Sei sulla pagina 1di 78

Econometra No Paramtrica y Estimacin de Efectos

Causales en Economa
II Curso de Econometra Aplicada para la Investigacin Econmica
Prof. Carlos Mendiburu
carlos.mendiburu@bcrp.gob.pe
31.08.11
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 1 / 39
Econometra No Paramtrica y Estimacin de Efectos
Causales
1
Introduccin
2
Efectos causales
3
Estimacin de efectos causales utilizando mtodos no paramtricos:
1 Regresin no paramtrica
2 Matching
3 Mtodos basados en el propensity score
4
Comentarios nales
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 2 / 39
Introduccin a la econometra no paramtrica
Modelo de regresin lineal: Y
i
= X
i
+
i
.
Modelo de regresin no lineal: Y
i
= f (, X
i
) +
i
.
Modelo general de regresin no paramtrica: Y
i
= f (X
i
) +
i
.
Ventaja: Se gana eciencia (precisin) al relajar el supuesto de
linearidad.
Desventajas:
I
Intepretacin menos directa ("no theory").
I
Mayor costo computacional.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 3 / 39
Resultados potenciales
Potential outcome approach: Fisher (1935), Neyman (1923) y Rubin
(1974, 1977, 1978).
N unidades tomadas aleatoriamente de una poblacin.
Dos resultados posibles:
I
Y
i
(0): "sin tratamiento" o "control" y
I
Y
i
(1): "con tratamiento" o "tratamiento activo".
Un vector de caractersticas (covariables): X
i
.
Un tratamiento D
i
0, 1.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 4 / 39
Resultados realizados
Para cada unidad se observa un resultado realizado:
Y
i
= Y
i
(D
i
) =
_
Y
i
(0) si D
i
= 0
Y
i
(1) si D
i
= 1
_
Por lo tanto, para i slo se tiene informacin sobre (D
i
, Y
i
, X
i
).
Nuestro inters: la distribucin (D, Y, X).
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 5 / 39
Deniciones
Propensity score:
e(x) = Pr(D = 1 [ X = x) = E[D [ X = x]
Funciones de regresin condicional:

d
(x) = E[Y(d) [ X = x], para d 0, 1
Funciones de varianza condicional:

2
d
(x) = V[Y(d) [ X = x], para d 0, 1
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 6 / 39
Efectos de Tratamiento Poblacionales
Population Average Treatment Eect (PATE)

P
= E[Y(1) Y(0)]
Population Average Treatment Eect for the Treated (PATT)

P
T
= E[Y(1) Y(0) [ D = 1]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 7 / 39
Efectos de Tratamiento Muestrales
Sample Average Treatment Eect (SATE)

S
=
1
N
N

i =1
[Y
i
(1) Y
i
(0)]
Sample Average Treatment Eect for the Treated (SATT)

S
T
=
1
N
T

i :D
i
=1
[Y
i
(1) Y
i
(0)]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 8 / 39
Efectos de Tratamiento Condicionales
Conditional Average Treatment Eect (CATE)
(X) =
1
N
N

i =1
E[Y
i
(1) Y
i
(0) [ X
i
]
Conditional Average Treatment Eect for the Treated (CATT)
(X)
T
=
1
N
N

i :D
i
=1
E[Y
i
(1) Y
i
(0) [ X
i
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 9 / 39
Supuestos de Identicacin
1
[Y(0), Y(1)] l D [ X
2
0 < Pr(D = 1 [ X) < 1
3
E[Y(d) [ D, X] = E[Y(d) [ X], para d 0, 1
4
Y(0) l D [ X
5
Pr(D = 1 [ X) < 1
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 10 / 39
Estimacin
Veremos las siguientes alternativas de estimacin para los efectos
promedio poblacionales:
1
Regresin no paramtrica
2
Emparejamiento (matching)
3
Mtodos basados en el propensity score
4
Otros mtodos
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 11 / 39
Regresin
Objetivo: estimar consistentemente
d
(x) para d = 0, 1.
Con el estimado
d
(x) se pueden construir las funciones PATE, SATE
y CATE:

reg
=
1
N
N

i =1
[
1
(X
i
)
0
(X
i
)]
As como las funciones PATT y SATT:

reg,T
=
1
N
T
N

i =1
D
i
[Y
i

0
(X
i
)]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 12 / 39
Regresin
Estimacin tradicional de
d
(x):
I
Regresin paramtrica:

d
(x) = x + d.
I
El valor del efecto causal viene dado por .
I
Receta: estimar por mnimos cuadrados la regresin:
Y
i
= + X
i
+ D
i
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 13 / 39
Regresin
Estimacin tradicional de
d
(x):
I
Regresin paramtrica:

d
(x) = x + d.
I
El valor del efecto causal viene dado por .
I
Receta: estimar por mnimos cuadrados la regresin:
Y
i
= + X
i
+ D
i
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 13 / 39
Regresin
Estimacin tradicional de
d
(x):
I
Regresin paramtrica:

d
(x) = x + d.
I
El valor del efecto causal viene dado por .
I
Receta: estimar por mnimos cuadrados la regresin:
Y
i
= + X
i
+ D
i
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 13 / 39
Spline Regression
X
i
: escalar.
Regression spline model:
Y
i
=
0
+
p

j =1

j
X
j
i
+
l

j =p+1

j
1
[x
i
>k
j p
]
(x
i
k
j p
)
p
+
i
Cubic spline:
Y
i
=
0
+
1
X
i
+
2
X
2
i
+
3
X
3
i
+
+
4
1
[x
i
>k
1
]
(x
i
k
1
)
3
+
+
5
1
[x
i
>k
2
]
(x
i
k
2
)
3
+
+ . . . +
+
3+l
1
[x
i
>k
l
]
(x
i
k
l
)
3
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 14 / 39
Spline Regression
X
i
: escalar.
Regression spline model:
Y
i
=
0
+
p

j =1

j
X
j
i
+
l

j =p+1

j
1
[x
i
>k
j p
]
(x
i
k
j p
)
p
+
i
Cubic spline:
Y
i
=
0
+
1
X
i
+
2
X
2
i
+
3
X
3
i
+
+
4
1
[x
i
>k
1
]
(x
i
k
1
)
3
+
+
5
1
[x
i
>k
2
]
(x
i
k
2
)
3
+
+ . . . +
+
3+l
1
[x
i
>k
l
]
(x
i
k
l
)
3
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 14 / 39
Spline Regression
X
i
: escalar.
Regression spline model:
Y
i
=
0
+
p

j =1

j
X
j
i
+
l

j =p+1

j
1
[x
i
>k
j p
]
(x
i
k
j p
)
p
+
i
Cubic spline:
Y
i
=
0
+
1
X
i
+
2
X
2
i
+
3
X
3
i
+
+
4
1
[x
i
>k
1
]
(x
i
k
1
)
3
+
+
5
1
[x
i
>k
2
]
(x
i
k
2
)
3
+
+ . . . +
+
3+l
1
[x
i
>k
l
]
(x
i
k
l
)
3
+
i
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 14 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Una disgresin: Densidades Kernel
Supongamos que queremos estimar empricamente una funcin de
densidad f (x).
I
Marginal o condicional?
I
Cul es la opcin ms simple?
I
Cul es el problema con la opcin ms simple?
I
Qu se puede hacer? Ventanas
I
Qu ms se puede hacer? Ventanas mviles
Estimador de densidades kernel:

f
h
(x) =
1
N h
N

i =1
K
_
x x
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 15 / 39
Funciones kernel
Sea u = x x
i
.
Funciones kernel frecuentes:
I
Triangular:
K(u) = (1 [ u [) 1
[[u[<1]
I
Uniforme:
K(u) = (0.5) 1
[[u[<1]
I
Epanechnikov:
K(u) = (0.75) (1 [ u
2
[) 1
[[u[<1]
I
Normal:
K(u) =
e
0.5u
2
_
2
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 16 / 39
Eleccin del ancho de banda (bandwith)
Elegir el valor de h que minimize el Error Cuadrtico Medio Integrado
(IMSE):
I
Error Cuadrado Integrado: ISE(h) =
_
[

f
h
(x) f (x)]
2
dx
I
Error Cuadrado Medio Integrado : E[ISE(h)] =
_
E[

f
h
(x) f (x)]
2
dx
El ancho de banda ptimo sera:
h = [
_
f
//
(x)
2
dx]
0.2
(N
0.2
)
donde =
_ _
K(u)
2
du
[
_
u
2
K(u)du]
2
_
0.2
.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 17 / 39
Eleccin del ancho de banda (bandwith)
Silverman:
h = 1.364 N
0.2
min(s, iqr /1.349)
donde:
I
iqr es la distancia entre el cuartil 0.25 y el cuartil 0.75.
I
s es la desviacin estndar muestral de x.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 18 / 39
Densidades kernel bivariadas
Objetivo: Estimar f (x, y).
Estimador de densidades kernel bivariado:

f
h
(x, y) =
1
N h
1
h
2
N

i =1
K
_
x x
i
h
1
,
y x
i
h
2
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 19 / 39
Densidades kernel bivariadas
Generalizaciones de funciones kernel al caso bivariado:
I
Triangular:
K(u) =
_
(1 [ u
1
[) 1
[[u
1
[<1]
_

_
(1 [ u
2
[) 1
[[u
2
[<1]
_
I
Uniforme:
K(u) = (0.25) 1
[[u
1
[<1]
1
[[u
2
[<1]
I
Epanechnikov:
K(u) = (9/16)
_
1
[[u
1
[<1]
(1 u
2
1
)
_

_
1
[[u
2
[<1]
(1 u
2
2
)
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 20 / 39
Densidades kernel condicionales
Objetivo: Estimar f (y [ x).
Por denicin:
f (y [ x) =
f (x, y)
f (x)
.
Estimador de densidades kernel condicionales:
(Sup.: h
1
= h
2
= h)

f
h
(y [ x) =

f
h
(x, y)

f
h
(x)
=
1
h
N

i =1
K
_
xx
i
h
,
y y
i
h
_
N

i =1
K
_
xx
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 21 / 39
Estimacin de la esperanza condicional
Objetivo: Estimar E[y [ x].
Por denicin:
E[y [ x] =
_
yf (y [ x)dy
Estimador de esperanza condicional kernel:
_
y

f
h
(y [ x)dy =
_
y
_

_
1
h
N

i =1
K
_
xx
i
h
,
y y
i
h
_
N

i =1
K
_
xx
i
h
_
_

_
dy
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 22 / 39
Estimacin de la esperanza condicional
Integrando y simplicando: Nadaraya (1964) y Watson (1964)
_
y

f
h
(y [ x)dy =
N

i =1
_
K
_
xx
i
h
_
[y
i
]
N

i =1
K
_
xx
i
h
_
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 23 / 39
Kernel Regression
Estimacin no paramtrica de
d
(x) = f (x), con f no lineal.
Una regresin kernel es una tcnica de regresin no paramtrica que
se utiliza para estimar la esperanza condicional de una variable,
cuando se piensa que esta funcin es no lineal y el vector X tiene
dimensin mayor a 1.
Dado un punto x, se encuentran los puntos ms cercanos a x, los
mismos que se ponderan de acuerdo a una funcin kernel K().
La cercana est denida por el ancho de banda h.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 24 / 39
Kernel Regression
Heckman, Ichimura y Todd (1997, 1998) y Heckman, Ichimura, Smith
y Todd (1998):

d
(x) =

i :D
i
=d
K
_
X
i
x
h
_
Y
i

i :D
i
=d
K
_
X
i
x
h
_
Eleccin crtica: ancho de banda.
I
Qu pasa con la curva cuando aumenta el ancho de banda?
Generalizacin a N variables: es posible?
Curse of Dimensionality
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 25 / 39
Kernel Regression
Heckman, Ichimura y Todd (1997, 1998) y Heckman, Ichimura, Smith
y Todd (1998):

d
(x) =

i :D
i
=d
K
_
X
i
x
h
_
Y
i

i :D
i
=d
K
_
X
i
x
h
_
Eleccin crtica: ancho de banda.
I
Qu pasa con la curva cuando aumenta el ancho de banda?
Generalizacin a N variables: es posible?
Curse of Dimensionality
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 25 / 39
Kernel Regression
Heckman, Ichimura y Todd (1997, 1998) y Heckman, Ichimura, Smith
y Todd (1998):

d
(x) =

i :D
i
=d
K
_
X
i
x
h
_
Y
i

i :D
i
=d
K
_
X
i
x
h
_
Eleccin crtica: ancho de banda.
I
Qu pasa con la curva cuando aumenta el ancho de banda?
Generalizacin a N variables: es posible?
Curse of Dimensionality
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 25 / 39
Kernel Regression
Heckman, Ichimura y Todd (1997, 1998) y Heckman, Ichimura, Smith
y Todd (1998):

d
(x) =

i :D
i
=d
K
_
X
i
x
h
_
Y
i

i :D
i
=d
K
_
X
i
x
h
_
Eleccin crtica: ancho de banda.
I
Qu pasa con la curva cuando aumenta el ancho de banda?
Generalizacin a N variables: es posible?
Curse of Dimensionality
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 25 / 39
Kernel Regression
Heckman, Ichimura y Todd (1997, 1998) y Heckman, Ichimura, Smith
y Todd (1998):

d
(x) =

i :D
i
=d
K
_
X
i
x
h
_
Y
i

i :D
i
=d
K
_
X
i
x
h
_
Eleccin crtica: ancho de banda.
I
Qu pasa con la curva cuando aumenta el ancho de banda?
Generalizacin a N variables: es posible?
Curse of Dimensionality
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 25 / 39
Emparejamiento (Matching)
Supuesto: [Y(0), Y(1)] l D [ X
La idea es comparar unidades tratadas (D
i
= 1) con unidades de
control (D
i
= 0) que tienen valores similares de X
i
.
Sean N
T
y N
C
el nmero de unidades tratadas y unidades de control,
respectivamente.
Denamos N
T
conjuntos de ponderaciones w
i
(j ), con N
C
pesos
dentro de cada conjunto, con i = 1, . . . , N
T
, j = 1, . . . , N
C
.
I
Algo suma 1?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 26 / 39
Emparejamiento (Matching)
Supuesto: [Y(0), Y(1)] l D [ X
La idea es comparar unidades tratadas (D
i
= 1) con unidades de
control (D
i
= 0) que tienen valores similares de X
i
.
Sean N
T
y N
C
el nmero de unidades tratadas y unidades de control,
respectivamente.
Denamos N
T
conjuntos de ponderaciones w
i
(j ), con N
C
pesos
dentro de cada conjunto, con i = 1, . . . , N
T
, j = 1, . . . , N
C
.
I
Algo suma 1?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 26 / 39
Emparejamiento (Matching)
Supuesto: [Y(0), Y(1)] l D [ X
La idea es comparar unidades tratadas (D
i
= 1) con unidades de
control (D
i
= 0) que tienen valores similares de X
i
.
Sean N
T
y N
C
el nmero de unidades tratadas y unidades de control,
respectivamente.
Denamos N
T
conjuntos de ponderaciones w
i
(j ), con N
C
pesos
dentro de cada conjunto, con i = 1, . . . , N
T
, j = 1, . . . , N
C
.
I
Algo suma 1?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 26 / 39
Emparejamiento (Matching)
Supuesto: [Y(0), Y(1)] l D [ X
La idea es comparar unidades tratadas (D
i
= 1) con unidades de
control (D
i
= 0) que tienen valores similares de X
i
.
Sean N
T
y N
C
el nmero de unidades tratadas y unidades de control,
respectivamente.
Denamos N
T
conjuntos de ponderaciones w
i
(j ), con N
C
pesos
dentro de cada conjunto, con i = 1, . . . , N
T
, j = 1, . . . , N
C
.
I
Algo suma 1?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 26 / 39
Emparejamiento (Matching)
Supuesto: [Y(0), Y(1)] l D [ X
La idea es comparar unidades tratadas (D
i
= 1) con unidades de
control (D
i
= 0) que tienen valores similares de X
i
.
Sean N
T
y N
C
el nmero de unidades tratadas y unidades de control,
respectivamente.
Denamos N
T
conjuntos de ponderaciones w
i
(j ), con N
C
pesos
dentro de cada conjunto, con i = 1, . . . , N
T
, j = 1, . . . , N
C
.
I
Algo suma 1?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 26 / 39
Matching y efectos causales
Se imputan los resultados potenciales no observados utilizando valores
observados para unidades de anlisis similares.
Una opcin es imputar los resultados potenciales de la siguiente
manera:

Y
i
(0) =
_
_
_
Y
i
, si D
i
= 0
1
M

j J
M
(i )
Y
j
, si D
i
= 1
_
_
_

Y
i
(1) =
_
_
_
1
M

j J
M
(i )
Y
j
, si D
i
= 0
Y
i
, si D
i
= 1
_
_
_
w
i
(j )?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 27 / 39
Emparejamiento (Matching)
Abadie & Imbens (2002) denen un estimador simple de
emparejamiento (matching):

sm
M
=
1
N
N

i =1
[

Y
i
(1)

Y
i
(0)]
Denamos de manera general el estimador matching:

M
=
1
N
T

i D=1
[Y
i


j D=0
w
i
(j )Y
j
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 28 / 39
Emparejamiento (Matching)
Abadie & Imbens (2002) denen un estimador simple de
emparejamiento (matching):

sm
M
=
1
N
N

i =1
[

Y
i
(1)

Y
i
(0)]
Denamos de manera general el estimador matching:

M
=
1
N
T

i D=1
[Y
i


j D=0
w
i
(j )Y
j
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 28 / 39
Emparejamiento (Matching)
Qu observacin(es) utilizar como match para la observacin i ?
I
Criterio de cercana
X discreto
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 29 / 39
Matching para X continuo
Nearest neighbor:
w
i
(j ) =
_
1, si j : min
X
j
d(X
i
X
j
)
0, en otro caso
_
I
Mtricas:
I
Eucldea:
D(X
i
, X
j
) = (X
i
X
j
)
/
(X
i
X
j
)
I
Mahalanobis:
D(X
i
, X
j
) = (X
i
X
j
)
/

1
x
(X
i
X
j
)
Alguna otra idea?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 30 / 39
Matching para X continuo
Nearest neighbor:
w
i
(j ) =
_
1, si j : min
X
j
d(X
i
X
j
)
0, en otro caso
_
I
Mtricas:
I
Eucldea:
D(X
i
, X
j
) = (X
i
X
j
)
/
(X
i
X
j
)
I
Mahalanobis:
D(X
i
, X
j
) = (X
i
X
j
)
/

1
x
(X
i
X
j
)
Alguna otra idea?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 30 / 39
Matching para X continuo
Nearest neighbor:
w
i
(j ) =
_
1, si j : min
X
j
d(X
i
X
j
)
0, en otro caso
_
I
Mtricas:
I
Eucldea:
D(X
i
, X
j
) = (X
i
X
j
)
/
(X
i
X
j
)
I
Mahalanobis:
D(X
i
, X
j
) = (X
i
X
j
)
/

1
x
(X
i
X
j
)
Alguna otra idea?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 30 / 39
Matching para X continuo
Nearest neighbor:
w
i
(j ) =
_
1, si j : min
X
j
d(X
i
X
j
)
0, en otro caso
_
I
Mtricas:
I
Eucldea:
D(X
i
, X
j
) = (X
i
X
j
)
/
(X
i
X
j
)
I
Mahalanobis:
D(X
i
, X
j
) = (X
i
X
j
)
/

1
x
(X
i
X
j
)
Alguna otra idea?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 30 / 39
Matching para X continuo
Nearest neighbor:
w
i
(j ) =
_
1, si j : min
X
j
d(X
i
X
j
)
0, en otro caso
_
I
Mtricas:
I
Eucldea:
D(X
i
, X
j
) = (X
i
X
j
)
/
(X
i
X
j
)
I
Mahalanobis:
D(X
i
, X
j
) = (X
i
X
j
)
/

1
x
(X
i
X
j
)
Alguna otra idea?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 30 / 39
Matching: comentarios
til cuando interesa
P
T
y hay muchas unidades de control.
Con ello se podra en principio asociar cada unidad tratada a uno o
ms controles.
Se debe elegir el nmero de coincidencias.
I
Dado un par de unidades asociadas, el efecto de tratamiento sobre una
unidad se estima como la diferencia en resultados.
I
El estimador de
P
T
se obtiene promediando estas diferencias.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 31 / 39
Matching: comentarios
til cuando interesa
P
T
y hay muchas unidades de control.
Con ello se podra en principio asociar cada unidad tratada a uno o
ms controles.
Se debe elegir el nmero de coincidencias.
I
Dado un par de unidades asociadas, el efecto de tratamiento sobre una
unidad se estima como la diferencia en resultados.
I
El estimador de
P
T
se obtiene promediando estas diferencias.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 31 / 39
Matching: comentarios
til cuando interesa
P
T
y hay muchas unidades de control.
Con ello se podra en principio asociar cada unidad tratada a uno o
ms controles.
Se debe elegir el nmero de coincidencias.
I
Dado un par de unidades asociadas, el efecto de tratamiento sobre una
unidad se estima como la diferencia en resultados.
I
El estimador de
P
T
se obtiene promediando estas diferencias.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 31 / 39
Matching: comentarios
til cuando interesa
P
T
y hay muchas unidades de control.
Con ello se podra en principio asociar cada unidad tratada a uno o
ms controles.
Se debe elegir el nmero de coincidencias.
I
Dado un par de unidades asociadas, el efecto de tratamiento sobre una
unidad se estima como la diferencia en resultados.
I
El estimador de
P
T
se obtiene promediando estas diferencias.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 31 / 39
Matching: comentarios
til cuando interesa
P
T
y hay muchas unidades de control.
Con ello se podra en principio asociar cada unidad tratada a uno o
ms controles.
Se debe elegir el nmero de coincidencias.
I
Dado un par de unidades asociadas, el efecto de tratamiento sobre una
unidad se estima como la diferencia en resultados.
I
El estimador de
P
T
se obtiene promediando estas diferencias.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 31 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Matching: comentarios
El estimador de Abadie & Imbens (2002) tiene un sesgo que no
desaparece cuando crece N, y:
I
El nmero de covariables continuas es 2 o 3.
I
El nmero de controles crece ms lentamente que el nmero de
unidades tratadas.
El sesgo se puede reducir combinando esta tcnica con la regresin.
I
Rubin (1973) y Quade (1982):

Y
i
(1)

Y
i
(0) = + [

X
i
(1)

X
i
(0)] +
i
En general los estimadores no son ecientes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 32 / 39
Propensity score
X mutidimensional: Rosenbaum y Rubin (1983, 1985), Dehejia y
Wahba (2002):
I
Caso simple: Si todas las N variables contenidas en X son binarias, el
nmero de valores posibles en X es 2
N
.
Objetivo: utilizar el Propensity Score, e(x), para crear una muestra
balanceada entre unidades tratadas y unidades de control.
Supuestos:
1
[Y(0), Y(1)] l D [ X
2
0 < Pr(d = 1 [ X) < 1
Bajo estos supuestos: [Y(0), Y(1)] l D [ e(X)
Clave: Supuesto 2.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 33 / 39
Propensity score
Si no se conoce el Propensity Score, ste debe ser estimado.
Dehejia y Wahba (2002) proponen:
1
Estimar un modeo logit sencillo.
2
Ordenar las observaciones de acuerdo al propensity score estimado.
3
Estraticar la muestra utilizando el propensity score estimado.
4
Realizar pruebas estadsticas para vericar que, para cada covariable, la
diferencia de medias en cada estrato no es signicativamente diferente
de cero,y en cada covariable
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 34 / 39
Utilizando el Propensity Score
1
Regresin lineal:
Y
i
=
0
+
1
D
i
+
2
D
i
e(X
i
) +
3
e(X
i
) +
i
.
== ATE :
1
+
2
e(X
i
).
2
Blocking on the Propensity Score: K bloques
=
K

k=1

k
[
N
1k
+N
0k
N
]
3
Weighting with the Propensity Score: balancear con pesos:

P
=
1
N
N

i =1
[
D
i
Y
i
e(X
i
)

(1 D
i
) Y
i
1 e(X
i
)
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 35 / 39
Utilizando el Propensity Score
1
Regresin lineal:
Y
i
=
0
+
1
D
i
+
2
D
i
e(X
i
) +
3
e(X
i
) +
i
.
== ATE :
1
+
2
e(X
i
).
2
Blocking on the Propensity Score: K bloques
=
K

k=1

k
[
N
1k
+N
0k
N
]
3
Weighting with the Propensity Score: balancear con pesos:

P
=
1
N
N

i =1
[
D
i
Y
i
e(X
i
)

(1 D
i
) Y
i
1 e(X
i
)
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 35 / 39
Utilizando el Propensity Score
1
Regresin lineal:
Y
i
=
0
+
1
D
i
+
2
D
i
e(X
i
) +
3
e(X
i
) +
i
.
== ATE :
1
+
2
e(X
i
).
2
Blocking on the Propensity Score: K bloques
=
K

k=1

k
[
N
1k
+N
0k
N
]
3
Weighting with the Propensity Score: balancear con pesos:

P
=
1
N
N

i =1
[
D
i
Y
i
e(X
i
)

(1 D
i
) Y
i
1 e(X
i
)
]
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 35 / 39
Propensity Score Matching: aspectos prcticos
Con reemplazo o sin reemplazo?
I
Con reemplazo: cada unidad tratada se empareja con la unidad de
control ms parecida. Se reduce sesgo pero ....?
I
Sin reemplazo: el orden puede ser importante (Rosenbaum, 1995).
Cuntas unidades de control comparables utilizar?
I
Una: menor propensity score
I
Varias: Mayor precisin, pero ...?
F
M nearest neighbors
F
Cochran y Rubin (1973): Caliper matching. Distancia torelable
mxima.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 36 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Mtodos mixtos
Regresin + Weighting on the Propensity Score.
I
Robins y Ritov (1997). Estimar por mnimos cuadrados ponderados:
Y
i
= + X
i
+ D
i
+
i
I
Utilizando como pesos:
w
i
=
_
D
i
e(X
i
)
+
1 D
i
1 e(X
i
)
Regresin + Blocking on the Propensity Score.
I
Rosenbaum y Rubin (1983). Estimar por MCO en cada bloque:
Y
i
=
k
+
k
X
i
+
k
D
i
+
i
I
Cmo combinar estas estimaciones para obtener ?
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 37 / 39
Aplicaciones empricas
Matching vs datos experimentales
Lalonde (1986) dataset
I
Experimento en mercado laboral.
I
Dehejia y Wahba (1999), Smith y Todd (2003).
Arcenaux, Gerber y Green (2006)
I
Experimento con los votantes.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 38 / 39
Recomendaciones prcticas
Estimacin de varianza: mtodos de kernel, bootstrapping (Abadie e
Imbens, 2006).
Evaluar supuesto de exogeneidad.
Evitar incluir covariables dbilmente correlacionadas con los
resultados y con los indicadores de tratamiento.
Evaluar si hay superposicin suciente:
I
Observar las distribuciones (histogramas) de las covariables.
I
Estimar el Propensity Score y comparar su distribucin en los grupos de
tratamiento y control.
Si la superposicin es dbil, los mtodos de emparejamiento y los
basados en el Propensity Score son preferibles a los mtodos de
regresin.
Prof. Carlos Mendiburu (BCRP) Mdulo de Microeconometra 31.08.11 39 / 39

Potrebbero piacerti anche