Sei sulla pagina 1di 25

Regresiones con Truncamiento

Prof. Luis Garca N.


PUCP

Luis Garca - PUCP (c) 1


Introduccin
Una variable se encuentra truncada si no existen
valores de ellas en un rango, normalmente en sus
colas.
Ejemplo:
Queremos estimar el modelo
= ( , . , ,
, . )
Base de datos: Planillas de empresas formales
entregadas a las autoridades (MTPE/SUNAT)

Luis Garca - PUCP (c) 2


Introduccin
Dado que existe un salario mnimo legal min ,
todos los salarios superan este umbral, por lo
tanto min .
Si existieran trabajadores que ganen menos,
no se tendra datos de ellos, pues no se
registran en la planilla (trabajadores
informales).
Entonces, la variable salario est truncada en
su cola izquierda.

Luis Garca - PUCP (c) 3


Distribuciones Truncadas
Sea una variable aleatoria continua con
funcin de densidad () y con funcin de
distribucin acumulada .
Supongamos que los valores de no
existen o no estn disponibles.
Redefinimos a la variable aleatoria con
truncamiento, , que toma los mismos valores
que para > .

Luis Garca - PUCP (c) 4


Distribuciones Truncadas
= | >
Ejemplo con nmero, si = 10

13 13
4 .
12 12
5 .
9 .
11 11
16 16

Luis Garca - PUCP (c) 5


Distribuciones Truncadas
Cul es la funcin de densidad de ?
No puede ser la funcin () pues el integral

< 1

La densidad de es la densidad condicional
() ()
= > = =
Pr( > ) 1 ()

Luis Garca - PUCP (c) 6


Distribuciones Truncadas
Esta funcin cumple la propiedad que el rea
debajo de la densidad es igual a 1.

()
=
Pr( > )


1 Pr( > )
= () = =1
Pr( > ) Pr( > )

Luis Garca - PUCP (c) 7


Distribuciones Truncadas
Grficamente, la funcin () es un
1
reescalamiento de , pues >1
densidad 1()

()

()



Luis Garca - PUCP (c) 8
Distribuciones Truncadas
Si el truncamiento es por la derecha,
= | < , y la densidad de la truncada
es
() ()
= < = =
Pr( < ) ()

Luis Garca - PUCP (c) 9


Distribuciones Truncadas
El Caso Normal:
Sea ~ , 2 una v.a. sin truncamiento.
Si truncamos por la izquierda, siendo visible
solamente si > , la densidad de la truncada es

1
()
= =
Pr( > ) 1

Luis Garca - PUCP (c) 10


Distribuciones Truncadas
Pues

Pr > = Pr > = Pr > =1




1
= para cualquier ~ , 2

Luis Garca - PUCP (c) 11


Distribuciones Truncadas
Con el truncamiento, la media de ser
distinta de la media de .

= E[ | > ] = + () (1)

()
donde = es la Inversa de la
1()

Razn de Mills, y = .

Luis Garca - PUCP (c) 12


Distribuciones Truncadas
Como > 0, el valor esperado de la
variable truncada est a la derecha de la
media incondicional .

[] []
Luis Garca - PUCP (c) 13
Distribuciones Truncadas
Si el truncamiento es por la derecha,
= | < , la inversa de la razn de Mills
es:

= <0

Se cumple que < .

Luis Garca - PUCP (c) 14


Distribuciones Truncadas
Volviendo al caso de truncamiento por la
izquierda, se puede comprobar que:

= > = 2 (1 )

donde = ()( ), 0 < < 1.


La varianza de la truncada es menor que la
varianza de .
Luis Garca - PUCP (c) 15
Regresiones con variables dependientes
truncadas
En el modelo de regresin lineal clsico
multivariado
= + | ~ 0, 2
(2)
En este caso, bajo los supuestos clsicos la
funcin de regresin muestral (FRP) es

= + = (3)
Luis Garca - PUCP (c) 16
Regresiones con variables dependientes
truncadas
Ahora asumamos que es observable solamente
para > , y no existe el dato para < .
La FRP con truncamiento es,
= + > ,
= + [ | > , ] (4)

Es decir, el truncamiento en se traduce en un


truncamiento en .

Luis Garca - PUCP (c) 17


Regresiones con variables dependientes
truncadas
Observar que [ | > , ] no es
cero pues segn la ecuacin (1), haciendo
=
> , = +
=0
=

Donde = = . Reemplazando esto

en (4)

Luis Garca - PUCP (c) 18


Regresiones con variables dependientes
truncadas

= +

= +
Notar que no es constante sino que vara para
cada individuo i.
Luego el modelo verdadero de regresin lineal
para datos truncados puede escribirse como
= + +

Luis Garca - PUCP (c) 19


Regresiones con variables
dependientes truncadas
Si simplemente estimamos el modelo
= +
estaremos cometiendo un error por omisin de
la variable relevante , entonces MCO es
sesgado e inconsistente.

Luis Garca - PUCP (c) 20


Regresiones con variables
dependientes truncadas
Se debe estimar por mxima verosimilitud
La funcin de densidad de cada observacin
es:
1


=

1

Luis Garca - PUCP (c) 21


Regresiones con variables
dependientes truncadas
Luego la funcin de verosimilitud que se va a
maximizar es:

2
1
= 2 2 2
2 2 2
=0


ln 1

=0

Luis Garca - PUCP (c) 22


Ejemplo: Regresin Truncada
Se tiene una muestra de 150 mujeres
trabajadoras.
whrs= Horas trabajadas por las mujeres al ao
kl6 = # nios menores de 6 aos
k618 = # nios de 6 a 18 aos
wa = edad de la mujer
we = educacin en aos
Se regresiona solo para whrs > 0

Luis Garca - PUCP (c) 23


MCO con endgena truncada
. webuse laborsub

. keep if whrs>0
(100 observations deleted)

. regress whrs kl6 k618 wa we

Source SS df MS Number of obs = 150


F( 4, 145) = 2.80
Model 7326995.15 4 1831748.79 Prob > F = 0.0281
Residual 94793104.2 145 653745.546 R-squared = 0.0717
Adj R-squared = 0.0461
Total 102120099 149 685369.794 Root MSE = 808.55

whrs Coef. Std. Err. t P>|t| [95% Conf. Interval]

kl6 -421.4822 167.9734 -2.51 0.013 -753.4748 -89.48953


k618 -104.4571 54.18616 -1.93 0.056 -211.5538 2.639668
wa -4.784917 9.690502 -0.49 0.622 -23.9378 14.36797
we 9.353195 31.23793 0.30 0.765 -52.38731 71.0937
_cons 1629.817 615.1301 2.65 0.009 414.0371 2845.597

Luis Garca - PUCP (c) 24


Estimacin por Mxima Verosimilitud
. truncreg whrs kl6 k618 wa we, ll(0)
(note: 0 obs. truncated)

Fitting full model:

Iteration 0: log likelihood = -1205.6992


Iteration 1: log likelihood = -1200.9873
Iteration 2: log likelihood = -1200.9159
Iteration 3: log likelihood = -1200.9157
Iteration 4: log likelihood = -1200.9157

Truncated regression
Limit: lower = 0 Number of obs = 150
upper = +inf Wald chi2(4) = 10.05
Log likelihood = -1200.9157 Prob > chi2 = 0.0395

whrs Coef. Std. Err. z P>|z| [95% Conf. Interval]

kl6 -803.0042 321.3614 -2.50 0.012 -1432.861 -173.1474


k618 -172.875 88.72898 -1.95 0.051 -346.7806 1.030579
wa -8.821123 14.36848 -0.61 0.539 -36.98283 19.34059
we 16.52873 46.50375 0.36 0.722 -74.61695 107.6744
_cons 1586.26 912.355 1.74 0.082 -201.9233 3374.442

/sigma 983.7262 94.44303 10.42 0.000 798.6213 1168.831

Luis Garca - PUCP (c) 25

Potrebbero piacerti anche