Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1
Tabla
Contains 1 Descripción
data de& Probit.dta
from Base de Logit Variables y con ello facilita el análisis de
obs: 16,732
vars: 12 13 Oct 2018 21:44
observaciones microeconómicas.
size: 1,338,560
La aplicación de los modelos Logit y Probit Este modelo de respuesta binaria, tiene como
en el análisis de variables cualitativas facilita función de densidad conjunta la siguiente
la comprensión de los determinantes de la expresión:
pobreza en el Ecuador.
𝑒 (𝛽1 +𝛽2𝑋𝐼)
El presente trabajo está dividido en 4 𝐿𝑜𝑔𝑖𝑡 =
secciones la primera una breve descripción 1 + 𝑒 (𝛽1 +𝛽2 𝑋𝐼)
teórica de la pobreza, la metodología
La variable dependiente del modelo de
utilizada en la investigación, la tercera es los
respuesta binaria tiene una función tipo
resultados obtenidos y la última las
Bernulli a ser: 𝑓(𝑦𝑖 |𝑥𝑖 ) = 𝑝𝑖 𝑦𝑖 (1 − 𝑝𝑖 )1−𝑦𝑖 ,
conclusiones que se han logrado con el
en donde los coeficientes de regresión se
análisis de los resultados.
obtienen mediante una regresión de Máxima
Modelos de Respuesta Dicotómica Verosimilitud, la cual cuenta con sus
propiedades en muestras grandes, ya que
Los modelos de respuesta binaria son dichos estimadores maximizan la
utilizados para el análisis de datos verosimilitud.
cualitativos o respuestas discretas se
caracterizan por analizar una variable Estimados los coeficientes de la regresión es
dependiente que indica en cual categoría importante fijarse en los signos de estos,
mutua la respuesta de interés cae pues explican la naturaleza de las variables
(CAMERON, 2005). Los modelos de independientes, de hecho “Debe notarse
respuesta dicotómica no pierden generalidad que, sin embargo, en los modelos con
al usar valores de 1 o 0 si estos se expresan regresada binaria, la bondad del ajuste tiene
en forma de probabilidad de la respuesta. una importancia secundaria. Lo que interesa
son los signos esperados de los coeficientes
La estimación de los modelos de respuesta de la regresión y su importancia práctica y/o
dicotómica se realiza a través de Logit y estadística.” (GUJARATI, 2010)
Probit, los mismos que se diferencian por la
forma funcional de la probabilidad para la Modelo Probit
media condicional que se estima por MCO.
Este modelo también se trata de un modelo
(CAMERON, 2005). Además estos modelos
de respuesta binaria y la teoría alrededor de
permiten la interpretación y análisis del
este varía en la forma funcional ya que no
comportamiento de los agentes económicos
sigue una función de densidad acumulada de
2
manera Logística, sino la función de influyen las variables independientes en la
densidad acumulada de una distribución explicación de la pobreza en el Ecuador.
normal. (CAMERON, 2005)
En primera instancia se analiza la
𝛽´𝑥 información a través del modelo Logit, con
1 −(𝑦i −𝛽1 −𝑋𝐼 )2
𝑃𝑟𝑜𝑏𝑖𝑡 = ∫ 𝑒 2𝜎 𝑑𝑡, el fin de determinar los coeficientes y las
√2𝜋𝜎 2 relaciones marginales de las variables con el
−∞
problema de la pobreza en el Ecuador.
El modelo Probit al igual que el Logit es un
modelo de respuesta binaria con la variable Luego de ello se analiza los datos con el
dependiente tipo Bernoulli: 𝑓(𝑦𝑖 |𝑥𝑖 ) = modelo Probit, la finalidad es comparar los
Iteration 0: log likelihood = -6124.4889
𝑝𝑖 𝑦𝑖 (1 − 𝑝𝑖 )1−𝑦𝑖 y siendo también estimada resultados de los dos modelos sin perder la
Iteration 1: log likelihood = -4692.3099
mediante Máxima Verosimilitud. interpretación económica
Iteration 2: log likelihood = -4383.9642del problema que
se busca explicar en= -4366.7071
Iteration 3: log likelihood este trabajo.
Iteration 4: log likelihood = -4366.5875
El proceso es muy similar y las Iteration 5: log likelihood = -4366.5875
3
cual es un resultado interesante, un ejemplo de los coeficientes del modelo y b) la
en el que la varibles afecte en forma negativa interpretación de los efectos marginales.
la condición de pobreza es el Nivel de
Instrucción ya que mientras más alto sea el Como alternativa para esta investigación se
nivel de instrucción es inverso a la computó el valor de los efectos marginales
probabilidad de ser pobre. En cuanto a las lo cuales se presentan en la tabla 2 que se
variables con signo positivo por ejemplo detalla a continuación:
tomando la variable Ingreso Laboral esta Ingresos_Totales Área
tiene que ver directamente con la Tabla 3 Modelo Logit Efectos Marginales
Delta-method
probabilidad que el Jefe de Hogar sea pobre dy/dx Std. Err. z P>|z| [95% Conf. Interval]
o no; ya que, depende directamente de sus Género -.0538768 .0069996 -7.70 0.000 -.0675957 -.0401579
ingresos, y se puede dar el mismo tipo de Edad -.003965 .0002588 -15.32 0.000 -.0044722 -.0034578
Seguro_Social .0042828 .000842 5.09 0.000 .0026324 .0059331
interpretación en cuanto al signo a las demás Estado_Civil -.0030529 .0014902 -2.05 0.040 -.0059736 -.0001323
Categoría_ocupación .0188959 .0019184 9.85 0.000 .015136 .0226558
variables. Experiencia_Laboral .0011016 .0002239 4.92 0.000 .0006628 .0015403
Nivel_instrucción -.0393721 .0045884 -8.58 0.000 -.0483651 -.030379
Años_Aprobados -.0050745 .002149 -2.36 0.018 -.0092864 -.0008626
Adicional al contrastar la significancia de los Tipo_Etnia -.0125851 .0016379 -7.68 0.000 -.0157954 -.0093748
Ingresos_Totales .25582 .0078958 32.40 0.000 .2403446 .2712955
parámetros individualmete se puede apreciar Área .0798924 .006258 12.77 0.000 .067627 .0921578
que con un nivel de significancia del 5% no
existe evidencia estadística suficiente para Elaboración: Los autores
Fuente: INEC 2018
aceptar la Hipótesis Nula de que
individualmente dichos regresores son Para explicar los efectos marginales de se
iguales a cero, por lo que se acepta la tomó como referencia Ingreso Total, el cual
alternativa y se dice que todos los si sube en uno por ciento la probabilidad
parámetros son significativos. marginal de salir de “Pobre” a “No pobre” es
del 25,55% es decir que si el salario sube por
En cuanto a la bondad de ajuste del modelo
encima del salario básico hay más
con respuesta binaria se observa el Pseudo R
posibilidad de salir de la pobreza, las demás
Cuadrado el cual mide para este tipo de
variables se interpretarían de manera similar.
regresiones de variable siendo en este caso
Con lo cual se confirma que salir de la
del 28.7%, es decir el modelo se ajusta a los
condición de pobreza está en función de los
datos en este porcentaje. Aunque este valor
ingresos que recibe el sujeto económico; sin
es bastante bajo no se debe tomar como un
embargo, a pesar que la educación, género,
problema ya que esto ocurre muy
edad y estado civil disminuyen la pobreza no
frecuentemente, adicional como cita
aportan significativamente a solucionar el
Wooldridge, (2010) “Por tanto, se puede
problema, sí se revisa la teoría de Solow
calcular una pseudo R-cuadrada para Probit
acerca del desarrollo económico se puede
y Logit que sea directamente comparable
indicar que la educación es uno de los pilares
con la R-cuadrada usual a partir de la
fundamentales para el ingreso que reciben
estimación de un modelo de probabilidad
los agentes económicos.
lineal. En cualquier caso, la bondad de ajuste
suele ser menos importante que intentar En el Ecuador, su división presenta grandes
obtener estimaciones convincentes de los diferencias al momento de evaluar la
efectos ceteris paribus de las variables pobreza, en el estudio una variable que juega
explicativas.” (p. 582). un papel vital en determinar si es “Pobre” o
“No Pobre” es cambiar de área o lugar de
Efectos marginales residencia incrementa la posibilidad de no
Como se explicó en la parte teórica, los ser pobre un casi 7,99%, y más si se cambia
coeficientes del modelo Logit no pueden ser de una zona rural a una Urbana.
interpretados por ello existen dos
alternativas: a) la verificación de los signos
4
Estado_Civil =
2.864594 (mean)
Categoría_~n = 4.333433 (mean)
Experienci~l = 18.60454 (mean)
Nivel_inst~n = 2.848902 (mean)
Predictive margins Number of obs = 13,382 Años_Aprob~s = 3.385069 (mean)
Model VCE : OIM
Tipo_Etnia = 5.461814 (mean)
Ingresos_T~s = .4670453 (mean)
Expression : Pr(pobreza), predict()
Tabla 4 Efectos Marginales Promedio Tabla 6 Efectos
Área =Marginales
Individuales y
1.392467 (mean)
Promedio (Condicionados en media)
Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval] Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
_cons .1711254 .0027902 61.33 0.000 .1656568 .176594
Género -.0353917 .0047159 -7.50 0.000 -.0446347 -.0261487
Elaboración: Los autores Edad -.0026046 .0001896 -13.74 0.000 -.0029762 -.0022331
Fuente: INEC 2018 Seguro_Social .0028133 .0005496 5.12 0.000 .0017362 .0038905
Estado_Civil -.0020055 .0009825 -2.04 0.041 -.0039311 -.0000799
En la tabla anterior los Efectos Marginales Categoría_ocupación .0124127 .0012578 9.87 0.000 .0099475 .0148779
Promedio, es decir cuál es la probabilidad de Experiencia_Laboral .0007236 .0001504 4.81 0.000 .0004289 .0010184
Nivel_instrucción -.0258635 .0029265 -8.84 0.000 -.0315993 -.0201278
ser pobre luego de parametrizar todos los Años_Aprobados -.0033334 .0014067 -2.37 0.018 -.0060906 -.0005763
coeficientes, se computó el promedio de los Tipo_Etnia -.0082672 .001142 -7.24 0.000 -.0105054 -.0060289
parámetros siendo esto como una Ingresos_Totales .1680482 .0059258 28.36 0.000 .1564338 .1796626
interpretación de los Odd Ratio en promedio Área .0524813 .0044528 11.79 0.000 .043754 .0612087
5
En el Odds Ratio (o antilogaritmo) se puede siendo aceptada la Hipótesis de que todos los
ver como cada uno de los regresores parámetros son distintos de cero.
incrementan porcentualmente el valor de sus
coeficientes a la probabilidad de que el Jefe Tabla 9 Test De Bondad de Ajuste de
de Hogar sea pobre, es decir en los valores Pearson o Hosmer-Lemshow
Logistic model for pobreza, goodness-of-fit test
de los coeficientes obtenidos se puede medir
que si una de las variables se incrementa en number of observations = 13382
number of covariate patterns = 13049
una unidad, ceteris paribus es probable en Pearson chi2(13037) = 13965.42
promedio que la probabilidad de la persona Prob > chi2 = 0.0000
Como bien se conoce el test de Wald False + rate for true ~D Pr( +|~D) 22.45%
contrasta la Hipótesis nula de que todos los False - rate for true D Pr( -| D) 21.83%
False + rate for classified + Pr(~D| +) 58.18%
parámetros son igual a cero, a lo cual se False - rate for classified - Pr( D| -) 5.49%
6
El cuadro anterior muestra el valor de la una curva de 45°, se puede observar que la
sensibilidad, especificación valores curva ROC se encuentra en todos los puntos
predichos pero uno de los mas interesantes por encima de la recta de 45 grados (Curva
en cuanto a la bondad predictiva del modelo sin poder de predicción). Siendo en las
como se puede observar que se ha coordenadas 0,23 y 0,78 el punto donde se
maximizado en punto de corte del 0,23 (Este maximiza la distancia entre la curva ROC y
punto se obtiene mediante testeo hasta ver la recta de 45 grados además si se mide el
las coordenadas de corte en el grafico que se área
Iterationbajo
0: log la curva
likelihood de ROC, el valor del área
= -6124.4889
Iteration 1: log likelihood = -4510.1763
verá adelante) se puede decir que mediante de 0.8585 predice satisfactoriamente un
Iteration 2: log likelihood = -4382.0429
el comando usado de Estat clasification el 85,85%.
Iteration 3: log likelihood = -4380.2433
modelo en general prevee correctamente el Iteration 4: log likelihood = -4380.2432
7
Tabla 12 Tabla Comparación Coeficientes Interpretando el modelo existe la
Variable logit probit
probabilidad del 17,15% de que el Jefe de
Hogar sea pobre (“1”), teniendo este valor
Género -.51715443 -.28127726
Edad -.03805958 -.02069458 significante ya que es menor que el 5%, por
Seguro_Soc~l .0411094 .0218389
Estado_Civil -.02930464 -.01629472
lo que no existe suficiente evidencia
Categoría_~n .1813784 .09451581 estadística como para aceptar la Hipótesis
Experienci~l .01057375 .00607358
Nivel_inst~n -.37792587 -.19635529 Nula de que el promedio parametrizado de
Años_Aprob~s
Tipo_Etnia
-.04870899
-.12080226
-.02702295
-.07484877
las variables sea “0”.
Ingresos_T~s 2.4555734 1.2789431
Área .76687374 .42590433
_cons -1.5062396 -.76836246
Tabla 15 Efectos Marginales Promedio
Adjusted predictions Number of obs de= 13,382
Model VCE : OIM
las Variables Independientes
Elaboración: Los autores Expression : Pr(pobreza), predict()
Fuente: INEC 2018 at : Género = 1.225676 (mean)
Edad = 48.49073 (mean)
Seguro_Soc~l = 5.96443 (mean)
Estado_Civil = 2.864594 (mean)
La tabla anterior indica que los parámetros Categoría_~n = 4.333433 (mean)
8
todos los coeficientes son estadísticamente Tabla 18 Test De Bondad de Ajuste de
significativos. Pearson o Hosmer-Lemshow
Probit model for pobreza, goodness-of-fit test
10
ANEXOS coordenadas de 0,245 y 0,76
aproximadamente es el punto donde se
Poder predictivo Modelo Probit maximiza la en donde como se vio prevé
correctamente clasificadas el 77,81% de las
Tabla 01 Estat Classification. observaciones.
True
Classified D ~D Total
11