Sei sulla pagina 1di 11

TEORÍA ECONOMÉTRICA II

APLICACIÓN DE MODELOS DE REPUESTA DICOTOMICA: LOGIT Y


PROBIT
Caso de la pobreza en el Ecuador para el año 2018
Autores: Edwin Barros, Angel Campoverde y Juan Sisalima

RESUMEN alcanzar un mínimo nivel de vida” (EL


COMERCIO, 2018)
En el trabajo se presenta un análisis de la
aplicación de los modelos Logit y Probit a En este contexto, la pobreza se puede definir
los determinantes de la pobreza en el como la situación económica social causada
Ecuador para el año 2018, para ello se por la carencia o privación de al individuo
utilizan los datos de la encuesta ENENDU para alcanzar un mínimo nivel de vida.
elaborada por el INEC. Para el caso
analizado la variable cualitativa dependiente Antecedentes
es dicotómica discreta. Se examina variables
sociales, demográficas y económicas que En Ecuador se han realizado estudios de
pueden poseer las personas, en el caso de pobreza, sin embargo hay un retraso en la
estudio se escogió 13382 personas jefes de utilización de modelos econométricos para
hogar que respondieron la encuesta analizar las variables cualitativas. Por ello se
realizada por el INEC y que permitieron usó un modelo aplicado en Perú elaborado
calcular la probabilidad de “ser pobre” o “no por Frank Pucutay para el Centro de
pobre” por medio de los dos modelos de Investigaciones y Desarrollo del INEI.
respuesta binaria más utilizados como lo son
el modelo Logit y el Probit al final se El estudio citado utiliza el modelo Logit y
determinará el de mejor especificación. El Probit para evaluar un modelo de respuesta
análisis de los resultados de este artículo dicotómica basado en 1 “Pobre” y 0 “No
muestra que la pobreza se relaciona con los pobre”.
ingresos que obtienen los jefes de hogar y
Objetivo
que sus determinantes como educación, años
de educación, estado civil, género, etnia, etc Analizar la pobreza en el Ecuador utilizando
contribuyen a la disminución de la modelos Logit y Probit al aplicar el modelo
probabilidad de estar en condición de de respuesta dicotómica para obtener de
pobreza. manera más efectiva el comportamiento de
los determinantes que son causantes de la
Palabras clave: modelos de respuesta
pobreza.
binaria, pobreza, Logit, Probit, variable
Justificación
1.- INTRODUCCIÓN
El presente trabajo de investigación busca
La pobreza actualmente es un problema
analizar la pobreza en Ecuador utilizando
social persistente en la actualidad. Algunos
modelos de repuesta dicotómica; para su
autores la definen como:
análisis se utilizará los modelos Logit y
“La pobreza es una condición en la cual una Probit.
o más personas tienen un nivel de bienestar
Para la explicación del modelo se usaron las
inferior al mínimo socialmente aceptado”
siguientes variables:
(Pucutay, 2002)

“La pobreza es sinónimo de carencia y


privación, que limita a una persona para

1
Tabla
Contains 1 Descripción
data de& Probit.dta
from Base de Logit Variables y con ello facilita el análisis de
obs: 16,732
vars: 12 13 Oct 2018 21:44
observaciones microeconómicas.
size: 1,338,560

storage display value


Según la literatura revisada los modelos
variable name type format label variable label Probit son más usados por cuanto permiten
Área double %10.0g area Área
la inclusión de variable dependiente
Género double %10.0g p02 Género continua o a su vez ajustar el error por la
Edad double %10.0g p03 Edad
Seguro_Social double %35.0g p05a Seguro Social autoselección.
Estado_Civil double %13.0g p06 Estado Civil
Categoría_ocu~n double %46.0g p42 Categoría de ocupación
Experiencia_L~l double %10.0g p45 Experiencia Laboral Sin embargo los modelos Logit presentan
pobreza double %10.0g pobreza Pobreza
Nivel_instruc~n float %16.0g VAR01 Nivel de instrucción
ventajas al momento de analizar muestras
Años_Aprobados float %34.0g VAR02 Años Aprobados grandes ya que los Probit por su forma
Tipo_Etnia float %15.0g VAR03 Tipo de Etnia
Ingresos_Tota~s float %12.0g VAR11 Ingresos Totales
funcional dejan fuera ciertas observaciones
por ser inusuales.
Sorted by:
Elaboración: Los autores
Note: Dataset has changed since last saved.
Fuente: INEC 2018
Modelo Logit
.

La aplicación de los modelos Logit y Probit Este modelo de respuesta binaria, tiene como
en el análisis de variables cualitativas facilita función de densidad conjunta la siguiente
la comprensión de los determinantes de la expresión:
pobreza en el Ecuador.
𝑒 (𝛽1 +𝛽2𝑋𝐼)
El presente trabajo está dividido en 4 𝐿𝑜𝑔𝑖𝑡 =
secciones la primera una breve descripción 1 + 𝑒 (𝛽1 +𝛽2 𝑋𝐼)
teórica de la pobreza, la metodología
La variable dependiente del modelo de
utilizada en la investigación, la tercera es los
respuesta binaria tiene una función tipo
resultados obtenidos y la última las
Bernulli a ser: 𝑓(𝑦𝑖 |𝑥𝑖 ) = 𝑝𝑖 𝑦𝑖 (1 − 𝑝𝑖 )1−𝑦𝑖 ,
conclusiones que se han logrado con el
en donde los coeficientes de regresión se
análisis de los resultados.
obtienen mediante una regresión de Máxima
Modelos de Respuesta Dicotómica Verosimilitud, la cual cuenta con sus
propiedades en muestras grandes, ya que
Los modelos de respuesta binaria son dichos estimadores maximizan la
utilizados para el análisis de datos verosimilitud.
cualitativos o respuestas discretas se
caracterizan por analizar una variable Estimados los coeficientes de la regresión es
dependiente que indica en cual categoría importante fijarse en los signos de estos,
mutua la respuesta de interés cae pues explican la naturaleza de las variables
(CAMERON, 2005). Los modelos de independientes, de hecho “Debe notarse
respuesta dicotómica no pierden generalidad que, sin embargo, en los modelos con
al usar valores de 1 o 0 si estos se expresan regresada binaria, la bondad del ajuste tiene
en forma de probabilidad de la respuesta. una importancia secundaria. Lo que interesa
son los signos esperados de los coeficientes
La estimación de los modelos de respuesta de la regresión y su importancia práctica y/o
dicotómica se realiza a través de Logit y estadística.” (GUJARATI, 2010)
Probit, los mismos que se diferencian por la
forma funcional de la probabilidad para la Modelo Probit
media condicional que se estima por MCO.
Este modelo también se trata de un modelo
(CAMERON, 2005). Además estos modelos
de respuesta binaria y la teoría alrededor de
permiten la interpretación y análisis del
este varía en la forma funcional ya que no
comportamiento de los agentes económicos
sigue una función de densidad acumulada de

2
manera Logística, sino la función de influyen las variables independientes en la
densidad acumulada de una distribución explicación de la pobreza en el Ecuador.
normal. (CAMERON, 2005)
En primera instancia se analiza la
𝛽´𝑥 información a través del modelo Logit, con
1 −(𝑦i −𝛽1 −𝑋𝐼 )2
𝑃𝑟𝑜𝑏𝑖𝑡 = ∫ 𝑒 2𝜎 𝑑𝑡, el fin de determinar los coeficientes y las
√2𝜋𝜎 2 relaciones marginales de las variables con el
−∞
problema de la pobreza en el Ecuador.
El modelo Probit al igual que el Logit es un
modelo de respuesta binaria con la variable Luego de ello se analiza los datos con el
dependiente tipo Bernoulli: 𝑓(𝑦𝑖 |𝑥𝑖 ) = modelo Probit, la finalidad es comparar los
Iteration 0: log likelihood = -6124.4889
𝑝𝑖 𝑦𝑖 (1 − 𝑝𝑖 )1−𝑦𝑖 y siendo también estimada resultados de los dos modelos sin perder la
Iteration 1: log likelihood = -4692.3099
mediante Máxima Verosimilitud. interpretación económica
Iteration 2: log likelihood = -4383.9642del problema que
se busca explicar en= -4366.7071
Iteration 3: log likelihood este trabajo.
Iteration 4: log likelihood = -4366.5875
El proceso es muy similar y las Iteration 5: log likelihood = -4366.5875

interpretaciones de los coeficientes tampoco 3.- RESULTADOS


Logistic regression Number of obs = 13,382
se lo puede hacer directamente por ello se LR chi2(11) = 3515.80
3.1.-Modelo Logit
utiliza los efectos marginales. En cuanto a Prob > chi2 = 0.0000
Log likelihood = -4366.5875 Pseudo R2 = 0.2870
las pruebas de Hipótesis poder predictivo y Tabla 2 Regresión Logit
demás análisis del modelo es muy similar al
pobreza Coef. Std. Err. z P>|z| [95% Conf. Interval]
Logit. En este modelo no se puede utilizar el
Odds Ratio. Género -.5171544 .0678771 -7.62 0.000 -.6501911 -.3841177
Edad -.0380596 .0025851 -14.72 0.000 -.0431263 -.0329928
Seguro_Social .0411094 .0081053 5.07 0.000 .0252234 .0569954
El modelo Logit es el modelo natural como Estado_Civil -.0293046 .0143166 -2.05 0.041 -.0573646 -.0012447
el enlace canónico para la distribución Categoría_ocupación .1813784 .0186492 9.73 0.000 .1448266 .2179302
Experiencia_Laboral .0105738 .0021589 4.90 0.000 .0063423 .0148052
binomial mientras que el modelo Probit tiene
Nivel_instrucción -.3779259 .0443901 -8.51 0.000 -.464929 -.2909228
la atracción de ser o motiva la aleatorización Años_Aprobados -.048709 .0206369 -2.36 0.018 -.0891566 -.0082614
de las variables y se extiende hasta los Tipo_Etnia -.1208023 .0159393 -7.58 0.000 -.1520428 -.0895617
Ingresos_Totales 2.455573 .083162 29.53 0.000 2.292579 2.618568
modelos Tobit. (CAMERON, 2005) Área .7668737 .0617425 12.42 0.000 .6458608 .8878867
_cons -1.50624 .2979263 -5.06 0.000 -2.090164 -.9223147
2.- METODOLOGÍA
Elaboración: Los autores
Fuente: INEC 2018
Los datos que se usaron en el presente
documento, son de la encuesta ENENDU
De los resultados se puede ver que las
elaborado por el INEC, la encuesta está
variables con signo negativo son: Género,
encaminada “visualizar el perfil social,
Edad, Estado Civil, Nivel de Instrucción,
demográfico y económico de la población
Años aprobados, Tipo de Etnia, y la
total, en edad de trabajar, ocupada,
Constante, por lo cual afectan en forma
desocupada, inactiva y del subempleo en el
inversa a la probabilidad de que el Jefe de
área urbana y rural…, a través de variables
Hogar pueda ser pobre o no, en cambio las
de carácter general como: sexo, edad,…,
demás variables a ser: Seguro Social,
nivel de instrucción, asistencia escolar,
Categoría de Ocupación, Experiencia
afiliación al seguro social, entre otros.”
Laboral, Ingresos Totales, Área con signo
(INEC, 2018)
positivo afectan de manera directa con la
De esta encuesta se extrajo una muestra de probabilidad de que el Jefe de Hogar pueda
13382 observaciones, que tenía la categoría ser pobre o no.
común de ser jefes de hogar y se le relacionó
La constante indica que aun cuando todos los
contra los ingresos; la edad el sexo, la etnia,
coeficientes sean cero, la probabilidad de
nivel de instrucción, si era afiliado al IESS,
que el jefe de hogar sea pobre es negativa, el
etc; el objetivo es relacionar en cuanto

3
cual es un resultado interesante, un ejemplo de los coeficientes del modelo y b) la
en el que la varibles afecte en forma negativa interpretación de los efectos marginales.
la condición de pobreza es el Nivel de
Instrucción ya que mientras más alto sea el Como alternativa para esta investigación se
nivel de instrucción es inverso a la computó el valor de los efectos marginales
probabilidad de ser pobre. En cuanto a las lo cuales se presentan en la tabla 2 que se
variables con signo positivo por ejemplo detalla a continuación:
tomando la variable Ingreso Laboral esta Ingresos_Totales Área

tiene que ver directamente con la Tabla 3 Modelo Logit Efectos Marginales
Delta-method
probabilidad que el Jefe de Hogar sea pobre dy/dx Std. Err. z P>|z| [95% Conf. Interval]
o no; ya que, depende directamente de sus Género -.0538768 .0069996 -7.70 0.000 -.0675957 -.0401579
ingresos, y se puede dar el mismo tipo de Edad -.003965 .0002588 -15.32 0.000 -.0044722 -.0034578
Seguro_Social .0042828 .000842 5.09 0.000 .0026324 .0059331
interpretación en cuanto al signo a las demás Estado_Civil -.0030529 .0014902 -2.05 0.040 -.0059736 -.0001323
Categoría_ocupación .0188959 .0019184 9.85 0.000 .015136 .0226558
variables. Experiencia_Laboral .0011016 .0002239 4.92 0.000 .0006628 .0015403
Nivel_instrucción -.0393721 .0045884 -8.58 0.000 -.0483651 -.030379
Años_Aprobados -.0050745 .002149 -2.36 0.018 -.0092864 -.0008626
Adicional al contrastar la significancia de los Tipo_Etnia -.0125851 .0016379 -7.68 0.000 -.0157954 -.0093748
Ingresos_Totales .25582 .0078958 32.40 0.000 .2403446 .2712955
parámetros individualmete se puede apreciar Área .0798924 .006258 12.77 0.000 .067627 .0921578
que con un nivel de significancia del 5% no
existe evidencia estadística suficiente para Elaboración: Los autores
Fuente: INEC 2018
aceptar la Hipótesis Nula de que
individualmente dichos regresores son Para explicar los efectos marginales de se
iguales a cero, por lo que se acepta la tomó como referencia Ingreso Total, el cual
alternativa y se dice que todos los si sube en uno por ciento la probabilidad
parámetros son significativos. marginal de salir de “Pobre” a “No pobre” es
del 25,55% es decir que si el salario sube por
En cuanto a la bondad de ajuste del modelo
encima del salario básico hay más
con respuesta binaria se observa el Pseudo R
posibilidad de salir de la pobreza, las demás
Cuadrado el cual mide para este tipo de
variables se interpretarían de manera similar.
regresiones de variable siendo en este caso
Con lo cual se confirma que salir de la
del 28.7%, es decir el modelo se ajusta a los
condición de pobreza está en función de los
datos en este porcentaje. Aunque este valor
ingresos que recibe el sujeto económico; sin
es bastante bajo no se debe tomar como un
embargo, a pesar que la educación, género,
problema ya que esto ocurre muy
edad y estado civil disminuyen la pobreza no
frecuentemente, adicional como cita
aportan significativamente a solucionar el
Wooldridge, (2010) “Por tanto, se puede
problema, sí se revisa la teoría de Solow
calcular una pseudo R-cuadrada para Probit
acerca del desarrollo económico se puede
y Logit que sea directamente comparable
indicar que la educación es uno de los pilares
con la R-cuadrada usual a partir de la
fundamentales para el ingreso que reciben
estimación de un modelo de probabilidad
los agentes económicos.
lineal. En cualquier caso, la bondad de ajuste
suele ser menos importante que intentar En el Ecuador, su división presenta grandes
obtener estimaciones convincentes de los diferencias al momento de evaluar la
efectos ceteris paribus de las variables pobreza, en el estudio una variable que juega
explicativas.” (p. 582). un papel vital en determinar si es “Pobre” o
“No Pobre” es cambiar de área o lugar de
Efectos marginales residencia incrementa la posibilidad de no
Como se explicó en la parte teórica, los ser pobre un casi 7,99%, y más si se cambia
coeficientes del modelo Logit no pueden ser de una zona rural a una Urbana.
interpretados por ello existen dos
alternativas: a) la verificación de los signos

4
Estado_Civil =
2.864594 (mean)
Categoría_~n = 4.333433 (mean)
Experienci~l = 18.60454 (mean)
Nivel_inst~n = 2.848902 (mean)
Predictive margins Number of obs = 13,382 Años_Aprob~s = 3.385069 (mean)
Model VCE : OIM
Tipo_Etnia = 5.461814 (mean)
Ingresos_T~s = .4670453 (mean)
Expression : Pr(pobreza), predict()
Tabla 4 Efectos Marginales Promedio Tabla 6 Efectos
Área =Marginales
Individuales y
1.392467 (mean)
Promedio (Condicionados en media)
Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval] Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
_cons .1711254 .0027902 61.33 0.000 .1656568 .176594
Género -.0353917 .0047159 -7.50 0.000 -.0446347 -.0261487
Elaboración: Los autores Edad -.0026046 .0001896 -13.74 0.000 -.0029762 -.0022331
Fuente: INEC 2018 Seguro_Social .0028133 .0005496 5.12 0.000 .0017362 .0038905
Estado_Civil -.0020055 .0009825 -2.04 0.041 -.0039311 -.0000799
En la tabla anterior los Efectos Marginales Categoría_ocupación .0124127 .0012578 9.87 0.000 .0099475 .0148779
Promedio, es decir cuál es la probabilidad de Experiencia_Laboral .0007236 .0001504 4.81 0.000 .0004289 .0010184
Nivel_instrucción -.0258635 .0029265 -8.84 0.000 -.0315993 -.0201278
ser pobre luego de parametrizar todos los Años_Aprobados -.0033334 .0014067 -2.37 0.018 -.0060906 -.0005763
coeficientes, se computó el promedio de los Tipo_Etnia -.0082672 .001142 -7.24 0.000 -.0105054 -.0060289
parámetros siendo esto como una Ingresos_Totales .1680482 .0059258 28.36 0.000 .1564338 .1796626
interpretación de los Odd Ratio en promedio Área .0524813 .0044528 11.79 0.000 .043754 .0612087

para los coeficientes. El resultado se Elaboración: Los autores


interpreta que existe la probabilidad del Fuente: INEC 2018
17,11% en el que el Jefe de Hogar sea pobre
(“1”), teniendo este valor significante ya que La tabla 6 computa el efecto marginal para
es menor que el 5%, por lo que no existe las variables ya sea si se incrementa el valor
suficiente evidencia estadística como para de una variable en una unidad, y el efecto
aceptar la Hipótesis Nula de que el promedio marginal del en promedio de la variable,
parametrizado de las variables sea “0”. logrando cuantificar el efecto de cada
variable ya que dicho efecto no se lograba
Tabla 5 Efectos Marginales Promedio
Adjusted predictions Number of obs de
= las
13,382 realizar en la regresión, para ejemplificar se
Model VCE
Variables : OIM
Independientes puede decir que el efecto marginal de la
Expression : Pr(pobreza), predict() variable Ingresos Totales al obtener una
at : Género = 1.225676 (mean) unidad monetaria adicional de Ingreso afecta
Edad = 48.49073 (mean)
Seguro_Soc~l = 5.96443 (mean) negativamente en 16.8% a la probabilidad de
Estado_Civil = 2.864594 (mean) que el Jefe de Hogar sea pobre. Dicha
Iteration 0: log likelihood = -6124.4889
Categoría_~n = 4.333433 (mean)
Experienci~l = 18.60454 (mean) respuesta concordaría
Iteration 1: log likelihood = -4692.3099 con la teoría,
Iteration 2: log likelihood = -4383.9642
Nivel_inst~n = 2.848902 (mean) adicional nuevamente se
Iteration 3: log likelihood = -4366.7071
pueden ver que
Años_Aprob~s = 3.385069 (mean)
Tipo_Etnia = 5.461814 (mean)
todos loslogcoeficientes
Iteration 4: son estadísticamente
likelihood = -4366.5875
Ingresos_T~s = .4670453 (mean) Iteration 5: log likelihood = -4366.5875
significativos.
Área = 1.392467 (mean)
Logistic regression Number of obs = 13,382
Odds Ratio Logit LR chi2(11) = 3515.80
Delta-method Prob > chi2 = 0.0000
Margin Std. Err. z P>|z| [95% Conf. Interval] Log likelihood = -4366.5875 Pseudo R2 = 0.2870
Tabla 7 Odds Ratio Regresión Logit
_cons .0738961 .0032516 22.73 0.000 .067523 .0802691
pobreza Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
Elaboración: Los autores
Género .5962147 .0404693 -7.62 0.000 .521946 .6810512
Fuente: INEC 2018
Edad .9626556 .0024886 -14.72 0.000 .9577904 .9675455
Seguro_Social 1.041966 .0084454 5.07 0.000 1.025544 1.058651
En la tabla anterior se puede ver el valor de Estado_Civil .9711206 .0139031 -2.05 0.041 .9442498 .9987561
Categoría_ocupación 1.198869 .022358 9.73 0.000 1.155839 1.2435
la probabilidad de que un individuo que Experiencia_Laboral 1.01063 .0021819 4.90 0.000 1.006363 1.014915
tenga las características promedio del valor Nivel_instrucción .6852813 .0304197 -8.51 0.000 .6281797 .7475734
Años_Aprobados .9524583 .0196558 -2.36 0.018 .9147024 .9917726
de las variables independientes es del 7,39%.
Tipo_Etnia .8862092 .0141256 -7.58 0.000 .8589515 .9143318
Ingresos_Totales 11.65311 .9690963 29.53 0.000 9.900436 13.71607
Continuando el análisis se presenta el Área 2.153025 .132933 12.42 0.000 1.907628 2.429989
_cons .2217423 .0660629 -5.06 0.000 .1236668 .3975976
cálculo de los efectos marginales
individuales: Elaboración: Los autores
Fuente: INEC 2018

5
En el Odds Ratio (o antilogaritmo) se puede siendo aceptada la Hipótesis de que todos los
ver como cada uno de los regresores parámetros son distintos de cero.
incrementan porcentualmente el valor de sus
coeficientes a la probabilidad de que el Jefe Tabla 9 Test De Bondad de Ajuste de
de Hogar sea pobre, es decir en los valores Pearson o Hosmer-Lemshow
Logistic model for pobreza, goodness-of-fit test
de los coeficientes obtenidos se puede medir
que si una de las variables se incrementa en number of observations = 13382
number of covariate patterns = 13049
una unidad, ceteris paribus es probable en Pearson chi2(13037) = 13965.42
promedio que la probabilidad de la persona Prob > chi2 = 0.0000

sea pobre se incremente en el valor de Odds Elaboración: Los autores


Ratio de cada variable. Tomando como Fuente: INEC 2018
ejemplo la variable Área se puede decir que
si se trata de una persona que vive en el El programa stata brinda una gran ayuda con
sector Rural (2) es probable en promedio que el Test de Bondad de Ajuste de Pearson o
la probabilidad de que la persona sea pobre Hosmer-Lemshow, en donde dicho test se
se vea afectada en 2.15 veces a vs que viva usa para modelos logísticos.Siendo la
en el Sector Urbano. Hipótesis Nula que no hay diferencia entre
los valores observados con los
Los Odds ratio no tienen signo negativo, pronosticados, y como se puede ver en la
pero para este tipo de análisis mediante los tabla anterior se puede decir que existe la
Odss los valores menores a 1 tienen relación evidencia estadística suficiente para asumir
inversa como se podrá contrastar con la que nuestro modelo cuenta con una buena
regresión realizada ya que todos los bondad de ajuste logístico entre los valores
coeficientes con signo negativo en la observados y los pronosticados.
regresión de Logit tienen un Odd Ratio
menor a 1 por lo que para darle una Como se pudo ver a lo largo de todo el
interpretación exacta se debe sacar un modelo partiendo desde la estimación hasta
inverso es decir 1/(Odds Ratio de la los test el modelo se comporta de una manera
variable). favorable (La bondad de ajuste queda en
segundo plano de acuerdo a lo mensionado
Pruebas de Hipótesis en parrafos anteriores), a continuación se
evalua el poder predictivo del modelo a
Tabla 8 Test de Wald través de la bondad predictiva.
( 1) [pobreza]Género = 0
( 2) [pobreza]Edad = 0
( 3) [pobreza]Seguro_Social = 0
Tabla 10 Estat Classification.
( 4) [pobreza]Estado_Civil = 0
True
( 5) [pobreza]Categoría_ocupación = 0
Classified D ~D Total
( 6) [pobreza]Experiencia_Laboral = 0
( 7) [pobreza]Nivel_instrucción = 0
+ 1790 2490 4280
( 8) [pobreza]Años_Aprobados = 0
- 500 8602 9102
( 9) [pobreza]Tipo_Etnia = 0
(10) [pobreza]Ingresos_Totales = 0
Total 2290 11092 13382
(11) [pobreza]Área = 0
Classified + if predicted Pr(D) >= .23
chi2( 11) = 1898.72
True D defined as pobreza != 0
Prob > chi2 = 0.0000

Elaboración: Los autores Sensitivity Pr( +| D) 78.17%


Specificity Pr( -|~D) 77.55%
Fuente: INEC 2018 Positive predictive value Pr( D| +) 41.82%
Negative predictive value Pr(~D| -) 94.51%

Como bien se conoce el test de Wald False + rate for true ~D Pr( +|~D) 22.45%
contrasta la Hipótesis nula de que todos los False - rate for true D Pr( -| D) 21.83%
False + rate for classified + Pr(~D| +) 58.18%
parámetros son igual a cero, a lo cual se False - rate for classified - Pr( D| -) 5.49%

puede decir que no existe evidencia Correctly classified 77.66%


estadística suficiente para aceptar la
Hipótesis Nula por lo que se la rechaza Elaboración: Los autores
Fuente: INEC 2018

6
El cuadro anterior muestra el valor de la una curva de 45°, se puede observar que la
sensibilidad, especificación valores curva ROC se encuentra en todos los puntos
predichos pero uno de los mas interesantes por encima de la recta de 45 grados (Curva
en cuanto a la bondad predictiva del modelo sin poder de predicción). Siendo en las
como se puede observar que se ha coordenadas 0,23 y 0,78 el punto donde se
maximizado en punto de corte del 0,23 (Este maximiza la distancia entre la curva ROC y
punto se obtiene mediante testeo hasta ver la recta de 45 grados además si se mide el
las coordenadas de corte en el grafico que se área
Iterationbajo
0: log la curva
likelihood de ROC, el valor del área
= -6124.4889
Iteration 1: log likelihood = -4510.1763
verá adelante) se puede decir que mediante de 0.8585 predice satisfactoriamente un
Iteration 2: log likelihood = -4382.0429
el comando usado de Estat clasification el 85,85%.
Iteration 3: log likelihood = -4380.2433
modelo en general prevee correctamente el Iteration 4: log likelihood = -4380.2432

77,66% de las obervaciones. 3.2.-Modelo


Probit regression
Probit Number of obs = 13,382
LR chi2(11) = 3488.49
Figura 1 Intersección Sensivity y Especifity Tabla 11 Regresión Probit Prob > chi2 = 0.0000
Log likelihood = -4380.2432 Pseudo R2 = 0.2848

pobreza Coef. Std. Err. z P>|z| [95% Conf. Interval]

Género -.2812773 .038468 -7.31 0.000 -.3566732 -.2058813


Edad -.0206946 .0014443 -14.33 0.000 -.0235254 -.0178638
Seguro_Social .0218389 .0044911 4.86 0.000 .0130364 .0306414
Estado_Civil -.0162947 .0081311 -2.00 0.045 -.0322313 -.0003581
Categoría_ocupación .0945158 .0101641 9.30 0.000 .0745945 .1144371
Experiencia_Laboral .0060736 .0012215 4.97 0.000 .0036796 .0084676
Nivel_instrucción -.1963553 .0233188 -8.42 0.000 -.2420592 -.1506514
Años_Aprobados -.027023 .0118726 -2.28 0.023 -.0502929 -.003753
Elaboración: Los autores Tipo_Etnia -.0748488 .0092921 -8.06 0.000 -.0930609 -.0566367
Fuente: INEC 2018 Ingresos_Totales 1.278943 .039793 32.14 0.000 1.20095 1.356936
Área .4259043 .0347237 12.27 0.000 .3578471 .4939616
_cons -.7683625 .1619935 -4.74 0.000 -1.085864 -.450861
Como se puede ver el cruce entre la specifity
y sensivity se da en las coordenadas 0,23 y Elaboración: Los autores
0,78 aproximadamente (Este punto se lo Fuente: INEC 2018
toma mediante “tanteo” en el editor de
Al igual que en el modelo Logit todas las
grafico del Stata) que es el punto donde se
variables son significativas con un 95% de
maximiza la clasificación, y como se había
confianza, por lo que no existe evidencia
visto de las observaciones son correctamente
estadística suficiente para aceptar la
clasificadas el 77,66%.
Hipótesis Nula de que individualmente
Figura 2 Curva de ROC dichos regresores son iguales a cero, por lo
que se acepta la alternativa y se dice que
todos los parámetros son significativos.

En cuanto a la bondad de ajuste de la


regresión cuenta con el Pseudo R Cuadrado
de 28, 48 siendo muy similar al del Logit
(28.7%), por lo que la interpretación es
similar que bajo este criterio la bondad de
ajuste es baja.
Elaboración: Los autores Comparación Regresiones
Fuente: INEC 2018
La diferencia obtenida entre los estimadores
La curva de ROC permite observar la
obtenidos por Logit y Probit se muestra a
Sensibilidad de uno menos la Especificidad,
continuación:
usando el área bajo la curva, con ayuda de

7
Tabla 12 Tabla Comparación Coeficientes Interpretando el modelo existe la
Variable logit probit
probabilidad del 17,15% de que el Jefe de
Hogar sea pobre (“1”), teniendo este valor
Género -.51715443 -.28127726
Edad -.03805958 -.02069458 significante ya que es menor que el 5%, por
Seguro_Soc~l .0411094 .0218389
Estado_Civil -.02930464 -.01629472
lo que no existe suficiente evidencia
Categoría_~n .1813784 .09451581 estadística como para aceptar la Hipótesis
Experienci~l .01057375 .00607358
Nivel_inst~n -.37792587 -.19635529 Nula de que el promedio parametrizado de
Años_Aprob~s
Tipo_Etnia
-.04870899
-.12080226
-.02702295
-.07484877
las variables sea “0”.
Ingresos_T~s 2.4555734 1.2789431
Área .76687374 .42590433
_cons -1.5062396 -.76836246
Tabla 15 Efectos Marginales Promedio
Adjusted predictions Number of obs de= 13,382
Model VCE : OIM
las Variables Independientes
Elaboración: Los autores Expression : Pr(pobreza), predict()
Fuente: INEC 2018 at : Género = 1.225676 (mean)
Edad = 48.49073 (mean)
Seguro_Soc~l = 5.96443 (mean)
Estado_Civil = 2.864594 (mean)
La tabla anterior indica que los parámetros Categoría_~n = 4.333433 (mean)

Logit son mayores en promedio en 1.8 Experienci~l


Nivel_inst~n
=
=
18.60454 (mean)
2.848902 (mean)

aproximadamente a los parámetros Probit, Años_Aprob~s


Tipo_Etnia
=
=
3.385069 (mean)
5.461814 (mean)

ya que los mismos tienen formas funcionales Ingresos_T~s


Área =
= .4670453 (mean)
1.392467 (mean)
diferentes.
Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]
Efectos Marginales
_cons .0838304 .0033887 24.74 0.000 .0771888 .0904721

Los resultados con el modelo Logit no varian Elaboración: Los autores


Conditional marginal effects Number of obs = 13,382
mucho en cuanto a la interpretación del Fuente:
Model VCE
INEC
: OIM
2018
efecto marginal. Expression : Pr(pobreza), predict()
El efecto
dy/dx w.r.t. : Género marginal en promedio
Edad Seguro_Social Estado_Civil deExperiencia_Laboral
Categoría_ocupación los Nivel_instrucci
Ingresos_Totales Área
Tabla 13 Modelo Probit Efectos Marginales coeficientes
at : Género de las = variables
1.225676 (mean) o probabilidad
Edad = 48.49073 (mean)
Delta-method de un individuoSeguro_Soc~l que
= tenga
5.96443 las características
(mean)
dy/dx Std. Err. z P>|z| [95% Conf. Interval] Estado_Civil = 2.864594 (mean)
promedio del
Categoría_~n = valor de
4.333433 (mean) las variables
Experienci~l = 18.60454 (mean)
Género
Edad
-.0516929
-.0038032
.0070269
.0002593
-7.36
-14.67
0.000
0.000
-.0654654
-.0043114
-.0379204
-.0032951
independientes Nivel_inst~n es = del 8.3%.
2.848902 (mean)
Años_Aprob~s = 3.385069 (mean)
Seguro_Social .0040135 .0008237 4.87 0.000 .002399 .005628
Tipo_Etnia = 5.461814 (mean)
Estado_Civil -.0029946 .0014936 -2.01 0.045 -.0059219 -.0000673
Categoría_ocupación .01737 .0018542 9.37 0.000 .0137359 .0210042
Tabla 16 Efectos= Marginales Individuales y
Ingresos_T~s
Área
= .4670453 (mean)
1.392467 (mean)
Experiencia_Laboral
Nivel_instrucción
.0011162
-.036086
.0002237
.0042612
4.99
-8.47
0.000
0.000
.0006777
-.0444378
.0015547
-.0277342
Promedio (Condicionados en media)
Años_Aprobados -.0049663 .0021809 -2.28 0.023 -.0092407 -.0006918 Delta-method
Tipo_Etnia -.0137556 .0016893 -8.14 0.000 -.0170665 -.0104448 dy/dx Std. Err. z P>|z| [95% Conf. Interval]
Ingresos_Totales .2350431 .0066353 35.42 0.000 .2220381 .248048
Área .0782723 .0062711 12.48 0.000 .0659813 .0905634 Género -.0433166 .0059471 -7.28 0.000 -.0549727 -.0316604
Edad -.003187 .0002291 -13.91 0.000 -.0036359 -.002738
Seguro_Social .0033632 .0006853 4.91 0.000 .0020199 .0047064
Elaboración: Los autores
Estado_Civil -.0025094 .0012541 -2.00 0.045 -.0049673 -.0000514
Fuente: INEC 2018 Categoría_ocupación .0145554 .0015328 9.50 0.000 .0115511 .0175597
Experiencia_Laboral .0009353 .0001904 4.91 0.000 .0005621 .0013086
Nivel_instrucción -.0302386 .00345 -8.76 0.000 -.0370005 -.0234767
De hecho, la única diferencia son centésimas Años_Aprobados -.0041615 .0018218 -2.28 0.022 -.0077322 -.0005909
Tipo_Etnia -.0115267 .0014728 -7.83 0.000 -.0144132 -.0086401
entre algunos resultados del efecto marginal Ingresos_Totales .1969566 .0064967 30.32 0.000 .1842233 .2096898
Predictive margins
los regresores en relaciónNumber
a laofexplicación
obs = 13,382 Área .065589 .0054744 11.98 0.000 .0548594 .0763187
de
Model VCE : OIM Elaboración: Los autores
de la variable independiente por parte de los
Fuente: INEC 2018
parámetros.
Expression : Pr(pobreza), predict()
Tabla 14 Efectos Marginales Promedio Esta tabla muestra el efecto marginal de las
variables y de sus medias, para ejemplificar
Delta-method se puede decir que el efecto marginal de la
Margin Std. Err. z P>|z| [95% Conf. Interval] variable Ingresos Totales al obtener una
unidad monetaria adicional de Ingreso afecta
_cons .1715113 .0028206 60.81 0.000 .165983 .1770397
en 19.69% a la probabilidad de que el Jefe
Elaboración: Los autores de Hogar sea pobre. En este modelo Probit
Fuente: INEC 2018 también se pueden ver nuevamente que

8
todos los coeficientes son estadísticamente Tabla 18 Test De Bondad de Ajuste de
significativos. Pearson o Hosmer-Lemshow
Probit model for pobreza, goodness-of-fit test

Comparación Efectos Marginales Logit number of observations = 13382


Vs Probit number of covariate patterns
Pearson chi2(13037)
=
=
13049
18872.68
Prob > chi2 = 0.0000

Para Logit y Probit en las primeras tablas de Elaboración: Los autores


efectos marginales promedios para el caso Fuente: INEC 2018
de Logit fue de 0,1711 y para el caso de
Como se puede ver en la tabla anterior se
Probit de 0,1715.
puede decir que existe la evidencia
En el caso de los efectos marginales estadística suficiente para asumir que
Promedio de las Variables Independientes nuestro modelo cuenta con una buena
son exactamente las mismas para los bondad de ajuste entre los valores
modelos variando únicamente el valor del observados y los pronosticados.
efecto marginal para la constante siendo para
Desde la estimación hasta los test el modelo
el Logit de 7,39% y para el Probit el 8,39%.
se comporta de una manera favorable, pero a
Los Efectos Marginales Individuales y más de realizar una evaluación estructural se
Promedio (Condicionados en media) se evalúa su poder predictivo.
puede ver que los efectos marginales en
Luego de lo revisado tanto el modelo Logit
todas las variables para el modelo Logit son
como el Probit se han comportado de
menores que los que se ven en el modelo
maneras muy similares tanto en los test
Probit, aunque no tienen una variación muy
como sus resultados. En los anexos se puede
significativa.
ver el cómputo del poder predictivo del
Pruebas de Hipótesis modelo Probit.

Tabla 17 Test de Wald 4.- CONCLUSIONES


( 1) [pobreza]Género = 0
( 2) [pobreza]Edad = 0 Revisada las estimaciones del problema dela
( 3) [pobreza]Seguro_Social = 0
( 4) [pobreza]Estado_Civil = 0
pobreza en el Ecuador con la ayuda de los
( 5) [pobreza]Categoría_ocupación = 0 modelos Logit y Probit se detectó
( 6) [pobreza]Experiencia_Laboral = 0 implicancias interesantes que se resumen en
( 7) [pobreza]Nivel_instrucción = 0
( 8) [pobreza]Años_Aprobados = 0
las siguientes conclusiones:
( 9) [pobreza]Tipo_Etnia = 0
(10) [pobreza]Ingresos_Totales = 0  La pobreza es un fenómeno social que
(11) [pobreza]Área = 0
está presente en todo el mundo, sin embargo
chi2( 11) = 2202.83 en Ecuador presenta características
Prob > chi2 = 0.0000 específicas como es la demografía, la
Elaboración: Los autores educación y los salarios. Sin embargo el
Fuente: INEC 2018
mayor determinante de pobreza son los
Mediante el test de Wald se contrasta la ingresos, pero la gran interrogante que surge
Hipótesis nula de que todos los parámetros es si fuera solo los ingresos un determinante
son igual a cero, sin existir la suficiente de ser o no pobre pues en Finlandia
evidencia estadística para aceptar la cambiando el modelo educativo se logró
Hipótesis Nula por lo que se la rechaza, por salir de la condición de pobreza a la mayoría
lo que todos los parámetros son distintos de de la población.
cero.  El análisis de variables cualitativas a
través de modelos Logit y Probit no tienen
mayor variación sin embargo es importante
señalar que siempre dependerá de la manera
9
en que los datos son generados pues estos ingresos para las personas que viven en
determinan la forma funcional de la sectores rurales.
distribución.
 Ecuador en su historia no tiene una 5.- REFERENCIAS
cultura de análisis econométrico de
información cualitativa sino más bien se Cameron, C. &. (2005).
mantienen los métodos tradicionales es por Microeconometrics.
ello que determinar las causas de la pobreza Cameron, C., & Trivedi, P. (2009).
y sus implicancias es un tema novedoso para Microeconometrics Using Stata.
el medio ecuatoriano. Texas: uP bsleih ybd Stata rPess.
 Microeconómicamente el ingreso por EL COMERCIO. (26 de JULIO de 2018).
encima del salario básico representa mayor 25 de cada 100 ecuatorianos son
acceso a la canasta familiar, al igual que pobres. EL COMERCIO.
desde el punto de vista macro, sin embargo
al ser los ingresos los determinantes de ser o Greene, W. (2012). Ecomometric Analysis.
no pobre; es importante recomendar el New York: Pearson Education .
cambio de la matriz educativa pues algunas GUJARATI, D. &. (2010). Econometría
teorías de desarrollo modernas sostienen que (5ta ed.). Mexico: McGraw-Hill.
la mejora continua de las habilidades de los
individuos potencializa sus habilidades lo INEC. (20 de octubre de 2018).
que conlleva a mejores ingresos. INSTITUTO NACIONAL DE
 De la conclusión anterior es importante ESTADISTICAS Y CENSOS.
señalar que un problema social que Ecuador Obtenido de
presenta es el exceso de mano de obra http://anda.inec.gob.ec/anda/index.p
especializada en ciertas áreas por lo que los hp/catalog/171
ingresos de estos grupos son bajos por la Khandker, S., & Haughton, J. (2009).
competencia que tienen entre sí y esto da Handbook Poverty + Inequality.
lugar a la fuga de cerebros. Washington: The World Bank.
 La creación de activos públicos, son una Le Du, A. (2014). Distribución de
parte elemental para generar otros tipos de Probabilidad, Foro Estadística
activos privados, que animan a que los Aplicada. Obtenido de
agentes económicos no estén en condición http://estadisticas-ugma-faces-
de pobreza. guayana.blogspot.com/2014/03/distr
 Si el jefe de hogar cambia sus ibucion-muestral-grupo-6-
determinantes como educación y años de seccion.html
escolaridad, o de área geográfica con el paso
del tiempo la probabilidad de estar en la Pucutay, F. (2002). Los modelos Logit y
pobreza disminuye. Probit para la investigación social.
 Los hacedores de política económica Lima: INEI Centro de
deben considerar que para lograr la Investigaciones y Desarrollo.
disminución de pobreza en Ecuador deben Wooldridge, J. (2010). Introducción a la
fomentar políticas económicas que econometría Un enfoque moderno.
garanticen mejorar las condiciones de las Michigan: Cengage Lear ning.
determinantes de los individuos para que la
probabilidad de pobreza disminuya.
 También se debe indicar que la pobreza
es un fenómeno social causado por la
migración campo ciudad, es por ello que
también se debe promover el desarrollo de
política económica que garantice mejores

10
ANEXOS coordenadas de 0,245 y 0,76
aproximadamente es el punto donde se
Poder predictivo Modelo Probit maximiza la en donde como se vio prevé
correctamente clasificadas el 77,81% de las
Tabla 01 Estat Classification. observaciones.
True
Classified D ~D Total

+ 1784 2463 4247 Figura 02 Curva de ROC


- 506 8629 9135

Total 2290 11092 13382

Classified + if predicted Pr(D) >= .245


True D defined as pobreza != 0

Sensitivity Pr( +| D) 77.90%


Specificity Pr( -|~D) 77.79%
Positive predictive value Pr( D| +) 42.01%
Negative predictive value Pr(~D| -) 94.46%

False + rate for true ~D Pr( +|~D) 22.21%


False - rate for true D Pr( -| D) 22.10%
False + rate for classified + Pr(~D| +) 57.99%
False - rate for classified - Pr( D| -) 5.54%

Correctly classified 77.81%

Elaboración: Los autores


Elaboración: Los autores Fuente: INEC 2018
Fuente: INEC 2018
La curva de ROC muestra la Sensibilidad de
El punto de corte como se verá más adelante
uno menos la Especificidad, usando el área
en la gráfica se da en 0,245 (Este punto se
bajo la curva la ROC siempre se encuentra
obtiene mediante testeo hasta ver las
encima una curva de 45° (Curva sin poder de
coordenadas de corte) en donde se maximiza
predicción). En donde gráficamente,
la clasificación, Con el comando usado de
mediante el área bajo la curva de ROC,
Estat clasification el modelo en general
además del valor del área de 0.8584 siendo
estima correctamente clasificadas el 77,81%
el punto máximo las coordenadas 0,23 y
de las observaciones.
0,78 (corte de las curvas de Specifity y
Contrastando el poder predictivo de los Sensivity), por lo que se puede decir que el
modelos Logit y Probit se pueden ver que modelo predice satisfactoriamente un
prácticamente son iguales ya que para el 85,84%.
Logit se prevé correctamente clasificadas el
Por último se puede decir que casi no existe
77,66% y el modelo Probit el 77,81%.
variación en el poder de predicción bajo el
Figura 01 Intersección Sensivity y Especifity criterio de la curva de ROC de los modelos
Logit y Probit con 85,85% y 85,84%
respectivamente.

Como se ha podido ver a lo largo del


presente trabajo la intención del mismo fue
el contrastar los dos modelos, sus
regresiones, sus efectos marginales y su
poder predictivo, por lo que se puede
asegurar que como bien dice la literatura que
Elaboración: Los autores los dos modelos son similares por lo que no
Fuente: INEC 2018 existe gran diferencia en el usar uno u otro
modelo, el único plus que se puede dar es
Como se puede ver el cruce entre la curva de como se vio en clases los ODDS RATIO
Sensivity y la de Specifity se da en las para el modelo Logit.

11

Potrebbero piacerti anche