Sei sulla pagina 1di 13

PRESENTACIN:

En el presente trabajo se presenta un anlisis exploratorio de datos de gasto de

ingreso, realizando una gama de modelos de regresin lineal simples y

complejos.

Este documento ha sido elaborado por alumnos del 3er ao de la facultad de

economa, aplicando los conocimientos adquiridos en el curso de Econometra

I.

INTRODUCCIN
El presente trabajo es elaborado mediante el Anlisis de STATA en la cual se

analizaron los datos obtenidos en la Encuesta Nacional de Hogares ENAHO

2016, este abarca los aspectos relacionados al gasto del ingreso por familia,

teniendo en cuenta si la familia es pobre, pobre extremo o no pobre.


PLANTEAMIENTO DEL PROBLEMA
El gasto del ingreso por familia es un problema por la que tomamos como una variable

dependiente, de las variables de nmero de miembros por hogar e ingreso familiar.

Aqu veremos si tiene relacin o no entre estas variables.

codebook estrato
tab estrato
recode estrato (1/6=1 "urbano") (7/8=0 "rural"), gen(urbano)
tab urbano

Ahora bien segn las caractersticas de la vivienda y del hogar el rango para
los estratos esta establecido mediante la numeracion del uno al ocho,
definiendo el estrato numero uno como el valor maximo y el estrato numero
ocho como el valor mnimo.
La tabla anterior muestra que de uno a seis son urbanos(=1) y de siete a ocho
son rurales(=0)

El percentil registrado para los datos de infraestructura rural de del 31.31%


mientras que el dato de infraestructura urbana fue del 68,69%.

tab region urbano


table region urbano, c (count pobre)
table region pobre [iw=round(factor07)], c (mean ingpcm min ingpcm max
ingpcm)
table region pobre [iw=round(factor07)], c (mean gaspcm min gaspcm
max gaspcm)
Ahora demostramos los niveles de estrato, rural y urbano por cada regin
natural.
El anlisis de la pobreza mediante el Ingpcm, indico que en lima los ndices de
pobreza son mayores que en el resto de regiones del Peru como tambin la
riqueza es mayor en la capital.

El anlisis de la pobreza mediante el Gaspcm, indico que en lima los ndices de


pobreza son mayores que en el resto de regiones del Per, como tambin la
riqueza es mayor en la capital.
histogram ingpcm, by(region) kdensity
histogram ingpcm, by(urbano) kdensity
histogram ingpcm, by(pobreza, col(1)) kdensity

pobre extremo
0 .002.004.006

pobreno extremo
0 .002.004.006
Density

no pobre
0 .002.004.006

0 10000 20000 30000


ingpcm
Density
kdensity ingpcm
Graphs by pobreza

Los histogramas demuestran la trayectoria de la densidad de la pobreza por


regiones costa sierra selva y lima como tambien por estratos urbanos,
mediante el ingpcm.

reg gaspcm ingpcm


twoway (scatter gaspcm ingpcm) (lfit gaspcm ingpcm)
reg gaspcm ingpcm pobre urbano lima
twoway (scatter gaspcm ingpcm) (lfit gaspcm ingpcm), by( pobre)
twoway (scatter gaspcm ingpcm) (lfit gaspcm ingpcm), by(urbano)
twoway (scatter gaspcm ingpcm) (lfit gaspcm ingpcm), by(lima)
La regresion para gaspcm y ingpcm se interpreta que si ingpcm es cero se
predice que el gaspcm sera de 4.5187e+09 unidades. Cuando ingpcm
aumente en una unidad, en promedio se predice que el gaspcm aumentar en
6.5569e+09 unidades.

Se observa que el valor p es cero y quiere decir que el ingpcm explica


positivamente la variaciones del gaspcm.

Gaspcm=285.3233+0.3715295ingpcm-
228.6995pobre+122.3907urbano+179.1854lima

Cuando el ingpcm aumenta en 1%, el gaspcm aumenta en 0.372%,


manteniendo constante las demas variables.
Cuando la pobreza aumenta en 1%, el gaspcm disminuye en 228.7%,
manteniendo constante las demas variables.

Cuando la cantidad de urbano aumenta en 1%, el gaspcm aumenta en 122.4%,


manteniendo constante las demas variables.

Cuando Lima aumenta en 1%, el gaspcm aumenta en 179.185%, manteniendo


constante las demas variables.

costa, sierra y selva lima


15000
10000
5000
0

0 10000 20000 30000 0 10000 20000 30000


ingpcm
gaspcm Fitted values
Graphs by RECODE of region (RECODE of dominio (dominio geogrfico))

CONTRASTE DE HOMOCEDASTICIDAD MEDIANTE LA PRUEBA WHITE


Las hiptesis vendran a ser:
H0: Homocedasticidad
Var ( ) = 0
H1: Heterocedasticidad Var () 0
El cuadro nos muestra que la probabilidad es menor a 0.05%, por lo tanto la
hipotesis nula (H0) se rechaza; esto quiere decir que existe heterocedasticidad
tipo white.

Para la evaluacion de correcta especificacion debe verse las variables


redundantes y significativas, a lo que se observa en el cuadro las variables
ingpcm,
Pobre, urbano, Lima; son significativas por lo tanto estuvo bien incluirlas en la
ecuacion.
En cuanto a las variables omitidas, sera el primer paso en cuanto al
procedimiento para corregir la heterocedasticidad.
Debe ejecutarse la regresion de la variable ingpcm sobre las variables
pobre, urbano, lima; y obtener los residuales (variables omitidas).

El cuadro nos muestra el segundo paso, que es en el que se debe


obtener el log(2) elevando primero al cuadrado los residuales de MCO y
en seguida tomando el logaritmo natural.
Luego realizamos la regresin de log(2) sobre pobre, urbano, lima; y
obtenemos los valores ajustados.

Lo siguiente es exponen ciar los valores ajustados.


Por ultimo estimamos la ecuacin.
Al haber corregido la heterocedasticidad se observa que:
La ecuacin final del modelo resulta:
Lgaspcm=5.763119+0.0005067ingpcm-0.7202696pobre+0.2573509urbano+0.1814377lima

Con esto podemos decir que:

Cuando el ingpcm aumenta en 1%, el gaspcm aumenta en 0.05%,


manteniendo constante las demas variables.

Cuando la pobreza aumenta en 1%, el gaspcm disminuye en 72.02%,


manteniendo constante las demas variables.

Cuando la cantidad de urbano aumenta en 1%, el gaspcm aumenta en 25.73%,


manteniendo constante las demas variables.

Cuando Lima aumenta en 1%, el gaspcm aumenta en 18.14%, manteniendo


constante las demas variables.

Tambin se observa que por el valor (p) el modelo es significativo.

Potrebbero piacerti anche