Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SEIDYS GARAY
ECONOMISTA
PROGRAMA DE ECONOMIA
2016
Pib per cpita a precios corrientes: Es un indicador comnmente usado para estimar la
riqueza econmica de un pas. Numerosas evidencias muestran que la renta per cpita
est positivamente correlacionada con la calidad de vida de los habitantes de un pas.
Esto es especialmente cierto cuando la renta no supera un cierto umbral; sin embargo,
para pases de mayor renta la correlacin entre calidad de vida y renta per cpita se va
perdiendo La renta per cpita, PIB/PBI per cpita o ingreso per cpita es un indicador
macroeconmico de productividad y desarrollo econmico, usado para entregar una
visin respecto al rendimiento de las condiciones econmicas y sociales de un pas, esto
en consideracin del crecimiento real y la fuerza laboral. Generalmente tambin se utiliza
como indicador de bienestar social.
A continuacin se presentan los datos de los aos 2000 hasta el 2016 con respecto a los ndices
del precio de la vivienda nueva y la importancia de cada una de las variables explicativas para el
comportamiento de ese ndice, es decir cul es la que ms influye al establecer un precio cada
ao
Tabla 1: datos de variables
A nivel nacional, los sectores con mayor participacin son: el sector financiero, los servicios
sociales, el sector comercio, y la industria manufacturera. Pero, a nivel departamental, los
sectores con mayor participacin son la explotacin de minas y canteras seguidas de la
construccin la cual es la implicacin ms importante para realizar este estudio y el anlisis
explicativo en la regin y en especial en Villavicencio.
Este comando de STATA describe nos da una primera nocin de las variables que vamos a utilizar el
nmero de observaciones fecha, hora del momento en el cual se llev a cabo la salida tambin
observamos bajo qu tipo se almacenan los datos el formato en el cual est establecido cada
variable esto ms que todo es simplemente lenguaje de stata. Value label me indica si tengo
disfraces de texto para variables numricas y por ltimo el ms importante que es todo lo que hace
referencia a los rtulos de variable como tal, en esta columna podemos ver de qu se trata la
variable, y en qu medida est toda la informacin relevante para poder estudiar.1
A primera vista se observan Los nombres de las variables que estamos estudiando (ipvn Y,
pibper X1, parcontr X2, ipc X3, iccv X4, incredvivi X5, y adicionalmente tenemos a la vista los
residuos. Tenemos 16 observaciones, 7 variables las cuales se les realizo la descripcin, el
momento en el cual se llev a cabo la hora y fecha de la implementacin de este comando (28
noviembre 2016 17:54). El tipo de almacenamiento de este ejercicio es float (flotador) cada
variable posee un formato de %8.0 g excepto los residuos ya que maneja un formato de %9.0g.
Procesamiento de la informacin
Sum detail es el comando que sirve para tomar variable por variable hacer el estudio y ver
cmo se comportan cada una de sus observaciones respecto a los percentiles2
Como en la salida anterior, vemos que la media del IPVN es 54.98 y que la Desviacin estndar
es 29.896 Tambin vemos los diversos percentiles La mediana de IPVN (el percentil 50) 47.86
ndices porcentual. El percentil 25 es 29.025, y el percentil 75 es 77.97. Cuando realizamos el
resumen, aprendimos que el mnimo y el mximo eran 22.73 y 109.68, respectivamente. Ahora
vemos que los cuatro valores ms pequeos en nuestro conjunto de datos son 22.73, 23.41, 24.45
y 28.58. Por el contrario tenemos que los valores ms grandes son 86.35, 95.81, 100 y 109.68. La
asimetra de la distribucin es 0.54, y la curtosis es 1.8817. (Una distribucin normal tendra una
asimetra de 0 y una curtosis de 3) al ser mayor a 0 es positiva.
Analizando los resultados obtenidos por el software se tiene una idea a priori de lo que ser el
modelo lineal mltiple que ayudara a predecir el ndice de construccin de vivienda nueva a
partir del cambio de alguna variable, de acuerdo a la ecuacin:
Y = 1+ 2 X 2 + 3 X 3+ 4 X 4 + 5 X 5 + 6 X 6 (1)
Por ejemplo 2 = - 2,7824 significa que al mantener constante las dems variables4, la
participacin de IPVN en promedio se reduce 2,7824 puntos porcentuales por cada unidad de
incremento dela variable X1= PIBper; y del mismo modo ocurre con las dems variables. As
mismo 4=1.1820 X 4 significa que al mantener constante las dems variables, el ipvn en
promedio aumentara en 1,18 puntos porcentuales por cada unidad de incremento de la variable
X4= IPC. Del mismo modo se interpreta cualquier Bi.
Ahora, se analizara la significativa individual de las variables que nos permitir verificar si cada
variable aporta informacin significativa al anlisis. Bajo el esquema de prueba de hiptesis se
podr definir si la variable aporta informacin significativa.
De acuerdo a los datos odtenidos en la salida de los coeficientes de stata, especificamente en las
dos columnas referentes a valor de T y el VALOR DE SIGNIFICACIA se podra definir
realmente que variable aportan informacion significativa al modelo.
879 .202653
R2 = =0, 934413660993. 4
13406 .644
R2: Esto significa que aproximadamente el 93,4% de la variacin en el promedio del ipvn se
atribuye a la variacin de las variables independientes y solamente el 6,6 % de la variacin de la
variable dependiente no se atribuye a eso.
Suma de cuadrados
La suma total de cuadrados SST, se descompone en dos componentes: suma de cuadrados para la
regresin, y suma de cuadrados del error.
SST = SSR + SSE
La suma de cuadrados para la regresin es aquella parte de la suma total de cuadrados que se
atribuye a las variables independientes. Mientras que la suma de cuadrados del error es aquella
porcin de la suma de cuadrados total y que no se debe a las variables independientes, por ello se
llama suma de cuadrados del error.5
Por otro lado se observa el valor del r ajustado el cual nos indica si realmente el modelo es viable
o no entre ms cercano este de 1 la importancia del modelo igualmente ser mayor.
As mismo es necesario realizar el contraste de regresin a partir de la tabla anova arrojada por
stata. Que servir para verificar que de forma conjunta las variables explicativas aportan
informacin a la variable respuesta6
modelo Sma de Grdos de libertad Media cuadrtica F Sig
cuadrados
Regresin 12527,3513 5 2505,47 28,49 0,000
Residuo 879,2926 10 87,92
total 13406,644 15 893,77
Bajo la prueba de hiptesis se podr verificar si las variables explicativas aportan informacin en
la explicacin de la variable respuesta asi:
Ahora para analizar la tabla anova hay que dirigirse a la columna sig, se observa que el valor es
0,000 a un nivel de significancia del 5% se rechaza Ho (las variables explicativas influyen de
forma conjunta y lineal sobre Y)
Anlisis de los residuos: el objetivo ser verificar que no se violan las hiptesis sobre las que se
estima el modelo y se realiza la inferencia. Los supuestos a analizar son los siguientes:
Normalidad de los residuos, no auto-correlacin, homocedasticidad, falta de linealidad y no
multicolinealidad.
6 ( miranda) p.18
1.1 Linealidad
A partir de los grficos de dispersin se tendr una imagen precisa de que variables
cumplen con el supuesto de linealidad. Si no tienen linealidad se dice que un error de
especificacin 7 (Pardo & Ruiz 2005).
120
120
100
100
80
80
ipvn
ipvn
60
60
40
40
20
20
0 2 4 6 4 5 6 7 8 9
pibper parconstr
ipvn Fitted values ipvn Fitted values
120
120
100
100
ipvn
ipvn
80
80
60
60
40
40
20
20
0 5 10
2 4 6 8 iccv
ipc
ipvn Fitted values
ipvn Fitted values
1.2 Normalidad
7 Estricta mente hablando un error de especificacin es el incumplimiento de cualquiera de los supuestos bsicos
del modelo lineal general, podemos comentar dos tipos de errores especificacin: omisin de variables relevantes
(infra especificacin) e inclusin de variables irrelevantes (sobre especificaciones).
Para demostrar este supuesto se utiliza la prueba de significancia shapiro wilk proporcionada
por el programa stata; debido a que el mtodo de los grafico solo orienta sobre la procedencia o
no de la muestra de una poblacin normal, por eso es mejor trabajar con una prueba estadstica
que certifique o no la normalidad de las variables ( miranda).
El objetivo del test de shapiro-wilk nos permite saber si los residuos son normales o no, la prueba de
shapiro est organizado de la siguiente manera: W: nos da los valores de la prueba de shapiro, V: es
el valor de prueba normal ah nos dice si debemos o no rechazar la hiptesis nula para la
normalidad, Z: problemas de normalidad. Si p> le creo al test.
histogram residuos, normal grafico Q-Q normal de residuos
estandarizados
(Bin=4, start=-11.682756, width=6.7996385)
15
.05
10
.04
5
.03
Residuals
Density
0
.02
-5
.01
-10
0
-10 -5 0 5 10 15 -10 -5 0 5 10
Residuals Inverse Normal
1.3 homocedasticidad
El supuesto de homocedasticidad implica que la variacin de los residuos sea uniforme en todo
el rango de valores de los pronsticos. Para comprobar este supuesto se realiz el diagrama de
dispersin de los residuos tipificados, dejando entre dicho el siguiente resultado:
8 Se observa que aunque existe una tendencia, hay algunos valores atpicos lo ideal sera que todos estn sobre la
lnea.
120
100
80
60
40
20
-10 -5 0 5 10 15
Residuals
Hace referencia a las posibles desviaciones de los datos desde el modelo lineal que se esta
(miranda) Para demostrar este supuesto se calcularon los diagramas de dispersin parcial
mediante STATA. Los cuales permiten una idea rpida sobre la forma que adapta una relacin
() en el contexto del anlisis de regresin, permiten examinar la relacin existente entre la
variable dependiente y cada una de las variables independientes por separado, tras eliminar de
ellas el efecto del resto de las variables independientes incluidas en el anlisis ( pardo y Ruiz,
2005).
Estos diagramas estn basados en los residuos obtenidos al efectuar un anlisis de regresin con
el resto de variables independientes. A continuacin se presentan los diagramas de dispersin
parcial para cada una de las variables independientes.
1.4. multicolinealidad
Fuente: salida de stata.
El valor medio del vif es de 3,35 lo que indica que tiene una multicolinealidad moderara, ya que
la regla dice que si el valor de la media se encuentra entre 2 y 10 indica una multicolinealidad
moderada. Se dice que le modelo tiene multicolinealidad cuando existe correlacin entre 3 o mas
variables independientes, esto reduce al poder predictivo del modelo. Si la correlacin fuese de
dos variables independientes se habla de linealidad (Bello, 2012).
Lo ideal es tener alta correlacin entre las variables independientes con la variable respuesta,
pero que esta situacin no entre las variables independientes9
120
120
100
100
80
80
60
60
40
40
20
20
4 5 6 7 8 9
0 2 4 6 parconstr
pibper
Grfico de dispersin del ipvn y el ipc grfico de dispersin del ipvn y el iccv
150
100
100
50
50
0
0
2 4 6 8 0 5 10
ipc iccv
11 12 13 14
lncredvivi
ipvn 95% CI
Fitted values
CONCLUCIONES
Bibliografa
Moreno, A.A. (s.f.). Seleccin de variales, mtodos stepwise. Obtenido de trabajos resueltos.
Oracle, estadstica y mas: https://es.scribd.com/doc/95258979/Seleccion -de-variables-Metodos-
Stepwise
Pardo, A., & Ruiz, M. . (2005). Analisis de regresin lineal el procedimiento de regresin
lineal. En A. Pardo, & M. . Ruiz, Analisis de datos con SPSS 13 base (pags. 337-377). Madrid:
McGraw-Hill.