Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Director
Edilberto Cepeda C., Ph. D.
Bogot, D. C.
Mayo de 2010
ndice general
Introduccin
12
12
12
1.4.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . .
15
17
20
NDICE GENERAL
20
20
21
23
24
24
26
28
28
36
37
40
41
44
3.2.2. Aplicacin
. . . . . . . . . . . . . . . . . . . . . . . .
46
3.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
. . . . . . . . . . . . . . . . . . . . . . . .
52
Distribucin a priori . . . . . . . . . . . . . . . . . . .
53
54
58
58
4.1.1.
ii
ndice general
4.2.2. Aplicacin . . . . . . . . . . . . . . . . . . . . . . . . .
60
4.2.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . .
64
iii
Introduccin
vi
ndices de concentracin.
Tierra privada rural en
Colombia
Introduccin
La concentracin de las variables econmicas como ingreso, tierra y produccin agricola, se determina con los ndices de Theil, Gini y HirschmanHerfindal, entre otros. En este captulo se calcula el ndice de Gini para la
tierra en Colombia, estudiando los predios privados rurales, mediante el ndice de Gini. En este estudio se exluyen los departamentos de Amazonas,
Guana, Guaviare y Vichada, dado que, para estos departamentos, no se posee informacin de los predios registrados en el IGAC para los aos 1996 y
2000.
La informacin catastral registrada por el Instituto Geogrfico Agustn Codazzi (IGAC) para 1985 indicaba que el total de tierra registrada en Colombia era de 36.6 millones de hectreas, de las cuales, el 89 % era propiedad
privada (Candelo, Mera y Ossa, 2000). En 1996, segn IGAC y Catastro de
Antioqua, la tierra registrada era de 79.4 millones de hectreas, presentndose un incremento en el nmero de hectreas registradas con respecto a la
1
1.1.
Sea una variable aleatoria con funcin de distribucin (), y media finita
. Dado
1 () = inf { : () } , 0 1,
la curva de Lorenz se define mediante una funcin (), definida en el intervalo [0, 1], donde
1 ()
1
() =
().
0
= 1 2
(),
0
[
= 2 1/2
()
donde = { } y = 1
. As, el rea bajo la curva de
Lorenz es =
=1
=1
20
40
L(X)
60
80
100
Curva de Lorenz
20
40
60
80
100
= 1 2 = 1 lm
( + 1 ) = 1 ( ) (1 ).
=1
equivalente a
=1
=1
=1
1
2
= 1
2
1.2.
1.2.1.
Para determinar la curva de Lorenz en el caso de la distribucin de la tierra se debe tener en cuenta el concepto de distribucin equitativa. Existe
una distribucin equitativa de la tierra entre los miembros de una poblacin
cuando a cada uno de ellos le corresponde una fraccin proporcional del total
de la misma. Por ejemplo, en una poblacin de 100 propietarios, si la tierra
est distribuida equitativamente, cada uno de los miembros de la poblacin
debe ser propietario de un 1 % del total de la superficie de la tierra.
La funcin de equidistribucin est determinada por la ecuacin () = ,
donde es el porcentaje de los propietarios de la tierra y = () es el
porcentaje de tierra que le corresponde. Cuando existe concentracin de la
tierra la curva de Lorenz se encuentra por debajo de la diagonal, y a mayor
concentracin de la tierra mayor es la curvatura.
1.2.2.
(1
)
= 2
2
= 1 2
donde es el rea comprendida entre la curva de Lorenz, el eje y =1.
Para calcular el rea bajo la curva de Lorenz, T, se realiza la suma de las
reas de los trapecios cuyas bases corresponden a los rangos porcentuales
acumulados de los propietarios de la tierra. En consecuencia,
1
[1 () + ()][ ( ) ( 1 )],
2
=1
1.3.
1.3.1.
La informacin de predios rurales resgistrados fue suministrada por el Instituto Geogrfico Agustn Codazzi (IGAC) y para el ao de 1996 del catastro
de Antioqua. Los periodos de tenencia de la tierra con registro catastral son
los aos 1986, 1996, 1999, 2000 y 2001. Esta informacin esta desagregada
por cada municipio del pas. Las variables que maneja el IGAC son: Cdigo
del departamento,Cdigo del municipio (este cdigo es el mismo que utiliza
el DANE), ndice del rango, Nombre del Departamento, Nombre del Municipio, Rangos de rea en hectreas, Total de predios por rango, Total de
propietarios por rango, Total de superficie por rangos.
En la tabla 1.1 se muestra la estructura de la base de datos presentada por
municipios, se considran 13 rangos, en hectreas, como es registrado por el
IGAC, tomando como ejemplo el municipio de Sop en el departamento de
Cundinamarca.
Rango ()
<a1
1-3
3-5
5 - 10
10 - 15
15 - 20
20 - 50
50 - 100
100 - 200
200 - 500
500 - 1000
1000 - 2000
> 2000
Predios
73
48
23
16
22
9
30
6
8
2
0
1
0
Propie
80
93
27
19
25
10
39
11
9
2
0
1
0
Area
215.118
900.477
887.665
1.201.487
2.692.937
1.563.713
9.784.236
4.147.000
10.713.998
6.800.000
0
10.710.000
0
Constr (2 )
4.809
7.522
2.468
15.000
2.234
6.128
24.262
4.898
14.765
2.680
0
0
0
Avalo
31.6893.500
105.429.700
334.404.000
1.491.322.000
588.022.000
671.727.000
3.939.730.000
1.078.234.000
2.208.735.000
1.958.803.000
0
369.500.000
0
1.3.2.
Distribucin de la tierra
En esta seccin se presentan datos correspondientes a la estructura de concentracin de la tierra en Colombia, para los aos 1996 y 2000. La tabla 1.2
muestra datos de la concentracin de tierra en la regin Andina. Indica, por
ejemplo, que en 1996, en el departamento de Boyac, el 45.1 % de la tierra
rural estaba distribuida en el 95 % de los propietarios. As, el 54.9 % de la
tierra rural estaba distribuida en un 5 % de los propietarios rurales. Para este
departamento, en el ao 2000 se evidencia un incremento en la concentracin
de la tierra, debido a que el porcentaje de la tierra rural distribuida en el
5 % de los propietarios alcanza el 58.3 %. En la misma tabla, se muestra que
en Quindo, en este periodo de tiempo, en porcentaje de tierra en manos del
95 % de los propietarios paso del 20 % al 44.6 %, indicando un proceso de
desconcentracin. Este fenmeno tambin se presenta en el Huila, que es el
departamento de la regin Andina con menor concentracin.
% de Prop.
Antioqua
Boyac
Caldas
Cund.
Huila
N. Sant.
Quindo
Risaralda
Santander
Tolima
40
1.8
3.4
1.5
2.8
3.1
2.6
1.9
2.4
2.0
2.2
60
3.5
7.9
4.7
7.0
9.0
8.5
4.5
7.6
8.1
8.0
80
13.3
16.1
18.0
20.0
21.1
22.2
11.3
17.9
18.8
20.1
90
32.9
30.0
29.2
30.7
37.5
35.3
19.5
28.1
32.1
38.3
95
38.6
45.1
45.6
43.7
51.6
47.1
26.6
40.0
44.0
49.1
40
1.2
3.2
3.1
3.0
3.2
3.1
2.9
3.3
3.3
3.0
60
3.5
8.1
7.2
9.1
10.2
10.0
7.9
9.0
8.1
9.2
80
10.1
18.1
17.8
20.4
26.6
28.9
19.0
20.2
20.1
22.1
90
20.0
30.0
30.1
33.0
45.2
45.1
31.1
32.0
37.0
40.0
95
39.4
41.7
46.8
46.1
62.0
59.2
44.6
48.0
49.1
57.1
% de Prop.
Atlntico
Bolvar
Cesar
Crdoba
Guajira
Magdalena
Sucre
40
4.5
4.3
3.6
1.9
1.0
3.0
1.9
60
12.6
11.1
11.0
9.1
3.4
12.0
7.6
80
29.0
28.0
24.1
23.0
9.2
26.5
25.4
90
45.0
40.0
38.5
39.0
14.5
38.9
40.1
95
54.3
52.0
49.2
54.4
20.0
52.2
57.5
40
4.1
4.1
5.2
2.3
3.1
3.7
2.3
60
12.1
8.7
16.3
8.5
10.5
14.1
10.0
80
30.0
27.8
34.3
25.3
25.8
30.3
27.8
90
46.0
47.2
52.5
40.0
43.1
46.8
48.3
95
66.1
64.3
66.6
60.0
55.6
65.4
63.5
Cauca
Choc
Nario
Valle
40
1.3
0.06
2.4
0.8
60
4.6
0.9
8.2
3.1
80
12.5
4.5
16.9
11.1
90
20.
5.2
28.6
22.9
95
30.
7.1
35.7
31.8
40
2.0
0.03
2.9
0.7
60
6.9
14.2
9.3
3.4
80
18.3
38.5
19.2
11.9
90
28.7
56.1
32.1
24.2
95
38.5
66.0
42.5
35.7
1.3.3.
Mapas de porcentajes
Caquet
Meta
Arauca
Casanare
Putumayo
40
1.6
0.9
3.1
1.2
0.8
60
5.1
3.1
8.0
5.1
3.1
80
10.4
10.0
16.1
12.9
11.1
90
15.6.
17.6
22.1
21.9
22.9
95
18.1
28.1
33.2
34.4
31.8
40
7.5
0.9
2.6
1.4
0.7
60
14.5
3.0
8.0
7.5
3.4
80
29.3
10.2
15.6
14.5
11.9
90
39.6
20.7
22.1
26.7
24.2
95
48.0
38.0
33.2
37.6
35.7
Cuadro 1.5. Porcentaje de Tenencia de Tierra. Regin Orinoqua y Amazona. 1996 y 2000
Porcentaje de tierra
para el 60& de los propietarios
0,00 - 3,50
3,51 - 7,50
7,51 - 9,30
9,31 - 12,10
10
Porcentaje de tierra
para el 90% de los propietarios
0,00
0,01 - 24,20
24,21 - 33,00
Procentaje de tierra
para el 95% de los propietraios
0,00
0,01 - 41,70
41,71 - 49,10
11
1.4.
1.4.1.
1.4.2.
Gini
Andina
Atlntica
Pacfica
Orinoqua - Ama
0.7579
0.6811
0.7584
0.7843
Antioquia 2000
100
60
0
0
20
40
60
80
100
20
40
60
80
Cordoba 2000
Colombia 2000
100
60
20
0
20
60
Acmulado de tierra
100
Acumulado de Propietarios
100
Acumulado de Propietarios
Acmulado de tierra
20
Acmulado de tierra
60
20
0
Acmulado de tierra
100
Cesar 2000
20
40
60
80
Acumulado de Propietarios
100
20
40
60
80
100
Acumulado de Propietarios
Antioqua
Boyac
Caldas
Cundin
Huila
Nort-San
Quindo
Risaralda
Santander
Tolima
Atlntico
Bolvar
Cesar
Crdoba
Gini
Departamento
0.8583
0.7619
0.7821
0.7529
0.7025
0.6923
0.7755
0.7591
0.7539
0.7404
0.6662
0.6937
0.6178
0.7295
Guajira
Magdalena
Sucre
Cauca
Choc
Nario
Valle
Casanare
Caquet
Meta
Arauca
Casanare
Putumayo
Gini
0.7090
0.6547
0.6972
0.7579
0.6314
0.7646
0.8429
0.8108
0.6904
0.8544
0.8198
0.8108
0.7459
ilcitos y de actores del conflicto armado en Colombia: paramilitares, guerrilla y fuerza pblica. Igualmente, la presencia de narcotrfico y su relacin con
15
el conflicto armado, genera desplazamiento y, posiblemente, mayor cocentracin de tierra (Daz and Snchez 2004).
En la figura (1.6) se representa el ndice de Gini por departamentos. En ella,
se observa que los departamentos del pie de monte llanero, Antioqua y Valle
del Cauca son los que tienen mayor concentracin de tierra; los de menor
concentarcin estn en la regin Atlntica.
Gini 2000
Departamentos
0,000000
0,000001 - 0,666219
0,666220 - 0,729512
0,729513 - 0,794566
1.4.3.
Conclusiones
16
17
Captulo 2. Anlisis
Introduccin
Segn Tukey (1977) el Anlisis Exploratorio de Datos (AED) puede definirse
como el conjunto de herramientas grficas y descriptivas utilizadas para identificar patrones de comportamiento en los datos y para establecer hiptesis
con la menor estructura posible.
El Anlisis Exploratorio de Datos Espaciales (AEDE), en palabras de (Anselin 999a), puede definirse como el conjunto de tcnicas que: describen y visualizan distribuciones espaciales, identifican puntos atpicos espaciales (spatial
outliers), descubren esquemas de asociacin espacial, visualizan agrupamientos (clusters) o puntos calientes (hot spots) y sugieren estructuras espaciales
u otras formas de heterogeneidad espacial. Por tanto, estos mtodos tienen
un carcter descriptivo, aunque la deteccin de estructuras espaciales en las
variables geogrficas hace posible la formulacin de hiptesis para la modelacin economtrica y posible prediccin espacial.
En particular, en el estudio de datos espaciales, cuando no existe un marco
formal o teora previa acerca del fenmeno que se analiza, deben utilizarse
las tcnicas del AEDE. Esta situacin se presenta en el campo de las ciencias
sociales, cuando se analizan grandes bases de datos geogrficos cuya distribucin no se conoce a priori. En los ltimos aos, el AEDE ha sido introducido
18
Introduccin
19
20
3. Heterogeneidad espacial:
a) Mapa del histograma de frecuencias.
b) Diagrama de dispersin.
2.1.
Heterogeneidad y autocorrelacin
espacial
En esta seccin se describen efectos espaciales que se pueden presentar cuando se trabaja con datos georreferenciados. Estos efectos son los que impiden
que los mtodos estndar del anlisis economtrico sean una buena herramienta para el estudio de este tipo de datos, los cuales poseen los efectos
espaciales de autocorrelacin y de heterogeneidad.
2.1.1.
Heterogeneidad espacial
La heterogeneidad espacial es la carencia de uniformidad de los efectos espaciales en la variable de estudio. Esto implica que, en los modelos espaciales,
las formas funcionales y los parmetros varan segn la localizacin geogrfica, no siendo homogneos para la matriz de datos (Anselin 1988; Chasco
2003). Esta variabilidad espacial suele ocurrir, por ejemplo, cuando se utilizan datos de una variable econmica para explicar un fenmeno como concentracin de riqueza en los departamentos de un pas que contiene regiones
pobres y regiones ricas.
La heterogeneidad espacial puede tratarse con tcnicas economtricas clsicas, a travs de la consideracin de cambios considerables en los parmetros,
coeficiente aleatorios o varias formas de cambios estructurales, tales como la
regresin de cambio bruscos.
2.1.2.
2.1.3.
0
12 ... 1
21
0
... 2
=
.
.
.
.
1 2 ...
0
Esta es una matriz cuadrada no estocstica cuyos elementos reflejan la
intensidad de la interdependencia existente entre cada par de regiones y
. Los pesos de la matriz deben de ser positivos y finitos, pero no hay
una definicin nica de estos pesos. La forma ms usada es la contigidad
fsica de primer orden, utilizado por Moran (1948) y Geary (1954), donde
es igual a 1 si las regiones y son fsicamente adyacentes o 0 en caso
contrario.
22
23
2.1.4.
Para definir el retardo espacial se debe tener en cuenta las diferentes vecindades de una regin. Si suponemos una malla regular (Cressie 1993), el
concepto de cambio espacial implica considerar observaciones que estn alejadas una o ms unidades de distancia de una localizacin (, ), donde las
unidades de distancia, determinadas por los retculos, pueden medirse en dos
o en cuatro direcciones. As, por ejemplo si seguimos el criterio reina, cada
celda en una estructura regular (, ) tiene ocho vecinos:
1, + 1
1,
1, 1
, + 1
,
, 1
+ 1, + 1
+ 1,
+ 1, 1
(2.1)
donde es el operador de retardo espacial asociada con la clase de contigidad , es el ndice de las observaciones que pertenecen a la clase de
contigidad con respecto a la localizacin , y son los pesos espaciales
de la matriz de pesos espacial. es una variable retardada espacialmente,
que guarda cierta similitud con la distribucin retardo que se menciona en
el anlisis de series de tiempo. En este caso, los pesos son dados a apriori,
reduciendo as un problema de linealidad y el riesgo de imponer un error
estructural (Anselin 1988).
24
2.2.
2.2.1.
Para determinar la presencia o ausencia de dependencia espacial a nivel univariado, se debe probar si se cumple la hiptesis de que una variable se
encuentra distribuida de forma aleatoria en el espacio o si por el contrario,
existe una asociacin significativa de valores similares o dismiles entre regiones vecinas. Para ello, se ha propuesto unos estadsticos de dependencia
espacial, entre los que se destacan la I de Moran, la C de Geary y la G(d)
de Getis y Ord.
1. El contraste I de Moran (Moran 1948)
=
0
( )( )
=
(
(2.2)
)2
=1
muestral y 0 =
. Segn (Cliff and Ord 1981), cuando el ta
( )
( 1)
=
=
20
( )2
(2.3)
=1
26
() =
() .
=1 =1
(2.4)
=1 =1
2.2.2.
2
/
(2.5)
() =
()
=1
, =
(2.6)
=1
()
()
=1
(2.7)
=1
Los estadsticos locales construidos por (Getis and Ord 1992) inicialmente solo podan ser aplicados al caso de variables naturales posi28
tivas y para matrices de contigidad simtricas (binarias o de distancia). Para solucionar dichas limitaciones, Ord y Getis (1995) reespecifican ligeramente los estadsticos anteriores, obteniendo los denominados
y .
Despus de la estandarizacin de estos estadsticos locales de Getis y
Ord (distribuyndose en todos los casos asintticamente normal estndar), un valor significativo y positivo (negativo) de los mismos indicar
la existencia de un cluster alrededor de la regin de valores similares
elevados (bajos) de la variable .
Es importante resaltar que los clculos de los estadsticos locales de Moran
junto con los de Getis y Ord son complementarios, en la medida que ambos
tipos de ndices suministran informacin derivada del significado diferente
de sus signos.
2.3.
Entre los programas de AEDE reticular, se destaca GeoDa, que incluye tambin un mdulo dedicado al anlisis de regresin espacial. Este programa
ha sido desarrollado por el Profesor Luc Anselin, de la Universidad de Illinois, para presentar la capacidad y posibilidades del AEDE. En trminos
generales, las diferentes funciones de GeoDa podran ser clasificadas en 6
categoras: tratamiento de datos geogrficos, transformacin de datos, representacin grfica en mapas, grficos estadsticos, dependencia espacial
y regresin espacial. La ltima versin de GeoDa es la 0.9.5i del 2004 y
se encuentra en la web en http://geodacenter.asu.edu/software/downloads.
(Anselin 2004; Chasco 2005).
2.3.1.
Como se enunci en la seccin anterior, la dependencia o autocorrelacin espacial, consiste en la existencia de una relacin funcional entre lo que ocurre
en un punto determinado del espacio y lo que sucede en lugares cercanos
o vecinos al mismo. Es decir, una variable estar espacialmente autocorrelacionada cuando los valores observados en un punto o regin dependan de
29
los valores observados en regiones vecinas. La principales tcnicas de asociacin espacial en el AEDE reticular son: el diagrama de dispersin de Moran
y los grficos Local Indicator of Spatial Association, su sigla es LISA (mapa/diagrama de caja), as como sus correspondientes versiones multivariantes.
La tendencia espacial es de carcter geogrfico y tiene un sentido global,
es decir, referido a todo el mapa (y no a una parte del mismo). Por eso,
las tcnicas del AEDE que analizan esta componente son herramientas de
representacin cartogrfica, donde lo fundamental no es el mapa en s mismo,
si no la representacin grfica de los estadsticos bsicos.
32
Diagrama de dispersin
Este grfico muestra la relacin entre dos variables, GeoDa superpone la recta de regresin ajustada por el mtodo de mnimos cuadrados ordinarios y
presenta el valor de la pendiente de la misma. Este grfico se puede calcular
para los valores estandarizados de las variables, de forma que la pendiente de la recta de regresin se corresponda con el coeficiente de correlacin
de Pearson. Adicionalmente, el anlisis de los 4 cuadrantes del diagrama de
dispersin permite identificar las localizaciones con valores superiores o inferiores a la media en ambas variables o al contrario, valores superiores a la
media en una variable e inferiores a la media en otra.
El grfico (2.4) muestra que la correlacin entre las dos variables estandarizadas NBI05 y PR95 es de 0.4074. En general, un ndice de NBI alto tiene
concentracin moderada de tierra y un ndice NBI medio tiene una concentracin alta de tierra. Entre los departamentos con moderada concentracin
de tierra y NBI bajo estn Atlntico, Putumayo, Huila y Tolima. Entre los
departamentos con NBI medio y alta concentracin de tierra estn Cundinamarca, Boyac, Santander, Quindo, Risaralda, Caldas, Antioquia, Valle del
33
Figura 2.5. Diagrama de dispersin para PR95 y Violencia de Grupos Armados al Margen de la Ley.
con moderada concentracin de tierra y alto nivel de violencia son Bolvar y
Norte de Santander.
Las dems variables con respecto a la concentracin de tierra no presentan
35
correlaciones relevantes.
Figura 2.6. ndice de Moran para NBI05 Rural y el retardo espacial de PR95.
36
2.3.2.
conformado por los departamentos de Boyac, Arauca y Casanare, con valores altos de concentracin de tierra y un p-valor de 0.01.
2.3.3.
El anlisis exploratorio de datos multivariados muestra las relaciones espaciales existentes entre las variables geogrficas en cuestin. Mencionaremos
nicamente el grfico condicional.
Grficos condicionales
Este tipo de grficos utiliza 2 variables condicionales que dividen a la muestra de datos en diferentes grupos (categoras). Se trata de dibujar, para una
tercera variable, un grfico o mapa diferente para cada grupo o categora.
El programa GeoDa considera, para cada una de las 2 variables condicionales, 3 grupos o categoras, por lo que se producir un total de 9 grficos
o mapas. Este programa permite variar los intervalos que determinan cada
categora. En concreto, con el programa GeoDa se pueden disear 4 tipos de
38
que son PR95 y NBI05 Rural con la variable VIOL-GRARM. En estos mapas
se muestra que Valle del Cauca y Meta tienen alta concentracin de tierra
con bajo NBI y con un nivel medio de violencia de los grupos al margen de
la ley. En esta misma categora del alta concentracin de tierra pero con un
NBI medio se encuentran los departamentos de Antioquia con una violencia
muy alta, le sigue Arauca y Cauca con un nivel medio-alto de violencia y
luego los departamentos de Boyac y Nario con niveles medio de violencia.
Se destaca tambin la categora de baja concentracin y nivel medio de NBI
con niveles medio de violencia en los departamentos de Cesar, Magdalena,
Bolvar y Norte de Santander, Huila y Putumayo. Los departamentos de
Choc, Crdoba y Sucre que tienen un NBI alto, con moderada concentracin
de tierra presenta nivel bajo de violencia.
40
Captulo 3. Modelacin de la
concentracin de tierra en
Colombia por mtodos clsicos
de econometra espacial
3.1.
Introduccin
3.2.
Los modelos de regresin lineal espaciales los presenta (Anselin 1988), con
una estructura general para organizar varias situaciones modelo en la econometra espacial. Las especificaciones se refieren a situaciones donde las
observaciones son disponibles para una seccin cruzada de unidades espaciales en un punto en el tiempo. La expresin del modelo es
y = W1 y + X + ,
= W2 + ,
(3.1)
con (0, )
y los elemnetos de la matriz de covarianzas como:
= ()
hi > 0,
(3.2)
= [, , , 2 , ]
(3.3)
(3.4)
(3.5)
(3.6)
y = ( + )W1 y + X W1 X W12 y + ,
(3.7)
(3.8)
(3.9)
(3.10)
(3.11)
3.2.1.
(3.12)
= (I W2 )1
(3.13)
y
de las ecuaciones (3.12) y (3.13) se obtiene:
= (I W2 )[(I W1 )y X]
(3.14)
(3.15)
(3.20)
(3.21)
= (I W2 )y X
(3.22)
+ 2 (I W2 )[(I W1 )y X]
(I W2 )[(I W1 )y X]
2
(3.24)
que se puede maximizar numricamente para obtener los mximos de la
y . Las
funcin seudo-verosimilitud de los parmetros y , llamados
1
2 2 [I X] [I X]
2
2
46
(3.25)
(3.26)
estadstico que est distribuido asintticamente como una 2 con dos grados
de libertad.
Seleccin del modelo
La seleccin de los modelos se hace utilizando el criterio de informacin de
Akaike, AIC por sus siglas en ingls,
2 + 2
(3.27)
2 +
(3.28)
3.2.2.
Aplicacin
En esta seccin se estudia el modelo que se ajustar a los datos de concentracin de tierra, utilizando la variable independiente de concentracin de
tierra denotada por PR-95 que corresponde, como se dijo anteriormente, a la
proporcin del 95 % de propietarios de la tierra que tiene un porcentaje acumulado de tierra y est calculada para el ao 2000, los datos originales fueron
suministrados por el IGAC y el Banco de la Repblica. Se consideraron como variables explicativas del nivel de concentracin de tierra en Colombia,
las siguientes: necesidades bsicas insatisfechas del sector rural para el ao
2005 (NBI05 rural), tasa de cobertura en educacin secundaria para el ao
2000 (SECU00), tasa de cobertura en la educacin superior para el ao 2000
(TC-ES00), tasa de participacin de los departamentos con cultivos ilcitos
47
(coca y amapola) durante el ao 2000 (Coca00), la variable violencia de grupos armados al margen de la ley para el ao 2000 (VIOL-GML) y tasa de
recepcin de desplazados para el ao 2000 (TR-DES). Los datos, de estas
variables, utilizados en este anlisis fueron suministrados por diversas instituciones. Los datos de la variable NBI05 rural fueron suministrados por el
DANE, Departamento Administrativo Nacional de Estadsticas, los de SECU00 y TC-ES00 por el Ministerio de Educacin Nacional, los de Coca-00
por la Polica Nacional - Direccin Antinarcticos, y los de VIOL-GML y
TR-DES por el Departamento Nacional de Planeacin.
Para comparar el desempeo del anlisis estadstico de estos datos, consideramos a continuacin varios modelos, el modelo de regresin lineal, el modelo
con retardo espacial en la variable dependiente y el modelo con retardo espacial en los errores, y se muestra que el modelo con mejor ajuste es el que
presenta dependencia espacial en los errores.
1
s.d
p.v
0
-17.3943
39.04215
0.6607
1
0.2256
0.1165
0.0670
2
0.7407
0.4898
0.1461
3
0.1893
0.2276
0.4153
4
-0.0537
0.0242
0.0380
5
0.5345
0.4874
0.2858
48
Modelo
2
s.d
p.v
0
-25.3634
37.4410
0.5051
1
0.1945
0.1124
0.0977
2
0.8796
0.4626
0.0704
3
-0.04534
0.0228
0.0597
Modelo
0
1
2
3
4
5
6
1
-1.9034 0.2944 0.3075 0.3495 -0.0609 0.5101 0.4283 0.2163
s.d
34.6007 0.1212 0.4704 0.2086 0.0205 0.4106 0.3100 0.2153
p.v
0.9561 0.0151 0.5132 0.0939 0.0030 0.2140 0.1670 0.3151
Cuadro 3.3. Parmetros estimados para el modelo con retardo espacial
Modelo
2
s.d
p.v
0
19.0137
12.9083
0.1407
1
0.2868
0.1073
0.0075
2
0.3393
0.2101
0.1063
3
-0.0572
0.0195
0.0033
4
0.4893
0.2750
0.0751
0.3211
0.2086
0.1237
3.3. CONCLUSIONES
(BIC) est dado por = 195.86. As, el mejor modelo es el segundo cuyos
valores de ambos criterios son menores que los del primer modelo.
Modelo
1
s.d
p.v
0
7.3875
31.7992
0.8162
1
0.1806
0.1039
0.0823
2
0.4693
0.3823
0.2196
3
0.3649
0.2010
0.0695
4
-0.0572
0.0204
0.0051
5
0.3500
0.3845
0.3627
0.5043
0.1963
0.0102
Modelo
2
s.d
p.v
0
47.2447
7.5395
0.0000
1
0.1630
0.1056
0.1228
2
0.3685
0.2087
0.0775
3
-0.0535
0.0181
0.0032
0.5898
0.1743
0.0007
Cuadro 3.6. Estimadores para un modelo con retardo espacial en los errores
3.3.
Conclusiones
Como lo muestra el cuadro (3.7), los modelo con menor AIC y BIC corresponden a los de retardo espacial en los errores, siendo el de mejor ajuste el
segundo, cuyas variables independientes estn dadas por NBI05 rural, Coca00, VIOL-GML. Lo que evidencia que la variable concentracin de la tierra
privada rural en Colombia para el ao 2000 es explicada por estas variables.
Se utiliz el modelo de regresin lineal clsica para mostrar la diferencia con
un modelo que presenta dependencia espacial, teniendo mejor ajuste el que
presenta dependencia espacial.
51
52
4.1.
Teorema de Bayes
( , )( )
(, )
=
,
( )
( )
53
(4.1)
donde
(, ).
( ) =
(4.2)
(4.3)
4.1.1.
Distribucin a priori
En esta seccin se discutirn las forma que puede tener la densidad de probabilidad a priori segn el conocimiento que se tiene acerca de . Esta distribucin debe reflejar el conocimiento previo que se tiene acerca del parmetro
antes de observar una nueva muestra.
A prioris informativas
En este caso se tiene un conocimiento previo sobre la poblacin de la cual
es muestreado el parmetro y puede ser utilizado para especificar una
densidad a priori con alguna forma funcional paramtrica particular. Dentro
de este contexto es importante el concepto de distribuciones conjugadas que
se da a continuacin:
Definicin. Sea = {( ), } una familia de distribuciones muestrales. Se dice que la clase de distribuciones es conjugada con respecto a la
familia si para toda ( ) y () , ( ) .
Las distribuciones a priori conjugadas tienen ventajas prcticas. Al pertenecer la a priori y la posteriori a la misma familia paramtrica, la actualizacin
de la informacin acerca de involucra tan slo un cambio en el valor de los
parmetros de la distribucin.
54
A prioris no informativas
Cuando no se tiene informacin inicial disponible para la densidad a priori
se puede proponer () para variando en un subconjunto de . Esta
opcin tiene algunos dificultades: ()puede ser una distribucin impropia
si el rango de es ilimitado, es decir () no es igual a 1 o incluso ser
divergente, violando uno de los supuestos de una densidad de probabilidad.
Adems, si = () es una transformacin inyectiva de , por el teorema de
la transformacin de variables la densidad de es
() = (()) .
4.1.2.
son las muestras sucesivas del parmetro. (Una cadena de Markov es una
sucesin de variables aleatorias 1 , 2 , ..., , ... donde la probabilidad de
dados todos los valores anteriores depende nicamente de 1 ). La cadena
se construye de tal manera que sea irreducible y aperidica, garantizando
as, la existencia de una nica distribucin lmite y la convergencia de la
cadena; las probabilidades de transicin se proponen de tal manera que la
cadena tenga como distribucin lmite la distribucin a posteriori ().
Mtodo de muestreo de Gibbs
En este mtodo la probabilidad de transicin o kernel est constituida por
todas las distribuciones condicionales completas. Gamerman (1997) lo presenta de la manera siguiente: sea () donde = (1 , ..., ) una distribucin
conocida y suponga que deseamos generar una muestra de utilizando el
mtodo de muestreo de Gibbs (Geman and Geman 1984). Cada una de las
componentes puede ser un escalar, un vector o una matriz. Adems, las
distribuciones condicionales ( ) = ( ) para = 1, ..., son conocidas
y es el vector sin la componente i-sima . El problema que se desea resolver es muestrear de cuando la generacin directa es costosa, complicada
o imposible de hacer, pero generar de es posible. El mtodo de muestreo
de Gibbs consiste en:
1. Inicialice el contador de la cadena = 1 y de un valor inicial de la
(0) (0)
(0)
cadena ()(0) = (1 , 2 , ..., ).
()
()
()
Algoritmo de Metrpolisis-Hasting
El algoritmo de Metrpolis-Hasting utiliza las cadenas de Markov. Siguiendo
la manera en que lo presenta (Gamerman 1997), sea una distribucin
conocida de la cual queremos generar una muestra. En este caso se debe
construir una funcin de transicin o Kernel (, ) de manera tal que es
la distribucin de equilibrio de la cadena. Una forma sencilla de hacer esto
es en el caso que satisface las condiciones de reversibilidad de la cadena
(4.4)
= .
(4.6)
(, ) = 1
(, )(, ).
(4.7)
{ ()(, ) }
(, ) = mn 1,
.
()(, )
(4.8)
58
(4.9)
4.2.
4.2.1.
(4.10)
2 = ()
donde Y es el vector ( 1) de observaciones de la variable dependiente,
X es la matriz ( ) de observaciones de las variables independientes,
= (0 , 1 , ...., ) es el vector de parmetros para la media, es la matriz
de retardos espaciales, Y es el operador de retardo espacial, es el parmetro de la variable dependiente retardada espacialmente, = (1, 1 , ..., )
es el vector de las variables explicativas de la varianza y = (0 , ..., )
los parmetros de la varianza. Las variables explicativas de la varianza pueden ser las variables independientes o los retardos espaciales de la variable
dependiente.
Para implementar una metodologa bayesiana para el ajuste del modelo,
se necesita especificar una distribucin a priori para los parmetros. Por
simplicidad, se asume
a priori() para = (, ) esta
que la distribucin
para = 1, 2, ..., .
(4.11)
(4.12)
[( )] = [( )]2 ( )
(4.13)
y
en alguna vecindad de ( ) = 2 . Por lo tanto, si () y () son los valores
actuales de y , el valor apropiado de la observacin es
= () + [ 1 () ][( () )2 1 ( () )]
(4.14)
(4.15)
( () )2
1,
( () )
60
= 1, 2, ...,
(4.16)
(4.17)
1
donde = (1
+ 0.5 ) y = ( + 0.5 ) .
Note que esta propuesta es la misma que resulta como la distribucin a posteriori de , obtenida de la combinacin de la priori con el modelo observado
( , 2),
= 1, 2, ..., .
(4.18)
4.2.2.
Aplicacin
Se estiman dos modelos como los definidos por las ecuaciones (4.10) para
la concentracin de la tierra en Colombia, utilizando mtodos de MCMC
y la metodologa bayesiana descrita en la seccin anterior. Se generan las
cadenas de cada uno de los parmetros, y para cada parmetro, tanto los de la
media como los de la varianza, se realizaron 13.000 iteraciones. Para obtener
las estimaciones a posteriori se eliminan los primeros 8.000 valores de cada
cadena, se calculan la media y la desviacin estndar de estos valores, y se
obtienen as, las estimaciones a posteriori de los parmetros y las desviaciones
estndar respectivas.
Modelo 1.
Y = Y + +
=
i = 0 + 1 ( 05) + 2 ( )
i2 = (0 + 1 ( 05) + 2 ( Y))
61
(4.19)
Donde:
NBI05 corresponde a las necesidades bsicas insatisfechas del 2005,
sector rural. Se uso este valor debido a que no se encontr el NBI para
1993 en el sector rural y buscar un promedio entre estos dos valores.
VIOL-GML corresponde a la violencia registrada por los grupos armados al margen de la ley para el ao 2000.
W es la matriz de retardo espacial.
Y es la variable dependiente PR-95 que se define como la proporcin
del 95 % de propietarios de la tierra que tiene un porcentaje acumulado de tierra y est calculada para el ao 2000. Indica el grado de
concentracin de la tierra.
Los valores de beta y gama estn dados en el cuadro (4.1), con sus respectivas
varianzas.
0
45.02
5.651
Modelo
1
s.d
1
0.2548
0.1281
2
-0.0522
0.01902
7.3148
2.7201
0
-1.6572
1.4420
1
-0.0496
0.0265
2
0.6370
0.5595
i = 0 + 1 ( 05) + 2 ( ) + ( 95)
i2 = (0 + 1 ( 05))
(4.20)
Los valores de beta y gama estn dados en el cuadro (4.2), con sus respectivas
varianzas.
En este modelo el criterio de informacin bayesiano (BIC) es de 190.641. Las
distribuciones a priori de los parmetros de la media y la varianza son normales, de media cero, varianzas grandes (del orden de 105 )y la verosimilitud
62
Modelo
1
s.d
0
45.02
5.651
1
0.2551
0.1281
2
-0.0530
0.01878
7.3150
2.720
0
-1.6560
1.439
1
-0.0489
0.0255
50
30
Beta 0
70
8000
9000
10000
11000
12000
13000
Iteraciones
0.2
0.2
Beta 1
0.6
8000
9000
10000
11000
12000
13000
Iteraciones
64
Beta 2
0.10
0.00
TIERRA EN COLOMBIA
8000
9000
10000
11000
12000
13000
Iteraciones
4.2.3.
Conclusiones
Los modelos planteados desde la metodologa bayesiana presentan mejor ajuste que los modelos clsicos.
Los modelos con varianza variable presentan mejor ajuste que los modelos con varianza constante.
La variable concentracin de tierra expresada como 95 se autocorrelaciona espacialmente, esto significa que si un departamento tiene
concentracin alta de tierra sus vecinos se comportan de igual forma.
La relacin entre la proporcin de tierra que poseen el 95 % de los
propietarios con el NBI rural es directa, es decir a mayor proporcin
de tierra en manos del 95 % de los propietarios mayor es el NBI rural.
En la propuesta bayesianos se model la varianza del error, con un
mejor ajuste que los modelos de regresin espacial clsicos.
La relacin entre la proporcin de tierra que poseen el 95 % de los
propietarios y la violencia es inversa, esto es a mayor proporcin de
65
15
5
5
Beta 3
8000
9000
10000
11000
12000
13000
Iteraciones
66
2
6
Gama 0
TIERRA EN COLOMBIA
8000
10000
12000
14000
16000
Iteraciones
67
18000
0.00
0.10
Gama 1
8000
10000
12000
14000
16000
Iteraciones
68
18000
1000
500
0
Frecuencia
1500
Histograma de Beta 0
20
30
40
50
60
Beta 0
69
70
600
400
0
200
Frecuencia
800
Histograma de Beta 1
0.2
0.0
0.2
0.4
Beta 1
70
0.6
600
400
0
200
Frecuencia
800
Histograma de Beta 2
0.15
0.10
0.05
0.00
Beta 2
600
0
200
Frecuencia
1000
Histograma de Beta 3
10
15
20
Beta 3
1000
500
0
Frecuencia
1500
Histograma de Gama 0
Gama 0
72
1000
0
500
Frecuencia
1500
Histograma de Gama 1
0.10
0.05
0.00
Gama 1
73
Apendice
donde
1 () = { : () },
0 1,
(1) = 1,
(0+ ) 0,
() 0 para (0, 1)
Si se reparametriza la curva de Lorenz (; , ), donde y denotan vectores de parmetros. En el caso ms simple, supondremos que es un parmetro escalar el cual denota algn factor heterogneo de la poblacin. Para
74
Apendice
modelar este factor se supone que varia acorde con una funcin de densidad
de probabilidad continua (; ) con soporte sobre un conjunto , y
donde es un vector de parmetros.
Teorema 2. Bajo las condiciones previas, la siguiente expresin:
, ) =
(;
(; , )(, ),
=
()
()() = [()]
1
1
=
( + 1)
=1
75
[(
]
1
=1
76
Apendice
( )
40
60
80
90
95
4.2
2.1
4.5
3.4
2.6
3.1
4.3
3.1
2.2
8.9
7.5
9.5
8.8
9.0
9.6
8.5
9.1
8.9
18.2
16.1
21.0
26.5
26.5
22
18.6
18.1
19.1
30.0
30.1
34.2
41.1
40.1
37.7
30.7
33.6
34.2
40.5
41.2
47.1
50.3
58.3
46.6
47.2
50.9
48.7
77
% de Propietarios
Atlntico
Bolvar
Cesar
Crdoba
Guajira
Magdalena
Sucre
40
28.5
1.1
6.5
1.6
1.9
3.5
1.8
60
42.5
10.0
14.5
7.0
2.5
14.5
7.5
80
66.5
25.0
32.5
23.0
14.0
35.5
23.8
90
80.0
40.0
48.0
40.
25
39.5
40.0
95
87.1
55.7
65.2
64.9
41.9
50.3
56.9
% de Propietarios
Cauca
Nario
Valle
40
2.9
2.8
1.4
60
6.0
8.5
5.2
80
16.3
19.1
18.5
90
26.0
30.6
34.9
95
40.6
42.5
48.5
% de Propietarios
Caquet
Meta
Arauca
Casanare
Putumayo
40
10.0
1.0
3.1
1.0
1.0
60
20.0
2.4
10.0
3.2
7.3
80
36.5
9.9
19.7
11.3
25.4
90
50.2
18.5
28.6
22.3
40.0
95
57.6
26.6
39.5
33.0
55.4
78
Bibliografa
Anselin, L. 1980. Estimation methods for spatial autoregressive structures. Regional Science Dissertation and Monograph, vol. 8.
. 1988. Spatial Econometrics: Methods and Models. Kluwer Academic
Publishers.
. 2004. GeoDa 0.9.5-i Release Notes. Center for Spatially Integrated
Social Science.
. 1988b. Lagrange multiplier test diagnostic for spatial dependence
and spatial heterogeneity. Geographical Analysis. 20 (1):117.
. 1999a. The future of spatial analysis in the social sciences. Geographic Information Sciences 5 (2):6776.
. 1999b. Spatial Econometrics. University of Texas at Dallas. Richardson, TX 75083-0688.: Bruton Center, School of Social Sciences.
Anselin, L., and A. Bera. 1998. Spatial dependence in linear regression models with an introduction to spatial econometrics. Handbook of Applied
Economic Statistics, pp. 237289.
Anselin, L, and R. Florax. 1995. New Directions in Spatial Econometrics.
Ed. Comunidad de Madrid.
Arbia, G. 2006. Spatial econometrics: statistical foundations and applications to regional convergence. Springer.
Banco-Mundial, and CEDE. 2004. Colombia: una poltica de tierras en
transicin. Documento CEDE 2004-29 29:1100.
Bao, S., L. Anselin, D. Martin, and D. Stalberg. 2000. Seamless integration of spatial statistics and GIS: the S-Plus for ArcView and the S+
Grassland links. Journal of Geographical Systems 2:287306.
79
BIBLIOGRAFA
Breusch, T., and A. Pagan. 1979. A simple test for heteroscedasticity and
random coefficient variation. Econometrica., vol. 47.
Cepeda, E., and D. Gamerman. 2001. Bayesian Modeling of Variance
Heterogeity in Normal Regression. Brazilian Journal of Probability and
Statistics 14:207221.
Chasco, C. 2003. Econometra Espacial Aplicada a la Prediccinextrapolacin de Datos Espaciales. Ed. Comunidad de Madrid.
. 2005. Anlisis Exploratorio de Datos Espaciales al Servicio del
Geomarketing. Ponencia presentada en el III Seminario sobre Nuevas
Tecnologas en la Investigacin, el Marketing y la Comunicacin.
Cliff, A., and J. Ord. 1973. Spatial Autocorrelation. Ed. Pion. London.
. 1981. Spatial Proces. Models and Applications. Ed. Pion. London.
Cressie, N. 1993. Statistics for Spatial Data. Ed. Pion. London.
Dacey, M. 1968. A review of measures of contiguity for two and K-Colr
Maps. Ed. B.Berry.
Daz, A., and F. Snchez. 2004. Geografa de los Cultivos Ilicitos y Conflicto Armado en Colombia. Documento CEDE. (Edicin Electrnica)
18:178.
Fajardo, D. 2002. Notas para la formulacin de un programa de desarrollo
rural para la paz. Colombia tierra y paz.
Fernndez, A., and M. Costa. 1998. Descomposicin de los ndices de Gini
y entropa generalizada: desigualdad y nivel de estudios en Espaa e
Italia (1991). Estadstica Espaola 40:233256.
Gamarra, J. 2007. La economa en el departamento del Cauca, concentracin de tierra y pobreza. Economa regional, Banco de la Repblica
95:353.
Gamerman, D. 1997. Markov Chains Monte Carlo: Stochastic Simulation
for bayesian Inference. London: Chapman and Hall.
Gastwirth, J., and M. Glauberman. 1976. The Interpolation of the Lorenz
Curve and Gini Index from Grouped Data. Econometrica 44:479483.
Gastwirth, J. L. 1971. A general definition of the Lorenz curve. Econometrica 39:10371039.
Gaviria, C., and J. Muoz. 2007. Desplazamiento forzado y propiedad de
la tierra en Antioquia, 1996-2004. Universidad de Antioquia-Lecturas
de Economa 66:946.
80
BIBLIOGRAFA
BIBLIOGRAFA
Sen, K. 1986. The Gini coefficenst and Poverty Indexes: Some Reconciliations. Journal of American Statistical Association 81:10501057.
Unwin, A. 2000. Using your eyes-making statistics more visible with
computers. Computational Statistics and Data Analysis. 32 (3-4): 303
312.
Unwin, A., and D. Unwin. 1998. Exploratory Spatial Data Analysis with
Local Statistics. The Statistician 47 (3): 415421.
82