Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Artículo de Revisión
Luc Anselin, of the Arizona State Uniner- ción, predicción y simulación de di- matorio de datos espaciales, en los
sity, in two dimensions: (1) the univariate chos fenómenos (Warrick & Myers, que se formulan modelos de regre-
data analysis; that is, the spatial distribu- 1987). Al respecto, se reconoce como sión y se realiza la estimación de
tion characteristics are studied with res- una rama de la Estadística tradicio- parámetros muestrales.
pect to a single variable and (2) the multi-
nal que, parte de la observación de Uno de los componentes más re-
variate data analysis, which involves more
than two variables. Finally, it is concluded
que la variabilidad o continuidad levantes dentro del AEDE e incluso
that the AEDE should be the first link in espacial de las variables distribuidas dentro del AED, es el análisis gráfi-
an analysis for decision making in envi- en el espacio tienen una estructura co. Este, combinado con técnicas de
ronmental, social and economic research particular, que se estudia mediante análisis estadístico, da origen a lo
whose main techniques are statistics and las dependencias entre ellas. De otro que suele denominarse visualización
graphic representation, to enable the lado, la Econometría espacial se científica (Smouse, Long & Sokal,
analysis of spatial distributions and spa- ocupa de la dependencia espacial y 1986), la cual permite extraer toda
tial groupings. la heterogeneidad espacial, aspectos la información posible y de manera
críticos de los datos utilizados por eficiente, cuando se trabaja con
Keywords → Exploratory Analysis Spatial
Data, spatial distribution, spatial trend, los científicos regionales. grandes bases de datos; simultánea-
spatial association schemes. Por lo anterior, en este artículo se mente, genera técnicas gráficas, con
presenta la aplicación de las princi- la capacidad de trabajar con la tota-
Introducción pales técnicas del AEDE, combina- lidad de las observaciones o, si se
das con el análisis estadístico gráfi- desea, analizar parcialmente un de-
En la actualidad no existen técnicas co. Esto hace posible, el estudio de terminado conjunto de datos para
completas, que permitan una cohe- las distribuciones espaciales y sus establecer comportamientos, ten-
rente descripción y visualización de valores atípicos, esquemas de aso- dencias, puntos atípicos, entre otros.
distribuciones espaciales, que den ciación espacial y agrupamientos
validez a un modelo econométrico, En este sentido, un método efi-
espaciales. Para ello, se utiliza el ciente de visualización científica del
herramientas que la econometría programa que ha sido desarrollado
tradicional no incorpora al rezagar AEDE, es aquel que permite identi-
por el profesor Luc Anselin, de la ficar dos características básicas de
efectos espaciales. De esta necesidad, Arizona State Uninersity, con el
nace la pregunta de investigación de las distribuciones espaciales: suavi-
cual se presenta la capacidad y las zado (smooth) y asperezas (rought)
¿porque son necesarios en los estu- posibilidades del AEDE. La versión
dios sociales, ambientales y econó- (Velleman, 1981; Phillips, 1985).
más reciente del programa, está
micos, los análisis exploratorios de disponible en internet (http://sal. El suavizado (smooth), que, en el
datos espaciales (AEDE)? Para en- agecon.uiuc.edu/geoda_main.php) contexto temporal, es la tendencia
tender un poco estas herramientas, y es de acceso libre. central de la variable determinada
es necesario acercarnos a una defini- mediante un elemento central como
ción del análisis exploratorio de da- la mediana y medidas de dispersión,
tos espaciales (AEDE), concebido Materiales y métodos permite determinar tendencias y pa-
como una disciplina dentro del aná- El análisis exploratorio de datos es- trones de asociación espacial en un
lisis exploratorio de datos (AED). paciales (AEDE), se define como el esquema global de análisis, es decir,
Los métodos gráficos y visuales grupo de técnicas que describen y logra identificar patrones de asocia-
del Análisis Exploratorio de Datos, visualizan las distribuciones espa- ción espacial representados mediante
se usan para identificar las propie- ciales, identifican localizaciones atí- la autocorrelación espacial global.
dades de los datos con el fin de de- picas, descubren esquemas de aso- Por su parte, las asperezas (rought),
tectar patrones en datos, formular ciación (auto-correlación espacial) y son un análisis local que identifica la
hipótesis a partir de los datos y as- sugieren estructuras en el espacio presencia de puntos atípicos (outliers)
pectos de la evaluación de modelos. geográfico (heterogeneidad espacial) en distribuciones espaciales.
El AEDE, puede plantearse desde el (Ver Hoef, 1993); por consiguiente, Dentro de las investigaciones so-
punto de vista de la Geo-estadística el AEDE es más una técnica des- ciales, ambientales, económicas y
o por la econometría espacial, donde criptiva (estadística) que confirmato- del territorio, el análisis del espacio
la Geo-estadística es una rama de la ria (econométrica) (Chasco Yrigo- y la localización, han sido variables
Estadística que trata fenómenos es- yen, 2003). Al respecto, se reafirma inquietantes para la toma de deci-
paciales ( Journel & Huijbregs, 1978), que el análisis exploratorio de datos, siones en los sectores públicos y pri-
cuyo interés principal es la estima- es el estudio previo al análisis confir- vados, y la puesta en marcha de
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 93
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
planes de manejo territorial, por el análisis espacial univariante, las Mapas temáticos
ejemplo. Por ese motivo, este artícu- cuales permiten identificar tenden- (cuantiles)
lo brinda técnicas de análisis explo- cias, esquemas de asociación y distri-
ratorio de datos espaciales, soporta- bución espacial. Para ilustrar los Los mapas temáticos, en general,
dos en técnicas gráficas, que permi- ejemplos, se trabaja con base en datos consisten en la representación car-
tan un mejor entendimiento de las correspondientes a variables ambien- tográfica de una variable geográfi-
problemáticas existentes. tales de Colombia, que están asocia- ca. Esta representación de la varia-
Las principales técnicas expues- das a la temperatura media, nivel de ble, en un mapa, puede llevarse a
tas en este artículo de análisis explo- pluviosidad y nivel de humedad rela- cabo mediante símbolos y colores,
ratorio de datos reticular, incluidas tiva, en todos los departamentos de que pongan de manifiesto el valor
en el programa GeoDa, son AED Colombia para el año 2015. de una variable en cada una de las
general, cuyas tendencias espaciales unidades geográficas consideradas
son visualizadas mediante: (i) el his- Representación de la (países, regiones, etc.) (Anselin,
tograma de frecuencias, (ii) el dia- 1995). Puede utilizarse un color/
tendencia central. símbolo diferente para cada valor o
grama de dispersión, (iii) el gráfico
de coordenadas paralelas y (iv) el A menudo, cuando se describen para cada intervalo de valores de la
gráfico de dispersión en 3D; los atí- diferentes grupos de observaciones, variable. Dentro del AEDE reticu-
picos espaciales, se observan a través es necesario resumir la información lar, los mapas temáticos más impor-
de los diagramas de caja. Por otra en un conjunto de datos menos ex- tantes para la representación de la
parte, el AEDE reticular, analiza la tenso que los originales y que permi- tendencia espacial de una variable,
tendencia espacial mediante: (i) ma- ta identificar el comportamiento de son el mapa de cuantiles y el mapa
pas temáticos, (ii) mapa dinámico, los datos, con base en criterios de de la desviación típica (Chasco Yri-
(iii) gráficos condicionales, (iv) dia- categorización cuantitativa. Dentro goyen, 2003).
grama de dispersión de Moran y (v) de este grupo se cuenta con: mapas Los mapas temáticos, son repre-
diagrama de dispersión de Moran de cuantiles, histogramas de fre- sentaciones cartográficas que identi-
multivariante. Los respectivos atípi- cuencia y mapas de desviación típica. fican fenómenos geográficos, como
cos espaciales, se analizan con: (i)
mapa de caja, (ii) mapa de percenti-
les, (iii) cartograma, (iv) gráficos LI-
SA y (v) gráficos LISA multivariantes.
Resultados
En los últimos años, se han propues-
to gran cantidad de métodos gráfi-
cos para el análisis exploratorio de
datos (AEDE), aunque pocos le den
el interés y la efectividad de todos
ellos (Haining, 2000; Wagner,
2003). Se podría afirmar, entonces,
que el método gráfico de AEDE
proporciona resúmenes rápidos y
visuales de las características de da-
tos esenciales, herramienta de gran
ayuda para la toma de decisiones.
Análisis univariante
espacial
Se presentan las técnicas de visuali-
zación gráfica, más usadas en el con- Figura 1. Mapa de cuantiles para la temperatura promedio por departamentos en Colombia, 2015.
texto de la econometría espacial para Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
94 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas | Giuseppe B. de Corso S., Maribel Pinilla R.
Histograma
de frecuencias
TEMP
Este permite visualizar la distribu-
Figura 2. Histograma de frecuencias para la temperatura promedio por departamentos en Colombia,
ción espacial de datos de naturaleza periodo 2015. Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
continua. El histograma se compo-
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 95
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
TEMP
Figura 3. Mapa de desviaciones típicas para la temperatura promedio, Figura 4. Box Plot para la temperatura promedio, periodo de 2015, por
periodo de 2015, por departamentos en Colombia. Fuente: elabo- departamentos en Colombia. Fuente: elaboración propia a partir
ración propia a partir de GeoDa 1.0.1., 2016. de GeoDa 1.0.1., 2016.
cos, es necesario precisar que un la estructura del modelo, es necesa- vaciones, se les conoce como valores
punto atípico, tiene que ver con rio usar transformaciones para sua- atípicos (Graham & Glaister, 2003).
aquellos elementos discontinuos en vizar las bases de datos (Moreno & Por su facilidad de construcción e
una variable, es decir, representan Vayá, 2000). interpretación, también ayuda a
valores excesivamente bajos o altos comparar a la vez varios grupos de
que, generalmente, no son significa- Diagrama de caja datos, sin perder información ni sa-
tivos y tienden a distorsionar el
comportamiento de la variable. Los
y bigotes (Box Plot) turarse de ella. Esto ha sido particu-
larmente importante, en el momento
puntos atípicos (elementos de dis- El diagrama de caja y bigotes (figu- de escoger esta representación para
continuidad en una variable) son ra 4), es un gráfico representativo de
valores de la variable excepcional- mostrar la opinión de los estudiantes
las distribuciones de un conjunto de respecto de la actuación docente,
mente bajos/altos, que pueden no datos, en cuya construcción se usan
ser representativos en la distribución mediante las diversas preguntas del
cinco medidas descriptivas de estos,
general y afectarían el comporta- instrumento utilizado (Whittle,
a saber: mediana, primer cuartil,
miento de los contrastes estadísticos 1954; Vilalta Perdomo, 2005).
tercer cuartil, valor máximo y valor
(Acevedo & Velásquez, 2008; mínimo (Duncan, 1991; Okabe, La construcción del rectángulo,
Cressie, 2001). Satoh & Sugihara, 2009). Esta pre- implica el cálculo del primer cuartil
Dentro de los análisis del AED, sentación visual, asocia las cinco (en el que se ubica máximo el 25 %
la presencia de puntos atípicos im- medidas que suelen trabajarse de de los datos) y el tercer cuartil (don-
plica la existencia de errores de me- forma individual. Al mismo tiempo, de se pone máximo el 75 % de los
dida, que expresan situaciones ex- presenta información sobre la ten- datos), así como de la mediana (que
trañas en el comportamiento de los dencia central, dispersión y simetría corresponde al valor del segundo
datos y no aportan información re- de los datos de estudio. Además, cuartil). El cálculo de los límites in-
levante; por lo cual, en algunos ca- permite identificar, con claridad y ferior y superior se obtiene restando
sos, se aconseja eliminarlos; pero, si de forma individual, observaciones y sumando respectivamente, a la
la cantidad de datos atípicos es rele- que se alejan de manera poco usual mediana el producto de los valores
vante y eliminarlos implica perder del resto de los datos. A estas obser- del tercer (primer) cuartil por 1,5
96 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas | Giuseppe B. de Corso S., Maribel Pinilla R.
Cartograma.
Los cartogramas (figura 5), son una
forma de representación de puntos Figura 5. C artograma de pluviosidad promedio, periodo de 2015, por departamentos en Colombia.
Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
atípicos dentro de las ubicaciones co-
rrespondientes en el mapa; asimismo, de datos que estudia, analiza, repre- correlación o dependencia entre va-
la diferencia o discontinuidad de va- senta e interpreta los datos que re- riables. Las relaciones que pueden lle-
lores se muestra, en la proporción del sultan de observar más de una va- gar a presentarse son de tipo lineal,
tamaño de la observación con respec- riable estadística, sobre una muestra cuando la intersección de cada dato
to a las demás. El cartograma, permi- de individuos. Las variables obser- de X con su respectivo dato en Y, for-
te la identificación de las unidades vables son homogéneas y correla- ma una elipse en cualquier sentido;
con valores atípicos y, adicionalmen- cionadas, sin que alguna predomine nula, cuando la distribución de los
te, facilita la comparación visual de la sobre las demás. La información puntos no tiene una forma estructura-
relación que tienen las unidades con estadística en AM, es de carácter da (por ejemplo, un círculo), y no li-
valores atípicos y las unidades con multidimensional; por lo tanto, la neal, si los puntos adoptan cualquier
valores no atípicos (Wartenberg, geometría, el cálculo matricial y las otra forma (logarítmica, exponencial,
1985; Epperson & Li, 1996). distribuciones multivariante desem- cuadrática, etc.). Pero, la visualización
En el mapa de la desviación están- peñan un papel fundamental gráfica no es suficiente para determi-
dar para el nivel de pluviosidad, se (Sampson, 1987; Delfiner, 1979). nar algún tipo de relación. Por tal
evidencia la existencia de un valor Los análisis multivariante, permi- motivo, se hace necesario el uso de un
atípico que, en el Box Plot, se ubica ten analizar la relación entre múlti- coeficiente que permita medir el gra-
por encima de la mediana, situándose ples variables en simultánea; es decir, do de dependencia entre variables,
arriba del límite superior. En el carto- identifican la incidencia de un grupo como es el caso del coeficiente de co-
grama, el círculo de color rojo, que, a de variables independientes X, con rrelación lineal, que representa el
su vez, es el más grande, representa respecto a una sola variable depen- comportamiento de una variable de-
este valor, correspondiente al nivel de diente Y, medidas mediante un con- pendiente Y, con respecto a una varia-
pluviosidad más alto, el cual se presen- junto de observaciones o datos. ble independiente X. Al respecto, el
ta en el departamento del Choco que, coeficiente de correlación lineal (r) se
para el año 2015, fue de 9000 m. m. Diagramas mueve en un rango de -1 a 1, en el que
de dispersión. valores cercanos a 1 indican una rela-
Análisis ción lineal positiva directamente pro-
multivariante espacial Los diagramas de dispersión, son porcional; valores cercanos a 0 evi-
nubes de puntos que representan la dencian que no existe un esquema de
El análisis multivariante (AM), es la relación entre dos variables X y Y, o correlación definido entre variables y
parte de la estadística y del análisis sea, permiten identificar el grado de valores próximos a -1 indican la exis-
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 97
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
2,9
Diagrama de dispersión
espacio-temporal
1,6
PLUV
El diagrama de dispersión espacio-
temporal (figura 6), arroja el valor
0,3
del coeficiente de correlación lineal
r, denotado por la pendiente, asi-
-1,0
mismo, permite hacer análisis par-
ciales de datos. Algunas observacio-
nes sobre el coeficiente de correla- -2,3 -1,0 0,3 1,6 2,9 4,2
TEMP
ción r para tener en cuenta son:
• I r I = 1 Relación lineal perfecta
Figura 6. D
iagrama de dispersión espacio-temporal de la temperatura, con respecto al nivel de pluvio-
• I r I > 0,8 Relación lineal fuerte sidad, en el periodo de 2015, por departamentos en Colombia. Fuente: elaboración propia a
partir de GeoDa 1.0.1., 2016.
• 0,5 ≤ I r I ≤ 0,8 Relación lineal moderada
• 0 ≤ I r I ≤ 0,5 Relación lineal débil
HUMEDAD
• I r I = 0 No existe una relación lineal (0,25,0,90)
Como se observa en el siguiente
diagrama, el valor y signo del coefi-
ciente denotado por la pendiente, in-
dica que existe una relación lineal PLUV
negativa muy débil (-0.0191), es decir, (500,200,9000,00)
98 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas | Giuseppe B. de Corso S., Maribel Pinilla R.
TEMP
13 29
11.69
7.263
YMCTF
2.828
(4) (3) (2)
-1.606
Figura 8. Grafico condicional del NBI, por departamentos en Colombia, datos de 2015. Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 99
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
Figura 10. M
apa de contigüidades por departamento. Fuente: Elaboración propia a partir de GeoDa 1.0.1., 2016.
100 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas | Giuseppe B. de Corso S., Maribel Pinilla R.
2,0
teracciones, basados en el uso de ma-
trices. Precisamente, ahí se determina
-1,0
el mejor parámetro que identifica el
W_TEMP
esquema de relaciones entre cada va-
-0,0
riable, con la utilización de los criterios
de contigüidad espacial. Para com-
-1,0
prender mejor la utilidad mediante los
criterios, considérese el siguiente mapa
-2,0
de convenciones: (figura 9).
A continuación, se muestran los -3,0 -2,0 -1,0 0,0 1,0 2,0 3,0
criterio de contigüidad de la reina Figura 11. Diagrama de dispersión I de Moran de la temperatura, en el periodo de 2015, por departa-
(criterio de contigüidad para ocho mentos en Colombia. Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
observaciones, donde serán vecinas
de i las regiones que comparten al-
gún lado o vértice con i) para identi-
ficar la vecindad por departamen-
tos. Ver figura 10.
El departamento de Antioquia
tiene ocho departamentos vecinos,
según el criterio de la reina: Bolívar,
Boyacá, Caldas, Chocó, Córdoba,
Cundinamarca,Risaralda y San-
tander.
Test I de Moran
La herramienta auto-correlación
espacial (I de Moran global) mide,
simultáneamente, la auto-correla-
ción espacial basada en las ubicacio-
nes y los valores de las entidades.
Figura 12. Mapa LISA para la temperatura, en el periodo de 2015, por departamentos en Colombia.
Dado un conjunto de entidades y un Fuente: elaboración propia a partir de GeoDa 1.0.1., 2016.
atributo asociado, evalúa si el patrón
expresado está agrupado, disperso o espacialmente la variable en cada Donde Yi Yk Yl …Yn son las zo-
es aleatorio. La herramienta calcula observación; este proceso, consiste nas contiguas a la región Yi. Los
el valor del índice I de Moran y una en calcular un parámetro w y multi- valores rezagados de la variable se
puntuación z. El estadístico de prue- plicarlo por una observación i de la ubican en el eje Y y los valores nor-
ba I de Moran para contrastar la variable en cuestión, donde el pará- males de la variable se ponen en el
auto-correlación espacial es el esti- metro w se obtiene al promediar los eje X. A continuación, se presenta el
mador de la pendiente de la regre- valores de la variable vecinos a i, en diagrama de dispersión para la va-
sión por mínimos cuadrados ordi- el orden de contigüidad especifica- riable temperatura.
narios (Bellehumeur & Legendre, do. Quedando así Wi: El valor del estadístico I de Mo-
1998; Biondi, Myers & Avery, 1994). ran, sugiere que existe un esquema
Para construir el diagrama de Yi*Wi débil de auto-correlación espacial
dispersión de Moran de una varia- Wi=(Yi+Yk+ Yl + …+ Yn)/n global positiva. Es decir, a partir del
ble específica, es necesario rezagar examen del diagrama de dispersión I
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 101
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
de Moran (Figura 11) y la identifica- grupal en la que existe la posibilidad bal (donde los criterios de contigüi-
ción de una estadística importante de que se localicen conjuntos de ob- dad definen la relación de vecindad
de Moran I (0,1508; p<0,001), se en- servaciones, que no evidencien nin- entre unas observaciones y las posi-
cuentra una clara evidencia de auto- gún esquema de asociación espacial. bles regiones vecinas, es decir, los
correlación espacial en la temperatu- esquemas de autocorrelación espa-
ra en Colombia, en el año 2015. Mapas LISA cial local variarán en función del
criterio de contigüidad, utilizándose
(indicadores de asocia- en general el criterio de la reina,
Contrastes de depen- ción espacial local) que contempla el análisis multidi-
dencia espacial local mensional más completo).
univariante Los indicadores de asociación espa-
cial local, se pueden representar A continuación, se presenta el
Estos contrastes, permiten identifi- gráficamente como mapas que de- mapa de clústeres o asociaciones
car clústeres o asociaciones signifi- terminan localizaciones con valores espaciales significativas locales para
cativas de valores altos y bajos de significativos. Asimismo, permiten la variable temperatura promedio
una observación, con respecto a sus el cálculo del estadístico I de Moran en los departamentos de Colombia.
regiones vecinas. Por otra parte, de- de asociación espacial local, es de- Ver figura 12.
terminan si el esquema de auto-co- cir, para cada observación se calcula Como se observa, existen esque-
rrelación especial, es constante en un estadístico I. La sumatoria de los mas de asociación espacial local pa-
todo el espacio geográfico objeto de estadísticos Ii de todas las observa- ra la temperatura con valores signi-
estudio o si, por el contrario, la de- ciones, darán como resultado el es- ficativos altos (tono rojo), en los de-
pendencia espacial es una tendencia tadístico de asociación espacial glo- partamentos de La Guajira, Cesar y
Tabla 1. E stadísticos LISA para la temperatura, en el periodo de 2015, por departamentos en Colombia.
San Andres
10 Casanare -0,3024275 27 0,0000000
y Providencia
17 Guania 0,2421272
102 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas | Giuseppe B. de Corso S., Maribel Pinilla R.
Magdalena y las correspondientes retardos espaciales o temporales), y métrico espacial, porque, finalmente,
localizaciones vecinas de cada uno; la replique como una variable más en esta fase se determina si existe la
valores significativos bajos (tono dentro del modelo. necesidad de aplicar econometría es-
azul), para el departamento de pacial o si, por el contrario, los méto-
Cundinamarca; valores poco signi- Conclusiones dos incluidos dentro de la econome-
ficativos –bajo alto– (tono azul claro) tría convencional siguen siendo útiles.
para el departamento de Sucre, es El AEDE, es una técnica descripti- Los mapas temáticos de cuantiles,
decir, los departamentos contiguos a va que permite la combinación de son útiles para determinar la tenden-
Sucre presentan valores de tempera- herramientas de la rigurosidad esta- cia espacial; sin embargo, el riesgo
tura promedio relativamente altos dística, con métodos de análisis de interpretación inadecuada de los
con respecto a ese departamento; y, gráficos, lo cual ayuda a identificar datos y la obtención de resultados
valores poco significativos –alto ba- y analizar la estructura de la distri- espurios, se hace mayor cuando no
jo–(tono rosado) para el departa- bución espacial en un contexto uni- es posible clasificar los datos en ran-
mento del Huila, o sea, los departa- variante o multivariante, al deter- gos de cuantiles, debido a la gran
mentos contiguos a Huila presentan minar cómo es la regularidad en los diversidad en los valores de los datos.
valores de temperatura promedio esquemas de asociación espacial,
bajos con respecto a dicho departa- cuando las variables en cuestión no Los mapas de desviación típica,
mento. Por su parte, San Andrés no tengan un referente hipotético, que permiten una mejor identifica-
tiene regiones vecinas con las que sugiera alguna idea del comporta- ción de la tendencia espacial, pues
pueda asemejarse a algún patrón de miento de las variables. no clasifican los datos con respecto
asociación espacial; al respecto, pa- a los rangos de cuantiles, si no que
El AEDE, debe constituir el pri-
ra efectos de un mejor análisis espe- establecen unas categorías más pre-
mer eslabón en un análisis modeli-
cial, en el que se presente este tipo cisas, basadas en el grado de disper-
zador y decisor en el campo de la
de situaciones y existan observacio- sión de los valores de los datos con
investigación ambiental, social y
nes muy distanciadas o excluidas del respecto a la media.
económica. En este artículo, se han
resto de observaciones, como es el En el contexto multivariante, el
caso, se hace necesario definir un presentado las principales técnicas
del AEDE, que combinan el análisis análisis del gráfico de coordenadas
criterio de contigüidad que se base
estadístico con el análisis gráfico paralelas permite identificar la ten-
en el reconocimiento de distancias
para hacer posible el estudio de las dencia de una variable asociada con
mínimas d, y no de la determinación
distribuciones espaciales y sus valo- múltiples variables; en consecuen-
de un límite o frontera común.
res atípicos, esquemas de asociación cia, es posible determinar un valor
La sumatoria de los estadísticos espacial y agrupamientos espaciales. medio esperado condicional en si-
de asociación local (tabla 1), dan tuaciones de estudio, en el que se
como resultado el valor del estadís- Se concluye que, en el análisis de
las series geográficas, se requiere de presentan más de dos variables.
tico de auto-correlación espacial
global I de Moran, que es de 0,1508. herramientas propias, que van más
La importancia de identificar los allá de las convencionales técnicas Referencias
esquemas de auto-correlación espa- del AED o minería de datos y, por
tanto, de un software específico. ACEVEDO, I., & Velásquez, E.
cial radica, principalmente como (2008). Algunos conceptos de la
un criterio, en la selección del mo- Estas herramientas, deben estar di-
rigidas al análisis de dos elementos econometría espacial y el análisis
delo econométrico, puesto que, si
fundamentales: tendencia espacial y exploratorio de datos espaciales.
existe una situación bien definida
puntos atípicos. Esto último, se en- Ecos de Economía, (27), 9-34.
de auto-correlación espacial, es ne-
cesario optar por un modelo econo- tiende no solo como la determina- ANSELIN, L. (1995). Local Indicators
métrico espacial que recoja la infor- ción de valores significativamente of Spatial Association-LISA. Geo-
mación procedente de la auto-co- altos o bajos de una variable, sino graphical Analysis, 27(2), 93-115.
rrelación (donde las fuentes de auto- también como “concentración” de BELLEHUMEUR, C., & Legendre,
correlación en un modelo se deben, valores similares o disimilares en P. (1998). Multiscale Sources of
principalmente, a la existencia de torno a una unidad geográfica (de- Variation in Ecological Variables:
esquemas de tendencias bien defini- pendencia espacial). Modeling Spatial Dispersion,
dos, variables incorrectamente es- El AEDE entonces, constituye la Elaborating Sampling Designs.
pecificadas, omisión de variable y etapa previa al modelamiento econo- Landscape Ecology, (13), 15-25.
Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104 103
Métodos gráficos de análisis exploratorio de datos espaciales con variables espacialmente distribuidas. | Giuseppe B. de Corso S., Maribel Pinilla R.
BIONDI, F., Myers, D., & Avery, C. EPPERSON, B. K., & Li, T.-Q. American Journal of Sociology, (93),
C. (1994). Geostatistically Mode- (1996). Measurement of Genetic 348-382.
ling Stem Size and Increment in Structure within Populations SMOUSE P., Long, J. C., & Sokal, R.
an Old-Growth Forest. Canana- Using Moran's Spatial Autocorre- R. (1986). Multiple regression and
dian Journal of Forest Research, 24, lation Statistics. Proceedings of the correlation extension of the Man-
1354-1368. National Academy of Sciences the USA, tel test ofmatrix correspondence.
BRADSHAW, G. A., & Spies, T. A. (93), 10528-10532. Systmatic Zoology, (35), 627-632.
(1992). Characterizing Canopy GRAHAM, D. J., & Glaister, S. UNWIN, A. (2000). Using Your
Gap Structure in Forests Using (2003). Spatial Variation in Road Eyes-Making Statistics More Vi-
Wavelet Analysis. The Journal of Pedestrian Casualties: The Role sible With Computers. Computa-
Ecology, 80(2), 205-215. of Urban Scale, Density and tional Statistics & Data Analysis,
CASETTI, E., & Poon, J. (1995). Land-use Mix. Urban Studies, (32), 303-312.
Econometric Models and Spatial 40(8) , 1591-1607. VAYÁ, E., Moreno, R., & Suriñach, J.
Parametric Instability. Relevant HAINING, R. S. (2000). Providing (2002). Economic Growth and
Concepts and an Instability In- Scientific Visualization for Spatial Spatial Externalities. En L. Anse-
dex. En L. Anselin & R. Florax Data Analysis: Criteria and an lin, R. Florax, & S. Rey (Eds.), Ad-
(Eds.), New Directions in Spatial Assessment of SAGE. Journal of vances in Spatial Econometrics (pp.145-
Econometrics (pp. 301-321). Berlin, Geographical Systems, 2, 121-140. 156), Springer-Verlag: Heidelberg.
Germany: Springer. JOURNEL, A. G., & Huijbregs, Ch. VELLEMAN, P. F. (1981). Applica-
CHASCO YRIGOYEN, C. (2003). (1978). Mining Geostatistics. New tions, basics, and computing of explora-
Métodos gráficos del análisis explorato- York: Academic Press. tory data analysis. Boston: Duxbury.
rio de datos espaciales. Madrid: Ins- LEDUC, A., Drapeau, P., Bergeron, VER HOEF, J. M., Cressie, N., &
tituto L. R./Universidad Autó- Y., & Legende, P. (1992). Study of Glenn-Lewin, D. (1993). Spatial
noma de Madrid. Spatial Components of Forest models for spatial statistics: some
CRESSIE, N. (1993). Statistics for Cover Using Partial Mantel Tests unification. Journal of Vegetation
Spatial Data (Revised edition). and Path Analysis. Journal Vegege- Science, 4, 441-452. doi:
New York: Wiley. tation Science, 3(1), 69-78. 10.2307/3236071
CRESSIE, N. (2001). Fitting Vario- MORENO, R., & Vayá, E.. (2000). VILALTA PERDOMO, C. J. (2005).
gram Models of Weighted Least Técnicas econométricas para el trata- Cómo enseñar autocorrelación
Squares. Journal of the International miento de datos espaciales: La econo- espacial. Economia, Sociedad y Te-
Associarion of Mathematical Geology, metría espacial. Barcelona: Edi- rritorio, 18, 323-333.
17, 563-86. cions Universitat de Barcelona. WAGNER, H. H. (2003). Spatial co-
DALE, M. (1999). Spatial Pattern Analysis OKABE, A., Satoh, T., & Sugihara, variance in plant communities:
in Plant Ecology. Cambridge: Cam- K. A. (2009). A Kernel Density integrating ordination, geostatis-
bridge University Press. Estimation Method for Networks, tics, and variance testing. Ecology,
DELFINER, P. (1979). Basic Introduc- its Computational Method and 84, 1045-1057.
tion to Geostatistics. Paris: Ecole GIS-Based Tool. Geographic Infor- WARRICK, A. W. & Myers, D. E.
des Mines. mation Science, 23(1), 7-32. (1987). Moptimization of Sam-
DUNCAN, R. P. (1991). Competition ORD, J. (1975). Estimation Methods pling Locations for Variogram
and the Coexistence of Species in for Models of Spatial Interaction. Calculations. Water Resources Re-
a Mixed Podocarp stand. Journal Journal of the American Statistical search, (23), 496-500.
of Ecology, 79(4), 1073-1084. Association, 70, 120-126. WARTENBERG, D. (1985). Multivaria-
DYKES, J. (1998). Cartographic Vi- PHILLIPS, J. D. (1985). Measuring te spatial correlation: a method for
sualization: Exploratory Spatial Complexity of Environmental Exploratory Geographical Analysis.
Data Analysis with Local Indica- Gradients. Vegetatio, 64(2-3), 95-102. Geographical Analysis, 17(4), 263-283.
tors of Spatial Association Using SAMPSON, R. (1987). Urban Black WHITTLE, P. (1954). On Stationary
Tcl/Tk and CDV. The Statistician, Violence: The Effect of Male Jo- Processes in the Plane. Biometrika,
47(3), 485-497. blessness and Family Disruption. (41), 434-449.
104 Cuad. Latam. de Admón. | ISSN (impreso) 1900-5016 - ISSN (digital) 2248-6011 | Jul. - Dic. 2017 | Volumen XIII - Numero 25 | Págs. 92-104