Sei sulla pagina 1di 12

Jess Manuel Caballero Daz (2010).

Uso de los Sistemas de Informacin


Geogrfica para el Anisis de la Biodiversidad. Aplicacin al Estudio de los
Macrolepidpteros
en
Angola.
Merida
2010.
Disponible
en
http://www.academia.edu/5508581/Construcci
%C3%B3n_y_uso_de_mapas_probabil
%C3%ADsticos_en_el_estudio_de_la_biodiversidad_aplicaci
%C3%B3n_al_estudio_de_los_macrolepid%C3%B3pteros_de_Angola

1.3 El modelado predictivo


Bajo el nombre genrico demodelado predictivo (MP) se agrupa un conjunto de
mtodos que analizan la posible presencia de una especie, formacin o
ecotopo basndose en lo actualmente conocido y extrapolndolo al resto del
territorio. El procedimiento es, en principio, simple y puede explicarse en los
siguientes pasos que se vern con ms detenimiento en el apartado de
metodologa:
1. Localizar geogrficamente los registros de presencia de la especie X y, si es
posible, establecer igualmente puntos de ausencia.
2. Integrar los datos en un sistema de informacin geogrfica (SIG) a partir de
sus coordenadas de forma que permita el anlisis espacial de la informacin.
3. Revisar exhaustivamente los datos para confirmar su correccin y eliminar
los errores.
4. Definir un conjunto de variables descriptivas que se utilizarn como
predictores. La idea es intentar definir un nicho ambiental para la especie a
partir de los datos de presencias y ausencias disponibles. Estas variables
suelen ser topogrficas y climticas.
5. Establecer una relacin estadstica entre las variables descriptoras o
independientes y la dependiente (presencia/ausencia). Este proceso es
esencialmente un procedimiento de clasificacin: se trata de generar un
algoritmo que separe lo mejor posible los positivos (presencias) y negativos
(ausencias) en el espacio multidimensional de las variables. Normalmente la
clasificacin genera resultados en un rano 0-1 que se relaciona con una funcin
de pertenencia al conjunto de presencias.
6. Valorar la bondad de la clasificacin, es decir, hasta qu punto el clasificador
ha podido discriminar correctamente entre los datos de presencia y ausencia
que se le han suministrado.
7. Construir el modelo cartogrfico a partir del clasificador o modelo
estadstico. Este procedimiento se realiza etiquetando cada punto del rea de
estudio con un valor de probabilidad de presencia en funcin de los valores
generados por el clasificador. El resultado de este procedimiento es un mapa
de probabilidad de presencia que llamaremos aqu modelo de idoneidad (Figura
3)

Los modelos de idoneidad representan lo adecuado o inadecuado del


territorio para la presencia de la especie en una escala continua en el rango 01 (incompatible - idneo). El valor concreto de cada punto se asigna mediante
una funcin de distancia que puede elegirse entre un conjunto de mtricas
relativamente variado. Los modelos de idoneidad se construyen con el fin de
tener una estimacin de las reas donde es ms probable encontrar la especie.
Los objetivos pueden ser muy variados y en la bibliografa encontramos el
estudio de la riqueza de especies (Cumming, 2000), distribucin potencial de
bosques (Felicsimo et al., 2002b; Felicsimo and Gmez-Muoz, 2005), el riesgo
asociado a especies invasoras (Kolar and Lodge, 2002), la proteccin de
especies amenazadas (Godown and Peterson, 2000) o los cambios de la
distribucin de especies ante escenarios de cambio climtico (Iverson et al.,
1999; Peterson et al., 2002).
Los modelos de idoneidad se soportan sobre mtodos de clasificacin
multivariantes. El ms popular fue hasta hace pocos aos la regresin logstica
multivariable (RLM) aunque ms recientemente los investigadores han
comenzado a explorar otros mtodos buscando especialmente superar las
limitaciones inherentes a los mtodos paramtricos. En (Guisan and
Zimmermann, 2000) puede encontrarse una buena revisin de diferentes
mtodos para la generacin de estos modelos; en (Lobo, 2000) encontramos
una discusin complementaria sobre problemas inherentes a los mtodos y en
(Elith et al., 2006a) una nueva revisin ms actual y donde se incorporan
novedades metodolgicas esenciales. Respecto a los mtodos, los ms
habituales en la bibliografa son los siguientes:
*
mtodos de regresin (GLM, generalized linear models) con un uso
frecuente de la regresin logstica (Narumalani et al., 1997; Pfeiffer et al.,
1997; Odom et al., 2001).
*
redes neuronales (Lek-Ang et al., 1999; Ordez et al., 2003)
*
algoritmos genticos (Lim et al., 2002; Anderson et al., 2003)
*
machine learning (Kobler and Adamic, 2000; Ordez et al., 2003)
*
CART, classification and regression trees (Moore et al., 1991; Iverson et
al., 1999; Muoz and Felicsimo, 2004a)
*
MARS,multivariate adaptive regression splines (de Veaux and Ungar,
1994; Felicsimo and Gmez-Muoz, 2005).
La eleccin del mtodo no es una decisin inocua sino que condiciona
estrechamente la calidad de los resultados por lo que debe ser tomada
fundamentadamente y con una evaluacin y control del error adecuado
(Fielding and Bell, 1997a). La fiabilidad de los modelos depende en gran
medida de la calidad de los datos a partir de los cuales se realiza el anlisis.
Estos datos bsicamente es engloban en dos tipos: por un lado est la
distribucin de las especies que queremos estudiar y por otro lado tenemos las
variables que vamos a considerar potencialmente influyentes en la presencia

de la especie en cuestin. Los problemas ms habituales que aparecen a la


hora de recopilar esta informacin son:
*
informacin insuficiente o irregular, derivada de esfuerzo de muestreo
inadecuado o variable (Lim et al., 2002; Stockwell and Peterson, 2002).
*
ausencia o falta de fiabilidad de datos negativos, ya que frecuentemente
se registran solamente las presencias (Marsden and Fielding, 1999; Pearce and
Boyce, 2006)
*
falta de exactitud o de resolucin espacial, que debe ser compatible con
los objetivos del trabajo y coherente con lo que se pretende discriminar. Cabe
destacar finalmente que los modelos de idoneidad no son causales, es decir, no
establecen relaciones causa-efecto entre las variables ambientales y la
presencia de especies. Los modelos de idoneidad establecen relaciones
estadsticas tratndose, por lo general, de modelos empricos (Guisan and
Zimmermann, 2000; Robertson et al., 2003) por lo que no se debe caer en el
error de analizar las variables independientes como causas primarias de las
distribuciones
4.

DATOS

4.1. Variables Independiente (Ejemplo: las Mariposas)


4.1.1.
Tabla de Localidades
----------------------------------------------------------------------------------------------------------------------Cdigo
Localidad Distrito
Provincia Long Latitud
Altitud
Hoja
----------------------------------------------------------------------------------------------------------------------4.1.2.

Tabla de Especies

4.1.3.

Tabla de Localizacin

------------------------------------------------------------------------------------------------Cdigo
Especie
Long
Latitud
Altitud
-------------------------------------------------------------------------------------------------

4.2. Variables Independientes

Para la elaboracin de los modelos de distribucin potencial se han utilizado


variables independientes con cobertura global y resolucin espacial
compatible. Podemos agruparlas en tres categoras que describimos a
continuacin:
elevacin
variables climticas
variables NDVI
4.2.1.
Elevacin
Los datos de elevacin proceden de la Shuttle Radar Topography Mission
(SRTM12), un proyecto encabezado por la National Geospatial-Intelligence
Agency (NGA) y la National Aeronautics and Space Administration (NASA) con
la colaboracin de las agencias espaciales de Alemania (DLR) e Italia.
ftp://e0srp01u.ecs.nasa.gov/srtm/

4.2.2. Datos climticos


Los datos climticos son an ms escasos que los topogrficos, incluso en
pases desarrollados. Baste decir que en Espaa no disponemos de mapas
climticos generales y que los datos de las estaciones no son pblicos. Cuando
es necesario trabajar con grandes extensiones es obligado acudir a bases de
datos poco detalladas pero de cobertura general, como es el caso de
Worldclim.
Las variables climticas consideradas han sido la temperatura media, as como
las medias de las mximas y de las mnimas junto con la precipitacin mensual
registrada en las estaciones meteorolgicas; y 19 variables bioclimticas
derivadas.
Para este estudio se descargaron los datos correspondientes al rea de estudio
para las siguientes variables:
*
temperatura media de las mximas mensual (12 mapas, uno por mes)
*
temperatura media de las mnimas mensual (12 mapas, uno por mes)
*
precipitacin media mensual (12 mapas, uno por mes)
*
variables bioclimticas: 19 mapas resultado de la cominacin de las
variables mensuales anteriores.

4.2.3 ndice de Vegetacin, NDV

El otro conjunto de variables independientes utilizado ha sido el NDVI o ndice


de vegetacin normalizado (Normalized Difference Vegetation Index). El NDVI
se estima mediante la expresin siguiente:

4.3

APLICACIONES INFORMATICAS

Las aplicaciones informticas utilizadas en este trabajo y su funcin han sido


las siguientes:
SPSS
12
(Statistical
Package
for
Social
Sciences,
SPSS
Inc,
http://www.spss.com/): clculos para la reduccin dimensional de la serie de
imgenes NDVI mediante ACP, anlisis de componentes principales.
ArcView GIS 3.2 y ArcInfo 7.1.2 (Enviromental Systems Research Institute,
Inc., ESRI, http://www.esri.com/): la integridad de los procesos, anlisis y
tratamientos mediante SIG.
Microsoft Access 2002 (Microsoft. http://www.microsoft.com/): creacin y
gestin de las bases de datos utilizadas en esta tesis.
MARS 2.0 (Salford Systems, http://www.salford-systems.com/): construccin
de modelos estadsticos basados en regresiones no paramtricas.
DIVA-GIS 5.2.0.2 (International Potato Center, http://www.diva-gis.org/):
construccin de modelos estadsticos basados en los algoritmos Bioclim y
Domain.
DesktopGarp
(The
University
of
Kansas
Center
for
Research,
http://www.nhm.ku.edu/desktopgarp/): construccin de modelos estadsticos
basados en algoritmos genticos.
MaxEnt (Maximum Entropy Modeling of Species Geographic Distributions,
http://maxent.sourceforge.net/about.html):
construccin
de
modelos
estadsticos basados en algoritmos de mxima entropa

4.4

OTRO MATERIAL CARTOGRAFICO

4.4.1 reas protegidas


Las reas protegidas de Angola utilizadas en esta tesis doctoral corresponden a
los parques nacionales y naturales, reservas parciales y totales de Angola
obtenidas de la base de datos World Database on Protected Areas 25 del
Programa de Medioambiente de Naciones Unidas 26 en colaboracin con la
comisin de reas protegidas del IUCN 27.
4.4.2 Lmites administrativos
Los lmites administrativos de Angola han sido descargados del servidor de
datos del Internacional Potato Center 2829 que contiene diversos mapas

temticos, desde los lmites administrativos de pases, elevaciones basados en


los datos SRTM y datos climticos basados en WORLDCLIM. El archivo
descargado contiene tres coberturas con diferentes niveles de desagregacin
administrativa: ADM0 (fronteras de los pases), ADM1 (primer nivel de
subdivisin administrativa como pueden ser estados o departamentos) y ADM2
(segundo nivel de subdivisiones administrativas) (Figura 29)
5.
METODOS
5.1. Combinaciones de variables independientes
Los conjuntos de variables y sus combinaciones se resumen en la Tabla 12. Se
han utilizado 4 grupos de variables para generar los modelos de idoneidad con
cada mtodo estadstico. Por ejemplo, la combinacin llamada bio usa las 19
variables bioclimticas y 7 factores principales determinados a partir de la
serie de NDVI mediante ACP. A estas 26 variables se unen la elevacin, la
latitud y la longitud. Estas tres ltimas variables se han usado en todas las
combinaciones. Como las variables climticas y bioclimticas ya se han
descrito en el captulo anterior, as como el origen de los datos bsicos NDVI,
queda explicar en este captulo el proceso para generar los factores principales
a partir de la serie de imgenes NDVI.

5.3 Modelizadores estadsticos


Los modelos de idoneidad se han construido mediante 5 mtodos de modelado
estadstico diferentes a partir de los 4 conjuntos de variables descritos
anteriormente. Ya hemos comentado que existe una amplia variedad de
mtodos estadsticos para la elaboracin de modelos de idoneidad en estudios
de ecologa. Podemos encontrar revisiones de estos mtodos en varios trabajos
como (Guisan and Zimmermann, 2000; Elith, 2002; Hernndez, 2004; Elith et
al., 2006b), por lo que nos centraremos en las familias que acogen a los 5
modelizadores estadsticos utilizados en este trabajo. Los modelizadores que
hemos utilizado en este trabajo son los llamados BIOCLIM, DOMAIN, MAXENT,
GARP y MARS (Tabla 13) y han sido elegidos para tener una representacin de
mtodos muy diferentes en cuanto a sus fundamentos y asunciones
estadsticas.

5.3.1 BIOCLIM
Fundamentos
BIOCLIM utiliza un algoritmo de envuelta ambiental que acota aquellas
localizaciones que estn incluidas en el rango de variacin de condiciones
ambientales que incluyen las presencias. Para ello se identifican los valores
mximos y mnimos de las variables independientes entre los cuales aparecen
las presencias de la muestra. Los puntos del rea de estudio que tienen unas
condiciones ambientales dentro de los lmites de la caja multidimensional
definida por esos rangos son declarados como potenciales puntos de presencia
por estar contenidos en la llamada envuelta marginal. Este procedimiento
presupone que las localizaciones de presencias representan adecuadamente el
nicho ambiental de la especie, definido por los rangos de las variables
ambientales entre los cuales se distribuyen las presencias que se introducen
como datos. La primera referencia localizada donde este mtodo fue utilizado
para generar mapas de presencia es la de Nix (1986) sobre la distribucin de
serpientes en Australia. BIOCLIM ha sido utilizado tambin con otros grupos
incluyendo, como en este trabajo, lepidpteros (Beaumont, 2002, Pyry 2008).
Lgicamente, el mtodo es muy sensible a los datos errneos lo que suele
paliarse eliminando los datos extremos. En el procedimiento ms comn se
define la caja por los valores de los rangos entre los percentiles del 5% y del
95% en cada variable (envuelta central, Figura 30). Los lmites del rango de
delimitacin pueden relajarse o restringirse en funcin del modelo y de las
condiciones ambientales (Beauvais et al., 2004; Hernndez, 2004; Parra et al.,
2004).

BIOCLIM trabaja con datos de presencia nicamente, dando como resultado un


modelo de fcil interpretacin y sin prerrequisitos estadsticos pero con algunos
problemas como:
las variables son tratadas como con igual peso en el modelo por lo que
pueden introducirse distorsiones con facilidad a travs de variables no
pertinentes.
no hay informacin sobre la variabilidad explicada por cada variable.
no hay informacin sobre la correlacin entre variables ni sobre sus posibles
interacciones.
Todas las combinaciones de las variables dentro de la envuelta ambiental se
consideran igual de adecuadas a pesar de la sensibilidad a datos anmalos y a
los sesgos del muestreo con lo que lo anteriormente descrito puede ser
insuficiente al reducir el potencial predictivo y aumentar el error de omisin
(porcentaje de falsos negativos o presencias reales fuera del rea predicha por
el modelo) (Hernndez, 2004)
la introduccin de excesivas variables provoca un efecto de sobreajuste
(overfitting) del modelo donde las predicciones de idoneidad se ajustan
estrechamente a los datos de entrada generando un modelo cartogrfico sin
sentido biolgico; al contrario, el uso de pocas variables genera nichos
climticos excesivamente amplios (sobreprediccin). En cambio, es uno de los
pocos mtodos que puede usarse cuando hay poca informacin y slo de
presencias aunque en estos casos es necesario ser prudente e interpretar los
mapas en un sentido exploratorio ms que como predictores de nichos
ambientales.

Aplicaciones informticas
BIOCLIM est implementado en DIVA-GIS 5.2, un Sistema de Informacin
Geogrfica de libre distribucin que hemos utilizado para realizar estos
modelos. Los fundamentos propios de esta aplicacin estn descritos en
Hijmans 2001.
Los datos de entrada son las variables ambientales en formato raster (matricial
regular) y los puntos de presencia en formato vectorial. La aplicacin permite
seleccionar las variables a incluir en el modelo as como los percentiles que
definen el rango de la envuelta ambiental. Los resultados son limitados en el
sentido de que se puede obtener un mapa binario (presencia/ausencia
predicha) o en ms clases pero no la contribucin de cada variable al modelo
final ni estadsticos de error.

Distribucin potencial de Aniba perutilis Hemsley en el departamento


del Valle del Cauca.
BIOCLIM
El dominio genera dos reas potenciales de distribucin, central y extenso. El
dominio central est definido por un conjunto de celdas que registran
homoclimas para la especie dentro de valores porcentuales que caen en el
intervalo de 5-95% del perfil bioclimtico.
Estas celdas se consideran como un clima conveniente para la especie. Los
valores
menores de 5% y mayores de 95% se consideran como celdas con un clima no
conveniente para la especie, corresponden a valores extremos del clima. Y el
dominio extenso incluye celdas que caen dentro de valores porcentuales que
van de 0-100% del perfil (Nix, 1986; Lindernmayer et al. 1991; Villaseor y
Tellez-Valdes, 2004; Garca, 2006).
Para la presentacin del mapa de resultados de cada modelo, se fijo un formato
de valor entre 0-1, que se pueda similar a una probabilidad de presencia de la
especie en cada celda de la zona de estudio. Utilizando este rango de valores
comunes, se pudo adicionar los resultados finales de los modelos.

TRABAJOS SOBRE PREDICCION DE ESPECIES


Lobo, J.M., 2000. Es posible predecir la distribucin geogrfica de las especies
basndonos en variables ambientales? In: F. Martn-Piera, J.J. Morrone and A.
Melic (Editor), PrIBES 2000, Zaragoza, Espaa, pp. 55-68.
Moreno, C.E., 2001. Mtodos para medir
Entomolgica Aragonesa, Zaragoza, 83 p.

la

biodiversidad.

Sociedad

Muoz, A.G., 2004. Distribucin potencial de especies arbreas en las dehesas


de Extremadura, Universidad de Extremadura.
Sillero, N., 2006. Aplicacin de la teledeteccin y de los Sistemas de
Informacin Geogrfica en el anlisis de la biogeografa de anfibios y reptiles
ibricos, Universidad de Len, Len.
Villaseor, J.L. and Tllez-Valds, O., 2004. Distribucin potencial de las
especies del gnero Jefea (Asteraceae) en Mxico. Anales del Instituto de
Biologa, Universidad Nacional Autnoma de Mxico, Serie Botnica, 75:205220.
De Marco, P.Jr. & Siqueira, M.F. 2009. Como determinar a distribuio potencial
de espcies sob uma abordagem conservacionista? Megadiversidade,5 :65-76.

Carlos Alirio Hurtado Aguilar (2007). USO DE MODELOS DE PREDICIN COMO


HERRAMIENTA PARA ESTIMAR EL REA DE DISTRIBUCIN POTENCIAL DE LA
ESPECIE Aniba perutilis Hemsley (COMINO CRESPO) EN EL DEPARTAMENTO DEL
VALLE DEL CAUCA. Tesis de pregrado presentada como registro para optar al
titulo de Eclogo. FUNDACIN UNIVERSITARIA DE POPAYN, FACULTAD DE
CIENCIAS NATURALES, PROGRAMA DE ECOLOGA, POPAYN. Dispinible
en:https://botanica.uniandes.edu.co/investigacion/pdfs/HurtadoDistribucion_Aniba%20perutlilis%20Hemsley_2007_.pdf
Carlos A. Nez-Coln, Diana Escobedo-Lpez, Miguel . Hernndez-Martnez,
Carlos Ortega-Rodrguez. 2012. MODELOS DE LAS ZONAS ADECUADAS DE
ADAPTACIN DEL TEJOCOTE (Crataegus mexicana DC.) POR EFECTO DEL
CAMBIO CLIMTICO. AGRONOMA MESOAMERICANA 23(2):241-246. 2012. ISSN:
1021-7444.
Nez-Coln, CA. 2009b. reas prioritarias para colectar germoplasma de
Crataegus L. en Mxico con base en la diversidad y riqueza de especies.
Agricultura Tcnica en Mxico 35(3):333-338.

Nez-Coln, CA. 2010. Distribucin y caracterizacin eco-climtica del


membrillo cimarrn (Amelanchier denticulata (Kunth) Koch) en Mxico.
Revista Chapingo Serie Horticultura 16(3):195-206.
Nez-Coln, CA; Nieto-ngel, R; Barrientos-Priego, A. F; Segura, S; SahagnCastellanos, J; Gonzlez-Andrs, F. 2008b. Distribucin y caracterizacin ecoclimtica del gnero Crataegus (Rosaceae subfam. Maloideae) en Mxico.
Revista Chapingo serie Horticultura 14:177-184.

http://myslide.es/documents/modelos-para-la-prediccion-de-la-distribucion-deespecies-x-pga.html
http://codesharing.arcgis.com/?dbid=1320
www.fs.fed.us/informs/download.php)

Potrebbero piacerti anche