Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
porque no cubren todas las fases de trabajo necesarias para generar MDEs
tal y como los requieren las actuales tendencias de la disciplina.
PRESENTACIÓN
En algunos de estos entornos de modelado se omite sistemáticamente
La aplicación de las nuevas tecnologías de la información al tratamiento una fase de gran importancia para garantizar la calidad de los resultados: la
geográfico de datos de biodiversidad no es un campo nuevo, porque viene preparación de los datos de presencia de las especies (pares de coorde-
desarrollándose desde los comienzos de los Sistemas de Información nadas indicando localidades en las que se confirmó la presencia de indivi-
Geográfica. Pero en los últimos años se está originando una expansión duos de la especie), dejando esta completamente en manos del investigador,
notable en sus aplicaciones, motivada por la reducción de costes de hard- cuando se trata de un trabajo laborioso y apenas normalizado.
ware, la emergencia del software libre, y el cada vez mayor interés por la
conservación de los recursos biológicos. Como consecuencia de esta Una segunda limitación consiste en la aplicación de un único algoritmo
sinergia de factores, y del esfuerzo de investigadores que han comprendido para generar los MDEs (excepto OpenModeller, que se tratará en profun-
la importancia de las nuevas tecnologías en su área de trabajo, se habla didad en una sección posterior), cuando actualmente se acepta que la mejor
cada vez mas de una disciplina con entidad propia, la Ecoinformática (o aproximación es generar varios modelos de la misma especie con diferentes
Informática de la Biodiversidad), en la que se funden teorías de biología y algoritmos y ensamblarlos para obtener lo que se denominan superficies de
ecología con los Sistemas de Información, especialmente con los enfocados consenso (Araújo y New 2007). Hasta la fecha no existe ninguna aplicación
al tratamiento de información geográfica. que genere y ensamble resultados de distintos algoritmos, por lo que el
procedimiento debe hacerse manualmente operando con los mapas en soft-
Dentro de esta disciplina se está asentando una “cultura” con carácter ware con características SIG.
propio, orientada al estudio de la distribución geográfica de la biodiversidad:
el Modelado de Distribución de Especies (en adelante, MDE). Basándose en Un modelo de distribución, calibrado con las condiciones climáticas
el marco teórico del concepto “nicho ecológico”, esta disciplina depende del actuales, puede proyectarse hacia el futuro, si se dispone simulaciones
desarrollo e implementación de algoritmos diseñados para analizar las rela- climáticas para el periodo de proyección. Algunos de estos programas direc-
ciones causa-efecto que se establecen entre la presencia de una especie y tamente carecen de esta capacidad de proyección (Biomapper). Otros como
las variables ambientales que la condicionan. El resultado de un algoritmo de OpenModeller y MaxEnt si disponen de esta capacidad, pero no propor-
este tipo es un modelo numérico más o menos complejo según la técnica cionan herramientas para organizar y analizar los resultados de las proyec-
empleada, que se proyecta geográficamente en la forma de un mapa digital. ciones.
En este mapa se representa mediante una escala de valores la idoneidad del
hábitat para la especie o la probabilidad de presencia. Hasta el momento, aunque aún no se ha tratado en profundidad en este
texto, ya puede percibirse que el proceso de modelado presenta múltiples
Los MDEs tienen una serie de aplicaciones prácticas que justifican sobra- fases que requieren la atención del investigador, y la operación casi manual
damente su interés: cartografía de especies en zonas de difícil acceso, loca- durante determinadas secciones del trabajo. Cuando un proyecto de mode-
lización de poblaciones de especies en peligro, análisis de fragmentación de lado implica el trabajo con muchas especies, el esfuerzo necesario se multi-
hábitat, selección de reservas, estudios biogeográficos, y más reciente- plica, y cuando los MDEs se van a proyectar sobre distintos escenarios de
mente, simulación de los efectos potenciales del cambio global. Cambio Climático, se vuelve directamente inabordable con los medios que
un usuario normal de estos programas tiene a su disposición. Cuando los
En estos últimos años, el software de modelado ha evolucionado mucho, trabajos de modelado cobran estas dimensiones, una alternativa es recurrir a
y existen algunos paquetes de gran calidad como MaxEnt, OpenModeller o combinaciones de software de modelado, SIG y un entorno de scripting (para
Biomapper, que proporcionan las herramientas apropiadas para generar un ejemplo, ver Benito-Garzón 2006), pero se requieren ciertos conoci-
modelos de distribución. Sin embargo, estos programas algunas carencias, mientos en lenguajes de programación.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 4
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Recientemente las posibilidades en este campo han mejorado para los variables ambientales en la distribución de la especie y análisis estadístico
usuarios con escasos conocimientos en programación gracias al desarrollo de la calidad de los modelos.
de los programas para diseñar y ejecutar flujos de trabajo, que transforman
sintaxis informática y líneas de código en un lenguaje visual, más asequible Análisis gráfico de los efectos potenciales del cambio del clima sobre
para usuarios sin experiencia. Como consecuencia de la emergencia de esta la especie, incluyendo: estimación del grado de estrés climático, análisis
nueva tecnología, ahora es posible combinar programas SIG y programas de temporal del área de hábitat idóneo, análisis del número de parches de
modelado mediante flujos de trabajo, para ejecutar, de modo automático, hábitat en cada intervalo, y estimas de migración altitudinal y latitudinal.
todas las tareas requeridas por un proyecto de modelado de cierta enverga-
dura. Preparación automática y publicación de los resultados en web.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 5
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Otro antecedente más directamente relacionado con este trabajo, puede celdas totales: 251370
encontrarse en el libro “Workflows for e-Science”, concretamente en el celdas efectivas: 136855
trabajo “Ecological Niche Modeling Using the Kepler Workflow System”
(Pennington et al. 2007), en el que los autores presentan un flujo de trabajo La resolución puede parecer grosera (porque lo es), pero teniendo en
diseñado sobre el software Kepler para llevar adelante todos los pasos cuenta la carga computacional del proceso que se pretende llevar a cabo, es
necesarios en un proyecto de modelado de gran envergadura. En esencia, el necesaria para permitir cierta fluidez en el periodo de desarrollo. El objetivo
presente trabajo y el de estos autores es similar, porque ambos siguen las es poder aplicar el resultado final de este proyecto a resoluciones entre los
convenciones más recientes en el campo de los MDEs, aunque la estructura 50 y 100 metros.
y los métodos utilizados son muy diferentes. Pennington et al utilizan un
único algoritmo de modelado (GARP, un algoritmo genético), mientras que
en el presente trabajo se utilizarán varios diferentes, hasta un total de ocho. Esquema conceptual del proceso de modelado
Por otra parte, los recursos informáticos son bien distintos; el grupo de
Pennington trabaja en el Centro de Supercomputación de San Diego, y Para entender por qué son necesarias distintas fuentes de datos, distintas
utiliza información distribuida de la red EcoGrid, planeada para análisis herramientas de software y su integración en un flujo de trabajo único, es
ecológicos a gran escala en los EEUU. En cambio el presente proyecto se necesario comprender la arquitectura conceptual del proceso de modelado
basa en un PC de sobremesa, sin utilización de recursos externos. Por tanto, propuesto en este proyecto.
existe entre ambos proyectos únicamente existe una simetría conceptual,
difiriendo bastante en cuanto a metodología. El procedimiento de modelado tiene dos entradas imprescindibles:
Registros de presencia georreferenciados de las especies de trabajo,
en forma de pares de coordenadas geográficas, con un formato de texto
METODOLOGÍA plano, según una estructura de columnas predeterminada para cada soft-
ware de modelado.
Área de trabajo Mapas digitales de variables ambientales con influencia directa o indi-
recta en la distribución geográfica de las especies de trabajo. Dos tipos de
variables se utilizan habitualmente:
Para probar el flujo de trabajo se utilizó como caso de estudio el territorio
de la Comunidad Autónoma Andaluza. Las características del área de trabajo Variables topográficas: Son constantes a lo largo del tiempo cubierto
fueron las siguientes: por el proceso de modelado, como la pendiente o el índice topográfico de
humedad, por ejemplo. Tienen influencia directa en la distribución de la
Proyección: UTM, datum ED50, huso 30 (EPSG 23030).
especie, pero a una escala local (ámbito predictivo: de los cientos a los
Coordenadas límite: miles de metros). Cuanto mayor es la resolución espacial, mejor es la de-
norte: 4289200 finición obtenida en el modelo de distribución resultante.
sur: 3987000 Variables climáticas: Cambian durante el intervalo de tiempo que cubre
el proceso de modelado, como la precipitación anual o la temperatura
este: 620400 máxima del verano, por ejemplo. Estas variables influyen directamente
oeste: 88000 en la distribución geográfica de las especies, pero su efecto se manifies-
Resolución: 800 x 800 metros ta a una escala mayor que la local (ámbito predictivo: de los miles a los
cientos de miles de metros). El modelo de distribución obtenido de estas
378 filas x 665 columnas variables no es tan sensible a la resolución como en el caso de las varia-
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 6
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 7
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
con otros programas como R, Matlab o Grass. Los actores transmiten infor-
mación de unos a otros mediante canales y relaciones (ramificaciones de los
canales). Distintos actores pueden combinarse en un único actor compuesto, Una función interesante de Kepler es la posibilidad de diseñar un Actor
que adoptará las funcionalidades que le confieren los distintos actores que lo Compuesto, que permite anidar flujos de trabajo dentro de otros flujos de
forman. trabajo de nivel superior. Cada uno de estos niveles puede tener su propio
Director, dependiendo de los requerimientos computacionales del nivel. En
este proyecto se aprovecha esta característica para anidar procesos que
ocurren un cierto número de veces dentro de un mismo flujo.
Un flujo de trabajo de Kepler
El director
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 8
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
La aparente sencillez de esta arquitectura y la facilidad de manejo del En el presente proyecto GRASS se ha ocupado del almacenamiento de
interfaz gráfico enmascaran las dificultades que ofrece el sistema al usuario toda la información geográfica, parte de la preparación de los registros de
novel. Los modelos de computación que ofrecen los distintos tipos de direc- presencia, almacenamiento y ensamblado de modelos, y composición auto-
tores obedecen a reglas que en ocasiones no son intuitivas, es difícil conocer mática de mapas, gráficos y animaciones.
el comportamiento de un actor concreto con un director determinado, y no
resulta fácil, en principio, conseguir iteraciones y loops dentro de la lógica OpenModeller
que se esperaría en unas líneas de código escritas. Kepler es una auténtica
plataforma visual de desarrollo de programas, y como cualquier lenguaje de OpenModeller es un entorno amigable de modelado de distribución de
programación, presenta una curva de aprendizaje prolongada. Una vez especies, actualmente desarrollado por la entidad brasileña CRIA (Centro de
superadas estas dificultades, el programa proporciona características muy Referência em Informação Ambiental) con la colaboración de otras institu-
interesantes, que pretenden explotarse a lo largo de este proyecto. ciones. Está liberado bajo licencia GPL, y es uno de los programas de su
género más desarrollado, ya que contempla gran parte de los procesos
Kepler se ha utilizado en este proyecto para diseñar y ejecutar el flujo de necesarios para generar modelos de distribución. Permite la utilización de
trabajo, llevar a cabo determinadas tareas dentro del mismo (escritura de distintos algoritmos para generar los modelos (unos 10, dependiendo de la
ficheros, organización de datos, control de iteraciones), y llamadas a ejecu- versión), la evaluación estadística de los resultados, y la exportación de los
ción para los programas necesarios. En el Anexo 3 se describen los actores modelos a distintos formatos.
más utilizados en este proyecto.
Desde el principio de su desarrollo está pensado para ser multiplata-
GRASS GIS forma, y está dotado de herramientas que permiten el acceso al programa a
través de la línea de comandos, facilitando su explotación mediante scripts.
GRASS (Geographic Resources Analysis Support System) es un
programa especializado en el almacenamiento, análisis y explotación de MaxEnt
información geográfica. Desarrollado inicialmente por el laboratorio CERL
(U.S. Army Construction Engineering Research Laboratories) desde 1982, y MaxEnt es un software gratuito de código cerrado (el único sin licencia
liberado con licencia GPL en 1999, GRASS GIS es actualmente un proyecto libre de este proyecto) diseñado para generar modelos de distribución utili-
oficial de OSGeo (Open Source Geospatial Foundation). zando un algoritmo que combina el aprendizaje automático con el principio
de máxima entropía. Se utiliza para este proyecto, adicionalmente a Open-
GRASS tiene una gran capacidad de procesamiento raster (algo más limi- Modeller, por sus buenos resultados, y el fácil acceso a las funcionalidades
tada en el ámbito vectorial) y herramientas avanzadas para la visualización del programa a través de la línea de comandos, que permite su ejecución
de datos geográficos. Pero sin duda, la característica más interesante, que mediante scripts, o desde un actor modificado de Kepler.
determina su adopción como plataforma SIG para este proyecto, es su
potente lenguaje de scripting, que se integra perfectamente con el lenguaje
GNU Octave
de programación bash en sistemas unix/linux. Esta integración permite GNU Octave es un lenguaje de cálculo numérico matricial similar a
ejecutar tareas de modo automático fácilmente a través de “batch-jobs” Matlab, pero libre y gratuito (licencia GPL). Es muy potente, y permite un
(scripts con secuencias de órdenes), creando loops para trabajo reiterativo rápido desarrollo de algoritmos de cálculo gracias a un lenguaje de progra-
sobre grupos de mapas. Otras características interesantes son su gran esta- mación sencillo y bien documentado. Se accede a sus funciones a través de
bilidad y velocidad trabajando con raster de gran tamaño, y la diversidad de la línea de comandos o de scripts.
formatos de importación y exportación mediante las librerías de abstracción
GDAL-OGR. En este proyecto se han utilizado scripts de Octave para preparar los
registros de presencia, y evaluar los modelos de distribución.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 9
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
R shapefile.
Modelo de elevaciones de 10 metros de resolución espacial, obtenido me-
El lenguaje de cálculo estadístico R, liberado bajo licencia GPL, es con diante fotorrestitución, a partir de ortofotomapas de alta resolución. El for-
seguridad el lenguaje estadístico más utilizado en el ámbito académico. A mato original es raster ESRI grid.
sus funcionalidades se accede a través de la línea de comandos, scripts y
algunos interfases gráficos como R-Commander o JGR. R destaca por la Localización geográfica de poblaciones de plantas catalogadas por la Ley
calidad de su motor gráfico y la enorme cantidad de funciones de cálculo de Andaluza de Flora y Fauna. Se trata de una cartografía de poblaciones
las que dispone. Kepler está especialmente preparado para conectar con R muy precisa, compuesta por los técnicos de la Red Andaluza de Jardines
(la versión Windows de Kepler trae R incluida), y muchos actores utilizan Botánicos, en el marco del programa FAME de la Consejería de Medio
expresiones en este lenguaje. Ambiente (Flora Amenazada). El formato original es vectorial, shapefile de
geometría poligonal.
En este proyecto se ha utilizado R para realizar algunos cálculos estadís- Registros climáticos de la red de estaciones meteorológicas de la AEMET,
ticos y composición avanzada de gráficos. obtenidos a través del Subsistema Clima de la Consejería de Medio Am-
biente, en formato DBF, cubriendo el periodo 1980-2000.
Bash
Simulaciones climáticas (temperatura y precipitación) del futuro según 4
Bash es un intérprete libre (licencia GPL) de órdenes en sistemas escenarios de cambio climático generadas por la Fundación para la Inves-
UNIX/Linux, que utiliza una sintaxis específica para llevar a cabo tareas de tigación del Clima utilizando el método de Análogos FIC. Están accesibles
distinta complejidad. En este proyecto se han utilizado scripts de Bash para vía web (www.aemet.es), y se trata de un extenso banco de datos en for-
llevar a cabo aquellas tareas para las que Kepler no dispone de actores mato texto, con simulaciones diarias de temperatura máxima, mínima y
específicos, especialmente edición de ficheros de texto. Entre otras tareas, precipitación para cada estación meteorológica del territorio español.
se ocupa de lanzar las ejecuciones de los modelos de distribución, los batch-
jobs de GRASS y el formateo de ficheros y tablas de datos. Construcción de las variables ambientales
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 10
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
vertienes con orientación este, y valor 0 en las orientaciones oeste. Esta predictores distintas variables según el descriptor:
variable recoge influencias de la topografía en la distribución de las espe-
Predictores de Temperatura media mínima de invierno (CL_TMNI): eleva-
cies vegetales, no relacionadas con la insolación (exposición a vientos do-
ción, distancia logarítmica a la costa, gradiente de orientación sur-norte, y
minantes, por ejemplo).
radiación solar potencial media de invierno.
Exposición topográfica en un radio de 1000 metros (TP_EXPO): esta
Predictores de Temperatura media máxima de invierno (CL_TMNV): ele-
variable indica la diferencia de altitud entre una celda, y el promedio de al-
vación y distancia logarítmica al mar Mediterráneo.
titud de las celdas circundantes en un radio de 1000 metros. Expresa nu-
méricamente el grado de exposición de un punto cualquiera del territorio a Predictores de Temperatura media máxima de verano (CL_TMXV): eleva-
los elementos atmosféricos. Las zonas expuestas como las cimas de ción, distancia logarítmica a la costa, y radiación solar potencial media de
montañas presentan valores positivos altos, mientras que las zonas res- verano.
guardadas presentan valores negativos. Para calcular esta variable, se Predictores de Precipitación media anual (CL_PA) y precipitación media
aplicó al modelo de elevaciones de 40 metros un filtro de medias circular de verano (CL_PV): distancia lineal al Océano Atlántico, distancia lineal al
en un radio de 25 celdas mediante el módulo r.neighbors, utilizando la fun- mar Mediterráneo, distancia lineal a la costa, elevación media en un radio
ción average, con una vecindad circular. A la capa resultante se le restó el de 1000 metros y exposición topográfica.
modelo de elevaciones original, para obtener los valores de exposición.
Índice topográfico de humedad (TP_ITH): este índice refleja el compor- Los residuos de los mapas de temperatura se interpolaron mediante el
tamiento hidrológico del territorio, discriminando áreas según la deposición algoritmo Inverse Distance Weighted, utilizando el módulo de GRASS
potencial de sedimentos. En ecología de plantas es importante porque re- v.surf.idw con sus opciones por defecto. Los residuales de precipitación se
fleja diferencias entre suelos profundos y poco profundos, o zonas poten- interpolaron mediante Regularized Tension Splines usando el módulo
cialmente más húmedas. Para generar este mapa, se utilizó el módulo de v.surf.rst, y aplicando un valor de tensión igual a 1000, por ser el que
GRASS r.topidx. Este algoritmo genera áreas nulas en zonas llanas de mejores resultados ofreció en las pruebas de validación. A cada mapa obte-
cierta extensión. Para solucionar este problema, se realizaron modelos a nido de la ecuación de regresión se le sumó su correspondiente mapa de
distintas resoluciones (40, 80, 160, 320, 640 y 1280 metros), y se agrega- residuales utilizando álgebra de mapas (r.mapcalc) para obtener el mapa
ron en ese orden mediante la utilidad de superposición de mapas r.patch. final de cada variable.
Pendiente (TP_PEND): Se derivó el valor en grados a partir del modelo Los mapas de temperatura y precipitación actual se calibraron con los
de elevaciones utilizando el módulo r.slope.aspect de GRASS. registros reales de temperatura y precipitación del periodo 1980-2000
Radiación solar potencial de invierno (TP_RSD_I): Esta variable se cal- tomados de la red de estaciones meteorológicas de la AEMET.
culó mediante la función de GRASS r.sun. Este módulo aplica una simula-
ción de insolación tomando como parámetros una fecha concreta (solsticio Los mapas de temperatura y precipitación futura se generaron utilizando
de invierno en este caso), y mapas de elevación, pendiente, orientación y los las estimaciones de Cambio Climático proporcionadas por la Fundación
latitud para ejecutar una simulación basada en la posición del sol y la con- para la Investigación del Clima. Estos datos son estimaciones diarias para
figuración topografía del terreno. El resultado es un mapa en el que cada cada estación meteorológica de la AEMET, obtenidos de escenarios de
celda toma el valor de la suma de potencia solar que le llega durante di- cambio climático regionalizados mediante el método de análogos FIC. El
cho día. conjunto de datos combina dos modelos de circulación global (ECHAM4 y
CGCM2) con dos líneas evolutivas propuestas por el IPCC (A2 y B2). Como
Los mapas de variables climáticas se generaron utilizando las técnicas de resultado de esta combinación, y teniendo en cuenta los mapas de condi-
regresión múltiple con corrección de residuos descritas por Ninyerola y cola- ciones actuales, se dispone de los siguientes conjuntos de variables:
boradores (Ninyerola et al. 2000). Para la temperatura se utilizaron como
Un conjunto de calibrado, compuesto por las variables topográficas, y las
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 11
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 12
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 13
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 3: Flujo de trabajo PRP. Está formado por dos actores compuestos que
contienen flujos de trabajo completos (ver Figura 4 y Figura 5). El actor PRECONFI-
GURACION solo se ejecuta una vez. El actor Loop permite que PREPARA_XY se
ejecute tantas veces como le indica el valor NUM_ESPECIES.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 14
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 15
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 7: Estructura interna del actor compuesto PREPARA_COORDENADAS. Las secciones principales están señaladas con rectángulos de color. Un actor fundamental
es BORRA_LINEA, que borra una especie de la lista de especies, permitiendo al flujo empezar con una nueva especie en la siguiente iteración. El actor LISTAS_ESPECIES es una
expresión de R a la que se le introduce un listado con las especies y su número de presencias. Devuelve dos listas, una con las especies que cumplen los criterios y otra con las
que no.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 16
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Como resumen final, se relatan las entradas y salidas del módulo, y se Figura 9: Esquema gráfico del proceso realizado por el flujo de trabajo PRP.
Este procedimiento, realizado de forma manual, consume gran cantidad de tiempo.
muestra un ejemplo con los resultados (Figura 9): Este es, según el conocimiento del autor, el primer intento de automatizar y norma-
ENTRADAS: lizar esta fase del procesamiento de registros de presencia.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 17
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 18
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 19
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Ensamblado de modelos y exportación de mapas: El propio script 6 ini- este caso el criterio lo determina el usuario a través del parámetro
cial MODELOS EVALUACION.sh lanza el batch-job de GRASS llama- PORCENTAJE_OMISION. Este valor indica el porcentaje máximo de
do 7 ejecuta MODELOS EVALUACION.txt, que importa los resultados puntos de evaluación que pueden quedar excluidos del área de presen-
de MaxEnt y OpenModeller, y los ensambla utilizando el módulo r.series cia del modelo binario. Se interpreta como la proporción de localidades
con la función median. Igualmente calcula el mapa de desviación es- de presencia que el usuario considera que se encuentran fuera de las
tándar, aplicando la función stddev. La función v.random se utiliza para condiciones apropiadas para la especie. Un valor típico sería 5, indican-
generar dos conjuntos de puntos aleatorios (uno a escala global y otro do que el 95% de las poblaciones conocidas de la especie se encuen-
local), con la idea es muestrear más intensamente el ámbito local que el tran dentro de su óptimo ecológico. Un valor conservador puede ser 0,
global. Posteriormente extrae los valores de los puntos aleatorios y los con el que se asume que todas las poblaciones están dentro del ópti-
puntos de evaluación sobre los resultados de los algoritmos usando el mo. El valor del parámetro se pasa a un actor R (CALCULA_UMBRAL)
módulo v.what.rast y los exporta a tres tablas para la evaluación de los que, utilizando la tabla con los valores sobre el ensamblado de los pun-
modelos (VALORES ALEATORIOS GLOBAL.txt, VALORES ALEATO- tos de evaluación, calcula el cuantil correspondiente y lo exporta a un fi-
RIOS LOCAL.txt y VALORES PUNTOS EVALUACIÓN.txt). La orden d.- chero de texto plano.
mon se utiliza para generar automáticamente mapas de los modelos y Como resumen final, se relatan las entradas y salidas esta sección del flujo:
el ensamblado a las escalas global y local, superponiéndoles los puntos
de calibrado y los puntos de evaluación. Estos mapas en formato png ENTRADAS:
se mueven a la carpeta RESULTADOS en el directorio de la especie. Listado con especies que superan el criterio MIN_PRES.
Evaluación de modelos: Los algoritmos utilizados para evaluar los mo- Ficheros formateados con las coordenadas de presencia.
delos se detallan en el Anexo 2, así como una descripción de los gráfi-
Variables ambientales de calibrado.
cos resultantes. El actor EVALUA MODELOS lanza un script de octave
(8 EVALUA_MODELOS.m) que realiza los tests estadísticos que calcu- SALIDAS:
lan la precisión de los modelos. Resultados de los ocho algoritmos de modelado.
Composición de gráficos con los resultados: Los resultados de la eva- Mediana de la idoneidad del hábitat y desviación estándar.
luación, previo procesamiento, pasan al actor GRAFICOS, que lanza un
script de R (9 GRAFICOS EVALUACION.r) que genera una representa- Análisis gráfico de distribución de valores de los ensamblados.
ción gráfica de los datos de evaluación, y el gráfico de distribución del Análisis gráfico de los resultados de la evaluación de modelos.
ensamblado en formato PDF. Este PDF se transforma en png mediante Mapas de los resultados de los algoritmos, los ensamblados y dos ma-
una orden del programa ImageMagick y se copia a la carpeta RESUL- pas de la distribución conocida de la especie.
TADOS en el directorio de la especie.
Ficheros de texto con todos los datos numéricos expresados en los gráfi-
Cálculo del umbral de corte del modelo. Para determinados cálculos cos.
posteriores (por ejemplo, cálculo del área de presencia potencial de la
especie) es necesario transformar un modelo continuo (valores de 0 a
100) en modelo binario (0 y 1, indicando ausencia y presencia respecti-
vamente). Para esta transformación se selecciona en el modelo conti-
nuo, según un criterio más o menos objetivo, un valor de idoneidad um-
bral por encima del cual todas las celdas se recodifican con valor 1,
mientras que las celdas por debajo se recodifican con valor 0. Este um-
bral representa el límite teórico entre hábitat óptimo y sub-óptimo. En
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 20
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 14: Actor compuesto MODELADO: Sección del flujo de trabajo incluido dentro del actor compuesto MODELADO que ejecuta y evalúa los modelos iniciales (FASE 2
del proceso de modelado). Junto al director puede observarse el parámetro ESP_SELECCIONADA, que “muestra” el nombre de la especie en curso al resto de actores dentro del
flujo. La primera sección del flujo rellena la cabecera del fichero de configuración para OpenModeller, que tiene una estructura un tanto incómoda para su procesamiento auto-
mático. El actor UNE PARAMETROS une esta cabecera una vez terminada con los ficheros de parámetros de los algoritmos. Los ficheros resultantes se usan en EJECUTA
MODELOS para generar los modelos. Los actores PDF2PNG convierten los resultados de R en formato PDF a PNG para el informe final de la especie.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 21
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 22
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Puntos de presencia de la especie. Comparar el modelo de evaluación con el modelo recalibrado mediante
Variables ambientales del presente y el futuro. una resta, para comprobar la distribución espacial de los cambios en ido-
neidad que supone recalibrar el modelo con todos los puntos de presencia
SALIDAS: disponibles.
Archivos de los modelos numéricos de OpenModeller y MaxEnt. Genera un mapa de persistencia: el script suma todos los modelos bina-
Ensamblados de idoneidad y desviación estándar del presente y el futu- rios que se han ido generando (para extraer número de celdas y número
ro. de parches de hábitat idóneo) a partir de los ensamblados y transforma el
resultado en un valor de porcentaje. Este mapa de persistencia indica las
Mapas en formato png de los ensamblados.
áreas en las que, durante más tiempo, se van a conservar condiciones
Ficheros de texto con el número de celdas de hábitat idóneo en cada es- apropiadas para la biología de la especie.
cenario.
Exporta el mapa de comparación y el mapa de persistencia a formato
Ficheros de texto con el número de parches de hábitat idóneo en cada png.
escenario.
Tabla con los valores de idoneidad y desviación estándar de los puntos Llegados a este punto, para realizar el análisis, el flujo de trabajo ha
aleatorios y de presencia. entregado los siguientes datos:
Tabla VALORES_PUNTOS.txt. Se ha exportado del fichero vectorial que
Fase 4: Análisis y publicación de los resultados contiene los puntos de presencia de la especie, los puntos aleatorios del
ámbito global y los puntos aleatorios del ámbito local. La tabla contiene,
entre otros, los siguientes grupos de campos:
En esta fase final del flujo de trabajo se van a analizar en detalle los
resultados, ofreciendo gráficas y mapas que los describan. Los modelos Valores de idoneidad de los algoritmos de las fases de evaluación y re-
proyectados se analizarán teniendo en cuenta varios puntos de vista: varia- calibrado.
ciones de la idoneidad del hábitat, migración altitudinal, migración latitudinal, Valores de idoneidad y desviación estándar de los ensamblados de las
y evolución del área potencial y número de parches de hábitat idóneo. fases de evaluación, recalibrado y proyección (un campo de idoneidad y
otro de desviación estándar por cada escenario).
Con el objetivo es disponer, para cada especie, de un documento que
contenga organizada toda la información relevante del proceso de modelado, Valores de las variables ambientales utilizadas para calibrar los modelos.
se preparó una plantilla html sobre la que posteriormente insertar automáti- Fichero UMBRAL_CORTE_ENSCON.txt, con el valor apropiado para
camente los distintos elementos resultado del análisis. transformar el modelo continuo en binario.
Cuatro ficheros AREA_EC_(nombre escenario).txt, con el número de cel-
Análisis de los resultados
das de hábitat idóneo correspondientes a cada escenario.
La primera fase de análisis se realiza en GRASS. El actor ANALISIS (ver Cuatro ficheros PARCHES_EC_(nombre_escenario).txt, con el número de
Figura 16) lanza la ejecución del script de bash 15 inicia ANALISIS FINA- parches de hábitat idóneo para cada escenario.
LES.sh. Este borra una serie de ficheros temporales que ya no son útiles, y
lanza el batch-job de GRASS 16 ejecuta ANALISIS FINALES.txt. El script se Estos ficheros son procesados por el actor GRAFICOS de la siguiente
encarga de: sección del flujo (ver Figura 16). Se trata de un script de R (17 GRAFICOS
ANALISIS FINALES.r) que lee los datos, los organiza, y genera las gráficas
Exportar y formatear datos que serán procesados en R (valores de los descriptivas correspondientes, que se discutirán en la sección de resultados.
puntos aleatorios para todos los ensamblados).
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 23
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Informe de resultados
Para hacer accesible la información resultante del flujo, se ha optado por
un documento con una estructura basada en HTML, de forma que los resul-
tados puedan colgarse en un servidor web sin el menor esfuerzo.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 24
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
En esta sección se van a detallar los resultados que entrega el flujo de nombre_especie_PRESENCIA (vector, tipo polígono o punto): Correspon-
trabajo. de con el shapefile original de la especie.
nombre_especie_AMBITO (vector, tipo polígono): Mínimo rectángulo (más
Los resultados del flujo de trabajo pueden clasificarse en varios niveles 2000 metros de margen) que acoge todas las poblaciones conocidas de la
de aplicabilidad y complejidad. Algunos tienen un carácter definitivo, como el especie.
informe html, diseñado para su difusión en internet, mientras que otros son nombre_especie_CALIBRADO (vector, tipo punto): Puntos de calibrado.
útiles si es necesario realizar un estudio más exhaustivo sobre una especie
concreta (la base de datos de GRASS resultante del proceso y las tablas de nombre_especie_EVALUACION (vector, tipo punto): Puntos de evalua-
datos utilizadas para los análisis gráficos, por ejemplo). ción.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 25
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
especie, se almacenan los resultados que va generando el flujo. A continua- para OpenModeller.
ción se detalla la estructura de carpetas de una especie. PRESENCIAS_nombre_especie.csv: puntos de presencia completos
carpeta CALIBRADO. Contiene resultados relacionados con el modelo re- para MaxEnt.
calibrado. Todos son gráficos generados por R en el actor GRAFICOS de PRESENCIAS_nombre_especie.txt: puntos de presencia completos for-
la última sección del flujo. mateados para OpenModeller.
ANALISIS_MODELO.pdf carpeta PROYECCION
DIFERENCIAS_CALIBRADO_2_pdf carpeta MODELOS: definiciones de los modelos recalibrados de MaxEnt
DIFERENCIAS_CALIBRADO_EVALUACION_1.pdf y OpenModeller.
REQUERIMIENTOS_ECOLOGICOS.pdf ANALISIS_ENSAMBLADO_CONTINUO.pdf: gráfico de R que resume el
comportamiento de los modelos en las localidades de presencia de la es-
carpeta EVALUACION
pecie.
HISTOGRAMA_EC.txt: valores del histograma del modelo inicial de ido-
ANALISIS_FUTURO_ESPECIE.pdf: gráfico de R que muestra el com-
neidad.
portamiento potencial de la especie ante los distintos escenarios.
PUNTOS_CALIBRADO_nombre_especie.txt: coordenadas de los puntos
carpeta RESULTADOS: contiene todas las imágenes que van al informe
de calibrado devueltas por el flujo de trabajo PRP.
html, por lo que se comentan a continuación.
PUNTOS_EVALUACION_nombre_especie.txt: coordenadas de los pun-
tos de evaluación devueltas por el flujo de trabajo PRP.
Información incluida en el informe de resultados
UMBRAL_CORTE_ENSCON.txt: Valor del umbral de corte del ensam-
blado de idoneidad. El informe de resultados está diseñado para difundir a través de Internet
carpeta MODELOS: definiciones de los modelos de evaluación de Open- la información que proporciona el flujo de trabajo. Está dividido en cuatro
Modeller y MaxEnt. secciones que responden a distintas cuestiones. A continuación se detallan
carpeta RESULTADOS los resultados que en él aparecen.
AUC_GLOBAL_VALORES.txt: valores de evaluación en el ámbito glo- Sección 1: Distribución actual y requerimientos ecológicos
bal devueltos por actor EVALUA_MODELOS.
AUC_LOCAL_VALORES.txt: valores de evaluación en el ámbito local. Los resultados mostrados en esta sección tratan de responder a esta
cuestiones: ¿cual es la distribución de la especie?, ¿cuales son sus requeri-
HISTOGRAMAS.pdf: gráfico de R con la distribución de valores del en- mientos ecológicos?, ¿es una especie generalista o especialista?.
samblado de idoneidad de evaluación en el ámbito local.
Foto y ficha de la especie. Una vez ejecutado el flujo PRP, el usuario, a
GRAFICOS_EVALUACION.pdf: gráfico de R que resume los valores de partir de la lista de especies seleccionadas, puede preparar en un directo-
evaluación. rio (MATERIAL_ESPECIES, con las carpetas FICHAS y FOTOS) fichas de
carpeta PRESENCIA texto plano con información relevante sobre la biología de la especie
CALIBRADO_nombre_especie.csv: puntos de calibrado formateados (nombrado según la estructura Nombre_especie.txt) y una imagen de la
para MaxEnt. misma (Nombre_especie.jpg). Ambas son situadas por el flujo al principio
del informe.
CALIBRADO_nombre_especie.txt: puntos de calibrado formateados
Mapa de distribución general. Se trata de un mapa del relieve de Anda-
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 26
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 18: Ejemplo de mapa de distribución general de la especie ofrecido Figura 19: Detalle del mapa de localización de poblaciones. Se muestran
en el informe de resultados. como puntos rojos localidades de presencia de la especie.
Mapa de localización de poblaciones. Este mapa ofrece una visión más Diagramas de requerimientos ecológicos. En este diagrama se compa-
precisa de la localización concreta de las poblaciones de la especie (ver ran la distribución de valores sobre cada una de las variables ambientales
Figura 19). Se limita al ámbito de presencia de la especie, tiene una alta de los puntos de presencia y los puntos aleatorios del ámbito global (ver
resolución, y muestra los límites de los términos municipales, la red hidro- Figura 20). El objetivo es conocer en que rangos de cada variable se con-
gráfica, vías de comunicación, y las poblaciones, todos con su etiquetado centran los puntos de presencia de la especie (una medida de sus requeri-
correspondiente. Por las limitaciones de GRASS en este sentido no ha mientos ecológicos), y compararlos con los valores de la variable para
sido posible generar automáticamente una leyenda con todos los elemen- todo el territorio de trabajo. Para facilitar la comparación se han añadido lí-
tos. Aún así, el mapa es suficientemente comprensible como para localizar neas de referencia correspondientes al promedio de cada grupo. Este dia-
con cierta exactitud las poblaciones en el campo. grama permite conocer si la especie es especialista (promedios muy sepa-
rados) o generalista (promedios próximos), y los rangos de presencia co-
nocidos.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 27
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Sección 2: Evaluación del modelo de distribución
En esta sección, las cuestiones a responder son las siguientes: ¿cual de
los algoritmos funciona mejor?, ¿como se distribuyen por el territorio la
idoneidad y su desviación estándar?, ¿existe una relación entre la mediana Figura 21: Resultados de los algoritmos. Se muestran las capturas de los resul-
tados de GARP y MaxEnt. Observando la distribución de los valores de idoneidad del
de idoneidad y la desviación estándar?. Las siguientes figuras tratan de dar
hábitat en ambos modelos y la situación de los puntos de presencia de la planta (en
las respuestas: naranja), es fácil determinar cual de ellos está funcionando mejor.
Resultados de los algoritmos. Teniendo conocimiento sobre la distribu-
Resultados de los ensamblados. En el informe se muestran mapas si-
ción de la especie, y sobre como se interpretan los modelos de distribu-
milares a los anteriores, pero a una mayor resolución de imagen, de am-
ción, es posible determinar con una simple visualización, qué algoritmo
bos componentes del ensamblado (Figura 22).
funciona mejor. En esta sección se muestran capturas de los resultados
(ver Figura 21), en el ámbito global y local, mostrando superpuestos los
puntos de calibrado (símbolo “o”) y los puntos de evaluación (símbolo “x”).
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 28
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 23: Histograma del ensamblado. Indica el número total de celdas del
ámbito local ocupadas por cada valor de mediana de idoneidad.
Sección 3: Modelo de distribución
Figura 22: Ensamblados. Debe notarse que la especie no se encuentra en todas
las áreas con algún valor de idoneidad del hábitat. Para cada especie existe un
umbral de la escala por debajo del cual es muy poco probable que la especie esté
Esta sección corresponde con la fase de recalibrado del modelo utili-
presente. zando todos los puntos de presencia disponibles.
Ensamblado recalibrado. Se vuelven a mostrar las capturas del nuevo
Distribución de los valores de idoneidad en el ámbito local. Se trata
ensamblado generado con todos los puntos de presencia, por ser el mo-
de un gráfico que muestra, dentro del ámbito de presencia de la especie,
delo de distribución “final” aceptado para la especie según la metodología
la distribución de valores de idoneidad, expresada en número de celdas
propuesta.
(Figura 23). Los puntos se relacionan entre sí mediante una ecuación poli-
nomial ajustada en R. Diferencias entre los ensamblados de idoneidad de evaluación y re-
Gráfica de evaluación de resultados. Imagen del análisis gráfico de los calibrado: comparación en tres ámbitos geográficos. A partir de los va-
resultados de la evaluación estadística de los modelos. Se discute en pro- lores de los puntos aleatorios del ámbito global, los puntos aleatorios del
fundidad en el Anexo 2. ámbito local y todos los puntos de presencia de la especie, se comparan
mediante un diagrama de cajas los modelos de evaluación y recalibrado
(ver Figura 24), para buscar diferencias significativas entre ambos. La si-
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 29
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
tuación ideal es que no haya diferencias entre las cajas de ambos mode- tos a los valores de idoneidad y desviación en las poblaciones conocidas
los, pero lo cierto es que durante las pruebas del flujo se han detectado di- de la especie.
ferencias reseñables entre el modelo generado con los datos partidos se- Mapa de diferencias entre los ensamblados de idoneidad. Muestra el
gún el parámetro PARTICION y el modelo generado con todos los puntos resultado de la sustracción de valores de idoneidad entre el modelo recali-
de presencia. Este gráfico ayuda a comprender la incidencia de esta cues- brado y el modelo de evaluación (Figura 26). Permite conocer con detalle
tión en el resultado final del modelo. la distribución geográfica de las diferencias, mostrando en distintos tonos
e intensidades la ganancia o pérdida de idoneidad del modelo recalibrado
respecto al de evaluación.
Diferencias entre los ensamblados de idoneidad de evaluación y re- Figura 25: Comparación de valores de los ensamblados de evaluación y
calibrado: comparación de idoneidad vs. desviación en las localida- recalibrado en las localidades de presencia de la especie. En el eje x se
des de presencia de la especie. Este gráfico pretende incrementar la re- presenta la mediana de idoneidad y en el y la desviación estándar. El color verde
solución de la comparación entre modelos, centrándose en las localidades representa el modelo de evaluación, y el naranja el modelo recalibrado. Los polí-
de presencia conocida de la especie, pero comparando al mismo tiempo gonos envuelven los valores de las localidades de presencia. El centro de una cruz
representa el valor promedio, y la extensión de los ejes la desviación estándar de los
los dos componentes del ensamblado en un gráfico bivariante (ver Figura datos. En los márgenes se muestran las distribuciones relativas. En una situación
25). Permite conocer con detalle hasta que punto afecta la partición de da- ideal, ambos modelos deberían coincidir aproximadamente.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 30
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Sección 4: Efectos potenciales del Cambio Climático
En esta sección se abordan las siguientes cuestiones: ¿Como varía en el
tiempo y en los distintos escenarios la distribución geográfica de la idoneidad
y la desviación estándar?, ¿cual va a ser la tendencia en idoneidad del
hábitat en las poblaciones conocidas de la especie?, ¿cómo van a evolu-
cionar la superficie y el número de parches de hábitat idóneo?, ¿puede
migrar altitudinal y horizontalmente la especie?.
Animaciones de variación temporal de idoneidad y desviación están- Figura 28: Tabla de acceso a las animaciones. Cada imagen es un hipervínculo
dar. En el informe se muestran 8 animaciones interactivas, que ofrecen que lleva a la animación deseada.
una vista muy intuitiva de las variaciones temporales en ambos aspectos
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 31
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 32
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Figura 33: Evolución del área de hábitat idóneo para la especie, compa-
rando los distintos escenarios.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 33
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 34
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
CONCORDANCIA ENTRE RESULTADOS Y
OBJETIVOS
Teniendo en cuenta los objetivos planteados y las pruebas realizadas con
el flujo de trabajo resultante, el autor considera que se han alcanzado los
objetivos mínimos del proyecto satisfactoriamente.
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 35
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
perfectamente omitible, porque OpenModeller implementa su propio algo- GRASS le da una gran capacidad para integrar geoprocesos en sus flujos
ritmo de máxima entropía (aunque ofrece resultados muy inferiores). Sin de trabajo.
embargo, se ha incluido porque la calidad de sus resultados compensa con En un software SIG, una característica importante es la posibilidad de ac-
creces su carácter no libre. ceso completo a las funcionalidades a través de un lenguaje de scripting.
La automatización de procesos complejos mediante scripts es el único
modo de conseguir líneas de trabajo realmente productivas.
CONCLUSIONES
A lo largo del proyecto se ha desarrollado un flujo de trabajo basado en MATERIAL ONLINE
software libre que automatiza y estandariza completamente un proceso
complejo de modelado, que implica la simulación de cambios en la distri- Una versión de ejemplo del informe de resultados puede verse en la
bución geográfica de especies vegetales ante distintos escenarios de siguiente dirección:
cambio climático utilizando una metodología consistente basada en el
ensamblado de resultados de distintos algoritmos. http://botanica2.ugr.es/modplan/INICIO.html
Conclusiones metodológicas IDEAS PARA EL FUTURO
El programa de diseño y ejecución de flujos de trabajo Kepler permite gra-
cias a su flexibilidad utilizarlo como base para la ejecución de líneas com- El desarrollo del sistema de modelado no acaba aquí. Forma parte del
plejas de procesamiento de datos. Su capacidad de lanzar batch-jobs de núcleo de la tesis doctoral del autor, y va a seguir creciendo, implementando
nuevas funcionalidades, según los requerimientos de la investigación en
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 36
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
curso. A continuación se detallan algunas mejoras que deberían implemen- biología de la especie.
tarse en las siguientes versiones del sistema.
Un proyecto de ampliación de los análisis de los modelos que se está
La configuración inicial del sistema es relativamente compleja. Muchos barajando consiste en un análisis automático de las rutas migratorias más
“packages” de R, un pequeño “hacking” en GRASS para solucionar un bug, y probables que puede seguir cada especie. Utilizando los modelos como
algunos programas secundarios como ImageMagick o pdftk son necesarios superficies de fricción, y con la idea de que cuanto más idóneo es el hábitat,
para el funcionamiento del flujo. Una posibilidad es distribuir junto con el menor es la fricción a la dispersión, puede implementarse un método auto-
sistema un script de configuración que prepare el entorno automáticamente, mático en GRASS para generar las líneas de flujo migratorio. Esto es direc-
aunque será en versiones posteriores cuando se implemente. tamente aplicable en gestión, porque proporcionaría información valiosa para
el diseño de pasillos migratorios.
Una cuestión que queda pendiente es dotar al sistema de una mayor
flexibilidad para seleccionar el número de algoritmos de trabajo, controlar los También se está trabajando en un análisis final, una vez modeladas todas
intervalos de tiempo que se modelan, los escenarios o las variables de cali- las especies, que contemple dos vertientes: Una vertiente técnica, que
brado. Lo cierto es que las secciones del flujo dedicadas exclusivamente al permita comparar entre sí métodos de modelado y ensamblado, una suerte
modelado funcionan sin problemas con cualquier número de algoritmos, de laboratorio de pruebas para testar metodologías. Una vertiente biológica,
escenarios, variables y periodos de tiempo. Es la fase de edición de los basada en el ensamblado de resultados de las especies individuales para
resultados la que no está adaptada, y es algo que pretende implementarse trabajar a nivel de biodiversidad. Esto permitiría conocer con cierta aproxima-
en un futuro cercano. Sin embargo, para usuarios con escasos conoci- ción el comportamiento general de la biodiversidad vegetal ante distintos
mientos en modelado de distribución, esta flexibilidad suele suponer un escenarios de cambio climático.
problema, por lo que no se ha ahondado en ella en la versión del flujo dispo-
nible on-line. Otros 100 autores encontrarían otras 100 funciones que implementar.
Será el interés posterior de otras personas en los resultados de este
La implementación de otros métodos de ensamblado está contemplada. proyecto el que lo haga crecer o morir. Por la parte del autor, las novedades
De hecho, la versión inicial del flujo de trabajo descrito ya proporcionaba un descritas cubrirían con creces los objetivos planteados en un principio.
segundo método de ensamblado, que se ha descartado para evitar una
complejidad innecesaria en la exposición de resultados. Este método si está
plenamente funcional en otra rama de desarrollo de la aplicación. AGRADECIMIENTOS
Otra cuestión pendiente es mejorar el cálculo de la migración vertical y Este trabajo no hubiera sido posible sin la paciencia y el cariño de Ana,
horizontal. Los métodos implementados no son los más precisos posibles, que ha cuidado de mí durante el desarrollo del proyecto.
aunque si son buenos indicadores de las tendencias de la especie en ambos
aspectos. Al Dr. Julio Peñas, mi “jefe”. Con gran paciencia y confianza paciencia,
me ha dado carta blanca para llevarlo a cabo.
La estructura y presentación del documento html que presenta los resul- Mi mas sincero agradecimiento a los desarrolladores de OpenModeller,
tados muy probablemente pueden mejorarse. Los escasos conocimientos del MaxEnt, Kepler, GRASS, R, GNU Octave, pdftk, ImageMagick, Bash, Linux,
autor en el lenguaje html y alguna disfunción en cuanto a la capacidad para y cualquier otra línea de código en la que me haya apoyado incluso sin
seleccionar gamas de color complementarias explican perfectamente esta saberlo. Los que desarrollan software libre son los que de verdad ponen a
situación. Un proyecto próximo es mejorar la presentación, y segregar la nuestra disposición los recursos para avanzar hasta quién sabe donde.
información en dos niveles: uno técnico, referido a los modelos en sí, y otro
biológico, referido a los efectos potenciales del cambio del clima en la Al profesorado y coordinación de estudiantes de UNIGIS Girona, compa-
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 37
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
ñeros durante dos años y medio de largo viaje. He crecido por el camino Pennington DD, Higgins D, Peterson AT, Jones MB, Ludascher B, Bowers
gracias a su excelente trabajo. S 2007. Ecological Niche Modelling Using the Kepler Workflow System, en
Workflows for e-Science. Editores: Taylor IJ, Deelman E, Gannon DB,
A la Consejería de Innovación, Ciencia y Empresa de la Junta de Anda-
Shields M. Editorial Springer, Londres.
lucía (proyecto RNM 1067), porque financia mi periodo de formación como
investigador, y me ha introducido en un mundo que me apasiona. Phillips SJ, Anderson RP, Schapire RE. 2006. Maximum entropy mode-
ling of species geographic distributions. Ecological Modelling, 190: 231-259.
A la Red de Información Ambiental de la Junta de Andalucía y la Agencia
URL: www.osgeo.org/files/journal/final_pdfs/OSGeo_vol1_openModeller.pdf
Estatal de Meteorología, por proporcionar datos de fundamental importancia
para el desarrollo del proyecto. Sutton T, Giovanni R, Siqueira MF. Introducing openModeller - A funda-
mental niche modelling framework. OSGeo Journal Volume 1. ISSN
1994-1897. url: www.osgeo.org/files/journal/final_pdfs/OSGeo_vol1_openMo-
BIBLIOGRAFÍA deller.pdf
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 38
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Los algoritmos utilizados en este proyecto pueden clasificarse en dos grupos: GARP (Genetic Algorithm for Ruleset Prediction, siglas GA en el flujo) es un algo-
métricas de similaridad ecológica (distancias euclídea, de Mahalanobis, Manhattan y ritmo genético. Utiliza un mecanismo similar a la evolución genética biológica para
Chebyshev), métodos de aprendizaje artificial (GARP, MaxEnt, Neural Networks y desarrollar un conjunto de reglas válidas para predecir la distribución de la especie.
Support Vector Machines). La mecánica de GARP es un tanto oscura (incluso para los que lo conocen bien),
pero se tratará de plasmarla brevemente. Una ejecución de GARP comienza con una
Los métodos de similaridad ecológica generan, a partir de los valores estandari-
población de reglas generadas al azar (una regla podría ser: la especie está presente
zados de n variables ambientales, un espacio de n dimensiones (llamado espacio
entre los 500 y los 800 milímetros de precipitación anual). GARP genera un modelo
ecológico). Dentro de ese espacio se sitúan los puntos de presencia de la especie, y
de distribución con cada regla, los evalúa todos, y a la siguiente generación solo
puntos que representan a cada una de las celdas del territorio. El grado de simila-
pasan aquellas reglas que han superado un cierto valor de evaluación. El proceso
ridad ecológica de una celda se obtiene midiendo la distancia entre el punto que la
vuelve a repetirse un cierto número de veces hasta que se alcanza un cierto criterio
representa y los puntos de presencia de la especie. Dependiendo de la configuración
de parada (todas las reglas por encima de cierto valor de evaluación). Con todas las
del algoritmo, puede medirse la distancia hasta el centroide de todos los puntos de
reglas resultantes, GARP genera un fichero de reglas con el que crea el mapa de
presencia, el punto más cercano, o un grupo de número determinado de puntos más
distribución definitivo.
cercanos. La lógica matemática utilizada para medir la similaridad ecológica deter-
mina el nombre del algoritmo. GARP añade un proceso de mutación y recombinación de reglas estocástico en el
paso de una generación a otra, por lo que el resultado no es determinista. Una sola
La Distancia Euclídea (siglas EU en el flujo) mide al recorrido más corto entre el
simulación de GARP es una superficie binaria de presencia-ausencia. Para generar
punto que representa a la celda y el punto de presencia de la especie más cercano,
una superficie continua, se generan “n” modelos y se suman.
según la geometría más convencional e intuitiva.
Las Redes Neuronales Artificiales (NN en el flujo) son conjuntos interconectados
La Distancia de Chebyshev (siglas CH en el flujo) ofrece como resultado la
de neuronas artificiales organizados en capas, que tienen como objetivo proporcionar
máxima distancia posible entre dos puntos, en cualquier dimensión de los ejes de
respuestas a un problema concreto del mismo modo que lo haría un cerebro humano.
coordenadas. Se conoce también como distancia del tablero de ajedrez.
La red neuronal del algoritmo tiene tres capas. En la capa de entrada la red tiene
La Distancia de Mahalanobis (siglas MH en el flujo) es similar a la euclídea, pero tantas neuronas como variables ambientales se usan para calibrar el modelo. En la
tiene en cuenta la correlación entre las variables a la hora de ponderar la medida. segunda un número de neuronas determinado empíricamente, y una sola neurona en
la capa de salida. El algoritmo de aprendizaje de la red se basa en un mecanismo de
La Distancia de Manhattan (siglas MN en el flujo) es la suma de las diferencias retropropagación. A la red se le “muestran” los puntos de presencia de la especie y
absolutas de las coordenadas de los dos puntos entre los que se quiere medir la puntos aleatorios (con sus respectivos valores sobre las variables ambientales), y se
distancia. le pide que clasifique un punto cualquiera como presencia o ausencia. La red clasifica
Los cuatro algoritmos pueden configurarse según dos parámetros: el punto, y compara el resultado con la realidad. La diferencia entre la predicción de
la red y la realidad da lugar a un reajuste en la ponderación de las conexiones entre
Puntos más cercanos: número de puntos de presencia tomados como refe- neuronas “aguas arriba”. Esta operación se sigue repitiendo hasta que el error
rencia para medir la distancia. Pueden ser todos o varios, y entonces la distancia posible queda por debajo de cierto grado de tolerancia. Este algoritmo es de reciente
se calcula utilizando el centroide de los puntos, o puede ser uno, en cuyo caso se incorporación en OpenModeller, y sus resultados aún están poco probados.
mide la distancia al más cercano.
El algoritmo de Máxima Entropía (ME en el flujo) es un método de propósito
Máxima distancia: es un parámetro de referencia que indica una distancia general diseñado para generar predicciones a partir de información incompleta.
umbral a partir de la cual ya no se mide la distancia, por considerarse suficiente- MaxEnt utiliza un mecanismo de inteligencia artificial para buscar iterativamente la
mente alejadas de las condiciones apropiadas para la especie. distribución de probabilidad de presencia de la especie más uniforme posible (con la
Para cada uno de estos algoritmos pueden configurarse estos parámetros en el máxima entropía). Esta ecuación se proyecta al espacio geográfico con un rango de
flujo modificando los valores del fichero de parámetros en el directorio SCRIPTS. valores de 0 a 100 que expresa en valores relativos la idoneidad del hábitat para la
especie. MaxEnt está muy extendido en el ámbito académico por la calidad de los
Los métodos de aprendizaje artificial utilizan algún tipo de lógica heurística para resultados que proporciona y el sencillo uso de su interfaz.
determinar la distribución potencial de la especie. Los métodos aquí aplicados siguen
lógicas muy diferentes. Los Support Vector Machines (VM en el flujo) son métodos de aprendizaje artifi-
cial diseñados para clasificar grupos. El algoritmo toma como entrada dos vectores
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 39
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
de datos (presencias y puntos aleatorios) en un espacio de n dimensiones determi- mediante líneas. Posteriormente se calcula mediante un método geométrico el área
nado por las variables ambientales. El quid de la cuestión está en generar un hiper- que queda por debajo de de la curva para obtener el valor AUC. Si AUC está cercano
plano (el equivalente de un plano en un espacio de n dimensiones) que maximice las a 1, el modelo tiene una alta capacidad para discriminar presencias y puntos aleato-
diferencias entre ambos vectores. Cuanto mayor es la distancia entre un objeto rios. Si AUC está cercano a 0,5, el modelo no es capaz de discriminar entre ambos
concreto y el hiperplano, mayor será la seguridad de pertenencia al grupo a ese tipos de registros más allá de lo esperado por azar. Estrictamente, AUC indica la
“lado” del hiperplano. probabilidad de que, tomados al azar un punto de evaluación y un punto aleatorio, el
punto de evaluación tenga, sobre el modelo evaluado, un valor de idoneidad mayor
que el punto aleatorio.
Anexo 2: Evaluación estadística de modelos
Como la posición concreta de los puntos aleatorios tiene importancia en el cálculo
El objetivo de este anexo es describir los métodos de evaluación aplicados a los del valor AUC, se utilizan miles de puntos aleatorios, y se calcula AUC miles de
modelos de distribución en el flujo de trabajo, y explicar el contenido de la salida veces, manteniendo siempre los puntos de evaluación, pero reemplazando cada vez
gráfica asociada a dicho análisis. los puntos aleatorios. Cuando se comparan varios modelos, como veremos a conti-
nuación, se dispone de varios miles de valores de AUC, por lo que resulta una
La evaluación estadística de los modelos de distribución es un paso fundamental
comparación estadísticamente robusta.
para obtener información objetiva sobre su fiabilidad, sobre todo cuando se trabaja
con especies poco conocidas por el usuario. En este caso se trata de medir el poder Para combinar los valores de AUC obtenidos para los dos ámbitos geográficos, se
de discriminación del modelo, basándonos en los valores de los puntos de evaluación calcula un Índice Compuesto, en el que los resultados de la evaluación local se
y de n puntos aleatorios sobre el modelo. En esta evaluación tiene mucha impor- ponderan al doble que los de la evaluación global, y de forma que el máximo posible
tancia la escala geográfica de la evaluación. La evaluación de modelos se realizará a en la suma de ambos sea igual a 1, para mantener la escala de referencia original
las dos escalas comentadas a lo largo de este trabajo: escala local y global. En el entre 0 y 1
caso de especies muy extendidas geográficamente, ambas escalas pueden coincidir,
Correlación entre mediana de idoneidad y desviación estándar del ensamblado
con lo que no sería necesaria esta distinción. Pero no se ha implementado ningún
mecanismo de control al respecto. En este proyecto se explora también como un potencial índice de fiabilidad la
correlación que existe entre la mediana de idoneidad de los modelos, y el valor de
El procedimiento de evaluación es efectuado en Octave, mediante el script 8
desviación estándar.
EVALUA MODELOS.m, diseñado para evaluar los modelos según un método habi-
tual en la cultura de los MDEs: Área bajo la curva ROC (AUC). La desviación estándar es más baja en aquellos lugares para los que los modelos
coinciden en sus valores de idoneidad. Al contrario, la desviación es alta en aquellos
Área bajo la Curva ROC
lugares en los que hay desacuerdo entre los modelos. La idea que se explora es la
(AUC): Es un método estándar de evaluación, que normalmente se aplica a siguiente: cuanto mayor es el promedio de idoneidad y menor es la desviación
modelos de distribución que utilizan como entrada presencias y ausencias. En el estándar en los lugares en los que la especie está presente, más robusto es el
caso que nos ocupa, siendo modelos basados solo en presencia, se sustituyen las ensamblado (porque está determinando el grado de idoneidad con menor dispersión).
ausencias por puntos generados al azar. Un único cálculo de curva ROC implica
Esta relación se calcula haciendo un análisis de regresión lineal entre los valores
calcular, para cada valor de idoneidad del modelo los siguientes valores:
de EC y los valores de DE en las localidades con puntos de evaluación. La medida
Sensibilidad: es la fracción de aciertos del modelo discriminando registros de de robustez es el coeficiente de correlación de Pearson obtenido del análisis de
presencia (incluyéndolos en el modelo). Si de un total de 10 registros de correlación.
presencia, el nivel de idoneidad 80 engloba 7 registros, la sensibilidad asociada es
Los resultados de los distintos tests se muestran en la Figura 38. Los gráficos
0,7.
AUC local y AUC global muestran la distribución de los valores de AUC en sus
Especificidad: es la fracción de aciertos del modelo discriminando registros respectivos ámbitos geográficos. Las líneas horizontales rojas (solo visibles en el
aleatorios (excluyéndolos del modelo). Si de un total de 10 registros aleatorios, el primero de ellos en este caso) muestran el límite inferior de fiabilidad (0,5), la línea
nivel de idoneidad 80 engloba 4 registros, la especificidad asociada es 0,4. verde indica el valor promedio del conjunto, y la línea negra marca la mejor mediana
del conjunto. Según el valor de AUC local en este gráfico, el modelo que mejor discri-
Para calcular la curva ROC se dibujan en una gráfica los valores de Sensibilidad y
mina las presencias de la especie de los puntos aleatorios a escala local es MaxEnt
1-Especificidad correspondientes a cada nivel de idoneidad del modelo, y se unen
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 40
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
(ME), seguido de Support Vector Machines (VM) y el ensamblado (EC). El peor ambos, indicando que en este ensamblado, los valores de idoneidad de los distintos
modelo en este sentido sería GARP (GA). Según el gráfico de AUC global, son ME y modelos presentan una menor dispersión cuanto mayor es la idoneidad.
EC los mejores modelos, mientras que el peor, a esta escala, es la Distancia de
Chebyshev (CH).
Anexo 3: Actores de Kepler
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 41
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Anexo 4: Código fuente de los scripts
En este proyecto los scripts son los que hacen en trabajo “duro”. Para facilitar su
interpretación, todos llevan un prefijo numérico, según su orden de ejecución dentro
del flujo. A continuación se describen brevemente, y se muestran las secciones de
código más interesantes. Pulsando sobre el título con el nombre del script puede
accederse a la versión completa del código resaltado para su visualización en un
navegador web.
Flujo PRP
1_inicia_EXTRAE_COORDENADAS.sh
String Constant: Contiene una cadena de texto, generalmente una ruta, una ex- 2_ejecuta_EXTRAE_COORDENADAS.txt
presión o una orden, y la emite a través de output. Se utiliza, entre otras cosas,
para pasar órdenes al siguiente actor. Este script realiza la secuencia de rasterización y vectorización de polígonos dise-
External Execution: Permite llamar a una aplicación externa o a un script. Acepta ñada para transformarlos en nubes de puntos. Importa un shp y devuelve un fichero
un comando (command) y un directorio de trabajo para ejecutar su tarea. Se utiliza de texto con las coordenadas de la nube de puntos.
para llamar los scripts de Bash, R, Octave y GRASS. # TRATAMIENTO DEL SHAPEFILE DE PRESENCIA DE LA ESPECIE
Expresión de R: Los actores R son muy flexibles, y pueden modificarse a voluntad # importacion de las entidades poligonales
alterando el código y los puertos. El que se muestra lee una tabla, pero pueden v.in.ogr -o dsn=$DIR_RAIZ/PRESENCIA_SHP/${NOM_ESPECIE}.shp output=$
hacer casi cualquier cosa. Sin embargo, no ha sido posible utilizarlos para generar {NOM_ESPECIE}_PRESENCIA min_area=0.0001 snap=-1 --overwrite
los gráficos del flujo. Se ha mostrado más potente la posibilidad de invocar los # calculo de centroides
scripts de R mediante External Execution. v.centroids input=${NOM_ESPECIE}_PRESENCIA output=$
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 42
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 43
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
Es un script lanzado por el actor RENOMBRA_FICHEROS (ver Figura 7), que usa Una vez terminado el batch-job (no se ha mostrado la línea que lo lanza), el script
la orden mv de bash para mover y renombrar ficheros. Su código no tiene mayor reorganiza los ficheros de definición de modelos, borra los mapas .asc que ya están
interés. en GRASS, y compone los mapas de visualización de los resultados, pegando la
vista general y la vista de detalle (ver Figura 21) mediante una orden de ImageMagick
como esta:
convert +append -border 1 -bordercolor white 1.png 12.png 5_CH.png
Flujo MODPLAN
5_OM_UNE_CABECERA_PARAMETROS.sh
7_ejecuta_MODELOS_EVALUACION.txt
Un fichero de ejecución de OpenModeller tiene una cabecera, en la que se confi-
guran las rutas de acceso a datos, y una sección en la que se configuran los paráme- Este batch-job importa y ensambla los modelos, extrae los valores sobre los
tros de cada algoritmo. El script utiliza un bucle que itera sobre una lista con los acró- modelos de los puntos de calibrado y evaluación, genera puntos aleatorios y extrae
nimos de los modelos para pegar la cabecera con sus respectivos ficheros de pará- los valores de esos puntos sobre los modelos, prepara los ficheros de evaluación y
metros de los modelos. genera mapas de los modelos.
# IMPORTACION DE MODELOS
ALGORITMOS_OM=( CH EU GA MH MN NN VM )
for MODELO in $ALGORITMOS_OM ; do
for ALGORITMO in ${ALGORITMOS_OM[@]};do
r.in.arc input=$DIR_RAIZ/RESULTADOS/$ESP_SELECCIONADA/EVALUACION/$
cat $DIR_RAIZ/TEMPORAL/OM_CABECERA.txt
{ESP_SELECCIONADA}_${MODELO}.asc output=${ESP_SELECCIONADA}_${MODELO}
$DIR_RAIZ/PROGRAMAS/SCRIPTS/OM_PARAMETROS_${ALGORITMO}.txt > $DIR_RAIZ/
type=FCELL mult=100 --overwrite
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 44
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 45
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 46
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
13_inicia_PROYECCION.sh
12_ejecuta_MODELOS_CALIBRADO.sh Este script se encarga de proyectar las definiciones de los modelos sobre las
variables de los escenarios. El script utiliza dos bucles anidados. El primero itera
Este batch-job importa los modelos recalibrados, los ensambla, extrae los valores sobre la lista de escenarios. En cada iteración lanza el batch-job 14 ejecuta
de los puntos sobre los modelos, calcula el área de ocupación potencial de la PROYECCION.txt, que procesa los modelos proyectados. El bucle anidado itera
especie, el número de parches de hábitat idóneo y genera los mapas del ensam- sobre la lista de algoritmos.
blado. La mayor parte del código es similar al del script 7, por lo que solo se mues- ESCENARIO=`echo LISTA_ESCENARIOS`
tran las partes no comunes, referidas al cálculo de área y número de parches.
# itera sobre cada elemento de la lista de escenarios
# CALCULO DE AREA DE OCUPACION Y NUMERO DE PARCHES for nombre_escenario in ${ESCENARIO[@]}; do
# copia el fichero RECODE_ENSAMBLADO_CONTINUO a TEMPORAL # copia las definiciones de los modelos al directorio PROYECCION
cp $DIR_RAIZ/PROGRAMAS/SCRIPTS/RECODE_ENSAMBLADO_CONTINUO cp $DIR_RAIZ/RESULTADOS/${ESP_SELECCIONADA}/PROYECCION/MODELOS/*.xml
$DIR_RAIZ/TEMPORAL $DIR_RAIZ/RESULTADOS/${ESP_SELECCIONADA}/PROYECCION
# sustituye en el fichero la clave UMBRAL_ENSCON # reemplaza en las definiciones de los modelos la cadena CALIBRADO por
sed -i "s/UMBRAL_ENSCON/$UMBRAL_ENSCON/g" la cadena PROYECCION/NOMBRE_ESCENARIO
$DIR_RAIZ/TEMPORAL/RECODE_ENSAMBLADO_CONTINUO rpl /CALIBRADO /PROYECCION/${nombre_escenario} *.xml
# recodifica el modelo de idoneidad # lista de algoritmos de OpenModeller
r.recode input=${ESP_SELECCIONADA}_EC_2000 output=${ESP_SELEC- ALGORITMOS_OM=`echo CH EU GA MH MN NN VM`
CIONADA}_EC_2000_area1 rules=$
{DIR_RAIZ}/TEMPORAL/RECODE_ENSAMBLADO_CONTINUO export ALGORITMOS_OM
#filtro de mediana con kernel 3x3 para eliminar celdas aisladas for ALGORITMO in $ALGORITMOS_OM; do
r.neighbors input=${ESP_SELECCIONADA}_EC_2000_area1 output=${ESP_SELEC- # proyecta modelos OpenModeller
CIONADA}_EC_2000_area2 method=mode size=3 om_project --model ${ESP_SELECCIONADA}_${ALGORITMO}.xml --format
#elimina los valores 0 del mapa, preparandolo para su vectorizacion FloatingASC --dist-map ${ESP_SELECCIONADA}_${ALGORITMO}.asc
r.null map=${ESP_SELECCIONADA}_EC_2000_area2 setnull=0 done
#extrae la suma de celdas del mapa binario # proyecta modelo MaxEnt
r.sum rast=${ESP_SELECCIONADA}_EC_2000_area2 >> $ java -mx2600m -cp maxent.jar density.Project ${ESP_SELEC-
{DIR_RAIZ}/TEMPORAL/AREA_CONTINUO_2000.txt CIONADA}.lambdas $DIR_RAIZ/VARIABLES/PROYECCION/${nombre_escenario} $
{ESP_SELECCIONADA}_c_ME.asc dontextrapolate dontwriteclampgrid
#elimina una cadena de caracteres
done
sed -i 's/SUM = //g' ${DIR_RAIZ}/TEMPORAL/AREA_CONTINUO_2000.txt
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 47
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
14_ejecuta_PROYECCION.txt E)
umbral <- read.table("DIRECTORIO_RAIZ/TEMPORAL/UMBRAL_CORTE_ENSCON",
Este batch-job de GRASS hace las mismas tareas que el 12, pero añadiendo a header=FALSE)
cada resultado el nombre del escenario correspondiente, por lo que su código no resolucion <- read.table("DIRECTORIO_RAIZ/TEMPORAL/RESOLUCION",
tiene mayor interés. header=FALSE)
...
TIEMPO <- c(2000, 2020, 2040, 2060, 2080, 2100)
ESCENARIOS <- c("CGCM2_A2", "CGCM2_B2","ECHAM4_A2","ECHAM4_B2")
15_inicia_ANALISIS_FINALES.sh # GRAFICA DE REQUERIMIENTOS ECOLOGICOS
Es un script de bash lanzado por el actor ANALISIS (Figura 16). Su misión prin- pdf("REQUERIMIENTOS_ECOLOGICOS.pdf", width=11.5, height=8)
cipal es lanzar el batch-job 16 ejecuta ANALISIS FINALES.txt, preparar los ficheros par(mfrow=c(3,2), cex=0.6, mar=c(3,4,2,1), oma=c(2,2,4,2))
para las gráficas de área y número de parches, y limpiar directorios con ficheros layout(matrix(c(1,2,3,4,5,6,7,8,9,10), 5, 2, byrow = TRUE))
temporales que ya no son necesarios. # calcula densidad de la muestra de presencias
densidad_CL_PA <- density(presencias$CL_PA)
# calcula densidad de los puntos aleatorios global
densidad_global_CL_PA <- density(aleatorios.global$CL_PA)
16_ejecuta_ANALISIS_FINALES.txt
# calcula el valor maximo posible del eje y
Se encarga de hacer el mapa de diferencias entre modelos, el mapa de persis- ymaximos <- c(densidad_CL_PA$y, densidad_global_CL_PA$y)
tencia y exportar la tabla VALORES_PUNTOS con el muestreo realizado a todos los ymax=max(ymaximos)
ensamblados generados. # dibuja la grafica
# calcula diferencias entre el modelo continuo calibrado y el modelo plot(densidad_global_CL_PA, main="Precipitacion anual (milimetros)",
continuo de evaluacion ylab="", xlim=c(100, max(aleatorios.global$CL_PA)), ylim=c(0,ymax))
r.mapcalc ${ESP_SELECCIONADA}_DIFERENCIAS_EC=$ # rellena un poligono con la curva de densidad de las presencias
{ESP_SELECCIONADA}_EC_2000-${ESP_SELECCIONADA}_EC polygon(densidad_CL_PA, col="tomato", border="tomato")
# calcula mapa de persistencia sumando modelos de idoneidad transfor- # dibuja una linea con la curva de densidad del territorio de trabajo
mados en binarios
lines(densidad_global_CL_PA,xlim=c(0, max(aleatorios.global$CL_PA)),
r.series input="`g.mlist pattern="${ESP_SELECCIONADA}_EC_??_????_area1" ylim=c(0,ymax))
sep=,`" output=${ESP_SELECCIONADA}_PERSISTENCIA_1 method=sum --over-
write # dibuja una linea vertical en el promedio del valor de la variable
para todo el territorio
# recodifica el mapa en valores de 0 a 100
abline(v=mean(aleatorios.global$CL_PA), lwd=2)
r.recode input=${ESP_SELECCIONADA}_PERSISTENCIA_1 output=${ESP_SELEC-
# dibuja una linea vertical en el promedio del valor de la variable
CIONADA}_PERSISTENCIA rules=$
{DIR_RAIZ}/PROGRAMAS/SCRIPTS/RECODE_MAPA_PERSISTENCIA –overwrite para todos los puntos de presencia
abline(v=mean(presencias$CL_PA), col="tomato4", lwd=2)
#LEYENDA
17_GRAFICOS_ANALISIS_FINALES.r texto.media.especie="promedio especie"
texto.media.territorio="promedio territorio"
Este script de R, lanzado por el actor GRAFICOS3 (Figura 16) se encarga de leer
text(mean(aleatorios.global$CL_PA)-200, ymax-(ymax/5), texto.media.ter-
los datos, organizarlos y generar gráficos descriptivos.
ritorio, cex=1.2)
# carga tabla VALORES_PUNTOS text(mean(presencias$CL_PA)+200, ymax-(ymax/15), texto.media.especie,
DATOS <- read- cex=1.2, col="tomato4")
.table("DIRECTORIO_RAIZ/TEMPORAL/VALORES_PUNTOS.txt",sep="|",header=TRU
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 48
BLAS BENITO DE PANDO, ALUMNO DE 9ª PROMOCIÓN UNIGIS TRABAJO DE FIN DE MASTER
smoothScatter(aleatorios.global$C_2000C,aleatorios.global$CL_PA,
FLUJO DE TRABAJO PARA LA SIMULACIÓN DE CAMBIOS EN LA DISTRIBUCIÓN DE PLANTAS EN ESCENARIOS DE CAMBIO CLIMÁTICO 49