Sei sulla pagina 1di 8

ndices de biodiversidad en R-project

http://statisticalecology-
ec.blogspot.com.co/2012/08/indicesdebiodiversidadR.ht
ml
Clase 6: ndices de biodiversidad en R-project

ndices de biodiversidad
Continuando con este breve curso sobre bioestadstica en R (Clase 1, Clase 2, Clase 3, Clase
4 y Clase 5), en esta oportunidad intentaremos abordar el problema de los ndices de biodiversidad
utilizando R. Comenzaremos con algunos conceptos previos.
Qu queremos decir por biodiversidad?
La biodiversidad o diversidad biolgica se define como la variabilidad entre los organismos
vivientes de todas las fuentes, incluyendo, entre otros, los organismos terrestres, marinos y de
otros ecosistemas acuticos, as como los complejos ecolgicos de los que forman parte; esto
incluye diversidad dentro de las especies, entre especies y de ecosistemas (UNEP, 1992). El
trmino comprende, por tanto, diferentes escalas biolgicas: desde la variabilidad en el
contenido gentico de los individuos y las poblaciones, el conjunto de especies que integran
grupos funcionales y comunidades completas, hasta el conjunto de comunidades de un paisaje
o regin (Solbrig, 1991; Halffter y Ezcurra, 1992; Heywood, 1994; UNEP, 1992; Harper y
Hawksworth, 1994).
Fuente: http://entomologia.rediris.es/sea/manytes/metodos.pdf

Es decir, existen distintas escalas de diversidad:

Diversidad a escala gentica.


Diversidad de especies: la diversidad alfa es la riqueza de especies de una comunidad
particular a la que consideramos homognea.
Diversidad a nivel de comunidades: la diversidad beta es el grado de cambio o
reemplazo en la composicin de especies entre diferentes comunidades en un paisaje, y la
diversidad gamma es la riqueza de especies del conjunto de comunidades que integran un paisaje,
resultante tanto de las diversidades alfa como de las diversidades beta (Whittaker, 1972).

Diversidad de especies.
La diversidad alfa tiene dos componentes fundamentales:
riqueza especfica: nmero de especies que tiene un ecosistema
estructura (equitabilidad): mide la distribucin de la abundancia de las especies, es decir,
cmo de uniforme es un ecosistema.

Cmo podemos traducir un concepto intuitivo en algo


que podamos medir?

Fuente: http://entomologia.rediris.es/sea/manytes/metodos.pdf

Mtodos paramtricos: ndices


La medida de ocurrencia Jaccard o Coeficiente de comunidad es una medida muy simple e intuitiva
(Shi 1993; Magurran 2004).
La medida de Sorenson o ndice de Dice, Czekanowski or Coincidencem hace ms nfasis a las
especies presentes compartidas ms que a las no compartidas, y su clculo es relativamente
simple e intuitivo (Wolda 1981; Hub?lek 1982).
Otros dos ndices similares sue se utilizan ocasionalmente son las medidas de Ochiai y Kulczynski.
Sin embargo, se eligen las medidas de Jaccard o Soreson porque son las ms utilizadas
actualmente.
El ndice de Simpson intenta solucionar uno de los problemas ms tpicos, el de diferentes
tamaos muestrales entre localidades. Comprar sitios con intensidades desiguales puede generar
visiones sesgadas. Teniendo esto en cuenta, Simpson (1960) desarroll una medida para tamaos
muestrales distintos. Su frmula reescala el valor por el nmero de especies del ltimo sitio
muestreo, por lo que una submuestra tendr similitud con la muestra original. Por tanto, este ndice
es utilizado con datos altamente variables en intensidad de muestreo, por ejemplo los datos de
fsiles.
La medida de Bray-Curtis es posiblemente la ms utilizada, debido a su gran relacin con las
distancias ecolgicas bajo condiciones variadas (Bray and Curtis 1957; Faith etal. 1987; Minchin
1987; Clarke 1993). Esta medida es equivalente a la de Soreson, cuando la utilizamos como
medida de similitud con datos de ocurrencia.
A pesar de ser menos conocido, el ndice de Mosisita-Horn es recomendable debido a su relativa
independencia del tamao muestral y diversidad (Wolda 1981; Magurran 2004). Existen muchas
variantes de este ndice.

Mtodos no paramtricos y de rarefaccin.


Uno de los mtodos tpicos para solucionar los problemas de muestreo desigual en intensidad, es
el ndice de rareza (o tambin conocido con el peculiar nombre de "rarefaccin" o interpolacin de
los datos; Sanders 1968). Los ndices de rareza permiten comparar entre distintas comunidades
donde cada una es "enrarecida" a un nmero igual de ejemplares muestreados (Heck et al. 1975;
Foote 1992; Colwell and Coddington 1994).

Los ndices de rareza interpolan nuevos datos, mientras que los estimadores no paramtricos de
especies extrapolan los datos para encontrar el "verdadero" nmero de especies (Colwell and
Coddington 1994).

Los estimadores no paramtricos utilizan el nmero de especies raras para encontrar la manera de
calcular qu tan probable es que hayan ms especies sin encontrar en la muestra.

Por ejemplo, el estimador de Chao (Chao 1984; Colwell and Coddington 1994) calcula la diversidad
de especies verdadera estimada de la muestra mediante los datos de abundancia. En caso de que
no contemos con datos de abundancia sino de ocurrencia, podremos utilizer el estimator Chao 2
(Chao 1987; Colwell and Coddington 1994), que estima la diversidad de las especies a partir de los
datos de ocurrencia de mltiples muestras.

Otro estimador es el de Jackknife (Burnham & Overton, 1978, 1979) originalmente utilizados para
dates de capture y recaptura.

Dentro del paquete fossil existe un mtodo de rarefaccin conocido como la curva de
Coleman(Coleman 1981; Coleman et al. 1982), que se desarrolla como un mtodo de remuestreo
ms que mediante una frmula de rareza.

Por ltimo est el estimator de riqueza boostrap (Smith & van Belle, 1984).

Aplicacin en R: paquetes fossil y vegan


#########################################################################
##
# Anlisis de datos con R
#
# 2012 #
# Msc. Rosana Ferrero
#
# http://statisticalecology.blogspot.com/
#
#########################################################################
##

#########################################################################
##
# 6. ANLISIS DE BIODIVERSIDAD #
# libreras fossil y vegan
#########################################################################
##

#########################################################################
##
############ con la librera fossil
#################
############ 1. Manipulacin de los datos
############ 2.
#########################################################################
##
library(fossil)

data(fdata.list)
head(fdata.list)

############ 1. Manipulacin de los datos


#las funciones estimadoras de especies pueden agruparse en 2 categoras:
las que usan los datos de ocurrencia y aquellas que usan los datos de
abundancia.

#matriz de ocurrencias
ocurrencias=create.matrix(fdata.list,tax.name="species",locality="localit
y")
#toma la lista de las especies y su ocurrencias, y las convierte en una
matriz de especies (filas) y localidades (columnas).

#matriz de abundancia
abundancias=create.matrix(fdata.list,tax.name="species",locality="localit
y", abund=TRUE,abund.col="abundance")
#crea una matriz de abundancias, se trata de la misma funcin anterior
pero ahora incluye la opcin abund=TRUE y el argumento abund.col que
corresponde a la columna de los valores de abundancia.
#para este ejemplo, el resultado es el mismo que data(fdaa.mat)

#matriz de coordenadas
coordenadas=create.lats(fdata.list,loc="locality",long="longitude",
lat="latitude")
#extrae las coordenadas de los sitios, eliminando aquellas entradas que
se repiten.

#La funcin dino.dist() toma una matrix de ocurrencia de especies vs.


localidad (o grupos) y devuelve una matriz de distancia pareadas.
##matriz de distancia entre cualquier nmero de localidades
#ecol.dist(x, method = sorenson, type = "dis")
#dino.dist(x, method = sorenson, type = "dis")

data(fdata.mat)
ecol.dist(fdata.mat)
ecol.dist(fdata.mat,simpson,"sim")

#grfico
data(fdata.mat)
fdata.dist=dino.dist(fdata.mat)
fdata.mst=dino.mst(fdata.dist)
data(fdata.lats)
library(maps)
map("state")
mstlines(fdata.mst,coordinates(fdata.lats))
points(coordinates(fdata.lats),pch=16,col="white",cex=3)
points(coordinates(fdata.lats),pch=1,cex=3)
text(coordinates(fdata.lats),labels=LETTERS[1:12])

############ 2. ndices de distancia/similitud/diversidad beta


#Coefficient Name Formulae Alternate Name
Function Call
#Jaccard a/(a+b+c) Coefficient of Community
jaccard()
#Sorenson 2a/(2a+b+c) Dice, Czekanowski, Coincidence Inde
sorenson()
#Simpson a/(a+min(b,c)) -
simpson()
#Braun-Blanquet a/(a+max(b,c)) -
braun.blanquet()
#Ochiai a/sqrt{(a+b)(a+c)} Coefficient of Closeness
ochiai()
#Kulczynski [a/(a+b)+a/(a+c)]/2 -
kulczynski()

#otros:
braun.blanquet(x, y)
bray.curtis(x, y)
euclidean(x,y)
kulczynski(x,y)
jaccard(x, y)
manhattan(x, y)
morisita.horn(x, y)
ochiai(x, y)
simpson(x, y)
sorenson(x, y)

#Todas las funciones de similitud se utilizan de la misma manera. Las


funciones necesitan dos argumentos que representen las dos muestras. Es
importante que las ocurrencias de especies estn colocadas de misma
manera para cada sitio, y que cada especie ausente se represente por el
cero.
sampleA=c(1,1,0,1,1,1,1)
sampleB=c(0,1,1,0,0,1,1)
sorenson(sampleA,sampleB)

##Conteo de especies de 2 localizaciones diferentes.


a = c(1,0,4,3,5,0,0,7)
b = c(2,1,3,0,0,1,0,6)
bray.curtis(a,b)
jaccard(a,b)
simpson(a,b)
sorenson(a,b)
morisita.horn(a,b)

##### 3. Mtodos con muestras complejas (incompletas) o pequeas:


aleatorizacin, remuestreo, boostrap.
data(fdata.mat)
head(fdata.mat) #es nuestra matriz de "abundancias"
chao1(fdata.mat)
jack1(fdata.mat)

## con aleatorizacin
#spp.est(). La funcin tiene varias opciones: el nmero de
aleatorizaciones y si utilizar o no datos de abundancias. Calcula la
curva de rareza de Chao, Coverage Estimators y Jacknife, as como las
desviaciones estndar para todas las estimaciones. Por defecto la funcin
corre 10 aleatorizaciones de los datos, sin embargo si queremos mejores
estimaciones tendremos que aumentar dicho nmero.
e run.

#ejemplo con datos de abundancia


data(fdata.mat)
spp.est(fdata.mat, abund = TRUE, counter = FALSE)

#ejemplo con datos de ocurrencia


data(fdata.mat)
spp.est(fdata.mat, abund = FALSE, counter = FALSE)

## los estimators de Chao-Jaccard y Chao-Sorenson como estimadores de las


especies cuando tenemos datos incompletos
#chao.sorenson(x, y) chao.jaccard(x, y)
#se deben datos dos vectores separados, con las especies dispuestas
con el mismo orden, desde el rea A a la B. Si la especie est presente
en uno de los sitios pero no en el otro, debe ser identificada en ambos
sitio; en el sitio donde no se encontr se codificar con un cero.
Especies que no estn presentes en ninguno de los dos sitios sern
ignoradas.
##conteo de especies en 2 localizaciones diferentes
a = c(1,0,4,3,5,0,0,7)
b = c(2,1,3,0,0,1,0,6)
chao.sorenson(a,b)
chao.jaccard(a,b)

## Mtodo de Bootstrap en estimadores de riqueza de especies, para datos


de abundancia o para datos de presencia-ausencia.

## vector muestra
a=c(0,5,1,1,2,0,0,1,0,0,8,45)
bootstrap(a,samples=45)

## formato matricial
a=matrix(c(0,5,1,1,2,0,0,1,0,0,8,45),4,3)
bootstrap(a)
bootstrap(a,,FALSE)

## matriz de presencia-ausencia
a=matrix(c(0,1,1,1,1,0,0,1,0,0,1,1),4,3)
bootstrap(a,,FALSE)

## matiz de abundancia
bootstrap(fdata.mat,,TRUE,samples=1000)

#########################################################################
##
############## con la librera vegan ###################
#########################################################################
##

#Vamos a utilizar unos datos clsicos de la diversidad de rboles de


Barro Colorado. Los datos consisten de 50 parcelas (filas) de 1 hectrea
donde se realiza el conteo de los rboles en cada parcela y la
identificacin de su especie (columnas). Se incluyeron todos los rboles
con dimetros por encima de 10cm. Se encontraron 225 especies.
library(vegan)
data(BCI) # Barro Colorado Island tree data # 50 1-ha plots, counts of 225 spp.
View(BCI) #para ver los datos
fix(BCI)

### Riqueza especfica: ndices


cts= c(20,12,5,3,2,1,1,0,0,0) # counts for 10 spp
#1. Sin utilizar vegan
sum(cts>0) #7: sums a logical vector: T=1,F=0
#2. Utilizando vegan
specnumber(BCI) # funcin para encontrar el nmero de especies, trabaja
con matrices
specnumber(cts) # error
specnumber(matrix(cts,nrow=1))

#Diversidad: otras mtricas. Funcin diversity()


diversity(BCI, index="shannon") # Shannon-Wiener, H
diversity(BCI, index="simpson") # Simpson, 1-D
diversity(BCI, index="invsimpson") # Inverse Simpson, 1/D
fisher.alpha(BCI) # parameter alpha of the log-series

Vegan no tiene ndices de equitatividad o igualdad, peru podemos calcular


el ms comn de ellos, el ndice de Pielou: J = H/ log(S) de una manera
sencilla

J <- H/log(specnumber(BCI))

# Rarefaccin:
# min N in BCI data is 340
bci.340 = rarefy(BCI, sample=340, se=FALSE)
plot(bci.340)
#Curvas de rarefaccin.
#? Based on rarefying to many different subsample sizes.
#? rarefy() can only take a single value for sample.
#? Can call it lots of times, and collect the data: tedious!
#? In Session 4, we?ll make our own function to do this.

Tambin existen las funciones:


specaccum #Species accumulation
renyiaccum; tsallisaccum #diversity accumulation fisherfit; prestonfit; radfit #Species
abundance models specpool, estimateR # Extrapolated species richness beta
diver; betadisper #Indices of betadiversity
taxondive #Taxonomic diversity
treedive #one option of functional diversity
Null models and nestedness (oecosimu with support functions)
Technical and advanced functions like dissimilarity indices (vegdist, designdist) and their
extensions (step across)

Bibliografa y material para profundizar:


http://entomologia.rediris.es/sea/manytes/metodos.pdf
http://duncanjg.files.wordpress.com/2008/02/clasediversidad1.pdf
http://www.um.es/docencia/geobotanica/ficheros/practica2.pdf
http://prof.usb.ve/eklein/labeco2/biblio/Estructura%20de%20las%20comunidades.pdf
http://palaeo-electronica.org/2011_1/238/238.pdf
http://cran.r-project.org/web/packages/vegan/vignettes/diversity-vegan.pdf
http://www.bio.utk.edu/fesin/msa2009/snowbeam4.pdf

Potrebbero piacerti anche