Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SUFICINCIA AMOSTRAL EM
LEVANTAMENTOS DE DESCRIO E
ANLISE DA VEGETAO
NDICE
1. INTRODUO ....................................................................................................................... 3
2. AMOSTRAGEM..................................................................................................................... 4
2.1 Procedimentos de amostragem............................................................................................ 4
2.1.1 Amostragem casual simples ......................................................................................... 5
2.1.2 Amostragem sistemtica .............................................................................................. 5
2.2 Mtodos de amostragem...................................................................................................... 5
2.2.1 O conceito de rea mnima........................................................................................... 6
2.2.1 Mtodos para determinar tamanho timo de parcelas.................................................. 7
3. SUFICINCIA AMOSTRAL ................................................................................................ 8
4 AMOSTRAGEM ITERATIVA .............................................................................................. 9
5 MTODOS DE VERIFICAO DA SUFICINCIA AMOSTRAL ............................... 11
5.1 CURVA DO COLETOR................................................................................................... 11
5.2 CURVA DO COLETOR COMBINADA COM MTODO DE REAMOSTRAGEM .... 12
5.3 MTODO BASEADO NA VARINCIA........................................................................ 15
5.4 SUFICINCIA AMOSTRAL AVALIADA COM BASE EM LIMITES DE
CONFIANA ......................................................................................................................... 17
5.5 SUFICINCIA AMOSTRAL EM ANLISE DE AGRUPAMENTOS .......................... 21
5.6 SUFICINCIA AMOSTRAL EM ORDENAO .......................................................... 26
5.7 MODELO SEGMENTADO COM PLAT ..................................................................... 28
6 ESTIMADORES DE RIQUEZA NO PARAMTRICOS .............................................. 33
6.1 JACKKNIFE 1 E JACKKNIFE 2 ..................................................................................... 34
6.2 CHAO 1 e 2....................................................................................................................... 36
6.3 ACE e ICE......................................................................................................................... 38
6.4 BOOTSTRAP ................................................................................................................... 39
7 ESTIMATIVA DA RIQUEZA TOTAL DE ESPCIES POR EXTRAPOLAO
FUNCIONAL......................................................................................................................... 41
7.1 MICHAELIS-MENTEN ................................................................................................... 41
8 REFERNCIAS BIBLIOGRFICAS ................................................................................. 41
9 TUTORIAIS......................................................................................................................Anexo
1. INTRODUO
Um dos principais problemas enfrentados em estudos que objetivam o conhecimento da
diversidade dos ecossistemas florestais nativos a dificuldade de se obter as informaes
necessrias para caracterizao confivel dos mesmos. Uma representao fiel da diversidade de
espcies de uma comunidade s seria atingida atravs do emprego de um levantamento com
enumerao completa dos indivduos, chamado de censo, o que se torna invivel do ponto de
vista econmico e temporal para a grande maioria dos estudos.
Desta forma, o emprego de tcnicas de amostragem, mostra-se como a forma mais
exeqvel para realizao de estudos de descrio e anlise da vegetao. Sendo necessrio,
porm, a verificao da adequao de mtodos e procedimentos amostrais aplicados para que se
possa contemplar a maior parte da variabilidade da comunidade estudada e, desta forma, fazer
inferncias mais precisas sobre a diversidade do local.
O sistema de amostragem o conjunto do mtodo e do procedimento de amostragem. O
primeiro trata do tamanho e da forma das parcelas, enquanto o segundo trata da maneira como
essas sero locadas em campo. Quando o sistema de amostragem definido corretamente, a
representatividade da amostra utilizada em relao populao estudada garantida. A deciso
sobre um mtodo e um procedimento de amostragem deve ser fundamentada nas peculiaridades
da populao alvo e nos objetivos do estudo (REIS et al. 2007).
To importante quanto a definio correta de mtodos e procedimentos amostrais, a
verificao de suficincia amostral. Segundo SANTANA (2001) e GOMIDE (2005), somente
aps a determinao da suficincia amostral pode-se quantificar os vrios ndices de
diversidade, similaridade e a caracterizao florstica da rea de estudo.
Gomide (2005)
procedimentos a serem adotados, e ainda, ter uma noo da estrutura da comunidade a ser
estudada.
Diversas tcnicas so aplicadas para a verificao da adequao do tamanho da amostra
utilizada nos mais diferentes estudos, sendo que a forma de utilizao destes, dependente do
objetivo do trabalho e das caractersticas da comunidade objeto. Desta forma, objetiva-se neste
trabalho, apresentar os diferentes mtodos para determinao da suficincia amostral em estudos
de descrio e anlise da vegetao.
2. AMOSTRAGEM
A amostragem utilizada nos estudos da vegetao quando no possvel ou no
conveniente mensurar toda a populao de interesse. Assim, as informaes so obtidas sobre
uma parte desta, isto , para uma amostra, permitindo inferir atributos sobre o seu todo
(COCHRAN, 1963; PILLAR, 2004).
Uma amostra consiste de um conjunto de unidades amostrais ou parcelas, geralmente de
nmero inferior ao nmero total de unidades amostrais cabveis na populao. A amostra o
conjunto sobre o qual se faz observaes quantitativas e, ou qualitativas e deve ser uma
representao fiel do todo (COCHRAN, 1963).
Segundo REIS et al. (2007), a amostragem a maneira economicamente vivel de
quantificar a diversidade de um ambiente. Uma anlise representativa da populao alvo pode
ser obtida quando uma amostra corretamente selecionada e mensurada. Todavia, em qualquer
processo de amostragem tem-se um erro associado que chamado de erro de estimativa ou erro
de amostragem. Este erro ocorre devido ao fato de no se mensurar toda a populao. Outros
erros tambm ocorrem no processo, tais como os erros de medio e os erros sistemticos
(SCOLFORO e MELLO, 2006).
valor obtido pela assntota da curva e tende a incluir 90% do nmero total de espcies
existentes em uma populao.
Segundo CRAWLEY (1991), o conceito de rea mnima mostra idias equivocadas.
Uma delas de que existe um nmero fixo de espcies para cada regio e a outra de que h
relao entre a riqueza de espcies e a rea. O que ainda pode ocorrer, duas comunidades
contendo o mesmo nmero de espcies apresentarem reas mnimas diferentes. Isso acontece
devido ao fato de ter uma diferente diversidade do tipo beta.
Tabela 1. Intervalos de valores de rea mnima (m2) para diferentes tipos de fisionomias.
Tipo de comunidade
rea mnima (m2)
Liquens
1-2
Pastagens
10-25
Floresta tropical seca
400-1000
Floresta tropical mida
4000-10000
Florestas de conferas
200-500
Florestas tropicais (1cm < dimetro < 10cm) 100
Florestas tropicais (dimetro > 10cm)
20000
Fonte: Maarel (2005) e Pires OBrien e OBrien (1995).
E=
S y1 * t1
S y2 * t 2
3. SUFICINCIA AMOSTRAL
n=
t2 S 2
onde a diferena mnima a ser detectada e t o valor da distribuio de Student para n-1 graus
de liberdade correspondente a uma dada probabilidade. Como t depende de n, o valor de n
encontrado iterativamente.
Entretanto, PILLAR (2004) afirma que esta soluo problemtica para levantamentos
de florestas nativas, pois assume distribuio normal da varivel X e o objetivo da amostragem
pode no ser estimativa de mdias e varincias. Assim, o autor descreve outros mtodos para
determinao de suficincia amostral que utilizam a re-amostragem dentro de uma mesma
amostra como forma de se verificar a estabilidade das estimativas da caracterstica de interesse.
A seguir sero apresentadas algumas das metodologias utilizadas com intuito de
verificar a adequao da amostragem utilizada nos estudos fitossociolgicos.
4 AMOSTRAGEM ITERATIVA
Um processo iterativo aquele que para chegar a um resultado deve ser repetido
diversas vezes, e a cada vez que se repete, gera um resultado parcial que ser usado na etapa
seguinte. Seguindo esta idia, a amostragem iterativa pode tambm ser interpretada como um
processo de sucessivas aproximaes.
Acerca deste processo de amostragem PILLAR (2004) descreve o que segue:
nn
t = 1 + int 1
s
nn1
. A escolha de um valor de s
s
pequeno produzir um grande nmero de passos de amostragem e uma curva mais regular do
atributo de interesse.
Ainda de acordo com PILLAR (2004), outra aplicao dessa abordagem, muito usada
em ecologia de comunidades, a curva do coletor, relao entre o nmero de espcies e o
nmero de unidades amostrais. Neste caso o atributo considerado o nmero de espcies e a
anlise da curva (atravs da agregao de novas unidades amostrais sistemtica e contiguamente
s que j esto na amostra) tem o objetivo de indicar a suficincia amostral.
A limitao da utilizao da amostragem iterativa que a ordem na qual as unidades
amostrais so agregadas amostra afeta a percepo de estabilidade da curva. Tambm,
dependendo da preciso requerida, a amostra pode ser suficiente mesmo sem que a curva tenha
atingido estabilidade.
10
a) Visualizao da assntota
CAIN (1938) afirma que a determinao da suficincia amostral atravs da percepo
do padro de estabilizao, representado pela assntota da curva do coletor, invivel. A
inviabilidade deste mtodo, de acordo com este autor, se deve porque a visualizao da assntota
depende das razes dos eixos usados para a construo da curva. Pois dependendo da relao
entre o comprimento dos eixos x e y o patamar pode ou no ser visualizado. SCHILLING &
BATISTA (2008) afirmam que uma abscissa longa grafada contra uma ordenada curta sempre
resultar na visualizao de um patamar (Figura 1).
11
12
13
entre 25 e 200 replicaes e que para uma boa estimativa dos limites de confiana seriam
necessrias mais de 500 replicaes (CUNHA & COLOSIMO, 2003).
importante que a reamostragem seja realizada com reposio, sempre selecionando os
valores de forma aleatria. Para a gerao destas reamostras as tcnicas computacionais so de
grande utilidade. O programa Excel realiza estas reamostragens atravs da funo de gerao de
nmeros aleatrios a partir de uma distribuio discreta preestabelecida (distribuio da amostra
mestre) (CYMROT & RIZZO, 2006).
Uma vez geradas as reamostras, deve-se calcular para cada reamostra a estatstica
solicitada no problema. Essa tcnica no altera nenhum valor da amostra mestre, ela apenas
trabalha na anlise da combinao dos valores iniciais com a finalidade de se obter as
concluses desejadas (CYMROT & RIZZO, 2006).
Sobre o processo de reamostragem, SILVA JUNIOR (2005) descreve o seguinte: Seja t
= (t1, t2, ..., tn) uma amostra aleatria contendo n tempos de sobrevivncia disponveis para
anlise, com i = 1 para os tempos exatamente observados e i = 0, para tempos censurados a
direita, (i = 1, 2, ..., n). Logo, o conjunto de dados disponveis dado por T = (t, ). O processo
de reamostragem Bootstrap consiste em reamostrar B amostras T*(1), T*(2), ..., T*(B) ,
independentes e identicamente distribudas (i.i.d.), cada uma de tamanho n. Na terminologia do
procedimento Bootstrap, as B amostras (i.i.d.) construdas a partir da populao finita T = (t, )
corresponde em reamostrar com reposio a partir do conjunto T. Aps a obteno das B
amostras Bootstrap, pode-se obter as estimativas de mxima verossimilhana do parmetro de
interesse, para cada amostra Bootstrap, chegando ao vetor
^*
^*
^*
^*
14
FRV p =
Xp
n
X
p =1
15
IVI i = FIVI ip
p =1
onde IVIi o valor de importncia para a espcie i, IVIip o valor de importncia obtido por
espcie em cada parcela p.
Para o clculo do nmero de parcelas necessrias para a realizao do levantamento
para atingir um erro de amostragem inferior ao erro mximo admissvel, foram consideradas
quatro diferentes propostas, considerando informaes obtidas em uma amostra piloto.
A primeira considera a maior variao no IVI, considerando todas as espcies. A
intensidade amostral calculada de modo que o erro de amostragem para esta espcie seja
inferior ao erro mximo admissvel, assim, o tamanho da amostra garante uma boa
representao de todas as outras espcies.
A segunda proposta considera uma variao mdia, considerando o IVI de todas as
espcies.
n
IVI =
IVI
i =1
onde IVI a mdia aritmtica da mdia dos IVIs de todas as espcies e n o nmero de
espcies.
Neste caso, a varincia calculada com base na formulao a seguir.
S2 =
S
i =1
2
i
A terceira considera uma variao ponderada dos IVIs das espcies. A formulao
utilizada para o clculo do IVI e da varincia so:
16
IVI w =
IVI IVIi
i =1
300
S =
2
w
S
i =1
2
i
IVI i
300
onde IVI w a mdia ponderada dos valores de importncia das espcies e S w2 a mdia
ponderada das varincias das espcies.
Com o valor de varincia obtido em cada uma das propostas acima, foi calculado o
coeficiente de variao e intensidade amostral necessria para o levantamento, considerando
cada caso. Aps o lanamento do restante das parcelas, possvel calcular o erro de amostragem
do levantamento, com base na formulao encontrada em Cochran (1977).
E=
Sx t
100
X
17
o tamanho de amostra suficiente. O detalhamento dos mtodos para diferentes atributos ser
apresentado a seguir.
O intervalo de confiana para um dado tamanho de amostra nk n obtido atravs do
seguinte algoritmo de reamostragem Bootstrap (PILLAR, 2004):
1. Seleciona-se aleatoriamente no pseudo universo amostral uma amostra bootstrap de
tamanho nk com reposio. Sendo a seleo com reposio, a mesma unidade amostral
poder aparecer mais de uma vez na mesma amostra bootstrap.
2. Computa-se na amostra bootstrap o parmetro k* de interesse. O valor resultante
armazenado.
3. Repetem-se os passos 1 e 2 um grande nmero de vezes (indica-se no mnimo 1000
vezes).
4. Ordenam-se os valores de k* do menor ao maior. Determinam-se limites de confiana
para uma especificada probabilidade . Se forem 1000 iteraes e = 0.05, o limite
inferior ser o valor de k* na 25 posio e o limite superior aquele na 976 posio. Na
verdade, nesse caso, somente necessrio armazenar os 25 valores menores e os 25
valores maiores de k* .
5. Pode-se ento afirmar, com uma probabilidade de estar errado, que o valor verdadeiro
do parmetro avaliado encontra-se entre os limites de confiana.
A determinao de intervalos de confiana para uma srie de amostras bootstrap de
tamanho nk n permite examinar a estabilidade da amplitude entre limites superior e inferior. A
Figura 4 mostra outro exemplo e a sua interpretao.
18
Figura 4. Valores mdios de uma varivel X obtidos por reamostragem com reposio de um
conjunto de dados com 60 unidades amostrais. Os tamanhos de amostra variam de 5 a 60. Duas
das muitas seqncias de possveis mdias das amostras so mostradas e A-B. Em C intervalos
de confiana foram definidos com base em 1000 interaes de amostragem para cada tamanho
de amostra. Para ilustrar so mostrados com os limites em C o caso de A.
H diversas tcnicas para o clculo de intervalos de confiana Bootstrap, sendo 2 delas
apresentadas a seguir:
19
SEbootstrap =
^*
1
^* 1
i
i
B 1 B
^*
com i igual ao valor da estatstica para cada reamostra e B igual ao nmero de reamostragens
realizadas. O asterisco usado para diferenciar a estatstica das reamostras da estatstica da
^
amostra original, a qual representada por ( ). Algumas literaturas utilizam no primeiro valor
do denominador, apenas B ao invs de (B 1), pois como o nmero de reamostragens um
valor muito alto, essa alterao acaba ficando praticamente insignificante (RIZZO & CYMROT,
2006).
O intervalo t-Bootstrap s funciona bem quando conhecido que a distribuio
Bootstrap aproximadamente normal e tem pequeno vcio. Para verificar se o intervalo de
confiana t calculado confivel podemos compr-lo com o intervalo de confiana percentil. Se
o vcio for pequeno e a distribuio bootstrap for aproximadamente normal, os dois intervalos
iro apresentar valores muito prximos. O intervalo de confiana t-Bootstrap acaba servindo
mais como prova da suposio de normalidade da distribuio Bootstrap.
Para estimar um intervalo de confiana para uma estimativa , calcula-se o valor destas
^*
^*
estatsticas para cada uma das i reamostras Bootstrap ( i ) e a mdia dessas estimativas .
20
Encontra-se ento, para cada reamostra i, a diferena entre esses valores, isto :
^*
^*
diferena = i
Para uma confiana de 95%, encontram-se os percentils 97,5% e 2,5% destas diferenas
e calcula-se o intervalo de confiana Bootstrap Percentil da seguinte forma:
^
^
21
G K* = 1
S
T
22
a proporo de
)
amostras bootstrap de tamanho nk n permite examinar a estabilidade de P(G G ) . Se para
um dado tamanho de amostra nk a probabilidade P(G G ) no for maior do que um limiar
0
*
0
*
iteraes bootstrap em que G K G K . A determinao de P GK G K para uma srie de
0
K
0
K
*
K
*
K
0
*
probabilidades P GK G K
0
*
tamanho da amostra. Caso contrrio, se P GK G K > , Ho aceita, e duas alternativas so
0
*
possveis: (1) se as probabilidades P GK G K
estveis para tamanhos de amostra maiores do que nk, a amostra suficiente, e a classificao
0
*
ser considerada ntida; (2) se a magnitude de P GK G K
para tamanhos de amostra maiores do que nk, a amostra considerada insuficiente, no sendo
possvel nenhuma concluso a respeito da nitidez da estrutura de grupos.
Exemplos com dados artificiais esto na Figura. 6. Um exemplo com dados
limnolgicos mostrado na Figura. 7.
23
24
25
26
27
28
Yi = 0 + 1 X i + i se X i X 0
Eq. 1
Yi = P + i
Eq. 2
se X i > X 0
Yi = ( 0 + 1 X i )Z i + P(1 Z i )
Eq. 3
Em que:
0 e 1- parmetros a serem estimados na equao da reta;
P- parmetros a serem estimados na equao de Plat;
Y i - varivel dependente;
X i - varivel independente;
Z - varivel Dummy.
O clculo do ponto de juno (X0) dado igualando as duas Equacoes 1 e 2 formando a
Equacao 4.
P = 0 + 1 X 0
X0 =
P 0
Eq.4
29
(Y )
SQT = Y
n
Eq.5
X Y
SQR = 1 X iYi
Eq.6
Eq.7
Amostras
30
freqncia acumulada de espcies crescente a uma taxa constante para acrscimos constantes
de rea amostral deve-se supor a no formao do plat, uma vez que o incremento de espcies
crescente e no forma pontos de estabilidade do crescimento. A formacao desse ponto indica um
"falso" plat, assim chamado, por representar de forma errnea um suposto plat que no
deveria ocorrer, devido a no estabilidade da reta, que apresenta um crescimento constante e
crescente. Isto implica no erro de uma "falsa" suficincia amostral, ao se aplicar a regresso
linear de plat, com um nico sorteio (GOMIDE et al. 2005).
90
ltimoparordenado(6000,80)
Espcies
80
70
60
50
40
30
0
1000
2000
3000
4000
5000
6000
7000
reaamostral
31
X0=4750m
32
33
utiliza o procedimento
S J = s + Q1
n 1
n
onde Sj a riqueza estimada, s a riqueza observada, Qj (no caso acima com j igual a 1) o
nmero de espcies que ocorrem em exatamente j amostras, e n o nmero de amostras
(BARROS, 2007).
SJ = s +
Q1 (2n 3) Q2 (n 2 )
n
n(n 1)
34
JACKKNIFE DE N ORDENS
Os modelos Jackknife de demais ordem podem ser vistos abaixo.
35
6.2 CHAO 1 e 2
De acordo com SANTOS (1999), estes motodo foram desenvolvidos por Chao (1984) a
partir de modelos tericos de estimativa de classes, e adaptados para estimativa de riqueza em
espcies ou de tamanho de populaes. O modelo Chao l utiliza como parmetros a riqueza total
observada e o nmero de espcies "raras" (representadas por apenas 1 indivduo em todas as
amostras) e "duplas" (representadas por 2 indivduos). A mesma equao pode ser adaptada para
utilizar o nmero de espcies que ocorrem respectivamente em uma ou em duas unidades
amostrais (Chao 2). Chao (1987) desenvolveu uma equao para calcular um intervalo de
confiana para as estimativas geradas pelos dois modelos.
S Chao1 = S obs
a2
+
2b
36
250
Espcies
200
150
100
50
0
0
10
15
20
25
30
35
Amostras
Sobs Mean (runs)
Chao 1 Mean
L2
S Chao 2 = S obs +
2M
Onde L o nmero de espcies que ocorrem em somente uma parcela (uniques) e M o nmero
de espcies que ocorrem em exatamente duas parcelas (duplicates).
Diferentes equaes diferentes so usadas para calcular os estimadores de riqueza
Chao1 e Chao2, alm de sua varincia, e os log-lineares correspondentes intervalos de confiana
a 95% de probabilidade. (Maiores informaes em:
http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#Appe
ndixB e tambm em CHAO, A. 1984; 1987; 2005).
CHAO et al. (2009), propem o primeiro mtodo estatstico no paramtrico utilizado
para estimar o nmero mnimo adicional de indivduos, de unidades amostrais ou de rea
amostrada, necessrios a detectar qualquer proporo arbitrria (incluindo 100%) da riqueza de
espcies estimada em um carter assinttico. O mtodo utiliza os estimadores no-paramtricos
de riqueza assinttica, Chao1 e Chao2, que so baseados nas freqncias de espcies raras na
amostragem dos dados originais. Os autores verificaram ao aplicar o mtodo em diferentes
conjuntos de dados que, o esforo amostral adicional necessria para capturar todas as espcies
estimadas variou de 1,05-10,67 vezes a amostra original, com valor mdio de aproximadamente
37
2,23. Por outro lado, menos esforo necessrio para detectar 90% das espcies onde o esforo
amostral adicional variou de 0,33 a 1,10 vezes o esforo inicial, com mdia em torno de 0,80.
Onde Sace = riqueza estimada pelo mtodo ACE, Sabund = nmero de espcies abundantes (com
mais de 10 indivduos em toda a amostra); Srare = nmero de espcies raras (representadas por
menos de 10 indivduos em toda a amostra), Fi = Nmero de espcies que possuem exatamente
i indivduos em todas as amostras sendo (F1 a freqncia de singletons e F2 a freqncia de
doubletons), Cace = estimativa de cobertura da amostra com base em abundncia; ace =
coeficiente de variao das F i de espcies raras.
J o estimador ICE da riqueza de espcies :
Onde Sice = riqueza estimada pelo mtodo ACE, Sfreq = nmero de espcies frequentes
(encontradas em mais de 10 unidades amostrais); S inf r = nmero de espcies raras (encontradas
em 10 unidades amostrais ou menos), Qj = Nmero de espcies que ocorrem exatamente em j
unidades amostrais sendo (Q1 a freqncia de uniques e Q2 a freqncia de duplicates), Cice =
estimativa de cobertura da amostra com base em incidncia; ice = coeficiente de variao do Qj
de espcies raras.
38
Maiores detalhes sobre esses dois procedimentos e suas formulaes podem ser
encontrados em:
(http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#App
endixB).
6.4 BOOTSTRAP
O mtodo Bootstrap foi desenvolvido por Bradley Efron em 1979, e baseia-se no
princpio de que no havendo melhor informao, a distribuio de freqncias na amostra a
melhor indicao da sua distribuio no universo amostral (PILLAR, 2004). O mtodo
Bootstrap estima a riqueza total utilizando dados de todas as espcies, no se restringindo s
espcies raras (BARROS, 2007).
Este mtodo, entretanto, requer o uso de simulao em computador, onde uma amostra
aleatria de tamanho n retirada dos dados obtidos, usando amostragem com ou sem reposio.
A estimativa de riqueza ento calculada pela equao:
S Boot = S obs + (1 pi )
onde
que contm a espcie i. Estes passos devem ser realizados de 100 a 500 vezes no computador
(BARROS, 2007). Na Figura 16 apresentada um exemplo de curva
160
140
120
Espcies
100
80
60
40
20
0
0
10
15
20
25
30
35
Amostras
Sobs (Mao Tau)
Bootstrap Mean
39
foram encontradas 164 espcies, porm os estimadores de riqueza variaram de 197 a 255,
sugerindo que entre 64% e 83% das espcies de abelhas presente no local foram efetivamente
amostradas, conforme verificado na Tabela 3.
Tabela 3- Comparao entre a riqueza de espcies de abelhas efetivamente amostrada e valores
obtidos partir de vrios estimadores no paramtricos. Fonte: KRUG & ALVES-DOS
SANTOS (2008).
Estimador
Bootstrap
Chao 1
Jackknife 1
Michaelis-Menten
Riqueza estimada
197
222
238
255
40
7.1 MICHAELIS-MENTEN
Existem muitas funes curvilneas, assintticas e no assintticas, que poderiam gerar
uma curva de acumulao de espcies (SOBERN & LLORENTE 1993, COLWELL &
CODDINGTON 1994). Como opo de estimativa de riqueza, por meio de uma funo
assinttica, comumente utilizada a funo de Michaelis-Menten. Originalmente desenvolvida
para modelar cintica de enzimas, esta equao permite estimar a assntota a partir de qualquer
ponto da curva, sendo um modelo facilmente ajustvel a diferentes conjuntos de dados
(COLWELL & CODDINGTON, 1994).
Esta equao um exemplo de modelos matemtico que pode ser ajustado curva do
coletor, resultando em diferentes estimativas de riqueza mxima para um mesmo conjunto de
dados, podendo serem geradas curvas mdias obtidas atravs de varias randomizaes
(MMruns) ou curvas geradas a partir de uma randomizao na amostra (MMmeans). Maiores
detalhes podem ser encontrados em:
(http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#App
endixB).
COLWELL et al. (2004) propem um modelo misto binomial para a funo de
acumulao espcies baseada na presena-ausncia (incidncia) de espcies. O modelo baseiase em interpolao e extrapolao, permitindo comparar riquezas partindo-se de diferentes
tamanhos de amostra (rarefao) e extrapolar o nmero de espcies de forma emprica para alm
do tamanho da amostra atravs de um estimador probabilstico com intervalo de confiana
bootstrap.
8 REFERNCIAS BIBLIOGRFICAS
ALBUQUERQUE, M. A. A.; Ferreira, R. L. C.; Silva, J. A. A.; Santos, E. S.; Stosic, B.; Souza,
A. L. (2006) Estabilidade em anlise de agrupamento: estudo de caso em cincia florestal.
Revista rvore, v.30, p. 257-265.
ARRIEL, E. F.; PAULA, R.C.; BAKKE, O. A.; ARRIEL, N.H.C.; SANTOS, D.R. Genetic
variability among Cnidoscolus phyllacanthus (Mart.) Pax & K. Hoffm. Crop Breeding and
Applied Biotechnology, v.5, p.207-214, 2005.
BARROS, R. S. M. Medidas de Diversidade Biolgica. 2007. Programa de Ps Graduao em
Ecologia Universidade Federal de Juiz de Fora. Disponvel em:
41
http://www.ecologia.ufjf.br/admin/upload/File/Estagio_docencia_Ronald.pdf Acessado em
21/11/2009.
BATISTA, C. E. DE A. et al. Variabilidade molecular de acessos de faveleira [Cnidoscolus
phyllacanthus (M. Arg.) Pax & Hoffm.] inermes e com espinhos. Rev. bras. ol. fibros., Campina
Grande, v.11, n.1, p.31-36, jan./abr. 2007
BRAUN-BLANQUET, J. 1932. Plant sociology. McGraw Hill, New York.
CAIN, S.A. & CASTRO, G. M. O. 1959. Manual of vegetation analysis. Harper & Brothers,
New York.
CAIN, S.A. 1938. The species-area curve. The American Midland Naturalist 19:573-581.
CHAO, A. & S.-M Lee. 1992 Estimating the number of classes via sample coverage. Journal of
the American Statistical Association 87, 210-217. Download pdf.
CHAO, A. 1984. Non-parametric estimation of the number of classes in a population.
Scandinavian Journal of Statistics 11, 265-270. Download pdf.
CHAO, A. 1987. Estimating the population size for capture-recapture data with unequal
catchability. Biometrics 43, 783-791. Download pdf.
CHAO, A. 2005. Species richness estimation, Pages 7909-7916 in N. Balakrishnan, C. B. Read,
and B. Vidakovic, eds. Encyclopedia of Statistical Sciences. New York, Wiley. Download pdf.
CHAO, A.; COLWELL, R. K.; CHIH-WEI, L.; GOTELLI, N. J. Sufficient sampling for
asymptotic minimum species richness estimators. Ecology, 90(4), 2009, pp. 11251133.
COCHRAN, W. G. Tcnicas de amostragem. Rio de Janeiro: USAID, 1963. 555p.
COLWELL, R. K. & CODDINGTON, J.A. 1994. Estimating terrestrial biodiversity through
extrapolation. Philosophical Transactions of the Royal Society of London, B 345: 101-118.
COLWELL, R. K., MAO, C. X.; CHANG J. Interpolating, extrapolating, and comparing
incidence-based species accumulation curves. Ecology 85:2717-2727. 2004.
COSTA, G. G. O. Estimativas Bootstrap para o enviesamento, desvio padro e intervalo de
confiana de dengue no estado do Rio de Janeiro. Anais Simpsio de Excelncia em gesto e
tecnologia. 2008.
COSTA, R. F. et al. Estrutura fitossociolgica do componente arbreo de um fragmento de
floresta ombrfila densa na mata sul de Pernambuco, nordeste do Brasil. Cincias Florestais, v.
18, n. 2, abr.-jun., 2008
CUNHA, W. J. & COLOSIMO, E. A. Intervalos de confiana Bootstrap para modelos de
regresso com erros de medida. Revista Brasileira de Matemtica e Estatstica, So Paulo, v.21,
n.2, p.25-41, 2003.
CYMROT, R. & RIZZO, A.L.T. Apliacao da tecnica de reamostragem Bootstrap na
estimao da probabilidade dos alunos serem usurios de transporte pblico. Environmental and
Health World Congress. July 16-19, 2006, Santos, Brasil.
42
43
44
SMITH, E.P. & van Belle, G. 1984. Nonparametric estimation of species richness. Biometrics
40, 119-129.
SOBERN, J. & LLORENTE, J. 1993. The use of species accumulation functions for the
prediction of species richness. Conservation Biology 7, 480-488.
TIVANG, J.G.; NIENHUIS, J.; SMITH, O.S. Estimation of sampling variance of molecular
marker data using bootstrap procedure. Theoretical and Applied Genetics, v.89, p.259- 64,
1994.
45
ANEXO
TUTORIAL
46
NDICE
47
1.1 EstimateS
1.1.1 Instalao
Download: http://viceroy.eeb.uconn.edu/EstimateS
Descompacte o arquivo.
Execute o Setup.
Siga a seqncia: Next Next Next Yes (escolha o local de instalao) Next Next
Close.
48
Click em OK.
49
nparcelas/amostrasnas colunas
nparcelas/amo
nde
nas
50
51
A janela contm a configurao padro para as anlises, elas podem ser alteradas posteriormente
pelos Menus. Click em OK.
Mantenha marcado o Format 1 (nosso arquivo de dados for confeccionado nesse formato), no
necessrio preencher nada, click em OK .
52
Configure de acordo com as opes das 3 figuras abaixo e click em OK. Para rodar a anlise
diretamente caso j importou o arquivo click em Compute.
53
54
Caso aparece a mensagem abaixo quando rodar a anlise v ao Menu Diversity click em
Diversity Settings click na 2 aba (Estimators) e marque a opo Use classic formula for
Chao 1 & Chao 2 click em Compute.
A figura abaixo mostra a tabela de resultados. Para exportar os dados para construo das curvas
click em Export.
55
56
57
58
A curva de acumulao com intervalos de confiana esta pronta. Configure o grfico de acordo
com suas preferncias.
Curva de acumulao de espcies
160
160
140
140
120
120
100
Espcies
100
80
60
80
60
40
40
20
20
0
0
10
15
20
25
30
35
10
15
20
25
30
35
Parcelas
59
Espcies
100
80
60
40
20
0
0
500
1000
1500
2000
2500
3000
Indivduos
60
Exemplo: [Individuals (computed)] x [Shannon Mean] com desvio padro [Shannon SD (runs)]
4.5
4
ndice de Shannon
3.5
3
2.5
2
1.5
1
0
500
1000
1500
2000
2500
3000
Nm ero Indivduos
1.3.4.1 Bootstrap
Para construo da curva do estimador de riqueza Bootstrap juntamente com a curva mdia de
espcies observadas, selecione primeiramente a coluna [Individuals (computed)] OU [Samples],
em seguida as colunas [Sobs Mean (runs)] e [Bootstrap Mean]. Insira o grfico como descrito
nos itens anteriores.
61
160
140
120
Espcies
100
80
60
40
20
0
0
10
15
20
25
30
35
Amostras
Sobs (Mao Tau)
Bootstrap Mean
Para construo da curva do estimador de riqueza Chao 1 (primeira ordem) com os intervalos de
confiana e juntamente com a curva mdia de espcies observadas, selecione primeiramente a
coluna [Individuals (computed)] OU [Samples], em seguida as colunas [Sobs Mean (runs)],
[Chao 1 Mean], [Chao 1 95% CI Lower Bound] e [Chao 1 95% CI Upper Bound]. Utilize a
mesma lgica para o estimador Chao 2 (segunda ordem), porm com as colunas [Chao 2 Mean],
[Chao 2 95% CI Lower Bound] e [Chao 2 95% CI Upper Bound]. Insira o grfico como descrito
nos itens anteriores.
250
Espcies
200
150
100
50
0
0
10
15
20
25
30
35
Amostras
Chao 1 Mean
62
200
180
160
Espcies
140
120
100
80
60
40
20
0
0
10
15
20
25
30
35
Amostras
Sobs Mean (runs)
Jack 2 Mean
Jack 1 Mean
ICE e ACE so estimadores de riqueza com base em cobertura. ICE um estimador de riqueza
de espcies com base em incidncia (matriz de presena e ausncia, 0 ou 1) e ACE baseado
em abundncia (matriz com nmero de indivduos da espcie Xi na amostra Yi).
63
180
160
140
Espcies
120
100
80
60
40
20
0
0
10
15
20
25
30
35
Amostras
Sobs (Mao Tau)
ACE Mean
1.3.4.5 Michaelis-Menten
O EstimateS calcula 2 tipos o [MMRuns Mean] e [MMMeans (1 run)]. Em ambos, os dados que
o programa representar a assntota estimada com base em um, dois, trs ... n amostras. A
diferena que o primeiro mtodo [MMRuns Mean] calcula estimativas de valores para cada
nvel de agrupamento, para cada execuo de randomizao, em seguida, as mdias das
randomizao. O problema que se por acaso na randomizao for selecionado uma amostra
muito rica no inicio h uma grande distoro da estimativa da riqueza no incio da curva (veja
no grfico abaixo).
O segundo mtodo [MMMeans (1 run)] calcula as estimativas para cada amostra apenas uma
vez, com base na curva de acumulao de espcies. As estimativas desse segundo so menos
erradas do que para o primeiro mtodo, sendo, portanto mais recomendado.
64
160
140
Espcies
120
100
80
60
40
20
0
0
10
15
20
25
30
35
Amostras
Sobs (Mao Tau)
MMRuns Mean
MMMeans (1 run)
A curva de acumulao clssica prev apenas uma aleatorizao das parcelas para construo do
grfico. Para isso v ao EstimateS abra o arquivo de dados como descrito nos itens anteriores.
V ao Menu Diversity click em Diversity Settings na aba Randomization marque a
opo Dontt randomize Compute
Obs.: no se esquea posteriormente de reativar as randomizaes para outras anlises.
Exporte e salve os resultados e importe o arquivo para o Excel como descrito nos itens
anteriores.
65
Clssica
Clssica
140
140
120
120
100
Espcies
Espcies
100
80
60
80
60
40
40
20
20
0
0
0
10
15
20
25
30
35
500
1000
1500
2000
2500
3000
Indivduos
Parcelas
Pode-se inserir manualmente uma coluna de rea acumulada (se as amostras forem de mesmo
tamanho) junto base de dados caso deseje uma curva de espcies em funo da rea.
Selecione primeiramente [rea] em seguida a coluna [Sobs Mean (runs)]. Insira o grfico como
descrito nos itens anteriores.
Clssica
140
120
Espcies
100
80
60
40
20
0
0
5000
10000
15000
20000
25000
30000
66
2.1.1 Instalao
Exemplo: Amostra com 30 parcelas de 1000m com total de 2564 indivduos em 128 espcies.
A base de dados deve vir de algum procedimento que gere valores mdios a partir da
aleatorizao das parcelas para composio dos dados (curva de acumulao mdia). Caso
contrrio pode-se formar o chamado falso plat.
Pose utilizar os resultados gerados pelo EstimateS copiando as colunas [Samples], [Individuals
(computed)] e [Sobs Mean (runs)]. A coluna de rea acumulada pode ser inserida manualmente.
67
Abra o SAEG.
Click em Arquivo Click Ativar Arquivo de Dados Existentes.
68
69
70
2.1.4 Resultados
Na janela Resultados Atuais pode ser encontrado todo o procedimento usado para o ajuste da
regresso, estatsticas simples, matriz de correlao, analise de varincia, de regresso, etc.
71
Ao final da janela mostrado o ponto de encontros das retas que no nosso caso representa a
suficincia amostral pelo mtodo de Plat.
Pelo exemplo apresentado, a suficincia amostral dada por 19 parcelas representando 120
espcies. O que significa que 19 parcelas o mnimo de parcelas a serem lanadas de modo a
representar aquela populao.
72
3.1.1 Instalao
Download: http://ecoqua.ecologia.ufrgs.br/ecoqua/software.html
O arquivo pode ser confeccionado em Excel depois exportado para texto (descrito nos itens
anteriores).
Obs.: porm necessrio que o usurio esteja ciente de como variveis esto dispostas no
arquivo (espcies em linha x amostra em colunas ou vice-versa) pois o MULTV perguntar
mais tarde.
73
Obs.: a base de dados deve ser salva DENTRO da pasta junto com os arquivos do software
MULTV.
Execute o MULTIV
Interface do MULTV
PREFERENCES
74
PREFERENCIAS
Alterar preferencias em:
L lingua (mudar para ingles/change to English)
S diagramas de dispersao
D dendrogramas
F formato de resultados
C voltar ao menu principal
Entre opcao: C
Primeiro cole a base de dados na mesma pasta junto aos arquivos do MULTV.
Usaremos como exemplo uma base de dados comporta por 30 parcelas com 128 espcies no
total formada por uma matriz de abundancia (nij nmero de indivduos da espcies i na
parcela j)
75
MENU PRINCIPAL
* N especificar dados ou abrir sessao existente
V atributos descritivos
T transformar dados
R medidas de semelhanca
G especificar grupos de unidades amostrais
D diagramas de dispersao
O ordenacao
C agrupamento (cluster analysis)
P testes de aleatorizacao comparando grupos de unidades amostrais
A testes de aleatorizacao comparando variaveis
* E preferencias
S armazenar sessao
* X sair
------------------------------------------------------------------------------Entre opcao (opcoes validas com *): N
Deseja especificar novos dados (n) ou abrir (a) uma sessao ja existente? n/a N
Entre nome do arquivo com matriz de dados: basedados.txt
Numero de unidades amostrais:
30
76
Entre opcao: 1
Dados ordenados por (as linhas da matriz correspondem a):
(N) unidades amostrais (u1v1,..., u1vp,..., unv1,..., unvp)
(T) variaveis (u1v1,..., unv1,..., u1vp,..., unvp)
Entre opcao: N (vai depender de como foi construdo sua matriz de dados, se as parcelas
estiverem em linha coloque N se as espcies estiverem na linha coloque T)
Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 30 unidades amostrais, 128 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma
Transformacao vetorial: (0)nenhuma
Sessao esta armazenada em arquivo.
------------------------------------------------------------------------------MEDIDAS DE SEMELHANCA
Opcoes:
(1)entre unidades amostrais
(2)entre variaveis
77
78
Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 30 unidades amostrais, 128 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma
Transformacao vetorial: (0)nenhuma
Medida de semelhanca: (3)distancia euclidiana, (1)entre unidades amostrais
Sessao esta armazenada em arquivo.
Metodo de agrupamento:
(1)ligacao simples
(2)ligacao completa
(3)soma de quadrados (Ward)
(4)ligacao media nao-ponderada (UPGMA)
(5)ligacao media ponderada (WPGMA)
(6)fatorial hierarquico (Denimal & Camiz)
(7)soma de quadrados restringido pela topologia
79
Os resultados foram impressos no arquivo Prinda.txt que se encontra na pasta junto com
MULTV.
80
Selecione toda a base de dados e insira o grfico (descrito em itens anteriores). Formate o
grfico de acordo com suas preferncias.
81
3.2.1 Resultado
Avaliao de suficincia amostral e significncia de nveis de partio em grupos
0.3
P(GNull<=G*)
0.25
0.2
0.15
0.1
0.05
0
0
10
15
20
25
30
35
Unidades amostrais
2 grupos:
3 grupos:
4 grupos:
5 grupos:
3.2.2 Interpretao
Considerando um limiar = 0,1 o teste indica que partio em 2 e 3 grupos so ntidas, portanto
significativas a partir de 6 e 11 unidades amostrais, respectivamente. Isso significa que amostras
maiores que 6 e 11 parcelas so suficientes para corretas concluses sobre os agrupamentos
formados com 2 e 3 nveis de partio respectivamente.
82
Nesse exemplo de anlise utilizamos uma base de 42 parcelas com 164 espcies numa matriz de
abundancia com parcelas dispostas em linha. Como importar e confeccionar a base de dados j
foi descrito nos itens anteriores.
Siga o procedimento abaixo aps ter realizado a importao da base de dados e escolhido a
medida de semelhana.
------------------------------------------------------------------------------MENU PRINCIPAL
* N especificar dados ou abrir sessao existente
* V atributos descritivos
* T transformar dados
* R medidas de semelhanca
* G especificar grupos de unidades amostrais
* D diagramas de dispersao
* O ordenacao
* C agrupamento (cluster analysis)
* P testes de aleatorizacao comparando grupos de unidades amostrais
A testes de aleatorizacao comparando variaveis
* E preferencias
* S armazenar sessao
* X sair
------------------------------------------------------------------------------Entre opcao (opcoes validas com *): O
Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 42 unidades amostrais, 164 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma
83
84
85
Selecione toda a base de dados e insira o grfico (descrito em itens anteriores). Formate o
grfico de acordo com suas preferncias.
3.3.1 Resultado
0.6
0.5
0.4
0.3
0.2
0.1
0
0
10
15
20
25
30
35
40
45
Unidades amostrais
Eixo 1
Eixo 2
Eixo 3
3.3.2 Interpretao
Considerando um nvel de significncia = 0,1. Probabilidades acima desse valor indicam que
os eixos de ordenao, no representam tendncias consistentes de variao.
O teste indica que amostras com 11 ou mais unidades amostrais so suficientes para interpretar
como consistentes as tendncias de variao reveladas sobre o eixo 1 da ordenao. Em quanto
86
87