Sei sulla pagina 1di 87

UNIVERSIDADE FEDERAL DE LAVRAS UFLA

DEPARTAMENTO DE CINCIAS FLORESTAIS DCF


PROGRAMA DE PS-GRADUAO EM ENGENHARIA FLORESTAL
DESCRIO E ANLISE DA VEGETAO DCF 559

SUFICINCIA AMOSTRAL EM
LEVANTAMENTOS DE DESCRIO E
ANLISE DA VEGETAO

Antnio Jos da Silva Neto


Gabriel Marcos Vieira Oliveira
Gabryella Morosini Pereira
Isabel Carolina de Lima Guedes
Srgio Teixeira Silva

Lavras, Dezembro de 2009

NDICE

1. INTRODUO ....................................................................................................................... 3
2. AMOSTRAGEM..................................................................................................................... 4
2.1 Procedimentos de amostragem............................................................................................ 4
2.1.1 Amostragem casual simples ......................................................................................... 5
2.1.2 Amostragem sistemtica .............................................................................................. 5
2.2 Mtodos de amostragem...................................................................................................... 5
2.2.1 O conceito de rea mnima........................................................................................... 6
2.2.1 Mtodos para determinar tamanho timo de parcelas.................................................. 7
3. SUFICINCIA AMOSTRAL ................................................................................................ 8
4 AMOSTRAGEM ITERATIVA .............................................................................................. 9
5 MTODOS DE VERIFICAO DA SUFICINCIA AMOSTRAL ............................... 11
5.1 CURVA DO COLETOR................................................................................................... 11
5.2 CURVA DO COLETOR COMBINADA COM MTODO DE REAMOSTRAGEM .... 12
5.3 MTODO BASEADO NA VARINCIA........................................................................ 15
5.4 SUFICINCIA AMOSTRAL AVALIADA COM BASE EM LIMITES DE
CONFIANA ......................................................................................................................... 17
5.5 SUFICINCIA AMOSTRAL EM ANLISE DE AGRUPAMENTOS .......................... 21
5.6 SUFICINCIA AMOSTRAL EM ORDENAO .......................................................... 26
5.7 MODELO SEGMENTADO COM PLAT ..................................................................... 28
6 ESTIMADORES DE RIQUEZA NO PARAMTRICOS .............................................. 33
6.1 JACKKNIFE 1 E JACKKNIFE 2 ..................................................................................... 34
6.2 CHAO 1 e 2....................................................................................................................... 36
6.3 ACE e ICE......................................................................................................................... 38
6.4 BOOTSTRAP ................................................................................................................... 39
7 ESTIMATIVA DA RIQUEZA TOTAL DE ESPCIES POR EXTRAPOLAO
FUNCIONAL......................................................................................................................... 41
7.1 MICHAELIS-MENTEN ................................................................................................... 41
8 REFERNCIAS BIBLIOGRFICAS ................................................................................. 41
9 TUTORIAIS......................................................................................................................Anexo

SUFICINCIA AMOSTRAL EM LEVANTAMENTOS DE DESCRIO E ANLISE


DA VEGETAO
Antnio Jos da Silva Neto, Gabriel Marcos Vieira Oliveira, Gabryella Morosini Pereira, Isabel
Carolina de Lima Guedes, Srgio Teixeira Silva

1. INTRODUO
Um dos principais problemas enfrentados em estudos que objetivam o conhecimento da
diversidade dos ecossistemas florestais nativos a dificuldade de se obter as informaes
necessrias para caracterizao confivel dos mesmos. Uma representao fiel da diversidade de
espcies de uma comunidade s seria atingida atravs do emprego de um levantamento com
enumerao completa dos indivduos, chamado de censo, o que se torna invivel do ponto de
vista econmico e temporal para a grande maioria dos estudos.
Desta forma, o emprego de tcnicas de amostragem, mostra-se como a forma mais
exeqvel para realizao de estudos de descrio e anlise da vegetao. Sendo necessrio,
porm, a verificao da adequao de mtodos e procedimentos amostrais aplicados para que se
possa contemplar a maior parte da variabilidade da comunidade estudada e, desta forma, fazer
inferncias mais precisas sobre a diversidade do local.
O sistema de amostragem o conjunto do mtodo e do procedimento de amostragem. O
primeiro trata do tamanho e da forma das parcelas, enquanto o segundo trata da maneira como
essas sero locadas em campo. Quando o sistema de amostragem definido corretamente, a
representatividade da amostra utilizada em relao populao estudada garantida. A deciso
sobre um mtodo e um procedimento de amostragem deve ser fundamentada nas peculiaridades
da populao alvo e nos objetivos do estudo (REIS et al. 2007).
To importante quanto a definio correta de mtodos e procedimentos amostrais, a
verificao de suficincia amostral. Segundo SANTANA (2001) e GOMIDE (2005), somente
aps a determinao da suficincia amostral pode-se quantificar os vrios ndices de
diversidade, similaridade e a caracterizao florstica da rea de estudo.

Gomide (2005)

menciona ainda que, a deficincia amostral pode levar a interpretaes e concluses


equivocadas da fisionomia estudada, por no contemplar corretamente a populao em estudo.
A riqueza e a diversidade de espcies so diretamente influenciadas pela natureza da
populao e pelo esforo amostral despendido, uma vez que o nmero de espcies aumenta com
o aumento do nmero de indivduos amostrados (BARROS, 2007; COLWELL et al., 2004).
Portanto, necessrio selecionar amostras que sejam representativas do padro da populao.
Para uma amostragem eficiente deve-se conhecer os princpios bsicos dos mtodos e

procedimentos a serem adotados, e ainda, ter uma noo da estrutura da comunidade a ser
estudada.
Diversas tcnicas so aplicadas para a verificao da adequao do tamanho da amostra
utilizada nos mais diferentes estudos, sendo que a forma de utilizao destes, dependente do
objetivo do trabalho e das caractersticas da comunidade objeto. Desta forma, objetiva-se neste
trabalho, apresentar os diferentes mtodos para determinao da suficincia amostral em estudos
de descrio e anlise da vegetao.

2. AMOSTRAGEM
A amostragem utilizada nos estudos da vegetao quando no possvel ou no
conveniente mensurar toda a populao de interesse. Assim, as informaes so obtidas sobre
uma parte desta, isto , para uma amostra, permitindo inferir atributos sobre o seu todo
(COCHRAN, 1963; PILLAR, 2004).
Uma amostra consiste de um conjunto de unidades amostrais ou parcelas, geralmente de
nmero inferior ao nmero total de unidades amostrais cabveis na populao. A amostra o
conjunto sobre o qual se faz observaes quantitativas e, ou qualitativas e deve ser uma
representao fiel do todo (COCHRAN, 1963).
Segundo REIS et al. (2007), a amostragem a maneira economicamente vivel de
quantificar a diversidade de um ambiente. Uma anlise representativa da populao alvo pode
ser obtida quando uma amostra corretamente selecionada e mensurada. Todavia, em qualquer
processo de amostragem tem-se um erro associado que chamado de erro de estimativa ou erro
de amostragem. Este erro ocorre devido ao fato de no se mensurar toda a populao. Outros
erros tambm ocorrem no processo, tais como os erros de medio e os erros sistemticos
(SCOLFORO e MELLO, 2006).

2.1 Procedimentos de amostragem


Dentre os diversos procedimentos de amostragem disponveis em literatura, os mais
utilizados nos estudos de vegetao so a Amostragem Casual Simples e a Amostragem
Sistemtica. O primeiro largamente utilizado, principalmente em pequenas reas, enquanto
que o segundo prefervel em grandes reas, pela facilidade de localizao das parcelas no
campo.

2.1.1 Amostragem casual simples


Neste procedimento no existe restrio casualizao. Todas as parcelas cabveis na
populao possuem a mesma probabilidade de serem sorteadas para a composio da amostra.
A Amostragem Casual Simples (ACS) indicada para estudos em pequenas reas e de
fcil acesso. As parcelas so locadas em campo por sorteio, sem que haja reposio das mesmas.
Apesar da facilidade do procedimento, algumas desvantagens do mesmo so a dificuldade de
localizao das parcelas no campo e o custo elevado quando adotado em grandes reas, ou em
locais de difcil acesso. Isto aumentaria substancialmente o tempo de deslocamento entre
parcelas e tempo de medio das mesmas, fatores diretamente ligados ao custo total do
levantamento (SCOLFORO e MELLO, 2006).

2.1.2 Amostragem sistemtica


Neste procedimento, a casualizao sofre restrio, pois somente a primeira parcela
sorteada. As demais parcelas se distanciam da primeira por um intervalo k definido
previamente.
O procedimento recomendado quando se deseja conhecer o padro espacial das
espcies existentes na rea de estudo, pois em sua maioria, as espcies no apresentam padro
de distribuio aleatrio. O procedimento utilizado tambm quando se trata de levantamentos
em grandes reas e, ou de difcil acesso, por permitir a locao das parcelas de forma menos
complicada quando comparada Amostragem Casual Simples (SCOLFORO e MELLO, 2006).

2.2 Mtodos de amostragem


As parcelas podem ser de diversas formas: faixas, retngulos, quadrados ou circulares.
A extenso do permetro da parcela e a facilidade do seu estabelecimento que influenciam na
escolha da forma a ser utilizada em cada levantamento. Quanto maior o permetro, maiores so
os problemas com rvores limtrofes, dificultando a delimitao da mesma. Para os estudos de
vegetaes nativas, as mais utilizadas so as parcelas em forma de faixas ou as retangulares.
Uma das caractersticas de sistemas ecolgicos a sua variao no-aleatria. Assim,
nessas condies, as medidas comparativas tais como similaridade, dissimilaridade e
diversidade, so fortemente dependentes do tamanho das unidades amostrais. Estimadores
estatsticos tambm sero dependentes do tamanho da unidade amostral, como exemplo, temos
as mudanas no comportamento da varincia em unidades de tamanhos diferentes. Maiores
parcelas tendem a serem menos variveis entre si do que unidades menores.

Sabe-se que quanto menor a varincia, menor o nmero de unidades amostrais


necessrias para uma mesma preciso da estimativa de uma mdia (COCHRAN, 1963). Logo,
se o objetivo estimar a mdia de uma varivel, unidades amostrais maiores e mais
heterogneas internamente permitem atingir suficincia amostral com um menor nmero de
unidades amostrais. Contudo, este fator influenciado pela escala de trabalho e pelo padro
espacial das espcies.
Portanto, se o objetivo da amostragem revelar e interpretar padres de variao, o
procedimento provavelmente o oposto, pois unidades amostrais muito grandes podero
mascarar aspectos importantes da variao no sistema. Portanto, as condies de amostragem
que satisfazem o objetivo de estimar atributos simples podem no coincidir com as que
satisfazem o objetivo de estudar padres (ORLCI e PILLAR, 1989). Se a variao em
sistemas ecolgicos aleatria, o que raramente parece ser o caso em sistemas naturais, os
resultados no sero afetados pelo tamanho e forma das unidades amostrais (PALMER, 1988).
Segundo SCOLFORO E MELLO (2006), podem-se utilizar parcelas em torno de 600
m2 para levantamentos na fisionomia de Cerrado, parcelas de 2000 a 2500 m2 para florestas
tropicais midas, e ainda, a largura das faixas pode variar de 5 a 20 metros. Como o padro de
distribuio das espcies no tende a um aleatrio, quando se trata da pequena escala,
prefervel lanar um maior nmero de parcelas menores do que um pequeno nmero de parcelas
maiores. Isto aumenta a probabilidade de captar espcies com padro de distribuio agregado.
No entanto, a deciso do tamanho, forma e nmero de parcelas a serem lanadas em um
estudo de vegetao, influenciada pela preciso desejada, a variabilidade da floresta e a
quantidade de recursos disponveis para a realizao do levantamento.
Ainda existem os levantamentos sem parcelas, muito utilizados em estudos de
vegetao, como exemplo temos o mtodo da agulha e as transees em linhas. A grande
vantagem dos levantamentos sem a utilizao de parcelas a eficincia na aquisio dos dados e
consequentemente, na reduo dos custos. Contudo, com este tipo de levantamento, no
possvel acompanhar o desenvolvimento da vegetao ao longo do tempo.

2.2.1 O conceito de rea mnima


Segundo PIRES-OBRIEN E OBRIEN (1995), a rea mnima refere-se ao menor
tamanho de unidade amostral que tem a probabilidade de incluir uma certa proporo do total
das espcies de uma populao. No geral, esta proporo estabelecida em torno de 90%.
(MAAREL, 2005). Na Tabela 1, encontram-se alguns valores de rea mnima, para diferentes
tipos de comunidades.
Utiliza-se a curva de frequncia espcie-rea, onde o logaritmo do nmero de espcies
plotado em relao ao logaritmo da rea amostrada, para a determinao da rea mnima. Este

valor obtido pela assntota da curva e tende a incluir 90% do nmero total de espcies
existentes em uma populao.
Segundo CRAWLEY (1991), o conceito de rea mnima mostra idias equivocadas.
Uma delas de que existe um nmero fixo de espcies para cada regio e a outra de que h
relao entre a riqueza de espcies e a rea. O que ainda pode ocorrer, duas comunidades
contendo o mesmo nmero de espcies apresentarem reas mnimas diferentes. Isso acontece
devido ao fato de ter uma diferente diversidade do tipo beta.
Tabela 1. Intervalos de valores de rea mnima (m2) para diferentes tipos de fisionomias.
Tipo de comunidade
rea mnima (m2)
Liquens
1-2
Pastagens
10-25
Floresta tropical seca
400-1000
Floresta tropical mida
4000-10000
Florestas de conferas
200-500
Florestas tropicais (1cm < dimetro < 10cm) 100
Florestas tropicais (dimetro > 10cm)
20000
Fonte: Maarel (2005) e Pires OBrien e OBrien (1995).

2.2.1 Mtodos para determinar tamanho timo de parcelas


O tamanho timo de uma amostra encontrado comparando a preciso desejada com o
custo de se obter a informao. O tamanho timo ser aquele que maximize a preciso,
mantendo o custo constante ou, de forma equivalente, minimize o custo mantendo a preciso
constante (SCHILLING, 2007). A preciso dos levantamentos, geralmente dada pelo
estimador do erro padro da mdia.
Segundo SCOLFORO E MELO (2006), o mtodo da curva espcie-amostra permite
encontrar o tamanho timo de parcelas para o levantamento. Quando acrscimos de 10% na rea
da parcela propiciam acrscimos menores que 10% no nmero de novas espcies definido o
tamanho ideal da parcela.
Outro mtodo o do coeficiente de variao-amostra, onde mensurado o coeficiente
de variao para a caracterstica de interesse em diversos tamanhos de amostra. O tamanho
timo determinado quando houver estabilizao do coeficiente de variao em relao rea
da parcela.
Ainda existe a alternativa de definir o tamanho timo da parcela por meio da eficincia
relativa. Neste caso, utiliza elementos de natureza econmica e o tamanho a ser adotado
comparado com um tamanho de parcela adotado como base, utilizando a formulao a seguir.
Quando E > 1, o procedimento comparado mais eficiente do que aquele tomado como base de
comparao.

E=

S y1 * t1
S y2 * t 2

onde S y1 o erro padro em porcentagem do procedimento adotado como base; S y2 o erro


padro em porcentagem do procedimento a ser comparado; t1 o tempo de medio tomado do
procedimento tomado como base e t2 o tempo de medio do procedimento a ser comparado.

3. SUFICINCIA AMOSTRAL

Segundo SCHILLING E BATISTA (2008) a suficincia amostral um conceito


quantitativo (ou quasi-quantitativo) utilizado em estudos fitossociolgicos para informar se a
amostra utilizada representativa da populao em estudo. A idia de representatividade se
relaciona indicao de que a composio florstica e a densidade de rvores por espcie esto
adequadamente amostradas.
Nas escolas tradicionais de fitossociologia, a suficincia amostral definida como uma
rea mnima que garanta a representatividade do padro da populao alvo (BRAUNBLANQUET 1932; DAUMBENMIRE, 1968). Atualmente, apesar do conceito terico de
suficincia amostral estar ligado composio caracterstica da comunidade, o uso da curva do
coletor como mtodo para determinao da rea mnima no implica numa composio
caracterstica, mas sim num nmero mnimo de espcies presentes na amostra.
PILLAR (2004) refere-se suficincia amostral como um processo de sucessivas
aproximaes tanto para a estimativa de atributos simples quanto para o estudo de padres. A
suficincia amostral o tamanho suficiente de amostra no qual a caracterstica de interesse, seja
simples ou complexa, comea a ter estabilidade, ou seja, quando o fato de agregarem-se novas
unidades amostrais amostra resulta em alteraes relativamente menores no valor do atributo
considerado.
A suficincia amostral pode se basear no somente na estabilizao de curvas de riqueza
de espcies em funo do esforo amostral, mas tambm, pode ser determinada em funo da
estabilizao de outras variveis da populao estudada, como medidas de diversidade.
Qualquer atributo pode ser considerado nessas curvas.
Os mtodos mais utilizados para determinao da suficincia amostral em estudos de
vegetao, normalmente esto apoiados na relao entre o nmero de espcies acumulado e o
esforo amostral desprendido, sendo este ltimo podendo ser expresso em funo do nmero de
parcelas, a rea acumulada das parcelas, pontos amostrais ou o nmero acumulado de
indivduos.

Em estudos de descrio e anlise da vegetao, a curva espcie-rea, tambm chamada


curva do coletor ou de forma mais oportuna, curva de acumulao de espcies, tem sido
utilizada como principal forma de verificao da suficincia amostral. Sendo esta, ligada ao
conceito de rea mnima (HOPKINS, 1957).
Diferentemente dos mtodos aplicados a levantamento florestais que visam estimar
mdia e varincia de variveis continuas de uma populao (volume, rea basal ou dimetro), de
acordo com PILLAR (2004), os mtodos para verificao de suficincia amostral em estudos
ecolgicos no compartilham da soluo proposta por COCHRAN (1963). Este ltimo prope
que o nmero de unidades amostrais necessrios para representar uma populao em
levantamentos cujo objetivo a estimativa de mdias, pode ser dimensionado atravs da
frmula apresentada abaixo, nos casos em que a populao pode ser considerada infinita.

n=

t2 S 2

onde a diferena mnima a ser detectada e t o valor da distribuio de Student para n-1 graus
de liberdade correspondente a uma dada probabilidade. Como t depende de n, o valor de n
encontrado iterativamente.
Entretanto, PILLAR (2004) afirma que esta soluo problemtica para levantamentos
de florestas nativas, pois assume distribuio normal da varivel X e o objetivo da amostragem
pode no ser estimativa de mdias e varincias. Assim, o autor descreve outros mtodos para
determinao de suficincia amostral que utilizam a re-amostragem dentro de uma mesma
amostra como forma de se verificar a estabilidade das estimativas da caracterstica de interesse.
A seguir sero apresentadas algumas das metodologias utilizadas com intuito de
verificar a adequao da amostragem utilizada nos estudos fitossociolgicos.

4 AMOSTRAGEM ITERATIVA

Um processo iterativo aquele que para chegar a um resultado deve ser repetido
diversas vezes, e a cada vez que se repete, gera um resultado parcial que ser usado na etapa
seguinte. Seguindo esta idia, a amostragem iterativa pode tambm ser interpretada como um
processo de sucessivas aproximaes.
Acerca deste processo de amostragem PILLAR (2004) descreve o que segue:

A amostragem iterativa encontra suporte na relao entre preciso e estabilidade.


Quanto mais precisa a estimativa de um atributo, mais estvel ser a medida do atributo obtida
de outras amostras de maior tamanho. Nessa abordagem o estado de um dado atributo obtido a
partir da amostra evolui e atinge estabilidade na medida em que se aumenta o nmero de
unidades amostrais na amostra. O tamanho suficiente de amostra aquele no qual o atributo
simples ou complexo de interesse comea a ter estabilidade, ou seja, quando o fato de agregarse novas unidades amostrais amostra resulta em alteraes relativamente menores no valor do
atributo considerado. Assim, se por um lado o objetivo estimar a mdia de alguma varivel, o
tamanho suficiente da amostra ser aquele em que a mdia da amostra atinge estabilidade.
A estabilidade da amostra percebida pela magnitude relativa da alterao do atributo
de interesse entre passos de amostragem com tamanhos crescentes de amostra n1, n2, ..., nk, ... n,
em que n1 um tamanho inicial de amostra (no primeiro passo de amostragem). O incremento
constante do tamanho de amostra s, que o nmero de unidades amostrais agregadas
amostra a cada um dos passos de amostragem seguintes.
O nmero total de passos de amostragem dado por

nn
t = 1 + int 1
s
nn1
. A escolha de um valor de s
s

Em que, int indica a poro inteira do quociente

pequeno produzir um grande nmero de passos de amostragem e uma curva mais regular do
atributo de interesse.
Ainda de acordo com PILLAR (2004), outra aplicao dessa abordagem, muito usada
em ecologia de comunidades, a curva do coletor, relao entre o nmero de espcies e o
nmero de unidades amostrais. Neste caso o atributo considerado o nmero de espcies e a
anlise da curva (atravs da agregao de novas unidades amostrais sistemtica e contiguamente
s que j esto na amostra) tem o objetivo de indicar a suficincia amostral.
A limitao da utilizao da amostragem iterativa que a ordem na qual as unidades
amostrais so agregadas amostra afeta a percepo de estabilidade da curva. Tambm,
dependendo da preciso requerida, a amostra pode ser suficiente mesmo sem que a curva tenha
atingido estabilidade.

10

5 MTODOS DE VERIFICAO DA SUFICINCIA AMOSTRAL


5.1 CURVA DO COLETOR
A aplicao da amostragem iterativa em ecologia se d pela utilizao da curva do
coletor para a determinao do nmero timo de unidades amostrais, o mtodo consiste em
plotar a evoluo do nmero de espcies amostradas medida que se aumenta o nmero de
unidades amostrais ou o tamanho da amostra, buscando identificar o incio de um padro de
estabilizao da varivel de interesse.
Apesar de ser muito utilizada para determinao da suficincia amostral, o uso deste
mtodo apresenta duas limitaes:

a) Visualizao da assntota
CAIN (1938) afirma que a determinao da suficincia amostral atravs da percepo
do padro de estabilizao, representado pela assntota da curva do coletor, invivel. A
inviabilidade deste mtodo, de acordo com este autor, se deve porque a visualizao da assntota
depende das razes dos eixos usados para a construo da curva. Pois dependendo da relao
entre o comprimento dos eixos x e y o patamar pode ou no ser visualizado. SCHILLING &
BATISTA (2008) afirmam que uma abscissa longa grafada contra uma ordenada curta sempre
resultar na visualizao de um patamar (Figura 1).

Figura 1. Curvas de acumulao de espcies para Floresta Ombrfila Densa, P. E. de Carlos


Botelho. (a) razo x:y de 2:1, (b) razo x:y de 1:2. Fonte: SCHILLING & BATISTA (2008).
Para fugir desta limitao, CAIN (1938) props que a uma determinada taxa de
crescimento para definir o tamanho timo da amostra, independente da razo entre os eixos. O
autor sugere que a amostragem seria adequada quando um aumento de 10% no tamanho da
amostra correspondesse a um aumento de 10% no nmero de espcies.

11

b) Arbitrariedade da ordem de entrada das unidades amostrais na construo da


curva.
Outra limitao do uso da curva do coletor est relacionada arbitrariedade da ordem de
entrada das unidades amostrais na construo da curva. A cada nova ordem de entrada gera-se
uma curva diferente. Como conseqncia disso, qualquer interpretao a respeito da forma da
curva, ou de variaes nessa forma a partir de um padro bsico esperado, invlido se essa
curva tiver sido gerada a partir de uma ordem arbitrria.
MARTINS E SANTOS (1999) observam que o uso da curva espcie-rea para
determinao de suficincia amostral apresenta o problema de essa relao pressupor a
existncia de reas de tamanhos diferentes e independentes entre si. Isso no ocorre quando se
trabalha comunidades amostrais acumuladas, onde a rea total acumulada totalmente
dependente das reas acumuladas anteriormente. Por isso, a ordem de entrada das reas afetar a
forma da curva obtida.
Diante dessas restries, autores como PILLAR (2004); SCHILLING (2007);
SCHILLING & BATISTA (2008); sugerem a utilizao de tcnicas de reamostragem como
Bootstrap para construo de curvas mdias de acumulao de espcie em funo da rea
amostrada. Essa curva mdia resultante bastante distinta da maior parte das observadas em
trabalhos de fitossociologia, pois suave, com curvatura geralmente inferior curva gerada na
ordem de observao dos dados e no apresenta patamares.

5.2 CURVA DO COLETOR COMBINADA COM MTODO DE REAMOSTRAGEM


Considerando-se que qualquer ordem das unidades amostrais arbitrria, a nica forma
apropriada de se construir uma curva do coletor seria obter um grande nmero de curvas a partir
de vrias ordenaes distintas, geradas aleatoriamente, e ento calcular uma curva mdia
(COLEMAN 1982 apud SCHILLING & BATISTA, 2008). Outra vantagem da aleatorizao
da ordem de entrada das unidades amostrais a possibilidade de construir intervalos de
confiana empricos para a curva do coletor (SCHILLING, 2007).
A idia da reamostragem surgiu em meados de 1935, entretanto a aplicao de tais
tcnicas teve que esperar at a chegada de computadores mais rpidos, uma vez que
procedimentos de reamostragem utilizam intensivamente o computador (SILVA JUNIOR,
2005).
De acordo com SCHILLING (2007), mtodos estatsticos como o de Bootstrap por
permutao, podem ser usados para gerar curvas de acumulao de espcies no dependentes da
ordem de entrada dos dados.

12

O mtodo Bootstrap, introduzido por Bradley Efron em 1979, simula reamostragem da


prpria amostra, permitindo avaliar o grau de estabilidade quando combinado a uma
amostragem iterativa.
Este mtodo tenta realizar o que seria desejvel realizar na prtica, se fosse possvel,
que repetir a experincia de amostragem B vezes. Alm disso, o procedimento trata a amostra
observada como se esta representasse exatamente toda a populao (SILVA JUNIOR, 2005). O
mtodo baseia-se no princpio de que no havendo melhor informao, a distribuio de
freqncias na amostra a melhor indicao da sua distribuio no universo amostral (PILLAR,
2004). De acordo com CYMROT & RIZZO (2006), consiste em sortear com reposio, dados
pertencentes a uma amostra retirada anteriormente, denominada amostra mestre, de modo a
formar uma nova amostra.
A reamostragem dos dados da amostra, com reposio, simula a reamostragem do
universo amostral. Cada amostra obtida por reamostragem uma amostra Bootstrap. A amostra
sendo reamostrada define um pseudo universo amostral (PILLAR, 2004). As reamostras desta
amostra mestre representam o que se deve obter quando se retiram muitas amostras da
populao original (CYMROT & RIZZO, 2006).
Inferncias a respeito de um parmetro so baseadas na distribuio amostral de seu
estimador. A tcnica Bootstrap em primeiro lugar, uma maneira de encontrar a distribuio
amostral, pelo menos aproximadamente, a partir de uma nica amostra disponvel. Uma
distribuio amostral est baseada em muitas amostras aleatrias da populao. Entretanto, ao
invs de retirarem-se muitas amostras da populao, cria-se reamostras, com reposio, a partir
de uma nica amostra da populao (SILVA JUNIOR, 2005).
Muitas vezes a distribuio de probabilidade desconhecida. Nesse caso o Bootstrap
muito til, pois uma tcnica que no exige diferentes frmulas para cada problema e pode ser
utilizada em casos gerais, no dependendo da distribuio original do parmetro estudado
(RIZZO & CYMROT, 2006). A reamostragem descarta a distribuio amostral assumida de
uma estatstica e calcula uma distribuio emprica a real distribuio da estatstica ao longo
de centenas ou milhares de amostras (COSTA, 2008).
Para que a aplicao da tcnica resulte em valores confiveis devem ser feitas, a partir
da amostra mestre, centenas ou at milhares de reamostras do mesmo tamanho n.
Segundo Montgomery (2001) citado por RIZZO & CYMROT (2006), o nmero de
reamostragens pode ser estipulado verificando a variao do desvio padro para a estimativa do
parmetro em questo calculado para as reamostras medida que estas so realizadas. No
momento em que esse valor se estabilizar o tamanho da reamostra Bootstrap estar adequado.
Alguns autores discutem os nmeros de replicaes Bootstrap necessrias para uma boa
estimativa do erro-padro e do intervalo de confiana. EFRON E TIBSHIRANI (1993) afirmam
que para obtermos uma boa estimativa do erro-padro atravs do Bootstrap so necessrias

13

entre 25 e 200 replicaes e que para uma boa estimativa dos limites de confiana seriam
necessrias mais de 500 replicaes (CUNHA & COLOSIMO, 2003).
importante que a reamostragem seja realizada com reposio, sempre selecionando os
valores de forma aleatria. Para a gerao destas reamostras as tcnicas computacionais so de
grande utilidade. O programa Excel realiza estas reamostragens atravs da funo de gerao de
nmeros aleatrios a partir de uma distribuio discreta preestabelecida (distribuio da amostra
mestre) (CYMROT & RIZZO, 2006).
Uma vez geradas as reamostras, deve-se calcular para cada reamostra a estatstica
solicitada no problema. Essa tcnica no altera nenhum valor da amostra mestre, ela apenas
trabalha na anlise da combinao dos valores iniciais com a finalidade de se obter as
concluses desejadas (CYMROT & RIZZO, 2006).
Sobre o processo de reamostragem, SILVA JUNIOR (2005) descreve o seguinte: Seja t
= (t1, t2, ..., tn) uma amostra aleatria contendo n tempos de sobrevivncia disponveis para
anlise, com i = 1 para os tempos exatamente observados e i = 0, para tempos censurados a
direita, (i = 1, 2, ..., n). Logo, o conjunto de dados disponveis dado por T = (t, ). O processo
de reamostragem Bootstrap consiste em reamostrar B amostras T*(1), T*(2), ..., T*(B) ,
independentes e identicamente distribudas (i.i.d.), cada uma de tamanho n. Na terminologia do
procedimento Bootstrap, as B amostras (i.i.d.) construdas a partir da populao finita T = (t, )
corresponde em reamostrar com reposio a partir do conjunto T. Aps a obteno das B
amostras Bootstrap, pode-se obter as estimativas de mxima verossimilhana do parmetro de
interesse, para cada amostra Bootstrap, chegando ao vetor

= (1) , (2 ) ,..., (B ) . A partir


^*

^*

^*

^*

^*

do vetor , pode-se obter a distribuio Bootstrap do estimador , que permite construir


intervalos de confiana e tambm testar hipteses a respeito do parmetro .
SCHILLING et al. (2004) utilizaram um conjuntos de dados de diferentes locais para
produzir as matrizes de presena/ausncia de espcies. A partir desses dados foram obtidas as
curvas espcie-rea usuais, que resultam da acumulao das espcies na ordem de coleta dos
dados. Para construir as curvas espcie-rea independentes da ordem de entrada dos dados,
foram feitas permutaes em nvel de unidade amostral gerando 1000 simulaes com ordem
aleatria. Com essas simulaes obtiveram-se as curvas espcie-rea mdias e os intervalos de
confiana empricos, utilizando-se os quantis 2.5 e 97.5% (Figura 2).

14

Figura 2 - Curvas espcie-rea mdias (linha contnua suavizada) e intervalos de confiana de


95% (linhas tracejadas), e curvas usuais, utilizando a ordem de observao dos dados (linha
irregular). Fonte: SCHILLING et al. (2004).
Este mtodo pressupe ocorrncia aleatria das espcies, como as espcies vegetais
tendem a ocorrer de forma agrupada (MAGURRAN, 1988), uma curva mdia gerada por
aleatorizao tender sempre a ter uma curvatura menor do que a da curva observada, obtida
considerando a ordem de coleta dos dados. comum tambm que a curva observada extrapole
os limites do intervalo de confiana emprico gerado pela aleatorizao (SCHILLING, 2007).
Alm disso, quanto maior a discrepncia entre a curva usual e a curva mdia, maior a
evidncia de um efeito estrutural da comunidade vegetal que descaracteriza a premissa de
ocorrncia aleatria das espcies (SCHILLING et al., 2004).
Alm disso, as curvas mdias obtidas por aleatorizao tm seu carter assinttico
enfatizado, tornando-se impossvel observar qualquer tendncia de estabilizao, pois somente
possvel definir um ponto objetivo sobre uma curva assinttica se essa curva apresentar um
ponto de inflexo (SCHILLING, 2007).

5.3 MTODO BASEADO NA VARINCIA


MORAIS E SCHEUDER (1997) propuseram uma metodologia para a avaliao da
suficincia amostral em levantamentos fitossociolgicos, baseado no valor de importncia (IVI).
Para o clculo da preciso, necessrio transformar as variveis de abundncia, rea basal e
frequncia para uma mesma unidade. Este mtodo foi chamado de Valor de Fragmentao
Relativa.

FRV p =

Xp
n
X
p =1
15

Em que: FRVp o valor de fragmentao relativa, Xp o valor do atributo na parcela p e n o


nmero de parcelas.
Devido ao numerador e denominador terem a mesma unidade, elas so eliminadas,
obtendo-se, ento, um valor por parcela relativo. Foram calculados os valores de fragmentao
relativa para a abundncia, dominncia e frequncia. O valor de fragmentao relativa do IVI
foi obtido por meio da soma dos trs anteriores.
Posteriormente, foi calculado um valor relativo de IVI por espcie.

IVI i = FIVI ip
p =1

onde IVIi o valor de importncia para a espcie i, IVIip o valor de importncia obtido por
espcie em cada parcela p.
Para o clculo do nmero de parcelas necessrias para a realizao do levantamento
para atingir um erro de amostragem inferior ao erro mximo admissvel, foram consideradas
quatro diferentes propostas, considerando informaes obtidas em uma amostra piloto.
A primeira considera a maior variao no IVI, considerando todas as espcies. A
intensidade amostral calculada de modo que o erro de amostragem para esta espcie seja
inferior ao erro mximo admissvel, assim, o tamanho da amostra garante uma boa
representao de todas as outras espcies.
A segunda proposta considera uma variao mdia, considerando o IVI de todas as
espcies.
n

IVI =

IVI
i =1

onde IVI a mdia aritmtica da mdia dos IVIs de todas as espcies e n o nmero de
espcies.
Neste caso, a varincia calculada com base na formulao a seguir.

S2 =

S
i =1

2
i

A terceira considera uma variao ponderada dos IVIs das espcies. A formulao
utilizada para o clculo do IVI e da varincia so:

16

IVI w =

IVI IVIi
i =1

300

S =
2
w

S
i =1

2
i

IVI i

300

onde IVI w a mdia ponderada dos valores de importncia das espcies e S w2 a mdia
ponderada das varincias das espcies.
Com o valor de varincia obtido em cada uma das propostas acima, foi calculado o
coeficiente de variao e intensidade amostral necessria para o levantamento, considerando
cada caso. Aps o lanamento do restante das parcelas, possvel calcular o erro de amostragem
do levantamento, com base na formulao encontrada em Cochran (1977).

E=

Sx t
100
X

onde E o erro de amostragem e S x o desvio padro da mdia.

5.4 SUFICINCIA AMOSTRAL AVALIADA COM BASE EM LIMITES DE


CONFIANA
Uma das aplicaes da metodologia Bootstrap obter intervalos de confiana (Figura 3)
confiveis (CYMROT & RIZZO, 2006). O mtodo da suficincia amostral com base em
intervalos de confiana pode ser aplicado a qualquer atributo da amostra para o qual a
suficincia amostral possa ser avaliada pela preciso da estimativa indicada por intervalos de
confiana. Nesta categoria incluem-se atributos tais como a mdia ou a varincia de alguma
varivel, a correlao entre duas variveis, e outros que possam ser derivados a partir dos dados
(PILLAR, 2004).
Atributos adequados ao uso de intervalos de confiana so aqueles cujos valores podem
ser interpretados diretamente, tais como os coeficientes de correlao (se o intervalo inclui zero
ou no um indicativo de significncia), ou que sero comparados entre si diretamente, tais
como mdias (PILLAR, 2004).
O atributo de interesse pode ser simples, como a mdia ou a varincia de alguma
varivel, ou mais complexo como a correlao entre duas variveis, a medida da nitidez da
classificao da amostra em um dado nmero de grupos, ou a medida do estado da ordenao
das unidades amostrais (PILLAR, 1999).
Avalia-se se o atributo de interesse atinge o nvel mnimo de preciso dentro da
amplitude de tamanhos de amostra nk n avaliados; sendo o resultado positivo, conclui-se que

17

o tamanho de amostra suficiente. O detalhamento dos mtodos para diferentes atributos ser
apresentado a seguir.
O intervalo de confiana para um dado tamanho de amostra nk n obtido atravs do
seguinte algoritmo de reamostragem Bootstrap (PILLAR, 2004):
1. Seleciona-se aleatoriamente no pseudo universo amostral uma amostra bootstrap de
tamanho nk com reposio. Sendo a seleo com reposio, a mesma unidade amostral
poder aparecer mais de uma vez na mesma amostra bootstrap.
2. Computa-se na amostra bootstrap o parmetro k* de interesse. O valor resultante
armazenado.
3. Repetem-se os passos 1 e 2 um grande nmero de vezes (indica-se no mnimo 1000
vezes).
4. Ordenam-se os valores de k* do menor ao maior. Determinam-se limites de confiana
para uma especificada probabilidade . Se forem 1000 iteraes e = 0.05, o limite
inferior ser o valor de k* na 25 posio e o limite superior aquele na 976 posio. Na
verdade, nesse caso, somente necessrio armazenar os 25 valores menores e os 25
valores maiores de k* .
5. Pode-se ento afirmar, com uma probabilidade de estar errado, que o valor verdadeiro
do parmetro avaliado encontra-se entre os limites de confiana.
A determinao de intervalos de confiana para uma srie de amostras bootstrap de
tamanho nk n permite examinar a estabilidade da amplitude entre limites superior e inferior. A
Figura 4 mostra outro exemplo e a sua interpretao.

Figura 3. Esquema do procedimento Bootstrap. Fonte: SILVA JUNIOR (2005).

18

Figura 4. Valores mdios de uma varivel X obtidos por reamostragem com reposio de um
conjunto de dados com 60 unidades amostrais. Os tamanhos de amostra variam de 5 a 60. Duas
das muitas seqncias de possveis mdias das amostras so mostradas e A-B. Em C intervalos
de confiana foram definidos com base em 1000 interaes de amostragem para cada tamanho
de amostra. Para ilustrar so mostrados com os limites em C o caso de A.
H diversas tcnicas para o clculo de intervalos de confiana Bootstrap, sendo 2 delas
apresentadas a seguir:

Intervalo de confiana Bootstrap t


Calcula-se o intervalo de confiana Bootstrap t para uma determinada estatstica da
seguinte maneira:

19

IC bootstrap = estatstic a t SE bootstrap

sendo n o tamanho da amostra mestre, t encontrado utilizando-se (n-1) graus de liberdade, N o


nmero de reamostras realizadas e SEbootstrap igual ao desvio padro das estatsticas nas N
reamostras.
O desvio padro da distribuio Bootstrap para a mdia (tambm chamdo de erro
padro) uma medida de variabilidade e calculado da seguinte forma:

SEbootstrap =

^*
1

^* 1

i
i

B 1 B

^*

com i igual ao valor da estatstica para cada reamostra e B igual ao nmero de reamostragens
realizadas. O asterisco usado para diferenciar a estatstica das reamostras da estatstica da
^

amostra original, a qual representada por ( ). Algumas literaturas utilizam no primeiro valor
do denominador, apenas B ao invs de (B 1), pois como o nmero de reamostragens um
valor muito alto, essa alterao acaba ficando praticamente insignificante (RIZZO & CYMROT,
2006).
O intervalo t-Bootstrap s funciona bem quando conhecido que a distribuio
Bootstrap aproximadamente normal e tem pequeno vcio. Para verificar se o intervalo de
confiana t calculado confivel podemos compr-lo com o intervalo de confiana percentil. Se
o vcio for pequeno e a distribuio bootstrap for aproximadamente normal, os dois intervalos
iro apresentar valores muito prximos. O intervalo de confiana t-Bootstrap acaba servindo
mais como prova da suposio de normalidade da distribuio Bootstrap.

Intervalo de confiana Bootstrap percentil


Este intervalo pode ser calculado de duas maneiras. A primeira tcnica de clculo do
intervalo de confiana Bootstrap percentil calculada desta forma:
Para uma confiana (1 )100%, encontra-se o percentil (1 /2)100 % e o percentil
(/2)100% da estatstica nas reamostras [7].
A terceira tcnica de clculo do intervalo de confiana Bootstrap tambm denominada
intervalo de confiana percentil e calculado atravs dos percentis das diferenas dos valores
das estatsticas das reamostras em relao ao valor mdio desta mesma estatstica nas
reamostras (MONTGOMERY & RUNGER, 2003 apud RIZZO & CYMROT, 2006).
^

Para estimar um intervalo de confiana para uma estimativa , calcula-se o valor destas
^*

^*

estatsticas para cada uma das i reamostras Bootstrap ( i ) e a mdia dessas estimativas .

20

Encontra-se ento, para cada reamostra i, a diferena entre esses valores, isto :
^*

^*

diferena = i

Para uma confiana de 95%, encontram-se os percentils 97,5% e 2,5% destas diferenas
e calcula-se o intervalo de confiana Bootstrap Percentil da seguinte forma:
^
^

ICbootstrappercentil = P97 ,5% diferenas; P2,5% diferenas

5.5 SUFICINCIA AMOSTRAL EM ANLISE DE AGRUPAMENTOS


A anlise de agrupamento uma ferramenta til na classificao, quando a descrio dos
objetos multivariada (PILLAR, 1999). A anlise de agrupamento tem por finalidade reunir,
por algum critrio de classificao, as unidades amostrais em grupos, de tal forma que exista
homogeneidade dentro do grupo e heterogeneidade entre grupos (JOHNSON e WICHERN,
1992; CRUZ e REGAZZI, 1994 apud ALBUQUERQUE et al., 2006).
Recentes avanos da cincia da computao permitiram o desenvolvimento de sistemas
interativos de processamentos de dados, com algoritmos rpidos e precisos. Com isso, muitos
pesquisadores esto desenvolvendo metodologias estatsticas, com a finalidade de estudar e
avaliar a estabilidade dos agrupamentos obtidos a partir de matrizes de dissimilaridade. Entre
essas metodologias, destaca-se o procedimento de reamostragem Bootstrap, que pode fornecer
um ponto de equilbrio que permite uma estimativa precisa dos grupos (LAVORANTI, 2003
apud ALBUQUERQUE et al., 2006).
A anlise de agrupamentos aplicada em ecologia objetiva classificar unidades amostrais
(ecossistemas, comunidades, ou indivduos) permitindo simplificar em tipologias a variao
complexa comum em sistemas naturais (PILLAR, 2004). Um problema sempre presente em
anlise de agrupamentos a escolha do nvel de partio, e essa deciso est relacionada
suficincia (PILLAR, 2004).
A Figura 5 mostra um exemplo.

21

Figura 5. Dendrograma de anlise de agrupamentos, obtida pelo mtodo da varincia mnima,


com dados contendo 19 unidades amostrais descritas pela composio de algas (109 espcies).
Dados de Padilha (1997). A anlise utilizou distncias euclidianas calculadas com os dados
transformados por log (x+1). A anlise de agrupamentos oferece vrias possibilidades de
classificao (partio em grupos).
Um dado nvel de classificao (nmero de grupos) ser considerado ntido se os tipos
revelados aparecerem consistentemente quando o levantamento for repetido no mesmo universo
amostral. A reamostragem do universo amostral pode ser simulada atravs de reamostragem
Bootstrap (PILLAR, 2004).
A avaliao de suficincia amostral atravs de reamostragem Bootstrap em anlise de
agrupamentos baseada no mtodo usado para a determinao da significncia de grupos em
anlise de agrupamentos descrito em PILLAR (1999; 2004).
Dados multivariados podem ser representados em um espao geomtrico, abstrato,
multidimensional; neste as variveis so as suas dimenses e as unidades amostrais os pontos no
espao. Quanto mais ntida for a estrutura de grupos no espao abstrato, os grupos revelados por
anlise de agrupamentos de amostras bootstrap sero mais estveis; como conseqncia,
suficincia amostral ser atingida com um tamanho menor de amostra (PILLAR, 2004).
O atributo medido em cada amostra bootstrap de tamanho k para um dado nvel m de partio
em grupos

G K* = 1

S
T

onde T a soma de quadrados total, envolvendo (n + nk)(n + nk 1)/2 dissimilaridades ao


quadrado de n + nk unidades amostrais, sendo n unidades amostrais originalmente do pseudo
universo amostral e nk unidades amostrais da amostra bootstrap. S a soma de quadrados de
contrastes aos pares entre grupos na amostra bootstrap e o grupo mais prximo no pseudo
universo amostral.

22

A determinao de S envolve um processo iterativo de anlise com o objetivo de


encontrar pares exclusivos formados por grupos da amostra bootstrap com grupos do pseudo
universo amostral de forma a minimizar o valor de S. Maior detalhamento do mtodo pode ser
encontrado em PILLAR (1999).
Diferentemente do mtodo em que intervalos de confiana so determinados, aqui o
*
0
valor de G K comparado a G K gerado a cada iterao de bootstrap sob a hiptese nula (Ho)

de que os grupos so ntidos. Se Ho verdadeira, cada grupo encontrado pela anlise de


agrupamentos nas amostras bootstrap ser uma amostra aleatria do grupo correspondente (mais

prximo) no pseudo universo amostral. A probabilidade P G K0 G K*

a proporo de

)
amostras bootstrap de tamanho nk n permite examinar a estabilidade de P(G G ) . Se para
um dado tamanho de amostra nk a probabilidade P(G G ) no for maior do que um limiar
0
*
0
*
iteraes bootstrap em que G K G K . A determinao de P GK G K para uma srie de
0
K

0
K

*
K

*
K

de probabilidade , digamos = 0,05, Ho ser rejeitada e a classificao em m grupos ser


considerada difusa e pouco ntida, logo instvel. Neste caso, de rejeio de Ho, a amostra de
tamanho nk suficiente, pois tamanhos de amostra maiores do que nk tendem a determinar

0
*
probabilidades P GK G K

consistentemente menores do que . Ou seja, as concluses a

respeito da falta de estrutura ntida de grupos nos dados no se alteraram ao se aumentar o

0
*
tamanho da amostra. Caso contrrio, se P GK G K > , Ho aceita, e duas alternativas so

0
*
possveis: (1) se as probabilidades P GK G K

so consistentemente maiores do que e

estveis para tamanhos de amostra maiores do que nk, a amostra suficiente, e a classificao

0
*
ser considerada ntida; (2) se a magnitude de P GK G K

) ainda instvel ou decrescente

para tamanhos de amostra maiores do que nk, a amostra considerada insuficiente, no sendo
possvel nenhuma concluso a respeito da nitidez da estrutura de grupos.
Exemplos com dados artificiais esto na Figura. 6. Um exemplo com dados
limnolgicos mostrado na Figura. 7.

23

Figura 6. Avaliao de suficincia amostral e significncia de nveis de partio em grupos


atravs de probabilidades P(Gk 0 Gk *) em diferentes dados. Probabilidades geradas em 10000
iteraes de reamostragem bootstrap a cada tamanho de amostra. Dados e nvel de partio so
os seguintes: (A) Dados artificiais com 60 unidades amostrais descritas por 60 variveis geradas
por nmeros aleatrios (no h grupos ntidos), nvel de partio 2; (B) Dados artificiais gerados
com 3 grupos bem ntidos, nveis de partio em 3 e 4 grupos. A anlise de agrupamentos pelo
mtodo de varincia mnima. Adaptado de Pillar (1998).
Em relao a Figura 6, os dados em A, sem nenhuma estrutura de grupos, foram
corretamente identificados como tal (adotando um limiar = 0,05) em amostras com 6 ou mais
unidades amostrais. Os dados em B, gerados com uma estrutura ntida de 3 grupos, foram
corretamente identificados como tal em amostras com 8 ou mais unidades amostrais (para um
limiar = 0,05), sendo que amostras menores indicariam 4 grupos ntidos. Adotando-se um
limiar = 0,1, concluses corretas seriam obtidas para amostras com 5 ou mais unidades
amostrais.

24

Figura 7. Avaliao de suficincia amostral e significncia de nveis de partio em grupos


atravs de probabilidades P(Gk0 Gk *) geradas por reamostragem bootstrap (Pillar 1999). Os
dados (Padilha 1997) foram obtidos em 19 unidades amostrais descritas pela composio de
algas (109 espcies). Probabilidades foram geradas em 10000 iteraes de reamostragem a cada
tamanho de amostra. Os grupos foram obtidos por anlise de agrupamentos pelo mtodo de
varincia mnima; a Fig. 8 mostra dendrograma obtido com as 19 unidades amostrais.
Em relao a Figura 7, considerando um limiar = 0,1, o teste indica que parties em
2 e 3 grupos so ntidas, enquanto parties em 4 grupos ou mais (estes no mostrados) so
difusas. Porm, as curvas para 2 ou 3 grupos ainda so levemente decrescentes at 19 unidades
amostrais, indicando que a amostra com 19 unidades amostrais insuficiente para concluses
definitivas a respeito da nitidez dos grupos nesses nveis de partio. A curva para 4 grupos
tambm levemente decrescente at 19 unidades amostrais, mas a concluso de que os grupos
so difusos no se alterar se a curva continuar decrescendo com tamanhos maiores de amostra.
BATISTA et al. (2007) estudando variabilidade molecular de acessos de faveleira
Cnidoscolus phyllacanthus (M. Arg.) Pax & Hoffm., com e sem espinhos, utilizou anlises
bootstrap para verificar se o nmero de marcadores polimrficos obtidos foi suficiente para
fornecer estimativas precisas das similaridades genticas (TIVANG et al., 1994). A consistncia
dos agrupamentos do dendrograma foi avaliada por 2000 reamostragens com repetio
(FELSENSTEIN, 1985). A anlise bootstrap revelou que os agrupamentos so pouco
consistentes. A maior percentagem de vezes que um agrupamento se repetiu nos 2000
dendrogramas gerados pela anlise foi 76%, valor relativamente baixo Uma provvel razo para
o baixo valor da probabilidade bootstrap, que representa uma pequena robustez dos
agrupamentos, pode ser a existncia de elevado fluxo gnico entre as populaes de faveleira
usadas neste estudo, fato favorecido pela alogamia da espcie (ARRIEL et al., 2005).

25

Figura 8 - Dendrograma dos gentipos de faveleira baseado nas similaridades segundo o


coeficiente de Jaccard e UPGMA. Valores esquerda do agrupamento representam a
percentagem de vezes que o agrupamento apareceu nas 2000 repeties bootstrap.
Agrupamentos sem a percentagem apresentaram percentagens inferiores a 50%. A primeira letra
de cada acesso corresponde aos diferentes locais de coleta, a segunda letra corresponde a
presena e a ausncia de espinhos (E: com espinhos; S: sem espinhos).
5.6 SUFICINCIA AMOSTRAL EM ORDENAO
Os mtodos de ordenao permitem obter uma sntese da variao observada em um
espao geomtrico, abstrato, multidimensional, no qual dados ecolgicos podem ser
representados (PILLAR, 2004).

Uma representao dessa variao no espao pode ser

visualizada em diagramas de disperso como na Figura 9 a seguir.

26

Figura 9. Diagrama de disperso obtido por ordenao de 19 unidades amostrais. Os dados


(Padilha 1997) foram obtidos em 19 unidades amostrais descritas pela composio de algas (109
espcies). Os pontos so as unidades amostrais; os eixos foram obtidos por anlise de
coordenadas principais a partir de distncias euclidianas calculadas com os dados transformados
por log (x+1). Os dois eixos contm 28,1 + 14,4 = 42,5% da varincia total. Os taxons cuja
variao est mais correlacionada com o eixo 1 so as seguintes: Sphaerocystis sp. (r = -0.89),
Cymbella sp. (r = -0.88), Hyaloraphidium sp. (r = -0.85), Rhizosolenia sp. (r = -0.85),
Micrasterias sp. (r = -0.85) e Stenopterobia sp. (r = -0.82). Com o eixo 2 esto mais
correlacionados os seguintes taxons: Scenedesmus sp. (r = -0.80), Eunotia sp. (r= -0.79),
Radiococcus sp. (r = -0.79) e Kirchneriella sp. (r = -0.78).
Mediante o diagrama mostrado acima, qual a probabilidade de que essas tendncias de
variao observadas se mantenham ao se repetir o levantamento no mesmo universo amostral?
Qual a probabilidade de que tendncias de variao observadas atravs da ordenao de dados
obtidos de um levantamento se mantenham ao se repetir o levantamento no mesmo universo
amostral?
A questo est vinculada significncia dos eixos de ordenao, mas somente poder
ser respondida se a amostra for suficiente, entretanto, a reamostragem bootstrap pode ser
utilizada neste caso como forma de verificao da significncia dos eixos de ordenao,
conforme verificado em (Stauffer et al. 1985, Knox & Peet 1989, Jackson 1993) apud PILLAR
(2004).
PILLAR (1999) descreve o mtodo baseado em reamostragem bootstrap para avaliar a
significncia de eixos de ordenao. O procedimento inicia-se pela aplicao do mtodo de
ordenao ao pseudo universo amostral, armazenando-se os escores das unidades amostrais
como escores de referncia. A seguir, para cada tamanho k de amostra, o seguinte procedimento
seguido e repetido um grande nmero de vezes (iteraes): tomada uma amostra bootstrap
de tamanho nk a qual submetida ao mtodo de ordenao. Os escores de ordenao da amostra
bootstrap para um dado nmero de eixos da ordenao so armazenados em uma matriz Xk*, e
os escores das unidades amostrais que esto na amostra bootstrap, mas extrados dos escores de

27

referncia, so armazenados em uma matriz Xk. Um ajuste Procrusteano (Schnemann &


Carroll 1970) apud Pillar (1999), envolvendo os primeiros i eixos da ordenao torna os escores
das duas ordenaes comparveis; tal ajuste envolve rotao, translao e dilatao do
subespao de ordenao na amostra bootstrap, de tal forma a maximizar o ajuste com a
ordenao do pseudo universo amostral. Os escores no eixo de ordenao i em Xk* e Xk so
comparados pelo coeficiente de correlao ki * = r(xki*, xki).
Quanto mais alta a correlao, melhor a concordncia entre os escores bootstrap e de
referncia, e mais estvel so as tendncias de variao observadas na ordenao da amostra de
tamanho k. A cada iterao a correlao ki * comparada a uma correlao ki 0 gerada sob a
hiptese nula de que os dados no tm estrutura. Ou seja, as matrizes Xk* e Xk so agora obtidas
atravs de reamostragem bootstrap dos dados observados com as observaes permutadas
aleatoriamente dentro de variveis. Se ki 0 ki * , o algoritmo soma 1 freqncia acumulada
F(ki 0 ki * ). Aps B iteraes bootstrap, a probabilidade P(ki 0 ki * ) a proporo F(ki 0 ki
* )/B. Mais detalhes do mtodo podero ser encontrados em PILLAR (1999).

5.7 MODELO SEGMENTADO COM PLAT


A sua introduo do mtodo no Brasil se deu na rea de Cincia dos Solos, com o autor
Braga em 1983 ao desenvolver um ensaio sobre fertilidade do solo (Gomide et al. 2005).
O primeiro trabalhos com o objetivo de determinar a suficincia amostral em
levantamentos florsticos foi realizado por Ferreira em 1988 com seu trabalho sobre a anlise
estrutural da vegetao da estao florestal de experimentao de Au-RN, como subsdio
bsico para o manejo florestal. Segundo esse autor a utilizao desta metodologia de extrema
facilidade para a avaliao de amostragens florsticas, uma vez que minimiza o erro de
estimao por meio dos mnimos quadrados e permite a retirada da subjetividade observada em
outros mtodos (SILVA, 2007).
A partir de ento diversos trabalhos foram desenvolvidos com essa mesma finalidade,
como por exemplo, Silva et al. (2007), Costa et al. (2008), Gama et al. (2001), Gomide et al.
(2005), REIS et al. (2007).
Em levantamentos florsticos, segundo REIS et al. (2007), este procedimento permite
determinar a rea mnima de amostragem, para a representao florstica das reas.
O modelo plat de resposta linear descreve dois segmentos uma reta crescente ou
decrescente (dependendo do valor de 1 da Equao 1), at uma determinada altura P que o
plat. A partir desse ponto, o valor Yi assume um valor constante P, que o segundo segmento
(FERREIRA, 2005). O modelo plat de resposta linear dado pelas Equaes 1 e 2.

28

Yi = 0 + 1 X i + i se X i X 0

Eq. 1

Yi = P + i

Eq. 2

se X i > X 0

Em que Yi a varivel dependente (resposta); 0 o intercepto do modelo linear


simples do segmento anterior ao Plat; 1 o coeficiente angular neste mesmo segmento; ei o
erro associado i-sima observao; P o Plat e X0 o ponto de juno dos dois segmentos
(PARANABA, 2007).
Segundo FERREIRA (2005), o uso de uma varivel binria Dummy (Equao 3)
empregado para unir os dois modelos representados pelas Equaes 1 e 2. O mecanismo que
aciona cada modelo em funo de Z. Logo, para o valor de Z = 1, ou seja (X < X0), o modelo
linear ativado. Com o valor de Z = 0, isto (X > X0) o modelo de plat acionado.

Yi = ( 0 + 1 X i )Z i + P(1 Z i )

Eq. 3

Em que:
0 e 1- parmetros a serem estimados na equao da reta;
P- parmetros a serem estimados na equao de Plat;
Y i - varivel dependente;
X i - varivel independente;
Z - varivel Dummy.
O clculo do ponto de juno (X0) dado igualando as duas Equacoes 1 e 2 formando a
Equacao 4.

P = 0 + 1 X 0

X0 =

P 0

Eq.4

No processo de ajuste, a base de dados rearranjada em vrios conjuntos de dados,


comeando por 2 e n-2 dados, respectivamente, at n-1 e 1, em que realiza-se uma srie de
ajustes de regresso at a definio do ponto de plat, sendo n o nmero de unidades
amostrais (Alvarez, 1985 citado por Gomide et al. 2005).
Segundo FERREIRA (2005) a anlise de varincia montada para o modelo linear,
calculando-se a Soma de Quadrado Total (SQT), Soma de Quadrado da Regresso (SQR) e a
Soma de Quadrado do Desvio (SQD) a partir das Equaes 5; 6; e 7.

29

(Y )
SQT = Y
n

Eq.5

X Y
SQR = 1 X iYi

Eq.6

SQD = SQT SQR

Eq.7

Em que: Y.e X. definidos anteriormente.


Para o modelo de Plat, apenas a SQT calculada, devido a inexistncia do parmetro
1. Entretanto esta soma de quadrado considerada como a SQD. Isto ocorre devido ao plat,
apresentar um comportamento constante, aps o ponto X0. Logo, a SQT a mesma que a SQD,
para plat. E selecionado as equaes (reta e plat) que apresentarem a menor SQD para o
conjunto de dados. Em que a Soma de Quadrado do Desvio da combinao composta pelo
somatrio das SQD (reta) e SQT (plat) (FERREIRA 2005).
A Figura 10 mostra a aplicao do modelo a uma curva de espcies acumuladas.

Amostras

Figura 10 Regresso linear de Plat aplicado a curva de acumulao de espcies. (Fonte:


Gama et al. 2001)
A unio das retas gerada pelo modelo linear, em conjunto com a regresso de plat,
expressa a suficincia amostral. Assim, deste ponto (X0) em diante, a amostragem se faz
suficiente, no havendo mais necessidade de lanar novas unidades amostrais (GOMIDE et al.
2005).
O emprego de tcnicas como a regresso linear de Plat uma alternativa vivel, para
se encontrar a suficincia amostral, porm deve-se utilizar com critrios. Em alguns pontos
pode-se chegar at a uma falsa suficincia. O surgimento de um possvel "falso" plat, aparece
na posio do ltimo par ordenado observado (Figura 11). Para uma situao em que o a

30

freqncia acumulada de espcies crescente a uma taxa constante para acrscimos constantes
de rea amostral deve-se supor a no formao do plat, uma vez que o incremento de espcies
crescente e no forma pontos de estabilidade do crescimento. A formacao desse ponto indica um
"falso" plat, assim chamado, por representar de forma errnea um suposto plat que no
deveria ocorrer, devido a no estabilidade da reta, que apresenta um crescimento constante e
crescente. Isto implica no erro de uma "falsa" suficincia amostral, ao se aplicar a regresso
linear de plat, com um nico sorteio (GOMIDE et al. 2005).

90

ltimoparordenado(6000,80)

Espcies

80

70

60
50

40

30
0

1000

2000

3000

4000

5000

6000

7000

reaamostral

Figura 11 Representao do falso plat.


Porm GOMIDE et al. (2005) prope uma nova abordagem para o uso do mtodo da
regresso linear de plat baseado no teorema do limite central que dificulta a formao do falso
plat.
O teorema considera que se uma varivel qualquer, com uma distribuio muito diferente
da normal (pode at mesmo ser discreta), poder se tornar uma curva normal, desde que desta
populao seja sorteado um grande nmero de amostras (Bussab 1988, citado por GOMIDE et al.
2005) (Figura 12). O princpio desta teoria parte da aleatorizao de unidades amostrais, em que
novas combinaes amostrais so geradas provenientes da amostragem original.

Figura 12 representao do teorema do limite central. (Fonte: Gomide et al., 2005)

31

Para realizar o ajuste da regresso e calcular a suficincia amostral, as amostras so


sorteadas aleatoriamente (mnimo 30 vezes). Em cada sorteio, calculava-se a freqncia
acumulada desta combinao. No final dos sorteios, extrai-se a mdia da frequencia acumulada e
calcula-se ainda a rea acumulada referente s unidades do levantamento florestal. A partir deste
ponto aplicava-se a regressao linear de plat, obtendo-se seus parmetros e o ponto de encontro
entre as duas regresses (Figura 13).

X0=4750m

Figura 13 Comportamento da amostragem, indicando o ponto de suficincia amostral (X0),


aps o encontro da equao linear com a de plat. (Fonte: Gomide et al., 2005)
Uma vez que a maioria das espcies recorrentes de determinado ambiente foi amostrada
e se atingiu a suficincia amostral, o comportamento da curva de freqncia acumulada, para
qualquer fisionomia, tende ao comportamento quase assinttico, ou seja, o aumento da rea
amostral reproduz ganhos de espcies continuamente, at o completo levantamento (censo) da
riqueza total de espcie da rea. Contudo, aps a formao do plat, o aumento de informaes
de espcie/parcela reduzido e economicamente desinteressante (Gomide et al., 2005).
Runho et al. (2001) citado por Rezende et al. (2007) afirmam que o ajuste de dados pelo
modelo linear com plat em proporciona bom ajuste estatstico, mas freqentemente subestima
o valor timo.
A grande maioria dos trabalhos encontrados na literatura, que utilizam o mtodo de
regresso linear com plat para determinao da suficincia amostral em levantamentos
florsticos, utilizam o software SAEG Sistema para Anlise Estatstica e Gentica para a
realizao do ajuste do modelo.
Existem diversos outros modelos matemticos que podem ser segmentados com Plat,
como por exemplo, modelos polinomiais quadrticos, exponenciais e at no-lineares, mas
exigem softwares mais sofisticados para executar os ajustes (veja Rezende et al. 2007).

32

6 ESTIMADORES DE RIQUEZA NO PARAMTRICOS


Ecologicamente informaes significativas podem ser obtidas a partir dos dados do
inventrio, incluindo a riqueza de espcies de rvores. No entanto, a estimativa do nmero total
de espcies baseada na amostra notoriamente difcil (LAM e KLEINN, 2008).
O conceito de diversidade envolve dois parmetros: riqueza e abundncia relativa
(PIANKA 1994). Riqueza a quantidade de espcies e abundncia relativa a quantidade de
indivduos de determinada espcie que ocorre em um local ou em uma amostra (PIANKA,
1994; MORENO, 2001 apud DIAS, 2004). Os estimadores de riqueza fornecem a quantidade de
espcies que se pode encontrar em uma rea, sem levar em conta a quantidade de indivduos por
espcie (abundncia). H uma tendncia, nos dias de hoje, de se estimar somente a riqueza de
animais ou vegetais em uma rea. Segundo algumas propostas ecolgicas, o que realmente
importa em um estudo conservacionista o clculo da quantidade observada (riqueza) e da
quantidade de espcies que pode ser potencialmente descoberta e, portanto, preservada
(SANTOS, 2003 apud DIAS, 2004). Alguns estimadores de riqueza comumente utilizados so
apresentados Tabela 2.
Tabela 2 - Alguns estimadores de riqueza e seus pressupostos.

Fonte: DIAS (2004)

33

6.1 JACKKNIFE 1 E JACKKNIFE 2


Estes mtodos foram desenvolvidos originalmente para estimativa de tamanho
populacional baseado em marcao e recaptura (Burham & Overton, 1979) apud SANTOS
(1999). Os mtodos de estimativas baseados em equaes de Jackknife diferem em alguns
parmetros. Enquanto o Jackknife de primeira ordem (Jackknife l) calcula a riqueza mxima a
partir da relao entre o nmero de espcies que ocorrem em apenas uma amostra e o esforo
amostrai total, o Jackknife de segunda ordem (Jackknife 2), usa, alm destes parmetros, o
nmero de espcies que ocorrem em duas amostras (Palmer, 1991; Smith & van Belle, 1984). O
mtodo Jackknife permite o clculo de intervalo de confiana e

utiliza o procedimento

bootstrap baseando-se na variao da ordem de amostra entre randomizaes. (Maiores detalhes


em:
http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#Appe
ndixB e Heltshe, J. & Forrester, N. E. 1983).

JACKKNIFE 1 (primeira ordem)


O Mtodo Jackknife 1 estima a riqueza total utilizando o nmero de espcies que
ocorrem em apenas uma amostra (uniques). A estimativa de riqueza calculada pela equao:

S J = s + Q1

n 1
n

onde Sj a riqueza estimada, s a riqueza observada, Qj (no caso acima com j igual a 1) o
nmero de espcies que ocorrem em exatamente j amostras, e n o nmero de amostras
(BARROS, 2007).

JACKKNIFE 2 (segunda ordem)


J o Jackknife 2 utiliza os uniques e o nmero de indivduos que ocorrem em duas
amostras (duplicates), e calculado pela equao (BARROS, 2007):

SJ = s +

Q1 (2n 3) Q2 (n 2 )

n
n(n 1)

onde Sj a riqueza estimada, s a riqueza observada, Q1 o nmero de espcies que ocorrem


em exatamente 1 amostra, Q2 o nmero de espcies que ocorrem em exatamente 2 amostras e n
o nmero de amostras. Na Figura 14 so apresentadas as curvas de riqueza geradas para os
mtodos Jack 1 e 2 obtidas no software EstimateS.

34

JACKKNIFE DE N ORDENS
Os modelos Jackknife de demais ordem podem ser vistos abaixo.

LAM e KLEINN (2008) estudando o comportamento dos estimadores Jackknife para


estimativa de riqueza espcies arbreas em inventrio em grandes reas de floresta chegou a
uma constatao importante a falha de dos estimadores de 4 e 5 ordem. As estimativas so
quase idnticas e at mesmo inferiores ao nmero de espcies observado. Alm disso,
estimadores de ordem superior mostram uma grande variao da estimativa. Os de 1 e 2
ordem tem pequena variao e, portanto, so mais confiveis do que os de ordem superior
(Figura 14). O fracasso dos estimadores Jackknife de ordem superior sugere que no so
adequados para o problema da estimativa de riqueza de espcies.
Alm de que, o mesmo autor observou que nenhum dos estimadores Jackknife
independente da ordem atinge uma assntota e a maioria tem erros padro crescente com o
tamanho da amostra.
Embora apresentem um vis questionvel que pode tambm invalidar os de 1 e 2
ordem, seus comportamentos sugerem que eles so recomendveis para a estimativa. Portanto, o
cuidado deve ser em relao a interpretao das estimativa de riqueza de espcies Jackknife
LAM e KLEINN (2008).

Figura 14 Curva de acumulao de espcies observadas e estimadores de riqueza de espcies


Jackknife (a). E erro padro das estimativas para cada Jackknife respectivamente (b).

35

6.2 CHAO 1 e 2
De acordo com SANTOS (1999), estes motodo foram desenvolvidos por Chao (1984) a
partir de modelos tericos de estimativa de classes, e adaptados para estimativa de riqueza em
espcies ou de tamanho de populaes. O modelo Chao l utiliza como parmetros a riqueza total
observada e o nmero de espcies "raras" (representadas por apenas 1 indivduo em todas as
amostras) e "duplas" (representadas por 2 indivduos). A mesma equao pode ser adaptada para
utilizar o nmero de espcies que ocorrem respectivamente em uma ou em duas unidades
amostrais (Chao 2). Chao (1987) desenvolveu uma equao para calcular um intervalo de
confiana para as estimativas geradas pelos dois modelos.

CHAO 1(Primeira ordem)


Conforme dito anteriormente, o mtodo Chao 1 estima a riqueza total utilizando o
nmero de espcies representadas por apenas um indivduo nas amostras (singletons), e o
nmero de espcies com apenas dois indivduos nas amostras (doubletons) (BARROS, 2007). A
estimativa de riqueza calculada pela equao:

S Chao1 = S obs

a2
+
2b

Onde S obs o nmero observado de espcies na amostra, a o nmero de espcies com


somente um indivduo presente na amostra (singletons) e b o nmero de espcies com
exatamente dois indivduos presentes na amostra (doubletons). Na figura 15 mostrada a curva
mdia bem como o intervalo de confiana gerado por este mtodo Chao 1.

36

250

Espcies

200

150

100

50

0
0

10

15

20

25

30

35

Amostras
Sobs Mean (runs)

Chao 1 Mean

Chao 1 95% CI Lower Bound

Chao 1 95% CI Upper Bound

Figura 15 - Curvas de estimativa de riqueza e intervalo de confiana obtidos a partir do mtodo


Cho 1.
CHAO 2 (Segunda ordem)
O estimador Chao 2 anlogo ao Chao 1, porm considera a distribuio de espcies
nas parcelas que compem a amostra (SCHILLING, 2007). O Chao 2 uma adaptao que
utiliza os uniques e os duplicates.

L2
S Chao 2 = S obs +
2M

Onde L o nmero de espcies que ocorrem em somente uma parcela (uniques) e M o nmero
de espcies que ocorrem em exatamente duas parcelas (duplicates).
Diferentes equaes diferentes so usadas para calcular os estimadores de riqueza
Chao1 e Chao2, alm de sua varincia, e os log-lineares correspondentes intervalos de confiana
a 95% de probabilidade. (Maiores informaes em:
http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#Appe
ndixB e tambm em CHAO, A. 1984; 1987; 2005).
CHAO et al. (2009), propem o primeiro mtodo estatstico no paramtrico utilizado
para estimar o nmero mnimo adicional de indivduos, de unidades amostrais ou de rea
amostrada, necessrios a detectar qualquer proporo arbitrria (incluindo 100%) da riqueza de
espcies estimada em um carter assinttico. O mtodo utiliza os estimadores no-paramtricos
de riqueza assinttica, Chao1 e Chao2, que so baseados nas freqncias de espcies raras na
amostragem dos dados originais. Os autores verificaram ao aplicar o mtodo em diferentes
conjuntos de dados que, o esforo amostral adicional necessria para capturar todas as espcies
estimadas variou de 1,05-10,67 vezes a amostra original, com valor mdio de aproximadamente

37

2,23. Por outro lado, menos esforo necessrio para detectar 90% das espcies onde o esforo
amostral adicional variou de 0,33 a 1,10 vezes o esforo inicial, com mdia em torno de 0,80.

6.3 ACE e ICE


Estes dois mtodos foram desenvolvidos por CHAO & LEE (1992), baseando-se no
conceito estatstico de "cobertura de amostra" (sample coverage), que estima o nmero de
espcies no coletadas a partir da abundncia proporcional das espcies coletadas. A aplicao
deste conceito tem como premissa que a abundncia relativa de cada espcie na amostra
correponde sua abundncia relativa real. O primeiro modelo (ACE - Abundance Based
Estimator) trabalha com a abundncia das espcies raras (de 1 a 10 indivduos), enquanto que o
segundo (ICE - Incidence Based Estimator) requer o nmero de espcies que ocorrem em
poucas unidades amostrais (de 1 a 10 unidades).
As estimativas e intervalos de confiana so calculadas com as equaes originais de
CHAO & LEE (1992), incluindo as modificaes sugeridas por COLLWELL &
CODDINGTON (1994).
O estimador ACE da riqueza de espcies :

Onde Sace = riqueza estimada pelo mtodo ACE, Sabund = nmero de espcies abundantes (com
mais de 10 indivduos em toda a amostra); Srare = nmero de espcies raras (representadas por
menos de 10 indivduos em toda a amostra), Fi = Nmero de espcies que possuem exatamente
i indivduos em todas as amostras sendo (F1 a freqncia de singletons e F2 a freqncia de
doubletons), Cace = estimativa de cobertura da amostra com base em abundncia; ace =
coeficiente de variao das F i de espcies raras.
J o estimador ICE da riqueza de espcies :

Onde Sice = riqueza estimada pelo mtodo ACE, Sfreq = nmero de espcies frequentes
(encontradas em mais de 10 unidades amostrais); S inf r = nmero de espcies raras (encontradas
em 10 unidades amostrais ou menos), Qj = Nmero de espcies que ocorrem exatamente em j
unidades amostrais sendo (Q1 a freqncia de uniques e Q2 a freqncia de duplicates), Cice =
estimativa de cobertura da amostra com base em incidncia; ice = coeficiente de variao do Qj
de espcies raras.

38

Maiores detalhes sobre esses dois procedimentos e suas formulaes podem ser
encontrados em:
(http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#App
endixB).

6.4 BOOTSTRAP
O mtodo Bootstrap foi desenvolvido por Bradley Efron em 1979, e baseia-se no
princpio de que no havendo melhor informao, a distribuio de freqncias na amostra a
melhor indicao da sua distribuio no universo amostral (PILLAR, 2004). O mtodo
Bootstrap estima a riqueza total utilizando dados de todas as espcies, no se restringindo s
espcies raras (BARROS, 2007).
Este mtodo, entretanto, requer o uso de simulao em computador, onde uma amostra
aleatria de tamanho n retirada dos dados obtidos, usando amostragem com ou sem reposio.
A estimativa de riqueza ento calculada pela equao:

S Boot = S obs + (1 pi )

onde

S Boot a riqueza estimada, S obs a riqueza observada, e p a proporo das amostras n


i

que contm a espcie i. Estes passos devem ser realizados de 100 a 500 vezes no computador
(BARROS, 2007). Na Figura 16 apresentada um exemplo de curva

160
140
120

Espcies

100
80
60
40
20
0
0

10

15

20

25

30

35

Amostras
Sobs (Mao Tau)

Bootstrap Mean

Figura 16 - Curva de estimativa de riqueza obtida a partir do mtodo Bootstrap.


KRUG & ALVES-DOS-SANTOS (2008) estudando a fauna de abelhas em Floresta
Ombrfila Mista, em Santa Catarina, analisaram a suficincia amostral atravs dos seguintes
estimadores de riqueza: Chao1, Jacknife1, Bootstrap e Michaelis-Menten. Em sua amostragem

39

foram encontradas 164 espcies, porm os estimadores de riqueza variaram de 197 a 255,
sugerindo que entre 64% e 83% das espcies de abelhas presente no local foram efetivamente
amostradas, conforme verificado na Tabela 3.
Tabela 3- Comparao entre a riqueza de espcies de abelhas efetivamente amostrada e valores
obtidos partir de vrios estimadores no paramtricos. Fonte: KRUG & ALVES-DOS
SANTOS (2008).
Estimador
Bootstrap
Chao 1
Jackknife 1
Michaelis-Menten

Riqueza estimada
197
222
238
255

Porcentagem de fauna amostrada


83
73
68
64

Na Figura 17 so apresentadas diferentes curvas obtidas da aplicao desses


estimadores no meso trabalho, bem como a curva do coletor da amostra utilizada.

Figura 17- Estimadores de riqueza no paramtricos utilizados com os dados de riqueza da


comunidade de abelhas estudada e curva de acumulao das espcies de abelhas ao longo de
treze coletas em Porto Unio, SC, entre outubro/2005 e outubro/2006. Fonte: KRUG &
ALVES-DOS SANTOS (2008).
Note a grande variao existente entre as riquezas estimadas por cada mtodo. Segundo
os autores apesar dos mtodos indicarem que 64 83% das espcies de abelhas terem sido
efetivamente amostradas, as curvas desses estimadores tambm no se estabilizaram, indicando
que essa percentagem pode ser ainda menor.

40

7 ESTIMATIVA DA RIQUEZA TOTAL DE ESPCIES POR EXTRAPOLAO


FUNCIONAL

7.1 MICHAELIS-MENTEN
Existem muitas funes curvilneas, assintticas e no assintticas, que poderiam gerar
uma curva de acumulao de espcies (SOBERN & LLORENTE 1993, COLWELL &
CODDINGTON 1994). Como opo de estimativa de riqueza, por meio de uma funo
assinttica, comumente utilizada a funo de Michaelis-Menten. Originalmente desenvolvida
para modelar cintica de enzimas, esta equao permite estimar a assntota a partir de qualquer
ponto da curva, sendo um modelo facilmente ajustvel a diferentes conjuntos de dados
(COLWELL & CODDINGTON, 1994).
Esta equao um exemplo de modelos matemtico que pode ser ajustado curva do
coletor, resultando em diferentes estimativas de riqueza mxima para um mesmo conjunto de
dados, podendo serem geradas curvas mdias obtidas atravs de varias randomizaes
(MMruns) ou curvas geradas a partir de uma randomizao na amostra (MMmeans). Maiores
detalhes podem ser encontrados em:
(http://viceroy.eeb.uconn.edu/EstimateSPages/EstSUsersGuide/EstimateSUsersGuide.htm#App
endixB).
COLWELL et al. (2004) propem um modelo misto binomial para a funo de
acumulao espcies baseada na presena-ausncia (incidncia) de espcies. O modelo baseiase em interpolao e extrapolao, permitindo comparar riquezas partindo-se de diferentes
tamanhos de amostra (rarefao) e extrapolar o nmero de espcies de forma emprica para alm
do tamanho da amostra atravs de um estimador probabilstico com intervalo de confiana
bootstrap.

8 REFERNCIAS BIBLIOGRFICAS

ALBUQUERQUE, M. A. A.; Ferreira, R. L. C.; Silva, J. A. A.; Santos, E. S.; Stosic, B.; Souza,
A. L. (2006) Estabilidade em anlise de agrupamento: estudo de caso em cincia florestal.
Revista rvore, v.30, p. 257-265.
ARRIEL, E. F.; PAULA, R.C.; BAKKE, O. A.; ARRIEL, N.H.C.; SANTOS, D.R. Genetic
variability among Cnidoscolus phyllacanthus (Mart.) Pax & K. Hoffm. Crop Breeding and
Applied Biotechnology, v.5, p.207-214, 2005.
BARROS, R. S. M. Medidas de Diversidade Biolgica. 2007. Programa de Ps Graduao em
Ecologia Universidade Federal de Juiz de Fora. Disponvel em:

41

http://www.ecologia.ufjf.br/admin/upload/File/Estagio_docencia_Ronald.pdf Acessado em
21/11/2009.
BATISTA, C. E. DE A. et al. Variabilidade molecular de acessos de faveleira [Cnidoscolus
phyllacanthus (M. Arg.) Pax & Hoffm.] inermes e com espinhos. Rev. bras. ol. fibros., Campina
Grande, v.11, n.1, p.31-36, jan./abr. 2007
BRAUN-BLANQUET, J. 1932. Plant sociology. McGraw Hill, New York.
CAIN, S.A. & CASTRO, G. M. O. 1959. Manual of vegetation analysis. Harper & Brothers,
New York.
CAIN, S.A. 1938. The species-area curve. The American Midland Naturalist 19:573-581.
CHAO, A. & S.-M Lee. 1992 Estimating the number of classes via sample coverage. Journal of
the American Statistical Association 87, 210-217. Download pdf.
CHAO, A. 1984. Non-parametric estimation of the number of classes in a population.
Scandinavian Journal of Statistics 11, 265-270. Download pdf.
CHAO, A. 1987. Estimating the population size for capture-recapture data with unequal
catchability. Biometrics 43, 783-791. Download pdf.
CHAO, A. 2005. Species richness estimation, Pages 7909-7916 in N. Balakrishnan, C. B. Read,
and B. Vidakovic, eds. Encyclopedia of Statistical Sciences. New York, Wiley. Download pdf.
CHAO, A.; COLWELL, R. K.; CHIH-WEI, L.; GOTELLI, N. J. Sufficient sampling for
asymptotic minimum species richness estimators. Ecology, 90(4), 2009, pp. 11251133.
COCHRAN, W. G. Tcnicas de amostragem. Rio de Janeiro: USAID, 1963. 555p.
COLWELL, R. K. & CODDINGTON, J.A. 1994. Estimating terrestrial biodiversity through
extrapolation. Philosophical Transactions of the Royal Society of London, B 345: 101-118.
COLWELL, R. K., MAO, C. X.; CHANG J. Interpolating, extrapolating, and comparing
incidence-based species accumulation curves. Ecology 85:2717-2727. 2004.
COSTA, G. G. O. Estimativas Bootstrap para o enviesamento, desvio padro e intervalo de
confiana de dengue no estado do Rio de Janeiro. Anais Simpsio de Excelncia em gesto e
tecnologia. 2008.
COSTA, R. F. et al. Estrutura fitossociolgica do componente arbreo de um fragmento de
floresta ombrfila densa na mata sul de Pernambuco, nordeste do Brasil. Cincias Florestais, v.
18, n. 2, abr.-jun., 2008
CUNHA, W. J. & COLOSIMO, E. A. Intervalos de confiana Bootstrap para modelos de
regresso com erros de medida. Revista Brasileira de Matemtica e Estatstica, So Paulo, v.21,
n.2, p.25-41, 2003.
CYMROT, R. & RIZZO, A.L.T. Apliacao da tecnica de reamostragem Bootstrap na
estimao da probabilidade dos alunos serem usurios de transporte pblico. Environmental and
Health World Congress. July 16-19, 2006, Santos, Brasil.

42

DAUBENMIRE, R. 1968. Plant communities. Harper & Row, New York.


DIAS, S. C. Planejando estudos de diversidade e riqueza: uma abordagem para estudantes de
graduao. Acta Scientiarum. Biological Sciences Maring, v. 26, no. 4, p. 373-379, 2004.
FELSENSTEIN, J. Confidence limits on phylogenies: An approach using the bootstrap.
Evolution, v.39, p.783-791, 1985.
FERREIRA, D. F. Uso de Recursos Computacionais Lavras, 2005
GAMA, J. R. V. et al. Tamanho de parcela e suficincia amostral para estudo da regenerao
natural em floresta de vrzea na Amaznia. Cerne, V.7, N.2, P.001-011, 2001.
GLEASON, H.A. 1922. On the relation between species and area. Ecology 3:158-162.
GLEASON, H.A. 1925. Species and area. Ecology 6:66-74.
GOMIDE, L. R.; SCOLFORO, J. R. S.; THIERSCH, C. R.; OLIVEIRA, A. D. Uma nova
abordagem para definio da suficincia amostral em fragmentos florestais nativos. Cerne,
Lavras, v. 11, n. 4, p. 376-388, out./dez. 2005.
HELTSHE, J. & Forrester, N.E. 1983. Estimating species richness using the jackknife
procedure. Biometrics 39, 1-11.
HILL, J. L., CURRAN, P. J. & FOODY, G.M. 1994. The effect of sampling on the species-area
curve. Global Ecology and Biogeography Letters 4:97-106.
KRUG, C. & ALVES-DOS-SANTOS, I. O Uso de Diferentes Mtodos para Amostragem da
Fauna de Abelhas (Hymenoptera: Apoidea), um Estudo em Floresta Ombrfila Mista em Santa
Catarina. Neotropical Entomology 37(3): 265-278 (2008).
LAM, T. Y., KLEINN C. Estimation of tree species richness from large area forest inventory
data: Evaluation and comparison of jackknife estimators. Forest Ecology and Management,
255 (2008), 10021010.
MAAREL, E. van der (Ed.) Vegetation Ecology. Blackwell Publishing, 2005.
MARTINS, F. R. & SANTOS, F. A. M. 1999. Tcnicas usuais de estimativa da
biodiversidade. Holos 1:236-267.
MUELLER-DOMBOIS, D. & ELLEMBERG, H. 1974. Aims and methods of vegetation
analysis. Wiley, New York.
PALMER, M.W. 1991. Estimating species richness: The second-order jackknife reconsidered.
Ecology 72, 1512-1513.
PARANAIBA, P. F. Proposio e avaliao de mtodos para estimar o tamanho de
parcelas experimentais. Tese (Mestrado) Universidade Federal de Lavras, Lavras, MG. 2007.
63 p..
PIANKA, E.R. Evolutionary Ecology. 5. ed. New York: HarperCollins, 1994.

43

PILLAR, V. D. 2004. Suficincia amostral. In Amostragem em Limnologia (C.E.M. Bicudo


& D.C. Bicudo, eds.). Editora Rima, So Carlos, p.25-43.
PILLAR, V. D. The bootstrapped ordination re-examined. Journal of Vegetation Science 10:
895-902, 1999.
PIRES OBRIEN, M. J.; OBRIEN, C. M. Vegetao e comunidades. IN: Ecologia e
modelamento de florestas tropicais. Belm: FCAP. Servio de documentao e informao,
Cap. 4, p. 147-222, 1995.
REIS, H,; SCOLFORO, J,R,S,; OLIVEIRA, A,D,; OLIVEIRA-FILHO, A,; MELO, J, M,
Anlise da composio florstica, diversidade e similaridade de fragmentos de mata atlntica
em Minas Gerais, Revista Cerne, Lavras, v, 13, n, 3, p, 280-290, 2007.
REZENDE, D. M. L. C., et al. Ajuste de modelos de plat de resposta para a exigncia de zinco
em frangos de corte. Cinc. agrotec., Lavras, v. 31, n. 2, p. 468-478, mar./abr., 2007
RIZZO, A.L.T. & CYMROT, R. Utilizao da tcnica de reamostragem bootstrap em aplicao
na engenharia de produo. Anais X Encontro Latino Americano de Iniciao Cientifica e VI
Encontro Latino Americano de Ps-Graduao Universidade do Vale do Paraba. 2006.
SANTANA, C. A. A. Estrutura e florstica de fragmentos de florestas secundrias de encosta no
Municpio do Rio de Janeiro. 2001. 133 f. Dissertao (Mestrado) Universidade Federal Rural
do Rio de Janeiro, Seropdica, 2001.
SANTOS, A. J. 1999. Diversidade e composio em espcies de aranhas da Reserva Florestal
da Companhia Vale do Rio Doce (Linhares - ES). Dissertao de mestrado. UNICAMP,
Campinas-SP, 105 p.
SCHEINER, S. M. Six types of species-area curves. Global Ecology & Biogeography (2003)
12, 441 447.
SCHILLING, A.C. & BATISTA, J.L.F. Curva de acumulao de espcies e suficincia amostral
em florestas tropicais. Revista Brasileira Botnica, v.31, n.1, p.179-187, jan.-mar. 2008.
SCHILLING, A.C. Amostragem da diversidade de espcies arbreas em florestas tropicais:
padres e limitaes de algumas medidas. Tese de doutorado Universidade de So Paulo.
Piracicaba, 2007.
SCHILLING, A.C.; BATISTA, J. L.; TALORA, D.C. Algumas implicaes do uso de bootstrap
na construo de intervalos de confiana empricos para a curva espcie rea. Anais 49 Reunio
da Regio Brasileira da Sociedade Internacional de Biometria. 2004, p.460-464.
SCOLFORO, J. R. S.; MELLO, J. M. Inventrio florestal. Lavras: UFLA/FAEPE, 2006. 561p.
SILVA JUNIOR, W.V. Probabilidade de cobertura dos intervalos de confiana assintotico, pBootstrap e t-Bootstrap, para alguns parmetros da distribuio weibull. Monografia de
concluso de curso Universidade Estadual de Maring, Maring, 2005.
SILVA, W. C. et al. Estudo Da Regenerao Natural de Espcies Arbreas em Fragmento de
Floresta Ombrfila Densa, Mata das Galinhas, no Municpio de Catende, Zona da Mata Sul de
Pernambuco. Cincia Florestal, Santa Maria, v. 17, n. 4, p. 321-331, out-dez, 2007.

44

SMITH, E.P. & van Belle, G. 1984. Nonparametric estimation of species richness. Biometrics
40, 119-129.
SOBERN, J. & LLORENTE, J. 1993. The use of species accumulation functions for the
prediction of species richness. Conservation Biology 7, 480-488.
TIVANG, J.G.; NIENHUIS, J.; SMITH, O.S. Estimation of sampling variance of molecular
marker data using bootstrap procedure. Theoretical and Applied Genetics, v.89, p.259- 64,
1994.

45

ANEXO

TUTORIAL

46

NDICE

1 Construo de curvas de acumulao de espcies.................................................................... 48


1.1 EstimateS........................................................................................................................... 48
1.1.1 Instalao.................................................................................................................... 48
1.1.2 Iniciando o EstimateS pela primeira vez.................................................................... 48
1.1.3 Construo da base de dados...................................................................................... 50
1.1.4 Importando a base de dados para o EstimateS ........................................................... 51
1.1.5 Configuraes para as anlises de diversidade........................................................... 53
1.1.6 Executando e exportando a anlise ............................................................................ 54
1.2 Importando os resultados para o Excel.............................................................................. 56
1.3 Construo das curvas....................................................................................................... 58
1.3.1 Curva de Rarefao com base em amostras (Curva de acumulao de espcies) ...... 58
1.3.2 Curva de rarefao com base em indivduos (Coleman)............................................ 59
1.3.3 Curvas utilizando ndices de diversidade ................................................................... 60
1.3.4 Curvas utilizando estimadores no-paramtricos de riqueza ..................................... 61
1.3.4.1 Bootstrap ............................................................................................................ 61
1.3.4.2 Chao 1 e Chao 2 ................................................................................................. 62
1.3.4.3 Jackknife 1 e Jackknife 2 ................................................................................... 63
1.3.4.4 ACE e ICE.......................................................................................................... 63
1.3.4.5 Michaelis-Menten .............................................................................................. 64
1.3.4.6 Curva de acumulao de espcies clssica......................................................... 65
2 Suficincia amostral pela Regresso linear com Plat ............................................................. 67
2.1 Software SAEG ................................................................................................................. 67
2.1.1 Instalao.................................................................................................................... 67
2.1.2 Base de dados ............................................................................................................. 67
2.1.3 Executando a anlise .................................................................................................. 68
2.1.4 Resultados .................................................................................................................. 71
3 Suficincia amostral em anlise de agrupamentos e ordenao............................................... 73
3.1 Software MULTIV............................................................................................................ 73
3.1.1 Instalao.................................................................................................................... 73
3.1.2 Base de dados ............................................................................................................. 73
3.1.3 Utilizando pela primeira vez ...................................................................................... 74
3.1.4 Importar uma base de dados....................................................................................... 75
3.2 Suficincia amostral com base em agrupamentos ............................................................. 79
3.2.1 Resultado.................................................................................................................... 82
3.2.2 Interpretao............................................................................................................... 82
3.3 Suficincia amostral com base em ordenao ................................................................... 83
3.3.1 Resultado.................................................................................................................... 86
3.3.2 Interpretao............................................................................................................... 86

47

1 Construo de curvas de acumulao de espcies

1.1 EstimateS

1.1.1 Instalao

Download: http://viceroy.eeb.uconn.edu/EstimateS
Descompacte o arquivo.
Execute o Setup.
Siga a seqncia: Next Next Next Yes (escolha o local de instalao) Next Next
Close.

1.1.2 Iniciando o EstimateS pela primeira vez

Abra o programa: Iniciar Programas EstimateS Win 8.20 EstimateSWin820.


Click em New.

Escolha o arquivo Statistics e click em Salvar.

48

Se perguntar click em Sim para substituir o arquivo.

Click em OK.

Caso aparea a janela a seguir. V em Opes Regionais e de Idiomas do seu computador


(Painel de Controle) e altere para Ingls (Estados Unidos).

49

1.1.3 Construo da base de dados

Confeco do arquivo no Excel 2003.

nparcelas/amostrasnas colunas
nparcelas/amo
nde
nas

Avaliao de suficincia amostral e signifi

O EstimateS l exclusivamente no formato texto (.txt) separado por tabulaes.

Depois de confeccionado o arquivo v ao Menu Arquivo Salvar como.


Escolha o tipo Texto (separado por tabulaes).
De um nome ao arquivo (evite nomes extensos e espaos) e click Salvar .

50

(obs.: caso seja o Excel 2007: click no smbolo da Microsoft (


formatos Escolha o tipo Texto (separado por tabulaes)).

) Salvar como Outros

Aspecto do arquivo no Bloco de notas.

1.1.4 Importando a base de dados para o EstimateS

Acesse File Load Data Input File.

51

Localize seu arquivo e click em Abrir.

A janela contm a configurao padro para as anlises, elas podem ser alteradas posteriormente
pelos Menus. Click em OK.

Mantenha marcado o Format 1 (nosso arquivo de dados for confeccionado nesse formato), no
necessrio preencher nada, click em OK .

52

Verifique se o arquivo foi importado corretamente e click em OK.

1.1.5 Configuraes para as anlises de diversidade

V ao Menu Diversity click em Diversity Settings.

Configure de acordo com as opes das 3 figuras abaixo e click em OK. Para rodar a anlise
diretamente caso j importou o arquivo click em Compute.

53

1.1.6 Executando e exportando a anlise

Para rodar a anlise v ao Menu Diversity click em Compute Diversity Stats.

Click em OK para sobrescrever anlises passadas.

54

Caso aparece a mensagem abaixo quando rodar a anlise v ao Menu Diversity click em
Diversity Settings click na 2 aba (Estimators) e marque a opo Use classic formula for
Chao 1 & Chao 2 click em Compute.

A figura abaixo mostra a tabela de resultados. Para exportar os dados para construo das curvas
click em Export.

55

Escolha o local, nomeie o arquivo e click em Salvar.

1.2 Importando os resultados para o Excel

V ao Menu Arquivo Abrir Altere o tipo do arquivo para Todos os arquivos.


Localize o arquivo salvo anteriormente e click em Abrir.

Na janela do Assistente de importao de texto click em Concluir. O formato que se encontra o


arquivo permite importao direta.

56

O aspecto da base de dados aps importao

Salve uma copia no formato do Excel (.xls ou .xlsx)


Menu Arquivo Salvar como Altere o tipo para Pasta de Trabalho do Microsoft Office
Excel click em Salvar.

57

1.3 Construo das curvas

1.3.1 Curva de Rarefao com base em amostras (Curva de acumulao de espcies)

Na base de dados selecione primeiramente toda a coluna [Sample] e em seguida mantendo


CONTROL (Ctrl) pressionado selecione as colunas [Sobs (Mao Tau)], [Sobs 95% CI Lower
Bound] e [Sobs 95% CI Upper Bound].

V ao Menu Inserir Grfico.


Escolha o tipo Disperso (XY) subtipo Disperso com pontos de dados conectados por linhas
suaves Concluir.

58

A curva de acumulao com intervalos de confiana esta pronta. Configure o grfico de acordo
com suas preferncias.
Curva de acumulao de espcies

160

160
140

140
120

120
100

Espcies

100
80
60

80
60

40

40

20

20

0
0

Sobs (Mao Tau)

10

15

20

Sobs 95% CI Low er Bound

25

30

35

Sobs 95% CI Upper Bound

10

15

20

25

30

35

Parcelas

1.3.2 Curva de rarefao com base em indivduos (Coleman)

Na base de dados selecione primeiramente toda a coluna [Individuals (computed)] e em seguida


mantendo CONTROL (Ctrl) pressionado selecione a coluna [Cole Rarefaction]

Siga o mesmo procedimento anterior para inserir o grfico.

59

Rarefao baseado em indivduos


140
120

Espcies

100
80
60
40
20
0
0

500

1000

1500

2000

2500

3000

Indivduos

1.3.3 Curvas utilizando ndices de diversidade

O EstimateS calcula o ndice de diversidade alpha de Fisher, o ndice de diversidade Shannon


(usando logaritimo natural), o ndice de diversidade exponencial de Shannon e o ndice de
diversidade de Simpson.

Para construo do grfico selecione primeiramente a coluna [Individuals (computed)] OU


[Samples] e em seguida a coluna com o ndice de seu interesse, [Alpha Mean], [Shannon Mean],
[Shannon Exponential Mean] OU [Simpson Mean].

Obs.: Pode se adicionar o desvio padro curva.


Depois de construdo o grfico click sobre a curva no grfico com o boto direito do mouse em
seguida Formatar Srie de Dados. Na aba Barra de erros Y click em Ambas na opo Exibir e
em Personalizar na opo Erro. Nas opes + e localize e selecione a coluna correspondente
ao desvio padro do respectivo ndice [... SD (runs)] e click em OK.

60

Exemplo: [Individuals (computed)] x [Shannon Mean] com desvio padro [Shannon SD (runs)]

4.5
4

ndice de Shannon

3.5
3

2.5
2
1.5
1
0

500

1000

1500

2000

2500

3000

Nm ero Indivduos

1.3.4 Curvas utilizando estimadores no-paramtricos de riqueza

1.3.4.1 Bootstrap

Para construo da curva do estimador de riqueza Bootstrap juntamente com a curva mdia de
espcies observadas, selecione primeiramente a coluna [Individuals (computed)] OU [Samples],
em seguida as colunas [Sobs Mean (runs)] e [Bootstrap Mean]. Insira o grfico como descrito
nos itens anteriores.

61

160
140
120

Espcies

100
80
60
40
20
0
0

10

15

20

25

30

35

Amostras
Sobs (Mao Tau)

Bootstrap Mean

1.3.4.2 Chao 1 e Chao 2

Para construo da curva do estimador de riqueza Chao 1 (primeira ordem) com os intervalos de
confiana e juntamente com a curva mdia de espcies observadas, selecione primeiramente a
coluna [Individuals (computed)] OU [Samples], em seguida as colunas [Sobs Mean (runs)],
[Chao 1 Mean], [Chao 1 95% CI Lower Bound] e [Chao 1 95% CI Upper Bound]. Utilize a
mesma lgica para o estimador Chao 2 (segunda ordem), porm com as colunas [Chao 2 Mean],
[Chao 2 95% CI Lower Bound] e [Chao 2 95% CI Upper Bound]. Insira o grfico como descrito
nos itens anteriores.

250

Espcies

200

150

100

50

0
0

10

15

20

25

30

35

Amostras

Sobs Mean (runs)

Chao 1 Mean

Chao 1 95% CI Lower Bound

Chao 1 95% CI Upper Bound

62

1.3.4.3 Jackknife 1 e Jackknife 2

Para construo da curva do estimador de riqueza Jackknife 1 e Jackknife 2 juntamente com a


curva mdia de espcies observadas, selecione primeiramente a coluna [Individuals (computed)]
OU [Samples], em seguida as colunas [Sobs Mean (runs)], [Jack 1 Mean] e [Jack 2 Mean].
Insira o grfico como descrito nos itens anteriores.

200
180
160

Espcies

140
120
100
80
60
40
20
0
0

10

15

20

25

30

35

Amostras
Sobs Mean (runs)

Jack 2 Mean

Jack 1 Mean

1.3.4.4 ACE e ICE

ICE e ACE so estimadores de riqueza com base em cobertura. ICE um estimador de riqueza
de espcies com base em incidncia (matriz de presena e ausncia, 0 ou 1) e ACE baseado
em abundncia (matriz com nmero de indivduos da espcie Xi na amostra Yi).

Como o nosso exemplo uma matriz de abundncia vamos utilizar o ACE.


Para construo da curva do estimador de riqueza ACE juntamente com a curva de acumulao
de espcies, selecione primeiramente a coluna [Individuals (computed)] OU [Samples], em
seguida as colunas [Sobs Mean (runs)] e [ACE Mean]. Caso fosse uma matriz de incidncia
escolheramos [ICE Mean]. Insira o grfico como descrito nos itens anteriores.

63

180
160
140

Espcies

120
100
80
60
40
20
0
0

10

15

20

25

30

35

Amostras
Sobs (Mao Tau)

ACE Mean

1.3.4.5 Michaelis-Menten

O EstimateS calcula 2 tipos o [MMRuns Mean] e [MMMeans (1 run)]. Em ambos, os dados que
o programa representar a assntota estimada com base em um, dois, trs ... n amostras. A
diferena que o primeiro mtodo [MMRuns Mean] calcula estimativas de valores para cada
nvel de agrupamento, para cada execuo de randomizao, em seguida, as mdias das
randomizao. O problema que se por acaso na randomizao for selecionado uma amostra
muito rica no inicio h uma grande distoro da estimativa da riqueza no incio da curva (veja
no grfico abaixo).

O segundo mtodo [MMMeans (1 run)] calcula as estimativas para cada amostra apenas uma
vez, com base na curva de acumulao de espcies. As estimativas desse segundo so menos
erradas do que para o primeiro mtodo, sendo, portanto mais recomendado.

Para construo da curva do estimador de riqueza Michaelis-Menten juntamente com a curva de


acumulao de espcies, selecione primeiramente a coluna [Individuals (computed)] OU
[Samples], em seguida as colunas [Sobs (Mao Tau)], [MMRuns Mean] OU [MMMeans (1 run)].
Insira o grfico como descrito nos itens anteriores.

64

160
140

Espcies

120
100
80
60
40
20
0
0

10

15

20

25

30

35

Amostras
Sobs (Mao Tau)

MMRuns Mean

MMMeans (1 run)

1.3.4.6 Curva de acumulao de espcies clssica

A curva de acumulao clssica prev apenas uma aleatorizao das parcelas para construo do
grfico. Para isso v ao EstimateS abra o arquivo de dados como descrito nos itens anteriores.
V ao Menu Diversity click em Diversity Settings na aba Randomization marque a
opo Dontt randomize Compute
Obs.: no se esquea posteriormente de reativar as randomizaes para outras anlises.

Exporte e salve os resultados e importe o arquivo para o Excel como descrito nos itens
anteriores.

No Excel selecione primeiramente a coluna [Samples] OU [Individuals (computed)], em seguida


a coluna [Sobs Mean (runs)]. Insira o grfico como descrito nos itens anteriores.

65

Clssica
Clssica

140

140

120

120

100
Espcies

Espcies

100
80
60

80
60

40

40

20

20
0

0
0

10

15

20

25

30

35

500

1000

1500

2000

2500

3000

Indivduos

Parcelas

Pode-se inserir manualmente uma coluna de rea acumulada (se as amostras forem de mesmo
tamanho) junto base de dados caso deseje uma curva de espcies em funo da rea.
Selecione primeiramente [rea] em seguida a coluna [Sobs Mean (runs)]. Insira o grfico como
descrito nos itens anteriores.

Clssica
140
120

Espcies

100
80
60
40
20
0
0

5000

10000

15000

20000

25000

30000

Ara amostral (m)

66

2 Suficincia amostral pela Regresso linear com Plat

2.1 Software SAEG

2.1.1 Instalao

Download da verso de demonstrao: http://www.ufv.br/saeg/download.htm


Obs.: a verso de demonstrao excuta todas as anlises que a verso paga, porm s aceita 40
observaes (linhas).

Execute o Setup saegd910

Siga a seqncia: Avanar Sim (escolha o local de instalao) Avanar (Preencha o


nome da empresa e usurio) Avanar Instalar

2.1.2 Base de dados

Formato da base de dados: Microsoft Excel (.xls)

Exemplo: Amostra com 30 parcelas de 1000m com total de 2564 indivduos em 128 espcies.

A base de dados deve vir de algum procedimento que gere valores mdios a partir da
aleatorizao das parcelas para composio dos dados (curva de acumulao mdia). Caso
contrrio pode-se formar o chamado falso plat.
Pose utilizar os resultados gerados pelo EstimateS copiando as colunas [Samples], [Individuals
(computed)] e [Sobs Mean (runs)]. A coluna de rea acumulada pode ser inserida manualmente.

67

2.1.3 Executando a anlise

Abra o SAEG.
Click em Arquivo Click Ativar Arquivo de Dados Existentes.

Localize sua base de dados e click Abrir.

68

Selecione o formato Excel(.xls) e click em Processar.

Adicione um ttulo qualquer e click em Continuar.

Verifique se foi importado com sucesso e click em Abandonar.

69

V no Menu Regresses Click em Linear Response Plateau.


Obs.: no utilize as caixinhas azuis de atalho porque podem acontecer erros na verso de
demonstrao.

Primeiro escolha a varivel ESPCIES (varivel dependente - Y)


Click no boto funo
Em seguida escolha a varivel PARCELAS ou REA ou INDIVDUOS (varivel independente X) (geralmente trabalha-se com PARCELAS)
Por fim click em Processar.

70

2.1.4 Resultados

Primeiro exibido o grfico com a regresso.


O grfico pode ser configurado de acordo com a preferncia do usurio acessando as diversas
opes do menu.
Para exportar o grfico click no Menu Arquivo Salvar grfico no padro bmp.
Para ver os outros Resultados Finais do ajuste click no Menu Arquivo Abandonar

Na janela Resultados Atuais pode ser encontrado todo o procedimento usado para o ajuste da
regresso, estatsticas simples, matriz de correlao, analise de varincia, de regresso, etc.

71

Ao final da janela mostrado o ponto de encontros das retas que no nosso caso representa a
suficincia amostral pelo mtodo de Plat.

Pelo exemplo apresentado, a suficincia amostral dada por 19 parcelas representando 120
espcies. O que significa que 19 parcelas o mnimo de parcelas a serem lanadas de modo a
representar aquela populao.

Os resultados podem ser salvos clicando em Salvar.

72

3 Suficincia amostral em anlise de agrupamentos e ordenao

3.1 Software MULTIV

3.1.1 Instalao

Download: http://ecoqua.ecologia.ufrgs.br/ecoqua/software.html

Descompacte o arquivo: Multiv_Windows


No necessrio instalar o arquivo auto-executvel

3.1.2 Base de dados

O programa l em formato texto (.txt) separado por tabulaes ou espaos.

O arquivo pode ser confeccionado em Excel depois exportado para texto (descrito nos itens
anteriores).

A base de dados no precisa tem qualquer identificao de amostras parcelas ou espcies,


apenas deve ser composta da matriz (abundancia, incidncia, rea basal, etc).

Obs.: porm necessrio que o usurio esteja ciente de como variveis esto dispostas no
arquivo (espcies em linha x amostra em colunas ou vice-versa) pois o MULTV perguntar
mais tarde.

Aspecto da base de dados

73

Obs.: a base de dados deve ser salva DENTRO da pasta junto com os arquivos do software
MULTV.

3.1.3 Utilizando pela primeira vez

Execute o MULTIV

Interface do MULTV

Para mudar a idioma para portugus sigas os passos abaixo:

Enter option (valid options with *): E

PREFERENCES

74

Set preferences of:


L language (change to Portuguese/mudar para portugues)
S scatter diagram
D dendrograms
F output
C return to main menu
Type option: L

PREFERENCIAS
Alterar preferencias em:
L lingua (mudar para ingles/change to English)
S diagramas de dispersao
D dendrogramas
F formato de resultados
C voltar ao menu principal
Entre opcao: C

3.1.4 Importar uma base de dados

Primeiro cole a base de dados na mesma pasta junto aos arquivos do MULTV.

Usaremos como exemplo uma base de dados comporta por 30 parcelas com 128 espcies no
total formada por uma matriz de abundancia (nij nmero de indivduos da espcies i na
parcela j)

75

Abra o MULTIV e siga os passos abaixo:

MENU PRINCIPAL
* N especificar dados ou abrir sessao existente
V atributos descritivos
T transformar dados
R medidas de semelhanca
G especificar grupos de unidades amostrais
D diagramas de dispersao
O ordenacao
C agrupamento (cluster analysis)
P testes de aleatorizacao comparando grupos de unidades amostrais
A testes de aleatorizacao comparando variaveis
* E preferencias
S armazenar sessao
* X sair
------------------------------------------------------------------------------Entre opcao (opcoes validas com *): N

Deseja especificar novos dados (n) ou abrir (a) uma sessao ja existente? n/a N
Entre nome do arquivo com matriz de dados: basedados.txt
Numero de unidades amostrais:

30

Numero de variaveis: 128 (corresponde ao nmero de espcies no nosso caso)


Tipos de variaveis:
(1) somente variaveis quantitativas, medidas na mesma escala
(2) somente variaveis quantitativas, escalas diferentes
(3) somente variaveis qualitativas nao binarias
(4) somente variaveis binarias
(5) varios tipos

76

Entre opcao: 1
Dados ordenados por (as linhas da matriz correspondem a):
(N) unidades amostrais (u1v1,..., u1vp,..., unv1,..., unvp)
(T) variaveis (u1v1,..., unv1,..., u1vp,..., unvp)
Entre opcao: N (vai depender de como foi construdo sua matriz de dados, se as parcelas
estiverem em linha coloque N se as espcies estiverem na linha coloque T)

Nomes para as unidades amostrais e variaveis:


(1) usar padrao automatico (1, 2, ...)
(2) ler nomes apos dados no arquivo basedados.txt
(comecando por u. amostrais, nomes com ate 5 simbolos alfanumericos)
Entre opcao: 1

Incluir matriz de dados no arquivo com resultados? s/n N

Para as anlises de suficincia em ordenao e agrupamento necessrio definir a medida de


semelhana. Siga as opes abaixo:

Entre opcao (opcoes validas com *): R

Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 30 unidades amostrais, 128 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma
Transformacao vetorial: (0)nenhuma
Sessao esta armazenada em arquivo.
------------------------------------------------------------------------------MEDIDAS DE SEMELHANCA
Opcoes:
(1)entre unidades amostrais
(2)entre variaveis

77

(99)cancelar e voltar ao menu principal


Entre opcao: 1

Tipo de medida de semelhanca (1)entre unidades amostrais:


(1)momento produto
(2)funcao valor absoluto
(3)distancia euclidiana
(4)informacao mutua
(5)indice de Gower
(17)correlacao
(18)distancia de corda
(19)indice de Legendre&Chodorowski
(20)dissimilaridade Bray&Curtis
(21)segundo autovalor de correlacao pareada
Entre opcao: 3 (pode-se escolher a de sua preferncia, a opo 3 mais utilizada)
Incluir matriz de semelhanca nos resultados? s/n N

Veja resultados no arquivo Prinda.txt.

Veja que as opes de agrupamento e ordenao do menu j esto disponveis


------------------------------------------------------------------------------MENU PRINCIPAL
* N especificar dados ou abrir sessao existente
* V atributos descritivos
* T transformar dados
* R medidas de semelhanca
* G especificar grupos de unidades amostrais
* D diagramas de dispersao
* O ordenacao

78

* C agrupamento (cluster analysis)


* P testes de aleatorizacao comparando grupos de unidades amostrais
A testes de aleatorizacao comparando variaveis
* E preferencias
* S armazenar sessao
* X sair
-------------------------------------------------------------------------------

3.2 Suficincia amostral com base em agrupamentos

Siga os procedimentos abaixo:

Entre opcao (opcoes validas com *): C

Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 30 unidades amostrais, 128 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma
Transformacao vetorial: (0)nenhuma
Medida de semelhanca: (3)distancia euclidiana, (1)entre unidades amostrais
Sessao esta armazenada em arquivo.
Metodo de agrupamento:
(1)ligacao simples
(2)ligacao completa
(3)soma de quadrados (Ward)
(4)ligacao media nao-ponderada (UPGMA)
(5)ligacao media ponderada (WPGMA)
(6)fatorial hierarquico (Denimal & Camiz)
(7)soma de quadrados restringido pela topologia

79

(99)voltar ao menu principal


Entre opcao: 3

Avaliar nitidez de particoes atraves de autoreamostragem (bootstrap)? s/n S


Entre o numero maximo de grupos (nivel de particao) a ser avaliado: 5 (coloque o nmero mximo de
grupos que deseja analisar. Colocando 5 ele analisar 2,3,4 e 5)
Tamanho inicial de amostra: 6 ( o nmero mximos de grupos + 1 (5+1=6))
Numero de unidades amostrais agregadas a cada passo de amostragem: 1
Entre o numero de iteracoes de autoreamostragem: 1000 ( o mnimo recomendado)
Inicializacao do gerador de numeros aleatorios:
(1) automatica
(2) especificar numero inicializador
Enter option: 1
Guardar resultados intermediarios? s/n N

Veja resultados no arquivo Prinda.txt.

Os resultados foram impressos no arquivo Prinda.txt que se encontra na pasta junto com
MULTV.

Abra o arquivo Prinda.txt e dessa at o final do texto.


Copie as linhas marcadas abaixo

80

Cole diretamente no Excel e em seguida transponha a matriz (selecione a matriz copiar


boto direito do mouse e colar especial marque Transpor OK)

Insira uma coluna com o nmero de amostras/parcelas. O nmero inicial de parcelas/amostras


o nmero de grupos + 1.

Selecione toda a base de dados e insira o grfico (descrito em itens anteriores). Formate o
grfico de acordo com suas preferncias.

81

3.2.1 Resultado
Avaliao de suficincia amostral e significncia de nveis de partio em grupos
0.3

P(GNull<=G*)

0.25
0.2
0.15
0.1
0.05
0
0

10

15

20

25

30

35

Unidades amostrais
2 grupos:

3 grupos:

4 grupos:

5 grupos:

3.2.2 Interpretao

Considerando um limiar = 0,1 o teste indica que partio em 2 e 3 grupos so ntidas, portanto
significativas a partir de 6 e 11 unidades amostrais, respectivamente. Isso significa que amostras
maiores que 6 e 11 parcelas so suficientes para corretas concluses sobre os agrupamentos
formados com 2 e 3 nveis de partio respectivamente.

As parties em 4 e 5 grupos so difusas, portanto no-significativas at 30 unidades amostrais,


portanto 30 parcelas so insuficientes para qualquer concluso a respeitos dos grupos formados
com 4 e 5 nveis. Porm h uma tendncia da pario em de 4 grupos se tornar significativa a
partir de 30 unidades amostrais. A amostragem de novas parcelas pode definir que 4 grupos
significativos.

82

3.3 Suficincia amostral com base em ordenao

Nesse exemplo de anlise utilizamos uma base de 42 parcelas com 164 espcies numa matriz de
abundancia com parcelas dispostas em linha. Como importar e confeccionar a base de dados j
foi descrito nos itens anteriores.

Siga o procedimento abaixo aps ter realizado a importao da base de dados e escolhido a
medida de semelhana.

------------------------------------------------------------------------------MENU PRINCIPAL
* N especificar dados ou abrir sessao existente
* V atributos descritivos
* T transformar dados
* R medidas de semelhanca
* G especificar grupos de unidades amostrais
* D diagramas de dispersao
* O ordenacao
* C agrupamento (cluster analysis)
* P testes de aleatorizacao comparando grupos de unidades amostrais
A testes de aleatorizacao comparando variaveis
* E preferencias
* S armazenar sessao
* X sair
------------------------------------------------------------------------------Entre opcao (opcoes validas com *): O
Status da analise:
Arquivo de dados: basedados.txt
Dimensoes: 42 unidades amostrais, 164 variaveis
Tipo de dados: (1) quantitativos, mesmas escalas de medida
Transformacao escalar: (0)nenhuma

83

Transformacao vetorial: (0)nenhuma


Medida de semelhanca: (3)distancia euclidiana, (1)entre unidades amostrais
Sessao esta armazenada em arquivo.
Metodo de ordenacao:
(1)analise de coordenadas principais
(2)analise de componentes principais
(3)analise de correspondencia
(99)voltar ao menu principal
Entre opcao: 1
Guardar resultados intermediarios? s/n N
Veja resultados no arquivo Prinda.txt.
Avaliar significancia de eixos de ordenacao atraves de autoreamostragem (bootstrap)? s/n S
Entre o numero maximo de eixos de ordenacao a monitorar: 3 (quantos preferir)
Tamanho inicial de amostra: 4 (nmero de eixos +1)
Numero de unidades amostrais agregadas a cada passo de amostragem: 1
Entre o numero de iteracoes de autoreamostragem: 1000
Inicializacao do gerador de numeros aleatorios:
(1) automatica
(2) especificar numero inicializador
Enter option: 1
Guardar resultados intermediarios? s/n N

Abra o arquivo Prinda.txt e dessa at o final do texto.


Copie as linhas marcadas abaixo.

84

Cole diretamente no Excel e em seguida transponha a matriz (selecione a matriz copiar


boto direito do mouse e colar especial marque Transpor OK)

Insira uma coluna com o nmero de amostras/parcelas. O nmero inicial de parcelas/amostras


o nmero de eixos + 1.

85

Selecione toda a base de dados e insira o grfico (descrito em itens anteriores). Formate o
grfico de acordo com suas preferncias.

3.3.1 Resultado

Avaliao de suficincia amostral e significncia de eixos de ordenao


0.7

P(roRnd >= ro*)

0.6
0.5
0.4
0.3
0.2
0.1
0
0

10

15

20

25

30

35

40

45

Unidades amostrais
Eixo 1

Eixo 2

Eixo 3

3.3.2 Interpretao

Considerando um nvel de significncia = 0,1. Probabilidades acima desse valor indicam que
os eixos de ordenao, no representam tendncias consistentes de variao.

O teste indica que amostras com 11 ou mais unidades amostrais so suficientes para interpretar
como consistentes as tendncias de variao reveladas sobre o eixo 1 da ordenao. Em quanto

86

42 unidades amostrais so insuficientes interpretar como consistentes as tendncias de variao


reveladas sobre o eixo 3 da ordenao j que h uma tendncia decrescente da curva e um
nmero maior de amostras pode tornar o eixo significativo.

Em relao ao eixo 2, 11 unidades amostrais so suficientes para concluir que qualquer


tendncia revelada nesse eixo no ser consistente. J que a curva do eixo estvel a partir
desse ponto, qualquer que seja o nmero de amostras esse eixo no ser significativo.

87