Sei sulla pagina 1di 9

Amostragem

Quando inconveniente acessar todo o universo amostral: Toma-se uma amostra, formada por um certo nmero de unidades amostrais, para inferir atributo(s) do universo amostral.
Bibliografia: Kenkel, N. C., P. Juhsz-Nagy & J. Podani. 1989. On sampling procedures in population and community ecology. Vegetatio 83: 195-207. Orlci, L. & Pillar, V. D. 1989. On sample size optimality in ecosystem survey. Biometrie-Praximetrie 29:173-184. Pillar, V. D. 1998. Sampling sufficiency in ecological surveys. Abstracta Botanica 22: 37-48 Pillar, V. D. 1999. How sharp are classifications? Ecology 80: 2508-2516 Pillar, V. D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902. Pillar, V.D. 2004. Suficincia amostral. In: Bicudo, C.E.M. & Bicudo, D.C. Amostragem em Limnologia. p. 25-43. Editora Rima, So Carlos. 351 p. Abordagem tradicional: Cochran, W. G. 1977. Sampling Techniques. 3 ed. Wiley.

Unidad es amostrais: objetos discretos (um espcimen, um lago, um ponto) agregados (rea de vegetao, perfil de solo, volume de gua) Decises: - Tamanho/forma das unidades amostrais - Mtodo de seleo (aleatrio, sistemtico, estratificado, preferencial) - Nmero de unidades amostrais (tamanho da amostra)

Decises so dependentes do conte xto:


1. Objetivo da amostragem: -> estimar atributos simples, como mdias e varincias ou ->estudar padres estruturais, que podem ser expressos atravs de atributos complexos, como entropia mtua, correlao, nitidez da estrutura de grupos, etc. 2. Universo amostral: ->discreto (unidades amostrais naturais, reconhecveis, universo amostral tem tamanho finito) ou ->contnuo (unidades amostrais so agregados arbitrariamente delimitados) Exemplos de contextos de amostragem.
(Adaptado de Kenkel, Juhsz-Nagy & Podani 1989).

Objetivo

Universo de amostragem Discreto

Exemplos de atributos avaliados

Estimativa de atributos simples

- Altura mdia de rvores - Produo de sementes por planta - Mdias de variveis morfolgicas, como altura de planta, largura de folha, etc. - Cobertura ou biomassa em quadros de vegetao como um todo ou de cada espcie - Teores mdios de macronutrientes e pH do solo - Padro de distribuio espacial de indivduos de uma espcie - Estado da ordenao e classificao de entidades discretas, como OTUs - Padro de distribuio espacial da cobertura de uma espcie - Estado da ordenao e classificao de comunidades vegetais - Correlao entre dois conjuntos de variveis, e.g. entre vegetao e ambiente

Contnuo

Estudar padres estruturais (estimativa de atributos complexos)

Discreto

Contnuo

Sele o de unidad es amo strais


Uma amostra de n unidades tomada de um universo amostral de N unidades N! ser uma possibilidade de C= diferentes amostras. n!(N ! n)!

Seleo aleat ria

Seleo completamente aleatria Todas as possveis unidades amostrais tm a mesma probabilidade de serem includas na amostra. Requer a lista ou mapa do universo amostral
Exemplos 1. O objetivo avaliar o grau de contaminao da gua captada para abastecimento urbano numa dada regio. Seleciona-se a amostra aleatoriamente a partir de uma lista de pontos de captao.
2. O objetivo descrever comunidades vegetais quanto a interaes de espcies entre si e com fatores de ambiente. Mapeiam-se os limites da rea. H um nmero infinito de pontos para localizar quadros (unidades amostrais) aleatoriamente atravs de coordenadas geogrficas. A definio do tamanho e forma da unidade amostral arbitrria, sendo as estruturas reveladas dependentes desse contexto.

Seleo sistemtica Apenas o primeiro membro da amostra (pivot) selecionado ao acaso Os demais so tomados a intervalos regulares (r) r = INT(N/n) Seleo do pivot: Mtodo 1: Ao acaso dentre todo o universo amostral. Requer a lista mapa do universo amostral. Mtodo 2: Ao acaso dentre as r primeiras unidades amostrais.

ou

Exemplos 1. O objetivo descrever exsicatas de herbrio de um dado grupo taxonmico. Como o tamanho do universo amostral impede um censo, uma exsicata selecionada ao acaso dentre as primeiras r = INT (N/n) exsicatas da lista; as demais so selecionadas sistematicamente a cada r exsicatas at o final da lista. Universo amostral: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Amostra sistemtica com n = 9 exsicatas (r = INT(30/9) = 3): 2 5 8 11 14 17 20 23 26
2. O objetivo estudar em uma lagoa as relaes entre composio do fitoplancton e variveis fisico-qumicas da gua. No mapa da lagoa marca-se o pivot aleatoriamente, sobre o qual posiciona-se um dos ns de uma grade quadriculada. A amostra ser composta por unidades amostrais localizadas em todos os ns da grade que estiverem sobre a lagoa.

Seleo estratifica da O universo amostral dividido em k estratos no sobrepostos (diviso pode ser subjetiva) e

Em cada estrato feita amostragem completamente aleatria ou sistemtica.

Amostragem em dois estgios Unidades amostrais menores so selecionadas dentro de unidades amostrais maiores para a avaliao de diferentes variveis.
Exemplos 1. Descrio de estrato arbreo feita em unidades maiores; descrio do estrato herbceo feita em unidades menores dentro das primeiras. 2. Para avaliar nmero de flores fertilizadas numa populao de plantas de uma espcie selecionam-se n plantas, em cada uma das quais so selecionadas m flores para observao.

Seleo preferencial

Unidades so selecionadas porque parecem tpicas. Para atributos constantes ou para confirmar padres mais ou menos evidentes. Usada em taxonomia (espcimen tipo), fitossociologia (Braun-Blanquet).

Tamanho/forma d as un idades amostrais - arbitrrio (comunidades no tm limites naturais). - Unidades contguas permitem definir a posteriori unidades maiores a partir de unidades menores. Percep o d e sim ilaridad es d ependente da escala de observao: - unidades menores, quadradas ou circulares - so mais homogneas internamente e menos semelhantes entre si.
Mdias so independentes e varincias so dependentes de tamanho/forma das unidades.

Se o obj etivo estimar m dias: - amostragem aleatria, sistemtica ou estratificada. - reduzindo varincia -> maior preciso com o mesmo nmero de unidades amostrais. Se o obj etivo estudar variao e d etectar pad res: - a amostragem pode ser preferencial - variao borrada se unidades muito heterogneas
Objetivos pode estar aninhados: - Deteco de padres, vrios quadros grandes numa dada rea - Estimativa de composio florstica dentro de cada quadro grande atravs de vrios quadros menores.

Quantas un idades am ostrais? - Suficincia pode ser indicada por estabilidade do parmetro avaliado. - Reamostragem bootstrap.
Quanto maior o tamanho da amostra, maior a certeza de que novas amostras tomadas do mesmo universo amostral permitiro as mesmas concluses.

Nmero d e un idades amo stra is (tamanho da amo stra)

A amostra suficiente?
Quanto maior o tamanho da amostra, maior a certeza de que novas amostras tomadas do mesmo universo amostral permitiro as mesmas concluses.

Solu o tradicional
Balano entre o custo da amostragem e a varincia da mdia
Sx =
2

S2 " n X 1! $ n # N%

2 onde SX a varincia de X, n o tamanho da amostra e N o tamanho do universo amostral.

n ! 0 , e usando a distribuio t de Student, o tamanho da amostra N pode ser determinado por


Sendo

2 " " " n 2 "2n t 2Sx t= #t = #t = #t = 2 # n = 2 2 2 2 SX " Sx Sx SX n


onde a diferena mnima a ser detectada e t o valor da distribuio de Student para n-1 graus de liberdade correspondente a uma dada probabilidade P(t0t) = .

Problemas: Requer estimativa prvia da varincia (piloto, outros levantamentos). Assume distribuio normal da varivel X. Quando universo amostral contnuo, a varincia afetada tambm pelo tamanho e forma da unidade amostral. Objetivo pode no ser estimativa de mdias e varincias.

Amostragem iterativa
(Orlci & Pillar 1989)

1. O estado de um atributo obtido a partir da amostra evolui e se torna mais estvel na medida em que se aumenta o nmero de unidades amostrais na amostra. 2. Estabilidade indica que o fato de agregar novas unidades amostrais resulta em alteraes relativamente menores no atributo estudado. 3. Estabilidade indica tamanho suficiente de amostra.

Mdia da amostra

Nmero de unidades amostrais

Limitaes: - A ordem em que as unidades amostrais so agregadas amostra afeta a percepo de estabilidade. - Dependendo da preciso requerida, a amostra pode ser suficiente mesmo sem ter atingido estabilidade. Soluo: O mtodo Bootstrap simula reamostragem da prpria amostra, permitindo avaliar o grau de estabilidade.

Ream ostragem bootstrap:


Efron, B. 1979. Bootstrap methods: another look at the jackknife. The Annals of Statistics 7: 1-25. Efron, B., and R. Tibshirani. 1993. An Introduction to the Bootstrap. Chapman & Hall, London. Pillar, V. D. 1998. Sampling sufficiency in ecological surveys. Abstracta Botanica 22: 37-48. Pillar, V.D. 2004. Suficincia amostral. In: Bicudo, C.E.M. & Bicudo, D.C. Amostragem em Limnologia. p. 25-43. Editora Rima, So Carlos. 351 p.

1. No havendo melhor informao, a distribuio de freqncias na amostra a melhor indicao da sua distribuio no universo amostral. 2. A reamostragem dos dados da amostra, com reposio, simula a reamostragem do universo amostral. 3. Cada amostra obtida por reamostragem uma amostra bootstrap. 4. A amostra sendo reamostrada um pseudo universo amostral. 5. A reamostragem permite calcular a preciso de estimativas atravs de limites de confiana ou probabilidades.

Algoritmo para clculo de limites de confiana:

Uma amostra existente de tamanho n tomada como um pseudo universo amostral: 6. Seleciona-se no pseudo universo amostral uma amostra bootstrap de tamanho n com reposio. 7. Computa-se na amostra bootstrap os parmetros de interesse (e.g., mdia de uma dada varivel). O valor resultante armazenado. 8. Repetem-se os passos 1 e 2 um grande nmero (1000) vezes. 9. Ordenam-se os valores obtidos do menor ao maior. Determinam-se limites de confiana para uma especificada probabilidade . Se forem 1000 iteraes e = 0.05, o limite inferior ser o valor na 25 posio e o limite superior o na 976 posio. 10. Pode-se ento afirmar, com uma probabilidade de estar errado, que o valor verdadeiro do parmetro avaliado encontra-se entre os limites de confiana.

Estabilidade dos limites de confiana:

Uma srie de amostras bootstrap de tamanho nk n permite examinar a estabilidade da amplitude entre limites superior e inferior.

Limites de confiana atravs de bootstrap


Exemplo: SAMPLER Sampling optimization ----------------------------------------------------------------Data Number of variables: 1 Number of sampling units: 11 41 29 3 42 42 42 16 11 6 Sample attribute: (1) mean of a variable (variable 1) INTERMEDIATE RESULTS: 42 42 29 42 42 42 41 42 6 29 29 42 11 42 42 42 41 6 29 42 42 3 42 6 16 42 42 6 29 6 29 16 11 41 6 42 42 42 6 16 6 42 6 3 11 42 16 42 42 42 42 29 42 42 3 42 3 16 29 41 42 3 11 41 6 42 42 42 42 42 16 42 41 41 42 42 42 16 11 16 42 42 42 6 16 42 29 6 29 11 42 42 11 41 3 16 42 42 3 29 42 3 3 29 6 11 11 42 42 3

file:

42 mean: mean: mean: mean: mean: mean: mean: mean: mean: mean:

42 35.0909 31.0909 22.2727 22.9091 32.0909 25.0909 39.4545 24.3636 25.6364 20.0909

FINAL RESULTS: Wed Jun 16 12:08:29 1999 Elapsed time: 0.2 seconds Initializer of pseudo-random number generator: 3138523705 Average of sample attribute generated by 10 iterations of bootstrap resampling: 27.8091 Confidence limits at 0.2 alpha probability: Lower limits for 1 sampling steps: 20.0909 Upper limits for 1 sampling steps: 39.4545 Upper - lower confidence limit for 1 sampling steps: 19.3636

Potrebbero piacerti anche