Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Resumo
O agrupamento preferencial de amostras freqente em estudos na rea de
minerao e geocincias. A utilizao de amostras para estimativas de parmetros
estatsticos da populao requer que a amostragem seja representativa da rea de
interesse e/ou da populao. Tal representatividade pode ser obtida pelo
planejamento cuidadoso do sistema ou padro de amostragem e pode ser
questionada sempre que os dados no estejam igualmente dispersos pela rea.
Nesse estudo, foram utilizadas duas tcnicas de desagrupamento: o Mtodo da
Poligonal e o Mtodo da Clula Mvel. Analisam-se a aplicabilidade dos mtodos e o
impacto da amostragem preferencial sobre a estatstica bsica em dois bancos de
dados distintos. O Mtodo da Poligonal forneceu uma resposta direta, nica e com
metodologia mais facilmente compreensvel pelo usurio, contribuindo
favoravelmente para sua adoo. Testou-se tambm o mtodo da entropia
estatstica para auxiliar na determinao do tamanho de clula mais apropriado,
quando utilizado o Mtodo de Clulas Mveis. Os dois mtodos estudados
apresentaram resultados estatsticos semelhantes, porm distintos dos parmetros
estatsticos calculados para os dados agrupados, atestando o vis estatstico gerado
ao ignorar o efeito do agrupamento preferencial.
Palavras-chave: amostragem preferencial, mtodos de desagrupamento, entropia
estatstica.
Abstract
Preferential sampling or clustering is frequently found in mining and earth sciences
applications. Reliable statistics for a population are obtained when representative
samples are available. Such representativeness can be achieved by a proper
sample design covering evenly the area. This paper investigates two declustering
methods to obtain unbiased statistics where clustered samples are available,
namely the polygonal and the cell-declustering method. The impact of clustering is
analysed for two different datasets. Polygonal method proved to be simpler as it
provides an unique solution easily to be understood by the user. In relation to the
cell-declustering method, a methodology to calculate the statistical entropy was
implemented to help in determining the most appropriate cell size. The two
methods lead to similar declustered statistics. However the final statistics showed a
large difference when compared to the statistics obtained for the clustered dataset.
Keywords: preferential sampling, declustering methods, statistical entropy.
1. Introduo
A amostragem dita preferencial quando a localizao das amostras no regular
ou aleatoriamente distribuda. Diversos fatores podem fazer com que subreas
sejam preferencialmente amostradas, quais sejam:
sondagem com dados de teor de Au (g/t). Como a anlise no foi efetuada num
espaamento regular ao longo do furo, para o banco de dados 3D, a primeira
providncia foi efetuar essa regularizao pela composio em amostras de igual
suporte, resultando em um banco composto por uma informao a cada 5 m de
furo. As medidas de estatstica descritiva dos dados agrupados de ambos os bancos
de dados apresentada nas Figuras 3 e 4.
(1)
onde m a mdia desagrupada dos dados, A o somatrio de todas as reas dos
polgonos, wa a rea do polgono centrado em ua e z(ua) o valor da varivel
resposta observado na amostra. O resultado grfico da gerao de Polgonos de
Voronoi obtido com o 3Plot para o banco de dados 2D apresentado na Figura 7.
O 3Plot, alm de produzir o mapa com as reas de influncia delimitada para cada
amostra, tambm gera uma tabela com as reas para cada amostra e,
conseqentemente, torna-se possvel determinar os pesos, conforme mostra
a Figura 8. Dessa maneira possvel calcular a mdia desagrupada da amostragem,
como ilustrado para o banco de dados 2D (Figura 9).
Figura 8 - Planilha utilizada para clculo dos pesos e da mdia a partir das reas dos Polgonos de
Voronoi.
(2)
(3)
onde:
B = nmero de clulas.
n = nmero de dados em cada clula.
= peso.
z(u) = valor da varivel respostado no ponto.
Tamanho de clula.
(4)
onde N o nmero total de possveis resultados de X, e pi a probabilidade
associada ao isimo resultado. H(X) pode ser interpretado como a quantidade de
incerteza que existe sobre o valor de X e/ou a quantidade mdia de informaes
recebidas quando o valor de X observado.
Considerando-se uma varivel aleatria discreta V, definida em um domnio espacial
D, tal que todas N valores possveis de V (v1, v2,, vN) esto associadas a um grupo
de amostras de tamanhos iguais que compe o domnio D, a entropia H(V)
definida como:
(5)
Se cada resultado possvel de X tem uma igual probabilidade de ocorrncia, ento
H(V) mximo. Para qualquer outro grupo de pesos desiguais, H(V) < - ln(1/N).
Agora considere uma amostragem limitada U de V, com L amostras ul, onde l = 1,
2,, L e sendo L < N. A entropia das amostras de U pode ser medida como:
(6)
onde wl [0,1] so os pesos associados s amostras ul e wl = 1. Se U escolhido
atravs de um espaamento regular amostral, tal que os wl so iguais a 1/L, a
entropia dessa amostragem regular Ut
(7)
A escolha de wl=1/L maximiza o valor de H(U) e, por conseguinte, minimiza o valor
de H(V) - H(U). Isto interpretado da seguinte forma: a amostragem regular Ut de
V fornece o mximo de informaes possveis sobre V para um nmero de amostras
L. Para qualquer outro no-regular ou agrupado grupo de amostras Uc com L
amostras, tal que wl no igual a 1/L, H(Uc) < H(Ut).
Portanto busca-se um grupo timo de pesos wl, tal que H(V) - H(Uc) mximo. Na
prtica, essa diferena pode ser maximizada atravs da minimizao de H(Uc),
usando as mesmas condies apresentadas no Mtodo da Clula Mvel, ou seja, os
pesos wl so diretamente proporcionais rea de influncia da amostra ul. Usa-se o
6. Concluses
Os resultados apresentados demonstram o risco em se assumir que as medidas
estatstica descritiva de dados preferencialmente amostrados seja representativa da
distribuio real da populao. No resumo comparativo apresentado na Tabela 1,
pode-se notar que os valores de mdia e desvio obtidos pelos dois mtodos de
desagrupamento so bastante semelhantes. Em relao ao valor da mdia
agrupada, no entanto, as variaes so da ordem de 13% e 26%, para os bancos
de dados 2D e 3D, respectivamente.
7. Referncias Bibliogrficas
SHANNON, C.E. A mathematical theory of communication. Bell System Techical
Journal, 27, p. 379-623, 1948.
[ Links ]
JOURNEl, A.G. Non-parametric estimation of spatial distributions. Mathematical
Geology, v. 15, n. 3, p. 445-468, 1983.
[ Links ]
ISAAKS, E.H., SRIVASTAVA, M.R. An introduction to applied geostatistics. New
York: Oxford University Press, 1989. 561 p.
[ Links ]
DEUTSCH, C.V. DECLUS: a Fortran 77 program for determining optimum spatial
declustering weights.Computers & Geosciences, v. 15, n. 3, p. 325-332, 1989.
[ Links ]
CHRISTAKOS, G. A bayesian/maximum-entropy view to the spatial estimation
problem. Mathematical Geology, v. 22, n. 7, p.763-777, 1990.
[ Links ]
JOURNEL, A.G, DEUTSCH, C.V. Entropy and spatial disorder. Mathematical
Geology, v. 25, n. 3, p.329-355, 1993.
[ Links ]