1.4 FREQNCIA 1.5 - PONTO CENTRAL DA CLASSE 1.6 FREQNCIA ACUMULADA E FREQNCIA ACUMULADA RELATIVA 1.7 - REPRESENTAO GRFICA DOS DADOS NUMRICOS 1.7.1 Histograma, Polgono de freqncia e Polgono de freqncia acumulada 1.7.2 - Grficos Estatsticos 1.7.2.1 - Grficos de Barras e de Linhas 1.7.2.2 - Grficos em colunas superpostas ou porcentagens complementares 1.7.2.3 - Grfico Circular ou Grfico em Setores 1.7.3 - Diagrama de Roseta 1.7.4 - Estereogramas 1.7.5 - Pictogramas 1.7.6 - Cartogramas 1.7.7 - Box-and-Whisker Plots 1.7.8 Diagrama Triangular I.7.9 Ogiva 1.7.10 Diagramas Retangulares 1.7.11 Logs 1.7.12 - Hidrogramas 1.8 CURVAS DE FREQNCIAS 1.9 CURVAS DE PROBABILIDADE NORMAL OU GAUSSIANA E LOGNORMAL 1.10 CANAL DE TOLERNCIA
Captulo 01 REPRESENTAO ESTATSTICA DOS DADOS NUMRICOS
1.1 - CONCEITOS BSICOS
Estatstica parte da matemtica responsvel pela coleta, organizao, resumo e anlise dos dados numricos, e em geologia ela extensivamente aplicada recebendo a denominao especifica de geoestatstica.
A geoestatstica envolve anlise e inferncia de fenmeno espacial e ou temporal, tal como concentrao de poluentes, variao do teor de zinco no solo, preo do petrleo no tempo, etc. A geoestatstica teve sua origem na rea de minerao (Krige, 1951).
Em quase todas as amostragens geolgicas possvel recolher um nmero praticamente ilimitado de dados - exemplo: um nmero infinito de fragmentos de rocha em um batlito grantico para exame petrogrfico, ou um nmero incomensurvel de pedaos de calcrio para a determinao do teor de CaO e MgO em uma formao carbontica, mas no lugar de examinar todo o grupo, chamado de populao ou universo, usualmente s se estuda um pequeno nmero de dados, denominados de amostra*, inferindo a partir deles o carter, as caractersticas mdias e a regularidade de toda a populao. Nos raros casos em que manipulada toda a populao, esta operao chamada de censo.
Em geologia, segundo LANDIM (1993), onde normalmente os dados so coletados segundo um plano de amostragem com coordenadas definidas, torna-se muito importante, quando da anlise desses dados, que a configurao espacial seja considerada. Alis, essa uma caracterstica inerente aos dados geolgicos que exige para a sua anlise uma metodologia estatstica especfica e diferente daquela usualmente utilizada.
A natureza dos dados geolgicos pode ser qualitativa (cor do solo, grau de alterao da rocha mineralogia, litologia, textura da rocha e estrutura) ou quantitativa (teor de elemento qumico maior e/ou trao, propriedades fsicas das rochas, espessura de camadas e medidas geofsicas).
Os dados geolgicos tambm podem ser discretos ou contnuos. queles que so descritos por uma varivel que pode assumir qualquer valor entre determinados limites, chama-se de dado contnuo.
Um exemplo o teor de ferro nas amostras de uma jazida de hematita: um fragmento a coletado pode apresentar qualquer teor entre 0%Fe (ausncia de hematita) e 70,0%Fe (que corresponde hematita pura), tais como 56,74%Fe, 61,14%Fe, 31,06%Fe etc. Os dados discretos so aqueles expressos unicamente por nmeros inteiros, sendo exemplos: os nveis de arenito em uma certa formao (que pode ser 0, 1, 2, 3, ..., mas nunca 1,5 ou 2,3), os files mineralizados de uma jazida etc.
Por outro lado, os dados geolgicos podem ser dimensionados de trs formas diferentes (nos nveis: nominal, ordinal e intervalar), embora alguns autores citem um quarto tipo de mensurao, o nvel de razo, que um caso particular da escala intervalar.
No nvel nominal cada dado da amostra (chamado de individuo, sujeito ou dado individual da amostra) colocado em uma certa categoria da populao e expresso por um nome, smbolo ou nmero, contando-se ento a freqncia com que eles ocorrem na amostragem. Nos estudos paleontolgicos, por exemplo, comum agrupar as amostras ou os perfis geolgicos numa escala hierrquica de associao, sendo que em cada indivduo coletado verifica-se apenas a presena (n 0 1) ou a ausncia (n 0 2) de um determinado fssil. Por outro lado, a distino entre dois arenitos de uma bacia sedimentar s vezes pode ser feita em funo da freqncia de turmalina verde (n 0 1), amarela (n 0 2) ou rosa (n 0 3) nesses clsticos, como demonstra Till (1974).
(*) Note-se que existe uma diferena acentuada entre o termo amostra usado pelos estatsticos (que expressa um conjunto de dados colhidos de uma populao) e pelos gelogos (que significa um fragmento ou uma espcie de minrio, rocha ou fssil, representativo do local amostrado). Nesta apostila, na maioria das ocasies a palavra amostra ter o significado estatstico.
No nvel ordinal da mensurao procura-se ordenar os indivduos da amostra em funo de uma caracterstica fcil de ser avaliada. Um bom exemplo de escala ordinal a de Mohs (tabela 1.1), onde os minerais esto ordenados em escala crescente de dureza.
Convm notar que a diferena de dureza entre o diamante e o corndon no fisicamente igual diferena de dureza entre a calcita e a gipsita ou entre o quartzo e o feldspato, embora na escala ordinal essa diferena seja sempre igual a 1. Isso significa que o nvel ordinal de mensurao fornece informaes sobre a ordenao das categorias, mas no indica a magnitude das diferenas entre os valores. Ou seja, um mineral que risca o feldspato e riscado pelo quartzo, apresenta uma dureza entre 6 e 7, no sendo possvel estabelecer apenas por esse teste se a sua dureza 6,2, 6,5 ou 6,8.
O nvel intervalar de mensurao ordena as categorias e indica tambm a distncia entre elas. Ou seja, as escalas intervalares so expressas em unidades constantes de medidas, tais como: o metro, o centmetro, a unidade de teor (%, grama/tonelada, grama/metro cbico, quilate/metro cbico) e o grau centgrado.
1.2 - SUBDIVISES DA ESTATSTICA E DA GEOESTATSTICA
A estatstica geralmente utilizada como instrumento de descrio ou de deciso e da a subdiviso dessa cincia em estatstica descritiva e estatstica indutiva.
A estatstica descritiva, tambm chamada de estatstica dedutiva, busca organizar, resumir e analisar os dados da amostra sem estabelecer qualquer concluso acerca da populao amostrada.
J a estatstica indutiva, ou a inferncia estatstica, tem por objeto definir as caractersticas de toda a populao com base nesses dados amostrais. Isto , a partir de uma amostra, a estatstica descritiva caracteriza essa amostra e define, por exemplo, a sua mdia, enquanto a inferncia estatstica procura caracterizar toda a populao amostrada, inferindo o seu valor mdio e os limites de confiana desse valor mdio, uma vez que a mdia real da populao quase nunca obtida por mais preciso que seja o trabalho de amostragem.
Por outro lado, em funo do nvel de mensurao dos dados amostrais e do carter da populao* a estatstica subdividida em paramtrica e no-paramtrica. Quando os dados amostrais esto mensurados a nvel intervalar e o carter gaussiano ou lognormal da populao conhecido ou pode ser deduzido com uma boa margem de segurana, usa-se a estatstica paramtrica. Entretanto, quando no se pode honestamente determinar o carter da populao amostrada, ou quando se define que esse carter diferente da distribuio normal ou lognormal, ou ainda quando os dados esto dimensionados nas escalas ordinal ou nominal, usa-se a estatstica no-paramtrica, que pode ser aplicada para qualquer tipo de populao e de dado. A geoestatstica, por sua vez, subdividida em geoestatstica clssica e geoestatstica mineira.
A geoestatstica clssica, tambm chamada geoestatstica bernoulliana, utiliza os fundamentos da estatstica descritiva e da estatstica indutiva para a resoluo dos problemas geolgicos.
A geoestatstica mineira aplica extensivamente os fundamentos da teoria das variveis regionalizadas na resoluo dos problemas geolgicos. Ela usada principalmente para a resoluo de problemas mineiros, tais como: a definio dos valores mdios de um minrio pesquisado, o clculo de suas reservas etc.
(*) As populaes geolgicas em geral so normais ou gaussianas e lognormais, mas isso precisa ser testado em cada caso.
1.3 - PRINCIPAIS APLICAES DA GEOESTATSTICA
O nmero de amostras a ser coletada em um batlito grantico, a definio da eqidistncia de uma malha de sondagem ou do espaamento na amostragem de um veio mineralizado, depende da regularidade dos corpos que esto sendo estudados. Por outro lado, ao curso de qualquer estudo geolgico, freqentemente so levantadas hipteses de trabalho que precisam ser testadas, tais como: h um aumento progressivo do teor no minrio estudado com a profundidade, ou os resultados analticos do laboratrio X no so confiveis etc.
Essas e inmeras outras questes geolgicas podem ser solucionadas empiricamente, mas a experincia tem demonstrado que as concluses mais acertadas so aquelas baseadas em clculos matemticos que se lastreiam em geoestatstica, sendo que as principais aplicaes dessa tcnica de avaliao so:
(1 0 ) Confeco de grficos e tabelas de freqncia, condensando os dados numricos disponveis e permitindo a visualizao do carter e da disperso da amostra. (2 0 ) Determinao do grau de regularidade da populao amostrada, estabelecendo a partir desse valor: o nmero de amostras que deve ser recolhido numa campanha de amostragem, a eqidistncia ideal para uma malha de sondagem, o espaamento na amostragem de um corpo linear etc. (3 0 ) Os valores timos das curvas de mesmo valor (as isolinhas) nos mapas de isoteores, de ispocas, de isoanomalias etc.
(4 0 ) Estimativas de parmetros populacionais a partir de dados de amostragem, tais como: a composio qumica e mineralgica mdia de uma rocha ultrabsica: a espessura, o teor, a acumulao e a densidade mdia de um minrio etc. (5 0 ) Clculos de erros de amostragem, permitindo: (i) a classificao das reservas minerais de acordo com a classe do erro de computao; (ii) a avaliao do processo de amostragem e dos limites de confiana dos valores mdios calculados. (6 0 ) Definio de background e valor limiar dos trabalhos de geofsica, geoqumica e prospeco de minerais pesados. (7 0 ) Identificao das populaes existentes em um lote de dados de amostragem. (8 0 ) Desenhos de mapas de tendncias e de mdias mveis, para melhor localizao de zonas anmalas. (9 0 ) Comprovao sobre hipteses de trabalho, notadamente na definio de diferenas ou similaridades significativas entre as propriedades medidas na amostra. Exemplos: comparao dos teores encontrados em dois setores diferentes de uma jazida mineral, ou entre as composies modais de amostras coletadas em dois batlitos granticos mapeados. (10 0 ) Identificao de correlao estatstica significativa entre as propriedades de uma populao e quantificao do grau de correlao. Um exemplo prtico de correlao estatstica o da prospeco pedogeoqumica para ouro. Esse elemento, em amostras de solo, em geral apresenta teores muitos baixos e mostra um halo anmalo relativamente pequeno devido a sua baixa mobilidade. Entretanto, como ele freqentemente aparece associado a outros elementos com maior mobilidade e/ou com teores mais elevados, o passo inicial dessa prospeco consiste em definir quais os elementos farejadores do ouro na rea a pesquisar, por testes de correlao estatstica. Definidos esses elementos, as amostras de solo so dosadas para ouro e para os farejadores; que so elementos qumicos associados ao ouro e capazes de indicar a sua presena. (11 0 ) Identificao de tendncias de comportamento em uma populao. So exemplos: a determinao do preo provvel de comercializao de um minrio em um futuro definido, a partir de retas ou curvas de tendncias traadas com base nos preos registrados em uma srie histrica do passado. Clculos de demandas de um bem mineral a partir de dados de mercado e da srie histrica. (l2 0 ) Identificao da funo de distribuio dos atributos da populao, expressando essa funo na forma grfica e matemtica, possibilitando, com isso, a previso do comportamento do minrio em reas desconhecidas ou em blocos ainda no- amostrados.
1.4 FREQNCIA
O passo inicial de toda tcnica estatstica consiste na ordenao dos dados disponveis, j que normalmente o gelogo trabalha com uma quantidade considervel de informaes, principalmente sobre o teor, a densidade e a espessura da rocha ou do minrio que est sendo pesquisado. Se os dados forem apresentados em um quadro contendo cada uma das observaes recolhidas, ser difcil a sua compreenso tal como se observa na tabela 1.2, onde esto relacionados os teores de chumbo encontrados em 569 amostras de solo colhidos durante uma prospeco geoqumica em Caic-RN.
A primeira idia acerca do carter dos valores encontrados j se obtm com a construo da tabela de freqncia, onde os dados sofrem um arranjo por classes. A sistemtica para a elaborao dessa tabela consiste: 1 0 Determina-se entre os valores verificados os dados extremos, que na tabela 1.2 so: 5ppm - teor mais baixo encontrado - e 150ppm - teor mais elevado.
2 0 - Calcula-se a amplitude da populao, representada pela diferena entre os valores extremos. No caso da tabela 1.2, a amplitude de 145ppm (150ppm - 5ppm).
Tabela 1.2a - Teores de Chumbo (ppm) em Amostras de Solo Coletadas na Fazenda Ponta da Serra - Caic-RN.
3 0 - Divide-se os dados verificados em um nmero conveniente de classes. Essa subdiviso pode ser realizada de forma emprica de modo que as informaes fiquem agrupadas entre 4 e 15 classes, como mostra a tabela 1.3, ou pode ser encontrada pela expresso de Sturges dada a seguir: It = A / 1 + 3,32 log N Onde: A a amplitude da populao; log N o logaritmo decimal do nmero N de informaes; It o intervalo de classe, procurado.
No caso dos teores de chumbo relacionados na tabela 1.2, os dados devem ser agrupados em 10 classes com intervalo de 14,5ppm para cada classe, utilizando a tabela 1.3 (l45ppm: 10 = 14,5ppm), ou em 11 classes com intervalo de 14,3ppm pela expresso de Sturges, como se demonstra a seguir:
It = 145 / 1 + 3,32 log 569 = 14,3 ppm
Tabela 1.2b - Teores de Chumbo (ppm) em Amostras de Solo Coletadas na Fazenda Ponta da Serra - Caic-RN, em Ordem Crescente.
4 0 - Definem-se os limites de cada classe, que so encontrados acrescentando-se o intervalo de classe calculado ao menor valor observado e, a partir da, mais um intervalo de classe ao limite superior da classe anterior.
Dessa forma, para os dados da tabela 1.2, utilizando-se o intervalo de 14,5ppm, a populao ficaria subdividida nas seguintes classes conforme quadro a seguir:
Classe Intervalo de Classe Limite Inferior Limite Superior It = 14,5 ppm Primeira 5ppm 19,5ppm (5 + 14,5 = 19,5) Segunda 19,5ppm 34ppm (19,5 + 14,5 = 34) Terceira 34ppm 48,5ppm (34 + 14,5 = 48,5) Quarta 48,5ppm 63,0 ppm Quinta 63,0ppm 77 ,5ppm Sexta 71,5ppm 92,0ppm. Stima 92,0ppm 106,5ppm. Oitava 106,5ppm 121,0ppm. Nona 121,0ppm 135,5ppm Dcima 135,5ppm 150,0ppm
Convm notar que com essa subdiviso existe a possibilidade de uma informao pertencer a duas classes diferentes: urna amostra com 34ppm por exemplo, poderia ser includo na segunda ou terceira classe, o mesmo ocorrendo com 92ppm, que poderia ser enquadrado na sexta ou na stima classe, e com 121ppm, na oitava ou nona classe.
Quantidade de Observaes
Nmero de Classes 6 a 11 4 12 a 22 5 23 a 45 6 46 a 90 7 91 a 181 8 182 a 362 9 363 a 724 10 725 a 1448 11 1449 a 2896 12 2897 a 5792 13 5793 a 11584 14 Acima de 11584 15 Tabela 1.3 Nmero de classes em funo da quantidade de observaes.
Para evitar essa situao, trs caminhos usualmente so seguidos: (i) utiliza-se um intervalo de classe tal que os valores-limites de cada classe nunca coincidam com os dados da populao. Assim ocorreria se fosse utilizado o valor de 14,3ppm calculado pela expresso de Sturges; (ii) acrescenta-se 0,1 (ou 0,01 se os dados da populao j tm casa decimal) ao limite inferior de cada classe.
Assim, em relao aos valores da tabela 1.2, os seguintes intervalos de classe seriam considerados:
Primeira classe: 6 a 19,5ppm. Segunda classe: 19,6 a 34,0ppm. Terceira classe: 34,1 a 48,5ppm. Quarta classe: 48,6 a 63,0ppm;
e assim sucessivamente; (iii) considera-se que os limites nominais de capa classe so nmeros inteiros, enquanto que os limites reais ocupariam o centro entre os limites nominais das classes adjacentes, como mostra a tabela 1.4, onde se considerou um intervalo de classe de 14ppm.
Classe Limites Nominais Limites Reais Primeira 5 a 19 4,5 a 19,5 Segunda 20 a 34 19,5 a 34,5 Terceira 35 a 49 34,5 a 49,5 Quarta 50 a 64 49,5 a 64,5 Quinta 65 a 79 64,5 a 79,5 Sexta 80 a 94 79,5 a 94,5 e assim sucessivamente Tabela 1.4 - Limites Nominais e Reais para a Confeco da Tabela de Freqncia dos Dados da Tabela 1.2
5 0 - Conta-se s observaes que caem dentro de cada intervalo de classe, como mostra a tabela 1.5.
Intervalo de Classe Nmero de Observaes
5 a 19,5ppm
183 19,6 a 34,0ppm
248 34,1 a 48,5ppm 83 48,6 a 63,0ppm 28 63,1 a 77,5ppm 11 77,6 a 92,0ppm 10 92,1 a 106,5ppm 2 106,6 a 121,0ppm 2 121,1 a 135,5ppm 1 135,6 a 150,0ppm 1 Tabela 1.5 - Clculo das Freqncias de Observaes Verificadas em cada Classe dos Dados da Tabela 1.2
6 0 - Quando nos dados amostrais aparece um ou alguns valores anmalos, estes no devem ser levados em considerao na definio da amplitude da populao, embora devam ser considerados na tabela de freqncia. Por exemplo: se entre os dados da tabela 1.2- existisse um teor de 420ppm e um outro de 600ppm, a amplitude da populao, a ser utilizada na expresso de Sturges continuaria a ser de 145ppm, s que na tabela de freqncia haveria uma dcima-primeira classe englobando os dados com mais de 150ppm de Pb.
1.5 - PONTO CENTRAL DA CLASSE
Vrios parmetros estatsticos de uma populao numerosa de dados so calculados a partir de tabelas de freqncia, s que nesse caso utiliza-se nos clculos matemticos o ponto mdio ou central de cada classe, que representa a mdia aritmtica dos extremos reais da classe. Sendo assim, na tabela anterior o teor central da classe que vai de 63,1 a 77,5ppm 70,25ppm, como mostra a expresso seguinte: Tc = 63,0* + 77,5 / 2 = 70,25ppm (*) Como visto anteriormente. embora o limite inferior nominal dessa classe seja 63,1ppm, o seu valor real de 63,0ppm.
Os demais pontos centrais da tabela de freqncia 1.5 esto relacionados na tabela 1.6.
Tabela 1.6 - Tabela de Freqncia dos Teores de Chumbo Relacionados na Tabela 1.2
1.6 FREQNCIA ACUMULADA E FREQNCIA ACUMULADA RELATIVA
Muitas vezes. nas interpretaes estatsticas so usadas tabelas de freqncia acumulada ou de freqncia acumulada relativa em conjunto com as tabelas de freqncia das observaes. As tabelas de freqncia acumulada so construdas somando-se as observaes registradas em cada intervalo de classe com os dados verificados anteriormente. Assim, por exemplo, na tabela 1.7, construda a partir dos valores da tabela 1.6, a freqncia acumulada da classe compreendida entre 92,1 e 106,5ppm resulta da adio das observaes da classe com as quatro verificadas anteriormente, entre 106,6 e 150ppm.
As freqncias acumuladas relativas resultam da diviso das freqncias acumuladas em cada classe pelo total de observaes, sendo o resultado multiplicado por 100 para express-lo em porcentagem. Por isso, a freqncia acumulada relativa da classe limitada pelos teores de 92,1 e 106,5ppm igual ao nmero de observaes acumuladas (6) dividido pelo total das observaes (569), multiplicando o resultado por 100. As tabelas de freqncia acumulada e de freqncia acumulada relativa dos dados da tabela 1.2, esto na tabela 1.7.
A freqncia acumulada e/ou acumulada relativa podem ser calculadas tanto no sentido crescente como decrescente, s que no tratamento dos dados geoqumicos e na maioria dos dados geofsicos aconselhvel o clculo em ordem decrescente;. uma vez que em vrios testes estatsticos a ltima classe abandonada e os maiores erros de dosagens, por exemplo, aparecem normalmente na classe que engloba os menores valores, enquanto que os resultados anmalos, indicativos dos alvos para detalhamento, ocorrem nas classes com valores mais elevados. Existem outras situaes em que mais vantajosa a construo das tabelas em ordem crescente, como ser visto mais adiante.
Os resultados numricos expressos, por exemplo, nas, tabelas de freqncia, so mais bem visualizados nas representaes grficas e, por isso, sero descritas a seguir as principais formas grficas de representao dos dados numricos em geologia.
1.7.1 Histograma, Polgono de freqncia e Polgono de freqncia acumulada
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as freqncias.
O histograma formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classe. A rea de um histograma proporcional soma dasfreqncias simples ou absolutas. Frequncias simples ou absolutas: so os valores que realmente representam o nmero de dados de cada classe. A soma das freqncias simples igual ao nmero total dos dados da distribuio. Frequncias relativas: so os valores das razes entre as freqncias absolutas de cada classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %).
O histograma de freqncia, como se v na figura 1.1, constitudo por um conjunto de retngulos que apresentam as seguintes caractersticas: (a) as bases sobre um eixo horizontal, tendo cada retngulo uma largura igual ao intervalo real de classe da tabela de freqncia; (b) alturas proporcionais s freqncias das classes.
O polgono de freqncia um grfico em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal, levantados pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio.
O polgono de freqncia acumulada traado marcando-se as freqncias acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Freqncia simples acumulada de uma classe o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqncia relativa acumulada de um classe a freqncia acumulada da classe, dividida pela freqncia total da distribuio.
O polgono de freqncia a figura geomtrica que se obtm ligando os pontos mdios do topo de cada retngulo do histograma, como mostra tambm a figura 1.1.
(a)
(a)
(b)
(b)
Fig. 1.1 - Exemplos de histogramas e polgonos de freqncia: (a) dos teores de chumbo relacionados na tabela 1.2; (b) das espessuras de um minrio de fosfato sedimentar situado na bacia costeira Pernambuco - Paraba, em uma campanha de sondagem. Fonte: Maranho (1982; 1984).
1.7.2 - Grficos Estatsticos So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas. Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Grficos de informao: So grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes. Grficos de anlise: So grficos que se prestam melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise freqentemente vm acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico. Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de escalas.
Classificao dos grficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.
Diagramas So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser :
1- Grficos em barras horizontais. 2- Grficos em barras verticais (colunas). 3- Grficos em barras compostas. 4- Grficos em colunas superpostas. 5- Grficos em linhas ou lineares. 6- Grficos em setores e circulares
1.7.2.1 - Grficos de Barras e de Linhas
Nos grficos de barra, quando as legendas no so breves usam-se de preferncia os grficos em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica.
Os grficos em linha so freqentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmeno denomidada de rea de excesso.
Esses grficos so construdos da mesma forma que o histograma e o polgono de freqncia, s que eles no expressam tabelas de freqncia como mostra a figura 1.2, elaborada a partir dos dados da tabela 1.8.
Fig. 1.2 - Exemplos de diagrama de barra e grfico de linha
1.7.2.2 - Grficos em colunas superpostas ou porcentagens complementares
Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos.
Esse grfico, quando desenhado em barras isoladas, aplica-se a praticamente todos os campos da geologia; entretanto,nas avaliaes econmicas de jazidas minerais, ele freqentemente usado para demonstrar as variaes verificadas nos atributos dimensionados (produo, por exemplo), durante uma serie histrica.
Nas barras isoladas, inicialmente traa-se um primeiro retngulo de altura (H) qualquer, subdividindo-o em retngulos menores de acordo com a participao de cada componente da amostra ou da tabela de dados. Usando os componentes da tabela 1.10 como exemplo, verifica-se que a microclina deve ocupar uma rea equivalente a 41,24% da rea global do retngulo original e, para tal, traa-se uma primeira linha horizontal numa altura iguala 0,4124 H. Para o plagioclsio ser representado por uma rea correspondente a 25,89% da rea do retngulo original, traa-se uma segunda linha horizontal com altura h = 0,2589 H, altura esta contada a partir do topo do retngulo indicativo da participao da microclina. Da mesma forma procede-se para os demais minerais, como mostra a figura 1.3a.
Para a construo do grfico em barras de uma srie histrica, inicialmente so desenhados os retngulos correspondentes a cada ano da srie. Por exemplo: tendo com base os dados da tabela 1.9, primeiramente so elaborados os retngulos com alturas proporcionais s produes totais de concentrado de tungstnio em cada ano. Em seguida, cada um desses retngulos tratado como uma barra isolada e, por isso, na sua subdiviso utiliza-se sistemtica descrita anteriormente (fig. 1.3b).
Figura 1.3 - (a) Diagrama de barras em porcentagem da composio modal do granito de Brejo da Madre de Deus. (b) Diagrama de barras em porcentagem da produo de concentrado de tungstnio no Brasil entre 1977 e 1982. Fonte DNPM.
Estados da Federao Ano 1977 1978 1979 1980 1981 1982 Rio Grande do Norte 2.026 1.937 1.934 1.897 2.001 2.031 Par - - - - 459 515 Paraba - - - - 90 56 Total: 2.026 1.937 1.934 1.897 2.550 2.602
Tabela 1.9 Produo Brasileira de Concentrados de Tungstnio entre 1977 e 1982 (em t.). Fonte: DNPM
1.7.2.3 - Grfico Circular ou Grfico em Setores
Este grfico construdo com base em um crculo, e empregado sempre que desejamos ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no mximo, sete dados. Obs: As sries temporais geralmente no so representadas por este tipo de grfico.
Neste caso parte-se do princpio de que a amostra corresponde a um arco de 360 e que cada classe de dados ocupa um arco proporcional ao seu valor, em relao ao conjunto total dos dados. Por exemplo: se a composio modal mdia de um granito a descrita na tabela 1.10, o seu grfico construdo da seguinte forma:
Mineral Percentual Microclina 41,24% Plagioclsio 25,89% Quartzo. 17,88% Biotita 11,55% Hornblenda 1,95% Acessrios 1,49% Total: 100,00% Tabela 1.10 - Composio Modal Mdia do Granito Prfiro de Brejo da Madre de Deus-PE. Fonte: Maranho (1983).
1 passo - Clculo do arco ocupado pela microclina. 100% correspondem a 360 41,24% correspondem a X X = (41,24 x 360): 100 = 14828'
2 passo - Clculo dos arcos relacionados com os outros minerais.
Mineral Clculo do arco ocupado pelo mineral Resultado Plagioclsio (25,89 x 360) : 100 9312' Quartzo (17,88 x 360) : 100 6422' Biotita (11,55 x 360) : 100 4135' Hornblenda (1,95 x 360) : 100 0701' Acessrios ( 1,49 x 360) : 100 0522
3' passo - Desenho do grfico circular.
Como mostra a figura 1.4, aps o desenho do circulo com um dimetro qualquer, traa- se um raio arbitrrio marcando a partir dele os arcos correspondentes aos minerais relacionados.
Figura 1.4 diagrama circular da composio modal do granito descrito na tabela 1.10. Fonte DNPM. A figura 1.5 exibe a representao grfica de uma amostra de gua, representada por um crculo de raio proporcional aos Slidos Totais Dissolvidos em meq/L, subdividido em partes proporcionais s concentraes, em meq/L, dos seus constituintes inicos.
Figura 1.5 Diagrama circular simples dos inicos principais de uma amostra de gua subterrnea.
Fig. 1.5.1 -Diagrama de Carl 1.7.3 - Diagrama de Roseta
Esse grfico usado principalmente nos trabalhos de geologia estrutural, de geotecnologia e de hidrogeologia, uma vez que permite correlacionar as freqncias das observaes com as direes observadas nas fraturas, foliaes, eixos de dobras e etc., possibilitando, desta forma, interpretar as direes de esforos, identificar as direes principais de fraturamento e etc.
O processo de elaborao do grfico simples e ser ilustrado com os dados da tabela 1.11, contendo as fraturas verificadas em uma rea de migmatito escolhida para a construo de uma barragem hidrogrfica na regio de Bom Conselho - PE. 1 passo Inicialmente traa-se um arco de 180 com raio arbitrrio e marca-se ao longo desse semicrculo os diferentes intervalos de classe, tendo, no caso, 10 de amplitude, como mostra a figura I.4. 2 passo Considerando que o comprimento do raio arbitrrio (R) corresponde ao nmero de dados agrupados na classe de maior freqncia, cada classe da tabela de freqncia tem um raio (r) proporcional ao seu nmero de observaes e ao raio arbitrrio. Por exemplo: na tabela 1.11 a classe de maior freqncia tem 159 observaes, por isso o raio corresponde classe de N 0 a 10 E ter um raio r=(47 dados x R) : 159 observaes = 0,296 R. Da mesma forma,o raio correspondente classe de N 5001 a 60 W = (3 observaes x R) : 159 = 0,019 R. 3 passo De posse dos diferentes raios marca-se em cada classe o seu limite, como mostra a figura 1.6.
Convm notar que nos casos em que importa o sentido do dado numrico (por exemplo o mergulho da camada), o arco deve ter 360, mas o grfico de roseta construdo da mesma maneira.
Intervalo de Classe Freqncia Intervalo de Classe Freqncia N 0 a 10 E 47 N 0 a 10 W 26 N 1001 a 20 E 55 N 1001 a 20 W 8 N 2001 a 30 E 56 N 2001 a 30 W 35 N 3001 a 40 E 55 N 3001 a 40 W 16 N 4001 a 50 E 159 N 4001 a 50 W 49 N 5001 a 60 E 42 N 5001 a 60 W 3 N 6001 a 70 E 56 N 6001 a 70 W 18 N 7001 a 80 E 90 N 7001 a 80 W 13 N 8001 a 90 E 109 N 8001 a 90 W 43 Tabela 1.11 Tabela de Freqncia das Direes de Fraturas Verificadas nos Migmatitos de Bom Conselho PE. Fonte: Maranho (1983).
Figura 1.6 Diagrama de roseta das fraturas do migmatito em Bom Conselho-PE, relacionados na tabela 1.11, indicando a principal direo de esforo ( 1 ) verificado na rea. (fonte Maranho, 1983).
1.7.4 - Estereogramas: So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada pequena preciso que oferecem. . 1.7.5 - Pictogramas So grficos construdos a partir de figuras representativas da intensidade do fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo da figura 1.7.
Figura 1.7 Pictograma de nmero de visitantes da UFPE.
1.7.6 Cartogramas Cartogramas so ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de figurar os dados estatsticos diretamente relacionados com reas geogrficas ou polticas. 1.7.7 - Box-and-Whisker Plots Box-and-Whisker plots ou simplesmente box-plots so simples representaes diagramticas dos cinco nmeros sumrios: (mnimo, quartil inferior, mediana, quartil superior, mximo). Um box-plot para os dados geoqumicos fica como mostrado na figura 1.8 a seguir.
Figura 1.8 Box-and-Whisker Plots
1.7.8 Ogiva Esse grfico construdo colocando-se no eixo das abcissas os limites de cada classe e nas ordenadas as freqncias acumuladas relativas correspondentes, como mostra a figura 1.9, construdas a partir dos dados da tabela 1.7. Convm notar que o limite de cada classe neste grfico pode ser o limiar inferior ou o superior, dependendo se a tabela de dados acumulados esta em ordem crescente ou decrescente. No caso da tabela 1.7, construda em ordem decrescente, usa-se o limite inferior real de cada classe,uma vez que 569 observaes, por exemplo, representam o nmero de elementos com teor superior ou igual a 5 ppm. Da mesma forma, as 27 observaes acumuladas na classe de 36,1 a 77,5 ppm expressam que existem 27 dados na amostra com mais de 63,0 ppm de Pb.
Figura 1.9 Ogiva correspondente aos dados da tabela 1.7
1.7.9 Diagrama Triangular
Esse grfico muito usado nos trabalhos de petrografia para a classificao de rochas gneas, em sedimentologia para estudos granulomtricos de sedimentos, na avaliao de rocha carbontica e etc. Como mostram a figura 1.10, esse grfico constitudo por um triangulo eqiltero subdividido em partes iguais, tendo os vrtices ocupados pelos trs componentes principais da amostra, os quais aparecem numa proporo de cem (no prprio vrtice) por cento. Essa proporo indicada pela reta perpendicular bissetriz imaginaria traada no ngulo correspondente ao vrtice ocupado por cada atributo. Dessa forma, a amostra 1 da figura 1.10 tem (i) 30% do atributo A, j que a reta horizontal perpendicular bissetriz de A (ngulo A) corresponde a esse valor; (ii) 10% do atributo B, uma vez que a perpendicular bissetriz do ngulo B a reta de 10% em relao ao vrtice B; (iii) 60% do atributo C, j que a perpendicular bissetriz C mostra esse valor. Quando na amostra aparecem mais de 3 componentes, agrupam-se os atributos ou recalculam-se as porcentagens dos componentes a serem graficamente representados para que eles representem 100%. Como exemplo, examinemos o seguinte problema: represente graficamente em um diagrama triangular uma amostra caracterizada por seu volume de quartzo-plagioclsio e lcali-feldspato, sabendo que a sua composio modal a seguinte: quartzo = 51,67%, lcali-feldspato = 21,38%, plagioclsio = 16,04%,biotita = 6,21%, hornblenda = 3,93% e acessrios = 0,77%.
Figura 1.10 Representao grfica de amostras no diagrama triangular Resoluo:
1 passo Clculo da participao dos atributos a serem graficamente representados. Quartzo = 51,67% lcali-feldspato = 21,38% Plagioclsio = 16,04% Total = 89,09%
2 passo Definio da porcentagem de quartzo em relao ao volume de quartzo + feldspato. 89,09% de quartzo + feldspato correspondem a 100% 51,76% de quartzo correspondem a A A = (51,76 x 100) : 89,09 = 58,00%
3 passo Determinao da porcentagem de plagioclsio e lcali-felsdpato em relao ao volume de quartzo + feldspato. lcali-feldspato = B = (21,38 x 100) : 89,09 = 24,00% Plagioclsio = C = (16,04 x 100) : 89,09 = 18,00%
4 passo Apresentao grfica da amostra.
Inicialmente procura-se a horizontal referente a 58,00% que representa o teor de quartzo (A na figura 1.10). Depois, a linha de direo NNE com 18% correspondente ao plagioclsio. A interseo destas duas linhas d a posio da amostra 2 no diagrama triangular, uma vez que este ponto tem 24% de lcali-feldspato.
Algumas vezes o diagrama triangular usado tambm para identificar grupos de amostras com composies semelhantes.
Este diagrama tambm utilizado para representar os constituintes inicos principais de anlise qumica de gua (figura 1.11). A gua neste diagrama caracterizada por dois pontos (representando os nions e os ctions) ligados por uma reta. .
Figura 1.11 diagrama triangular da composio de uma gua subterrnea.
Diagrama Triangular de Durov
Os pontos que representam as concentraes dos cations e dos anions respectivamente so projetados no quadrado formado pelas bases dos tringulos (Fenzl, 1988). O ponto obtido caracteriza a gua analisada ( fig. 11a).
Fig. 11a -Diagrama de Durov
Diagrama Triangular de Piper
O diagrama de Piper utilizado freqentemente quando se trabalha com grande nmero de anlises qumicas das guas, serve para classificar e comparar os distintos grupos de guas quanto aos ons dominantes em cloretada, sdica, carbonatada, magnesiana, etc.
Para plotar no diagrama, transforma-se os valores de cada on (constante no grfico em meq/l) em percentagem do total de anions e do total de cations separadamente (fig 1.11b).
Fig. 1.11b - Diagrama de Piper 1.7.10 Diagramas Retangulares
Como assinala Tinoco (indito) os vrios tipo de diagramas retangulares se prestam para a representao de numerosas amostras em um perfil vertical ou horizontal, possibilitando a rpida identificao das variaes verticais ou laterais,ao longo do perfil estudado.
A figura 1.12.a, por exemplo, um diagrama retangular construdo a partir de amostras recolhidas em um furo de sonda com 15 m de profundidade, executado em uma rocha carbontica situada na ilha de Itamarac PE. A simples observao do diagrama evidencia que nesse furo de sonda: (i) o calcrio sempre impuro, mas o teor de CaCO 3 aumenta com a profundidade, a no ser no intervalo de 7,2 a 9,1 m composto por uma argila calcria; (ii) o contedo de resduo insolvel chega a atingir 30% nos primeiros 3 m de sondagem,provavelmente por efeito do intemperismo, mas decai gradativamente com a profundidade, ocorrendo apenas um aumento brusco ao longo da intercalao argilosa; (iii) o teor de MgCO 3 varia entre 4 e 20%,no tendo sido observada uma tendncia na variao do seu teor com a profundidade. Algumas vezes utiliza-se um grfico retangular composto para descrever as variaes, ao longo do perfil, de vrios atributos. No diagrama 1.12.b, por exemplo, apresenta-se a composio mineralgica media do fosforito de Olinda PE, em relao rocha total, e tambm, na frao com menos de 2 micra de dimetro.
Figura 1.12a - Diagrama retangular simples em relao composio qumica de amostra recolhidas em furo de sonda em Itamarac-PE.
Figura 1.12b Grfico retangular composto mostrando a composio do fosforito de Olinda-PE, na rocha total e na frao com menos de 2 micra de dimetro (fonte Maranho 1981).
So utilizados tambm para comparar as propores dos constituintes inicos principais de guas superficiais e subterrneas (figura 1.13), a altura das colunas representa a concentrao ou % dos ons em miliequivalente por litro ou miligrama por litro.
Fig. 1.13 Diagramas colunares dos resultados de anlises qumicas de gua subterrnea expresso miliequivalente por litro e em percentagem de miliequivalente por litro.
Diagrama para Classificao da gua para Irrigao(da US Dept. of Agriculture)
Este diagrama utilizado para classificar e comparar as guas para irrigao com base na condutividade eltrica e na razo de adsoro de sdio (SAR), ver fig. 1.13a.
Fig. 1.13a - Diagrama da US Dept. of Agriculture 1.7.11 Logs
Como mostra a figura 1.14, os logs so grficos compostos, onde cada atributo dimensionado fica contido em uma coluna prpria, permitindo de imediato a verificao das variaes verticais ou laterais dos dados numricos e as correlaes existentes entre eles.
Diagrama Semi-logartmico de Schoeller
As concentraes (em meq/l) de uma amostra de gua so plotadas num papel semi- logartmico. Esta forma de apresentao dos dados hidroqumicos bastante flexvel e permite aumentar ou reduzir o nmero de elementos representados, de acordo com as necessidades e os objetivos da interpretao (fig.1.14a ).
Fig. 1.14a - Diagrama Semi-logartmico de Schoeller
1.7.12 Hidrogramas
So grficos que mostram a variao de uma certa caracterstica em funo do tempo. a forma mais clara de se visualizar as variaes de composio da gua subterrnea com o tempo. Normalmente representam-se vrias caractersticas num mesmo hidrograma. Na figura 1.15 apresentado um exemplo tpico de um hidrograma.
Figura 1.15 - Hidrograma
Outras formas grficas Diagrama de Stiff
Todas as concentraes inicas em meq/l ou % meq/l so representadas sobre linhas paralelas horizontais. Ligando todos os pontos respectivos, obtm-se uma figura geomtrica caracterstica para a gua analisada ( fig. 1.16).
Fig. 1.16- Diagrama Stiff
1.8 CURVAS DE FREQNCIAS
J foi visto que o intervalo de classes prprio em cada tabela de freqncia matematicamente calculado pela expresso: It = A:(1+3,32 log N). Dessa forma, se o numero N de dados numricos tende ao infinito, o intervalo de classes It ter amplitude infinitesimal e, por isso, o polgono de freqncia resultante aproximar-se- de uma curva, chamada curva de freqncia ou curva de distribuio.
A experincia obtida com a analise de milhes de amostras geolgicas diferentes evidenciam que as curvas de freqncia mais comuns, constitudas a partir de populaes numerosas de dados geolgicos so:
i. Curvas simtricas, caracterizadas por um nico pico e a forma de sino como mostra a figura 1.16.a . Neste caso, se os dados numricos so contnuos, essa curva de distribuio chama- se normal ou gaussiana.
ii. Curvas assimtricas, com um nico pico, tendo um ramo mais alongado do que o outro, ramo este que pode ser o do lado direito ou o do lado esquerdo (figura 1.16.b). Se os dados numricos da curva so contnuos, ela se chama lognormal.
iii. Curvas caracterizadas pela existncia de vrios picos, como mostra a figura 1.16.c, chamada de multimodal.
Figura 1.16 Curvas de distribuio de freqncias (a) Curva normal ou gaussiana, (b) Curva log-normal, (c) Curva multimodal. As populaes constitudas pelos teores de minrios em jazidas de baixos teores (ouro, prata, platina, etc.) ou resultante de amostragem geoqumica, via de regra apresentam curva assimtricas com um nico pico, da mesma forma que o carter da distribuio dos teores e espessuras em jazidas de alto teor (ferro, mangans, calcrio, fosfato, gipsita, argilas e etc.) , na maioria doa casos, simtrica ou unimodal. o que acontece, por exemplo, quando se analisam todos os teores em uma jazida de cobre contendo faixas de minrios supergnicos (xidos de cobre) e faixas de sulfetos primrios.
1.9 CURVAS DE PROBABILIDADE NORMAL OU GAUSSIANA E LOGNORMAL
A determinao do carter da distribuio de toda a populao amostrada a partir dos dados da amostra muito til, uma vez que permite a definio do modelo matemtico que rege a disperso dos dados numricos na populao e facilita a manipulao e avaliao dos resultados. Sendo assim, necessrio que o padro de distribuio da amostra seja aferido em cada caso estudado, para poder aplicar as leis e expresses matemticas prprias de cada distribuio da populao.
Quando o nmero de dados grande, relativamente fcil de definir a curva de freqncia correspondente e como a freqncia relativa tende probabilidade da populao, pode-se inferir com uma boa margem de segurana o modelo de distribuio da populao. Entretanto, para um nmero relativamente pequeno de dados numricos, a determinao grfica da curva de distribuio da populao a partir dos dados de freqncia no fcil, e cada gelogo tende a construir uma curva diferente, dificultando a avaliao dos resultados. Para minimizar os erros pessoais, as curvas de freqncia so substitudas por curvas de probabilidades, de construo bem mais simples e de interpretao muito mais fcil, e que podem ser desenhadas desde que existam no mnimo 30 a 50 dados numricos na amostra.
Essas curvas so construdas a partir de tabela de freqncia acumuladas relativas, utilizando papis especiais, chamados papis de probabilidade, que apresenta no eixo das abcissas uma escala aritmtica papel de probabilidade normal ou logartmica papel de probabilidade lognormal e no eixo das ordenadas uma escala de probabilidade, que corresponde s freqncias acumuladas relativas das observaes* (*Nos anexos 1.1 e 1.2 esto reproduzidos, respectivamente, os papis de probabilidade normal e lognormal). De posse do papel especial, a construo da curva de probabilidade semelhante da curva de freqncia acumulada relativa, s que a ultima classe da tabela de freqncia abandonada, uma vez que no papel de probabilidade no h um local correspondente freqncia acumulada relativa de 100%. Em sendo assim, a tabela de freqncia acumulada deve se elaborada de forma a ser abandonada a classe com menor nmero de observaes. Pra exemplificar o processo de construo desta curva, vamos utilizar os dados apresentados na tabela I.6, vista anteriormente.
1 passo Construo da tabela de freqncia acumulada relativa.
Na tabela 1.6 verifica-se que a primeira linha tem 183 observaes e a ultima classe (de 135,6 a 150 ppm de Pb) tem apenas um dado. Por isso a tabela acumulada relativa deve ser construda em ordem crescente, como mostra a tabela 1.12, para desprezar a classe com uma informao e no aquela com 183 dados.
2 passo Escolha do limite de cada classe.
Como se pode ver no papel de probabilidade, na abcissa usa-se o limite real de cada classe, e como a tabela foi construda em ordem crescente, aplica-se o limite superior da classe e a freqncia acumulada relativa correspondente, uma vez que qualquer valor acumulado est correlacionado a esse limite superior. Por exemplo: 80,33% das observaes tem valores inferiores ou iguais a 48,5 ppm Pb, que o limite real da classe correspondente, da mesma forma, 99,82% dos dados tem menos que 135,6 ppm Pb.
3 passo Uso do papel de probabilidade.
Na figura 1,17 so apresentados as curvas de probabilidade normal e lognormal construdas a partir dos dados da tabela 1.12.
Uma das principais propriedades desses grficos que quando a populao amostrada apresenta uma populao gaussiana, no papel de probabilidade normal os pontos orientam-se segundo uma reta e apresentam-se dispersos no papel de distribuio lognormal. Entretanto, quando as amostras so recolhidas de uma populao com distribuio lognormal, o fato se inverte e os pontos apresentam-se alinhados no papel de distribuio lognormal e dispersos no papel normal. Quando os pontos mostram-se dispersos nos dois papis porque se tratam de populaes no-gaussianas e no- lognormais, podendo ser ou no uma populao com distribuio multimodal. Isso significa que os dados da tabela 1.12 aproximam-se mais de uma populao lognormal.
1.10 CANAL DE TOLERNCIA
Freqentemente, quando os pontos da curva de probabilidade esto aproximadamente alinhados, ocorrem alguns desses pontos que se posicionam nas proximidades da reta de probabilidade normal e/ou lognormal mas no sobre ela, tal como se v na figura 1.17b. Advm da a dvida se o carter da populao mesmo assim pode ser aceito. Em estatstica pequenas aproximaes so aceitveis, desde que elas se situem dentro de determinados limites de tolerncia. Esses limites podem ser calculados com preciso a partir de alguns testes estatsticos, como o do qui-quadrado. Entretanto, nos casos onde no se exige uma rigidez muito grande, costuma-se obter os limites de tolerncia a partir de processos grficos, utilizando a construo de Liourzou, reproduzida na figura 1.18.
Figura 1.18 Grfico para obteno do intervalo de confiana de 95% para a freqncia relativa acumulada de uma amostra.
Nessa construo grfica os limites de tolerncia so determinados a partir do nmero de dados da populao e das freqncias relativas. Assim sendo, numa amostra contendo 202 dados numricos, os limites de tolerncia para um ponto que deveria ter 60% de freqncia acumulada relativa so: 53% e 66,5%, como mostra a figura 1.17. Em sendo assim, determinam-se os limites de confiana para diferentes pontos da reta de probabilidade, marcando-os no papel de probabilidade. Ligando estes valores limites entre si estabelece-se um canal, chamado de canal de tolerncia, como mostra a figura 1.18. Se todos os pontos esto situados no interior deste invlucro porque os dados numricos no diferem significativamente da distribuio esperada, tal como acontece com a figura 1.18, onde se evidencia que a populao analisada considerada como uma populao lognormal. Par melhor ilustrar o uso desta sistemtica de trabalho, vamos resolver o problema seguinte: verifique se os dados da tabela 1.13 apresentam uma distribuio gaussiana, com auxilio da reta de probabilidade e do respectivo canal de tolerncia.
1 passo Determinao dos limites de tolerncia das freqncias acumuladas relativas.
Para as 287 observaes contidas na amostra, com o auxilio da construo de Liourzou so encontrados os limites de tolerncia assinalados na tabela 1.14.
Freqncia Acumulada Relativa (%) Limites de Tolerncia Superior Inferior 5 8,0 ? 10 14,0 7,5 20 25,0 15,6 30 35,8 25,0 40 46,0 34,5 50 56,0 44,5 60 66,0 54,5 70 75,0 64,5 80 84,0 75,0 90 93,0 87,0 95 ? 92,0 Tabela 1.14 Limites de Tolerncia das Freqncia Acumuladas Relativas para uma Amostra com 287 Indivduos.
2 passo Desenho da reta de probabilidade normal e do canal de tolerncia.
Inicialmente, plota-se no papel de probabilidade normal os pontos definidos pelos limites superiores das classes de freqncias e pelas freqncias acumuladas relativas correspondentes. A partir deste ponto traa-se visualmente a reta de probabilidade. Onde esta reta corta as ordenadas de 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 e 95% marcam-se os valores limites definidos na tabela 1.14. ligando esses pontos limites desenha-se o canal de tolerncia da figura 1.18. nota-se que neste invlucro a sua amplitude cresce nas duas terminaes da reta de probabilidade, uma vez que s so levados em considerao os pontos situados entre os percentis de 5 e 95%, j que a construo de liourzou s contempla valores dentro deste intervalo.
3 passo Concluses Como todos os pontos relativos tabela 1.13 esto localizados no interior do canal de tolerncia da reta de probabilidade normal, se aceita a hiptese que os dados numricos reunidos na tabela 1.13 so provenientes de uma populao gaussiana e como tal deve ser tratada.