Sei sulla pagina 1di 2

Por dentro da estatstica

O uso de mtodos estatsticos vem crescendo vigorosamente em pesquisas da rea mdica. Com freqncia, mdicos e profissionais da Sade so expostos a informaes provenientes de anlises de dados, nem sempre claras e de fcil interpretao. Esta seo visa familiarizar pesquisadores com conceitos e termos estatsticos comumente presentes em artigos cientficos. Com nfase na discusso conceitual em detrimento a frmulas matemticas, o objetivo esclarecer algumas dvidas freqentes e contribuir com o desenvolvimento do senso crtico na hora de analisar, descrever e interpretar dados. ngela Tavares Paes
Editora da seo

O que fazer quando a distribuio no normal?


ngela Tavares Paes*
* Doutora em Estatstica do Centro de Pesquisa Clnica do Instituto Israelita de Ensino e Pesquisa Albert Einstein IIEPAE, So Paulo (SP), Brasil.

Ao aplicar um teste para comparao de mdias ou um modelo de regresso, necessrio checar se as suposies assumidas por estes testes so razoveis. Os mtodos estatsticos mais conhecidos supem que a varivel resposta (ou dependente) tem distribuio normal, porm, muitos usurios da estatstica ignoram tal suposio e utilizam os testes sem se preocupar com a distribuio dos dados. Por outro lado, aqueles mais cuidadosos que costumam verificar se a distribuio ou no normal, buscam mtodos alternativos nas situaes em que esta suposio no est satisfeita. Antes de responder o que fazer quando a distribuio no normal, natural pensar em outras perguntas como O que distribuio normal?; Por que buscamos a distribuio normal? e Como verificar se os dados seguem uma distribuio normal?. O que distribuio normal? Uma distribuio de probabilidades uma funo matemtica usada para descrever o padro de variao de uma varivel contnua. A funo matemtica que representa a distribuio normal envolve dois parmetros (mdia e varincia), a curva que a descreve tem forma de sino e sua principal propriedade a simetria em torno da mdia. A curva normal tambm conhecida como curva de Gauss devido suposio de que Gauss foi o primeiro a fazer uso de suas propriedades para aplicaes prticas.

Por que buscamos a distribuio normal? Os mtodos paramtricos baseiam-se na suposio de que os dados observados na amostra so provenientes de uma populao com distribuio de forma terica conhecida. A suposio de que os dados seguem uma distribuio normal assumida para a maioria dos mtodos estatsticos mais utilizados na pesquisa mdica, como o teste t de Student, ANOVA, regresso linear e intervalos de confiana. Este fato somado a resultados tericos fundamentais (teorema do limite central) faz com que a distribuio normal seja a distribuio terica mais importante em estatstica. Como verificar se os dados seguem uma distribuio normal? Em qualquer anlise de dados, a etapa inicial fazer uma boa anlise descritiva. A normalidade dos dados pode ser analisada descritivamente por meio de histogramas, box-plots, anlise da distncia entre mdia e mediana e coeficientes de assimetria e curtose, que medem, respectivamente, o grau de desvio ou afastamento da simetria e do achatamento da distribuio. Alm dos mtodos descritivos, existem testes de hipteses que avaliam a normalidade, como por exemplo, os testes de Kolmogorov-Smirnov e de Shapiro-Wilks. No entanto, importante ressaltar que esses testes so extremamente rigorosos e facilmente rejeitam a hiptese de normalidade. Portanto, devemos ter cautela e no basear a deciso apenas nos nveis descritivos (valores de p) desses testes. Aps a anlise preliminar e a constatao de que a distribuio normal no pode ser assumida, algumas alternativas podem ser adotadas. A mais comum utilizar testes no-paramtricos, que no assumem nenhuma distribuio terica para os dados. Os testes
einstein: Educ Contin Sade. 2009; 7(1 Pt 2): 3-4

no-paramtricos mais conhecidos so o Mann Whitney como alternativa ao teste t de Student, Wilcoxon como alternativa ao teste t pareado e Kruskall-Wallis como alternativa ANOVA com um fator. Apesar de parecer uma soluo relativamente simples, a grande desvantagem dos testes no-paramtricos que eles tendem a ser bem menos poderosos que os paramtricos. Alm disso, sua aplicao torna-se mais difcil quando a anlise um pouco mais complexa, como por exemplo, comparaes de mdias envolvendo mais de um fator. importante observar tambm que os testes paramtricos so bastante robustos, isto , os resultados so vlidos mesmo quando h pequenos desvios da normalidade. Por esta razo, torna-se mais atraente buscar alternativas paramtricas com maior poder estatstico e consequentemente com resultados mais robustos e confiveis. Muitas vezes a violao da distribuio devida assimetria. Isto acontece com frequncia em dados laboratoriais como, por exemplo, contagens de clulas ou dosagens de substncias, nas quais h muita variabilidade, mas com uma grande concentrao nos valores menores, prximos a zero. Nesse caso, uma opo transformar os dados em escala logartmica. A transformao logartmica a mais comum e geralmente resolve os problemas de assimetria, mas existem outras transformaes que podem ser utilizadas dependendo da caracterstica dos dados. Por exemplo, a transformao raiz quadrada mais usada quando a varivel uma contagem e esperada uma distribuio de Poisson. A transformao recproca (1/x) tem um efeito muito mais drstico do que tomar o logaritmo e pode ser til se os dados observados tm uma distribuio extremamente assimtrica. s vezes h uma forte razo para utilizar uma particular transformao, por exemplo, a raiz cbica pode ser apropriada para dados que so volumes. A principal dificuldade em usar transformaes a interpretao de dados transformados e a volta escala original, que no direta para as medidas de desvio padro. A distribuio normal considerada para variveis contnuas, mas na prtica ela tambm assumida para variveis discretas com grande variabilidade e em amostras relativamente grandes. Para variveis quantitativas discretas com pouca variabilidade, por exemplo, escores de instrumentos, nmero de erros em um teste psicomtrico, nmero de eventos prvios, etc, uma possvel

alternativa a categorizao (agrupamento em faixas de valores). Com a varivel categorizada, testes como o 2 para comparar distribuies de frequncias podem ser utilizados no lugar de comparaes de mdias. No entanto, deve-se ressaltar que qualquer categorizao implica em perda de informao, logo, a categorizao s deve ser feita se as categorias fizerem sentido e favorecerem a interpretao. Quando a transformao no capaz de corrigir o problema e no faz sentido categorizar a varivel, uma alternativa utilizar modelos com outras distribuies. Sim, existe vida alm da distribuio normal e dos testes no-paramtricos. Por exemplo, para dados de contagem, comum utilizar a distribuio de Poisson. Para variveis contnuas positivas (por exemplo, dados relacionados a medidas de tempo), podemos utilizar uma distribuio exponencial, gama ou Weibull. Apesar da teoria de modelos paramtricos com outras distribuies j estar consolidada h dcadas, tais modelos ainda so pouco utilizados na pesquisa mdica. Existe uma crena no meio mdico que diz que para amostras pequenas devem ser utilizados testes no-paramtricos. claro que em amostras pequenas podem ser observados maiores desvios da distribuio normal, mas devemos considerar a natureza da varivel e analisar a distribuio de frequncias dos dados observados. Amostras provenientes de uma distribuio normal, no necessariamente parecem ter esta distribuio, especialmente se a amostra pequena. Isto no significa que sempre que a amostra pequena, deve-se assumir distribuio no-normal. Com base no que foi comentado, ficam aqui duas sugestes para uma anlise de dados adequada. Primeiro, no avaliar a normalidade nica e exclusivamente por testes de hipteses. Segundo, antes de partir diretamente para os testes no-paramtricos, vale a pena tentar transformaes e outras distribuies(1-3).

REFERNCIAS
1. Altman DG. Practical statistics for medical research. Boca Raton (FL): Chapman & Hall; 1991. 2. Bland JM, Altman DG. Transformations, means and confidence intervals. BMJ. 1996;312(7038):1079. 3. Vieira S. Bioestatstica: tpicos avanados. Rio de Janeiro: Campos; 2003. Captulo 2.

einstein: Educ Contin Sade. 2009; 7(1 Pt 2): 3-4

Potrebbero piacerti anche