Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Medidas de dispersão: os
valores estão próximos entre si
ou variam muito?
Measures of dispersion: are all values
close to each other or do they vary a lot?
TABELA 1 – Pontuações obtidas por alunos do ensi- A variabilidade (ou dispersão) de um conjun-
no médio conforme as disciplinas cursadas (dados to de dados pode ser quantificada através da am-
hipotéticos).
plitude de variação, da variância, do desvio-pa-
Aluno Biologia Matemática drão e do coeficiente de variação, entre outras.1-4
Ana 5 5 Nas seções que seguem, são apresentadas as fór-
Carla 6 3 mulas e exemplos do cálculo de cada uma das
César 5 8 quatro medidas, bem como suas vantagens e des-
João Paulo 4 5 vantagens para utilização na análise de dados e
José Nilton 5 2 leitura crítica de trabalhos científicos.
Luiz Roberto 5 5
Marcelo 5 10 1 AMPLITUDE DE VARIAÇÃO
Maria 6 10
Mariana 4 5 A amplitude de variação pode ser obtida fa-
Pâmela 7 3 cilmente através da diferença entre o maior e o
Pedro 3 2 menor valor de uma distribuição de dados.3
Roberta 5 2 Aproveitando o exemplo das notas nas discipli-
Média aritmética ( X ) 5 5 nas de Biologia e Matemática, a amplitude de
variação em cada um dos casos foi de 4 (7 [maior
pontuação] – 3 [menor pontuação] = 4) e de 8 (10
[maior pontuação] – 2 [menor pontuação] = 8),
Distribuição da pontuação
Disciplina de Biologia respectivamente. A maior amplitude de variação
nas notas de Matemática está de acordo com o
.5
fórmula:2
2
Σ (x – X)2 ,
s =
.1
(n – 1)
0 1 2 3 4 5 6 7 8 9 10
Pontuação obtida x aos valores observados, X à média da distribui-
ção e n ao tamanho da amostra estudada.
Figura 2 – Distribuição da pontuação de alunos do ensino A aplicação desta fórmula pode ser ilustrada
médio na disciplina de Matemática (dados hipotéticos). com as pontuações obtidas nas disciplinas des-
(5 - 5) 2 + (6 - 5) 2 + (5 - 5) 2 + (4 - 5) 2 + (5 - 5) 2 + (5 - 5) 2 + (5 - 5) 2 + (6 - 5) 2 + (4 - 5) 2 + (7 - 5) 2 + (3 - 5) 2 + (5 - 5) 2
s2 = = 1,09
(12 - 1)
Realizando o mesmo cálculo para Matemática, item 2) e 2,92 (√8,54 = 2,92, onde 8,54 corresponde
chega-se ao valor de variância de 8,54. A maior à variância calculada no item 2), respectivamen-
variância na distribuição das notas desta últi- te. À primeira vista, utilizar o desvio padrão
ma é conseqüente à maior dispersão dos dados como medida de dispersão não ofereceria qual-
nesta disciplina, quando comparada com a Bio- quer vantagem em relação ao uso da variância, a
logia. Perceba que esta maior dispersão nas no- não ser pelo fato de conservar a unidade original
tas de Matemática já havia sido acusada na Figu- de medida das observações.
ra 2, o que significa que a dispersão de um con- A maior vantagem desta medida de dis-
junto de dados também pode ser verificada persão é que, em distribuições Normais ou
visualmente, através de gráficos do tipo histo- Gaussianas, 68% das observações encontram-se
grama, por exemplo. distanciadas em até um desvio-padrão em rela-
Uma desvantagem considerável desta medi- ção à média, para mais e para menos.1 De modo
da de variabilidade reside no fato de que seu re- análogo, 95% e 100% das observações de uma
sultado é oferecido na unidade de medida dos distribuição Gaussiana encontram-se entre mais
dados elevada ao quadrado.2 Exemplificando, a e menos dois e mais e menos três desvios-padrão
variância da altura em metros de indivíduos in- da média.1 A Figura 4 mostra que 68%, 95% e
cluídos em um estudo será expressa em metros 100%* dos valores estão contidos entre um, dois
quadrados. Isto confere maior complexidade de e três desvios-padrão da média aritmética em
interpretação à medida e, como forma de contor- distribuições Normais. Esta informação é impor-
nar o problema, calcula-se sua raiz quadrada. A tante quando do cálculo de intervalos de confi-
raiz quadrada da variância é denominada des- ança e do estabelecimento de inferências, assun-
vio-padrão, que receberá maior atenção na seção tos a serem tratados em notas futuras.
abaixo. Além disso, conhecendo-se o valor do desvio-
padrão e da média aritmética de uma distribui-
ção é possível saber se esta tende a uma forma
3 DESVIO-PADRÃO (s)
simétrica, também dita Normal, ou assimétrica.
O desvio-padrão é amplamente utilizado na Nos casos em que a distribuição dos dados for
literatura científica como medida de dispersão assimétrica, o desvio padrão será maior do que a
dos dados. Ele estima o quanto, em média, cada metade da média aritmética (em distribuições
valor se distancia da própria média aritmética de assimétricas s > X/2, onde s é o desvio padrão e
uma distribuição com a vantagem de preservar a X a média aritmética).1 É importante levar em
unidade de mensuração original das observa- consideração este fato, pois boa parte dos testes
ções, algo que não ocorre com a variância. Para utilizados nas análises estatísticas tem como pres-
calculá-lo, basta extrair a raiz quadrada da fór- suposto que a distribuição dos dados seja, pelo
mula da variância:2,3 menos, próxima à Normal. O teste t de Student,
por exemplo, largamente utilizado na compara-
Σ (x – X)2 , ção de médias entre dois grupos, tem como um
s=
√ (n – 1)
de seus requisitos (pressupostos) que a distribui-
ção da variável em questão seja Normal. Na au-
onde s equivale ao desvio-padrão, Σ ao soma- sência de informações gráficas sobre como se dis-
tório, x aos valores observados, X à média da distri- tribui uma variável, mas tendo-se à disposição
buição e n ao tamanho da amostra estudada.
Retomando o exemplo das disciplinas de Bio- * A área sob a curva Normal compreendida entre um, dois e três
logia e Matemática, o desvio padrão em ambas desvios-padrão para mais e para menos da média aritmética
distribuições de notas seria 1,04 (√1,09 = 1,04, é de 68,3%, 95,4% e 99,7%, respectivamente. Por motivos de
simplificação, estamos arredondando estes valores ao longo do
onde 1,09 equivale à variância calculada no presente texto.
Figura 3 – Área sob a curva da distribuição Normal (Gaussiana) e sua relação com os desvios padrão.
os valores de média e desvio-padrão, pode-se jul- que não possui unidade de medida. Assim, é pos-
gar adequado ou não o uso de um teste estatísti- sível comparar a dispersão entre duas variáveis,
co em uma publicação científica.5 Se, em uma mesmo que tenham sido mensuradas em escalas
publicação, tiver sido adotado o teste t para com- de medida diferentes e possuam médias diferen-
parar a média de algum atributo entre dois gru- tes. Por exemplo, através do coeficiente de varia-
pos e o desvio-padrão for maior do que metade ção pode-se comparar, diretamente e sem o re-
da média aritmética, pode-se considerar inade- curso de transformações, a variabilidade existen-
quado seu uso e colocar sob suspeita o resultado te em uma distribuição de alturas medidas em
apresentado. metros com outra de alturas medidas em milí-
metros. Mesmo com estas vantagens, o coefi-
ciente de variação é pouco utilizado e cede lugar
4 COEFICIENTE DE VARIAÇÃO (cv)
na maioria das vezes ao desvio-padrão e à va-
O coeficiente de variação, por sua vez, refe- riância nas análises estatísticas e nas publicações
re-se à divisão entre o desvio padrão e a média científicas.
de uma distribuição:2,3
s 5 CONSIDERAÇÕES FINAIS
cv = ,
X
Os conhecimentos introduzidos no presente
onde cv é o coeficiente de variação, s é o desvio padrão e artigo, somados àqueles da nota anterior, forne-
X a média aritmética. cem informações básicas e necessárias para se co-
Coeficientes de variação menores do que 0,2 nhecer as principais características de uma dis-
sugerem pouca dispersão nos dados, enquanto tribuição, tais como sua forma e dispersão. Quan-
coeficientes maiores que 1 indicam dispersão bas- do a distribuição dos dados não se aproxima de
tante elevada.3 Especificamente, coeficientes mai- uma forma Normal, muitos testes estatísticos são
ores que 0,5 também sugerem que a distribuição contra-indicados e o uso deles pode produzir re-
analisada tende a uma forma assimétrica ou não- sultados inválidos. Nestes casos, pode-se trans-
Normal. formar os dados (calculando-se o logaritmo dos
Esta medida consiste em uma forma simples valores, por exemplo) para que a distribuição as-
de avaliar a dispersão de uma variável, uma vez suma uma forma mais próxima da Normal ou
utilizar métodos estatísticos que não tenham 2. Kirkwood BR, Sterne JAC. Essential medical statistics.
Oxford: Blackwell Science; 2003.
como pressuposto que a distribuição seja simé-
3. Peres KG. Apresentação de dados epidemiológicos. In:
trica. Antunes JLF, Peres MA, editores. Fundamentos de
Além destas aplicações práticas, os conceitos odontologia: epidemiologia da saúde bucal. Rio de Ja-
de distribuição Normal e de desvio-padrão es- neiro: Guanabara Koogan; 2006. p.409-21.
tão intimamente relacionados com o cálculo de 4. Peres MA, Antunes JLF, Frazão P. Cárie dentária. In:
Antunes JLF, Peres MA, editores. Fundamentos de
intervalos de confiança e com o estabelecimento odontologia: epidemiologia da saúde bucal. Rio de Ja-
de inferências. Estes intervalos são estimativas de neiro: Guanabara Koogan; 2006. p.49-67.
precisão de um determinado valor e receberão 5. Altman DG, Bland JM. Statistics notes: detecting
destaque em notas futuras. skewness from summary information. BMJ. 1996;
313:1200.