Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
HIDROLOGIA ESTATÍSTICA 19
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
20 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
HIDROLOGIA ESTATÍSTICA 21
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
2.1.3 – Histograma
22 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
HIDROLOGIA ESTATÍSTICA 23
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Tabela 2.3 – Tabela de freqüências das vazões médias anuais do Rio Paraopeba
em Ponte Nova do Paraopeba – Período 1938 a 1999
Classe j Intervalo de Freqüência Absoluta fj Freqüência Relativa frj Freqüência Acumulada
Classe (m3/s)
F ∑ fr j
j
Com base nos elementos da Tabela 2.3, pode-se construir o histograma, da Figura
2.3, o qual é um simples gráfico de barras tendo, em abscissas, os intervalos de
classes e, em ordenadas, as freqüências absolutas e/ou relativas. A observação
do histograma da Figura 2.3 mostra algumas características salientes da amostra,
tais como: (a) a maior concentração de pontos no terceiro intervalo de classe, o
qual provavelmente contem o valor central em torno do qual os pontos restantes
se dispersam; (b) uma certa assimetria da distribuição de freqüências, demonstrada
pela maior amplitude à direita do bloco de maior freqüência, quando comparada
com a amplitude à esquerda e (c) a ocorrência isolada de observações muito
superiores ao valor central. É importante ressaltar, entretanto, que a forma do
histograma é muito sensível ao número, à largura e aos limites dos intervalos de
classe. De volta ao exemplo, note que os dois últimos intervalos de classe contêm
respectivamente 3 e 1 pontos amostrais, os quais certamente podem ser
24 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
concentrados em uma única classe de largura 40 m3/s, com limite inferior igual a
130 m3/s e superior igual a 170 m3/s.
Figura 2.3 – Histograma das vazões médias anuais do Rio Paraopeba em Ponte
Nova do Paraopeba – Período 1938 a 1999
HIDROLOGIA ESTATÍSTICA 25
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Figura 2.4 – Polígono de Freqüências Relativas das vazões médias anuais do Rio
Paraopeba em Ponte Nova do Paraopeba – Período 1938 a 1999
26 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Figura 2.5 – Diagrama de Freqüências Relativas Acumuladas das vazões médias anuais
do Rio Paraopeba em Ponte Nova do Paraopeba – Período 1938 a 1999
HIDROLOGIA ESTATÍSTICA 27
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Do modo análogo aos quartis, pode-se fazer referência aos decis, para freqüências
acumuladas múltiplas de 0,1, aos percentis para freqüências múltiplas de 0,01 e,
mais genericamente, aos quantis. Convém ressaltar que se houver a inversão dos
eixos horizontal e vertical de um diagrama de freqüências acumuladas, resulta o
assim denominado gráfico de quantis. Novamente, à medida que o número de
observações cresce, o diagrama de freqüências relativas acumuladas vai se tornando
uma curva de distribuição de freqüências. No caso limite de uma amostra de
tamanho infinito, esta curva tornar-se-ia a função de distribuição de
probabilidades acumuladas da população.
28 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Figura 2.7 – Curva de Permanência das Vazões do Rio Paraopeba em Ponte Nova
do Paraopeba
A curva de permanência da Figura 2.7 revela, por exemplo, que a vazão Q90, ou
seja a vazão que é excedida em 328,5 dias do ano, é de 23,4 m3/s. Além de seu
HIDROLOGIA ESTATÍSTICA 29
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
30 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Média
Se uma amostra de tamanho N é constituída pelos elementos {x1 , x 2 , ... , x N } , a
média aritmética, ou simplesmente média, de X é dada por
x1 x 2 ... x N 1 N
x
N
N
∑x i
(2.2)
i 1
N 1 x1 N 2 x 2 ... N k x k 1 k
x
N
N
∑N x i i
(2.3)
i 1
Alternativamente à media aritmética, porém dentro da mesma idéia por ela sugerida,
existem duas outras medidas de tendência central que são úteis em alguns casos
especiais. São elas: a media harmônica, representada por x h , e a média
geométrica x g . A média harmônica é o recíproco da média aritmética dos
recíprocos dos elementos da amostra. Formalmente, é definida por
1
xh
1 N 1 x1 1 x2 ... 1 x N (2.5)
HIDROLOGIA ESTATÍSTICA 31
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
N
⎛1 N ⎞
xg N x1 .x 2 . ... .x N xi 1 N exp⎜
⎝N
∑ ln x ⎟⎠ i (2.6)
i 1 i 1
Mediana
A média aritmética de uma amostra, por levar em conta todos os seus elementos,
apresenta a desvantagem de ter seu valor afetado pela eventual presença de pontos A
atípicos. Uma outra medida de posição mais resistente do que a média aritmética,
por ser imune à eventual presença de valores extremos discordantes na amostra,
é a mediana xmd. Essa é definida como o valor da variável X que separa a freqüência
total em duas metades iguais, sendo, portanto, equivalente ao segundo quartil Q2.
Se as observações amostrais são ordenadas de modo que
x1 x2 ... x N , a mediana pode ser calculada por
x⎛ N ⎞ x⎛ N ⎞
⎜ ⎟ ⎜ 1 ⎟
⎝ 2⎠ ⎝ 2 ⎠
xmd x⎛ N 1 ⎞ se N for ímpar ou xmd se N for par (2.7)
⎜ ⎟
⎝ 2 ⎠
2
Moda
A moda xmo é o valor amostral que ocorre com maior freqüência, sendo geralmente
obtido a partir do polígono de freqüências relativas, tal como o da Figura 2.3. No
caso limite de uma amostra de tamanho infinito de uma variável contínua X e,
conseqüentemente, do polígono de freqüências tornar-se a função densidade de
probabilidade, a moda irá corresponder à coordenada, no eixo das abscissas, do
32 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
HIDROLOGIA ESTATÍSTICA 33
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
x1 − x + x 2 − x + ... x N − x 1 N
d= = ∑x i −x (2.8)
N N i =1
Embora seja uma medida intuitiva, o desvio médio absoluto pondera de modo
linearmente proporcional tanto os pequenos como os grandes desvios em relação
à média. Além disso, o emprego do operador ‘valor absoluto’, na equação 2.8,
torna o cálculo de d ligeiramente trabalhoso, do ponto de vista computacional.
Desvio Padrão
Uma prática alternativa ao uso do valor absoluto nas medidas de dispersão, é
elevar ao quadrado os desvios em relação à média. Para uma amostra , define-se
a variância amostral como o desvio quadrático médio, dado pela seguinte
equação:
x x 2 x 2 x 2 ... x N x 2 1 N
2
s
i
∑ x i x 2 (2.9)
N N i 1
N
1
2
s ∑ x i x 2 (2.10)
N 1 i1
O termo ‘viés’ é aqui usado livremente para indicar que, em média, não existe
diferença entre
2 e sua estimativa pela equação 2.10, diferentemente do resultado
da equação 2.9. Diz-se, nesse caso, que houve a redução de 1 grau de liberdade
[de N para (N-1)] pelo fato da média populacional haver sido estimada pela
média amostral x, previamente à estimativa de
2 por meio da equação 2.10. Os
termos ‘viés’ e ‘graus de liberdade’ serão formalmente definidos no capítulo 6.
34 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
x x 2 x 2 x 2 ... x N x 2 1 N
s
i
N 1
∑ x i x 2 (2.11)
N 1 i 1
⎛ N 2
1 N
⎞ 1 N
N
s ⎜ ∑
N 1 ⎝ i1
xi 2 x ∑ x i N x
2
⎟
⎠
∑
N 1 i1
xi2
N 1
x 2 (2.12)
i 1
Coeficiente de Assimetria
Para uma amostra {x1, x2,... xN} , define-se o coeficiente de assimetria pelo
número adimensional dado por
HIDROLOGIA ESTATÍSTICA 35
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
N
∑ x i x
3
i 1
g (2.13)
N 1 N 2 s3
36 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Coeficiente de Curtose
Uma medida de quão pontiagudo ou achatado é o histograma (ou o polígono de
freqüências) em torno da média amostral, pode ser calculada pelo coeficiente de
curtose. Esse número adimensional é formalmente definido por
N
N 2 ∑ x i x
4
i 1
k (2.14)
N 1 N 2 N 3 s4
Por tratar-se de um coeficiente cuja base de cálculo é a soma das quartas potências
dos desvios em relação à média, a amostra deve ser de tamanho suficientemente
grande, digamos N 200 , para produzir estimativas confiáveis do grau de
achatamento da correspondente função de distribuição de freqüências. O
coeficiente de curtose possui maior relevância para distribuições aproximadamente
simétricas e também é um indicador do chamado peso relativo das caudas de
tais distribuições. Com efeito, como o valor do coeficiente k indica quão
aglomerados estão os pontos amostrais em torno da média, tem-se também a
noção da distribuição dos valores muito distantes daquele valor central e, por
conseguinte, das freqüências que se concentram nas caudas inferior e superior.
Às vezes, subtrai-se o valor 3 da equação 2.14 para estabelecer o coeficiente de
excesso de curtose ke, em relação a uma distribuição padrão perfeitamente
simétrica cujo valor de k é igual a 3. Nesse caso, se ke= 0, a distribuição é dita
mesocúrtica; se ke< 0, é leptocúrtica; e se ke> 0, é platicúrtica. A Figura 2.8
ilustra esquematicamente as situações mencionadas.
HIDROLOGIA ESTATÍSTICA 37
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Tabela 2.4 – Estatísticas descritivas das vazões médias anuais do Rio Paraopeba
em Ponte Nova do Paraopeba – Período 1938-1999
Estatística Amostral Notação Valor Unidades Cálculo
x
Média x 86,105 m3/s Equação 2.2
Moda xmo 80 m3/s Polígono Freqüências
Mediana xmd 82,7 m3/s Equação 2.7
Média Harmônica xh 79,482 3
m /s Equação 2.5
Média Geométrica 82,726 m3/s Equação 2.6
Amplitude A 123,3 3
m /s (Máximo-Mínimo)
Primeiro Quartil Q1 68,2 m3/s Eq. 2.7 (1 a metade da série)
Terceiro Quartil Q3 99,1 3
m /s Eq. 2.7 (2 a metade da série)
Ampl. Inter-Quartis AIQ 30,9 m3/s (Q 3-Q1)
Desvio Abs. Médio d 19,380 3
m /s Equação 2.8
Variância s2 623,008 (m3/s)2 Equação 2.10
Desvio Padrão s 24,960 3
m /s Equação 2.11
Coef. de Variação CV 0,290 Adimensional s x
Coef. de Assimetria g 0,808 Adimensional Equação 2.13
Coef. de Curtose k 3,857 Adimensional Equação 2.14
Excesso de Curtose ke 0,857 Adimensional (k-3)
38 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Os diagramas do tipo box plot são muito úteis por permitirem uma visão geral do
valor central, da dispersão, da assimetria, das caudas e de eventuais pontos
amostrais discordantes. O valor central é dado pela mediana e a dispersão pela
amplitude inter-quartis. A simetria ou assimetria da distribuição pode ser visualizada
pelas posições relativas de Q1, Q2 e Q3. Pode-se ter uma idéia das caudas superior
e inferior por meio dos comprimentos das linhas verticais que saem do retângulo
de quartis. Os diagramas do tipo box plot são particularmente úteis para comparar
as características de duas ou mais amostras diferentes.
HIDROLOGIA ESTATÍSTICA 39
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Box Plot
Figura 2.9 – Diagrama Box Plot para as vazões médias anuais do Rio Paraopeba
em Ponte Nova do Paraopeba – Período 1938-1999
40 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
HIDROLOGIA ESTATÍSTICA 41
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
não é acumulada; note, também, a anotação complementar das linhas que contêm
o primeiro e o terceiro quartis.
42 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
HIDROLOGIA ESTATÍSTICA 43
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Figura 2.12 – Diagrama de Dispersão com Box Plots – Ponte Nova do Paraopeba
44 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
O exame dos diagramas de dispersão, das Figuras 2.11 e 2.12, mostra que, em
geral, a maiores alturas de precipitação anual, correspondem maiores vazões
médias anuais, indicando uma associação positiva entre as duas variáveis.
Entretanto, observa-se também uma considerável dispersão entre os pares,
demonstrando, com clareza, que a aleatoriedade presente em Y não pode ser
explicada unicamente pela variação de X. De fato outras variáveis, como, por
exemplo, a evapotranspiração, poderiam reduzir o grau de dispersão. Além disso,
a bacia do Rio Paraopeba em Ponte Nova do Paraopeba drena uma área de
5.680 km2, com considerável variação espacial das características climáticas e
geomorfológicas, das propriedades do solo e das alturas pluviométricas. Os
histogramas e os diagramas box plots, por sua vez, demonstram a presença de 3
outliers entre as alturas pluviométricas anuais, assim como a maior dispersão e a
maior assimetria dessa variável, relativamente às vazões.
s X ,Y 1
∑ x i x y i y
i 1 (2.15)
rX ,Y
s X sY N s X sY
HIDROLOGIA ESTATÍSTICA 45
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
46 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
Exercícios
1) Com referência à série parcial das N maiores vazões média diárias, em N anos
de registros, do Rio Paraopeba em Ponte Nova do Paraopeba, objeto do exercício
9 do Capítulo 1, faça uma diagrama de linha para a variável discreta ‘número de
cheias anuais’, tal como o da Figura 2.1.
HIDROLOGIA ESTATÍSTICA 47
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
48 HIDROLOGIA ESTATÍSTICA
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
12) No anexo 1 desse livro, você encontrará as vazões médias mensais do Rio
Paraopeba em Ponte Nova do Paraopeba, de 1938 a 1999. Coloque em um
mesmo gráfico os diagramas box plot das vazões médias mensais de Janeiro e de
Setembro. Interprete os diagramas.
HIDROLOGIA ESTATÍSTICA 49
CAPÍTULO 2 - ANÁLISE PRELIMINAR DE DADOS HIDROLÓGICOS
50 HIDROLOGIA ESTATÍSTICA