Sei sulla pagina 1di 105

1

4 HIDROLOGIA ESTATÍSTICA: conceitos e aplicações

4.1 Conceitos básicos de Probabilidades

Um conjunto de dados hidrológicos necessita ser previamente analisado com base


em alguns indicadores estatísticos básicos para que se possa, efetivamente, desenvolver a
teoria das probabilidades às situações práticas desejadas. Primeiramente, este conjunto de
dados hidrológicos é conhecido, no âmbito da hidrologia, como série histórica e consiste,
basicamente, de uma amostra extraída de uma população.
Com base nesta amostra, podemos calcular alguns indicadores e medidas
estatísticas importantes, como média, desvio padrão (variância), assimetria, curtose e
distribuição de freqüência dos dados observados na amostra. Estas medidas caracterizam
apenas a amostra e nada dizem a respeito da população em si. A distribuição de
freqüências demonstra o comportamento da amostra no tocante à sua simetria e é nosso
objetivo, na hidrologia estatística, modelar esta distribuição de freqüência com base num
modelo matemático, constituído de parâmetros, conhecido como Distribuição de
Probabilidades.
Primeiramente, é importante que caracterizemos algumas situações relativas à
amostra, contextualizada em termos da hidrologia. Podemos modelar uma distribuição de
freqüência no contexto de dados discretos, como por exemplo, o lançamento de uma moeda
ou no sorteio de números de alguma forma de loteria. No caso da hidrologia, pode-se,
eventualmente, considerar dias chuvosos como variáveis hidrológicas discretas, mas na
maioria das vezes, a hidrologia considera suas análises dentro do contexto de variáveis
contínuas.
Em se tratando de variáveis discretas, podemos responder à pergunta: qual a
probabilidade de um número qualquer ser sorteado (evento x) dentro de um espaço
amostral finito S qualquer, constituído por N números, sendo este um evento aleatório. A
resposta pode ser escrita da seguinte forma:

mx
P(x ) = (1)
N
Observe que todos os números que constituem o espaço amostral S possuem a
mesma possibilidade de ser sorteados numa situação não viciada.
É importante, no entanto, diferenciarmos probabilidade de freqüência. Esta última
está associada ao número de vezes que um determinado evento ocorreu, enquanto que
probabilidade refere-se às possíveis situações de ocorrência, que no caso da equação 1, é
considerada como de igual de probabilidade. Assim, se um sorteio de cara e coroa é
realizado 10 vezes e “cara” for sorteado 7 vezes, sua freqüência será 0,7. Por lado, como
2

temos apenas duas possibilidades e estas são iguais (numa situação não viciada), o número
de vezes esperado para o sorteio de “cara” é 5 vezes, portanto, a probabilidade seria 0,5.
No entanto, na hidrologia, em grande parte das vezes, nos interessa, em termos
práticos, avaliar qual a possibilidade de um determinado evento ser maior ou igual (ou
menor ou igual) a um dado valor xi e isto remete ao conceito de uma variável contínua, como
por exemplo, vazões de um rio.
Existem diferenças importantes nos modelos probabilísticos para ambas as
situações. No caso de variáveis discretas busca-se estimar qual a P(x) ser igual a um valor;
no caso de variáveis contínuas, qual a P(x > xi) ou P(X<xi). Para variáveis discretas, o
modelo probabilístico pode ser ajustado com apenas um parâmetro, normalmente vinculado
à média, como no caso da Distribuição de Poisson. Em se tratando de variáveis contínuas, o
modelo probabilístico necessita de 2 ou 3 parâmetros para seu ajuste, e estes estão
vinculados às medidas estatísticas de média, variância e assimetria, ou seja, aos momentos
estatísticos de 1ª, 2ª e 3ª ordens.

4.1.1 Probabilidade Condicional


A probabilidade de ocorrência de um determinado evento A pode ser influenciado
pela ocorrência de outro evento B, uma vez que haverá redução do espaço amostral S para
a realização do evento A quando B ocorre. Neste caso, tem-se a seguinte definição:

P(A ∩ B )
P(A | B ) = (2)
P(B )
Nesta equação, P(A | B ) significa a probabilidade do evento A, associada (ou

condicionada) ao evento B, P(A ∩ B ) significa a intersecção dos eventos A e B no plano


amostral S e P(B) é a probabilidade de ocorrência do evento B. Graficamente, teríamos:

A P(A ∩ B )

Deste esquema, depreende-se também que:


3

P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B ) (3)

Exemplo de Aplicação 4.1


a) Sabendo-se que a probabilidade de ocorrer em janeiro uma precipitação total
superior 200 mm é de 0,098, recalcule esta probabilidade sabendo-se que já
ocorreram 130 mm no respectivo mês e que a probabilidade de se superar este
último valor é de 0,234.

Neste exemplo, o evento A consiste de P(A) = 0,098; o evento B é P(B) = 0,234.


Queremos a probabilidade do evento A mediante a condição de que já houve 130 mm no
mês de janeiro, ou seja, P(A|B):

P(A ∩ B ) P(B ) − P(A ) 0,098


P(A | B ) = = = 1− = 0,581
P(B ) P(B ) 0,234

b) Considere 2 eventos probabilísticos, A e B, ambos associados à possibilidade da


vazão mínima de um curso d’água não atender à demanda de um projeto, que é 4
m3/s. O evento A implica que a probabilidade da vazão do córrego A ser inferior a 2
m3/s é de 0,0547 e do córrego B é de 0,0891. Qual a probabilidade do projeto não
receber a vazão mínima projetada, sabendo-se que o evento A está condicionado a
B [(P|B) = 0,65]?
P(A) = 0,0547; P(B) = 0,0891. A possibilidade do projeto não ser atendido implica em
P(A ∪ B ) (equação 3).
Como P(A|B) é 0,65, da equação 2, tem-se:
P(A ∩ B ) = P(A | B ) × P(B ) = 0,65 × 0,0891 = 0,0579

P(A ∪ B ) = P(A ) + P(B ) − P(A ∩ B ) = 0,0547 + 0,0891 − 0,0579 = 0,0859


4

4.2 Freqüência de Dados Hidrológicos

Os fenômenos hidrológicos podem ser caracterizados como aleatórios, podendo-se


associar aos mesmos, um caráter probabilístico envolvendo estes fenômenos. Em termos
de seu comportamento há de se ressaltar que, sempre haverá possibilidade de um dado
evento hidrológico ser superior ou inferior a um valor histórico já registrado. Isto é essencial
para o entendimento das variáveis hidrológicas, uma vez que esta é uma das principais
funções da hidrologia, que consiste em observar os eventos e modelar as freqüências de
ocorrência, possibilitando que sejam feitas previsões assumindo determinado risco.
As variáveis hidrológicas, na maioria das vezes, são consideradas contínuas, ou
seja, variáveis que em termos físicos, existem continuamente no tempo. Em termos
estatísticos, são aplicadas distribuições que modelam este caráter, trabalhando com
cálculos de áreas sob a curva de distribuição de probabilidades abaixo ou acima de
determinado valor de interesse prático ou entre valores. Percebe-se que neste caso, não se
pergunta qual a probabilidade de um determinado evento ser IGUAL a um valor específico,
como no sorteio de um número, e sim, deste evento ser maior ou menor que este valor, ou
estar entre 2 valores específicos. Este entendimento também é fundamental para aplicação
das distribuições de probabilidades aos fenômenos hidrológicos.
O primeiro passo para se modelar a freqüência de dados hidrológicos é fazer um
estudo de sua ocorrência, no que se estabelece um percentual com que uma variável
hidrológica pode ser maior que um dado valor. Isto é chamado freqüência de excedência e é
obtida diretamente de uma série histórica de dados. Contudo, pode-se trabalhar com a
freqüência de não excedência, ou seja, aquela em que se estuda o percentual de uma
variável ser menor ou igual a um dado valor. A escolha depende dos objetivos, os quais
serão discutidos na seqüência. Deve-se ressaltar que uma é o complemento da outra, ou
seja:

f exc = 1 − fnão − exc (4)

Existem algumas definições de freqüência considerando variáveis contínuas,


destacando-se:
5

Tabela 4.1 Equações para estimativa da freqüência observada e suas aplicações.


Fórmula Autor Observações

fobs =
i Weibull Aplicação ao estudo de probabilidades não
N +1
enviesadas (sem tendência) para qualquer modelo de
Distribuição.

fobs =
i − 0,44 Gringorten Aplicada para estudos associados às Distribuições
N + 0,12
Gumbel e GEV.

fobs =
i − 0,375 Blom Aplicada para estudos associados às Distribuições
N + 0,25
Normal e Log-normal.

fobs =
i − 0,50 Hazen Aplicada para estudos associados à Distribuição
N
Gama 3 parâmetros.

fobs =
i − 0,40 Cunnane Aplicação ao estudo de probabilidades não
N + 0,20
enviesadas (sem tendência) para qualquer modelo de
Distribuição.

O termo i, no numerador, refere-se à posição que o dado ocupa dentro da série


histórica, a qual deve ser ordena em ordem crescente para freqüências de não excedência e
ordem decrescente para freqüência de excedência. Por outro lado, N, no denominador,
refere-se ao tamanho da série histórica. Ressalta-se que nos exemplos de aplicação aqui
desenvolvidos, será considerada apenas a equação proposta por Weibull.
Com base no estudo das freqüências de ocorrência, ajusta-se uma distribuição de
probabilidades e aquela que obtiver o melhor ajuste (menores diferenças entre as
freqüências observadas e estimadas) deve ser a escolhida. Note que o tamanho da série
histórica tem grande importância haja vista que ela representará a possibilidade de
ocorrência, ou seja, quanto maior esta, maior a representatividade do evento, tendo como
referência seu registro histórico. Portanto, o ajuste de uma distribuição de probabilidades
busca sua aplicação para estimar as freqüências de eventos que ainda não foram
registrados e que normalmente são aplicados a projetos hidráulicos.
A freqüência de excedência é bastante usada em hidrologia, especialmente quando
os dados a serem trabalhados constituem séries históricas de precipitação. No entanto, para
estudos de vazões, esta situação é também é importante, sendo que, neste caso, pode-se
gerar um gráfico conhecido como “Curva de Permanência”. Isto significa que pode-se obter
a percentagem de tempo (ou permanência) no qual um determinado evento é superado ou
igualado. Estudos com esta conotação têm várias importâncias práticas, como por exemplo,
na determinação de uma vazão mínima de um curso d’água para abastecimento ou
irrigação, ou ainda, a precipitação mínima num determinado período de um mês visando ao
balanço hídrico e fornecimento da lâmina de irrigação suplementar, ambas as grandezas
6

associadas a uma probabilidade de excedência. A Figura 4.1 ilustra uma curva de


permanência hipotética.

Figura 4.1 Representação gráfica de uma curva de permanência hipotética.

No gráfico acima, para um valor y de vazão, x é a percentagem de tempo com que


esta vazão é igualada ou superada, ou seja, sua permanência. Um valor prático extraído da
curva de permanência é o Q90%, o qual significa a vazão existente no curso d´água em 90%
do tempo, sendo aplicada à gestão dos recursos hídricos. Pela curva, observa-se que se
trata de uma vazão pequena. O risco assumido é de que há possibilidade de 10% da
mesma ser inferior ao valor estimado e neste caso, problemas com o fornecimento de água
ao projeto.
Uma observação adicional pode ser feita. Quanto menor o intervalo de análise dos
dados (dados diários, mensais ou anuais) mais segura será a interpretação da curva de
permanência. Isto quer dizer, por exemplo, que a análise de dados diários de vazão de um
determinado rio fornece um valor menor de vazão, para uma dada permanência, do que
dados mensais ou anuais. Estes últimos geram valores superestimados, sendo mais útil
para a gestão dos recursos hídricos, o estudo com observações diárias.
7

4.3 Conceito de Tempo de Retorno (TR)


O tempo de retorno representa o inverso da freqüência com que um evento pode ser
igualado ou superado, ou seja, reflete a probabilidade com que uma dada variável
hidrológica possa ser igualada ou superada, pelo menos uma vez, num ano qualquer. Ao se
ajustar uma distribuição de probabilidades aos dados de freqüência de uma série histórica,
utiliza-se a probabilidade de excedência para estimar um tempo de retorno, que é obtido em
anos. Por definição, tem-se:
1
TR = (5)
F(X > xi)
Ao se assumir uma distribuição de probabilidades com F (X > xi) estimado por P (X >
xi), tem-se:
1
TR ≅ (6)
P(X > xi)
No entanto, quando o objeto de estudo consiste de uma série histórica de dados
hidrológicos mínimos ou dados que apresentem distribuição normal, o tempo de retorno a
ser estimado também está associado à probabilidade com que o valor mínimo considerado
pode ser inferior ao esperado, ou seja:
1 1
TR = ≅ (7)
F(X ≤ xi) P(X ≤ xi)
Esta situação é comum quando se trabalha com dados de vazão mínima visando à
gestão dos recursos hídricos e avaliação da disponibilidade de água para irrigação ou
abastecimento. Uma vazão específica corresponde ao valor da Q7,10, que significa um valor
mínimo de vazão em 7 dias consecutivos, com Tempo de Retorno de 10 anos. Isto significa
que há probabilidade de 10% de ocorrer uma vazão mínima com 7 dias consecutivos inferior
ao valor estimado, sendo interpretado como um fator de segurança, porém associado à
garantia de vazão no curso d’água.
Contudo, o cálculo de TR, com base no seu conceito, não é suficiente. Assim, é
possível calcular o “risco hidrológico” propriamente dito, o qual está associado à
probabilidade de um evento ser igualado ou superado, porém, num intervalo de tempo N
menor que TR e cuja definição prática está associada à vida útil da obra. Na realidade, esta
probabilidade pode ser calculada pensando-se na probabilidade de que o evento não ocorra.
A linha de raciocínio é a seguinte: dados que p é a probabilidade de ocorrência de um
evento num ano qualquer; seu complemento é k, ou seja, a probabilidade de não ocorrência.
Assim:

k = 1− p (8)
8

Considera-se que a probabilidade do evento não ocorrer em qualquer dos anos, num
intervalo de N anos, é dada por:

K = kN (9)

Da mesma forma, seu complemento, no sentido agora de ocorrência, será:

R = 1− K (10)

Sendo R o risco de ocorrência do evento num período de N anos. Fazendo-se


algumas substituições, chega-se a:

R = 1− kN (11)

R = 1 − (1 − p)N (12)

N
1
R = 1− 1− (13)
TR
Na realidade, esta seqüência de equações nada mais é do que a aplicação da
Distribuição Binomial, considerando a probabilidade de não ocorrência, ou seja, P(x=0). A
Distribuição Binomial apresenta a seguinte estrutura:

N
P(X = x ) = ⋅ p x ⋅ (1 − p )
N− x
(14)
x
Assim, para a situação de não ocorrência, ou seja, P (X=0), teremos:
N
P(X = 0 ) = ⋅ p 0 ⋅ (1 − p ) = (1 − p )
N N
(15)
0
Para a situação de ocorrência:
P( X = x ) = 1 − (1 − p)N (16)
Sendo P(X=x) o risco hidrológico R definido anteriormente. O desdobramento, em
função de TR, é idêntico ao apresentado anteriormente.
9

4.4 Classificação das Principais Séries Históricas Hidrológicas

Os dados históricos relativos a um evento hidrológico constituem uma série


hidrológica, a qual pode ser classificada em:
a) Série original: constituída por todos os valores registrados. Exemplo: 30 anos de
dados de precipitação mensal. A série será constituída por 30 x 12 valores.
b) Série anual: constituída por valores extremos (máximos ou mínimos) de cada ano. A
partir do exemplo anterior, ter-se-ia uma série com 30 valores. Normalmente, valores
mínimos anuais dizem respeito ao comportamento de vazões em cursos d’água.
Este tipo de estudo visa fornecer informações para projetos de abastecimento de
água e irrigação.
c) Série parcial: constituída pelos “N” maiores ou menores valores ocorridos nos “N”
anos de observação. A partir do exemplo inicial, ter-se-ia uma série constituída por
30 valores, os quais seriam os maiores ou menores da série original, sem haver a
vinculação com o ano de ocorrência. Uma outra alternativa seria constituir a série
com todos os maiores (ou menores) valores da série, referindo-se a uma situação na
qual a série histórica é pequena e há utilização de mais de um valor extremo por
ano.

As séries históricas mais trabalhadas em hidrologia são as seguintes:

a) Precipitação total anual: constituída pela soma das precipitações diárias ocorridas ao
longo de 1 ano, obtendo-se, desta forma, 1 valor para a série. É estruturada,
portanto, com valores totais de cada ano. Neste caso, normalmente objetiva-se ao
estudo comportamental do ciclo hidrológico, sendo importante para estudos
vinculados ao balanço hídrico climatológico bem como balanço hídrico anual em
bacias hidrográficas.

b) Precipitação total mensal, quinzenal e decendial: nestas séries históricas, pode-se


trabalhar considerando um mês específico do ano (de interesse regional, por
exemplo) e estudar os seus totais mensal, da 1a e 2a quinzenas e 1o, 2o e 3o
decêndios. Este estudo é importante quando se realiza balanço hídrico de culturas
visando ao manejo de irrigação. O produto gerado é conhecido como Precipitação
Provável e trabalha-se com probabilidade de excedência, ou seja, objetiva-se
garantir um valor mínimo com 75, 90 ou 95% de excedência, dependendo da cultura
em questão. Culturas de maior valor econômico trabalha-se com um nível de
10

probabilidade de excedência maior, estimando-se um valor menor de precipitação


provável, devido ao risco de prejuízos mais importantes.

c) Precipitação máxima diária anual: neste caso, toma-se, em determinado ano, a maior
precipitação diária registrada, sendo este valor 1 componente da série histórica. É
feito desta forma para vários anos, constituindo-se a série histórica. Seu estudo é
importante quando se deseja obter valores extremos máximos diários, visando ao
estudo da freqüência de ocorrência de precipitações intensas, inclusive para geração
das equações de chuvas intensas. Quando a disponibilidade de dados históricos é
pequena, pode-se trabalhar com os 2 maiores valores anuais, a fim de melhorar a
representatividade da série.

d) Precipitação máxima anual correspondente a um determinado tempo de duração da


precipitação: aqui, têm-se os mesmos objetivos anteriores, porém trabalhando-se
com pluviogramas, separando-se o valor máximo da precipitação num determinado
ano, para vários tempos de duração. Assim, constitui-se uma série histórica para
cada tempo de duração. Estas séries geram resultados mais precisos para o ajuste
da equação de chuvas intensas, pois trata-se de intensidades reais que ocorreram
num determinado local. Valores totais diários não expressam tal característica.

e) Vazões Máximas Diárias Anuais: são séries históricas aplicadas ao estudo de vazões
de cheia e de projeto em cursos d´água. São séries com característica assintótica,
assim como as de precipitações máximas, ou seja, com acúmulo de dados à
esquerda na distribuição de freqüências, gerando-se um caudal à direita.

f) Vazões Mínimas Diárias Anuais: são séries históricas muito aplicadas à hidrologia,
fundamentais em estudos ligados à disponibilidade de água em cursos d’água para
projetos e gestão de recursos hídricos. De forma semelhante às vazões máximas,
são assintóticas, com acúmulo de dados à direita na distribuição de freqüência,
gerando-se um caudal à esquerda.

g) Vazões médias anuais: são séries históricas aplicadas ao estudo do comportamento


do deflúvio médio anual, obtida pela média aritmética dos dados.

h) Evapotranspiração: séries históricas que permitem estudar o comportamento


evapotranspirativo em bacias hidrográficas. Importante nos estudos ligados ao
11

comportamento climático de regiões, bem como modelagem do balanço hídrico


climatológico.

4.5 Histogramas de Freqüência

Histogramas de freqüência dizem respeito à representação gráfica (normalmente em


barras) da freqüência de ocorrência de uma dada variável, podendo ser simples ou
acumulada (de excedência ou não excedência). A curva de permanência é um tipo de
histograma de excedência, com as classes acumulando-se à esquerda. A seguir será
apresentada a metodologia clássica para o desenvolvimento de histogramas de freqüência.

1o) Determinação do número de classes (k)

- até 100 dados = k = n


- acima de 100 dados = k = 5 ⋅ log10 (n)
onde n é o número de observações.

2o) Amplitude total dos dados (A)


A = M − m , em que M é o valor máximo observado e m, o menor valor.

3o) Amplitude de classe (Ac)


A + ∆x
Ac = , em que, ∆x é a precisão de leitura (por exemplo: dados com uma casa
k −1
decimal, a precisão é de 0,1).

4o) Limite inferior da 1a classe


Ac
LIclasse1 = m −
2
5o) Limite superior da 1a Classe
LSclasse1 = LIclasse1 + Ac

6o) As demais classes são computadas somando-se os limites à amplitude, e assim


sucessivamente.
LSclasse1 = LIclasse2
LSclasse2 = LIclasse2 + Ac
LSclasse2 = LIclasse3, e assim por diante.
12

4.6 Medidas estatísticas básicas aplicadas em hidrologia

4.6.1 Média Aritmética


A média aritmétrica de um conjunto de dados é expressa por:
n
− xi
X = i =1 (17)
n

4.6.2 Moda
É definida como sendo o valor que aparece com mais freqüência num conjunto de
dados. Quando se tem um intervalo de classe, a moda será o ponto médio da classe que
contiver o maior número de ocorrências.

4.6.3 Mediana
Corresponde ao valor que representa exatamente 50% das ocorrências. Para obtê-lo
basta avaliar as freqüências de ocorrência, independentemente de ser de excedência ou
não-excedência. Para obter o valor exato de 50%, pode-se utilizar o procedimento de
interpolação dos dados vizinhos a este valor, quando não for possível obtê-lo diretamente.

4.6.4 Variância da Amostra


2
n −
xi − x
i=1
s2 = (18)
n −1

4.6.5 Desvio Padrão da Amostra

s = s2 (19)
Ao se avaliar tanto o desvio padrão quanto a variância, observa-se que quanto maior
ambos, maior a variação dos dados em torno da média.

4.6.6 Assimetria
A assimetria é um parâmetro importante na medida em que avalia a forma como os
dados estão distribuídos em relação à média. Para que os dados apresentem distribuição
normal, a assimetria deve ser próxima ou igual a zero. Nesta situação, a média, a moda e a
mediana são iguais. Contudo, quando este valor for distante de zero, apresentará um
padrão de distribuição com a maior quantidade de dados à esquerda (assimetria positiva) ou
à direita (assimetria negativa). Em termos de dados hidrológicos, por apresentarem um
padrão com limitação inferior (normalmente, valor mínimo é zero) e sem limitação superior
13

(os eventos hidrológicos podem ser superados), a assimetria é positiva. A assimetria pode
ser calculada da seguinte forma:
3
n −
xi − x
i=1
A= (20)
n
Na prática é mais comum a utilização do coeficiente de assimetria, que representa a
relação entre a assimetria e o desvio padrão ao cubo. Este coeficiente pode ser do tipo
corrigido ou comum. O último pode ser calculado por:
A
Ca = (21)
s3
O coeficiente corrigido é determinado da seguinte forma:
3
n −
xi − x
n i=1
Ca = ⋅ (22)
(n − 1) ⋅ (n − 2) s3

Além da análise geral dos dados, a média, o desvio padrão e o coeficiente de


assimetria são extremamente importantes, pois constituem-se nos parâmetros que permitem
o ajuste das distribuições de probabilidades.

4.6.7 Curtose
Quantifica o grau de “achatamento” da distribuição de freqüência de uma
determinada amostra. A referência para curtose é a curva normal e pode ser calculada pela
seguinte equação:

4
n −
xi − x
i=1 1
Cu = ⋅ −3 (23)
n s4

Se Cu for próximo a zero, a distribuição é intermediária, sendo conhecido como


“Mesocúrtica”; se for maior que zero, os dados estão distribuídos de forma “afilada”
(“Leptocúrtica”); se for menor que zero, forma “achatada” (Platicúrtica) (Figura 4.2).
14

Figura 4.2 Comportamento da distribuição normal em função do achatamento dos dados.

4.6.8 Co-variância amostral


Quando se relaciona um conjunto de dados de uma variável com valores de outra
variável que possa explicar o comportamento da primeira, aplica-se a co-variância amostral,
onde quanto maior este valor, maior a relação entre as variáveis, ou seja, mais uma variável
explica a outra. Este coeficiente pode ser calculado pela equação:
1 n −⋅ −
cov xy = ⋅ x i ⋅ y i − x⋅ y (24)
n i=1

A co-variância pode ser negativa ou positiva. No primeiro caso, significa que valores
mais baixos de uma variável explicam valores mais altos de outra variável. No segundo, as
variáveis possuem o mesmo comportamento em termos de crescimento. Em ambos os
casos, quanto maior o valor, em módulo, maior a explicação da variável dependente.

4.6.9 Coeficiente de correlação


É um coeficiente que adimensionaliza a co-variância e busca explicar, da mesma
forma anterior, a relação entre duas variáveis. Seu valor varia de –1 a 1 e quanto mais
próximo dos extremos, maior a explicação da variável. É calculada por:
15

cov xy
r= (25)
(s x ⋅ s y )
Em que sx e sy são respectivamente, o desvio padrão das variáveis x e y.

4.7 Distribuições Contínuas de Probabilidades em Hidrologia

4.7.1 Equação Geral de Ven Te Chow

Há situações em que se necessita estimar valores de eventos associados a


recorrências muito altas, cujas freqüências não foram ainda obtidas, como é o caso de
estruturas civis, cuja falha coloque em risco vidas humanas. Nestas condições, recomenda-
se o uso de Distribuições Teóricas de Probabilidades, as quais devem ser adequadas para
estimativa das freqüências observadas, sendo que estas são determinadas pelas
características dos dados, especialmente se forem assintóticas.
Ven Te Chow1 afirma que a maioria das funções de probabilidades, aplicáveis à
Hidrologia, visando associar valor (magnitude) da variável à probabilidade de sua
ocorrência, pode ser representada pela seguinte equação:

X TR = X+ K TR ⋅ S (26)

Em que XTR é o valor da variável hidrológica associada à recorrência TR, X é a
média aritmética da série histórica, S é o desvio padrão da mesma e KTR é o fator associado
à freqüência, sendo função de TR e da distribuição de probabilidades. É também chamado
“variável reduzida”. Basicamente, este modelo geral é aplicado em quase todos os estudos
probabilísticos em hidrologia.

4.7.2 Principais Distribuições de Probabilidades em Hidrologia

As distribuições de probabilidades que serão apresentadas, com as respectivas


aplicações, são as seguintes:
- Distribuição Normal ou de Gauss: adequada para séries originais (Ex.: totais
anuais de precipitação);
- Distribuição de Gumbel para máximos (ou Assintótica de Valores Máximos
Extremos do tipo I): adequada para série de valores extremos máximos (série
de valores máximos diários de precipitação ou vazão);

1
Haan (2002).
16

- Distribuição de Gumbel para mínimos (ou Assintótica de Valores Mínimos


Extremos do Tipo I): adequada para valores mínimos extremos (série de
valores mínimos de vazão);
- Distribuição Log-Normal a 2 e 3 parâmetros: aplicável tanto a valores originais
quanto máximos e estimativa da precipitação provável;
- Distribuição Gama: aplicável para estimativa da precipitação provável e séries
históricas de valores extremos;
- Distribuição Weibull: aplicável a série histórica de vazões mínimas;
- Distribuição de Extremos de Fréchet ou Log-Gumbel: aplicação voltada para
séries históricas de valores extremos máximos, especialmente vazões
máximas;
- Distribuição Generalizada de Valores Extremos (GEV): distribuição que
engloba as distribuições de extremos Tipo I (Gumbel), Tipo II (Fréchet) e Tipo
III (Weibull).

O ajuste de uma distribuição de probabilidades é conduzido com base em 2 ou 3


parâmetros. A estimativa destes parâmetros é feita com base na Inferência Estatística,
sendo o método dos momentos, o qual calcula os parâmetros com base nos momentos
estatísticos de 1a, 2a e 3a ordem, associados, respectivamente, à média, variância e
assimetria, o mais simples. As distribuições Normal e de Gumbel possuem apenas os 2
primeiros parâmetros. A Log-Normal pode estar associada aos 2 primeiros, assim como a
Normal, ou aos 3 parâmetros. No entanto, este método, apesar de mais aplicado, é menos
preciso que outros. Os métodos da Máxima Verossimilhança e Momentos – L são também
aplicados para estimativa dos parâmetros e também serão apresentados e discutidos.

4.7.2.1 Distribuição Normal ou de Gauss


A distribuição de Gauss ou Normal (DN) é uma distribuição de probabilidades para
variável contínua, caracterizada pela média e desvio padrão. Os valores de uma série que
segue a DN se distribuem simetricamente em relação à média. Portanto, apresentam o
coeficiente de assimetria igual a zero. A relação entre os valores e a probabilidade de
ocorrência pode ser visualizada na Figura 4.3, cuja área até determinado ponto (ou valor),
no sentido da esquerda para direita, representa a probabilidade de ocorrer valores menores
ou iguais àquele valor (probabilidade de não excedência).
17

Figura 4.3 Representação da distribuição normal com seus principais parâmetros.

A função densidade de probabilidade (FDP) é dada pela seguinte equação:

−0,5⋅
(x − µ ) 2
1
FDP = f (x ) = ⋅e σ
(27)
σ 2⋅π

Em que σ é o desvio padrão e µ é a esperança ou média, ambos da população, que serão


substituídas pelo desvio padrão e média amostrais, com o 1o e 2o momentos calculados da
seguinte forma:
^ ^
σ = se µ = X (28)

A probabilidade propriamente dita é obtida pela integração da função densidade de


probabilidade (FDP), gerando a Função Cumulativa de Probabilidades (FCP). A
probabilidade de não-excedência é obtida pela integração da FDP de − ∞ a um
determinado valor X. A probabilidade de excedência é obtida com base na equação 1, já
que a integração da FDP de − ∞ a + ∞ é igual a 1. Desta forma, tem-se para a
probabilidade de não-excedência:
18

−0,5⋅
(x − µ ) 2
x 1
FCP = F(x ) = Pr ob(x ≤ x i ) = ⋅e σ
dx (29)
−∞ σ ⋅ 2 ⋅ π

Para facilitar a generalização desta relação (valor e probabilidade), propõem-se a


distribuição normal padrão, que utiliza a chamada variável reduzida ou padrão z, que mede
o desvio de uma variável em relação à média, em termos do desvio padrão, ou seja:


x−x
z= (30)
s

Observa-se que z faz o papel de KTR conforme equação geral proposta por Ven Te
Chow (equação 26). Verifica-se, portanto, que a variável KTR é equivalente a z, no caso da
DN. A distribuição normal passa a ser DN (0,1) que é a distribuição normal padrão e sua
FCP calculada por:

1 z 2
F(z ) = Pr ob (Z ≤ z ) = ⋅ e −0,5⋅z dz (31)
2 ⋅ π −∞

Em que z é a variável reduzida.


Observa-se que esta integral não apresenta solução analítica. Desta forma, pode-se
utilizar a tabela de distribuição de Gauss ou tabela de z (Tabela 4.2), a qual foi gerada a
partir da solução numérica da equação 31. Esta tabela fornece os valores de probabilidade,
de − ∞ até o valor de z que corresponde ao valor da variável hidrológica X, correspondendo
a uma tabela com probabilidades de não excedência. Além desta metodologia, pode-se
trabalhar com uma aproximação razoável, utilizando a equação abaixo:

(
Pr ob(Z ≤ z ) = 1 − f (z ) ⋅ a 1 ⋅ q + a 2 ⋅ q 2 + a 3 ⋅ q 3 ) (32)
Em que:
1 2
f (z ) = ⋅ e −0,5⋅z (33)
2⋅π

q = (1 + a 0 ⋅ z )−1 (34)
Os valores para as constantes são:
a0 = 0,33267; a1 = 0,43618; a2 = -0,12017; a3 = 0,9373

Devido à simetria da curva normal, a série pode ser dividida em valores “menores
que” e “maiores que” a média. Deve-se ressaltar que variáveis afastadas da média do
19

mesmo valor (com os mesmos desvios) têm o mesmo tempo de recorrência, independente
de ser menor ou maior que a média. Assim, se 2 valores da variável X (X1 e X2) distam da
média, o mesmo desvio, tem-se o mesmo tempo de retorno para ambas. Numa situação,
busca-se a possibilidade de um valor menor que a média voltar a se repetir e noutra, um
valor maior que a média. Nesta situação, o cálculo de TR é conduzido considerando-se as
seguintes situações:
- Para valores menores que a média, objetiva-se conhecer o valor de não-
excedência;
- Para valores maiores que a média, objetiva a probabilidade de excedência;
Pelas equações abaixo, tem-se, respectivamente, a forma de cálculo de TR para
cada situação:
1
TR = ; se o valor da variável for menor que a média;
P(x ≤ x i )

1
TR = ; se o valor da variável for maior que a média;
P(x ≥ x i )

Exemplo de Aplicação 4.2


Se a precipitação total anual média é de 1000 mm e o desvio padrão, 200 mm, qual o
TR para as precipitações de 1200 mm e 800 mm.

O cálculo de z por meio da equação 30 fornece um valor para a primeira situação,


igual a 1 e para a segunda, –1. Ao se consultar a tabela de z (Tabela 4.2), encontra-se uma
freqüência de não excedência para z = 1, de 0,84134 e para z = -1, 0,15865. Para o primeiro
caso, o cálculo de TR é dado pela segunda equação. Assim, tem-se:
1
TR = = 6,3 anos ; o valor da probabilidade de excedência foi obtido por 1 –
0,15865

0,84134 = 0,15865.
Para o segundo caso, tem-se:
1
TR = = 6,3 anos ;
0,15865

O valor da probabilidade de não excedência, neste caso, é obtido considerando-se o


aspecto de simetria dos dados, ou seja, como P(z ≤ 1) é igual a 0,84134, seu complemento

[P(z > 1)] será 0,15865. Como os valores são simétricos, P(z ≤ −1) = P(z ≥ 1) e portanto,
0,15865.
20

Tabela 4.2 Tabela de z considerando probabilidade de não excedência


z 1 z2
( F(z ) = ⋅ exp − dz ).
−∞ 2⋅π 2

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 0.5 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.10 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.20 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.30 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.40 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.50 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.60 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.70 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.80 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.90 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.00 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.10 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.20 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.30 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.40 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.50 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.60 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.70 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.80 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.90 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.00 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.10 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.20 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.30 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.40 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.50 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.60 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.70 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.80 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.90 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.00 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.10 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.20 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.30 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.40 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

Exemplo de Aplicação 4.3


Com base na série histórica de alturas pluviométricas anuais de Lavras, MG, no
período de 1914-1943, 1946-1949 e 1951-1991, obter:
a) Distribuição de freqüência (tabela e gráfico), média, mediana, moda, desvio padrão e
coeficiente de assimetria.
21

b) Utilize a distribuição de Gauss para calcular os valores máximos e mínimos esperados


para os tempos de retorno de 10, 50, 100 e 1000 anos.
c) Compare as freqüências observada e teórica, associadas às precipitações de 1068,1
mm e 2042,2 mm.
d) Qual a probabilidade de ocorrer de um ano com precipitação superior a 2000 mm
sabendo-se que já ocorreram 1600 mm?

Tabela 4.3 Alturas pluviométricas anuais para Lavras, MG, e respectiva distribuição de
freqüência.
Ordem P Fnão-exc. Ordem P Fnão-exc. Ordem P Fnão-exc.
1 747,1 0,01316 29 1353,7 0,38158 57 1696,0 0,75
2 832,4 0,02632 30 1354,7 0,39474 58 1673,2 0,76316
3 999,2 0,03947 31 1355,7 0,40789 59 1683,5 0,77632
4 1001,3 0,05263 32 1374,4 0,42105 60 1686,6 0,78947
5 1068,1 0,06579 33 1377,9 0,43421 61 1689,4 0,80263
6 1093,5 0,07895 34 1380,4 0,44737 62 1705,5 0,81579
7 1109,9 0,09211 35 1393,6 0,46053 63 1719,1 0,82895
8 1170,6 0,10526 36 1398,7 0,47368 64 1726,6 0,84211
9 1171,3 0,11842 37 1413,1 0,48684 65 1728,5 0,85526
10 1183,2 0,13158 38 1427,3 0,50 66 1794,0 0,86842
11 1184,9 0,14474 39 1428,1 0,51316 67 1816,6 0,88158
12 1187,7 0,15789 40 1430,0 0,52632 68 1820,3 0,89474
13 1196,6 0,17105 41 1443,4 0,53947 69 1832,7 0,90789
14 1204,7 0,18421 42 1445,8 0,55263 70 1933,2 0,92105
15 1216,1 0,19737 43 1448,8 0,56579 71 1938,0 0,93421
16 1216,2 0,21053 44 1450,3 0,57895 72 1951,8 0,94737
17 1217,8 0,22368 45 1453,4 0,59211 73 2042,2 0,96053
18 1246,0 0,23684 46 1479,5 0,60526 74 2130,7 0,97368
19 1263,5 0,25 47 1496,3 0,61842 75 2485,6 0,98684
20 1266,7 0,26316 48 1555,8 0,63158
21 1268,6 0,27632 49 1567,4 0,64474
22 1282,5 0,28947 50 1584,3 0,65789
23 1288,8 0,30263 51 1585,1 0,67105
24 1301,2 0,31579 52 1589,1 0,68421
25 1313,0 0,32895 53 1590,0 0,69737
26 1319,8 0,34211 54 1634,1 0,71053
27 1326,6 0,35526 55 1634,1 0,72368
28 1352,8 0,36842 56 1665,3 0,73684
22

a) Distribuição de freqüência por classes

- número de classes (k) = 75 = 8,66 ≈ 8 classes


- amplitude total (A) = 2485,6 – 747,1 = 1738,5
1738,5 + 0,1
- amplitude de classe (Ac) = = 248,4
8 −1
- LIclasse 1 = 747,1 – (248,4)/2 = 622,9
- LSclasse 1 = 622,9 + 248,4 = 871,3

Tabela 4.4 Classes e distribuição de freqüência simples e acumulada.


No Ponto médio da F simples F acumulada
Classes
observações classe não-excedência não-excedência
622,9 – 871,3 2 747,1 0,02632 0,02632
871,3 – 1119,7 3 995,5 0,06579 0,09211
1119,7 – 1368,1 24 1243,9 0,31579 0,4079
1368,1- 1616,5 22 1492,3 0,28947 0,69737
1616,5 – 1864,9 16 1740,7 0,21053 0,9079
1864,9 – 2113,3 4 1989,1 0,05263 0,96053
2113,3 – 2361,7 1 2237,5 0,01316 0,97368
2361,7 – 2610,1 1 2485,9 0,01316 0,98685

Moda: ponto da classe com maior número de observações. Portanto, 1243,9 mm.
Mediana: valor que corresponde a exatamente 50% dos dados. Na Tabela 4.1, 1427,3 mm.

Gráfico da distribuição de freqüência simples e acumulada.


23

Ca = 0,72 Observa-se que a assimetria dos dados é pequena, sugerindo-se que é possível
ajustar a distribuição normal aos dados.

b) Aplicação da distribuição normal de probabilidades



x = 1466,0 mm e s = 319,2 mm
Equação geral de Ven Te Chow:
x TR = 1466 + k TR ⋅ 319,2
Para TR = 10 anos tem-se, com base na definição deste e na condição de simetria
da curva normal:
P (x > xi) = 0,10; A probabilidade de não excedência é: P(x < xi) = 0,90. Consultando a
tabela de z, tem-se z = 1,28. Para calcular os valores máximos e mínimos procede-se da
seguinte forma:
- Valor máximo
xTR = 1466 + 1,28 * 319,2 = 1874,6 mm
- Valor mínimo
Pela simetria da curva normal, tem-se z = -1,28 e xTR = 1466 – 1,28 * 319,2 = 1057,4 mm.
Os demais tempos de retorno são obtidos a partir do mesmo procedimento.

c) Aplicacão da equação geral de Ven Te Chow


x−x
1068,1 − 1466
z= = = −1,25 → Pr ob(Z ≤ −1,25 ) = 0,10628
s 319,2

x−x
2042,2 − 1466
z= = = 1,81 → Pr ob(Z ≤ 1,81) = 0,96447
s 319,2

d) Evento A: precipitação anual superior a 2000 mm [P(X ≥ 2000 mm )]

Evento B: precipitação anual superior a 1600 mm [P(X ≥ 1600 mm )]


Busca-se estimar o evento A condicionado ao evento B, portanto:

P(A ∩ B ) P(X ≥ 1600 mm ) − P(X ≥ 2000 mm )


P(A | B ) = =
P(B ) P(X ≥ 1600 mm )
24


x−x
2000 − 1466
z= = = 1,67 → P(Z ≤ 1,67 ) = 0,9525
s 319,2
P(X ≥ 2000 mm ) = 1 − 0,9525 = 0,0475


x−x
1600 − 1466
z= = = 0,42 → P(Z ≤ 0,42) = 0,6628
s 319,2
P(X ≥ 1600 ) = 1 − 0,6628 = 0,3372

P(A ∩ B ) P(X ≥ 1600 mm) − P(X ≥ 2000 mm) 0,3372 − 0,0475


P(A | B ) = = = = 0,859
P(B ) P(X ≥ 1600 mm) 0,3372

Três observações sobre o exemplo são pertinentes:

a) À medida que TR aumenta, aumenta-se a precipitação máxima e diminui-se a mínima.


Isto ocorre porque quando o TR fica maior, menor será a probabilidade com a qual o
valor será maior (no caso de máximos) ou menor (no caso de mínimos) que um
determinado valor da variável. Isto significa que, como a probabilidade é cada vez menor
para que o evento ocorra, mais no extremo da curva normal o mesmo se encontrará.

P2 é maior que P1, assim como P1`é menor que P2`.: TR2 > TR1.
25

b) Pode-se observar também que, para probabilidades menores que 0,01316 e maiores
que 0,98684 não é possível obter o valor com base na freqüência observada, porque as
freqüências extremas correspondem a estes valores, ou seja, o tamanho da amostra
(série histórica) não foi suficiente para que se pudesse detectar e comparar os
estimados pela distribuição de probabilidades em relação às respectivas freqüências
observadas.

c) Pode-se verificar que os erros na estimativa dos eventos são pequenos, indicando que a
distribuição normal pode representar bem o fenômeno das precipitações totais anuais.
No entanto, deve-se aplicar um teste estatístico de aderência para se concluir de forma
mais efetiva, o qual será tratado em tópico específico deste capítulo.

4.7.2.2 Distribuição de Gumbel para máximos ou assintótica de valores máximos do


tipo I

A Função Densidade de Probabilidade (FDP) de Gumbel é dada por:

− α (x −µ )−e − α (x − µ )
FDP = α ⋅ e (35)

A integração da FDP fornece a função cumulativa de probabilidades (FCP):

− α(x − µ )
P(x ≤ xi ) = e− e (36)

Esta distribuição apresenta os 2 primeiros parâmetros de uma distribuição de


probabilidades, ou seja, µ e σ , que são calculados pelas expressões abaixo, considerando-
se o método dos momentos:

^ 1,2826
α= (37)
s
^ −
µ = x − 0,45 ⋅ s (38)

Em que x e s correspondem, respectivamente, à média e o desvio padrão da série
histórica.
26

Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação


abaixo, fruto da manipulação da equação 36 e da consideração de TR como função da
probabilidade de excedência:

1
− LN − LN 1 −
TR
x TR = +µ (39)
α

4.7.2.3 Distribuição Generalizada de Extremos – GEV

A distribuição GEV (do inglês “Generalized Extreme Value”) foi introduzida por
Jenkinson (1955), incorporando as 3 formas assintóticas: Gumbel (Tipo I), Fréchet (Tipo II) e
Weibull (Tipo III). Sua FDP é dada por:

1+ ξ 1
− −
1 x−µ ξ x−µ ξ
FDP = f (x ) = ⋅ 1 + ξ ⋅ ⋅ exp − 1 + ξ ⋅ (40)
σ σ σ

Em que ξ, σ e µ são, respectivamente, os parâmetros de forma, escala e posição. Se


ξ for negativo, a GEV representa a forma assintótica de valores mínimos (Tipo III) e existe

apenas para x <


(µ − σ ) . Se ξ for positivo, a GEV representa uma distribuição Tipo II
ξ

(Fréchet), definida para x >


(µ − σ ) . Se ξ = 0 , tem-se a Distribuição Gumbel. Sua FCP é
ξ
dada por:
1

x−µ ξ
FCP = P( X ≥ xi) = exp − 1 + ξ ⋅ (41)
σ

A Distribuição GEV apresenta 3 momentos estatísticos:

σ
E[x ] = x = µ + ⋅ [Γ(1 − ξ ) − 1] (42)
ξ

[ ]
2
σ
Var (x ) = ⋅ Γ(1 − 2 ⋅ ξ) − Γ 2 (1 − ξ) (43)
ξ

− Γ(1 − 3 ⋅ ξ ) + 3 ⋅ Γ(1 − ξ) ⋅ Γ(1 − 2 ⋅ ξ) − 2 ⋅ Γ 3 (1 − ξ )


γ = CA = (sin al de ξ ) ⋅ (44)
[Γ(1 − 2 ⋅ ξ) − Γ (1 − ξ )]
3
2 2
27

Para estimar os parâmetros da Distribuição GEV deve-se inicialmente calcular o


parâmetro de forma pela equação 44. Para isto, é importante observar qual sinal ξ tem para
a situação em estudo, o que é obtido mediante análise do coeficiente de assimetria
(distorção). Para ξ = 0, γ = 1,1396; valores de γ superiores a este valor, ξ < 0; valores de γ
menores que 1,1396 implica em ξ > 0 até o valor de -1/3.
A estimativa de uma variável hidrológica associada a um tempo de retorno é dada
por, considerando-se freqüência de excedência:

−ξ
σ 1
x TR = µ + ⋅ 1 − − LN 1 − (45)
ξ TR

4.7.2.4 Distribuição de Fréchet ou Log-Gumbel

Também conhecida como Distribuição de Fréchet, consiste da aplicação da


Distribuição Gumbel aos valores logaritmizados da variável hidrológica. Fréchet aplicou-a
para estudar as freqüências de vazões de cheias, sendo muito útil aos estudos que
envolvem variáveis hidrológicas máximas. Sua FDP e FCP são, respectivamente:

θ+1 θ
θ λ λ
FDP = f (x ) = ⋅ ⋅ exp − (46)
λ x x

θ
λ
FCP = P(X ≥ xi) = 1 − exp − para x > 0; θ, λ > 0 (47)
x

Sendo F(x) a freqüência de excedência. São 3 momentos estatísticos:

1
E(x ) = µ = λ ⋅ Γ 1 − para θ > 1 (48)
θ

2 1
Var (x ) = σ 2x = λ2 ⋅ Γ 1 − − Γ2 1− para θ > 2 (49)
θ θ

2
Γ 1−
θ
CV = − 1 para θ > 2 (50)
1
Γ2 1−
θ
28

A obtenção dos parâmetros desta distribuição começa com a equação 50 a partir do


coeficiente de variação; em seguida, calcula-se o parâmetro λ com a equação 48, partindo-
se da média. A estimativa de um valor x, associado a um TR, é dada por:

1

TR θ
x TR = λ ⋅ LN (51)
TR − 1

4.7.2.5 Distribuição de Gumbel para mínimos ou assintótica de valores mínimos


extremos do tipo I

Esta distribuição de probabilidades consiste de uma versão da Distribuição de

Gumbel, com a diferença de se trabalhar com séries históricas de valores mínimos,

normalmente vazões mínimas. Na estimativa do parâmetro µ, troca-se o sinal. A definição

dos parâmetros da distribuição, pelo método dos momentos, é dada por:

^ 1,2826
α= (52)
s
^ −
µ = x + 0,45 ⋅ s (53)

A FDP é definida por:

α⋅(x −µ )− eα (x − µ )
FDP = α ⋅ e (54)

A FCP é dada pela probabilidade de não excedência:

α (x − µ )
P(x ≤ x i ) = 1 − e −e (55)

Para estimativa de uma variável hidrológica x em função do TR, aplica-se a equação


abaixo, fruto da manipulação da equação 55 e da consideração de TR como função da
probabilidade de não excedência:

1
LN − LN 1 −
TR
x TR = +µ (56)
α
29

Exemplo de Aplicação 4.4


Dada uma série histórica de 16 anos de precipitação máxima diária anual para a
cidade de Lavras, MG, no período de 1915 a 1930 (Tabela 4.5). Determinar:
a) Distribuição de freqüência simples de não-excedência dos dados;
b) Aplicar as distribuições Gumbel, GEV e Fréchet e determinar a precipitação máxima
diária para TR de 5, 10 e 20 anos;
c) Determinar o TR para as precipitações máximas diárias anuais de 80 e 90 mm;

Tabela 4.5 Precipitações máximas diárias anuais para Lavras, MG no período de 1915 a
1930 e respectivas freqüências observadas de não excedência.

Ordem Precipitação F não exced. Ordem Precipitação F não exced.


(mm) (mm)
1 46,2 0,05882 9 64,2 0,52941
2 50,0 0,11765 10 66,9 0,58824
3 50,4 0,17647 11 78,2 0,64706
4 57,0 0,23529 12 78,6 0,70588
5 58,7 0,29412 13 78,7 0,76471
6 60,2 0,35294 14 80 0,82353
7 61,6 0,41176 15 85,5 0,88240
8 63,4 0,47059 16 88,5 0,94120
30

Observa-se que as distribuições se ajustaram de forma razoável às freqüências


observadas, com destaque para a distribuição GEV para os valores mais baixos da série,
Fréchet para os intermediários e Gumbel para os maiores. Contudo, nenhuma delas se
ajustou bem aos dados próximos ao valor de 80 mm, uma vez que são números muito
próximos e com freqüências distintas, dificultando o ajuste da distribuição.

a) Estimativa dos valores de precipitação associados aos TRs de 5, 10 e 20 anos

Distribuição Gumbel

Os parâmetros ajustados para esta distribuição foram: α = 0,0968; µ = 60,80. Aplicando-se


estes parâmetros à equação 39 chega-se aos seguintes valores:

TR = 5 anos.: XTR = 76,30 mm


TR = 10 anos.: XTR = 84,05 mm
TR = 20 anos.: XTR = 91,50 mm

Distribuição GEV

Para esta distribuição, os parâmetros estimados foram: ξ = 0,2329; σ = 10,69; µ = 60,8685.


Aplicando-se a equação 45, chega-se aos seguintes valores:

TR = 5 anos . : XTR = 73,56 mm;


TR = 10 anos . : XTR = 77,94 mm;
TR = 20 anos . : XTR = 81,24 mm;

Distribuição Fréchet

Os parâmetros estimados para esta distribuição foram: θ = 7,313; λ = 60,68. Aplicando-se a


equação 51, chega-se aos seguintes valores:

TR = 5 anos.: XTR = 74,5 mm;


TR = 10 anos.: XTR = 82,54 mm;
TR = 20 anos.: XTR = 91,08 mm;
31

b) Estimativa de TR para as precipitações de 80 e 100 mm

Distribuição de Gumbel

Aplicando o inverso do complemento da equação 36, chega-se a:


P = 80 mm.: TR = 7 anos
P= 90 mm.: TR = 17,4 anos

Distribuição GEV

Aplicando-se a inversa da equação 41, chega-se aos seguintes valores:


P = 80 mm.: TR = 10,6 anos
P = 90 mm.: TR = 76 anos

Distribuição Fréchet

Aplicando-se o inverso da equação 47, chega-se aos seguintes valores:


P = 80 mm.: TR = 8,1 anos
P = 90 mm.: TR = 13,4 anos

Observa-se que a Distribuição GEV tende a superestimar o TR, especialmente para


valores mais altos, por se caracterizar, neste caso como uma distribuição Tipo III, a qual
para valores máximos, consiste de uma exponencial apenas, refletindo em valores mais
elevados. A partir de valores em torno de 80 mm (observar gráfico de ajuste), a distribuição
GEV proporciona ajustes mais distantes dos valores de freqüência observados, o que não
ocorre com as outras duas distribuições.

4.7.2.6 Distribuição Log-normal a 2 parâmetros

A função densidade de probabilidades (FDP) desta distribuição a seguinte:

Ln(x )−µn
2
−0,5⋅
1 σn
FDP = ⋅e (57)
x ⋅ σn ⋅ 2 ⋅ π

Os parâmetros são determinados por:


n
(Ln(x ))
µ n = i=1 (58)
n
32

σn = desvio padrão dos dados transformados.

Os valores dos parâmetros desta distribuição podem ser estimados com base na
média e desvio padrão dos dados sem transformação logarítmica. As equações são:

−4
1 x
µn = ⋅ Ln (59)
2 −2
x + s2

−2
x + s2
σ n = Ln (60)
−2
x

Esta distribuição se assemelha à Normal, porém, trabalhando-se com o logarítmo


dos dados. A variável reduzida kTR é o próprio valor de z utilizado na Distribuição Normal.
Assim, a equação geral de Ven Te Chow é trabalhada da seguinte forma:

x TR = e µn + k TR ⋅ σn (61)

4.7.2.7 Distribuição Log-normal a 3 parâmetros

Neste caso, a FDP é dada em função de 3 parâmetros, tendo-se a seguinte


estrutura:

Ln(x −β )−µn
2
−0,5⋅
1
FDP : f (x ) =
σn
⋅e , com x ≥ β . (62)
(x − β) ⋅ σ n ⋅ 2⋅π

Para estimar os parâmetros da distribuição log-normal, com base numa série


histórica de dados, as seguintes equações são aplicadas:
− s
β = x− (63)
ηy

ηy =
(1 − φ )
23
(64)
φ1 3

(
− γ + γ2 + 4 )
0,5

φ= (65)
2
33

Com base no coeficiente de assimetria - Ca (equação 22) calcula-se γ . Com isto,

estima-se φ (equação 65), ηy (equação 64) e com base neste último valor e na média e

desvio padrão dos dados, o parâmetro β , na equação 63. Os parâmetros µn e σn são


calculados com base nas seguintes equações:

µ n = Ln
s
ηy
( )
− 0,5 ⋅ Ln η y 2 + 1 (66)

(
σ n = Ln η y 2 + 1 ) (67)

Neste caso, a variável xTR é calculada por:

x TR = e µn +k TR ⋅σn + β (68)

Exemplo de Aplicação 4.5


Determinar a precipitação provável para 10, 75 e 90% de probabilidade, com base na
série histórica de precipitação associada ao 1o decêndio (Tabela 4.6) do mês de janeiro, de
1960 a 1981, para a cidade de Lavras, MG. Calcule também, o TR para uma precipitação
decendial de 310 mm nos primeiros 10 dias de janeiro. Aplique as distribuições log-normal
2P, log-normal 3P e GEV.

1o) Aplicação da Distribuição Log-normal a 2 parâmetros


A precipitação provável sugere um estudo probabilístico de valores mínimos a serem
garantidos, ou seja, visa-se à uma probabilidade de um dado valor x superar um xi. Esta
situação diz respeito, portanto, à probabilidade de excedência.
O cálculo dos parâmetros µ n e σ n foi feito com base no cálculo da média dos dados
logaritmizados, obtendo-se para o primeiro 4,358 e para o segundo 0,8985.

- Para 10% de probabilidade, P(x>xi) = 10% .: P(x<xi) = 90%. Da tabela de z, o


valor deste, para 90% de probabilidade, é 1,28. Assim, a precipitação
provável associada a esta probabilidade:

x TR = e µn +k TR ⋅σn = e 4,358 +1,28⋅0,8985 = 246,7 mm . Disto conclui-se que, com uma


probabilidade de 10%, a precipitação provável para os primeiros 10 dias de janeiro é
de 246,7 mm.
34

- Para 75% de probabilidade, P(x>xi) = 75%.: P(x<xi) = 0,25%. Da tabela de z,


obtém-se valor aproximadamente igual a –0,67. Da mesma forma anterior, a
precipitação provável será 42,78 mm. Espera-se uma precipitação mínima
para os primeiros 10 dias de janeiro, de 42,78 mm, com 75% de
probabilidade.
- Para 90% de probabilidade, P(x>xi) = 90%.: P(x<xi) = 10%. Da tabela de z,
obtém-se este aproximadamente igual a –1,28. Da mesma forma anterior, a
precipitação provável será 24,7 mm.

Tabela 4.6 Série histórica de precipitação associada ao 1º decêndio de janeiro para Lavras,
MG, no período de 1960 a 1981, e respectivas freqüências observadas.
Ordem Precipitação Fexcedência Ordem Precipitação Fexcedência
(mm) (mm)
1 290 0,04545 12 84,8 0,54545
2 253,2 0,09091 13 78,5 0,59091
3 189,9 0,13636 14 69,9 0,63636
4 162,8 0,18182 15 53,5 0,68182
5 144,8 0,22727 16 52,4 0,72727
6 141,2 0,27273 17 42,2 0,77273
7 140,3 0,31818 18 29,2 0,81818
8 135,3 0,36364 19 25,5 0,86364
9 111,7 0,40909 20 17,6 0,90909
10 97,8 0,45455 21 8,4 0,95455
11 95,9 0,50000

Analisando os resultados, observa-se que quanto maior a probabilidade de um


evento exceder um dado valor, menor será o evento, uma vez que a probabilidade do valor
ser superado aumenta. Em contrapartida, quanto menor a probabilidade de excedência,
maior será o valor, haja vista que o risco assumido é maior (a probabilidade do valor ser
superado é maior).
Para determinar o TR para uma precipitação mínima de 340 mm, com base nesta
série histórica, procede-se da seguinte forma:
Determina-se kTR e com este valor, na tabela de z, a probabilidade de não-
excedência. Determina-se então a de excedência, e aplica-se na definição de TR para
variáveis cujos estudos interessam a sua superioridade.
35

x TR = e µn + k TR ⋅ σn = 340 = e 4,358 + k TR ⋅0,8985


k TR = 1,64
Na tabela de z, obtém-se uma P(x<xi) = 0,94949 e P(x>xi) = 0,05051. O TR será
então igual a 19,8 anos. A probabilidade do valor de 340 mm ser igualado ou superado, pelo
menos uma vez, em 20 anos, é de 0,05051.

2o) Aplicando-se o modelo Log-normal a 3 parâmetros


Neste caso, o procedimento consiste no cálculo da média, desvio padrão e
coeficiente de assimetria dos dados. Assim:

x = 105,95 mm
s = 75,07 mm
Ca = 0,9845

Aplicando a equação 65, em que Ca = γ , determina-se φ :

(
− γ + γ2 + 4 )
0,5
(
− 0,9845 + 0,9845 2 + 4 )
0,5

φ= = = 0,6223
2 2

Na seqüência, aplicando-se a equação 64, obtém-se:

2
1 − 0,6223 3
ηy =
(1 − φ ) =
23
= 0,3175
φ1 3 1
0,6223 3

Com a equação 63, determina-se o 3o parâmetro, que representa a assimetria dos


dados:

− s 75,07
β = x− = 105,95 − = −130,47
ηy 0,3175

Com estas informações, estima-se µ n e σ n com nas equações 66 e 67:

µ n = Ln
s
ηy
2
(
− 0,5 ⋅ Ln η y + 1 = Ln )
75,07
0,3175
(
− 0,5 ⋅ Ln 0,3175 2 + 1 = 5,418 )
36

( ) ( )
σ n = Ln η y 2 + 1 = Ln 0,3175 2 + 1 = 0,3099

- Para P(x>xi) = 10%, o valor de z, conforme exemplo anterior,,é 1,28. Assim, a


precipitação será:
-

x TR = e µn +k TR ⋅σn + β = e 5,418 +1,28⋅0,3099 − 130,47 = 204,71 mm

- Para P(x>xi) = 75%, o valor de z é –0,67, e a precipitação mínima será:


xTR = 52,7 mm

- Para P(x>xi) = 90%, o valor de z é de –1,28 e a precipitação será:


xTR = 21,1 mm.

Cálculo de TR para 340 mm com base na distribuição com 3 parâmetros:

kTR = 2,37.: P(x<xi) = 0,9911 e P(x>xi) = 0,0089 e TR = 112,4 anos. Nota-se uma grande
diferença entre os cálculos dos dois modelos para a estimativa deste TR.

3o Aplicando a Distribuição GEV

O cálculo da assimetria dos dados produziu um valor de 0,9845. Aplicando-se a


equação 44, considerando sinal negativo, chega-se ao valor do parâmetro de forma desta
distribuição, o qual é igual a 0,02742. Na seqüência, aplicando o momento de segunda
ordem, encontra-se o parâmetro de escala igual a 60,587. Com a equação 42 e os demais
parâmetros, é possível estimar o parâmetro de posição µ como sendo igual a 72,58. Desta
forma, com a equação 41, são estimados os valores de precipitação associados aos níveis
de probabilidade de excedência.

Para Prob (x>xi) = 90%: P = 21,5 mm;


Para Prob (x>xi) = 75%: P = 52,7 mm;
Para Prob (x>xi) = 10%: P = 204,8 mm.

Comparando-se as estimativas da precipitação pelas três distribuições ao valor


obtido com base na freqüência observada, é possível desenvolver o seguinte quadro
resumo dos resultados:
37

P(x>xi) LN 2P (mm) LN 3P (mm) GEV (mm)


10 246,7 204,7 204,8
75 42,8 52,7 52,7
90 24,7 21,1 21,5

Obs.: A análise da distribuição de probabilidades que é mais precisa pode ser obtida
mediante testes estatísticos apropriados, os quais permitirão verificar a adequação da
distribuição bem como inferir sobre sua precisão propriamente dito.

4.7.2.8 Distribuição Gama


Consiste de uma distribuição de probabilidades com ampla aplicação à hidrologia,
com destaque para precipitação provável e vazões de maneira geral. Sua Função
Densidade de Probabilidades (FDP), considerando sua versão a 2 parâmetros, é:

−x
1
FDP : f (x ) = ⋅x υ−1
⋅e β
(69)
β υ × Γ(υ)

Os parâmetros desta distribuição são β e υ, os quais podem ser obtidos por:

s2
β= (70)
X

υ=
(X) 2
(71)
s2
A função Gama de um número qualquer pode ser aproximada por2:

2π 5 p
Γ(n) = ⋅ po + i
⋅ (n + 5.5 )n+0.5 ⋅ e − (n+5.5 ) (72)
n i=1 n + i

Para esta estimativa considerar:


po = 1,000000000190015; p1 = 76,180091729471460; p2 = -86,505320329416770;
p3 = 24,014098240830910; p4 = -1,231739572450155; p5 = 1,208650973866179x10-3

No entanto, com auxílio do software Excel, é possível obter a função gama de um


número qualquer de forma rápida e precisa, utilizando a função “exp(LNGAMA(n))”, sendo n
o número cujo gama deseja-se obter.

2
Trabalho desenvolvido por Press et al. (1992) com erro absoluto menor que 2x10-10 e citado por Ferreira (2005).
38

A Função Cumulativa de Probabilidades (FCP) deve ser obtida, primeiramente, entre


cada um dos valores da variável x de forma ordenada, para posterior somatório. Para isto,
procede-se calculando as integrais para cada intervalo de x de forma numérica:

xi+1
f (x ) ⋅ dx = (x i+1 − x i ) ⋅
[f (x i ) + f (x i+1 )] (73)
xi 2

Portanto, a FCP é calculada por:

x
P(X ≤ x ) = f (x ) ⋅ dx (74)
0

A FDP para a versão a 3 parâmetros é:

− (x − µ )
1
FDP : f (x ) = ⋅ (x − µ ) υ −1
⋅e β
(75)
β υ × Γ(υ)

A estimativa dos parâmetros desta equação, com base no método dos momentos, é:
4
υ= (76)
as 2
as ⋅ s
β= (77)
2
2⋅s
µ = X− (78)
as

Em que s é o desvio padrão e as é o coeficiente de assimetria. A versão desta


distribuição a 3 parâmetros pode produzir melhores resultados, contudo, os graus de
liberdade do ajuste também podem ficar comprometidos. Alguns estudos desenvolvidos
para precipitação provável têm mostrado desempenho similar destas distribuições, optando-
se, normalmente pela versão a 2 parâmetros.

4.7.2.9 Distribuição Weibull

Esta distribuição apresenta aplicações a séries históricas de valores mínimos, sendo,


normalmente trabalhada para séries de vazões mínimas ou similares. A distribuição de
Weibull é uma derivação da distribuição Assintótica de Valores Extremos. Sua FDP é dada
por:
39

β
FDP : f (x ) = λ ⋅ β ⋅ x β −1 ⋅ e −λ⋅x (79)

A Função Cumulativa de Probabilidades (FCP) é dada por:

β
FCP : P(X ≤ x ) = 1 − e −λ⋅x (80)

Os parâmetros desta distribuição são λ e β, que estão associados à média e


variância, respectivamente, por:
1
^ 1 β 1
µ=X= ⋅ Γ 1+ (81)
λ β
2 2
^
21 2 β 2 1
σ =s = ⋅ Γ 1+ − Γ 1+ (82)
λ β β

O valor da variável x associada ao tempo de retorno (TR) pode ser calculado por:

1
1 β
Ln 1 −
TR
x= (83)

Exemplo de Aplicação 4.6


Com base nas distribuições de probabilidade Weibull, Gumbel e GEV determinar a
vazão mínima de sete dias consecutivos para os TRs de 10, 20 e 50 anos, com base numa
série histórica de vazão mínima com 7 dias consecutivos, de 68 anos para o Rio Grande, sul
de Minas Gerais (Tabela 4.7). Calcule também, o TR para uma vazão mínima esperada de 6
m3 s-1 por ambas as distribuições.
40

Tabela 4.7 Série histórica de vazões mínimas com 7 dias consecutivos do Rio Grande com
seção de controle em Madre de Deus e respectivas freqüências observadas.
Ordem Vazão Fnão-excedência Ordem Vazão Fnão-excedência
1 8,97 0.01449 35 19.49 0.50725
2 10,41 0.02899 36 19.53 0.52174
3 11,32 0.04348 37 19.67 0.53623
4 11,50 0.05797 38 19.87 0.55072
5 13,10 0.07246 39 19.89 0.56522
6 13,15 0.08696 40 19.98 0.57971
7 13,57 0.10145 41 20.11 0.59420
8 14,46 0.11594 42 20.21 0.60870
9 14,95 0.13043 43 20.39 0.62319
10 14,95 0.14493 44 20.83 0.63768
11 15,66 0.15942 45 21.08 0.65217
12 16,04 0.17391 46 21.61 0.66667
13 16,06 0.18841 47 22.11 0.68116
14 16,18 0.20290 48 22.16 0.69565
15 16,20 0.21739 49 22.40 0.71014
16 16,32 0.23188 50 22.41 0.72464
17 16,39 0.24638 51 22.72 0.73913
18 17,00 0.26087 52 22.84 0.75362
19 17,02 0.27536 53 23.19 0.76812
20 17,04 0.28986 54 23.79 0.78261
21 17,04 0.30435 55 24.76 0.79710
22 17,48 0.31884 56 24.78 0.81159
23 17,57 0.33333 57 25.16 0.82609
24 17,66 0.34783 58 25.24 0.84058
25 17,72 0.36232 59 25.41 0.85507
26 17,88 0.37681 60 25.72 0.86957
27 18,09 0.39130 61 26.60 0.88406
28 18,77 0.40580 62 26.62 0.89855
29 18,79 0.42029 63 26.96 0.91304
30 18,79 0.43478 64 27.90 0.92754
31 18,80 0.44928 65 29.24 0.94203
32 19,04 0.46377 66 30.30 0.95652
33 19,41 0.47826 67 32.50 0.97101
34 19,48 0.49275 68 38.25 0.98551

1o) Aplicação da distribuição de Weibull

Trabalhando com os dados da Tabela 4.7, calcula-se a média e desvio padrão dos
dados da mesma. Assim, tem-se:

x = 20,01 m3 s-1
s = 5,276 m3 s-1

Manipulando as equações 81 e 82, pode-se chegar à seguinte equação:


41

2
2 µ 2 1
σ = ⋅ Γ 1+ − Γ 1+ (84)
1 β β
Γ 1+
β

Com isto, é possível estimar o parâmetro β e a partir daí, com a média dos dados, o
parâmetro λ na equação 81. Respectivamente, tem-se:
β = 4,283378; λ = 1,78219 x 10-6

Aplicando-se a equação 83, para todos os TRs, tem-se:


TR = 10 anos: Q = 13 m3/s;
TR = 20 anos: Q = 10,99 m3/s;
TR = 50 anos: Q = 8,84 m3/s;

Com base na equação abaixo, calcula-se TR para Q = 6 m3 s-1, ou seja:


1
TR = β
(85)
1 − e − λ⋅ x
TR = 261 anos

2o) Aplicação da distribuição Gumbel (série de mínimos)

Cálculo dos parâmetros da distribuição:


^ 1,2826
α= = 0,2431
s
^
µ = X + 0,45 ⋅ s = 20,01 + 0,45 ⋅ 5,276 = 22,38

Para TR = 10 anos
1 1
LN − LN 1 − LN − LN 1 −
TR 10
x TR = +µ = + 22,38 = 13,12 m3/s
α 0,2431
Valendo-se do mesmo procedimento, tem-se para os demais tempos de retorno:

TR = 20 anos: Q = 10,16 m3 s-1


TR = 50 anos: Q = 6,33 m3 s-1
42

Determinação de TR:
1 1
TR = =
P(X ≤ xi) 1 − exp(− exp(α ⋅ (x − µ )))
1
TR = = 54,12 anos
1 − exp(− exp(0,2431 ⋅ (6 − 22,38 )))

3o Aplicando-se a Distribuição GEV


O coeficiente de assimetria da série histórica é igual a 0,7195, gerando os seguintes
parâmetros da GEV: σ = 0,5332; α= 5,7207; β = 18,8035. Com estes valores e aplicando a
equação correspondente, tem-se:

Para TR = 10 anos: Q = 12,79 m3/s;


Para TR = 20 anos: Q = 10,27 m3/s;
Para TR = 50 anos: Q = 7,33 m3/s.

O cálculo de TR para uma vazão mínima de 7 dias consecutivos igual a 6 m3/s,


produziu um valor de 78,5 anos.

Observações
A comparação das distribuições mostra que para valores mais altos de vazão, a
estimativa da freqüência tende a ser próxima, especialmente Weibull e GEV. Para valores
menores, observa-se discrepância nas estimativas, com a GEV mais próxima da
Distribuição Gumbel.

4.8 Estimação dos parâmetros das distribuições de probabilidades com base na


Máxima Verossimilhança

4.8.1 Definições
O Método da Máxima Verossimilhança consiste de uma metodologia desenvolvida
por Fisher em 1922, no qual se busca a maximização da probabilidade (plausibilidade) de
um parâmetro representar uma população, maximizando a densidade conjunta dos
elementos amostrais. A função de verossimilhança é matematicamente definida pelo
produtório das densidades de cada valor amostral, sendo este dado por x1, x2, x3, etc, ou
seja:

n
L = f (x1) ⋅ f (x 2) ⋅ f (x3 )...f (xn) = ∏ f (xi) (86)
i=1
43

Assim, a máxima verossimilhança consiste em encontrar o ponto de máximo da


função acima, derivando-a em relação a cada um dos seus parâmetros, e igualando-se a
zero. Supondo uma distribuição de probabilidades com 1 parâmetro, como, por exemplo,
Poisson, tem-se:

e −λ x
P(x ) = ⋅λ (87)
x!

Em que λ é o parâmetro e x uma variável aleatória discreta. Uma pergunta pode ser
feita: “Qual o melhor parâmetro λ que maximizará a probabilidade de x ser igual a 10?”
Assim, a idéia geral dos estimadores de Máxima Verossimilhança é a seguinte:

Pelo esquema acima, percebe-se que existem vários valores do parâmetro que
podem ser utilizados para calcular a probabilidade de x ser igual a 10. Matematicamente, o
que maximizará esta probabilidade é o valor de λ que satisfará a equação abaixo:

dP
=0 (88)

Para distribuições contínuas com mais de um parâmetro, tem-se uma superfície e


duas outras equações, constituindo um sistema para obtenção dos parâmetros
correspondentes ao ponto de máximo. Para facilitar a solução matemática do ponto de
44

máximo, é necessário linearizar a equação 86, obtendo-se a função logaritmo de


verossimilhança (log (L)):

n
log(L ) = log f (x1) + log f (x 2) + log f (x3 ) + ... + log f (xi) = log f (xi) (89)
i=1

Considerando uma distribuição contínua com parâmetros θ1 e θ2, tem-se:


∂ log(L )
=0
∂θ1
Sistema de Equações para obtenção dos parâmetros θ1 e θ2.
∂ log(L )
=0
∂θ2

A seguir serão apresentadas as soluções do sistema acima para as distribuições de


probabilidades apresentadas anteriormente.

4.8.2 Distribuição Normal

A Distribuição Normal é caracterizada pela seguinte expressão:

(
FDP. : f x; µ, σ 2 = ) 1
⋅ exp−
(x − µ )2 (90)
2π ⋅ σ 2 2 ⋅ σ2

Aplicando-se o conceito definido pela equação 89, tem-se:

n
L = ∏ f (xi) = ∏
n 1
⋅ exp−
(x − µ )2 =
1
exp−
1 n
(xi − µ )2 (91)
i=1 i=1 2π ⋅ σ 2 2⋅σ 2
(2π ⋅ σ )2
n
2 2σ 2
i=1

Linearizando a equação 91, tem-se:

n
2
n
ln(L ) = − ln(2π ) − ln σ 2 −
2
1
2σ 2
( ) n

i=1
(xi − µ )2 (92)

Finalmente, derivando-se a equação acima em relação a µ e σ2, igualando-se a zero,


tem-se:
45

∂ ln L n 1 n
=− + ⋅ (xi − µ )2 (93)
∂σ 2
2⋅σ 2
2σ( )2 2 i=1

∂ ln L 1 n
= 2 ⋅ (xi − µ ) (94)
∂µ σ i=1

Assim, igualando as equações acima a zero, é possível resolver em função dos


parâmetros µ e σ2, obtendo-se sua estimativa por Máxima Verossimilhança:
n
xi −
i=1
µ= =x (95)
n

σ2 =
(n − 1) ⋅ S 2 (96)
n
Observa-se que estas equações são utilizadas na maioria das vezes em que a
Distribuição Normal é aplicada.

4.8.3 Distribuição Gumbel para máximos

A FDP da distribuição Gumbel é dada por:

−α⋅(x −µ )−e − α⋅(x −µ )


f (x; α, µ ) = α ⋅ e (97)

Sua função logaritmo de verossimilhança é:

n −α⋅(xi−µ )−e − α (xi−µ )


ln L = ln(α ) ⋅ e (98)
i=1

1 n n
ln L = ⋅ ln(α ) + − α ⋅ (xi − µ ) + e − α⋅(xi−µ ) (99)
n i=1 i=1

Derivando-se em relação a α e µ, igualando-se a zero, tem-se:

n
x i ⋅ exp(− α ⋅ x i )
1 i=1
= X− (100)
α n
exp(− α ⋅ x i )
i =1
46

n
exp(− α ⋅ x i )
exp(− α ⋅ µ ) = i =1
(101)
n

A solução deste sistema de equações é desenvolvida solucionando-se a equação


100 para α e substituindo-se este valor na equação 101, encontrando-se µ.

Exemplo de Aplicação 4.7


Compare o comportamento das freqüências estimadas pela distribuição Gumbel,
com parâmetros obtidos pelos Métodos dos Momentos e da Máxima Verossimilhança. A
série histórica de chuvas máximas diárias anuais apresentada na Tabela 4.8 é do município
de Barbacena, MG.

A distribuição Gumbel ajustada com base no método dos momentos propiciou a


estimativa dos parâmetros α e µ, respectivamente iguais a 0,064829 e 68,57729. Pelo
método da máxima verossimilhança obteve-se, respectivamente, 0,0557329 e 67,74231. Os
gráficos da Figura 4.4, na seqüência, representam os ajustes das freqüências teóricas às
observadas.

Figura 4.4 Ajustes da distribuição Gumbel, por Máxima Verossimilhança (MV) e Método dos
Momentos (MM), para série histórica de precipitação máxima diária anual para a cidade de
Barbacena, MG.
47

Tabela 4.8 Série histórica de precipitação máxima diária para o município de Barbacena,
MG.
Ordem hdia Ordem hdia Ordem hdia
1 43.20 25 73.20 49 97.20
2 43.80 26 74.00 50 97.60
3 47.60 27 74.20 51 100.00
4 47.60 28 75.40 52 100
5 49.00 29 77.00 53 100.20
6 49.40 30 78.20 54 101.00
7 49.80 31 79.00 55 105.50
8 50.00 32 81.00 56 111.50
9 50.20 33 82.00 57 116.40
10 53.20 34 82.60 58 121.00
11 57.00 35 83.00
12 58.00 36 86.40
13 58.40 37 88.20
14 60 38 88.20
15 63.20 39 89.00
16 65.00 40 90.00
17 65.00 41 90.40
18 65.60 42 92.60
19 66.00 43 93.00
20 66.00 44 93.20
21 68.00 45 95.00
22 70.00 46 95.00
23 72.60 47 96.20
24 72.60 48 96.60

É possível observar um melhor ajuste da distribuição Gumbel ajustada com base em


parâmetros estimados pela Máxima Verossimilhança, avaliando maior proximidade entre as
freqüências estimadas pela distribuição e as freqüências observadas. Isto também pode ser
comprovado pelo teste Qui-quadrado, onde obteve-se um valor de 7,3 para a distribuição
ajustada por máxima verossimilhança e 13,9 para a distribuição ajustada pelo método dos
momentos, enquanto o Qui-quadrado tabelado é de 14,1. Avalia-se que por este último
método, a distribuição quase não foi adequada e a grande diferença entre os valores de Qui-
quadrado reflete a precisão do ajuste3. Detalhes da aplicação do teste de Qui-quadrado
serão apresentados em tópico específico sobre Testes de Aderência.

3
Conforme Walpole & Mayers (1978).
48

4.8.4 Distribuição Gama


A distribuição Gama possui a seguinte formulação, na forma incompleta, para sua
FDP:
−x
1
f (x; β, υ) = υ −1 β
⋅x ⋅e (102)
β υ ⋅ Γ(υ)

Sua função log-verossimilhança é dada por:


n
n
xi
ln L(β, υ) = −n ⋅ υ ⋅ ln(β ) − n ⋅ ln[Γ(υ)] + (υ − 1) ⋅ ln ln(xi) − i=1 (103)
i=1 β

As derivadas parciais de ln (L) em relação a α e β igualadas a zero produz:

X
ln(υ) − ψ(υ) = ln (104)
XG

Em que ψ(υ) corresponde à função digama de υ e X G é a média geométrica dos


dados. A função digama pode ser aproximada por uma série de potência da seguinte forma:

1 1 1 1 1
ψ (υ) ≅ ln(υ) − − + − + ... (105)
2 ⋅ υ 12 ⋅ υ 2 120 ⋅ υ 4 252 ⋅ υ 6 240 ⋅ υ 8

A solução da equação 105 permite estimar o valor de υ e assim, calcula-se β da


seguinte forma:
X
β= (106)
υ

4.8.5 Log-normal 3 parâmetros

A FDP da distribuição log-normal 3 parâmetros é dada por:

−1
⋅(log(x −a )−µ )2
1
f (x; a, σ, µ ) = ⋅e 2⋅σ 2 (107)
(x − a ) ⋅ σ ⋅ 2π
49

Para a estimativa dos parâmetros pela Máxima Verossimilhança, adota-se o seguinte


procedimento:

Faz-se x* = x – a e os parâmetros µ e σ são obtidos por:


n

i=1
(log x ) i
*

µ= (108)
n

i=1
(
log x i * − µ )
2

σ= (109)
n

Assim, o parâmetro a é testado, avaliando-se a função log-verossimilhança, até que


haja maximização desta função. A função de log-verossimilhança é dada por:

ln L(x; µ, σ, a ) = −n ⋅ log(σ ) −
n ⋅ log(2π ) n
2
( )
− log x i * −
i=1
1
2
n
(
⋅ log x i * − µ
2 ⋅ σ i=1
)
2
(110)

Exemplo de Aplicação 4.8


Compare os ajustes das freqüências teóricas às observadas para vazões mínimas
anuais do Rio Aiuruoca, região Alto Rio Grande, MG, produzidos pelas distribuições Gama
Incompleta e Log-normal 3 parâmetros, ajustadas por máxima verossimilhança à série
histórica apresentada na Tabela 4.9.
50

Tabela 4.9 Série histórica de vazões mínimas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem Vazão Ordem Vazão
1 4,71 15 7,48
2 5,34 16 7,53
3 5,72 17 7,57
4 6,00 18 7,62
5 6,18 19 7,70
6 6,43 20 7,92
7 6,45 21 8,01
8 6,72 22 8,09
9 6,81 23 8,22
10 6,87 24 8,77
11 6,95 25 8,94
12 7,05 26 9,75
13 7,13 27 10,25
14 7,40 28 10,69
29 17,50

É possível observar um ligeiro melhor ajuste da distribuição log-normal 3 parâmetros,


o que pode ser constatado também pelos valores de Qui-quadrado calculados para ambos,
onde para a distribuição log-normal 3 parâmetros este valor foi de 0,233 enquanto para
distribuição Gama de 0,297.

Figura 4.5 Ajustes das distribuições Gama e log-normal 3 parâmetros, ajustadas pela
Máxima Verossimilhança, para série histórica de vazões mínimas diárias anuais do Rio
Aiuruoca, Alto Rio Grande, MG.
51

Exemplo de Aplicação 4.9


Comparar o ajuste das distribuições Gama, Log-normal 3 parâmetros e Gumbel,
ajustadas por máxima verossimilhança, às freqüências observadas da série de vazões
máximas diárias anuais do Rio Aiuruoca, apresentadas na Tabela 4.10.

Com base nos gráficos da Figura 4.6, verifica-se que a distribuição Gumbel
apresentou um melhor ajustamento das freqüências teóricas às observadas, seguida da
distribuição log-normal 3 parâmetros. Isto pode ser comprovado pelos valores de Qui-
quadrado das distribuições, sendo igual a 3,423 para distribuição Gumbel; 4,048 para log-
normal 3 parâmetros e 4,315 para a distribuição Gama.

Tabela 4.10 Série histórica de vazões máximas diárias anuais do Rio Aiuruoca, região Alto
Rio Grande.
Ordem Vazão Ordem Vazão
1 53,8 15 95,5
2 54,3 16 98,4
3 57,8 17 105
4 66,3 18 106
5 74,9 19 120
6 75,2 20 120
7 77,3 21 136
8 77,8 22 147
9 79,4 23 155
10 85,7 24 159
11 86,8 25 162
12 88,4 26 163
13 89,2 27 174
14 93,8 28 179
29 179
52

Figura 4.6. Distribuições Gumbel, log-normal 3 parâmetros e Gama, ajustadas por Máxima
Verossimilhança, para série histórica de vazões máximas diárias anuais do Rio Aiuruoca,
Alto Rio Grande, MG.

4.8.6 Weibull
A distribuição de Weibull possui sua FDP caracterizada por:

− λ⋅ xβ
f (x; α, β ) = λ ⋅ x β −1 ⋅ β ⋅ e (111)

Em que: x ≥ 0 ;λ, β > 0

Aplicando-se os conceitos de máxima verossimilhança, chega-se ao seguinte


sistema de equações:

n
λ= n
(112)
x iβ
i=1

n
β= (113)
λ⋅
n

i=1
(x i
β
)
⋅ ln(xi) −
n

i=1
ln(x i )
53

Utilizando-se o método de Newton-Raphson, obtém-se simultaneamente, β e λ.

4.8.7 GEV
A distribuição GEV possui sua FDP dada por:

1+ ξ 1
− −
1 x−µ ξ x−µ ξ
f (x ) = ⋅ 1 + ξ ⋅ ⋅ exp − 1 + ξ ⋅ (114)
σ σ σ

Aplicando-se os conceitos de verossimilhança, chega-se à seguinte equação:

1+ ξ 1
− −
n 1 n x −µ ξ n x −µ ξ
L(µ, σ, ξ ) = ∏ f (x i ) = n ⋅ ∏ 1 + ξ ⋅ i exp − 1+ ξ ⋅ i (115)
i=1 σ i=1 σ i=1 σ

O logaritmo da função de verossimilhança produz:


1

n 1+ ξ x −µ x −µ ξ
l(x; ξ, σ, µ ) = − ln(σ ) − ⋅ ln 1 + ξ ⋅ i − 1+ ξ ⋅ i (116)
i=1 ξ σ σ

Derivando-se a equação 115 em relação aos respectivos parâmetros e fazendo-se


uma série de manipulações, chega-se ao seguinte sistema de equações:

1

1 n 1+ ξ − y i ξ
⋅ =0
σ i=1 σ

1
(x i − µ ) ⋅ (1 + ξ ) − y i − ξ
n 1 n
− + ⋅ =0 (117)
σ σ 2 i=1 yi

n
1− yi

1
ξ ⋅
1 (x − µ ) − (x i − µ ) = 0
⋅ ln(y i ) − i
i=1 ξ 2
ξ ⋅ σ ⋅ yi σ ⋅ yi

Neste caso, tem-se que:


54

xi − µ
yi = 1+ ξ ⋅ (118)
σ

Para solução do sistema de equações, sugere-se iniciá-lo com base nos parâmetros
µ, σ e ξ oriundos do método dos momentos (equações 42, 43 e 44).

Exemplo de Aplicação 4.10


Ajustar a distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, na Região Alto Rio Grande (Tabela 4.7).
Os parâmetros ajustados foram: λ = 5,6482 x 10-6; β = 3,908993 e a aderência das
freqüências observadas às teóricas representada na Figura 4.7.

Figura 4.7 Ajuste da Distribuição Weibull à série histórica de vazões mínimas de 7 dias
consecutivos do Rio Grande, seção de Madre de Deus, MG.

Exemplo de Aplicação 4.11

Ajustar a distribuição GEV ajustada por Máxima Verossimilhança e Método dos


Momentos para a série histórica de precipitação decendial do mês de janeiro da Tabela 4.6.
55

Parâmetro MV MM
σ 54,08 60,59
µ 70,74 72,58
ξ 0,088 0,0274

Gráfico dos ajustes

A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em


relação às observadas foi de 9,70% para o método dos momentos e de 9,49% para o
método da Máxima Verossimilhança, com o erro máximo de 52% para MM e de 44% para
MV. Segundo alguns autores, o desempenho da MV será superior quanto maior a série
histórica, que no caso deste exemplo, apesar de apenas 21 dados da série histórica, esta
metodologia mostrou-se ligeiramente superior.

4.9 Estimação de parâmetros das Distribuições de Probabilidades com base nos


Momentos – L

O método dos momentos – L consiste de uma abordagem estatística que permite


estimar os parâmetros de uma distribuição de probabilidades com base em mais momentos
estatísticos de ordem superior a 3, podendo permitir, em casos de pequenas amostras,
ajustar, com maior precisão, uma distribuição de probabilidades do que o Método da
Máxima Verossimilhança.
56

Hosking (1990) menciona que os valores numéricos de momentos amostrais, em


especial de pequenas amostras, podem ser muito diferentes daqueles que de fato
caracterizam uma determinada população, constituindo-se em erros de elevada magnitude
na estimativa da freqüência.
Desta forma, foram introduzidos os conceitos de momentos ponderados por
probabilidades (MPP), apresentando a seguinte expressão para estimativa dos momentos
amostrais:
N−i
^ 1 N s
αs = ⋅ ⋅ xi (119)
N i=1 N − 1
s

Em que N é o tamanho da amostra, s é um número inteiro que varia de 0 a 3 e xi a


variável hidrológica em questão. Os termos entre parênteses são obtidos pela análise
combinatória, ou seja:

N−i
=
(N − i)! (120)
s (N − i − s)!⋅s!

Os momentos que podem ser estimados pela equação 119 podem ser linearizados
de acordo com Hosking (1990), uma vez que, nesta forma, os momentos são de difícil
aplicação para modelagem (caracterização da forma e escala) de uma distribuição de
probabilidades. Assim, os momentos podem então ser estimados pelas equações, sendo
conhecidos como Momentos - L:

λ1 = α 0
λ 2 = α 0 − 2 ⋅ α1
(121)
λ 3 = α 0 − 6 ⋅ α1 + 6 ⋅ α 2
λ 4 = α 0 − 12 ⋅ α 1 + 30 ⋅ α 2 − 20 ⋅ α 3

O momento – L λ1 é equivalente à média. O coeficiente de variação, o qual está


associado ao parâmetro de escala, é dado por:

λ2
τ= (122)
λ1

Os coeficientes de assimetria e curtose são obtidos respectivamente, por:


57

λ3
τ3 = (123)
λ2

λ4
τ4 = (124)
λ2

4.9.1 Aplicação às Distribuições de Probabilidades apresentadas

a) Distribuição Normal

^
µ = λ1 = α 0 (125)
^
σ = π ⋅ λ 2 = π ⋅ (α 0 − 2 ⋅ α 1 ) (126)

b) Distribuição Gumbel para Máximos

^ ln(2)
α= (127)
λ2
^ 0,5772
µ = λ1 − ^
(128)
α

c) Distribuição Gumbel para Mínimos

^ ln(2)
α=
λ2
^ 0,5772
µ = λ1 + ^
(129)
α

d) Distribuição Gama

λ2 Γ(υ + 0,5 )
= (130)
λ1 π ⋅ Γ(υ + 1)
λ1
β= (131)
υ
58

e) GEV

( )
^
ξ = (− 1) ⋅ 7,859 ⋅ C + 2,9554 ⋅ C 2 (132)

2 ln(2)
C= − (133)
3 + τ 3 ln(3 )

τ 3 = −3 +
(
2 ⋅ 1 − 3 −ξ )
(1 − 2 )−ξ
(134)

^ λ2 ⋅ ξ
σ=
(
Γ(1 + ξ ) ⋅ 1 − 2 −ξ ) (135)

^ α
µ = λ1 − ⋅ [1 − Γ(1 + ξ )] (136)
ξ

f) Log-normal
^ z
σN = 2 ⋅ (137)
2

τ +1
Sendo z a variável Normal padrão correspondente à probabilidade .
2

^
µ N = ln(λ 1 ) −
(σN )2 (138)
2

Exemplo de Aplicação 4.12

Compare o ajuste da distribuição GEV obtido pela Máxima Verossimilhança (MV),


Método dos Momentos (MM) e Método dos Momentos – L (MML) para a série histórica de
precipitação decendial do mês de janeiro da Tabela 4.6. Os ajuste por MV e MM foram
apresentados no Exemplo de Aplicação 4.11.

Parâmetro MV MM MML
σ 54,08 60,59 60,93
µ 70,74 72,58 70,77
ξ 0,088 0,0274 0,00000104
59

Gráfico dos ajustes

A estimativa de erro médio das freqüências estimadas pelos respectivos métodos em


relação às observadas foi de 9,70% para o método dos momentos, de 9,49% para o método
da Máxima Verossimilhança e 8,54% para o método dos momentos-L, com o erro máximo
de 52% para MM, de 44% para MV e 46,3% para MML. O desempenho de MML
normalmente é superior, especialmente para séries históricas menores, conforme
comentado anteriormente.

Exemplo de Aplicação 4.13


Com base na série histórica do Exemplo de Aplicação 4.4 (série da Tabela 4.5), a
qual diz respeito à precipitação máxima diária anual, ajuste a Distribuição de Gumbel pelo
método dos Momentos-L (ML), comparando o ajuste ao obtido pelo Método dos Momentos
(MM) e calcule a precipitação máxima diária anual para os TRs de 5, 10, 50 e 100 anos.
Os respectivos ajustes produziram os seguintes parâmetros, calculando-se os erros
médios absolutos entre as freqüências observadas e estimadas em cada um dos métodos.
60

Parâmetros MM ML
0,09683 0,08930
60,7957 60,2926
Erro (%) 16,81 13,64

Graficamente:

TR MM ML
5 76,29 77,09
10 84,04 85,49
50 101,09 104,00
100 108,30 111,81

Com base nos dados de erro absoluto acima, há indicativo de que o Método dos
Momentos-L gerou maior precisão do que o Método dos Momentos. No entanto, é
importante que esta análise possa ser conduzida com base em algum teste estatístico,
permitindo uma conclusão mais apropriada.
61

Exemplo de Aplicação 4.14


Ajuste as distribuições Gama 2P e GEV pelo método dos Momentos-L, comparando
os ajustes, à mesma série histórica do Exemplo 4.13 (Série da Tabela 4.5).

Os ajustes produziram um erro médio absoluto de estimativa das freqüências


observadas de 9,94% para a Distribuição Gama e de 13,81% para a Distribuição GEV. O
erro máximo observado na primeira situação foi de 24,1% e para a segunda, de 37,6%,
apontando para um melhor desempenho da distribuição Gama quando este método de
ajuste é aplicado. Graficamente, é possível perceber o melhor ajustamento das freqüências
estimadas às observadas pela Distribuição Gama.

Exemplo de Aplicação 4.15


Com base na série histórica de vazões mínimas consecutivas de 7 dias, do Rio
Grande (Tabela 4.7), ajuste as distribuições GEV e log-normal 2P pelo método dos
Momentos-L e calcule o valor correspondente ao TR de 10 anos por ambos os modelos.

Os parâmetros ajustados para a distribuição GEV foram:


= 6,91x10-5; = 4,191; = 17,588
Os parâmetros ajustados da distribuição log-normal 2P foram:
N = 0,2588; N = 2,963
62

Para um TR de 10 anos, correspondendo a valores mínimos, portanto, probabilidade


de não excedência, estima-se uma Q7,10 para o Rio Grande na seção de controle de Madre
de Deus, um valor de 14,1 m3/s com aplicação da GEV e de 13,9 m3/s aplicando-se a
distribuição log-normal 2P. O desempenho das distribuições é semelhante.

Graficamente, tem-se:

4.10 Adequação Estatística de uma Distribuição de Probabilidades


Para a aplicação de uma distribuição de probabilidades é indispensável analisar se a
mesma representa adequadamente bem a relação funcional entre os valores do evento e as
respectivas freqüências de ocorrência dos mesmos. Para isto, há necessidade de se
comprovar previamente se a distribuição é adequada para a série histórica a ser trabalhada.
A comprovação é feita com base em testes estatísticos não paramétricos, os quais, na
seqüência, serão apresentados de forma detalhada aqueles mais usuais em hidrologia,
sendo que também são conhecidos como Testes de Aderência Estatística.

4.10.1 Teste de Kolmogorov-Smirnov


Neste teste, promove-se o cálculo da diferença entre as freqüências observadas
(amostrais) e as freqüências esperadas com base na distribuição de probabilidades,
comparando-se a maior diferença obtida a um valor que correspondente à estatística do
teste (Tabela 4.11). Esta estatística é obtida em função do tamanho da amostra (n) e nível
63

de significância (α ) a ser adotado (5% na maioria das vezes). A hipótese de nulidade a ser
testada é a Hipótese Ho de que a freqüência observada poderá ser estimada pela
distribuição de pobabilidades, ou seja, como o valor tabelado é estatisticamente nulo, pode-
se concluir que valores menores ou iguais a este serão também estatisticamente nulos.
Desta forma, tem-se:

∆F calculadom áximo ≤ ∆F tabela (n,α ) (139)

Nesta situação, a distribuição de probabilidades será adequada, pois


[∆F]calculado máximo será nulo estatisticamente e, portanto, a freqüência observada não difere
da esperada. Observa-se que apenas a máxima diferença entre as freqüências é
considerada neste teste. Desta forma, o Teste de Kolmogorov-Smirnov é inteiramente
qualitativo, significando que o mesmo permite apenas a conclusão de que a distribuição de
probabilidades é adequada ou não, não havendo embasamento suficiente para se concluir a
respeito da precisão e comparação entre distribuições distintas. Se na equação 139 ocorrer
o contrário, a distribuição não será adequada, devendo-se buscar o ajuste de outra.
64

Tabela 4.11 Valores críticos do teste de Kolmogorov-Smirnov (Adaptado de Haan, 2002).

Tamanho da Nível de Significância


Amostra (N) 0,20 0,15 0,10 0,05 0,01
1 0,900 0,925 0,950 0,975 0,995
2 0,684 0,726 0,776 0,842 0,929
3 0,565 0,597 0,642 0,708 0,829
4 0,494 0,525 0,564 0,624 0,734
5 0,446 0,474 0,510 0,563 0,669
6 0,410 0,436 0,470 0,521 0,618
7 0,381 0,405 0,438 0,486 0,577
8 0,358 0,381 0,411 0,457 0,543
9 0,339 0,360 0,388 0,432 0,514
10 0,322 0,342 0,368 0,409 0,486
15 0,268 0,283 0,304 0,338 0,404
20 0,231 0,246 0,264 0,294 0,352
25 0,210 0,220 0,240 0,264 0,320
30 0,190 0,200 0,220 0,242 0,290
40 - - - 0,210 0,250
50 - - - 0,190 0,230
60 - - - 0,170 0,210
70 - - - 0,160 0,190
80 - - - 0,150 0,180
90 - - - 0,140 -
100 - - - 0,140 -

4.10.2 Teste de Qui-quadrado

Este teste é mais rigoroso que o anterior por agrupar os dados da série histórica em
classes de freqüência e acumular os erros entre as freqüências observada e teórica, com
participação de todas as classes e não apenas a máxima diferença. A soma destes erros
(obtida pela soma dos erros de todas as classes) gera o valor de λ2calculado. A estatística do
teste é obtida por meio da tabela de λ2 (Tabela 4.12), adotando-se o valor tabelado com
base em graus de liberdade da distribuição e nível de significância. Para que a distribuição
de probabilidades tenha aderência aos dados, o valor de λ2calculado deve ser menor que o de
tabela. Assim, tem-se:
65

χ 2 calculado =
n (fobsi − f teoricoi )2 (140)
i=1 f teoricoi

Em que n é o número de classes, fobsi e fteóricoi são, respectivamente, as freqüências


observada e teórica na classe i. As classes com menos de 3 valores devem ser agrupadas
com as classes vizinhas, seguindo os critérios de aplicação do teste. Os Graus de Liberdade
a serem adotados neste teste podem ser obtidos considerando-se uma situação
intermediária entre o número de classes menos 1 e o número de classes menos número de
parâmetros da distribuição menos 1. Por exemplo: para 6 classes, os graus de liberdade
devem estar, para uma Distribuição Normal (2 parâmetros) entre 5 e 3, adotando-se 4.
Ressalta-se que para um pequeno número de classes o teste perde precisão. Para maiores
detalhes para aplicação deste teste, consultar Ferreira (2005) e Haan (2002). Um detalhe
adicional é de que a equação 140 representa uma forma de cálculo do quadrado médio do
erro e todas as freqüências participam do mesmo. Desta forma, Walpole & Myers (1978)
consideram o teste de λ2 um cálculo de precisão do ajuste da distribuição de probabilidades.
131

Tabela 4.12 Quantis superiores da distribuição Qui-quadrado associados aos graus de liberdade (v) e diferentes níveis de significância
(adaptado de Ferreira 2005).

Graus de Nível de Significância


Liberdade (v) 0,995 0,975 0,950 0,900 0,750 0,500 0,100 0,050 0,010 0,005
1 0,000039 0,000982 0,003932 0,015791 0,101532 0,455 2,706 3,841 6,635 7,879
2 0,010025 0,050636 0,102587 0,210721 0,575364 1,386 4,605 5,991 9,210 10,597
3 0,071721 0,215793 0,351843 0,584369 1,213 2,366 6,251 7,815 11,345 12,838
4 0,206989 0,484418 0,710723 1,064 1,923 3,357 7,779 9,488 13,277 14,860
5 0,411742 0,831212 1,145 1,610 2,675 4,351 9,236 11,070 15,086 16,750
6 0,675727 1,237 1,635 2,204 3,455 5,348 10,645 12,592 16,812 18,548
7 0,989256 1,690 2,167 2,833 4,255 6,346 12,017 14,067 18,475 20,278
8 1,344 2,180 2,733 3,490 5,071 7,344 13,362 15,507 20,090 21,955
9 1,735 2,700 3,325 4,168 5,899 8,343 14,684 16,919 21,666 23,589
10 2,156 3,247 3,940 4,865 6,737 9,342 15,987 18,307 23,209 25,188
15 4,601 6,262 7,261 8,547 11,037 14,339 22,307 24,996 30,578 32,801
20 7,434 9,591 10,851 12,443 15,452 19,337 28,412 31,410 37,566 39,997
25 10,520 13,120 14,611 16,473 19,939 24,337 34,382 37,652 44,314 46,928
30 13,787 16,791 18,493 20,599 24,478 29,336 40,256 43,773 50,892 53,672
40 20,707 24,433 26,509 29,051 33,660 39,335 51,805 55,758 63,691 66,766
50 27,991 32,357 34,764 37,689 42,942 49,335 63,167 67,505 76,154 79,490
60 35,534 40,482 43,188 46,459 52,294 59,335 74,397 79,082 88,379 91,952
120 83,852 91,573 95,705 100,624 109,220 119,334 140,233 146,567 158,950 163,648
240 187,324 198,984 205,135 212,386 224,882 239,334 268,471 277,138 293,888 300,182
480 403,949 421,189 430,198 440,745 458,754 479,334 520,11 532,075 555,006 563,561
∞ 850,891 876,028 889,081 904,291 930,093 959,333 1016,566 1033,193 1064,867 1076,621
132

4.10.3 Teste de Filliben


Este teste foi introduzido por Filliben em 1975 para testar (verificar) a hipótese
H0 de normalidade, tendo sido adaptada para outras distribuições. Isto significa que o
teste verificará se uma determinada amostra y1, y2, y3, ..., yN, extraída de uma
população Y com distribuição de probabilidade F(y) também poderá ser representada
pela mesma distribuição.
Para isto, o teste de aderência estimará um coeficiente de correlação (r) entre
as observações yi e os quantis teóricos wi. Os valores de wi são obtidos pela inversa
da FCP, ou seja:

wi = Fy−1 (1 − qi) (141)

Sendo Fy-1 a função inversa da distribuição F(y). Isto significa obter o valor da
variável hidrológica associada à freqüência observada q. Para a distribuição Normal, o
software Excel possui uma função conhecida como INV.NORM. Para as demais,
procede-se aplicando a estrutura da própria distribuição. A freqüência observada qi é
obtida pela seguinte equação:

i−a
qi = (142)
N + 1− 2 ⋅ a

Sendo i a posição ocupada pelo valor na série amostrada, de preferência em


ordem crescente, N é o tamanho da amostra e a é um parâmetro a ser adotado de
acordo com a distribuição. Para a distribuição Normal e log-normal, a = 0,375; para
Weibull, a = 0; Gumbel, a = 0,44; GEV e outras, a = 0,40.
O coeficiente de correlação entre wi e yi é dado por:

i=1
(y i )(
− y ⋅ wi − w )
rcalc = (143)
N

i=1
(y i −y )
2

N

i=1
(w i −w )
2

Este valor deverá ser comparado a um valor crítico de r, considerando a


distribuição em questão. Se rcalc > rcr´tic, a amostra poderá ser representada pela
respectiva distribuição. Os valores de rcritic estão apresentados nas Tabelas 4.13, 4.14
e 4.15, respectivamente para as Distribuições Normal (log-normal), Gumbel (Weibull) e
GEV (adaptadas de Stedinger et al., 1993 por Naghettini & Pinto, 2007).
133

Tabela 4.13 Valores de rcritic para as Distribuições Normal e Log-Normal.

Tamanho da Significância (α)


Amostra (N) 0,10 0,05 0,01
10 0,9347 0,9180 0,8804
15 0,9506 0,9383 0,9110
20 0,9600 0,9503 0,9290
30 0,9707 0,9639 0,9490
40 0,9767 0,9715 0,9597
50 0,9807 0,9764 0,9664
60 0,9835 0,9799 0,9710
75 0,9865 0,9835 0,9757
100 0,9893 0,9870 0,9812

Tabela 4.14 Valores de rcritic para as Distribuições Gumbel para máximos e Weibull.

Tamanho da Significância (α)


Amostra (N) 0,10 0,05 0,01
10 0,9260 0,9084 0,8630
20 0,9517 0,9390 0,9060
30 0,9622 0,9526 0,9191
40 0,9689 0,9594 0,9286
50 0,9729 0,9646 0,9389
60 0,9760 0,9685 0,9467
70 0,9787 0,9720 0,9506
80 0,9804 0,9747 0,9525
100 0,9831 0,9779 0,9596
134

Tabela 4.15 Valores de rcritic para a Distribuição GEV.

Valores do Parâmetro σ
Significância N σ = -0,30 σ = -0,20 σ = -0,10 σ=0 σ = 0,10 σ = 0,20
(α)
5 0,777 0,791 0,805 0,817 0,823 0,825
10 0,836 0,845 0,856 0,866 0,876 0,882
0,01 20 0,839 0,855 0,878 0,903 0,923 0,932
30 0,834 0,858 0,890 0,920 0,942 0,953
50 0,825 0,859 0,902 0,939 0,961 0,970
100 0,815 0,866 0,920 0,959 0,978 0,985
5 0,853 0,863 0,869 0,874 0,877 0,880
10 0,881 0,890 0,900 0,909 0,916 0,920
0,05 20 0,898 0,912 0,926 0,938 0,948 0,953
30 0,903 0,920 0,937 0,952 0,961 0,967
50 0,908 0,929 0,950 0,965 0,974 0,979
100 0,914 0,940 0,963 0,978 0,985 0,989
5 0,888 0,892 0,896 0,899 0,901 0,903
10 0,904 0,912 0,920 0,927 0,932 0,936
0,10 20 0,920 0,932 0,943 0,952 0,958 0,962
30 0,928 0,941 0,953 0,962 0,969 0,973
50 0,935 0,950 0,963 0,973 0,979 0,982
100 0,944 0,961 0,974 0,983 0,988 0,991

4.10.4 Teste de Anderson-Darling


Este teste tem grande aplicabilidade em situações nas quais os dados
apresentam assimetria nas suas distribuições de freqüência, ou seja, séries históricas
caracterizadas por valores extremos, tanto no contexto de mínimos quanto de
máximos. Os demais testes analisam e comparam as freqüências observadas às
teóricas e normalmente verificam distorção significativa apenas em freqüências
intermediárias e não analisam de forma mais específica, os dados extremos (caudais).
Assim, distribuições do tipo Gumbel, log-normal, Weibull, GEV e log-Gumbel, dentre
outras, devem ser testadas por este teste sempre que possível.
Além desta aplicação, segundo Sharda et al. (2008) e D’Agostino & Stephens
(1986), este teste pode ser aplicado para analisar a “bondade do ajuste”, ou seja, a
precisão do mesmo quando se deseja comparar duas ou mais distribuições. A
estatística deste teste é a seguinte:

N
1
AD 2 = −N − ⋅ [(2 ⋅ i − 1)(ln(Pi ) + ln(1 − Pi ))] (144)
N i=1
135

Em que N é o tamanho da amostra, i é a posição de cada um dos dados na


série histórica posicionada em ordem crescente e Pi é o corresponde à probabilidade
calculada pela respectiva distribuição. O valor de AD2 deve ser comparado a um valor
crítico p, considerando um nível de significância α. Se AD2 > p (α), rejeita-se a
hipótese Ho de que a distribuição se ajusta de forma adequada aos dados de
freqüência. Na Tabela 4.16 estão apresentados os valores da estatística p (α) do teste
para as distribuições log-normal (normal), Weibull ou Gumbel, de acordo com
D’Agostino & Stephens (1986) e Naghettini & Pinto (2007).

Tabela 4.16 Valores críticos de p (α) para as distribuições log-normal (ou normal) e
Weibull e Gumbel.
Dsitribuição α p (α) Correção de A2
0,10 0,631
Normal ou log-normal 0,05 0,752 0,75 2,25
1+ + 2
0,025 0,873 N N
0,01 1,035
0,10 0,637
Weibull ou Gumbel para 0,05 0,757 0,2
1+
máximos 0,025 0,877 N
0,01 1,038
Adaptado de D”Agostino & Stephens (1986) e Naghettini & Pinto (2007).

Exemplo de Aplicação 4.16


Verificar pelos testes de adequação de Kolmogorov-Smirnov, Qui-quadrado,
Filliben e Anderson-Darling a aplicação da Distribuição Normal à série histórica de
precipitação total anual do Exemplo de Aplicação 4.3.
136

a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)


Prec. (mm) z fteórica fcalc. ∆f Prec. (mm) z fteórica fcalc. ∆f
747,1 -2,25 0,0122 0,0132 0,00094 1427,3 0,4522 0,5132
832,4 -1,98 0,0239 0,0263 0,00247 1428,1 -0,12 0,4522 0,5132 0,0609
999,2 -1,46 0,0721 0,0395 0,03267 1430,0 -0,11 0,4562 0,5263 0,0701
1001,3 -1,46 0,0721 0,0526 0,01951 1443,4 -0,07 0,4721 0,5395 0,0674
1068,1 -1,25 0,1056 0,0658 0,03985 1445,8 -0,06 0,4761 0,5526 0,0766
1093,5 -1,17 0,121 0,0789 0,04205 1448,8 -0,05 0,4801 0,5658 0,0857
1109,9 -1,12 0,1314 0,0921 0,03924 1450,3 -0,05 0,4801 0,5790 0,0989
1170,6 -0,93 0,1761 0,1053 0,07087 1453,4 -0,04 0,4840 0,5921 0,1081
1171,3 -0,92 0,1788 0,1184 0,06036 1479,5 0,04 0,5160 0,6053 0,0893
1183,2 -0,89 0,1867 0,1316 0,05515 1496,3 0,09 0,5359 0,6184 0,0826
1184,9 -0,88 0,1894 0,1447 0,04468 1555,8 0,28 0,6103 0,6316 0,0213
1187,7 -0,87 0,1922 0,1579 0,03426 1567,4 0,32 0,6255 0,6447 0,0192
1196,6 -0,84 0,2005 0,1711 0,0294 1584,3 0,37 0,6443 0,6579 0,0136
1204,7 -0,82 0,2061 0,1842 0,02189 1585,1 0,37 0,6443 0,6711 0,0268
1216,1 -0,78 0,2177 0,1974 0,020032 1589,1 0,39 0,6517 0,6842 0,0325
1216,2 -0,78 0,2177 0,2105 0,00716 1590,0 0,39 0,6517 0,6974 0,0456
1217,8 -0,78 0,2177 0,2237 0,00599 1634,1 0,53 0,7019 0,7105 0,0086
1246 -0,69 0,2451 0,2368 0,00825 1634,1 0,53 0,7019 0,7237 0,0217
1263,5 -0,63 0,2643 0,25 0,01434 1665,3 0,62 0,7324 0,7368 0,0045
1266,7 -0,62 0,2676 0,2632 0,00446 1673,2 0,65 0,7422 0,75 0,0079
1268,6 -0,62 0,2676 0,2763 0,0087 1683,5 0,68 0,7517 0,7632 0,0114
1282,5 -0,57 0,2843 0,2895 0,00514 1686,6 0,69 0,7549 0,7763 0,0214
1288,8 -0,56 0,2877 0,3026 0,0149 1689,4 0,70 0,7580 0,7895 0,0314
1301,2 -0,52 0,3015 0,3158 0,01426 1696 0,72 0,7642 0,8026 0,0384
1313 -0,48 0,3156 0,3289 0,01334 1705,5 0,75 0,7734 0,8158 0,0424
1319,8 -0,46 0,3228 0,3421 0,01936 1719,1 0,79 0,7852 0,8289 0,0437
1326,6 -0,44 0,3299 0,3553 0,0253 1726,6 0,82 0,7939 0,8421 0,0482
1352,8 -0,35 0,3632 0,3684 0,00526 1728,5 0,82 0,7939 0,8553 0,0614
1353,7 -0,35 0,3632 0,3816 0,01842 1794,0 1,03 0,8485 0,8684 0,0199
1354,7 -0,35 0,3632 0,3947 0,03158 1816,6 1,10 0,8643 0,8816 0,0173
1355,7 -0,35 0,3632 0,4079 0,04473 1820,3 1,11 0,8665 0,8947 0,0282
1374,4 -0,29 0,3859 0,4211 0,03515 1832,7 1,15 0,8749 0,9079 0,0329
1377,9 -0,28 0,3897 0,4342 0,04448 1933,2 1,46 0,9279 0,9210 0,0068
1380,4 -0,27 0,3936 0,4474 0,05379 1938,0 1,48 0,9306 0,9342 0,0037
1393,6 -0,23 0,4090 0,4605 0,05149 1951,8 1,52 0,9357 0,9474 0,0116
1398,7 -0,21 0,4168 0,4737 0,05685 2042,2 1,81 0,9649 0,9605 0,0043
1413,1 -0,17 0,4325 0,4868 0,05434 2130,7 2,08 0,9812 0,9737 0,0076
1427,3 -0,12 0,4522 0,5 0,04776 2485,6 3,19 0,9993 0,9868 0,0124
∆fcalc. máximo = 0,1081

Da tabela de valores da estatística do teste de Kolmogorov-Smirnov (Tabela


4.11), tem-se que ∆f(75,5%) = 0,155.
137

Conclusão: Como o valor calculado máximo é menor que o tabelado, conclui-se que a
Distribuição Normal foi adequada a esta série histórica de precipitação total anual.

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)


Observar procedimento estatístico desenvolvido no Exemplo de Aplicação 4.3,
para separação por classes de freqüência.
2
z Fteórica λ
Classes Fobs
LI LS
622,9 1119,7 7 -2,64 -1,08 10,11 0,959
1119,7 1368,1 24 -1,08 -0,31 18,04 1,968
1368,1 1616,5 22 -0,31 0,47 22,64 0,018
1616,5 1864,9 16 0,47 1,25 15,97 0,0
1864,9 2610,1 6 1,25 3,58 7,92 0,463
75 3,408

Exemplo de cálculos para a 1º classe


Com a média e o desvio padrão dos dados determina-se o valor de z para os limites
superior e inferior:

x = 1458,6 mm
s = 298,2 mm
622,9 − 1458,6
z= = −2,64
298,2
1119,7 − 1458,6
z= = −1,08
298,2
Na tabela de z encontram-se as probabilidades de não excedência de 0,00413
e 0,13898 respectivamente, para os limites inferior e superior. Assim, a freqüência
teórica para esta classe será:

Fteórica = (0,13898 − 0,00413 ) * 75 = 10,11

O valor de λ2 para o intervalo de classe será dado por:

(7 − 10,11) 2
λ2 = = 0,959
10,11
Após o cálculo dos valores de λ2 para as demais classes, estes devem ser
somados e comparados ao valor do λ2 tabelado. A distribuição será adequada se
λ2calculado ≤ λ2tabelado. Os graus de liberdade deste exemplo estarão entre 4 (5 classes –
1) e 2 (5 classes – 2 parâmetros – 1), adotando-se 3.
138

No exemplo, λ2calculado = 3,41 e λ2tab(0,05; 3) = 7,815. Portanto, a Distribuição Normal é


adequada a esta série histórica de precipitação total anual.

c) Teste de Filliben
O valor de qi, considerando-se N = 75 e a = 0,375, para i =1 produz valor de
0,008197, substituindo i =1 na equação 142. A inversa da Distribuição Normal, obtida
pela função INV.NORM do Excel, retorna um valor de 738,14 mm para esta
freqüência. Procede-se desta forma para os demais valores de precipitação ordenados
em ordem crescente.
O cálculo do coeficiente de correlação (equação 143) produz um valor de r
igual a 0,975. Consultando a Tabela de valores para rcrítico da DN, para nível de
significância de 0,05 e N = 75, obtém-se valor de 0,984. Como rcalc. < rcrítico, a amostra
não poderá ser representada pela Distribuição Normal.

d) Teste de Anderson-Darling
A estatística deste teste produziu AD2 igual a 0,874, o qual foi corrigido para
0,883 (os dados de posição e freqüência teórica estão apresentados na tabela do teste
de Kolmogorov-Smirnov). Adotando-se p (0,05), na Tabela 4.16, encontra-se valor de
0,752. Portanto, como AD2 é maior que p (0,05), rejeita-se a hipótese Ho de que a
série histórica pode ser representada pela Distribuição Normal.

Exemplo de Aplicação 4.17


Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Anderson-Darling
para verificação da adequação da distribuição Gumbel à série histórica de precipitação
máxima diária anual do Exemplo de Aplicação 4.4.
139

a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)


Precipitação (mm) z (kTR) fteórica fcalculado ∆f
46,2 -1,55 0,016622 0,058824 0,042368
50,0 -1,26 0,059317 0,117647 0,059405
50,4 -1,23 0,065988 0,176471 0,111588
57,0 -0,74 0,234492 0,235294 0,0007
58,7 -0,61 0,292971 0,294118 0,000324
60,2 -0,49 0,349022 0,352941 0,00626
61,6 -0,39 0,396151 0,411765 0,015274
63,4 -0,25 0,461246 0,470588 0,010892
64,2 -0,19 0,488444 0,529412 0,042309
66,9 0,01 0,574377 0,588235 0,01351
78,2 0,86 0,829884 0,647059 0,183609
78,6 0,89 0,835743 0,705882 0,130658
78,7 0,90 0,837656 0,764706 0,073274
80 1,00 0,855703 0,823529 0,032148
85,5 1,42 0,913063 0,882353 0,030184
88,5 1,64 0,933702 0,941176 0,007346

∆fcalc. máximo = 0,184; ∆f(16,5%) = 0,328

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição de Gumbel foi adequada para esta série histórica de precipitação máxima
diária anual.

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)


Seguindo-se o mesmo raciocínio apresentado no exemplo anterior, tem-se:
K= 4,0 Classes
A = 42,3
Ac = 14,13
LIclasse 1 = 39,13
LIclasse 2 = 53,27

Reagrupando, tem-se:
ktr Ytr 2
Classe Fobs P(x≤xi) Fteór λ
LI LS LI LS
39,13 53,27 3 -2,09 -1,02 -2,10 -0,73 0,0003 0,1259 2,01 0,488
53,27 67,40 7 -1,02 0,05 -0,73 0,64 0,1259 0,5900 7,43 0,024
67,40 95,67 6 0,05 2,18 0,64 3,38 0,5900 0,9664 6,02 0,000
16 0,513
140

Os graus de liberdade, neste caso, estariam entre 0 e 2, portanto, 1. No


entanto, como o número de classes, definido de acordo com os critérios estatísticos é
pequeno, pode-se considerar o grau de liberdade igual a 2.
λ2calculado = 0,513
λ2tab(0,05;2) = 5,991

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se, com ressalva
devido ao baixo valor dos graus de liberdade, que a distribuição de Gumbel foi
adequada à série histórica de precipitação máxima diária anual apresenta.

c) Anderson-Darling
De acordo com os dados da tabela aplicada ao teste de Kolmogorov-Smirnov,
foi calculado um valor de AD2 igual a 0,500 que corrigido pela respectiva equação
(Tabela 4.16), é igual a 0,525. Considerando p (0,05), o valor crítico da estatística é
0,757. Como AD2 é menor que p (0,05), aceita-se a hipótese Ho de que a série
histórica possa ser representada pela distribuição Gumbel.

Exemplo de Aplicação 4.18


Aplicar os testes de Kolmogorov-Smirnov e Qui-quadrado para verificação da
adequação de cada uma das distribuições de probabilidades aplicadas à série
histórica de precipitação decendial do Exemplo de Aplicação 4.5, acrescidas das
distribuições Normal, Gumbel e Gama.
141

Distribuição Log-normal a 2 parâmetros


a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm) z fteórico fcalculado ∆f
8,4 -2,48 0,00656 0,045455 0,038895
17,6 -1,66 0,04845 0,090909 0,042459
25,5 -1,25 0,10564 0,136364 0,030724
29,2 -1,09 0,13785 0,181818 0,043968
42,2 -0,69 0,24509 0,227273 0,017817
52,4 -0,44 0,32996 0,272727 0,057233
53,5 -0,42 0,33724 0,318182 0,019058
69,9 -0,12 0,45224 0,363636 0,088604
78,5 0,01 0,50398 0,409091 0,094889
84,8 0,09 0,53585 0,454545 0,081305
95,9 0,23 0,59095 0,5 0,09095
97,8 0,25 0,5987 0,545455 0,053245
111,7 0,40 0,65542 0,590909 0,064511
135,3 0,61 0,72906 0,636364 0,092696
140,3 0,65 0,74215 0,681818 0,060332
141,2 0,66 0,74537 0,727273 0,018097
144,8 0,69 0,7549 0,772727 0,017827
162,8 0,82 0,79389 0,818182 0,024292
189,9 0,99 0,83891 0,863636 0,024726
253,2 1,31 0,9049 0,909091 0,004191
290 1,46 0,92785 0,954545 0,026695

∆fcalc. máximo = 0,095; ∆f( 20,5%) ≈ 0,294

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de dados
de precipitação decendial do mês de janeiro.

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)


kTR 2
Classe Fobs Fcalc λ
LI LS
1 2
0,1 94 10 -4,0 0,21 12,23 0,407
94 187,9 8 0,21 0,98 5,33 1,338
187,9 375,7 3 0,98 1,75 2,60 0,062
21 1,886
1 2
Este valor foi adotado para permitir aplicação da distribuição log-normal; Adotado devido ao fato de que
para z < que -4, a probabilidade é praticamente zero, sendo o limite inferior da tabela de z.
142

λ2calculado = 1,886; λ2tab(0,05,2) = 5,991.


Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 2 parâmetros foi adequada a esta série histórica de
precipitação decendial do mês de janeiro apresentada.

Distribuição Log-normal a 3 parâmetros.


a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm) z fteórico fcalculado ∆f
8,4 -1,56 0,05938 0,045455 0,013925
17,6 -1,36 0,08691 0,090909 0,003999
25,5 -1,19 0,11702 0,136364 0,019344
29,2 -1,11 0,15624 0,181818 0,025578
42,2 -0,86 0,19489 0,227273 0,032383
52,4 -0,68 0,24825 0,272727 0,024477
53,5 -0,66 0,25462 0,318182 0,063562
69,9 -0,38 0,35197 0,363636 0,011666
78,5 -0,24 0,40516 0,409091 0,003931
84,8 -0,15 0,44038 0,454545 0,014165
95,9 0,01 0,50398 0,5 0,00398
97,8 0,04 0,51595 0,545455 0,029505
111,7 0,23 0,59095 0,590909 4,1E-05
135,3 0,53 0,70194 0,636364 0,065576
140,3 0,59 0,7224 0,681818 0,040582
141,2 0,60 0,72574 0,727273 0,001533
144,8 0,64 0,73891 0,772727 0,033817
162,8 0,85 0,80233 0,818182 0,015852
189,9 1,13 0,87076 0,863636 0,007124
253,2 1,72 0,95728 0,909091 0,048189
290 2,01 0,97778 0,954545 0,023235
∆fcalc. máximo = 0,066; ∆f(16,5%) ≈ 0,294

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição Log-normal a 3 parâmetros foi adequada a esta série histórica de
precipitação decendial.
143

b) Qui-quadrado (ao nível de significância de 5% de probabilidade)


kTR 2
Classe Fobs Fcalc λ
LI LS
0,1 94 10 -1,76 -0,01 9,59 0,018
94 187,9 8 -0,01 1,11 7,78 0,006
187,9 375,7 3 1,11 2,61 2,71 0,031
21 0,055

λ2calculado = 0,055; λ2tab(0,05,2) = 5,991


Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Log-normal a 3 parâmetros foi adequada à série histórica de precipitação
decendial do mês de janeiro apresentada.

Distribuição Normal
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm) z fteórico fcalculado ∆f
8,4 -1,30 0,0968 0,045455 0,051345
17,6 -1,18 0,119 0,090909 0,028091
25,5 -1,07 0,1423 0,136364 0,005936
29,2 -1,02 0,15386 0,181818 0,027958
42,2 -0,85 0,19766 0,227273 0,029613
52,4 -0,71 0,23885 0,272727 0,033877
53,5 -0,70 0,24196 0,318182 0,076222
69,9 -0,48 0,31561 0,363636 0,048026
78,5 -0,37 0,35569 0,409091 0,053401
84,8 -0,28 0,38973 0,454545 0,064815
95,9 -0,13 0,44828 0,5 0,05172
97,8 -0,11 0,4562 0,545455 0,089255
111,7 0,08 0,53188 0,590909 0,059029
135,3 0,39 0,65173 0,636364 0,015366
140,3 0,46 0,67724 0,681818 0,004578
141,2 0,47 0,68082 0,727273 0,046453
144,8 0,52 0,69846 0,772727 0,074267
162,8 0,76 0,77637 0,818182 0,041812
189,9 1,12 0,86864 0,863636 0,005004
253,2 1,96 0,975 0,909091 0,065909
290 2,45 0,99285 0,954545 0,038305

∆fcalc. máximo = 0,089255; ∆f(16,5%) ≈ 0,294

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição normal foi adequada a esta série histórica de precipitação decendial.
144

b) Qui-quadrado (ao nível de significância de 5% de probabilidade)


kTR 2
Classe Fobs Fcalc λ
LI LS
0,1 94 10 -1,41 -0,16 7,50 0,833
94 187,9 8 -0,16 1,09 8,94 0,099
187,9 375,7 3 1,09 3,59 2,89 0,004
21 0,936

λ2calculado = 0,936; λ2tab(0,05,2) = 5,991


Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição normal foi adequada para a série histórica de precipitação decendial do
mês de janeiro apresentada.

Distribuição Gumbel
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm) fteórico fcalculado ∆f
8,4 0,05123 0,045455 0,005775
17,6 0,078914 0,090909 0,011995
25,5 0,108729 0,136364 0,027635
29,2 0,124553 0,181818 0,057265
42,2 0,188568 0,227273 0,038705
52,4 0,246205 0,272727 0,026522
53,5 0,252712 0,318182 0,06547
69,9 0,353631 0,363636 0,010005
78,5 0,407583 0,409091 0,001508
84,8 0,446659 0,454545 0,007886
95,9 0,513357 0,5 0,013357
97,8 0,524403 0,545455 0,021052
111,7 0,60104 0,590909 0,010131
135,3 0,711614 0,636364 0,07525
140,3 0,731708 0,681818 0,04989
141,2 0,735203 0,727273 0,00793
144,8 0,748813 0,772727 0,023914
162,8 0,808388 0,818182 0,009794
189,9 0,874674 0,863636 0,011038
253,2 0,95559 0,909091 0,046499
290 0,976061 0,954545 0,021516

∆fcalc. máximo = 0,07525; ∆f(16,5%) ≈ 0,294

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição Gumbel foi adequada a esta série histórica de precipitação decendial.
145

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)


P(X<xi) 2
Classe Fobs Fcalc λ
LI LS
0,1 94 10 0,0325 0,5023 9,87 0,0017
94 187,9 8 0,5023 0,8708 7,74 0,0087
187,9 375,7 3 0,8708 0,9944 2,60 0,0615
21 0,072

λ2calculado = 0,072; λ2tab(0,05,2) = 5,991


Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Gumbel foi adequada para a série histórica de precipitação decendial do
mês de janeiro apresentada.

Distribuição Gama
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Precipitação (mm) fteórico fcalculado ∆f
8,4 0,00258 0,045455 0,042875
17,6 0,035235 0,090909 0,055674
25,5 0,075316 0,136364 0,061047
29,2 0,096836 0,181818 0,084982
42,2 0,179912 0,227273 0,047361
52,4 0,249833 0,272727 0,022894
53,5 0,25746 0,318182 0,060722
69,9 0,368768 0,363636 0,005131
78,5 0,424579 0,409091 0,015488
84,8 0,463693 0,454545 0,009147
95,9 0,528364 0,5 0,028364
97,8 0,538869 0,545455 0,006585
111,7 0,610467 0,590909 0,019558
135,3 0,711435 0,636364 0,075071
140,3 0,729602 0,681818 0,047784
141,2 0,73276 0,727273 0,005487
144,8 0,745065 0,772727 0,027663
162,8 0,799275 0,818182 0,018907
189,9 0,860971 0,863636 0,002666
253,2 0,944314 0,909091 0,035223
290 0,966266 0,954545 0,011721

∆fcalc. máximo = 0,0849; ∆f(16,5%) ≈ 0,294

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição Gama foi adequada a esta série histórica de precipitação decendial.
146

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)


P(X<xi) 2
Classe Fobs Fcalc λ
LI LS
0,1 94 10 0,0 0,5225 10,97 0,086
94 187,9 8 0,5225 0,8635 7,16 0,099
187,9 375,7 3 0,8635 0,9926 2,71 0,031
21 0,216

λ2calculado = 0,216; λ2tab(0,05,2) = 5,991


Conclusão: Pode-se observar que todas as distribuições de probabilidades testadas,
podem ser aplicadas à série histórica apresentada. Isto é importante, uma vez que na
aplicação da distribuição de probabilidades a um conjunto de dados quaisquer (não
necessariamente precipitação) de natureza desconhecida, deve-se testar as
distribuições e verificar qual possui o melhor ajuste, que pode ser analisado com base
nos valores de Qui-quadrado. Neste caso, em específico, o melhor ajuste foi obtido
pela distribuição log-normal 3 P, seguida da Distribuição Gumbel, pois seus valores de
Qui-quadrado calculados foram menores que os obtidos pelas outras distribuições.

Exemplo de Aplicação 4.19


Aplicar os testes de Kolmogorov-Smirnov, Qui-quadrado e Filliben para
verificação da adequação das distribuições Weibull, Gumbel e GEV para mínimos
aplicadas ao estudo de freqüência da série histórica de vazões mínimas com 7 dias
consecutivos (Exemplo de Aplicação 4.6).
147

Distribuição Weibull
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)
Ordem Vazão Fobs. Festim. Delta F Ordem Vazão Fobs. Festim. Delta F
1 8.97 0.01449 0.021255 0.006763 35 19.49 0.50725 0.449543 0.057703
2 10.41 0.02899 0.03986 0.010874 36 19.53 0.52174 0.452106 0.069633
3 11.32 0.04348 0.056575 0.013097 37 19.67 0.53623 0.462479 0.073753
4 11.50 0.05797 0.060377 0.002406 38 19.87 0.55072 0.476845 0.073879
5 13.10 0.07246 0.103095 0.030631 39 19.89 0.56522 0.478307 0.08691
6 13.15 0.08696 0.104699 0.017742 40 19.98 0.57971 0.484789 0.094921
7 13.57 0.10145 0.11891 0.017461 41 20.11 0.59420 0.494641 0.099562
8 14.46 0.11594 0.153046 0.037104 42 20.21 0.60870 0.501782 0.106913
9 14.95 0.13043 0.17423 0.043796 43 20.39 0.62319 0.515041 0.108147
10 14.95 0.14493 0.17436 0.029432 44 20.83 0.63768 0.547724 0.089957
11 15.66 0.15942 0.208418 0.048998 45 21.08 0.65217 0.566047 0.086126
12 16.04 0.17391 0.228177 0.054264 46 21.61 0.66667 0.604493 0.062173
13 16.06 0.18841 0.229246 0.040841 47 22.11 0.68116 0.64057 0.040589
14 16.18 0.20290 0.235722 0.032823 48 22.16 0.69565 0.64423 0.051422
15 16.20 0.21739 0.236811 0.01942 49 22.40 0.71014 0.661379 0.048766
16 16.32 0.23188 0.243288 0.011404 50 22.41 0.72464 0.66238 0.062258
17 16.39 0.24638 0.247301 0.000924 51 22.72 0.73913 0.683783 0.055348
18 17.00 0.26087 0.282503 0.021633 52 22.84 0.75362 0.691787 0.061836
19 17.02 0.27536 0.283876 0.008514 53 23.19 0.76812 0.714979 0.053137
20 17.04 0.28986 0.285254 0.004601 54 23.79 0.78261 0.753934 0.028675
21 17.04 0.30435 0.285254 0.019094 55 24.76 0.79710 0.810447 0.013346
22 17.48 0.31884 0.312235 0.006606 56 24.78 0.81159 0.811692 9.75E-05
23 17.57 0.33333 0.317937 0.015396 57 25.16 0.82609 0.831429 0.005342
24 17.66 0.34783 0.323687 0.024139 58 25.24 0.84058 0.835776 0.004804
25 17.72 0.36232 0.327547 0.034772 59 25.41 0.85507 0.844275 0.010797
26 17.88 0.37681 0.338127 0.038684 60 25.72 0.86957 0.858774 0.010791
27 18.09 0.39130 0.351907 0.039397 61 26.60 0.88406 0.895732 0.011674
28 18.77 0.40580 0.398175 0.007622 62 26.62 0.89855 0.896598 0.001953
29 18.79 0.42029 0.399272 0.021018 63 26.96 0.91304 0.90871 0.004334
30 18.79 0.43478 0.399771 0.035012 64 27.90 0.92754 0.937555 0.010019
31 18.80 0.44928 0.400269 0.049006 65 29.24 0.94203 0.966363 0.024334
32 19.04 0.46377 0.417267 0.046501 66 30.30 0.95652 0.980734 0.024212
33 19.41 0.47826 0.443878 0.034383 67 32.50 0.97101 0.995158 0.024143
34 19.48 0.49275 0.448615 0.044139 68 38.25 0.98551 0.999978 0.014471

∆fcalc. máximo = 0,1081; ∆f( 68,5%) ≈ 0,160

Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a


distribuição Weibull foi adequada a esta série histórica de vazões mínimas com 7 dias
consecutivos.
148

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)

2
Classes Fobs. Prob (X<xi) Fteo. λ

6,87 15,27 10 0,00683 0,1892 12,40 0,465


15,27 19,47 23 0,1892 0,4479 17,59 1,664
19,47 23,67 20 0,4479 0,7462 20,28 0,004
23,67 27,87 10 0,7462 0,9368 12,96 0,676
27,87 40,47 5 0,9368 1,0 4,30 0,114
68 2,92

λ2calculado = 2,92; λ2tab(0,05,3) = 7,815


Conclusão: Como o valor calculado é menor que o tabelado, conclui-se que a
distribuição Weibull foi adequada para a série histórica de vazão mínima de 7 dias
consecutivos apresentada.

c) Teste de Filliben

xi - x wi - w (xi - x ) (wi - w )
2 2
Ordem qi Vazão wi Produto
1 0.014493 8.97 8.20 -11.0378 -11.82 130.4682 121.832899 139.7155
2 0.028986 10.41 9.65 -9.59779 -10.36 99.46987 92.1176519 107.4089
3 0.043478 11.32 10.63 -8.68779 -9.39 81.55183 75.4777666 88.1147
4 0.057971 11.5 11.39 -8.50779 -8.63 73.40884 72.3825607 74.4497
5 0.072464 13.1 12.02 -6.90779 -8.00 55.24821 47.7176196 63.9672
6 0.086957 13.15 12.56 -6.85779 -7.45 51.10832 47.0293402 55.5411
7 0.101449 13.57 13.05 -6.43779 -6.97 44.86023 41.4451931 48.5567
8 0.115942 14.46 13.49 -5.54779 -6.53 36.22712 30.7780196 42.6410
9 0.130435 14.95 13.89 -5.05779 -6.13 30.99329 25.5812813 37.5503
10 0.144928 14.95 14.26 -5.05779 -5.75 29.10611 25.5812813 33.1166
11 0.15942 15.66 14.61 -4.34779 -5.41 23.50193 18.9033137 29.2192
12 0.173913 16.04 14.94 -3.96779 -5.08 20.14158 15.7433902 25.7685
13 0.188406 16.06 15.25 -3.94779 -4.76 18.80739 15.5850784 22.6959
14 0.202899 16.18 15.55 -3.82779 -4.47 17.09629 14.6520078 19.9483
15 0.217391 16.2 15.84 -3.80779 -4.18 15.92156 14.499296 17.4833
16 0.231884 16.32 16.11 -3.68779 -3.91 14.40927 13.5998255 15.2669
17 0.246377 16.39 16.37 -3.61779 -3.64 13.17946 13.0884343 13.2711
18 0.26087 17 16.63 -3.00779 -3.39 10.18794 9.04682545 11.4730
19 0.275362 17.02 16.88 -2.98779 -3.14 9.378685 8.92691369 9.8533
20 0.289855 17.04 17.12 -2.96779 -2.90 8.599425 8.80780192 8.3960
21 0.304348 17.04 17.35 -2.96779 -2.66 7.900855 8.80780192 7.0873
22 0.318841 17.48 17.58 -2.52779 -2.43 6.148125 6.3897431 5.9156
23 0.333333 17.57 17.81 -2.43779 -2.21 5.380331 5.94284016 4.8711
24 0.347826 17.66 18.03 -2.34779 -1.99 4.663208 5.51213722 3.9450
25 0.362319 17.72 18.25 -2.28779 -1.77 4.047631 5.23400192 3.1302
26 0.376812 17.88 18.46 -2.12779 -1.56 3.310196 4.52750781 2.4202
27 0.391304 18.09 18.67 -1.91779 -1.35 2.579858 3.67793428 1.8096
28 0.405797 18.77 18.88 -1.23779 -1.14 1.407941 1.53213428 1.2938
29 0.42029 18.79 19.08 -1.21779 -0.93 1.135082 1.48302251 0.8688
149

30 0.434783 18.79 19.29 -1.21779 -0.73 0.887498 1.48302251 0.5311


31 0.449275 18.8 19.49 -1.20779 -0.53 0.636814 1.45876663 0.2780
32 0.463768 19.04 19.69 -0.96779 -0.33 0.3167 0.93662545 0.1071
33 0.478261 19.41 19.89 -0.59779 -0.13 0.076795 0.35735781 0.0165
34 0.492754 19.48 20.09 -0.52779 0.07 -0.03659 0.27856663 0.0048
35 0.507246 19.49 20.28 -0.51779 0.27 -0.13794 0.26811075 0.0710
36 0.521739 19.53 20.48 -0.47779 0.46 -0.22121 0.22828722 0.2143
37 0.536232 19.67 20.68 -0.33779 0.66 -0.22272 0.11410487 0.4347
38 0.550725 19.87 20.87 -0.13779 0.86 -0.11791 0.01898722 0.7322
39 0.565217 19.89 21.07 -0.11779 1.05 -0.12396 0.01387545 1.1074
40 0.57971 19.98 21.27 -0.02779 1.25 -0.03473 0.00077251 1.5612
41 0.594203 20.11 21.46 0.102206 1.45 0.147934 0.01044604 2.0950
42 0.608696 20.21 21.66 0.202206 1.65 0.332916 0.04088722 2.7107
43 0.623188 20.39 21.86 0.382206 1.85 0.705852 0.14608134 3.4106
44 0.637681 20.83 22.07 0.822206 2.05 1.684543 0.67602251 4.1976
45 0.652174 21.08 22.27 1.072206 2.25 2.415491 1.14962545 5.0752
46 0.666667 21.61 22.48 1.602206 2.46 3.940121 2.56706369 6.0476
47 0.681159 22.11 22.68 2.102206 2.67 5.60927 4.41926957 7.1197
48 0.695652 22.16 22.90 2.152206 2.88 6.19949 4.63199016 8.2974
49 0.710145 22.4 23.11 2.392206 3.10 7.407242 5.72264898 9.5877
50 0.724638 22.41 23.33 2.402206 3.32 7.966775 5.7705931 10.9988
51 0.73913 22.72 23.56 2.712206 3.54 9.604542 7.35606075 12.5403
52 0.753623 22.84 23.79 2.832206 3.77 10.68153 8.02139016 14.2238
53 0.768116 23.19 24.02 3.182206 4.01 12.75395 10.1264343 16.0632
54 0.782609 23.79 24.27 3.782206 4.25 16.07999 14.3050813 18.0751
55 0.797101 24.76 24.52 4.752206 4.50 21.40061 22.5834607 20.2797
56 0.811594 24.78 24.78 4.772206 4.76 22.7379 22.773949 22.7019
57 0.826087 25.16 25.05 5.152206 5.04 25.95231 26.5452255 25.3726
58 0.84058 25.24 25.34 5.232206 5.32 27.84939 27.3759784 28.3310
59 0.855072 25.41 25.64 5.402206 5.62 30.38101 29.1838284 31.6273
60 0.869565 25.72 25.96 5.712206 5.94 33.95177 32.629296 35.3278
61 0.884058 26.6 26.30 6.592206 6.29 41.44302 43.4571784 39.5222
62 0.898551 26.62 26.67 6.612206 6.66 44.02742 43.7212666 44.3357
63 0.913043 26.96 27.08 6.952206 7.07 49.13555 48.3331666 49.9513
64 0.927536 27.9 27.54 7.892206 7.53 59.40224 62.2869137 56.6512
65 0.942029 29.24 28.07 9.232206 8.06 74.37843 85.2336255 64.9057
66 0.956522 30.3 28.71 10.29221 8.69 89.48318 105.929502 75.5903
67 0.971014 32.5 29.54 12.49221 9.52 118.9393 156.055208 90.6510
68 0.985507 38.25 30.80 18.24221 10.78 196.6504 332.778075 116.2078
Média 20.00779 20.01639 1742.524 1864.89237 1722.7355

Com base nos dados da Tabela acima, obteve-se um coeficiente de correlação


calculado igual a 0,972 e o valor crítico deste coeficiente é de 0,969, a 5% de
significância. Sendo assim, como rcalc. > rcrítico, aceita-se a hipótese H0 de que a
amostra pode ser representada pela distribuição Weibull. Na Figura 4.8 é possível
observar a precisão do ajuste como reflexo do teste de Filliben.
150

Figura 4.8 Ajuste da distribuição Weibull pelo teste de Filliben.


151

Distribuição Gumbel
a) Kolmogorov-Smirnov (Ao nível de significância de 5% de probabilidade)

Ordem Vazão Fobs. Festim. Delta F Ordem Vazão Fobs. Festim. Delta F
1 8.97 0.014493 0.03765 0.023157 35 19.49 0.507246 0.390671 0.116575
2 10.41 0.028986 0.053008 0.024022 36 19.53 0.521739 0.393281 0.128459
3 11.32 0.043478 0.065693 0.022215 37 19.67 0.536232 0.403919 0.132313
4 11.50 0.057971 0.068506 0.010535 38 19.87 0.550725 0.418869 0.131856
5 13.10 0.072464 0.099412 0.026948 39 19.89 0.565217 0.420404 0.144813
6 13.15 0.086957 0.100565 0.013608 40 19.98 0.57971 0.427244 0.152466
7 13.57 0.101449 0.110791 0.009342 41 20.11 0.594203 0.43774 0.156463
8 14.46 0.115942 0.135615 0.019673 42 20.21 0.608696 0.445423 0.163272
9 14.95 0.130435 0.15131 0.020875 43 20.39 0.623188 0.459857 0.163331
10 14.95 0.144928 0.151406 0.006479 44 20.83 0.637681 0.496382 0.141299
11 15.66 0.15942 0.177252 0.017832 45 21.08 0.652174 0.517448 0.134726
12 16.04 0.173913 0.192643 0.01873 46 21.61 0.666667 0.563019 0.103648
13 16.06 0.188406 0.193484 0.005079 47 22.11 0.681159 0.607427 0.073733
14 16.18 0.202899 0.198602 0.004296 48 22.16 0.695652 0.612018 0.083634
15 16.20 0.217391 0.199466 0.017925 49 22.40 0.710145 0.633728 0.076417
16 16.32 0.231884 0.204627 0.027257 50 22.41 0.724638 0.635006 0.089632
17 16.39 0.246377 0.207842 0.038535 51 22.72 0.73913 0.662568 0.076562
18 17.00 0.26087 0.236661 0.024208 52 22.84 0.753623 0.672994 0.08063
19 17.02 0.275362 0.237809 0.037553 53 23.19 0.768116 0.703522 0.064594
20 17.04 0.289855 0.238961 0.050894 54 23.79 0.782609 0.755651 0.026958
21 17.04 0.304348 0.238961 0.065386 55 24.76 0.797101 0.831813 0.034712
22 17.48 0.318841 0.261911 0.05693 56 24.78 0.811594 0.833476 0.021881
23 17.57 0.333333 0.266852 0.066481 57 25.16 0.826087 0.859617 0.03353
24 17.66 0.347826 0.271869 0.075957 58 25.24 0.84058 0.865303 0.024723
25 17.72 0.362319 0.275256 0.087063 59 25.41 0.855072 0.876318 0.021245
26 17.88 0.376812 0.284618 0.092193 60 25.72 0.869565 0.894737 0.025172
27 18.09 0.391304 0.296988 0.094317 61 26.60 0.884058 0.938477 0.054419
28 18.77 0.405797 0.340029 0.065768 62 26.62 0.898551 0.939425 0.040875
29 18.79 0.42029 0.341078 0.079212 63 26.96 0.913043 0.952225 0.039182
30 18.79 0.434783 0.341555 0.093227 64 27.90 0.927536 0.978176 0.05064
31 18.80 0.449275 0.342033 0.107242 65 29.24 0.942029 0.995015 0.052986
32 19.04 0.463768 0.358491 0.105277 66 30.30 0.956522 0.998946 0.042424
33 19.41 0.478261 0.384933 0.093328 67 32.50 0.971014 0.999992 0.028977
34 19.48 0.492754 0.389729 0.103025 68 38.25 0.985507 1 0.014493

∆fcalc. máximo = 0,1633; ∆f( 68,5%) ≈ 0,160

Conclusão: Como o valor calculado é maior que o tabelado, conclui-se que a


distribuição Gumbel não foi adequada a esta série histórica de vazões mínimas com 7
dias consecutivos.
152

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)

2
Classes Fobs. Prob (X<xi) Fteo. λ

6,87 15,27 10 0,0228 0,1625 9,51 0,026


15,27 19,47 23 0,1625 0,3889 15,39 3,763
19,47 23,67 20 0,3889 0,7451 24,23 0,739
23,67 27,87 10 0,7451 0,9775 15,80 2,129
27,87 40,47 5 0,9775 1,0 1,53 7,869
68 14,53

λ2calculado = 14,53; λ2tab(0,05,3) = 7,815

c) Teste de Filliben
Da mesma forma anterior, porém trabalhando com as equações de Gumbel
para mínimos para estimativa dos valores de wi, encontra-se rcalc igual a 0,930 contra
rcrítico de 0,983, a um nível de significância de 5% e considerando uma média de
valores de rcrítico presentes nas Tabelas para distribuição Normal e distribuição de
Gumbel/Weibull. Sendo assim, pelo teste de Filliben, a hipótese H0 pode ser rejeitada,
ou seja, a amostra não pode ser representada pela distribuição de Gumbel, resultado
prático semelhante ao teste de Qui-quadrado. Na Figura 4.9 é possível observar o
ajuste (rcalc x rcritic), o qual é visualmente inferior ao obtido pela distribuição Weibull.

Figura 4.9 Ajuste da distribuição Gumbel pelo teste de Filliben.


153

Distribuição GEV

a) Teste de Kolmogorov-Smirnov
Ordem Vazão Fobs. Festim. Delta F Ordem Vazão Fobs. Festim. Delta F
1 8.97 0.0145 0.0338 0.0193 35 19.49 0.5072 0.4134 0.0939
2 10.41 0.0290 0.0520 0.0230 36 19.53 0.5217 0.4161 0.1056
3 11.32 0.0435 0.0674 0.0239 37 19.67 0.5362 0.4257 0.1105
4 11.5 0.0580 0.0708 0.0128 38 19.87 0.5507 0.4397 0.1111
5 13.1 0.0725 0.1081 0.0357 39 19.89 0.5652 0.4411 0.1241
6 13.15 0.0870 0.1095 0.0225 40 19.98 0.5797 0.4474 0.1323
7 13.57 0.1014 0.1216 0.0202 41 20.11 0.5942 0.4566 0.1376
8 14.46 0.1159 0.1508 0.0349 42 20.21 0.6087 0.4638 0.1449
9 14.95 0.1304 0.1690 0.0385 43 20.39 0.6232 0.4768 0.1464
10 14.95 0.1449 0.1690 0.0240 44 20.83 0.6377 0.5090 0.1287
11 15.66 0.1594 0.1981 0.0386 45 21.08 0.6522 0.5276 0.1245
12 16.04 0.1739 0.2150 0.0411 46 21.61 0.6667 0.5677 0.0990
13 16.06 0.1884 0.2159 0.0275 47 22.11 0.6812 0.6059 0.0753
14 16.18 0.2029 0.2215 0.0186 48 22.16 0.6957 0.6097 0.0859
15 16.2 0.2174 0.2225 0.0051 49 22.4 0.7101 0.6281 0.0820
16 16.32 0.2319 0.2282 0.0037 50 22.41 0.7246 0.6289 0.0957
17 16.39 0.2464 0.2315 0.0149 51 22.72 0.7391 0.6527 0.0864
18 17 0.2609 0.2623 0.0014 52 22.84 0.7536 0.6619 0.0917
19 17.02 0.2754 0.2633 0.0120 53 23.19 0.7681 0.6886 0.0795
20 17.04 0.2899 0.2644 0.0255 54 23.79 0.7826 0.7337 0.0489
21 17.04 0.3043 0.2644 0.0400 55 24.76 0.7971 0.8034 0.0063
22 17.48 0.3188 0.2883 0.0306 56 24.78 0.8116 0.8048 0.0068
23 17.57 0.3333 0.2933 0.0400 57 25.16 0.8261 0.8305 0.0044
24 17.66 0.3478 0.2984 0.0494 58 25.24 0.8406 0.8358 0.0048
25 17.72 0.3623 0.3019 0.0604 59 25.41 0.8551 0.8468 0.0083
26 17.88 0.3768 0.3111 0.0657 60 25.72 0.8696 0.8662 0.0034
27 18.09 0.3913 0.3236 0.0677 61 26.6 0.8841 0.9159 0.0319
28 18.77 0.4058 0.3657 0.0401 62 26.62 0.8986 0.9170 0.0184
29 18.79 0.4203 0.3670 0.0533 63 26.96 0.9130 0.9336 0.0206
30 18.79 0.4348 0.3670 0.0678 64 27.9 0.9275 0.9712 0.0436
31 18.8 0.4493 0.3677 0.0816 65 29.24 0.9420 0.9988 0.0568
32 19.04 0.4638 0.3833 0.0805 66 30.3 0.9565 0.9998 0.0433
33 19.41 0.4783 0.4079 0.0703 67 32.5 0.9710 0.9999 0.0289
34 19.48 0.4928 0.4127 0.0800 68 38.25 0.9855 0.9999 0.0144

Sendo assim:
∆fmax.= 0,146; ∆f( 68,5%) ≈ 0,160

Com isto, observa-se que a hipótese H0 do teste de Kolmogorov-Smirnov pode ser


aceita, ou seja, a amostra pode ser representada pela distribuição GEV.
154

b) Qui-quadrado (Ao nível de significância de 5% de probabilidade)

2
Classes Fobs. Prob (X<xi) Fteo. λ

6,87 15,27 10 0,0172 0,1817 11,19 0,127


15,27 19,47 23 0,1817 0,4120 15,66 3,440
19,47 23,67 20 0,4120 0,7247 21,26 0,075
23,67 27,87 10 0,7247 0,9702 16,69 2,682
27,87 40,47 5 0,9702 1,0 2,03 4,345
68 10,67

λ2calculado = 10,67; λ2tab(0,05,3) = 7,815

c) Teste de Filliben

O valor q1, considerando a = 0,40 e N = 68, é igual a 0,008798. A função GEV

inversa retorna um valor de 4,95 mm. O valor de rcalc. é igual a 0,941 e o rcrítico para

nível de significância de 0,05 é de aproximadamente 0,993. Portanto, rejeita-se a

hipótese H0 de que esta série histórica possa ser representada pela Distribuição GEV,

de forma semelhante ao obtido pelo teste Qui-quadrado. Assim, observa-se que a

única distribuição aceita por todos os testes foi a de Weibull, sendo a mesma

recomendada para estudos associados à vazão mínima. Na Figura 4.10 tem-se o

ajuste da distribuição GEV pelo teste de Filliben, o qual se assemelha com o ajuste

obtido para distribuição Gumbel.


155

Figura 4.10 Ajuste da distribuição GEV pelo teste de Filliben.

4.11 Identificação de “outliers” em uma série hidrológica

Valores “outliers” numa série histórica são aqueles considerados atípicos,


sendo que esta situação pode ser ocasionada por erros laboratoriais, equívocos de
medição e ou de processamento, como ocorre com razoável freqüência com dados de
precipitação, ou a ocorrência de um ano hidrológico atípico, com eventos extremos de
precipitação, provocando situação idêntica no comportamento das vazões.
No caso de problemas com laboratório ou tratamento e processamento
equivocado dos dados, é recomendável, após identificação, sua eliminação da análise,
uma vez que dados atípicos podem comprometer os testes estatísticos de
adequabilidade e posterior aplicação das distribuições de probabilidades.
No entanto, quando o evento hidrológico extremo ocorre, recomenda-se uma
análise cautelosa da série histórica, uma vez que, naturalmente, aquele valor pode
fazer parte das condições climáticas e hidrológicas da região, mesmo sendo
considerado como atípico pela estatística. Neste caso, recomenda-se manter o dado
na série.
156

O teste mais aplicado para as condições de séries hidrológicas é conhecido


como teste de Grubbs & Beck, descrito por Grubbs & Beck (1972). Para encontrar o
menor valor considerado como “não-outlier” aplica-se a seguinte equação:

XI = X − TN,α ⋅ S (145)

O valor crítico de TN,α, pode ser inferido com base na Tabela 4.17, adaptada do
trabalho original de Grubbs & Beck (1972). Sendo assim, valores abaixo de XI,
teoricamente, podem ser considerados “outliers”. Sua remoção ou não dependerá de
uma análise mais aprofundada da série histórica em questão.

Tabela 4.17 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores
extremos inferiores, sendo N o tamanho da amostra e α, o nível de significância.
Tamanho da amostra α = 1% α = 5% α = 10%
(N)
3 1,155 1,153 1,148
5 1,749 1,672 1,602
7 2,097 1,938 1,828
10 2,410 2,176 2,036
12 2,550 2,285 2,134
15 2,705 2,409 2,247
20 2,884 2,557 2,385
22 2,939 2,603 2,429
25 3,009 2,663 2,486
30 3,103 2,745 2,563
35 3,178 2,811 2,628
40 3,240 2,866 2,682
45 3,292 2,914 2,727
50 3,336 2,956 2,768
55 3,376 2,992 2,804
60 3,411 3,025 2,837
65 3,442 3,055 2,866
68 3,460 3,071 2,883
70 3,471 3,082 2,893
75 3,496 3,107 2,917
78 3,511 3,121 2,931
80 3,521 3,130 2,940
85 3,543 3,151 2,961
90 3,563 3,171 2,981
100 3,600 3,207 3,017
110 3,632 3,239 3,049
120 3,662 3,267 3,078
130 3,688 3,294 3,104
140 3,712 3,318 3,129
147 3,727 3,334 3,144

Para verificar se o último valor da série pode ser considerado “outlier”, aplica-se
a seguinte seqüência de equações:

S12
TN,α = (146)
S2
157

Em que S12 é a variância da amostra (série histórica) sem o maior valor; S2 é a


variância da amostra completa e x 1 é média da amostra sem o último valor da série,
dada por:
N−1
(x i )
i=1
x1 = (147)
N −1

O valor de TN,α (equação 146) for maior que o valor crítico (Tabela 4.18), o
valor não pode ser considerado “outlier”, uma vez que o valor de T calculado não será
significativo.

Tabela 4.18 Valores críticos de TN,α do Teste de Grubbs & Beck (1972), para valores
extremos superiores, sendo N o tamanho da amostra e α, o nível de significância.
Tamanho da amostra α = 1% α = 5% α = 10%
(N)
4 0,000 0,0008 0,0031
5 0,0035 0,0183 0,0376
7 0,0440 0,1020 0,1479
10 0,1414 0,2305 0,2863
12 0,2043 0,2996 0,3552
15 0,2859 0,3818 0,4345
20 0,3909 0,4804 0,5270
22 0,4245 0,5107 0,5550
25 0,4680 0,5495 0,5906
30 0,5268 0,6008 0,6375
35 0,5730 0,6405 0,6737
40 0,6104 0,6724 0,7025
45 0,6412 0,6985 0,7261
50 0,6672 0,7203 0,7459
55 0,6894 0,7390 0,7627
60 0,7086 0,7550 0,7772
65 0,7253 0,7690 0,7898
68 0,7344 0,7766 0,7966
70 0,7401 0,7813 0,8009
78 0,7605 0,7983 0,8162
80 0,7650 0,8021 0,8197
90 0,7853 0,8190 0,8349
100 0,8020 0,8329 0,8475
110 0,8162 0,8447 0,8581
120 0,8284 0,8548 0,8672
130 0,8389 0,8636 0,8752
140 0,8481 0,8712 0,8821
147 0,8539 0,8761 0,8865
158

Exemplo de Aplicação 4.20

Verificar se os valores extremos da série histórica do Exemplo de Aplicação 4.6

(Tabela 4.7) podem ser considerados “outliers”.

Tamanho da Série: 68 dados

Nível de Significância: 10%

Média da série: 20,01 m3/s

Variância: 27,83 m6/s2

a) Para o menor valor: Tcrítico = 2,883 (Tabela 4.17)

XI = 20,01 − 2,883 × 27,83 = 4,80 m 3 / s


Como o valor é menor que o limite inferior da série (8,97 m3/s), este último não
poderá ser considerado como “outlier”.

b) Para o maior valor: Tcrítico = 0,7966 (Tabela 4.18)


S12 = 23,14 m6/s2
T68;10% = 23,14/27,83 = 0,831
Como o valor calculado para T é maior que o valor de Tcrítico, entende-se que não
houve significância e o último valor da série (38,25 m3/s) não pode ser considerado
“outlier”.

4.12 Outros testes não-paramétricos aplicados à Hidrologia

Estatisticamente, a aplicação de distribuições de probabilidades a séries


históricas é realizada tendo-se como referência uma amostra aleatória extraída de
uma população única cuja distribuição mais adequada não é conhecida. Para que isto
seja possível algumas premissas importantes devem ser consideradas, tratadas na
forma de hipóteses, as quais são analisadas mediante testes não-paramétricos. É
importante mencionar que os testes descritos anteriormente dizem respeito a testes
necessários para avaliar o grau de aderência da distribuição de probabilidades teórica,
caracterizada pela estimativa dos parâmetros populacionais, às freqüências
observadas, calculadas com base na série histórica (amostra). Estes testes não
avaliam se a série histórica apresenta as características necessárias para aplicação
das distribuições de probabilidades. Estas condições podem ser afetadas por vários
fatores como a construção de um barramento, retificação e ou alteração de um curso
159

d’água, alteração nas condições de uso do solo, eventos extremos e extraordinários,


fenômenos climáticos cíclicos, dentre outros.
As condições mencionadas anteriormente são tratadas como hipóteses e
podem ser resumidas da forma como se segue.

4.12.1 Hipótese de Aleatoriedade


Esta hipótese assume que as variações numa grandeza hidrológica são
devidas a causas naturais. Na existência de interferência antrópica, como
barramentos, é provável que as observações deixem de ser aleatórias. O teste de
aleatoriedade possui como hipótese H0, que a série histórica é constituída por dados
ou observações aleatórias. O comportamento de um hidrograma ao longo do tempo
permite verificar a existência de valores máximos e mínimos, conhecidos como
inflexões, e a presença deste tipo de observação, caracteriza a existência ou não de
aleatoriedade (Naghettini & Pinto, 2007). A estatística deste teste é dada por:

Ni − E(Ni)
T= (148)
var (Ni)

Em que Ni representa o número de inflexões observadas na série histórica;


E(Ni) e var (Ni), são, respectivamente, a esperança e a variância de Ni, sendo
estimados por:

2 × (N − 2)
E(Ni) = (149)
3
16 × N − 29
var (Ni) = (150)
90

A hipótese H0 pode ser rejeitada se T >z α , sendo α o nível de


1−
2

significância de z (Tabela 4.2). É importante mencionar que quando N for maior que
30, Ni segue uma distribuição aproximadamente Normal, recomendando-se a
aplicação do teste para séries com esta característica.

4.12.2 Hipótese de Estacionariedade


Esta hipótese estuda o comportamento de uma série histórica ao longo do
tempo, analisando se a mesma apresenta tendência temporal. A hipótese H0 do teste,
conhecido como Teste de Spearman, é de que os dados não apresentam tendência
160

temporal, ou seja, a série é estacionária. Uma série hidrológica pode apresentar


tendência temporal e não estacionariedade pela existência de ciclos nítidos na série
histórica, quando apresentar saltos na série provocados por alterações repentinas no
curso d’água ou na própria bacia e por mudanças climáticas embora, neste último
caso, seja necessário um longo período de tempo para análise. Mudanças graduais no
uso do solo de uma bacia hidrográfica também podem produzir alterações na
estacionariedade da serie histórica. A estatística do teste é obtida por:

cs
T= (151)
var (cs )

O coeficiente cs é calculado por:


N
6⋅ (Fi − fi )2
i=1
cs = 1 − (152)
N3 − N
1
var (cs) = (153)
N −1

Na equação 152, fi denota a posição temporal da observação na série histórica


e Fi a posição que as observações, associadas a fi, ocupam, com a série organizada
em ordem crescente. A hipótese H0 pode ser rejeitada se T > z α .
1−
2

4.12.3 Hipótese de Independência

Esta hipótese considera que uma dada observação não influencia a ocorrência
nem a não ocorrência de outra observação ao longo do tempo. Isto é importante no
contexto de vazões haja vista que o escoamento subterrâneo (pequenas vazões) é
influenciado pelo armazenamento de água na bacia oriundo do período de chuvas e
liberado lentamente no período seco. Vazões diárias apresentam tendência de maior
dependência que vazões mensais, anuais ou extremas (máximos ou mínimos em um
dado ano). A hipótese H0 deste teste é de que as observações são independentes.

r − E(r )
T= (154)
var (r )

A estimativa de r, E(r) e var(r) pode ser realizada da seguinte forma:


N−1
r= Y1'⋅ Y1'+i + Y1'⋅ YN' (155)
i=1
161

Nesta equação, Y’1, Y’i+1, etc, consiste da subtração dos Y valores da série
histórica pela média dos dados, ou seja:

Y'= Y − Y (156)

A esperança de r (E(r)) e sua variância são obtidas por:

s2
E(r ) = − (157)
N −1

s 22 − s 4 s 22 − 2 ⋅ s 4 s 22
var (r ) = + − (158)
N−1 (N − 1) ⋅ (N − 2) (N − 1)2
Em que s2 e s4 são os momentos amostrais de 2a e 4a ordem, obtidos por:

(Y )
N 2
'
s2 = i (159)
i=1

(Y )
N 4
'
s4 = i (160)
i=1

A hipótese H0 pode ser rejeitada se T > z α .


1−
2

4.12.4 Hipótese de Homogeneidade

Esta hipótese sugere que uma dada série histórica de vazões máximas esteja
associada a chuvas cuja freqüência de ocorrência seja normal (esperada). Vazões de
pico oriundas de eventos de chuvas históricas, ocorridas de forma atípica, causam
heterogeneidade à série histórica e a observação muito provavelmente se constituirá
num “outlier”.
A hipótese H0 deste teste considera que a série histórica é homogênea. Para
sua aplicação é recomendável que a série histórica seja dividida em duas partes
aproximadamente com o mesmo número de dados, constituindo-se duas sub-
amostras. A estatística deste teste é dada por:

V − E(V )
T= (161)
var (V )

A hipótese H0 será rejeitada se T > z α .


1−
2

O procedimento para cálculo de V, E(V) e var(V) é o seguinte:


162

- calcula-se o valor de V para a primeira sub-amostra:

N1 ⋅ (N1 + 1)
V1 = N1 ⋅ N2 + − H1 (162)
2

Sendo N1, N2 e H1, respectivamente, o número de dados da 1a sub-amostra, o


número de dados da 2a sub-amostra e a soma das ordens de classificação da série
histórica da 1a sub-amostra (soma de Fi do teste de estacionariedade).

- calcula-se o valor de V para a 2a sub-amostra:

V2 = N1 ⋅ N 2 − V1 (163)

O valor de V a ser adotado no cálculo de T deve ser o menor valor entre V1 e


V2 .

N1 ⋅ N 2
E(V ) = (164)
2
N1 ⋅ N2 ⋅ (N1 + N2 + 1)
var (V ) = (165)
12

Exemplo de Aplicação 4.21


Verifique se a série histórica de vazões máximas do Rio Grande, com seção de
controle em Madre de Deus de Minas, apresenta aleatoriedade, estacionariedade,
independência e homogeneidade. Considere nível de significância para z igual a 0,05
(z=1,96).
163

Ano Posição Qmáxima fi Fi Y' Posição Qmáxima Fi


1935 1 114.69 1 4 -79.81 1 114.69 4
1936 2 195.46 2 42 0.96 2 195.46 42
1937 3 196.34 3 43 1.84 3 196.34 43
1938 4 194.14 4 39 -0.36 4 194.14 39
1939 5 170.82 5 27 -23.68 5 170.82 27
1940 6 283.15 6 66 88.65 6 283.15 66
1941 7 126.38 7 7 -68.12 7 126.38 7
1942 8 193.26 8 38 -1.24 8 193.26 38
1943 9 258.85 9 59 64.35 9 258.85 59
1944 10 131.22 10 9 -63.28 10 131.22 9
1945 11 181.82 11 33 -12.68 11 181.82 33
1946 12 262.45 12 60 67.95 12 262.45 60
1947 13 176.98 13 31 -17.52 13 176.98 31
1948 14 196.34 14 43 1.84 14 196.34 43
1949 15 175.66 15 30 -18.84 15 175.66 30
1950 16 187.10 16 35 -7.40 16 187.10 35
1951 17 140.02 17 11 -54.48 17 140.02 11
1952 18 170.82 18 27 -23.68 18 170.82 27
1953 19 125.50 19 6 -69.00 19 125.50 6
1954 20 95.83 20 2 -98.67 20 95.83 2
1955 21 114.28 21 4 -80.22 21 114.28 4
1956 22 161.58 22 21 -32.92 22 161.58 21
1957 23 213.50 23 50 19.00 23 213.50 50
1958 24 204.70 24 48 10.20 24 204.70 48
1959 25 231.54 25 53 37.04 25 231.54 53
1960 26 152.78 26 18 -41.72 26 152.78 18
1961 27 271.45 27 63 76.95 27 271.45 63
1962 28 245.35 28 57 50.85 28 245.35 57
1963 29 226.70 29 51 32.20 29 226.70 51
164

1964 30 230.66 30 52 36.16 30 230.66 52


1965 31 244.00 31 56 49.50 31 244.00 56
1966 32 279.55 32 65 85.05 32 279.55 65
1967 33 194.14 33 40 -0.36 33 194.14 40
1968 34 134.30 34 10 -60.20 34 134.30 10
1969 35 162.02 35 23 -32.48 Soma 1200
1970 36 88.45 36 1 -106.05
1971 37 197.66 37 45 3.16
1972 38 152.34 38 17 -42.16
1973 39 162.02 39 22 -32.48
1974 40 187.10 40 34 -7.40
1975 41 149.70 41 16 -44.80
1976 42 195.02 42 41 0.52
1977 43 148.38 43 15 -46.12
1978 44 239.95 44 55 45.45
1979 45 213.50 45 49 19.00
1980 46 167.74 46 26 -26.76
1981 47 143.54 47 13 -50.96
1982 48 175.22 48 29 -19.28
1983 49 257.50 49 58 63.00
1984 50 159.82 50 20 -34.68
1985 51 275.05 51 64 80.55
1986 52 266.50 52 61 72.00
1987 53 162.90 53 24 -31.60
1988 54 165.10 54 25 -29.40
1989 55 187.10 55 34 -7.40
1990 56 202.50 56 47 8.00
1991 57 178.30 57 32 -16.20
1992 58 437.20 58 69 242.70
1993 59 141.34 59 12 -53.16
1994 60 157.62 60 19 -36.88
1995 61 373.20 61 68 178.70
1996 62 189.30 62 37 -5.20
1997 63 269.20 63 62 74.70
1998 64 129.90 64 8 -64.60
1999 65 310.60 65 67 116.10
2000 66 233.30 66 54 38.80
2001 67 113.46 67 3 -81.04
2002 68 145.11 68 14 -49.39
2003 69 201.80 69 46 7.30
165

Resultados dos testes não-paramétricos aplicados.

Teste Parâmetros do Teste


Ni N E(Ni) Var (Ni) |T|

Aleatoriedade 39 69 44,67 11,94 1,64


Conclusão: Hipótese H0
aceita (série aleatória)

Estacionariedade cs - - Var (cs) |T|


Conclusão: Hipótese H0
aceita (série 0,0831 0,01471 0,69
estacionária, sem
dependência temporal)

Independência r - E(r) Var(r) |T|


Conclusão: Hipótese H0
aceita (série -9830 -3820 909.212.690 0,20
independente)

Homogeneidade N1 N2 H1 V1 V2 E(v) Var (v) |T|


Conclusão: Hipótese H0
aceita (série 34 35 1200 585 605 595 6942 0,12
homogênea)

Com base nos respectivos testes não-paramétricos, observa-se que a série


histórica de vazões máximas do Rio Grande nesta seção, apresenta os requisitos
necessários para aplicação de distribuições de probabilidades. A hipótese de
aleatoriedade da série significa que as possíveis oscilações na série são devidas a
causas naturais, sem interferência antrópica. De fato, a montante desta seção de
controle, não se constata a existência de nenhum tipo de barramento no Rio Grande,
não verificando-se, portanto, influência nas vazões de jusante. A hipótese de
estacionariedade demonstra que a série histórica não apresenta tendência temporal,
ou seja, não se verificam ciclos ao longo do tempo no comportamento das vazões,
nem saltos na série, significando que não houve nenhum tipo de alteração na calha do
Rio Grande ou que esteja havendo alterações repentinas e importantes no uso do solo
na bacia. A independência da série histórica demonstra que não há influência de uma
observação em outra, ou seja, um determinado dado não é importante na ocorrência
nem na não ocorrência de outro dado. Hidrologicamente, é o que se espera de dados
de vazão máxima, os quais são caracterizados por precipitações importantes e a
influência do escoamento base não é da mesma magnitude do escoamento superficial
direto. A hipótese de homogeneidade da série demonstra que os picos verificados no
período não foram provocados por eventos extraordinários de precipitação e sim por
precipitações esperadas.
166

4.12.5 Teste de Mann-Kendall

O teste de Mann-Kendall (Kendall, 1975; Mann, 1945) consiste de um teste


não-paramétrico desenvolvido para aplicações a serie de dados temporais com o
objetivo de analisar se a série histórica apresenta algum tipo de tendência. Vem sendo
muito aplicado para estudos que envolvem tendência de dados hidrológicos e
climatológicos.
A hipótese Ho do teste é de que uma dada amostra (série histórica) é
independente e identicamente distribuída, ou seja, não há tendência nos dados. A
hipótese alternativa H1 é de que os dados apresentam tendência. A estatística do teste
é processada da seguinte forma:

( )
n −1 n
S= sin al x j − x i (166)
i =1 i = j + 1

Em que xj são dados seqüenciais na série histórica de tamanho n. Assim, tem-se a


seguinte situação:

1 se x j > x i
( )
sin al x j − x i = 0 se x j = x i (167)
− 1 se x j < x i

Após o cálculo de S, determina-se a sua variância por:

n
n ⋅ (n − 1) ⋅ (2 ⋅ n + 5 ) − tp ⋅ p ⋅ (p − 1) ⋅ (2 ⋅ p + 5 )
p =1
V (S ) = (168)
18
Sendo tp corresponde ao número de agrupamentos com p dados. A estatística Z
padronizada do teste é dada por:

S −1
Z= para S > 0
V (S )
Z = 0 para S = 0 (169)
S +1
Z= para S < 0
V (S )
167

A estatística Z do teste é então comparada aos valores de Z obtidos da Tabela


de Z da distribuição Normal. Para os níveis de 0,01; 0,05 e 0,1, tem-se,
respectivamente, 2,58; 1,96 e 1,65. Quando Z < Z α a hipótese de nulidade Ho é

aceita, ou seja, os dados não apresentam tendência; caso contrário, rejeitada,


caracterizando-se possível presença de tendência. Para todas as séries climáticas
simuladas foi adotado o nível de significância de 0,05.

Exemplo de Aplicação 4.22

Para a série histórica de precipitação máxima diária anual da localidade de


Acaiaca, representada graficamente, aplique o teste de Mann-Kendall e verifique se há
algum tipo de tendência importante na série.

Aplicando-se a seqüência de equações anterior, foi encontrado um valor para S


igual -50 e para V(S) de 35622,67. O valor de Z estimado para a série foi de -0,259
que, considerando seu valor em módulo, é menor que os valores de Z para os níveis
de significância mais aplicados. Isto significa que aceita-se a hipótese de nulidade Ho
de que não há tendência na série histórica de precipitação máxima diária anual de
Acaiaca, a qual corresponde em uma série completa entre 1942 e 2009.
168

Exemplo de Aplicação 4.23

Aplique o teste de Mann-Kendall para a série de vazões máximas apresentada

no Exemplo de Aplicação 4.21.

O valor de S calculado pela equação 167 foi igual a 122 e o valor de V(S) igual

a 35675,33. O valor de Z da estatística do teste foi igual a 0,641. Como este número é

menor que os valores de Z /2, conclui-se que a série não apresenta tendência

temporal.
169

Referências Bibliográficas

CASELLA, G.; BERGER, R.L. Statistical Inference. Belmont, CA: Duxbury Press.
1990. 650p.

D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit techniques. New York:


Marcel Decker. 1986.

DURRANS, S. R.; PITT, R. Maximum likelihood estimators for coarsely resolved


precipitation data. Journal of Hydrologic Engineering, Reston, v. 9, n.1, p.13-27,
2004.

FERREIRA, D.F. Estatística Básica. Lavras: Editora UFLA, 2005. 664p.

GRUBBS, F.E.; BECK, G. Extension of sample sizes and percentage points for
significance tests of outlying observations. Technometrics, v. 14, n.4, p.847-854.

HAAN, C.T. Statistical Methods in Hydrology. Ames: The Iowa State University
Press. 2a Edição, 2002, 377p.

HOSKING, J.R.M. L - moments: analysis and estimation of Distributions using Linear


Combinations of Order Statistics. Journal of Royal Statistical Society, v.52, n.1,
p.105-124, 1990.

KATZ, R.W.; PARLANGE, M.B.; NAVEAU, P. Statistics of extremes in hydrology.


Advances in Water Resources, Amsterdan, v.25, p.1287-1304, 2002.

NAGHETTINI, M.; PINTO, E.J.A. Hidrologia Estatística. Belo Horizonte: CPRM,


2007.552p.

SHARDA, V.N.; DAS, P.K.; OJASVI, P.R. Probability distribution of extrem rainfall
series for conservation planning in a sub-humid climate. Applied Engineering in
Agriculture, v. 24, n.4, p.447-453, 2008.

SPIEGEL, M.R. Advanced Mathematics for Engineers and Scientists. New York:
Schaum´s Outline Series, McGraw-Hill Book Company, 1971. 407p.
170

WALPOLE, R.E.; MYERS, R.H. Probability and Statistics for Engineers and
Scientists. New York: Macmililan Publishing Co, 2. Edition, 1978. 580p.

Potrebbero piacerti anche