Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
br
DOI: http://dx.doi.org/10.1590/0102-77863340011
Artigo
Resumo
Este trabalho teve como objetivo avaliar o desempenho da distribuição Nakagami na análise de séries de precipitação
mensal, ao longo de vários anos, visando à seleção de uma distribuição útil para o planejamento e gestão de atividades
dependentes dos índices de precipitação na Região Sul do Brasil. Para tanto, compara-se a mesma com cinco dis-
tribuições alternativas: Weibull, Gama, Log-Normal, Log-Logística e Inversa-Gaussiana. Foram utilizadas séries histór-
icas de 33 estações meteorológicas observadas entre janeiro de 1970 a dezembro de 2014, totalizando 396 séries (33
estações × 12 meses). Para a escolha da distribuição, que forneceu o melhor ajuste, foram utilizados os valores dos cri-
térios de informação de Akaike, de Kolmogorov-Smirnov, de Anderson-Darling e de Cramér-von Mises. Segundo estes
critérios se encontrou que as distribuições Nakagami e Weibull foram selecionadas o maior número de vezes (Naka-
gami: 146 vezes e Weibull: 100 vezes). Embora a distribuição Nakagami não seja muito utilizada, na descrição de dados
de precipitação, recomenda-se sua utilização na descrição do comportamento da pluviosidade mensal como alternativa
para distribuições tradicionalmente utilizadas.
Palavras-chave: ajuste de distribuições, variações climáticas, dados de precipitação, distribuição Nakagami,
verossimilhança.
Tabela 1 - Número das estações meteorológicas e suas respectivas coordenadas geográficas situadas na região sul do Brasil.
Rio Grande do sul Paraná Santa Catarina
h �α� i rffiffiffiffiffiffiffiffiffi � �
∂ α α(x − μ)2
lðα; θjxÞ ¼ n 1 þ log − ψ ð αÞ f (xjα; μ) ¼ exp − ; ð14Þ
∂α θ 2πx3 2μ2 x
X
n
1
X
n ð9Þ qffiffiffiffiffiffiffiffiffiffiffiffiffiffi
þ2 log (xi ) þ x2i ; E(X ) ¼ μ e Xmax ¼ μ 1 þ 4α 9μ2 3μ2
θ 2 − 2α :
i¼1 i¼1
Distribuição Log-Logística:
∂ na a Xn
lðα; θjxÞ ¼ þ 2 x2 ð10Þ
∂θ θ θ i¼1 i α α − 1h � x �α i − 2
f (xjα; θ) ¼ x 1 þ ; ð15Þ
d
θα θ
e que ψ ðαÞ ¼ dα logΓðαÞ
é a função digama. � �1
P −1 α
A partir da Eq. (10) se tem que, ^θ ¼ 1n ni¼ 1 x2i E(X ) ¼ θπ
, e para α > 1; Xmax ¼ θ αα þ
αsenðαπ Þ 1
enquanto que α^ é obtido numericamente a partir da equação:
Distribuição Log-Normal:
� � Xn "
n log ðαÞ − n log(^θ) − ψ ðαÞ þ 2 log (xi ) ¼ 0: ð11Þ � � #
i¼1 1 1 logðxÞ − μ 2
f ðxjμ; θÞ ¼ pffiffiffiffiffi exp − ; ð16Þ
2πθx 2 θ
As estimativas intervalares para θ e α podem ser obtidas a
�
partir da normalidade assintótica dos estimadores de má- EðX Þ ¼ exp μ þ 0:5θ2 e Xmax ¼ exp(μ − θ2 ).
xima verossimilhança e pela propriedade de invariância, Vale lembrar que os parâmetros, θ > 0, α > 0 e μ > 0
funções de θ e α, diga-se, gðα; θÞ são estimadas por g descrevem, respectivamente, a escala, a forma e a locação
� destas distribuições. Apenas na distribuição Log-Normal o
^; ^
α θ . Por exemplo, a média, EðX Þ é estimada por E ^ ðX Þ
qffiffi parâmetro μ tem suporte nos números reais.
^ �
¼ Γðα^Γþ ðα ^Þ
0:5Þ θ ^
^ enquanto que a estimativa de Var E ðX Þ é
α
Uma caracterização completa destas distribuições
apresentadas pode ser encontrada, por exemplo, em John-
calculada a partir da aplicação do método delta (Casella e
son et al. (1994 e 1995).
Berger, 1990).
Em se tratando de dados de precipitação total (diária,
decendial, mensal, etc.), a precipitação total mais provável 2.3. Os critérios de discriminação
ou máxima no período, representada aqui por, Xmax obtida Depois de estimados os parâmetros das distribuições
� candidatas pelo método da máxima verossimilhança foram
da equação, dXdmax f Xmax j^ α ; ^θ ¼ 0 e estimada por X^ max ¼
qffiffiffiffiffiffiffiffiffiffiffiffiffiffi�ffi utilizados quatro critérios para a escolha da distribuição
^θ 2^α − 1 . com melhor ajuste. A distribuição escolhida foi a que mais
2^ α
vezes se mostrou vencedora, segundo os valores das qua-
2.2.2. As demais distribuições tro estatísticas descritas no decorrer desta seção.
A título de avaliar a eficiência da distribuição Naka- Dado um conjunto de observações, x ¼ ðx1 ; …; xn Þ
gami, na descrição de dados de precipitação, a mesma foi representando a precipitação total mensal, e as seis dis-
comparada com cinco distribuições comuns na análise de tribuições concorrentes, decidiu-se em favor de uma delas,
dados de precipitação, sendo essas: Weibull, Gama, Log- a partir dos valores das estatísticas:
Normal, Log-Logística e Inversa-Gaussiana, resumida- � Critério de informação de Akaike: AIC ¼ − 2l þ 2p;
i i
mente caracterizadas a seguir pela função de densidade, � Kolmogorov-Smirnov: KS ¼ max (^zi − ; − ^zi )
média e moda, representada por Xmax . 1≤i≤n n n
para i ¼ 1; :::; n;
Distribuição Weibull: � Anderson-Darling:
α h �x�α i Xn
f ðxjα; θÞ ¼ α xα − 1 exp − ; ð12Þ AD ¼ − n − 1n i¼1
(2i − 1)[log(^zi ) þ log(1 − ^zn þ 1 − i )];
θ θ � Cramér-von Mises:
� � Xn
EðX Þ ¼ θ Γ α þα 1 e , para α > 1; Xmax ¼ θ α −α 1 : �2
CvM ¼ − 12n 1
þ ^zi − 2i2n− 1 .
i¼1
Distribuição Gama: Nestas expressões se tem que l é a verossimilhança
1 � x� localmente nas estimativas dos parâmetros, n é o tamanho
(α − 1)
f (xjα; θ) ¼ x exp − ; ð13Þ da amostra, p o número de parâmetros, xðiÞ a i-ésima esta-
θα ΓðαÞ θ �
E(X) ¼ α θ e para α > 1; Xmax ¼ θðα − 1Þ tística de ordem da amostra e ^z i ¼ F xðiÞ é a estimativa da
função de distribuição. Para todos os critérios decide-se
Mazucheli and Emanuelli 5
em favor da distribuição que apresenta o menor valor da Tabela 2 - Distribuição do nível mínimo de significância associado aos
estatística. testes Von-Neumann e Wald-Wolfowitz.
Além do critério de informação de Akaike (1974) Von-Neumann Wald-Wolfowitz
encontra-se na literatura, dentre outros, o critério de infor-
Intervalor para o Frequência Frequência Frequência Frequência
mação de Akaike corrigido, AICc ¼ − 2n þ n −2np p − 1, o cri- valor-p Absoluta Relativa Absoluta Relativa
tério de informação de Hannane-Quinn (1979), 0.00 ≤ p < 0.01 5 0.01 6 0.02
HQIC ¼ − 2l þ 2plog½logðnÞ� o critério de informação de 0.01 ≤ p < 0.05 18 0.05 20 0.05
Akaike consistente, CAIC ¼ − 2l þ p½logðnÞ þ 1� e o cri- 0.05 ≤ p < 0.20 62 0.16 67 0.17
tério de informação de Schwarz (1978),
0.20 ≤ p < 0.50 113 0.29 108 0.27
BIC ¼ − 2l þ plogðnÞ.
0.50 ≤ p < 0.80 151 0.38 118 0.30
Neste artigo, como as distribuições rivais são especi-
ficadas pelo mesmo número de parâmetros se pode, sim- ≥ 0.80 47 0.11 77 0.19
plesmente, usar como critério de seleção o valor de - 2l. Total 396 1.00 396 1.00
Sob esta circunstância, as estatísticas AIC, AICc, HQIC,
CAIC, BIC e - 2l sempre irão selecionar a mesma
distribuição. Com relação à qualidade do ajuste, avaliada pelos
Embora as estatísticas de Kolmogorov-Smirnov, testes de Kolmogorov-Smirnov, Anderson-Darling e Cra-
Anderson-Darling e Cramér-von Mises sejam, geralmente, mér-von Mises se constata que o número de vezes que a
usadas para avaliar a plausibilidade de uma dada dis- distribuição obteve maior valor-p coincidiu com os
tribuição, elas também podem ser usadas na escolha de valores observados nas Tabelas 3 e 4.
uma dentre duas ou mais distribuições concorrentes. Ao Na Tabela 5 apresentam-se os números de séries que
leitor interessado em detalhes destas estatísticas se reco- não rejeitaram, para um nível de significância de 5%, a
menda, entre outros, D’Agostino e Stephens (1986) e Ste- distribuição ajustada como sendo apropriada. É importante
phens (1974). observar o que ocorreu com as distribuições Weibull e
Nakagami. Estas distribuições não foram rejeitadas ne-
nhuma vez, ou seja, pelo ajuste, foram vencedoras em
3. Resultados e Discussões todas as séries utilizadas, 396 vezes (33 estações × 12
A primeira avaliação realizada nos dados ocorreu meses). Segundo os critérios utilizados na discriminação
quanto à validação das suposições de homogeneidade e de se encontra que as distribuições Nakagami e Weibull
aleatoriedade. Todas as 396 séries foram submetidas aos foram as distribuições selecionadas o maior número de
testes de Von-Neumann e Wald-Wolfowitz. Apresenta-se, vezes. Das 396 séries, a distribuição Nakagami foi sele-
na Tabela 2, a distribuição do nível mínimo de sig- cionada 146 vezes, seguida da Weibull selecionada 100
nificância associado a ambos os testes. Em nível de sig- vezes. Observa-se também que a escolha está relacionada
nificância de 5%, 23(26) séries não satisfizeram a ao critério de discriminação utilizado. O mesmo fato foi
suposição de homogeneidade(aleatoriedade). Esses observado por Ashkar e Zoglat (1997). Em Ashkar e
números representam 5.8% e 6.6% das 396 séries. No Aucoin (2012) é apontado que a razão das verossimi-
geral, 37 séries, 9.3%, não satisfizeram a suposição de lhanças maximizadas e o critério baseado na estatística
homogeneidade, de aleatoriedade ou ambas. Anderson-Darling são os critérios mais poderosos.
Em adição aos testes Von-Neumann e Wald-Wolfo- Segundo esses dois critérios se tem que a distribuição
witz foram aplicados os testes de Bartels (Bartels, 1982) e Nakagami leva vantagens sobre as demais distribuições
Mann-Kendall (Mann, 1945; Kendall e Gibbons, 1990). (ver, Tabelas 3 e 4).
As conclusões oriundas dos mesmos corroboram as con- É importante ressaltar, neste ponto, que a distribuição
clusões obtidas com os testes de Von-Neumann e Wald- Nakagami é amplamente utilizada em várias áreas do co-
Wolfowitz; por esse motivo, seus resultados não são nhecimento, especialmente, na análise do desvanecimento
reportados. Uma detalhada revisão desses e vários outros de sinais de rádio e de ultrassom (Karagiannidis et al.,
testes é apresentada em Machiwal e Jha (2012, Capítulo 4, 2005; Antônio, 2003; Guedes, 1994). Existe uma vasta lit-
página 51). eratura referente à aplicação na área de engenharia de
Nas Tabelas 3 e 4 são apresentados o número e a comunicações. Por outro lado, quando se buscam aplica-
porcentagem de vezes que cada uma das seis distribuições ções envolvendo variáveis climatológicas, um número bas-
foi selecionada, segundo os quatro critérios de dis- tante reduzido de publicações é encontrado (Schwartz et al.,
criminação. Na Tabela 3 foram consideradas todas as 396 2013; Singh e Sarkar, 2013; Sarkar e Rai, 2011; Sarkar e
séries, enquanto que na Tabela 4 constam somente as 359 Mathur, 2010; Sarkar e Mathur, 2009). No entanto, nenhum
séries que passaram, simultaneamente, nos testes de Von- deles utilizou dados de precipitação.
Neumann e Wald-Wolfowitz (homogeneidade e aleato- É importante enfatizar que, independentemente da
riedade, respectivamente). frequência com que cada uma das distribuições foi
6 Aplicação da Distribuição Nakagami na Análise de Dados de Precipitação
Tabela 3 - Número de séries (porcentagem) em que as distribuições de probabilidade (Weibull, Gamma, LogN, Log-Log, IGauss, Nakagami) foram sele-
cionadas (vencedoras) em cada critério de seleção: Akaike (AIC), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CvM), dentre
as 396 séries utilizadas. Números marcados em negrito indicam a distribuição vencedora em cada critério de seleção.
Critérios de seleção Distribuição de probabilidade candidata
Tabela 4 - Número de séries (porcentagem) em que as distribuições de probabilidade (Weibull, Gamma, LogN, Log-Log, IGauss, Nakagami) foram sele-
cionadas (vencedoras) em cada critério de seleção: Akaike (AIC), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CvM), some-
nte das séries que passaram, simultaneamente, nos testes de von-Neumann (homogeneidade) e Wald-Wolfowitz (aleatoriedade). Números marcados em
negrito indicam a distribuição vencedora em cada critério de seleção.
Critérios de seleção Distribuição de probabilidade candidata
Tabela 5 - Número de vezes em que as distribuições sob hipótese nula mensal como concorrente a algumas distribuições tradi-
não foi rejeitada em três testes de critérios de seleção [Akaike (AIC), Kol- cionalmente utilizadas.
mogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises
(CvM)], dentre as 396 séries utilizadas. Números marcados em negrito
indicam as distribuições que não tiveram a hipótese nula rejeitada nen-
huma vez. Agradecimentos
Teste Distribuição sob Hipótese Nula
Agradecemos ao Instituto Nacional de Meteorologia
Weibull Gamma LogN Log-Log IGauss Nakagami (INMET) por disponibilizar no portal INMET os dados
KS 396 395 378 396 275 396 utilizados neste trabalho. O segundo autor agradece ao
AD 396 395 376 395 282 396 Instituto Cesumar de Ciência, Tecnologia e Inovação
AvM 396 395 380 396 277 396 (ICETI) pela Bolsa de Produtividade em Pesquisa
concedida.
selecionada, todas elas são importantes e, sempre que pos-
sível, o maior número delas deve ser ajustada e escolhida,
segundo os critérios discutidos aqui e na literatura. Referências
AKAIKE, H. A new look at the statistical model identification.
IEEE Trans. Automat. Contr., v. 19, n. 6, p. 716-723,
1974.
4. Conclusões
ANTÔNIO, J.R. Área de cobertura em ambiente de propaga-
Embora a distribuição Nakagami não seja muito uti- ção modelado com a distribuição k-u. 2003. 88 p. Dis-
lizada na descrição de dados de precipitação ou de outras sertação (Mestrado em Engenharia Elétrica) - Instituto
variáveis climatológicas, os resultados deste trabalho evi- Nacional de Telecomunicações (INATEL), Santa Rita do
denciam seu potencial na análise de séries de precipitação. Sapucaí. 2003. Disponível em: http://www.wisstek.org/
A distribuição Nakagami foi escolhida o maior ie708/Jamil.pdf. Acesso em: 10 jan. de 2016
ASHKAR, F.; AUCOIN, F. Choice between competitive pairs of
número de vezes como vencedora, obtendo o melhor
frequency models for use in hydrology: a review and some
ajuste para as estações climatológicas da Região Sul do new results. Hydrol. Sci. J. v. 57, n. 6, p. 1092-1106, 2012.
Brasil para série histórica de até 44 anos. Esta distribuição ASHKAR, F.; ZOGLAT A.M. On the discrimination between
permite previsões de precipitação climática, que podem statistical distributions for hydrological frequency analysis.
servir de suporte para tomada de decisões, planejamento e In: CSCE ANNUAL CONFERENCE. Major Public
gestão no agronegócio de uma região. Recomenda-se sua Works: Key Technologies for the 21st Century, Quebec,
utilização na descrição do comportamento da pluviosidade 1997. p. 169-178
Mazucheli and Emanuelli 7
BARTELS, R. The rank version of von Neumann’s ratio test for KENDALL, M.; GIBBONS, J.D. Rank correlation methods,
randomness. J. Am. Stat. Assoc., v. 77, n. 377, p. 40-46, 5th Edition. A Charles Griffin Title. Edward Arnold, Lon-
1982. don. 1990.
BEYRUTH, Z. Água, agricultura e as alterações climáticas glo- KOLAR, R.; JIRIK, R.; JAN, J. Estimator comparison of the
bais. Rev. Tec. & Agrop., 318 n. 6, p. 74-89, 2008. Nakagami-m parameter and its application in echocardio-
BUISHAND, T.A. Some methods for testing the homogeneity of graphy. Radioengineering, v. 13, n. 1, p. 8-12. 2004.
rainfall records. J. Hydrol., v. 58, n. 1-2, p. 11-27, 1982. KOTZ, S.; NADARAJAH, S. Extreme value distributions.
CAEIRO, F.; MATEUS, A. Randtests: Testingrandomness in R. London: Imperial College Press. 2000
R package version 1.0. 2014. Disponível em: URL http:// MACHIWAL, D.; JHA, M.K. Hydrologic time series analysis:
CRAN.R-project.org/package=randtests. Acesso em: 30 de theory and practice. Springer, Dordrecht; Capital Publish-
abr. 2015. ing Company, New Delhi, 2012.
CARGNELUTTI-FILHO, A.; MATZENAUER, R.; MALUF, J. MANN, H.B. Nonparametric tests against trend. Econometrica,
R.T.; RADIN, B. Variabilidade temporal e espacial da pre- v. 13, n. 3, p. 245-259, 1945.
cisão das estimativas de elementos meteorológicos no Rio NAKAGAMI, M., The m-distribution - A general formula of
Grande do Sul. Cienc. Rural., v. 39, n. 4, p. 962-970, 2009. intensity distribution of rapid fading. In: HOFFMAN,
CASELLA, G.; BERGER, R.L. Statistical inference. Série: W. C. (Ed.), Statistical Methods in Radio Wave Propaga-
Statistics/Probability Serie, Ed. Wadsworth \& Brooks/Cole tion. Pergamon, 1960. p. 3-36.
Advanced Books \& Software, Pacific Grove, CA. 1990 R CORE TEAM, 2013. R: A Language and Environment for
COE, R.; STERN, R.D. Fitting models to daily rainfall data. J. Statistical Computing. R Foun-dation for Statistical Com-
Appl. Meteorol., v. 21, n. 7, p. 337 1024-1031, 1982. puting, Vienna, Austria. 2013.
D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit tech- RAMOS, P.L.; MOALA, F.A. A aplicação da distribuição
niques. Statistics: Textbooks and Monographs. v. 68. New exponencial geométrica estendida para modelagem de
York, Marcel Dekker, 1986. dados pluviométricos. Rev. bras. meteorol., v. 29, n. 4,
DELIGNETTE-MULLER, M.L.; DUTANG, C. Fitdistrplus: An p. 613-620, 2014.
R package for fitting distri-butions. J. Stat. Software, v. SARKAR, S.; GOEL, N.K.; MATHUR, B. Adequacy of Naka-
64, n. 4, p. 1-34. 2015 gami-m distribution function to derive GIUH. J. Hydraul.
DOURADO NETO D.; ASSIS, J.P. de; TIMM, L.C.; MAN- Eng., v. 14, n. 10, p. 1070-1079, 2009.
FRON, P.A.; SPAROVEK, G.; FARAWAY, J.; MARSA- SARKAR, S.; GOEL, N.K.; MATHUR, B. Performance investi-
GLIA, G.; MARSAGLIA, J.; BADDELEY, A. Goftest: gation of Nakagami-m distributionto derive flood hydro-
Classical Goodness-of-Fit Tests for Univariate Distribu- graph by genetic algorithm optimization approach. J.
tions. R package version 1.0-2. 2014. Disponível em: Hydraul. Eng., v. 15, n. 8, p. 658-666, 2010.
URL http://CRAN.R-project.org/package=goftest. Acesso SARKAR, S.; RAI, R.K. Flood inundation modeling using
em: 30 de abr. 2015. Nakagami-m distribution based GIUH for a partially
GIBBONS, J.D.; CHAKRABORTI, S. Nonparametric statis- gauged catchment. Water Resour. Manag., v. 25, n. 14,
tical inference, 5th Edition. Statistics: Textbooks and p. 3805-3835, 2011.
Monographs. Boca Raton: CRC Press. 2011. SCHWARTZ, J.; GODWIN, R.T.; GILES, D.E. Improved max-
GUEDES, L.G.R. Área de cobertura e sobreposição de células imum-likelihood estimation of the shape parameter in the
no ambiente Nakagami. 1994. 123p. Dissertação (Mes- Nakagami distribution. J. Stat. Comput. Simul., v. 83,
trado em Engenharia Elétrica) - Faculdade de Engenharia n. 3, p. 434-445, 2013.
Elétrica e de Computação UNICAMP, Campinas. 1994. SCHWARZ, G. Estimating the dimension of a model. The
Disponível em: http://repositorio.unicamp.br/jspui/bit- Annals of Statistics, v. 6, n. 2, p. 461-464, 1978.
stream/REPOSIP/259670/1/Guedes_LeonardoGuerradeR- SINGH, K.J.; SARKAR, S. Development of GIUH for the
ezende_M.pdf. Acesso em: 30 de abr. 2015 catchment contributing to Loktak lake, North East India. J.
HANNAN, E.J.; QUINN, B.G. The determination of the order of Indian Society Remote Sens., v. 41, n.2, p. 447-459, 2013.
an autoregression. Journal of the Royal Statistical STEPHENS, M.A. EDF statistics for goodness of fit and some com-
Society. Series B. Methodological, v. 41, n. 2, p. 190-195, parisons.J. Am.Stat. Assoc.,v.69,n. 347,p. 730-737,1974.
1979. TORRES, F.E.; CARGNELUTTI FILHO, A.; TEODORO, P.E.;
JOHNSON, N.L.; KOTZ, S.; BALAKRISHNAN, N. Con- CORRÊA, C.C.G.; RIBEIRO, L.P.; CUNHA, E.R. Dimen-
tinuous univariate distributions. v. 1, 2ed. New York: sionamento amostral para a estimação da média de pre-
Wiley-Interscience Publication. 1994. cipitação pluvial mensal em locais do Estado do Mato
JOHNSON, N. L.; KOTZ, S.; BALAKRISHNAN, N. Con- Grosso do Sul. Cienc. Rural, v. 46, n. 1, p. 60-69, 2016.
tinuous univariate distributions. v. 2, 2ed. New York:
Wiley-Interscience Publication. 1995. Endereços de Internet
KANG, H.M.; YUSOF, F. Homogeneity tests on daily rainfall
series in peninsular malaysia. Int. J. Contemp. Math. Sci., Portal do Instituto Nacional de Meteorologia (INMET), Dis-
v. 7, n. 1, p. 9-22, 2012. ponível em: http://www.inmet.gov.br.
KARAGIANNIDIS, G.K.; SAGIAS, N.C.; MATHIOPOULOS
P.T. The N×Nakagami Fading Channel Model. In: Wireless This is an Open Access article distributed under the terms of the Creative Commons Attribution
License, which permits unrestricted use, distribution, and reproduction in any medium, provided
Communication Systems of 2nd International Symposium, the original work is properly cited.
2005. Anais 2nd International Symposium; p. 185-189.