Sei sulla pagina 1di 6

UNIVERSITÀ DEGLI STUDI DI BRESCIA - FACOLTÀ DI INGEGNERIA

DIPARTIMENTO DI INGEGNERIA CIVILE, ARCHITETTURA, TERRITORIO E AMBIENTE (DICATA)

Corso di Idrologia
A.A. 2011-2012

Esercitazione n°3

TRATTAMENTO DEI DATI IDROLOGICI


ED ELABORAZIONI STATISTICHE ELEMENTARI

Scopo della presente esercitazione è l'illustrazione di alcuni strumenti di analisi e sintesi utilizzati
per il trattamento dei dati idrologici. Pertanto, con riferimento al campione costituito dalla serie
storiche delle altezze totali annue di precipitazione osservate alla stazione pluviometrica di Mantova
(Tab. I) si eseguiranno le seguenti elaborazioni:
a) disposizione del campione in ordine crescente, suddivisione del campione in classi e
determinazione delle frequenze di classe, sia assolute che relative;
b) rappresentazione ad istogramma delle frequenze di classe e delle frequenze di classe cumulate,
sia assolute che relative;
c) determinazione della frequenza cumulata e rappresentazione della curva in diagramma;
d) calcolo dei momenti centrali campionari fino al quarto ordine e dei corrisipondenti parametri di
forma, vale a dire media, varianza, coefficiente di asimmetria (skewness), coefficiente di
appiattimento (kurtosis);
e) adattamento della distribuzione normale al campione di Tab. I;
f) confronto fra l’istogramma della densità di frequenza di classe e la curva di densità di
probabilità della distribuzione ottenuta al punto e);
g) confronto fra l’istogramma delle frequenze cumulate relative di classe e la funzione di
probabilità ottenute al punto e);
h) confronto fra le frequenze di non superamento empiriche e la funzione di probabilità ottenuta al
punto e);

Indicazioni per lo svolgimento


Una delle operazioni preliminari che risultano utili alla comprensione delle caratteristiche di un
campione1 è quella dell'ordinamento, crescente o decrescente, dei valori del campione. Questa
operazione consente di individuare
• il valore massimo del campione, xmax,
• il valore minimo, xmin, e
• l'ampiezza del campione, definita come differenza tra il valore massimo e quello minimo, cioè
A = (xmax − xmin). (1)

1 Questa operazione va evitata quando la cronologia della sequenza di osservazioni sia importante perchè funzionale al
tipo di elaborazione da condurre.

1
La conoscenza della ampiezza del campione consente quindi di suddividere il campo di esistenza
della variabile in classi, cioè in insiemi disgiunti di valori compresi tra due estremi, xi e xi+1. Onde
evitare l'arbitrarietà della determinazione del numero di classi, che potrebbe condurre a
rappresentazioni grafiche poco significative, se non fuorvianti, si può utilizzare in proposito la
relazione suggerita da Sturges2 che lega il numero delle classi, k, alla dimensione del campione, N,
secondo la formula
k = 1 + 3.3 log10 N (2)
In via operativa l'ampiezza di ciascuna classe può essere resta quindi definita dividendo l'ampiezza
del campione per il numero di classi.
Quando siano determinate le classi è possibile calcolare per ciascuna di queste la frequenza di
classe, assoluta e relativa. La frequenza assoluta di classe corrisponde al numero di elementi che
ricadono in una classe, ovvero
f i = {numero di elementi x ∈ ( xi −1 , xi ]} , (3)

dove xi−1 e xi indicano rispettivamente gli estremi inferiore e suoeriore della i-esima classe.
La frequenza relativa di classe è invece il rapporto tra fi e la numerosità, N, del campione:
f ir = f i N . (4)

Infine la densità di frequenza è definita dal rapporto tra fir l’ampiezza delle i-esima classe xi - xi-1:
g i = f ir ( xi − xi −1 ). (5)
Analogamente, la frequenza assoluta cumulata di classe per la classe j-esima è ottenuta sommando
il numero di elementi compresi nelle classi, km, fino alla i-esima, ovvero
Fi = {numero di elementi x j x j ≤ xi } . (6)

La frequenza relativa cumulata di classe è invece espressa dal rapporto tra Fj e la numerosità del
campione N:
Fir = Fi N . (7)

La distribuzione delle frequenze di classe, assolute o relative, si può rappresentare graficamente con
un istogramma di frequenza che consta di una successione di rettangoli, disposti sopra un piano
cartesiano, la cui ascissa riporta l'indicazione delle classi e le cui ordinate riportano il valore della
frequenza. Ogni rettangolo corrisponde ad una classe, alla cui frequenza è proporzionale la sua area.
Svincolandosi dalla divisione in classi, si definisce frequenza cumulata la funzione che fa
corrispondere al valore x della variabile casuale il numero delle osservazioni di valore minore od
uguale rapportate al numero totale di osservazioni, ovvero la funzione,
F ( x) = {numero di elementi x j x j ≤ x} N , (8)

La sua rappresentazione grafica può essere condotta su un piano cartesiano del tutto analogo a
quello utilizzato per la rappresentazione della frequenza cumulata di classe, nel quale l'asse delle
ascisse riporta la scala dei valori della variabile x, anziché il numero delle classi. Una corretta
rappresentazione grafica riporta su tale piano una spezzata che presenta un salto in corrispondenza
di ogni valore osservato.
A complemento dell'analisi, si richiede di stimare per il campione di Tab. I alcuni indici di tendenza
centrale e di dispersione.
L’indice di tendenza centrale più elementare è rappresentato dalla media campionaria ottenuta
come media aritmetica degli N valori della variabile x, indicato indifferentemente con i simboli m(x)

2cfr. Sturges, H.A., (1926) The choice of a class interval, J. Am. Statist. Assoc., vol. 21, pp. 65-66.

2
o x:
N
1
x=
N
∑x
i =1
i . (9)

La misura della dispersione del campione attorno alla media, e quindi della variabilità delle
osservazioni, è invece ottenuta calcolando la varianza,
1 N
s2 = ∑
N − 1 i =1
( x i − x )2 (10)

o lo scarto quadratico medio, s, che è definito come la radice quadrata della varianza.
Assai utili sono poi i seguenti parametri adimensionali:

• coefficiente di variazione:
s ( x)
cv( x) = ; (11)
m( x )

• coefficiente di asimmetria (skewness):


N
N

( N − 1)( N − 2) i =1
(xi − x )3
g ( x) = , (12)
s ( x) 3
che risulta positivo per istogrammi inclinati a destra – cioè con una lunga coda a destra – e
negativo nel caso duale;
• coefficiente di appiattimento (kurtosis), di solito riferito al valore 3, caratteristico della
distribuzione normale:
N
N ( N + 1)

( N − 1)( N − 2)( N − 3) i =1
( x i − x )4
( N − 1) 2
k ( x) = − 3 . (13)
s ( x) 4 ( N − 2)( N − 3)

3
Tabella I
Altezze totali annue di precipitazione osservate alla stazione pluviometrica di Mantova

Anno Precipitazione annua Anno Precipitazione annua Anno Precipitazione annua


(mm) (mm) (mm)
1963 932.3 1977 705 1992 601.4
1964 685.9 1978 846.8 1993 523.8
1965 858.2 1979 680.3 1994 707.6
1966 722.2 1980 684.3 1995 556.6
1967 579.8 1981 589 1996 932.4
1968 804.7 1982 613.4 1997 610.6
1969 603.2 1984 770 1998 554
1970 497.5 1985 612.7 1999 796.4
1971 569.7 1986 794.4 2000 678
1972 775.2 1987 886.4 2001 739.6
1973 612.2 1988 458.8 2002 817.6
1974 604.8 1989 762.4 2003 433.4
1975 727.2 1990 662 2004 833.6
1976 777.3 1991 595.8 2005 853

4
APPENDICE

Distribuzione normale
Tra le distribuzioni di probabilità di uso più comune, e di uso frequente anche nelle applicazioni
idrologiche, va sicuramente ricordata la distribuzione normale, la cui densità di probabilità è
espressa come

1  1x−µ 
2

p( x) = exp−  X
 , − ∞ < x < +∞ (A.1)
2π σ X  2  σ X  

e la cui funzione di probabilità cumulata risulta

1
x  1 ξ − µ 
2

∫−∞ − 2  σ X  dξ , − ∞ < x < +∞ .
X
P( x) = exp (A.2)
2π σ X   

Allo scopo di potersi svincolare dai parametri si può introdurre la distribuzione normale in forma
canonica (o standard). In essa alla variabile casuale X si sostituisce la variabile ridotta
X − µX
U= , (A.3)
σX
caratterizzata dalla proprietà di essere una funzione crescente della variabile originaria, con media
nulla e varianza unitaria. Le espressioni della densità di probabilità e della funzione di probabilità
in forma canonica diventano così
1  1 
P(u ) = exp − u 2 , − ∞ < u < +∞ (A.4)
2π  2 
e
u
1  1 
∫ exp− 2 u ′
2
P (u ) = du ′, − ∞ < u < +∞ . (A.5)
2π −∞ 
Vale infine la pena ricordare che valgono le seguenti proprietà:
PU (u ) = PX ( x) , (A.6)

pU (u ) = p X ( x)σ X . (A.7)

5
Valori della distribuzione normale standardiz- 0.4 p(u)
u
1  1  0.3 P(u)
zata, P (u ) = ∫
2π − ∞
exp − ν 2 dν ,
 2  0.2

per u ≥ 0. 0.1
Per u < 0, data la simmetria della distribuzione,
0
vale la relazione -4.00 -2.00 0.00
u
2.00 4.00
P(-u)=1-P(u) variabile ridotta, u [-]

u PU(u) u PU(u) u PU(u) u PU(u)


0.00 0.5000 0.50 0.6915 1.00 0.8413 1.50 0.9332
0.01 0.5040 0.51 0.6950 1.01 0.8438 1.51 0.9345
0.02 0.5080 0.52 0.6985 1.02 0.8461 1.52 0.9357
0.03 0.5120 0.53 0.7019 1.03 0.8485 1.53 0.9370
0.04 0.5160 0.54 0.7054 1.04 0.8508 1.54 0.9382
0.05 0.5199 0.55 0.7088 1.05 0.8531 1.55 0.9394
0.06 0.5239 0.56 0.7123 1.06 0.8554 1.56 0.9406
0.07 0.5279 0.57 0.7157 1.07 0.8577 1.57 0.9418
0.08 0.5319 0.58 0.7190 1.08 0.8599 1.58 0.9429
0.09 0.5359 0.59 0.7224 1.09 0.8621 1.59 0.9441
0.10 0.5398 0.60 0.7257 1.10 0.8643 1.60 0.9452
0.11 0.5438 0.61 0.7291 1.11 0.8665 1.61 0.9463
0.12 0.5478 0.62 0.7324 1.12 0.8686 1.62 0.9474
0.13 0.5517 0.63 0.7357 1.13 0.8708 1.63 0.9484
0.14 0.5557 0.64 0.7389 1.14 0.8729 1.64 0.9495
0.15 0.5596 0.65 0.7422 1.15 0.8749 1.65 0.9505
0.16 0.5636 0.66 0.7454 1.16 0.8770 1.66 0.9515
0.17 0.5675 0.67 0.7486 1.17 0.8790 1.67 0.9525
0.18 0.5714 0.68 0.7517 1.18 0.8810 1.68 0.9535
0.19 0.5753 0.69 0.7549 1.19 0.8830 1.69 0.9545
0.20 0.5793 0.70 0.7580 1.20 0.8849 1.70 0.9554
0.21 0.5832 0.71 0.7611 1.21 0.8869 1.80 0.9641
0.22 0.5871 0.72 0.7642 1.22 0.8888 1.90 0.9713
0.23 0.5910 0.73 0.7673 1.23 0.8907 2.00 0.9772
0.24 0.5948 0.74 0.7704 1.24 0.8925 2.10 0.9821
0.25 0.5987 0.75 0.7734 1.25 0.8944 2.20 0.9861
0.26 0.6026 0.76 0.7764 1.26 0.8962 2.30 0.9893
0.27 0.6064 0.77 0.7794 1.27 0.8980 2.40 0.9918
0.28 0.6103 0.78 0.7823 1.28 0.8997 2.50 0.9938
0.29 0.6141 0.79 0.7852 1.29 0.9015 2.60 0.9953
0.30 0.6179 0.80 0.7881 1.30 0.9032 2.70 0.9965
0.31 0.6217 0.81 0.7910 1.31 0.9049 2.80 0.9974
0.32 0.6255 0.82 0.7939 1.32 0.9066 2.90 0.9981
0.33 0.6293 0.83 0.7967 1.33 0.9082 3.00 0.9987
0.34 0.6331 0.84 0.7995 1.34 0.9099 3.10 0.9990
0.35 0.6368 0.85 0.8023 1.35 0.9115 3.20 0.99931
0.36 0.6406 0.86 0.8051 1.36 0.9131 3.30 0.99952
0.37 0.6443 0.87 0.8078 1.37 0.9147 3.40 0.99966
0.38 0.6480 0.88 0.8106 1.38 0.9162 3.50 0.99977
0.39 0.6517 0.89 0.8133 1.39 0.9177 3.60 0.99984
0.40 0.6554 0.90 0.8159 1.40 0.9192 3.70 0.99989
0.41 0.6591 0.91 0.8186 1.41 0.9207 3.80 0.99993
0.42 0.6628 0.92 0.8212 1.42 0.9222 3.90 0.999952
0.43 0.6664 0.93 0.8238 1.43 0.9236 4.00 0.999968
0.44 0.6700 0.94 0.8264 1.44 0.9251 4.10 0.999979
0.45 0.6736 0.95 0.8289 1.45 0.9265 4.20 0.999987
0.46 0.6772 0.96 0.8315 1.46 0.9279 4.30 0.999991
0.47 0.6808 0.97 0.8340 1.47 0.9292 4.40 0.999995
0.48 0.6844 0.98 0.8365 1.48 0.9306 4.50 0.9999966
0.49 0.6879 0.99 0.8389 1.49 0.9319 5.00 0.9999997