Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
L’IDROLOGIA
CORSO DI COSTRUZIONI IDRAULICHE
2020-2021
h
Introduzione
Problema ingegneristico: determinare valori di grandezze a partire
da altre grandezze note (profilo del pelo libero al passaggio di una
data portata).
limitate illimitate
1
p 0.5
2
indipendente dipendente
Probabilità incondizionata Probabilità di E1 condizionata a E2
p E1 p E1 E2
Probabilità
Due eventi E1 ed E2 si dicono mutuamente indipendenti quando il
fatto che uno dei due sia accaduto non influisce sulla probabilità
che accade l’altro.
Probabilità condizionata = Probabilità incondizionata
p E1 E2 p E1
pn E p E
n
Distribuzioni di probabilità
Nel caso di una variabile discreta è possibile associare a ciascun
valore della grandezza una probabilità.
La funzione p(x), che associa ad ogni valore della variabile
casuale x la probabilità corrispondente, si chiama funzione di
probabilità di x.
1-P(xa)
P(xa) P(xa)
xa
P x xa 1 P xa
Distribuzioni di probabilità
Nel caso di una variabile continua si definisce invece la funzione
P(x), che definisce, per ogni valore di x, la probabilità che la
variabile assuma un valore non superiore ad x stesso (probabilità
di non superamento).
P(xa)
xa xb
P(xa)
xa xa
xa
P xa P x xa dp( x) dx P x
a
Distribuzioni di probabilità
Nel caso di variabile continua si definisce densità di probabilità,
p(x), la derivata della funzione di probabilità P(x).
dP( x)
p ( x)
dx
dP( x) 1
dp( x) dx 1
Grandezze delle distribuzioni
Data una variabile casuale discreta si definisce momento di r-esimo
ordine rispetto al valore x0 la grandezza:
N
x xi x0 p xi
' r
r
i 1
xi –x0
x0 xi
i 1
i 1
N
x xi x p xi x x x p x dx
2 2
2
varianza 2
i 1
Grandezze delle distribuzioni
Si definisce scarto quadratico medio (deviazione standard) della
variabile casuale x la radice quadrata σ(x) della sua varianza.
Lo scarto quadratico medio misura la dispersione dei valori
intorno alla media.
Si definisce coefficiente di variazione il rapporto tra lo scarto
quadratico medio e la media della variabile casuale x:
x
CV x
x
0.5
xmed
p(xmed)
xmod
Tempo di ritorno
Nella progettazione delle opere idrauliche non si fa riferimento alla
probabilità dell’evento più gravoso ma al suo tempo di ritorno
Si definisce tempo di ritorno corrispondente ad una data grandezza
x l’intervallo di tempo in cui tale valore viene uguagliato o
superato mediamente una sola volta.
1
T x
1 P x
m
con
N N!
m N m !m !
varianza n 1
0.15 9 0.06537
10 0.030817
p(m)
0.1 11 0.012007
12 0.003859
0.05
13 0.001018
0 14 0.000218
0 5 10 15 20 25 15 3.74E-05
m
16 5.01E-06
17 5.05E-07
media 6 18 3.61E-08
dove
- μ(x) è la media della distribuzione;
- σ(x) è lo scarto quadratico medio della distribuzione.
a b c
p(x) p(x)
x x
Distribuzione normale
La funzione di densità di probabilità è una funzione simmetrica
rispetto alla media: quindi la mediana coincide con la media.
Inoltre presentando p(x) il punto di massimo per x uguale a μ(x),
anche la moda coincide con la media.
Al fine di svincolarsi dai due parametri della distribuzione, scarto e
valore medio, si introduce la variabile adimensionale u:
x ( x)
u
( x)
u2
dx
p(u ) p( x) p ( x) ( x) p u
1
e
2
du 2
Distribuzione normale
Per calcolare la probabilità P(x) e la densità di probabilità p(x)
relative ad un valore assegnato x si procede come segue:
• Stima della media μ(x) e dello scarto quadratico medio σ(x);
x ( x)
• Stima dei corrispondenti valori di u per ogni x; u
( x)
P (u ) P ( x)
Distribuzione lognormale
La distribuzione lognormale a due parametri è caratterizzata dal
fatto che a seguire la legge normale non è la variabile originaria x,
ma il suo logaritmo y ln x .
La densità di probabilità della distribuzione vale:
1 ln x y 2
1
y
p x
2
e
x 2 y
xmod , xmed , ( x) f ( y )
Distribuzione lognormale
Poiché la variabile y è distribuita normalmente ci si può ricondurre
alla variabile ridotta u per mezzo della trasformazione
u a ln x b a y b
(u ) a ( y ) 1 a 1 ( y)
(u ) a ( y ) b 0 b ( y) ( y)
2 ( x)
( y) ln 1 2
2
( x)
Distribuzione lognormale
Nel caso della legge lognormale a tre parametri ci si riconduce
alla variabile ridotta u per mezzo della trasformazione
u a ln x x0 b
1
a
2 ( x)
ln 1 2
( x) x0
1
b a ln ( x) x0
2a
Distribuzione di Gumbel
Nello studio statistico di certi eventi (piene, piogge intense…)
riveste molta importanza la conoscenza della legge di probabilità
seconda la quale è distribuito il valore massimo di una variabile x
in un campione di dimensione N assegnato.
Distribuzione di Gumbel
Ripetendo tale ragionamento per ciascuno degli N anni di
osservazione è possibile introdurre una nuova variabile:
x max zi
N
y
p( y ) ee y
( x) 0.45 ( x)
Distribuzione di Gumbel
Il parametro α, che è inversamente proporzionale a σ(x), controlla
la forma del grafico della funzione densità di probabilità:
Il parametro ε controlla invece la posizione del grafico.
p(x)
b
p(x)
x c d
x
Frequenza di un campione
Il problema centrale delle applicazioni idrologiche della statistica
è quello di risalire alla funzione di probabilità di una data
grandezza in funzione del numero finito di misurazioni della stessa
grandezza a disposizione (problema di inferenza).
f(xi)
f(x) p(x)
x x
Frequenza di un campione
Quando la variabile è continua la ripetizione di un valore è invece
un fatto rarissimo, di conseguenza quasi tutti i valori osservati
presentano frequenza pari a 1/N.
f(x)
x
Frequenza di un campione
Anno h (mm)
1) Dimensione nel campione N: 20
1961 21.00
1962 32.00
1964 28.60 2) Ampiezza del campione:
1965 30.00 60.20 – 11.80 = 48.40 mm
1966 47.80
1967 53.22
3) Numero di classi: 6
1968 60.20
1970 25.40
1973 55.60 4) Estremi di classe:
1974 37.80
11.80 mm
1975 53.20
19.86 mm
1976 15.80
1977 15.40
27.93 mm
1978 29.00
36.00 mm
1979 17.40 44.06 mm
1980 11.80 52.13 mm
1981 25.00 60.20 mm
1982 22.00
1983 16.80
1985 12.80
ni
f ( xi ) fi
N
Frequenza di un campione
Estremi di classe Frequenza di classe Frequenza di Frequenza relativa
(mm) assoluta classe relativa cumulata
11.80 - 19.86 6 0.30 0.30
19.86 – 27.93 4 0.20 0.50
27.93 – 36.00 4 0.20 0.70
36.00 - 44.06 1 0.05 0.75
44.06 - 52.13 1 0.05 0.80
52.13 - 60.20 4 0.20 1.00
ni
F ( xi ) Fi f i
N
Frequenza di un campione
Essendo le variabili idrologiche generalmente di tipo continuo, è
necessario introdurre un concetto analogo alla probabilità di non
superamento: la frequenza di non superamento o frequenza
cumulata relativa.
La frequenza di non superamento di un dato valore si definisce
come il rapporto tra il numero delle osservazioni con valore non
maggiore di quello assegnato ed il numero totale delle osservazioni.
ni
F ( xi ) Fi f i
N
1 N
mr x xi m x
r momento di ordine r
N i 1 rispetto alla media
1 N
s x xi m x
2 2
varianza
N i 1
1 N scarto quadratico
x xi m x
2
s ( x) s 2
N i 1 medio
N 1 N i 1 N 1 i 1
Stima dei parametri
Individuare la distribuzione di una variabile casuale consiste nello
stabilire quale distribuzione di probabilità (normale, Gumbel…) fornisce
la migliore interpolazione dei punti rappresentanti la frequenza cumulata
relativa del campione.
F(x) F(x)
P(x)
x x
2 x s2 x varianza
N s2 x
coef .correttivo varianza
N 1
N2 m3 x
coef .correttivo momento del terzo
N 1 N 2 ordine
Stima dei parametri
Metodo dei minimi quadrati
Supponiamo di avere a disposizione un campione costituito da n
coppie di valori (x1, y1), (x2, y2)…(xn,yn), assunti in n occasioni
diverse ed indipendenti da due variabili x e y:
y
y = g(x)
y’i
yi
xi x
y y
i 1
i
'
i min
Stima dei parametri
Metodo dei minimi quadrati
Si proceda, ad esempio, alla stima dei parametri a e b delle legge
lognormale a due parametri:
Indicando con ui i valori osservati e ui’ i valori calcolati con
l’equazione:
ui' a ln xi b
N 2
u
i 1
'
i ui min
N '
2
a i 1
u i ui 0
N '
2
b i 1
u i ui 0
Stima dei parametri
Metodo dei minimi quadrati
Si proceda, ad esempio, alla stima dei parametri a e b delle legge
lognormale a due parametri:
Indicando con ui i valori osservati e ui’ i valori calcolati con
l’equazione:
ui' a ln xi b
N 2
u
i 1
'
i ui min
a ln x b ln x u ln x
2
a ln x b n u
Curva di probabilità
Una volta calcolati i parametri della legge di probabilità scelta, è possibile
valutare il valore di probabilità corrispondente a ciascuna grandezza del
campione.
i h (mm) F(h) PN(h) PL(h) PG(h)
1 11.80 0.05 0.11 0.05 0.07
x ( x) u a ln x b a y b y x
u
( x)
Legge normale Legge lognormale Legge Gumbel
y
P( y ) e e
x
Curva di probabilità
Per ciascuna delle distribuzioni di probabilità studiate sono state
introdotte delle variabili ridotte le quali risultano legate
linearmente alla variabile originaria x:
x ( x) u a ln x b a y b y x
u
( x)
Legge normale Legge lognormale Legge Gumbel
P(y) y
y
P( y ) e e
P( y ) P( x)
x
Curva di probabilità
Per ciascuna delle distribuzioni di probabilità studiate sono state
introdotte delle variabili ridotte le quali risultano legate
linearmente alla variabile originaria x:
x ( x) u a ln x b a y b y x
u
( x)
Legge normale Legge lognormale Legge Gumbel
P(x)
y
P( y ) e e
P( y ) P( x)
x
Curva di probabilità
Per ciascuna delle distribuzioni di probabilità studiate sono state
introdotte delle variabili ridotte le quali risultano legate
linearmente alla variabile originaria x:
x ( x) u a ln x b a y b y x
u
( x)
Legge normale Legge lognormale Legge Gumbel
P(x) T
1
T x
1 P x
x
Curva di probabilità
Elaborazioni su carta probabilistica normale
i h (mm) F(h) PN(h) uF,N(h) uP,N(h)
1 11.80 0.05 0.11 -1.67 -1.21
2 12.80 0.10 0.13 -1.31 -1.14
3 15.40 0.14 0.16 -1.07 -0.97
4 15.80 0.19 0.17 -0.88 -0.95
5 16.80 0.24 0.19 -0.71 -0.88
6 17.40 0.29 0.20 -0.57 -0.85
7 21.00 0.33 0.27 -0.43 -0.61
8 22.00 0.38 0.29 -0.30 -0.55
9 25.00 0.43 0.36 -0.18 -0.36
10 25.40 0.48 0.37 -0.06 -0.33
11 28.60 0.52 0.45 0.06 -0.12
12 29.00 0.57 0.46 0.18 -0.10
13 30.00 0.62 0.49 0.30 -0.03
14 32.00 0.67 0.54 0.43 0.09
15 37.80 0.71 0.68 0.57 0.47
16 47.80 0.76 0.87 0.71 1.11
17 53.20 0.81 0.93 0.88 1.46
18 53.22 0.86 0.93 1.07 1.46
19 55.60 0.90 0.95 1.31 1.61
20 60.20 0.95 0.97 1.67 1.91
Curva di probabilità
Rappresentazione su carta probabilistica normale
Curva di probabilità
Elaborazioni su carta probabilistica lognormale
i h (mm) F(h) PL(h) uF,L(h) uP,L(h)
1 11.80 0.05 0.05 -1.87 -1.62
2 12.80 0.10 0.07 -1.47 -1.46
3 15.40 0.14 0.14 -1.20 -1.10
4 15.80 0.19 0.15 -0.98 -1.05
5 16.80 0.24 0.18 -0.80 -0.93
6 17.40 0.29 0.19 -0.64 -0.86
7 21.00 0.33 0.31 -0.48 -0.49
8 22.00 0.38 0.34 -0.34 -0.40
9 25.00 0.43 0.44 -0.20 -0.15
10 25.40 0.48 0.45 -0.07 -0.12
11 28.60 0.52 0.54 0.07 0.11
12 29.00 0.57 0.56 0.20 0.14
13 30.00 0.62 0.58 0.34 0.21
14 32.00 0.67 0.63 0.48 0.33
15 37.80 0.71 0.74 0.64 0.66
16 47.80 0.76 0.87 0.80 1.12
17 53.20 0.81 0.91 0.98 1.33
18 53.22 0.86 0.91 1.20 1.33
19 55.60 0.90 0.92 1.47 1.41
20 60.20 0.95 0.94 1.87 1.57
Curva di probabilità
Rappresentazione su carta probabilistica lognormale
Curva di probabilità
Elaborazioni su carta probabilistica di Gumbel
i h (mm) F(h) PG(h) yF,G(h) yP,G(h)
1 11.80 0.05 0.07 -1.11 -0.97
2 12.80 0.10 0.09 -0.86 -0.89
3 15.40 0.14 0.14 -0.67 -0.67
4 15.80 0.19 0.15 -0.51 -0.64
5 16.80 0.24 0.17 -0.36 -0.56
6 17.40 0.29 0.19 -0.23 -0.51
7 21.00 0.33 0.29 -0.09 -0.21
8 22.00 0.38 0.32 0.04 -0.13
9 25.00 0.43 0.41 0.17 0.12
10 25.40 0.48 0.42 0.30 0.15
11 28.60 0.52 0.52 0.44 0.42
12 29.00 0.57 0.53 0.58 0.45
13 30.00 0.62 0.56 0.73 0.53
14 32.00 0.67 0.61 0.90 0.70
15 37.80 0.71 0.73 1.09 1.18
16 47.80 0.76 0.87 1.30 2.00
17 53.20 0.81 0.92 1.55 2.45
18 53.22 0.86 0.92 1.87 2.45
19 55.60 0.90 0.93 2.30 2.65
20 60.20 0.95 0.95 3.02 3.03
Curva di probabilità
Rappresentazione su carta probabilistica di Gumbel
Test statistici
L’adattamento di una distribuzione di probabilità ad un campione
deve essere successivamente provato utilizzando dei test statistici,
tra i quali il test del λ2 di Pearson.
Il campione viene diviso in k classi equi-probabili.
P(x)
Np5
2. Stima delle grandezze Ni per le k
classi di suddivisione;
3. Stima del λ2:
Ni N p
2
k
2
i 1 Np
4. Stima del parametro ν:
k s 1
5. Stabilito il livello di
significatività (usualmente 0.95)
stima del valore del λ2crit;
Fascia fiduciaria
u’’
Curve di controllo
u’
k P(u ) 1 P(u )
uF' u
p(u ) N
k P(u ) 1 P(u )
uF'' u
p(u ) N
dove
- u è la variabile ridotta corrispondente ad una data x;
- p(u) è la densità di probabilità associata ad u;
- P(u) è il valore di probabilità associato ad u;
- N è la dimensione del campione di dati a disposizione.
In particolare per α = 0.05 e 1 – α = 0.95 (livello di significatività
del 95%) risulta k = 1.96.
Fascia fiduciaria
Elaborazioni su carta probabilistica normale
i h (mm) F(h) PN(h) uF,N(h) uP,N(h) pN(h) u'P,N(h) u''P,N(h)
1 11.80 0.05 0.11 -1.67 -1.21 0.19 -1.93 -0.48
2 12.80 0.10 0.13 -1.31 -1.14 0.21 -1.84 -0.44
3 15.40 0.14 0.16 -1.07 -0.97 0.25 -1.63 -0.32
4 15.80 0.19 0.17 -0.88 -0.95 0.25 -1.60 -0.30
5 16.80 0.24 0.19 -0.71 -0.88 0.27 -1.52 -0.25
6 17.40 0.29 0.20 -0.57 -0.85 0.28 -1.47 -0.22
7 21.00 0.33 0.27 -0.43 -0.61 0.33 -1.20 -0.03
8 22.00 0.38 0.29 -0.30 -0.55 0.34 -1.13 0.03
9 25.00 0.43 0.36 -0.18 -0.36 0.37 -0.92 0.21
10 25.40 0.48 0.37 -0.06 -0.33 0.38 -0.89 0.23
11 28.60 0.52 0.45 0.06 -0.12 0.40 -0.68 0.43
12 29.00 0.57 0.46 0.18 -0.10 0.40 -0.65 0.45
13 30.00 0.62 0.49 0.30 -0.03 0.40 -0.58 0.51
14 32.00 0.67 0.54 0.43 0.09 0.40 -0.46 0.64
15 37.80 0.71 0.68 0.57 0.47 0.36 -0.10 1.04
16 47.80 0.76 0.87 0.71 1.11 0.22 0.42 1.80
17 53.20 0.81 0.93 0.88 1.46 0.14 0.63 2.28
18 53.22 0.86 0.93 1.07 1.46 0.14 0.63 2.28
19 55.60 0.90 0.95 1.31 1.61 0.11 0.71 2.52
20 60.20 0.95 0.97 1.67 1.91 0.06 0.79 3.03
Fascia fiduciaria
Rappresentazione su carta probabilistica normale
Fascia fiduciaria
Elaborazioni su carta probabilistica lognormale
i h (mm) F(h) PL(h) uF,L(h) uP,L(h) pL(h) u‘P,L(h) u'‘P,L(h)
1 11.80 0.05 0.05 -1.87 -1.62 0.11 -2.54 -0.71
2 12.80 0.10 0.07 -1.47 -1.46 0.14 -2.29 -0.64
3 15.40 0.14 0.14 -1.20 -1.10 0.22 -1.79 -0.41
4 15.80 0.19 0.15 -0.98 -1.05 0.23 -1.73 -0.38
5 16.80 0.24 0.18 -0.80 -0.93 0.26 -1.58 -0.29
6 17.40 0.29 0.19 -0.64 -0.86 0.28 -1.49 -0.23
7 21.00 0.33 0.31 -0.48 -0.49 0.35 -1.07 0.08
8 22.00 0.38 0.34 -0.34 -0.40 0.37 -0.97 0.16
9 25.00 0.43 0.44 -0.20 -0.15 0.39 -0.70 0.40
10 25.40 0.48 0.45 -0.07 -0.12 0.40 -0.67 0.43
11 28.60 0.52 0.54 0.07 0.11 0.40 -0.44 0.66
12 29.00 0.57 0.56 0.20 0.14 0.40 -0.41 0.69
13 30.00 0.62 0.58 0.34 0.21 0.39 -0.35 0.76
14 32.00 0.67 0.63 0.48 0.33 0.38 -0.23 0.89
15 37.80 0.71 0.74 0.64 0.66 0.32 0.06 1.25
16 47.80 0.76 0.87 0.80 1.12 0.21 0.42 1.81
17 53.20 0.81 0.91 0.98 1.33 0.17 0.56 2.09
18 53.22 0.86 0.91 1.20 1.33 0.17 0.56 2.10
19 55.60 0.90 0.92 1.47 1.41 0.15 0.61 2.22
20 60.20 0.95 0.94 1.87 1.57 0.12 0.69 2.45
Fascia fiduciaria
Rappresentazione su carta probabilistica lognormale
Fascia fiduciaria
Elaborazioni su carta probabilistica di Gumbel
i h (mm) F(h) PG(h) yF,G(h) yP,G(h) pG(h) y'P,G(h) y''P,G(h)
1 11.80 0.05 0.07 -1.11 -0.97 0.02 -8.22 6.28
2 12.80 0.10 0.09 -0.86 -0.89 0.02 -7.92 6.14
3 15.40 0.14 0.14 -0.67 -0.67 0.02 -7.36 6.02
4 15.80 0.19 0.15 -0.51 -0.64 0.02 -7.30 6.02
5 16.80 0.24 0.17 -0.36 -0.56 0.03 -7.17 6.06
6 17.40 0.29 0.19 -0.23 -0.51 0.03 -7.11 6.09
7 21.00 0.33 0.29 -0.09 -0.21 0.03 -6.92 6.50
8 22.00 0.38 0.32 0.04 -0.13 0.03 -6.92 6.67
9 25.00 0.43 0.41 0.17 0.12 0.03 -7.03 7.27
10 25.40 0.48 0.42 0.30 0.15 0.03 -7.06 7.36
11 28.60 0.52 0.52 0.44 0.42 0.03 -7.36 8.20
12 29.00 0.57 0.53 0.58 0.45 0.03 -7.41 8.31
13 30.00 0.62 0.56 0.73 0.53 0.03 -7.55 8.62
14 32.00 0.67 0.61 0.90 0.70 0.02 -7.87 9.26
15 37.80 0.71 0.73 1.09 1.18 0.02 -9.17 11.52
16 47.80 0.76 0.87 1.30 2.00 0.01 -12.95 16.95
17 53.20 0.81 0.92 1.55 2.45 0.01 -16.00 20.90
18 53.22 0.86 0.92 1.87 2.45 0.01 -16.02 20.92
19 55.60 0.90 0.93 2.30 2.65 0.01 -17.65 22.94
20 60.20 0.95 0.95 3.02 3.03 0.00 -21.37 27.42
Fascia fiduciaria
Rappresentazione su carta probabilistica di Gumbel
Correlazione e regressione
Alcune grandezze naturali a volte possono non essere indipendenti,
cioè presentano dei legami non rigidi detti correlazioni.
x y
34 37
37 37
36 34
32 34
32 33
36 40
35 39
34 37
29 36
35 35
28 30
30 34
32 30
41 37
Il grafico fornisce un’idea del campo di variazione delle due
38 40
grandezze, inoltre permette di verificare se vi sia una zona nel
36 42
piano dove tendono ad addensarsi i punti empirici.
37 40
33 36
32 31
33 31
Correlazione e regressione
Le interrelazioni tra le due variabili possono essere descritte da
una quantità detta coefficiente di correlazione ρ:
xy
x y
dove
- σx è lo scarto quadratico medio della variabile x;
- σy è lo scarto quadratico medio della variabile y;
- σxy è la covarianza definita come:
1 N
xy xi x yi y
N i 1
Se ρ = 0 e σxy = 0 allora le variabili x ed y sono indipendenti;
Se ρ = ± 1 si ha una relazione funzionale lineare tra x ed y;
Se – 1 < ρ < 0 si ha correlazione negativa;
Se 0 < ρ < + 1 si ha correlazione positiva.
Correlazione e regressione
Come la varianza misura l’ampiezza delle fluttuazioni attorno al
valore medio, la correlazione misura il collegamento tra
fluttuazioni di x e fluttuazioni di y.
Un caso particolare di correlazione è l’autocorrelazione, che
consiste nell’associare il valore yi di una serie con un valore yi+k
della stessa serie, cioè a paragonare termine a termine la serie
iniziale con la stessa sfalsata di k unità rispetto al tempo.
1 nk
yi y yi k yi k
N i 1
k y , y k
y yk nk nk
yi y yi k yi k
2 2
i 1 i 1
N 1
dove
- yi+k è il valore di yi sfalsato di k unità;
- yi+k è il valore medio della grandezza yi+k.
Correlazione e regressione
L’andamento dei dati sperimentali o un modello teorico possono
suggerire che le variabili x e y siano legate da una relazione nota
del tipo:
y f x, A, B...N
xi x y y
i 1
i
'
i min
Correlazione e regressione
L’andamento dei dati sperimentali o un modello teorico possono
suggerire che le variabili x e y siano legate da una relazione nota
del tipo:
y f x, A, B...N
x x
i 1
i
'
i min
xi x
Correlazione e regressione
L’andamento dei dati sperimentali o un modello teorico possono
suggerire che le variabili x e y siano legate da una relazione nota
del tipo:
y f x, A, B...N
xi x