Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
-27/02/2004
1 Introduzione
Una variabile si dice casuale quando assume valori che dipendono da un numero elevato di cause
sconosciute e/o parzialmente note e che, quindi, non sono prevedibili a priori.
Le grandezze idrologiche possono essere considerate variabili casuali. Ad esempio le portate
massime annuali in un corso d acqua non sono prevedibili e si succedono con variazioni di entit
rilevante e possono quindi apparire come una serie di numeri casuali. Per determinare il possibile
campo di valori che pu assumere una grandezza idrologica si esegue sulla base di dati noti un
analisi statistico-probabilistico al fine di individuare la distribuzione di probabilit che segue per
associare ad ogni valore che pu assumere la grandezza idrologica la frequenza con cui si verifica.
Per tempo di ritorno Tr si intende l intervallo di tempo, per essere pi precisi il numero di anni, in
cui un dato valore di una grandezza idrologica viene mediamente uguagliato o superato una sola
volta. Per evento si intende il verificarsi di un qualsiasi valore della variabile casuale superiore od
inferiore ad un valore prefissato o compreso in un possibile intervallo due valori prestabiliti. Il
verificarsi di un valore della grandezza idrologica uguale o superiore a quello prefissato un evento
con tempo di ritorno Tr pari al numero di anni di osservazione. Il tempo di ritorno quindi
univocamente collegato ad un prefissato valore della grandezza idrologica. Ad esempio se un anno
il valore massimo della portata convogliata dal fiume Po Q = 7000 m3/s e l anno successivo Q =
6000 m3/s, il primo valore corrisponde ad un tempo di ritorno di due anni, ovvero accade ogni due
anni, mentre il secondo corrisponde ad un tempo di ritorno di un anno, ovvero viene uguagliato o
superato ogni anno. Nell esempio sopra riportato la stima del tempo di ritorno associata ad un
evento (verificarsi del valore della grandezza idrologica) basata su una finestra di osservazione di
due anni. Prendendo in considerazione una finestra di osservazione di pi anni, i tempi di ritorno
associati ai valori considerati possono cambiare. Data una qualsiasi variabile casuale si definisce
popolazione l insieme di tutti i valori che la variabile casuale pu assumere. Si definisce campione
di dimensione N, un insieme di N valori estratto dalla popolazione della variabile casuale. Ad
esempio i valori di precipitazione massima annuale registrati da un pluviometro per la durata di un
ora per il periodo 1970-2000 costituiscono un campione della popolazione della variabile casuale
precipitazione massima annuale per la durata di un ora nella localit in cui stata registrata.
k = 1 + 1.33 ln N
(1)
Il valore di k ottenuto tramite la relazione (1) deve essere arrotondato ad un numero intero: con N =
20, k = 4.98, si assume k = 5, con N = 50, k = 6.2, si assume k = 6. Si determinano quindi gli
estremi delle classi in cui si vuole suddividere il campione. L estremo inferiore della prima classe
x1 un valore della variabile casuale minore del valore minimo del campione mentre l estremo
superiore dell ultima classe xN un valore della variabile casuale maggiore od uguale al valore
massimo del campione. Fissati gli estremi inferiore e superiore della prima ed ultima classe si
stabiliscono gli estremi delle rimanenti classi dividendo l intervallo tra i due estremi in parti uguali
o diseguali. Gli elementi del campione facenti parte di una classe di estremi xi ed xi+1 (xi < xi+1)
sono quelli per cui il loro valore x compreso tra gli estremi della classe che viene considerata
chiusa a destra:
xi < x
xi+1
Il numero di elementi di un campione fAi contenuti in una classe denominato frequenza assoluta di
classe. Si definisce frequenza relativa fRi il rapporto fra la frequenza assoluta di classe e la
dimensione del campione: fRi = fAi/N. La frequenza relativa di classe indica la percentuale di
elementi del campione compresi in quella classe, ovvero la frequenza con cui si presenta un
qualsiasi elemento contenuto in quella classe. Si introduce il rapporto gi = fAi/(N (xi+1 xi)),
denominato densit di frequenza relativa che rapporta la frequenza relativa fAi/N all ampiezza della
classe (xi+1 xi). La rappresentazione grafica della densit di frequenza relativa l istogramma di
frequenza relativa costituito da un insieme di rettangoli aventi per base l ampiezza di classe xi+1
xi e per altezza la densit di frequenza relativa gi (fig. 1).
La densit di frequenza relativa indica come distribuita la frequenza relativa in funzione dei valori
del campione. Ad esempio se un campione composto di 9 elementi divisi in due classi la cui
ampiezza l una il doppio dell altra e con un corrispondente numero di elementi l uno il doppio
dell altro la densit di frequenza relativa uguale per ogni classe, ovvero il campione distribuito
uniformemente e qualsiasi elemento del campione si presenta con la stessa frequenza (fig. 2a).
x1 x2 x3 x4 x5 x6
Se invece il numero di elementi del campione in classi di ampiezza l una il doppio dell altra l
uno la met dell altro la distribuzione non uniforme la densit di frequenza con cui si
presentano gli elementi appartenenti alla classe di ampiezza maggiore di quella con cui si
presentano gli elementi appartenenti alla classe di ampiezza minore (fig. 2b). L istogramma di
frequenza relativa permette di visualizzare la distribuzione di frequenza relativa per tutti i valori
degli elementi del campione. La somma delle aree delle barre costituenti l istogramma 1 perch
rappresenta la frequenza con cui si presenta l insieme di tutti gli elementi del campione.
a)
0.3
b)
0.3
0.2
0.2
0.1
1
0.1
6
5
6
3
Fig. 2. Istogrammi di frequenza relativa con 6 elementi nella prima classe e 3 elementi nella
seconda (a) e con 3 elementi nella prima classe e 6 elementi nella seconda (b).
Si definisce frequenza cumulata di non superamento Fa il numero di elementi del campione che
hanno un valore minore od uguale ad uno prefissato: x
prefissati gli estremi superiori di ogni classe la frequenza cumulata di non superamento coincide
con la somma progressiva delle frequenze assolute di classe fai:
Fa (x
xi+1) =
j=1
f aj
(2)
Nel caso si scelgano come valori prefissati gli elementi stessi del campione la frequenza cumulata
di non superamento il numero di ordine in senso crescente dell elemento:
Fa (x
x i) = i
(3)
con
1
Fa
xi ) =
1/N
i
N
(4)
con
1
Tr (x = x i ) =
1
F(x
xi )
1
1 - F(x < x i )
(6)
campione xN una frequenza cumulata relativa di non superamento pari ad uno, ovvero, tutti i valori
del campione sono minori od uguali di xN, il che esteso alla popolazione da cui il campione
estratto significa che tutti gli elementi della popolazione devono essere minori od uguali di xN che
pu non essere vero. Per ovviare a questo inconveniente la frequenza cumulata di non superamento
viene stimata mediante la formula di plotting position di Weibull:
F(x
xi ) =
i
N +1
(5)
per cui al valore massimo del campione viene associata una frequenza cumulata relativa di non
superamento leggermente inferiore ad uno (N/(N+1)).
Nella tabella I, in prima colonna, sono presentate le precipitazioni massime annuali corrispondenti
alla durata 1h misurate dalla stazione pluviometrica di San Martino di Castrozza (TN) negli anni
1952-1990 che vengono ordinate in senso crescente in seconda colonna. In terza colonna sono poste
le corrispondenti frequenze cumulate relative di non superamento ed in quarta colonna il
corrispondente tempo di ritorno relativo alla finestra di osservazione di 32 anni, uno in pi della
reale finestra di osservazione per tener conto dell utilizzo della formula di plotting position:
Tr =
1
i
1
N +1
N +1
N +1- i
(7)
Tabella 1. Precipitazione massime annuali (x) di durata 1 ora registrati dalla stazione pluviometrica
di San Martino di Castrozza (Tn) e le corrispondenti funzioni di frequenza ed il tempo di ritorno
associato.
Anno
1952
1953
1954
1955
1956
1957
1958
1959
1960
1962
1963
x (mm)
25.8
15.4
12.2
19.8
10.6
8.8
-
i
1
2
3
4
5
6
7
8
9
10
11
xi (mm)
7.2
7.8
8.0
8.8
9.2
10.2
10.6
11.0
11.4
11.8
12.2
F(x xi)
0.031
0.063
0.094
0.125
0.156
0.188
0.219
0.25
0.281
0.313
0.344
Tr
1.03
1.07
1.1
1.14
1.19
1.23
1.28
1.33
1.39
1.45
1.52
13.2
11.4
11.0
15.6
16.0
7.2
15.0
9.2
12.8
29.4
7.8
15.0
26.2
13.6
19.8
16.0
10.2
11.8
18.0
13.4
8.0
16.0
16.8
13.6
18.8
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
12.8
13.2
13.4
13.6
13.6
15.0
15.0
15.4
15.6
16.0
16.0
16.0
16.8
18.0
18.8
19.8
19.8
25.8
26.2
29.4
0.375
0.406
0.438
0.469
0.5
0.531
0.563
0.594
0.625
0.656
0.688
0.719
0.75
0.781
0.813
0.844
0.875
0.906
0.938
0.969
1.6
1.68
1.78
1.88
2.0
2.13
2.29
2.46
2.67
2.91
3.2
3.56
4.0
4.58
5.33
6.4
8.0
10.67
16.0
32.0
Gli anni in cui non si hanno dati (ad esempio il 1953) non sono considerati e nel caso che in anni
differenti sia registrato lo stesso valore di precipitazione, questi, viene considerato per ogni anno in
cui compare come un valore a se stante e quindi nella tabella nella colonna xj si possono avere
valori uguali e consecutivi ma caratterizzati da una frequenza diversa proprio perch considerati
indipendenti l uno dall altro.
Nelle figure 3 e 4 sono illustrati l istogramma di frequenza relativa e la spezzata di cumulata
relativa di non superamento del campione in tabella I.
g
0.1
0.05
0
0
10
15
20
25
30
0.8
0.6
0.4
0.2
0
0
10
15
20
25
30
Figura 4. Spezzata di frequenza cumulata relativadi non superamento per il campione in tabella 1.
valore x della variabile casuale minore od uguale del prefissato X. La probabilit cumulata di
superamento P(x
X) + P(x > X) = 1
Tr =
1
P(x
X)
1
1 - P(x < X)
(8)
g
0.1
0.05
0
5
10
15
20
25
30
35
L area sottesa dalla curva densit di probabilit vale 1 perch rappresenta la frequenza con cui si
presenta un qualsiasi possibile valore x della variabile casuale che un evento certo:
p(x) dx = 1
(9)
p(x)
0.4
0.3
0.2
0.1
10
15
20 X1 25 X2 30
35
40 x
Figura 6. Curva densit di probabilit (distribuzione doppio esponenziale) con area sottesa per x1
x x2.
X) (fig. 7).
Il valore della probabilit cumulata di non superamento sempre minore od uguale ad 1, come
spiegato nel paragrafo precedente. L area sottesa dalla curva densit di probabilit compresa tra il
valore minimo che pu assumere la nostra variabile casuale ed il valore X (fig. 8) la probabilit
cumulata di non superamento:
P(x
X) =
(10)
p(x) dx
0
p(x)
0.4
0.3
0.2
0.1
0
0
10
15
20
25
30
35
40
P(x X)
1
0.8
0.6
0.4
0.2
0
0
10
15
20
25
30
35
40
dP(x X)
dx
p(x) =
(11)
Se la variabile casuale x funzione della variabile casuale y, y = f(x), per cui Y = f(X) vale:
P(x
X) = P(y
Y)
(12)
e quindi:
p(y) =
dP(y Y) dP(x X) dx
dx
=
= p(x)
dy
dx
dy
dy
p(y) dy = p(x) dx
(13)
(14)
5 Parametri
I parametri sono entit che descrivono quantitativamente alcune caratteristiche della distribuzione
dei valori di un campione o di una popolazione della variabile casuale generica x. I parametri si
dividono in parametri di tendenza centrale che quantificano i valori verso cui si accentrano i valori
del campione/popolazione e di dispersione che quantificano la dispersione dei valori del
campione/popolazione rispetto ai primi. Appartiene ai parametri di tendenza centrale il valor medio
(o media) dei valori del campione/popolazione.
Il valor medio dei valori di un campione di dimensione N estratto dalla popolazione della variabile
casuale x :
N
x=
i =1
xi
(15)
La densit di probabilit p(x) rappresenta la frequenza probabile con cui si presenta il generico
valore x rispetto a tutti gli altri valori della variabile casuale. Il prodotto x p(x) rappresenta quindi il
valore mediato del generico valore x rispetto a tutti gli altri valori della popolazione. Il valore
medio dei valori che costituiscono la popolazione della variabile casuale la somma di tutti i valori
mediati:
X = x p(x) dx
(16)
(17)
N
i =1
(x i
x) =
N
i =1
Nx =Nx
xi
non nulla perch vengono sommate quantit positive. La stessa propriet vale per la popolazione.
Si definisce deviazione standard per un campione di N valori estratto da una popolazione di una
variabile casuale la seguente:
N
i =1
sX =
(x i
x) 2
(18)
Per la popolazione, il quadrato dello uno scarto viene mediato sulla popolazione tramite la densit
di probabilit, e la deviazione standard assume la seguente espressione:
(x - X ) 2 p(x) dx
(19)
Si definisce varianza il quadrato della deviazione standard. Per il campione la varianza la media
del quadrato degli scarti:
N
sX2 =
i =1
(x i
N
x) 2
(20)
Per la popolazione la varianza il valore del quadrato dello scarto rispetto al valor medio mediato
sull intera popolazione:
2
X
= (x - X ) 2 p(x) dx
(21)
Definito il valore atteso, il valore medio di una qualunque serie di valori o quantit generiche, il
valor medio si suddivide la popolazione di una variabile casuale in campioni. Il valore atteso del
valor medio dei singoli campioni estratti dalla popolazione risulta uguale al valor medio della
popolazione:
E( x ) = X
Il valore atteso della varianza dei singoli campioni non per uguale alla varianza della
popolazione:
2
X
E(sX2)
per cui la deviazione standard, per il campione, viene corretta, mediando il quadrato degli scarti su
N-1 valori, invece che con N valori:
N
sXC =
i =1
x) 2
(x i
(22)
N -1
sXC2 =
i =1
x) 2
(x i
N -1
(23)
per cui
E(sXC2) =
2
X
Campione
Popolazione
Frequenza relativa
X)
P(x
cumulata
di
non
superamento
X)
gi (xi+1 xi) = 1
p(x) dx = 1
0
Valor medio
x=
i =1
xi
Valor medio
N
N
Deviazione standard
sXC =
i =1
(x i
x) 2
sXC2 =
Deviazione standard
(x - X ) 2 p(x) dx
=
0
N -1
N
Varianza
X = x p(x) dx
i =1
(x i
x) 2
Varianza
2
X
= (x - X ) 2 p(x) dx
0
N -1
p(x)
g
0.1
0.1
0.05
0.05
10 15
20 25 30 x
10 15
20 25 30 35 40 x
10 15
x2
20 25 30 35 40 x
P(x X)
1
1
0.8
0.6
0.4
0.2
0
10 15
0.8
0.6
0.4
0.2
0
x1 x2
20 25 30 x
6 Distribuzioni di probabilit
Le espressioni della densit di probabilit p(x) e della probabilit cumulata di non superamento P(X
x) sono anche indicate con il termine distribuzioni di probabilit perch rappresentano la
distribuzione delle funzioni di frequenza per tutti i valori della popolazione della variabile casuale.
Le distribuzioni di probabilit sono, in genere, funzioni della variabile casuale x e dei parametri
valor medio e varianza o funzioni di questi parametri.
essendo
X) = e e
(24)
ridotta y:
y=
x u
(25)
P(y
(26)
y
dP(y Y)
= e- y e e
dy
p(y) =
(27)
Il valore medio della popolazione della variabile casuale y che segue la distribuzione di probabilit
secondo la relazione (27) :
y =
y
ye y e e dy = 0.5772
(28)
2
Y
=
-
y =
2
Y
x - u x
-
(y - Y ) p(y) dy =
2
=
-
(29)
si ha (equazione 17):
(30)
p(x) dx =
p(x) dx =
2
x
2
(31)
2
x
(32)
u = x
0.5772
2
x
(33)
Le equazioni (32) e (33) esprimono i parametri della distribuzione doppio esponenziale in funzione
del valor medio e della varianza della popolazione che segue quella distribuzione.
Si introduce una propriet della distribuzione doppio esponenziale tramite l utilizzo del legame tra
tempo di ritorno Tr e probabilit cumulata di non superamento. Tramite l eq. (26) si ottiene:
ln (P( y
Y)) = - e
ln( ln(P(y
Y) )) = y
y = ln( ln(P(y
Y) ))
(34)
1 - P(y
P(y
Y) = 1 -
1
Tr
1 Tr - 1
=
Tr
Tr
(35)
y = ln ln
Tr
Tr - 1
(36)
sostituendo nella relazione (36) l espressione che la lega la variabile casuale y alla variabile casuale
x si ottiene:
x-u
= ln ln
Tr
Tr - 1
x=
ln ln
Tr
Tr - 1
e quindi
+u
(37)
Noto il valore del tempo di ritorno Tr, il corrispondente valore della variabile casuale x viene
calcolato tramite l eq. (37), mentre, noto il valore della variabile casuale x, il corrispondente valore
del tempo di ritorno si ottiene tramite l eq. (8) dopo aver calcolato il valore della variabile ridotta
X) = P(y
Y) tramite
Y).
8 Distribuzione lognormale
La distribuzione di probabilit lognormale la distribuzione di una variabile casuale continua x tale
che la variabile casuale y = ln x segue la distribuzione di probabilit normale di Gauss:
p(y) =
1 y y
2
y
(38)
p(x) =
1
2
yx
1 ln x y
2
y
(39)
z=
y y
(40)
y
per cui:
dy
= p(y)
p(z) = p(y)
dz
x = x p(x) dx =
0
x p(y) dy =
e y p(y) dy =
z2
2
z y +y
p(z) dz
(41)
x =
- 0.5 z 2 + z
+y
dz = e
x = e
y +
y +
2
y /2
(42)
2
y /2
(43)
da cui:
2
y
2
y = ln x
2
X
(x
= (x - x ) 2 p(x) dx =
-
- 2 x x + 2x p(x) dx =
(44)
x 2 p(x) dx - 2 x x p(x) dx + 2x
0
p(x) dx
0
e 2y p(y) dy - 2 2x + 2x
-
e quindi la variabile z:
2
X
2 z y + y
p(z) dz -
2x
2 - 0.5 z 2 + z y + y
dz - 2x
sostituendo la 40 e la 41 si ottiene:
2 y +
2
y
2 =e
x
2 y +
e
2
y
=e
(2
2
y
)e
2
y
1 = 2x e
2
y
da cui:
e
2
y
I parametri y e
2
y
= ln
2
= x +1
2x
2
x
2
x
+1
(45)
Si introduce una propriet della distribuzione lognormale. La variabile ridotta z segue la legge di
P(z
I valori di P(z
z2
2 dz
(46)
Z) =
Conoscendo i parametri della distribuzione tramite la (40) ed essendo y = ln x dal valore z si ottiene
il corrispondente valore della variabile casuale x e viceversa.
9 Carta probabilistica
La carta probabilistica un diagramma con in ascissa il valore della variabile casuale ed in ordinata
il corrispondente valore della probabilit cumulata di non superamento. Poich quest ultima
legata al tempo di ritorno Tr (eq. (8)) presente un secondo asse delle ordinate con il tempo di
ritorno.
Il procedimento di associare ad un qualunque valore della variabile casuale x, il corrispondente
della probabilit cumulata di non superamento si realizza tramite la variabile ridotta che diventa il
terzo asse delle ordinate della carta probabilistica.
Per la distribuzione doppio esponenziale la relazione tra variabile casuale x e variabile ridotta y
(eq. 25):
y=
x u
mentre quello tra la variabile ridotta y e la probabilit cumulata di non superamento (eq. (34)) :
y = ln( ln(P(y
Y) ))
Poich la variabile y funzione della probabilit cumulata di non superamento, la retta y = (x u)/
individua la popolazione dei valori della variabile casuale x che segue la distribuzione doppio
esponenziale di parametri u ed
Figura 10. Rappresentazione di una popolazione di valori tramite una retta nella carta probabilistica
della distribuzione doppio esponenziale.
z=
y y
y
Poich la variabile ridotta z segue la distribuzione normale di Gauss possibile stabilire noto un
valore z della stessa il corrispondente valore della probabilit cumulata di non superamento P(z
Z)
tramite la tabella 3.
La retta z = (y y)/
Z).
Figura 12. Rappresentazione di una popolazione di valori tramite una retta nella carta probabilistica
della distribuzione lognormale
I valori in tabella 3 esprimono la probabilit secondo la distribuzione normale di Gauss che si abbia
0
Z. Nel caso Z = 0.71, questa probabilit 0.2612 (area tratteggiata in figura 14). La
distribuzione di densit di probabilit normale di Gauss simmetrica rispetto all origine. Per
calcolare la probabilit cumulata di non superamento, per il caso di Z positivo al valore in tabella
deve essere aggiunto la quantit 0.5 pari a all area sottostante la curva densit di probabilit per i
valori negativi di Z (fig. 14). Per esempio la probabilit cumulata di non superamento per Z = 0.71
P(0.71) = 0.5 + 0.2612 = 0.7612. Nel caso di valori negativi di z la probabilit cumulata di non
superamento il complementare a 0.5 del valore in tabella 3 (fig. 14). Per esempio la probabilit
cumulata di non superamento per Z = -0.71 P(-0.71) = 0.5 - 0.2612 = -0.2388
0.0
0.0
0.004
0.008
0.012
0.016
Z.
9
0.1
0.0399 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0754
0.2
0.3
0.1179 0.l217
0.4
0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5
0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6
0.2253 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2518 0.2549
0.7
0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8
0.2881 0.2910 0.2939 0.2967 0.2996 0.3023 0.3051 0.3078 0.3106 0.3133
0.9
1.0
0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3534 0.3577 0.3599 0.3621
1.1
0.3463 0.3665 0.3686 0.3708 0.33729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2
0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3
0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4
0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5
0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6
0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
0.091
0.334
0.148
0.1517
0.3365 0.3389
0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8
0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9
2.0
0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1
0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2
0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3
0.4893 0.4896 0.4998 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4
0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5
0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6
0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7
0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8
0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9
0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4986 0.4986 0.4986
3.0
3.1
0.499
3.2
0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3
0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4
0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5
0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6
0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.7
0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8
0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9
0.5
0.475
0.499
0.499
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
= sXC2
ed u alla media ed
6 s 2XC
u = x 0.5772
(47)
6 s 2XC
(48)
Le espressioni (47) e (48), sostituite nell eq. (25), permettono di individuare la retta di miglior
allineamento secondo il presente criterio:
y=
x u
x x + 0.5772
6 s 2XC
6 s 2XC
(49)
Sulla carta probabilistica si riportano i valori del campione e la retta secondo l eq. (49). Il disegno
della retta permette una stima visiva e soggettiva per la verifica del miglior all allineamento dei
punti del campione.
Tramite la retta possibile determinare un valore della variabile casuale x per un assegnato tempo
di ritorno Tr e viceversa (fig. 15). L utilizzo della retta esemplifica le operazioni analitiche per
determinare le coppie di valori (x,Tr), l uno in funzione dell altro, tramite l eq. (37) o tramite le
eq. (25), (26) e (35).
In tabella 4 si riportano i valori del campione in tabella 1 insieme al quadrato dello scarto (xi - x )
corrispondente ad ogni valore.
Figura 15. Utilizzo della retta che rappresenta la popolazione per determinare il valore della
variabile x corrispondente ad un fissato tempo di ritorno Tr.
Tabella 4. Valori del campione ed i corrispondenti quadrati degli scarti dal valor medio.
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xi (mm)
7.2
7.8
8.0
8.8
9.2
10.2
10.6
11.0
11.4
11.8
12.2
12.8
13.2
13.4
13.6
(xi- x )2
57.5640
48.8195
46.0647
35.8453
31.2157
21.0415
17.5318
14.3421
11.4724
8.9227
6.6931
3.9486
2.5189
1.9240
1.4092
13.6
15.0
15.0
15.4
15.6
16.0
16.0
16.0
16.8
18.0
18.8
19.8
19.8
25.8
26.2
29.4
1.4092
0.0453
0.0453
0.3757
0.6608
1.4711
1.4711
1.4711
4.0518
10.3227
16.1034
25.1292
25.1292
121.2840
130.2544
213.5369
La somma dei valori del campione e del quadrato degli scarti sono 458.4 e 862.07. Il valor medio, la
deviazione standard e la varianza corrette sono:
x = 458.4/31 = 14.79 mm
sXC2 = 862.07/30 = 28.73
sXC = 28.731/2 = 5.36
I parametri
6 x 28.73
u = 14.79 0.5772 x
Sostituendo i valori di u ed
= 4.18
6 x 28.73
= 12.38
carta probabilistica:
y = 0.239 x 2.96
La retta viene disegnata in figura 16 congiungendo due coppie di valori determinate tramite l
equazione di cui sopra: (10,-0.57) e (20,1.81) insieme ai valori del campione rappresentati dai punti
di coordinate (xi, Fi) secondo la tabella 1 (le frequenze cumulate di non superamento sono
considerate come probabilit cumulate di non superamento).
Figura 16. Adattamento della distribuzione doppio esponenziale al campione: metodo dei momenti.
Per la distribuzione lognormale l utilizzo del metodo dei momenti permette la stima dei parametri
Y e
attribuendo alla popolazione il valor medio e la varianza del campione e le eq. (45) e (44)
diventano:
2
y
= ln
y = ln x 0.5 ln
s 2XC
x2
s 2XC
x2
+1
(50)
+1
(51)
Le espressioni (50) e (51), sostituite nell eq. (40), permettono di individuare la retta di miglior
allineamento secondo il presente criterio:
z=
y Y
Y
ln x ln x + 0.5 ln
=
ln
s 2XC
2
x
s 2XC
x2
+1
+1
(52)
2
y
= ln
28.73
+ 1 = 0.122
14.79 2
Y
= 0.349
y = ln 14.79 0.5 x ln
28.73
14.79 2
+ 1 = 2.633
z = 2.865 ln x 7.544
La retta viene disegnata in figura 17 congiungendo due coppie di valori determinate tramite l
equazione di cui sopra: (10,-0.947) e (20,1.039) insieme ai valori del campione secondo la tabella 1.
Figura 17. Adattamento della distribuzione lognormale al campione: metodo dei momenti.
N
i =1
(x i
x i ) 2 =
N
i =1
(x i
(Ay i + B)) 2
I valori di A e B che rendono minimo D sono quelli per cui le derivate di D rispetto ad A ed B si
annullano:
D
=0
A
D
=0
B
A=
s XY
s 2Y
B=x Ay
(53)
(54)
s XY =
i =1
(x i
x)(y i
y)
(55)
Nel caso si fosse minimizzata la somma degli scarti orizzontali, ovvero gli scarti della variabile y, le
relazioni (53) e (54) valgono ancora sostituendo a denominatore della (53) sX2 con sY2.
Il calcolo della covarianza sXY pu essere semplificato utilizzando i valori medi di x ed y:
N
s XY =
i =1
(x i
x)(y i
y)
=
i =1
s XY =
x i yi
N
i =1
xi
x i y - xy i + xy)
N
N
i =1
(x i y i
i =1
i =1
x i yi
y
i =1
xi
i =1
yi
+ xy
yi
+ xy =
i =1
x i yi
xy xy + xy
s XY =
i =1
x i yi
N
(56)
xy
Per la distribuzione doppio esponenziale valgono le eq. (34) e (36) per cui:
y = ln( ln(P(y
Y) )) = ln ln
Tr
Tr - 1
Si approssima la probabilit cumulata di non superamento dei valori del campione con la frequenza
di probabilit cumulata di non superamento stimata mediante la formula di plotting position di
Weibull (eq. 5). Per il campione estratto da una popolazione che segue la distribuzione doppio
esponenziale vale:
y = ln( ln(F(y
Y) )) = ln ln
Tr
Tr - 1
(57)
5) F(yi) = i/(N+1) il valor medio y , la deviazione standard sY e la varianza sY2 della variabile ridotta
y dipendono dalla dimensione del campione e sono tabulati nelle tabelle 5a,b. In questo caso per la
Tabella 5. Valori medi e deviazione standard della variabile ridotta in funzione della dimensione del
campione
Valore medio della variabile ridotta y
20
0
1
2
3
4
5
6
7
8
9
0.5236 0.5252 0.5268 0.5283 0.5296 0.5309 0.5320 0.5332 0.5343 0.5353
30
0.5362 0.5371 0.5380 0.5388 0.5396 0.5402 0.5410 0.5418 0.5424 0.5430
40
0.5436 0.5442 0.5448 0.5453 0.5458 0.5463 0.5408 0.5473 0.5477 0.5481
50
0.5485 0.5489 0.5493 0.5497 0.5501 0.5504 0.5508 0.5511 0.5515 0.5518
60
0.5521 0.5524 0.5527 0.5530 0.5533 0.5535 0.5538 0.5540 0.5543 0.5545
70
0.5548 0.5550 0.5552 0.5555 0.5557 0.5559 0.5561 0.5563 0.5565 0.5567
80
0.5569 0.5570 0.5572 0.5574 0.5576 0.5578 0.5580 0.5581 0.5583 0.5585
90
0.5586 0.5587 0.5589 0.5591 0.5592 0.5593 0.5595 0.5596 0.5598 0.5599
Deviazione standard della variabile ridotta sY
20
0
1
2
3
4
5
6
7
8
9
1.0628 1.0696 1.0754 1.0811 1.0864 1.0915 1.0961 1.1004 1.1047 1.1086
30
1.1124 1.1159 1.1193 1.1226 1.1255 1.1285 1.1313 1.1339 1.1363 1.1388
40
1.1413 1.1436 1.1458 1.1480 1.1499 1.1519 1.1538 1.1557 1.1574 1.1590
50
1.1607 1.1623 1.1638 1.1658 1.1667 1.1681 1.1696 1.1708 1.1721 1.1734
60
1.1747 1.1759 1.1770 1.1782 1.1793 1.1803 1.1814 1.1824 1.1834 1.1844
70
1.1854 1.1863 1.1873 1.1881 1.1890 1.1898 1.1906 1.1915 1.1923 1.1930
80
1.1938 1.1945 1.1953 1.1959 1.1967 1.1973 1.1980 1.1987 1.1994 1.2001
90
1.2007 1.2013 1.2020 1.2026 1.2032 1.2038 1.2044 1.2049 1.2055 1.2060
rappresenta le decine e la prima riga le unit: per esempio: N=42, ym=0.5448, Sy=1.1458)
y=
(58)
Confrontando le eq. (25) e (58) e tenendo conto delle (53) e (54) si ha:
=A=
u=B= x
Sostituendo i valori di u ed
s XY
s 2Y
s XY
s 2Y
(59)
(60)
y=
x-u
s 2Y
=
(x - x) + y
s XY
(61)
xi (mm)
7.2
7.8
8.0
8.8
9.2
10.2
10.6
11.0
11.4
11.8
12.2
12.8
13.2
13.4
13.6
13.6
15.0
15.0
15.4
15.6
16.0
16.0
16.0
16.8
18.0
18.8
19.8
19.8
25.8
26.2
29.4
Fi
0.0313
0.0625
0.0938
0.1250
0.1563
0.1875
0.2188
0.2500
0.2813
0.3125
0.3438
0.3750
0.4063
0.4375
0.4688
0.5000
0.5313
0.5625
0.5938
0.6250
0.6563
0.6875
0.7188
0.7500
0.7813
0.8125
0.8438
0.8750
0.9063
0.9375
0.96880
yi
-1.2429
-1.0198
-0.8617
-0.7321
-0.6186
-0.5152
-0.4186
-0.3266
-0.2378
-0.1511
-0.0656
0.0194
0.1045
0.1903
0.2775
0.3665
0.4580
0.5528
0.6514
0.7550
0.8646
0.9816
1.1079
1.2459
1.3989
1.5720
1.7726
2.0134
2.3183
2.7405
3.4499
xi yi
-8.9491
-7.9543
-6.8934
-6.4425
-5.6910
-5.2551
-4.4371
-3.5930
-2.7114
-1.7834
-0.8008
0.2478
1.3792
2.5505
3.7738
4.9846
6.8706
8.2913
10.0321
11.7782
13.8338
15.7064
17.7269
20.9311
25.1808
29.5527
35.0965
39.8657
59.8123
71.8009
101.4272
A=
y = 0.213 x 2.61
La retta viene disegnata in figura 19 congiungendo due coppie di valori determinate tramite l
equazione di cui sopra: (10,-0.48) e (20,1.65) insieme ai valori del campione secondo la tabella 1 ed
alla retta ottenuta con il metodo dei momenti.
La retta ottenuta col metodo dei momenti permette un miglior allineamento rispetto alla retta
ottenuta col metodo dei minimi quadrati. La retta ai minimi quadrati, essendo un interpolazione nel
piano (x,y), risente della dispersione dei punti sul cartogramma probabilistico, ovvero risente dell
approssimazione della probabilit cumulata di non superamento dei valori del campione con la
frequenza cumulata di non superamento determinata con la formula di plotting position, mentre la
retta ottenuta con il metodo dei momenti dipendendo dalla deviazione standard e dalla media dei
valori del campione non ne risente.
Per la distribuzione lognormale non possibile utilizzare in modo diretto il metodo dei minimi
quadrati perch i valori della variabile ridotta z non sono noti a priori, ovvero non esiste una
relazione analitica, come per la distribuzione doppio esponenziale, che esprima la variabile ridotta z
in funzione della probabilit cumulata di non superamento o del tempo di ritorno. Per poter
Figura 19. Adattamento della distribuzione doppio esponenziale al campione: metodo dei minimi
quadrati.
13 Metodo di Gumbel
Il metodo di Gumbel per la ricerca della retta di miglior allineamento dei valori del campione nella
carta probabilistica un metodo di interpolazione analogo al metodo ai minimi quadrati. La retta di
interpolazione viene determinata minimizzando invece che gli scarti la distanza delle coppie di
valori (yi,xi) del campione dalla retta stessa (fig. 20). In questo caso i coefficienti A ed B della retta
di interpolazione x = Ay + B diventano:
A=
sX
sY
B=x Ay
(62)
(63)
Figura 20. Interpolazione lineare ai minimi quadrati tramite la distanza dalla retta.
Le relazioni (eq. 59 e 60) che esprimono i parametri della distribuzione
ed u in funzione di A e B
rimangono valide sostituendo sXY con sX ed sY2 con sY e l espressione della retta di interpolazione
per cui si ha il miglior allineamento dei punti, secondo il presente criterio :
y=
x-u
sY
(x - x) + y
sX
(64)
L espressione della retta uguale a quella ottenuta tramite il metodo dei momenti (eq. 49) se y =
0.5772, sY = / 6 ed sX = sXC.
La procedura di adattamento della distribuzione doppio esponenziale al campione in tabella 1 viene
eseguita utilizzando i risultati ottenuti nei paragrafi precedenti. La somma del quadrato degli scarti
862.07 e la standard non corretta :
862.07
= 5.27
31
sX =
sY = 1.1124
Sostituendo i valori A ed B nell espressione (58) si ottiene la retta che individua la popolazione
sulla carta probabilistica:
y = 0.240 x 3.02
In figura 21 disegnata la retta corrispondente al metodo di Gumbel insieme alle rette ottenute con
il metodo dei momenti e dei minimi quadrati oltre ai valori del campione.
Figura 21. Adattamento della distribuzione doppio esponenziale al campione: metodo di Gumbel.
La retta ottenuta con il metodo di Gumbel permette un miglior allineamento dei punti del campione
rispetto a quella ottenuta con i minimi quadrati perch la distanza tra punto e retta presenta una
minor dispersione rispetto allo scarto sia verticale che orizzontale, ma uno peggiore rispetto alla
retta ottenuta con il metodo dei momenti perch, quest ultima non risente dell approssimazione
Figura 22. Divisione in intervalli equi-probabili della distribuzione doppio esponenziale (p* = 0.2).
Si confronta quindi per ogni classe il numero di elementi del campione che ricade nella classe con
N p* (N/k), numero che rappresenta il numero di elementi del campione che cadrebbe in una classe
equi-probabile se la distribuzione di probabilit si adattasse perfettamente al campione: punti
allineati ed appartenenti alla retta che rappresenta la popolazione nella carta probabilistica.
(N i - Np *)2
(65)
Np *
misura la dispersione dei valori del campione rispetto alle classi equi-probabili. Il
valore del
crit.
Affinch la
Il valore di
crit
crit
dipende dal
parametro:
= k - s 1
(66)
essendo k il numero delle classi ed s il numero di parametri della distribuzione di probabilit che si
vuole adattare al campione. Nel caso delle distribuzione di probabilit doppio esponenziale e lognormale s = 2 (i parametri sono u ed
crit
per la
per diversi .
N p*
(67)
(68)
k = (1/0.2)
1 per definizione).
2
Tabella 7 Valori di
crit
crit
in funzione di
3.84
5.99
7.81
9.49
11.1
Nella tabella 1I sono riportate in ordine crescente i valori di pioggia massimi annuali per una durata
di 1 h registrati dal pluviometro della stazione di San Martino di Castrozza. L elaborazione
statistico probabilistica di questo campione di N = 31 elementi ha prodotto il seguente adattamento
della distribuzione doppio esponenziale mediante il metodo dei momenti:
y = 0.239 x + 2.96
(69)
5/31 = 0.161. Si sceglie p* = 0.2 che permette k = 1/0.2 = 5. Gli estremi degli
Y) ))
I valori di y calcolati (fig. 22) ed i corrispondenti valori di x, estremi dell intervallo, calcolati
secondo la (69) sono riportati nella tabella 8.
P(y)
0.2
-0.4759
10.39
0.4
0.0874
12.75
0.6
0.6717
15.19
0.8
1.4999
18.65
Nella tabella 9 vengono riportati per ogni classe, gli estremi, il numero di elementi del campione
contenuto nella classe Ni e la quantit (Ni N p*)2.
Classe
Estremi
Ni (Ni N p*)2
- 10.39
0.04
0.04
10.39 12.75
1.44
1.48
12.75 15.19
0.64
2.12
15.19 18.65
0.64
2.76
18.65 -
0.04
2.8
Essendo
crit
(Ni N p*)2