realizzato da:
Belviso Prospero
Bochicchio Antonello
Colucci Vincenzo
Petraglia Benito
Il nostro lavoro si è concentrato principalmente sul problema dell’inferenza
statistica.
Alcune definizioni:
Popolazione di una variabile casuale: insieme dei valori che la variabile può
assumere.
Frequenza: rapporto tra il numero dei casi favorevoli e il numero totale dei
casi possibili riferiti al campione.
dP(x)=p(x)dx
• Distribuzioni normale
• Distribuzioni log-normale
• Distribuzioni di Gumbel
• Distribuzioni TCEV
Distribuzione normale
Esistono due tipi di distribuzione di probabilità per valori estremi studiati nel
corso di idrologia:
INFERENZA STATISTICA
• CARTE PROBABILISTICHE
• COEFFICIENTE DI CORRELAZIONE
• CURVA DI REGRESSIONE
Tempo di ritorno
Noi abbiamo preso in esame una stazione idrometrica situata lungo il corso
del fiumi Agri, precisamente, nel comune di Grumento Nova (Pz) . Ci siamo
posti il problema dell’ iterazione e quindi studiando alcuni dati relativi a
medie annue dovevamo estrapolare la nostra curva di probabilità.
In questo caso la popolazione costituisce tutti i possibile valori che la nostra
variabile ( portata media annua) può assumere. Dalla popolazione abbiamo
estratto un sottoinsieme costituito da un’entità discreta di elementi (nel
nostro caso il campione ha una dimensione pari a 17).
In maniera particolare, il nostro campione è costituito dalle portate medie
annue relative agli anni 1961-1977.
Questi nostri dati costituiscono delle variabile continui allora non ha senso
parlare di frequenza (poiché è riferita al campione) dato che ogni valore
assumerà la frequenza pari ad , allora per variabili continue si parla di
frequenza di non superamento.
Per frequenza di non superamento si intende il numero di elementi inferiori
ad un certo valore soglia rapportata con la dimensione del campione (N).
Per ottenere la nostra frequenza di non superamento il primo passo è quello
di disporre gli elementi del nostro campione in ordine crescente e assegnare
ad ogni elemento del ordine la sua relativa posizione.
La frequenza di non superamento è quindi calcolata con la seguente
formula: dove i indica la posizione i-esima nell’ordine crescente; quindi se
vogliamo calcolare la frequenza del valore in posizione 10 , la nostra
frequenza di non superamento sarà pari a:1.
Facendo così ci siamo calcolati la frequenza di non superamento di tutti i
valore del nostro campione ed abbiamo riportato su grafito i risultati
ottenuti. Così facendo abbiamo riscontrato un errore poiché per il valore in
pozione 17 la nostra frequenza di non superamento risulta pari ad 1. Dai
teoremi della statica assumere frequenza pari ad una significa avere una
frequenza certa; ma ciò ci induce ad un errore.Una volta determinata la
frequenza di non superamento che meglio si adatta al nostro caso di studio
si pone il problema di passare dal campione alla popolazione. A tale scopo si
seguono le 4 fasi dell’inferenza statistica partendo dall’ipotesi di lavoro che
prevede la scelta di una distribuzione di probabilità che meglio possa
rappresentare la variabile studiata. Nel caso applicativo è stata scelta la
distribuzione di probabilità normale. Fatto ciò la seconda fase dell’inferenza
prevede il calcolo dei parametri che caratterizzano la distribuzione di
probabilità ovvero media, varianza e scarto quadratico medio. Questi
possono essere calcolati per il campione e successivamente possono essere
rapportati alla popolazione come valori presunti tramite opportuni fattori
correttivi:
Media 1
Varianza