Sei sulla pagina 1di 9

Criterio di valutazione quantitativo

Nota metodologica

La definizione di rischio si basa sulla relazione matematica

= [1]

dove, con P si indica la probabilit di accadimento di un evento e con G la gravit, ovvero, lentit del danno
associato ad un evento.

La relazione su esposta si presta, da un punto di vista probabilistico, ad essere associata al concetto di


variabile casuale ( o variabile aleatoria v.a.) intesa come il risultato numerico di un esperimento quando
questo non prevedibile con certezza (ossia non deterministico).

Ad una variabile casuale X si associa la sua distribuzione, o legge di probabilit che assegna ad ogni
sottoinsieme dellinsieme dei possibili valori di X (eventi ) la probabilit che la variabile X assuma valore in
esso. Le variabili casuali si dividono principalmente in due grandi classi:

discrete, se linsieme dei possibili valori (o supporto di X) finito o numerabile


continue, se linsieme dei possibili valori linsieme dei numeri reali

Per caratterizzare una variabile casuale X, dobbiamo specificarne la sua distribuzione, o legge di probabilit
che pu essere, in base al tipo di variabile casuale, di due tipi:

Funzione di probabilit () = ( = ) se la variabile aleatoria discreta


Funzione di densit di probabilit (), tale per cui ( ) = ()dx, se la variabile aleatoria
continua

Le due funzioni () e () dipenderanno da uno o pi parametri (, , , ). Fissati i valori dei parametri,


possibile calcolare la probabilit di eventi di interesse, ovvero, che la variabile X assume dei valori specifici.
Nelle applicazioni reali i parametri sono sempre ignoti, ma possono essere stimati attraverso una procedura
inferenziale di stima.

Cosa si intende per inferenza statistica? Si ipotizza che il comportamento della popolazione rispetto ad una
variabile casuale X viene descritto attraverso una funzione parametrica di probabilit (|) di cui non si
conosce . Non si conoscono i dati relativi alla popolazione, ma solo quelli relativi ad un campione
rappresentativo di n unit, ovvero, una realizzazione casuale di una popolazione incognita. Attraverso
suddetta realizzazione si cerca di stimare o di verificare la validit di alcune congetture su . Quindi linferenza
un processo attraverso il quale dal campione, si deducono informazioni sulla popolazione ed necessario
valutare la qualit e la veridicit di tali informazioni.

Nella gestione del rischio, si suppone che la variabile casuale X, sia associata al concetto di scenario a sua
volta colto dalla Gravit (G), definita come perdita economica a cui si esposti.


1 1
2 2


Da questo punto di vista, la identificazione della [1] diventa la stima del valore medio della variabile casuale
G, sulla base di una distribuzione di probabilit che, a sua volta, pu essere pensata come una
determinazione stocastica di un processo statistico casuale.

Nella gestione del rischio di una perdita economica pu essere interessante la stima del valore medio del
danno a cui si esposti.

In letteratura, esistono due tipologie di stime: quella puntuale e quella intervallare.

In questo ultimo caso si suppone che il valore atteso = del processo stocastico sia incognito.

Per definire si ricorre attraverso il concetto di intervallo di confidenza, occorre fissare un errore e
ipotizzare la distribuzione campionaria dello stimatore. Supponendo che questultimo sia di forma normale
e, ipotizzando un errore = 0,05, si arriva alla seguente formula

{ + }=1
2 2

Dove rappresenta il valore atteso della perdita economica G e rappresenta lo standard error della
2
distribuzione.

Nota metodologica per definire intervalli di confidenza.

Uno degli scopi principali dellanalisi dei dati consiste nelluso delle statistiche, come la media campionaria e
la proporzione campionaria per stimare i corrispondenti parametri delle rispettive popolazioni. Deve essere
chiaro che quando facciamo inferenza statistica siamo interessati a trarre conclusioni riguardanti una
popolazione e non un campione. Per esempio, per un esperto di sondaggi elettorali i risultati campionari sono
utili solo in quanto mezzo per stabilire la proporzione di voti che ricever per ciascun candidato dalla
popolazione degli elettori. Analogamente, un ispettore della finanza, nel selezionare un campione di fatture,
pu voler utilizzare la media campionaria ponderata per stimare leffettivo ammontare medio della
popolazione.

Nella pratica da una popolazione viene estratto a caso un solo campione, di ampiezza prestabilita. Gli
elementi da includere nel campione sono scelti mediante opportune tecniche di campionamento.

Come risalire al valore incognito della popolazione? Di fatto la decisione sul valore del parametro viene fatto
sulla base del solo campione estratto.

In via ipotetica, per usare le statistiche campionarie, con lo scopo di stimare i parametri della popolazione,
dovremmo analizzare tutti i campioni che possono essere estratti da questa.

Tuttavia, quando scegliamo come statistica campionaria la media aritmetica, si dimostra che questa gode di
buone propriet, grazie alle quali, possiamo fare a meno di estrarre tutti i possibili campioni.

Per chiarire sul perch la media aritmetica gode di buone propriet, facciamo il seguente esempio.
Consideriamo una popolazione costituita da N=4 dipendenti che presentano i seguenti valori

Dipendente Valore Frequenza


Anna 1 = 3 1 = 1
Alessandro 2 = 2 2 = 1
Riccardo 3 = 1 3 = 1
Luciana 4 = 4 4 = 1
La distribuzione di frequenza riportata di seguito

1,2

0,8

0,6

0,4

0,2

0
Anna Alessandro Riccardo Luciana

Senza perdere di generalit, supponiamo che i dati si riferiscano ad una popolazione molto grande, ovvero,
che la popolazione non sia nota. A partire da un campione occorre inferire, ovvero, risalire al vero parametro
della popolazione. Come procedere?

Supponendo di conoscere lintera popolazione, come in questo caso, il calcolo dei parametri agevole. Infatti
otteniamo che

=1 3 + 2 + 1 + 4
= = = 2,5
4

( )2
= =1 = 1,12

Ma se la popolazione fosse di numerosit troppo elevata, ovvero, la popolazione fosse rappresentata da una
infinit numerabile di unit, come si potrebbe procedere? In questo caso i dati osservati sarebbero
considerati come una determinazione causale di una variabile statistica non conosciuta. Come dire, se
stessimo osservando solo due unit, queste ultime potrebbero essere intese come uno dei possibili campioni
generati da una popolazione di 4 unit.

Verrebbe da chiedersi. Quanti possibili campioni di numerosit pari a n sarebbe possibile estrarre a partire
da una popolazione di N unit? La risposta semplice. Una volta fissato lo schema di campionamento, ad
esempio quello bernulliano o con reinserimento, la numerosit calcolata con la seguente formula

= 42 = 16.
In questo caso si avrebbero 16 possibili campioni. In pratica avremmo

Primo estratto
Secondo estratto Valore primo Valore secondo Media campionaria
1 Anna Anna 3 3 3
2 Anna Alessandro 3 2 2,5
3 Anna Riccardo 3 1 2
4 Anna Luciana 3 4 3,5
5 Alessandro Anna 2 3 2,5
6 Alessandro Alessandro 2 2 2
7 Alessandro Riccardo 2 1 1,5
8 Alessandro Luciana 2 4 3
9 Riccardo Anna 1 3 2
10 Riccardo Alessandro 1 2 1,5
11 Riccardo Riccardo 1 1 1
12 Riccardo Luciana 1 4 2,5
13 Luciana Anna 4 3 3,5
14 Luciana Alessandro 4 2 3
15 Luciana Riccardo 4 1 2,5
16 Luciana Luciana 4 4 4

. Linsieme di questi valori si chiama, distribuzione campionaria dello


Ovvero, avremo 16 possibili medie
stimatore, la cui media (come media delle medie), vale esattamente 2,5, ovvero, pari al valore incognito
della media della popolazione.

Lintera distribuzione pu essere rappresentata anche sotto forma di tabella statistica:

Valore della media Frequenza


1 1
1,5 2
2 3
2,5 4
3 3
3,5 2
4 1
16
Una rappresentazione grafica dello stimatore fornisce il seguente grafico

4 4

2 2

1 1

1 1,5 2 2,5 3 3,5 4

Dalla forma del grafico possibile trarre la seguente considerazioni: i valori oscillano simmetricamente
intorno al valore del parametro della popolazione.

Le fluttuazioni della media aritmetica da campione a campione sono sintetizzate statisticamente dal valore
dello scarto quadratico medio di tutte le possibili medie campionarie. Questa misura di variabilit prende il
nome di errore standard della media. Quando si campiona con reintroduzione, lerrore definito dalla
seguente equazione

Ovvero, lerrore standard della media uguale allo scarto quadratico medio della popolazione, diviso per la
radice quadrata dellampiezza del campione. Nel nostro caso, supponendo di avere una conoscenza della
variabilit nella popolazione, lerrore standard sarebbe pari a 0.56.

Una volta introdotta lidea di distribuzione campionaria e definito lerrore standard della media, dobbiamo
stabilire quale sia la distribuzione della media campionaria quando consideriamo tutti i possibili campioni
di ampiezza n. Si pu dimostrare che se effettuiamo estrazioni con reimmissione da una popolazione normale
con media e scarto quadratico medio , la distribuzione della media campionaria ancora una normale
con media e errore standard della media pari a , e questo vale per ogni n.
Ora sappiamo che la distribuzione della figura sopra riportata una distribuzione normale la cui funzione
nota ed data da:
2
1 1 ()
[ ]
() = 2
2

Dove:

e = costante matematica approssimata da 2,71826

= costante matematica approssimata da 3,1459

X = valori assunti dalla variabile aleatoria presa in considerazione

Visto che la distribuzione normale gode di una serie di propriet, tra le quali la simmetria, e considerato che,
suddetta funzione matematica sempre approssimabile da una curva, i dati della distribuzione campionaria
che abbiamo definito nellesempio, possono essere interpolati dalla funzione normale.

In questo caso, visto che lesempio tratta di pochi dati, chiaro che la distribuzione normale appare piuttosto
piatta. Tuttavia, se simulassimo con metodo Monte Carlo 1.000 casi da una distribuzione normale e
interpolassimo i dati con una normale, otterremmo il noto grafico a campana.
Tornando allesempio di prima, conoscendo la distribuzione e i relativi parametri, possiamo calcolare la
probabilit di osservare un campione di una determinata ampiezza. In questo caso, ricordiamo che il valore
medio pari a 2,5 e lo scarto quadratico medio pari a 2,1, potremmo scrivere:
14
{ 2,1 + 2,1} = = 0,875
16

Ossia la media di un campione casuale cade nellintervallo 2,1 con probabilit 0,875.

Invertendo con , potremmo scrivere

{ 2,1 + 2,1} = 0,875

Che pu intendersi dicendo che 0,875 la probabilit che si riferisce agli intervalli casuali che contengono il
valore .

Questo accade nel caso conoscessimo la distribuzione campionaria dello stimatore. In questo caso, quindi,
avremmo un intervallo fisso che pu contenere una serie di stime.

Nella realt, invece, abbiamo a che fare con un solo campione e non conosciamo nulla della popolazione.
Tuttavia possiamo ipotizzare la forma della distribuzione e possiamo avere una percezione della variabilit.
Con queste sole informazioni e, basandosi sul valore medio calcolato sul campione, possiamo procedere
con la stima per intervalli e, successivamente, con la verifica di ipotesi.

Stima per intervalli:

in questo caso, supponiamo di estrarre un campione. Nel nostro caso, supponiamo di aver scelto la
combinazione Riccardo Alessandro il cui valore medio 1,5 e lo s.q.m = 0,5. Ci chiediamo quale sia
lintervallo di confidenza che al 95% contiene il valore incognito della popolazione. Come procedere?
Poich sappiamo che la media campionaria si distribuisce normalmente con media e , allora dovremmo
procedere con lintegrazione della funzione della normale. Poich questo procedimento troppo
complesso, si trovata una scorciatoia. Standardizziamo la distribuzione in modo tale che riportiamo tutti i
valori ad unipotetica curva standardizzata i cui valori sono tutti tabulati. Per loperazione di
standardizzazione si ricorre alla seguente formula:


=

Come calcolare il valore di Z? Innanzitutto bisogna fissare un margine di errore che si disposti a tollerare.
Supponendo che questo sia del 5% (ovvero 2,5% a sinistra e a destra), dalle tavole della normale si pu
ricavare il valore di Z che corrisponde a suddetta area.

Una volta calcolata e, ricordando che abbiamo a che fare con la media campionaria che distribuzione e
, la nostra Z diventa


=

Di conseguenza possiamo calcolare


{ = } = 1 5%
2 2

Con semplici passaggi ricaviamo la nostra incognita pari a


{ + }=1
2 2
Sostituendo i dati con i valori osservati
0,5 0,5
{1,5 1,96 1,5 + 1,96 } = 95%
2 2

Ovvero

{0,8 2,5} = 95%


In questo caso, non conosciamo quale sia il parametro vero della popolazione (noi lo sappiamo che pari a
2,5). Tuttavia, con le considerazioni svolte sullintervallo di confidenza, possiamo calcolare un intervallo che
al 95% dei casi contiene il valore incognito del parametro.

Spetter alla verifica di ipotesi verificare se la media stabilita dallintervallo pu o meno essere definita
come plausibile.

Bibliografia

G.Cicchitelli, Introduzione alla statistica. Pearson edizioni, 2014

F.Leva, Laboratorio di statistica con R. Pearson edizioni, 2012