Sei sulla pagina 1di 26

Concetti base di probabilit e statistica

DEFINIZIONI

Probabilit
Un numero reale compreso tra 0 e 1, associato a un evento casuale.
Esso pu essere correlato con la frequenza relativa o col grado di
credibilit con cui un evento avviene.
Per un alto grado di credibilit la probabilit vicina al valore 1.
Da un punto di vista non completamente corretto la probabilit pu essere
considerata come il rapporto tra il numero di eventi favorevoli e il numero
degli eventi possibili nelle medesime condizioni.

Variabile aleatoria
Una variabile aleatoria una variabile che pu assumere qualsiasi valore in
un determinato intervallo, e alla quale associata una distribuzione di
probabilit (o densit di probabilit).
Una variabile aleatoria che pu assumere solo valori isolati detta
variabile discreta. Una variabile aleatoria che pu assumere tutti i valori
entro un intervallo finito o infinito detta variabile continua.

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Distribuzione di probabilit (di una variabile aleatoria)


Una funzione che definisce la probabilit che una variabile aleatoria discreta
assuma un determinato valore (o che una variabile aleatoria continua assuma
tutti i valori di un intervallo).
La probabilit che una variabile aleatoria possa assumere un qualsiasi valore
tra quelli permessi 1.
Densit di probabilit
per una variabile discreta: una funzione che fornisce, per ogni valore xi di
una variabile aleatoria discreta X, la probabilit pi che la variabile aleatoria
si uguale a xi. pi = Pr(X = xi)
per una variabile continua: una funzione p(x) che fornisce, per ogni
intervallo (x x+dx) dei valori che pu assumere una variabile aleatoria
continua X, la probabilit dP che la variabile aleatoria assuma un valore
all'interno dell'intervallo.
dP = p(x) dx = Pr(x X x+dx)
La densit di probabilit coincide con la derivata (quando esiste) della
funzione di distribuzione
p(x) = dP(x)/dx

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Normalizzazione della densit di probabilit


Per il fatto che la probabilit che una variabile aleatoria possa assumere
un qualsiasi valore tra quelli permessi vale 1, la densit di probabilit
deve soddisfare a condizioni di normalizzazione:
Se i valori possibili sono (x1, x2, .. ,xN)
per una variabile discreta:
N

p
i =1

per una variabile continua:


nell'intervallo (a b)

=1

pi 0

Se i valori possibili sono compresi

p( x) dx = 1

p(x) 0

axb

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Media o Valore Atteso


Per una variabile discreta: siano xi i valori assunti dalla variabile
aleatoria X con probabilit pi . Il valore atteso, se esiste, risulta:

= E ( X ) = pi xi
i

la somma essendo estesa a tutti i valori xi che pu assumere la


variabile X.
Per una variabile continua: sia p(x) la densit di probabilit
associata alla variabile aleatoria X. Il valore atteso, se esiste,
risulta:

= E ( X ) = x p ( x) dx

l'integrale essendo esteso a tutti gli intervalli che comprendono i


possibili valori assunti da X.

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Variabile aleatoria centrata


Una variabile aleatoria il cui valore atteso sia nullo. Se la variabile
aleatoria X ha un valore atteso uguale a , la corrispondente
variabile aleatoria centrata (X - ).
Varianza
La varianza di una variabile aleatoria, o di una distribuzione di
probabilit, il valore atteso del quadrato della corrispondente
variabile centrata

} ( )

2 = V ( X ) = E [X E ( X )] = E X 2 [E ( X )]
2

Deviazione standard
La deviazione standard di una variabile aleatoria, o di una
distribuzione di probabilit, la radice quadrata positiva della
varianza
2
2
= V ( X ) = E [X E ( X )] = E X 2 [E ( X )]

( )

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Stima statistica del valor medio (o valore atteso)


Il valore atteso della variabile aleatoria z, rappresentato col simbolo
z e detto anche valor medio di z, dato da

z E ( z ) = z p ( z ) dz
La sua stima statistica data dalla media aritmetica dei valori zi
assunti dalla variabile z di densit di probabilit p(z).

1 n
z = zi
n i =1

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Stima statistica della varianza


La varianza di una variabile aleatoria z, di densit di probabilit p(z),
data da:
2
2

( z ) = (z z ) p ( z ) dz

essendo z il valore atteso di z.


La varianza 2(z) pu essere stimata da

1 n
2
s (z ) =
z
z
(
)

i
n 1 1=1

1 n
z = zi
n i =1

Il fattore (n-1) nella espressione di s2(z) proviene dalla correlazione


tra i valori zi e z e riflette il fatto che vi sono solo (n-1) termini
indipendenti nel set di valori {zi - z }.
Se il valore atteso z della variabile z noto (non stimato) la
varianza pu essere stimata da

1
2
s ( zi ) =
n

(z
i =1

z )

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

La varianza della media aritmetica delle osservazioni, piuttosto che


la varianza di una singola osservazione, la misura appropriata
dell'incertezza del risultato di una misurazione.
La varianza della variabile z, 2(z), deve essere accuratamente
distinta dalla varianza della media aritmetica .
La varianza della media aritmetica di una serie di n osservazioni
indipendenti zi della grandezza rappresentata dalla variabile
aleatoria z data da
2 (z ) = 2 (z ) / n
ed stimata dalla varianza sperimentale della media:
2
s
( z)
1
2
s (z ) =
=
n
n (n 1)

2
z
z
(
)

i
i =1

Deviazione standard
La deviazione standard la radice quadrata positiva della varianza.

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

Quindi, in un esperimento:
la miglior stima della grandezza
x la media aritmetica

xbest

x1 + x2 + ... + x N xi
=x=
=
N
N

la deviazione standard delle misure x1,,xN


incertezza media :

i
1
2
3
4
5

xi

71
72
72
73
71

x = 71.8

sx =

di2

di = xi- x

-0.8
0.2
0.2
1.2
-0.8

=0

0.64
0.04
0.04
1.44
0.64

d i = 2.80

1
2
x
x
(
)

i
N 1

una stima della

media dei quadrati delle


deviazioni: varianza
estraendo la radice quadrata:
deviazione standard

N-1

Laboratorio di Fisica Generale - IV corso

Concetti base di statistica

La deviazione standard sx caratterizza lincertezza media


delle singole misure x1,,xN da cui stata calcolata.
Tuttavia xbest = x
rappresenta
una
combinazione
opportuna di tutte le N misure lincertezza di x minore
dellincertezza delle singole misure ed determinata dalla
deviazione standard della media:

sx
sx =
N

N.B.: la giustificazione teorica di questi concetti statistici


verr data quando sar discussa la curva di distribuzione
normale

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Distribuzione normale (o gaussiana)


La distribuzione di probabilit di una variabile aleatoria X la cui
densit di probabilit

1
p( x) =
e
2

detta distribuzione normale


o gaussiana.

( x ) 2
2 2

p(x)

il valore atteso della


variabile aleatoria X e
2 la relativa varianza.

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

La distribuzione normale rappresenta, per determinati valori di e di


che variano di caso in caso, la distribuzione delle misure per una estesa
classe di grandezze fisiche.
Esempio: costruzione di un istogramma
Supponiamo di effettuare per N volte la misurazione della stessa
grandezza nelle stesse condizioni: in generale, i risultati ottenuti non
saranno tutti uguali tra loro per via degli errori casuali.
Consideriamo i valori minimi e massimi misurati (xm e xM) e dividiamo
lintervallo compreso tra essi in r parti uguali di ampiezza

xM xm
x =
r
Consideriamo un sistema di assi cartesiani e riportiamo sulle ascisse i
valori delle misure ottenute e in ordinata il numero di risultati della misura
che cadono nel
sotto-intervallo
x
x
m

Laboratorio di Fisica Generale - IV corso

fk

La distribuzione normale

N:
numero totale di misure
fkxk: frazione di misure nellintervallo
k-esimo (area rettangolo)

N=40

fk

xm

xM

xm

fk
N=100

N=10000

xM

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

distribuzione limite: distribuzione dei risultati che si dovrebbe ottenere se


il numero delle misure diventasse infinitamente grande
fk

f(x)

x0

f ( x) dx = 1
+

x = x f ( x)dx

= ( x x ) 2 f ( x) dx
2

x+dx

f(x)dx=probabilit che una misura dia un


risultato compreso tra x e dx

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Si pu dimostrare che SE una misura soggetta a molte piccole


sorgenti di errori casuali e trascurabili errori sistematici, allora i
valori misurati saranno distribuiti secondo una distribuzione
normale (o di Gauss), centrata sul valore vero.
(x x0 )
1
f ( x) =
exp

2
2

f(x)

x0

Distribuzioni normali per diversi valori di

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

La conoscenza della distribuzione limite per una misura ci consente di


calcolare il valore medio atteso dopo un gran numero di prove. La media
attesa per la distribuzione di Gauss
+

x = x p ( x) dx

con

( x x0 ) 2
1
p( x) =
exp

2
2

y2
1
( y + x0 ) exp 2 dy
x=

2
2
+

con y = xx0

+
y2
y2
1 +
x=
y exp 2 dy + x0 exp 2 dy
2
2
2

x = x0

=0

= 2

Quindi, se le misure sono distribuite secondo la distribuzione normale, dopo


molte prove il valore medio x coincide con il valore x0 per cui la gaussiana
assume il suo valore massimo, che abbiamo assunto essere il valore vero

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Giustificazione della media come miglior stima


Avendo misurato N valori x1,x2,,xN il problema di determinare la
miglior stima del valore vero X e di .
Probabilit di ottenere
una lettura in un
intervallo dxi attorno a xi
semplificando: P ( xi )

1
P[x ( xi xi + dxi )] =
e
2

1
e

( xi x 0 ) 2
22

( xi x0 ) 2
22

La probabilit di osservare lintero set di letture il prodotto delle


probabilit singole (eventi indipendenti):

1
Px0 , ( x1 , x2 ,..., x N ) = P ( x1 ) P ( x2 )....P ( x N ) N e

( x x0 ) 2

i i

22

dxi

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Principio di massima verosimiglianza: date le N misure osservate, le


migliori stime di x0 e sono quei valori per i quali gli osservati sono
pi probabili (cio per cui Px0, massima)

t=

2
x
x
(
)

i i 0

minima

miglior stima per x0:

x0

t
=0
x0

=
i

Quindi la migliore stima del valore vero X (che abbiamo assunto


coincidere con lascissa del picco x0 della gaussiana) la media
aritmetica i xi/N delle misure.
Analogamente si dimostra che la miglior stima per la larghezza della
distribuzione la deviazione standard sx degli N valori osservati:

sx =

1 n
2
x
x
(
)

i
N 1 i =1

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Deviazione standard della media


Poich ciascuna delle grandezze misurate
x1 + ... + x N
x1,,xN distribuita normalmente, lo anche x =

Poich per ciascun valore x1,,xN il valore vero X, lo anche per

dopo aver fatto molte determinazioni della media x di N misure,


i risultati per x saranno distribuiti attorno al valore vero X.
La stima della larghezza della distribuzione dei risultati x si ricava
mediante la propagazione delle incertezze:
2

x
s x =
s x1 + ... +
s x N
x1
x N

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

x1,,xN sono tutte misure della stessa grandezza x sx1== sxN =sx
Inoltre

1
x
x
= ... =
=
x1
x N N
2

quindi:
2

sx
1
1
s x = s x + ... + s x =
N
N
N
Al solito s x rappresenta il limite di confidenza del 68%: se
ricaviamo la media di N misure una sola volta, possiamo essere
confidenti al 68% che il nostro risultato giace entro una distanza
s x dal valore vero X.

Laboratorio di Fisica Generale - IV corso

La distribuzione normale

Riassumendo:
se le misure di x sono soggette solo ad errori casuali, allora la loro
distribuzione limite la funzione di Gauss centrata sul valore vero X e
con larghezza .
La larghezza il limite di confidenza del 68%
Basandosi sugli N valori misurati x1,,xN si mostra che la miglior stima
del valore vero X la media x = i xi / N e la miglior stima di la
deviazione standard sx
Lincertezza in x ( x considerata la stima del valore vero X) la
deviazione standard della media x stimata come s x = s x / N
Si dimostra che lincertezza relativa di sx (considerata la stima della
larghezza vera ) 1 / 2( N 1) ( necessario fare

sufficienti misure prima di poter conoscere realisticamente


lincertezza!)

Laboratorio di Fisica Generale - IV corso

Livelli di confidenza

LIVELLI DI CONFIDENZA
Il problema di ottenere, dalla stima y della grandezza Y misurata
e dalla sua incertezza u(y), una incertezza espansa Up=kp u(y) che
definisca un intervallo y-U Y y+U tale che abbia una elevata
probabilit di copertura (o un elevato livello di confidenza) p.
Si deve quindi determinare il fattore di copertura kp che genera un
intervallo intorno al risultato y della misurazione che ci si aspetta
contenga una grande, specifica frazione p della distribuzione di
valori che potrebbero ragionevolmente essere attribuiti alla
grandezza Y da misurare.

Laboratorio di Fisica Generale - IV corso

Livelli di confidenza

Per ottenere il fattore di copertura kp che produce un intervallo


corrispondente a uno specifico livello di confidenza p si richiede
una dettagliata conoscenza della distribuzione di probabilit che
caratterizza i risultati della misura.
Ad esempio, per una grandezza x descritta dalla distribuzione
normale di valor medio <x> e deviazione standard <x> , il valore
di kp che produce un intervallo <x> kp <x> che comprende una
frazione p della distribuzione, pu essere calcolato facilmente.
Infatti la probabilit che
data da

x < x > k < x>

x0 + k < x >

x0 k < x >

f ( x )dx

(x x0 )
1
f ( x) =
exp

2
2
2

dove

Laboratorio di Fisica Generale - IV corso

Livelli di confidenza

Ad esempio: Livello di confidenza p (in %)


68.27
90
95
95.45
99
99.73
100

Fattore di copertura kp
1
1.645
1.960
2
2.576
3

Quindi, se i risultati si distribuiscono secondo una gaussiana, vi il 68.27%


di probabilit che il risultato di una misura differisca meno di dal
valore vero
f(x)
il 95.4 % di probabilit che
la misura cada entro 2 dal
valore vero
il 99.7 % di probabilit che
la misura cada entro 3 dal
valore vero

x03

x02

x0 x0

x0+
x0+2

x
x0+3

Laboratorio di Fisica Generale - IV corso

Livelli di confidenza

Analogamente, con il 68.27 % di probabilit, il valore medio


<x> si discosta da quello vero per meno di <x>
con il 95.4 % <x> si discosta per meno di 2<x>
con il 99.7 % <x> si discosta per meno di 3<x>.
f(x)

x
x0<x> x0 x0+<x>
x02<x>
x0+2<x>
x03<x>
x0+3<x>

In conclusione, il risultato di una misurazione si potr indicare


come

x =< x > s< x >

dove

1 n
< x >= xi
n i =1

s< x > =

n
1
2
x
x
(
)

<
>
i
n(n 1) i =1

N.B.: Nel caso in cui lincertezza calcolata come sopra


sia inferiore allerrore strumentale, si usa questultimo
come errore massimo.