Sei sulla pagina 1di 24

Analisi statistica dei dati:

un esempio di misura di
emissioni radioattive
V. Montalbano
Dipartimento di Fisica
Universit di Siena
Esistono limiti alla precisione di
una misura?
Ci sono essenzialmente due fattori che limitano la precisione delle
misure :
- Limiti strumentali ( si parla di
errore
errore
strumentale
strumentale . In questo caso
usualmente il risultato delle misure costante )
- Lo strumento raffinato , ma
il
fenomeno sfugge al completo
controllo ( si hanno risultati diversi da misura a misura e si
parla di
fluttuazioni
fluttuazioni
di
di
misura
misura )
Probabilit e statistica
Analisi statistica dei dati
Se si pu ripetere molte volte la misura di una stessa grandezza fisica

Se un fenomeno di ripete nel tempo e quindi pu essere misurato molte volte

si ottiene un insieme di misure (dati) che possono essere trattate statisticamente
per diminuire lincertezza della misura della grandezza fisica che stiamo
osservando dovuta a cause accidentali

NOTA BENE il trattamento statistico dei dati ha senso solo se le misure sono
indipendenti tra loro


Cominciamo a richiamare qualche concetto che ci sar utile in seguito legato alla
probabilit e alla statistica
Funzioni di distribuzione
Data una variabile casuale S ci si pu chiedere qual la probabilit
di ottenere un certo valore di S. Linsieme dei valori P(S) costituisce
la funzione di distribuzione della variabile S
Esempio: lancio
di due dadi
1/36 1 12
2/36 2 11
3/36 3 10
4/36 4 9
5/36 5 8
6/36 6 7
5/36 5 6
4/36 4 5
3/36 3 4
2/36 2 3
1/36 1 2
P(S) Casi favorevoli S
Rappresentazione di fenomeni casuali
Variabili discrete ( vedi esempio del lancio di due dadi)
Rappresentazionedi fenomeni casuali
Variabili continue
Ax
n
1
n
2
n
3
n
4
n
5
X
n/Ax
n/NAx
n
1
/N
N =..
Se ora effettivamente lanciamo due
dadi molte volte di seguito (senza
barare ovvero tutti i valori possibili su
ogni dado sono equiprobabili) i dati
raccolti si distribuiranno intorno al
valore pi probabile in modo molto
simile alla funzione di distribuzione
calcolata utilizzando il rapporto tra i
casi favorevoli ed i casi possibili
Ma quante volte dovete lanciare i dadi
per ottenere una distribuzione della
frequenza della misura davvero simile
alla distribuzione calcolata?
10 volte? 100? 1000?......

La teoria dei campioni statistici
permette di stabilire un insieme
minimo nel caso di misure di
grandezze fisiche.
Caratteristiche delle distribuzioni
1 ) ( =

i
x
i
x P
1 ) ( =
}
b
a
dx x p
) (

=
i
x
i i
x P x
) ( ) ( :
2 / 1 2 / 1 2 / 1
> = s
i i
x P x P
) ( ) ( :
max max
P x P
i
s
}
=
b
a
dx x xp ) (
2
1
) ( ) ( :
2 / 1
2 / 1
2 / 1
= =
} }
b
a
dx x p dx x p

Variabili discrete Variabili continue


distribuzione
di probabilit
media o
valor medio
moda
mediana
Dispersione intorno alla media I
Sia f(x) una funzione della variabile casuale x. Si definisce valore
di aspettazione della f
| | ) ( ) (
i
x
i
x P x f f E
i

= | |
}
=
b
a
dx x p x f f E ) ( ) (
E immediato verificare che
| | = x E
Per questo E[f] si chiama anche valor medio di f
| |
| | | |
| | | | | | g E f E g f E
f kE kf E
k k E
+ = +
=
=
E un operatore lineare
Dispersione intorno alla media II
Quanto sono lontane le nostre misure dalla media?
Se considero f(x) = x -
| | | | | | 0 = = = E x E x E
Consideriamo allora f(x) = (x )
2
Si definisce varianza
| |
2 2
) ( o = x E
Si definisce deviazione standard
2
o
| | | |= + = x x E x E 2 ) (
2 2 2
| | | | | |
= + = x E E x E 2
2 2
| | | | = + x E x E 2
2 2
| | | |
2 2 2 2 2
2 = + = x E x E
Se i risultati di una misura fluttuano , essi sono delle variabili casuali
che dipendono dalle condizioni sperimentali .
La media di questa variabile casuale il valore pi significativo
del risultato. La deviazione standard misura lincertezza da attribuire
al risultato.
Teorema di ebysv
2
1
) (
k
k x P s > o
Distribuzioni
Un insieme di dati si distribuisce secondo una funzione di distribuzione di
probabilit che una caratteristica di quellinsieme e che a priori non nota
Avendo a disposizione un campione dei dati si pu osservare come i dati si
distribuiscono attorno al loro valor medio

In alcuni casi si pu calcolare la funzione di distribuzione, molto pi spesso
invece si pu solo osservare con quale frequenza i dati si distribuiscono intorno
al valor medio e da questo desumere la funzione di distribuzione

Vediamo ora alcune delle funzioni di distribuzioni pi rilevanti per la fisica

Dimostriamo che: - la distribuzione normalizzata
- la media e la varianza sono = np;
- o
2
= npq esercizio proposto
Distribuzioni
Binomiale o di Bernoulli
Consideriamo n possibili eventi identici e indipendenti ciascuno dei
quali si pu realizzare in due modi diversi e
1
ed e
2
aventi probabilit
P(e
1
) = p e P(e
2
) = q = 1-p.
La probabilit di ottenere k volte levento e
1
in n prove data da
k n k
q p
k
n
k n P

|
|
.
|

\
|
= ) , (
)! ( !
!
k n k
n
k
n

=
|
|
.
|

\
|
dove
Distribuzione di Poisson
La probabilit che si verifichino k eventi in una situazione in cui
in media se ne verificano a data da:
a
k
e
k
a
k P

=
!
) (
Si ottiene come limite della distribuzione binomiale per p<<1, n>>1
ma np=costante=a
Allora p=a/n
Esempi di applicazione
Decadimento di sostanze radioattive
Numero di persone che entrano in un locale in un tempo fissato
Numero di auto che passano in un tempo fissato
o =
2
La distribuzione normalizzata
= a
Distribuzione di Gauss
una funzione di distribuzione continua, la cui densit
di probabilit data da
2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
x
e x p
2 ln
2
1
=

=
o
x
t
Semilarghezza a met altezza
Da cui si ottiene
o o 2 . 1 2 ln 2 ~ = x
Propriet
La distribuzione normalizzata
1
2
1
) (
2
2
1
= =
|
.
|

\
|


} }
dx e dx x p
x
o

t o
Calcolo della media
| |
t o
o

= = =
} }


|
.
|

\
|


dx xe dx x xp x E
x
2
2
1
2
1
) (
Si calcola utilizzando la sostituzione z=x-
Applicazioni
La distribuzione di Gauss si ottiene come caso limite della
Binomiale quando e p resta costante.
In tutti i casi in cui le fluttuazioni della variabile casuale continua sono
dovute alla somma di tanti piccoli contributi , a tante cause indipendenti ,
la gaussiana sembra descrivere bene questa variabile.
In fisica questa situazione si presenta molto spesso, per cui quando
non ci sono errori sistematici o cause di errore fortemente correlate
tra loro, cio non indipendenti , la distribuzione dei risultati molto
ben descritta dalla distribuzione di Gauss.
n
Cenni alla teoria dei campioni
Linsieme delle misure sperimentali soltanto una piccola
parte di tutte le misure effettuabili , un campione di tutte le
possibili misure.
Si postula lesistenza di una distribuzione dei risultati di tutte
le misure fattibili (distribuzione genitrice o parent distribution )
Dal campione dobbiamo approssimare al meglio la media e la
varianza della distribuzione genitrice
Teoria dei campioni II
Abbiamo detto che linsieme delle nostre misure sperimentali
rappresenta un campione di tutte le possibili misure.
Da questo dobbiamo stimare la media e la deviazione standard
della distribuzione genitrice.
Come miglior stima della media si prende la media aritmetica m
m
Quando n tende allinfinito

=
n
i
m x
n
s
1
2 2
) (
1
1
Dove s
2
la varianza del campione
interessante stimare qual la varianza della media m
Si pu far vedere che

=
n
i
m
m x
n n
s
1
2 2
) (
) 1 (
1
Quindi nel caso in cui si hanno misure i cui risultati fluttuano,
una volta verificato che non ci sono errori sistematici , il risultato
della misura si scrive:
m
s m
* ( - o < x < + o) cade il 68.7% delle misure rilevate;
* ( - 2 s < x < + 2 o) cade il 95.45% delle misure rilevate;
* ( - 3 o < x < + 3 o) cade il 99.73% delle misure rilevate.

Quali conseguenze per la nostra misura delle
emissioni radioattive?
Misuriamo le emissioni radioattive del nostro campione (o la radioattivit
naturale della stanza che costituisce il nostro fondo) per un certo periodo di
tempo (30s, 10 min, 1 h, ecc.).
Poich il decadimento di una sostanza radioattiva descritto da una
distribuzione di Poisson la varianza sar pari a N
1/2
, come si pu osservare
dallintervallo di oscillazione dei valori.
In media nellintervallo di tempo considerato decade un numero di nuclei pari a
N N
1/2


Consideriamo una grandezza misurata N volte, ovvero un campione statistico di
N misure della grandezza. Se N abbastanza grande la varianza s sar
proporzionale a N
-1/2

Un esempio
0 1000 2000 3000 4000 5000 6000 7000
0
50
100
150
200
c
o
n
t
e
g
g
i
/
1
0
m
i
n
min
-40 -20 0 20 40 60
0
20
40
60
f
r
e
q
u
e
n
z
a
X-Med1
Med1=182 N=188 s=16 sm=1

Med2=194.5 N=437 s=14 sm=0.7

-40 -20 0 20 40
0
20
40
60
80
100
120
140
f
r
e
q
u
e
n
z
a
X-Med2
BUON LAVORO
Tipi di errore
Errore Relativo: il rapporto tra l errore assoluto Ax e la misura
ottenuta x. Cio
Sia G il prodotto allora
x
x A
.....
p m n
c b a G =
.... +
A
+
A
+
A
=
A
c
c
p
b
b
m
a
a
n
G
G
Errore Sistematico: quellerrore deriva da errori di taratura di
strumenti dall apparato sperimentale o dalla mancanza di imparzialit
dellosservatore. Gli errori sistematici contribuiscono tutti nella stessa
direzione (o sempre per difetto o sempre per eccesso).
Precisione: un indice della consistenza interna delle misure . Indica
quanto si discostano tra loro i risultati sperimentali .
Accuratezza: una valutazione dell errore sistematico : una misura
tanto pi accurata quanto pi il risultato vicino a quello che si
otterrebbe in assenza di errore sistematico .
Cifre significative e arrotondamento
Il numero di cifre significative in un risultato dipende dalla sua
precisione
La cifra pi significativa quella, diversa da zero, pi a sinistra
La cifra meno significativa quella pi a destra, diversa da zero,
se non c la virgola decimale.
Se c la virgola decimale la cifra meno significativa quella pi
a destra, anche se zero.
Tutte le cifre tra la pi e la meno significativa comprese sono le
cifre significative .
Esempio:
3215 3215.4 3200 0.032 1500.0 12.00 0.130
+ - + - +- +- + - + - + -
Quante cifre significative si riportano ?
Si riportano tutte le cifre fino alla prima influenzata dall errore inclusa
Quando le cifre non significative vengono tagliate via da un numero, le
rimanenti cifre devono essere arrotondate per una migliore accuratezza .
Le cifre tolte vengono trattate come una frazione decimale .
Se la frazione pi grande di si incrementa di una unit la cifra
meno significativa
Se la frazione meno di non si incrementa
Se la frazione uguale ad si incrementa la cifra meno significativa
solo se dispari
Esempio: G = 12543.57; AG = 2.3576
Primo si arrotonda AG. 2 ~ AG
2
1
3576 . 0 <
2
1
57 . 0 >
2 12544 = G
12543 ~ G
poich