Statistica Applicata Alla Fisica

S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
D
o
t
t
o
r
a
t
o
d
i
R
i
c
e
r
c
a
i
n
F
i
s
i
c
a
X
I
V
C
i
c
l
o
(
A
n
n
o
A
c
c
a
d
e
m
i
c
o
1
9
9
8
9
9
)
S
t
a
t
i
s
t
i
c
a
A
p
p
l
i
c
a
t
a
a
l
l
a
F
i
s
i
c
a
B
e
n
v
e
n
u
t
i
W
h
e
r
e
s
h
a
l
l
I
b
e
g
i
n
,
p
l
e
a
s
e
,
y
o
u
r
M
a
j
e
s
t
y
?
h
e
a
s
k
e
d
.
B
e
g
i
n
a
t
t
h
e
b
e
g
i
n
n
i
n
g
,
t
h
e
K
i
n
g
s
a
i
d
,
g
r
a
v
e
l
y
,
T
h
e
t
i
m
e
h
a
s
c
o
m
e
,
t
h
e
W
a
l
r
u
s
s
a
i
d
,
a
n
d
g
o
o
n
t
i
l
l
y
o
u
c
o
m
e
t
o
t
h
e
e
n
d
:
t
h
e
n
s
t
o
p
.
t
o
t
a
l
k
o
f
m
a
n
y
t
h
i
n
g
s
.
(
A
l
i
c
e
i
n
W
o
n
d
e
r
l
a
n
d
)
(
T
h
r
o
u
g
h
t
h
e
L
o
o
k
i
n
g
G
l
a
s
s
)
M
a
u
r
i
z
i
o
L
o
r
e
t
i
0
Scuola di Dottorato in Fisica
Richiami di teoria della probabilit` a - I
Fenomeni casuali; spazio dei risultati; spazio degli
eventi. Evento impossibile; evento certo. Frequenza
assoluta e relativa in N prove.
Somma logica (unione) e prodotto logico (interse-
zione) di eventi casuali. Eventi condizionati.
Denizione assiomatica di probabilit` a:
Pr(E) 0
Pr(S) = 1
Pr(E
1
E
2
) = Pr(E
1
) + Pr(E
2
) +
(E
i
, E
k
: E
i
E
k
= )
Denizione empirica di probabilit` a:
Pr(E) = lim
N
f(E)
Denizione di limite statistico, lim
N
x = X:
, > 0 M :
N > M Pr
_
[x X[
_

Maurizio Loreti
1
Richiami di teoria della probabilit` a - II
Legge della probabilit` a totale:
Pr(E F) = Pr(E) + Pr(F) Pr(E F)
Legge della probabilit` a composta:
Pr(E F) = Pr(E) Pr(F[E)
= Pr(F) Pr(E[F)
Indipendenza statistica di uno o pi ` u eventi casuali
Teorema di Bayes:
Pr(A
i
[E) =
Pr(A
i
) Pr(E[A
i
)
_
j
_
Pr(A
j
) Pr(E[A
j
)
_
Maurizio Loreti
2
Esercizio
Lanciamo un dado per due volte, e consideriamo i
seguenti eventi casuali:
A, consistente nellottenere un punteggio dispari
sul primo dado;
B, consistente nellottenere un punteggio dispari
sul secondo dado;
C, consistente nellottenere un punteggio comples-
sivo dispari.
Quali di questi eventi sono tra loro statisticamente
indipendenti?
Maurizio Loreti
3
Soluzione
A ` e indipendente da B;
A ` e indipendente da C:
Pr(C[A) = Pr
B
_
=
1
2
= Pr(C)
B ` e indipendente da C (per la stessa ragione);
I tre eventi non sono indipendenti (Il realizzarsi di
A e di B rende impossibile il realizzarsi di C).
Maurizio Loreti
4
Esercizio
Lanciamo una moneta per tre volte, e consideriamo i
seguenti eventi casuali:
A: consistente nellottenere testa al primo lancio;
B: consistente nellottenere testa al secondo
lancio;
C: consistente nellottenere solo due teste, che
siano consecutive.
Quali di questi eventi sono tra loro statisticamente
indipendenti?
Maurizio Loreti
5
Soluzione
S TTT, TTC, TCT, CTT,
TCC, CCT, CTC, CCC
_
_
A TTT, TTC, TCT, TCC
B TTT, TTC, CTT, CTC
C TTC, CTT
_
_
Pr(A) =
1
2
Pr(B) =
1
2
Pr(C) =
1
4
_
_
A B TTT, TTC
A C TTC
B C TTC, CTT
_
_
Pr(A B) =
1
4
= Pr(A) Pr(B)
Pr(A C) =
1
8
= Pr(A) Pr(C)
Pr(B C) =
1
4
,= Pr(B) Pr(C)
A e B sono indipendenti; A e C sono indipendenti;
ma B e C non sono indipendenti.
Maurizio Loreti
6
Esercizio
Due sici esaminano indipendentemente un lm che
registra il passaggio di un fascio di particelle
attraverso una camera a bolle, alla ricerca di
decadimenti rari: il primo ne trova n
A
= 95 ed il
secondo n
B
= 98. Se gli eventi trovati da entrambi
sono n
AB
= 94, si chiede (supponendo di poter
approssimare ovunque le probabilit` a con le frequenze
rispettive):
1. Il numero pi ` u probabile N di eventi;
2. Lefcienza complessiva , ossia la probabilit` a che
tra i due osservatori almeno uno trovi un evento.
Maurizio Loreti
7
Soluzione
_
_
Pr(A) =
n
A
N
Pr(B) =
n
B
N
Pr(A B) =
n
AB
N
= Pr(A) Pr(B) =
n
A
N

n
B
N
N =
n
A
n
B
n
AB
Pr(A B)
= Pr(A) + Pr(B) Pr(A B)
=
n
A
+ n
B
n
AB
N
=
(n
A
+ n
B
n
AB
) n
AB
n
A
n
B
Maurizio Loreti
8
Esercizio
Si progetta un esperimento per lo studio di eventi
(segnale) individuati da un rivelatore che reagisce
anche ad altri eventi (di fondo).
Si ammettono note la probabilit` a del segnale, quella
del fondo, e lefcienza del rivelatore (sia per il
segnale che per il fondo); quale ` e la probabilit` a che
un evento osservato appartenga al segnale?
Maurizio Loreti
9
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
S
o
l
u
z
i
o
n
e
S
o
n
o
n
o
t
e
P
r
(
S
)
,
P
r
(
F
)
,
P
r
(
R
[
S
)
e
P
r
(
R
[
F
)
;
s
i
c
h
i
e
d
e
P
r
(
S
[
R
)
,
e
s
i
p
u
`
o
u
s
a
r
e
i
l
t
e
o
r
e
m
a
d
i
B
a
y
e
s
:
P
r
(
S
[
R
)
=
P
r
(
R
[
S
)
P
r
(
S
)
P
r
(
R
[
S
)
P
r
(
S
)
+
P
r
(
R
[
F
)
P
r
(
F
)
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
0
Richiami di teoria della probabilit` a - III
Variabili casuali, continue e discrete
Probabilit` a e densit` a di probabilit` a:
Variabile discreta Variabile continua
p
i
0 f(x) 0
_
i
p
i
= 1
_
+
f(x) dx = 1
Pr(x [x
0
, x
0
+ dx]) = f(x
0
) dx
Pr(x
1
x x
2
) =
_
x[x
1
,x
2
]
p
i
Pr(x
1
x x
2
) =
_
x
2
x
1
f(x) dx
Funzione di distribuzione: F(x) =
_
x
i
x
p
i
=
_
x
f(t) dt
Maurizio Loreti
11
Stime di tendenza centrale e di dispersione
Campioni e popolazione
Valor medio e varianza di un campione:
x =
1
N
_
i
x
i
=
_
k
f
k
x
k
s
2
=
1
N
_
i
_
x
i
x
_
2
=
_
k
f
k
_
x
k
x
_
2
=
1
N
_
i
x
2
i

x
_
2
Speranza matematica della variabile casuale x:
E(x) =
_
k
p
k
x
k
=
_
+
x f(x) dx
Varianza della popolazione:
Var(x) = E
_
_
x E(x)
_
2
_
Var(x) =
_
k
p
k
_
x
k
E(x)
_
2
=
_
+
_
x E(x)
_
2
f(x) dx
Maurizio Loreti
12
Speranza matematica delle combinazioni lineari
di variabili casuali
z = ax + by
E(z) =
_
ik
P
ik
(ax
i
+ by
k
)
= a
_
i
x
i
_
k
P
ik
+ b
_
k
y
k
_
i
P
ik
= aE(x) + bE(y)
che si generalizza immediatamente per induzione
completa a
z =
_
i
a
i
x
i
E(z) =
_
i
a
i
E(x
i
)
Maurizio Loreti
13
Varianza delle combinazioni lineari
di variabili casuali indipendenti
z = ax + by
P
ik
= p
i
q
k
E(x) = E(y) = 0 E(z) = 0
Var(z) =
_
ik
P
ik
(ax
i
+ by
k
)
2
=
_
ik
p
i
q
k
(a
2
x
2
i
+ b
2
y
2
k
+ 2abx
i
y
k
)
= a
2
_
i
p
i
x
2
i
_
k
q
k
+
+ b
2
_
k
q
k
y
2
k
_
i
p
i
+
+ 2ab
_
i
p
i
x
i
_
k
q
k
y
k
= a
2
Var(x) + b
2
Var(y)
Che si generalizza prima a due variabili casuali
indipendenti aventi speranza matematica non nulla e
poi alla somma di un numero qualsiasi di variabili
casuali tutte indipendenti:
z =
_
i
a
i
x
i
Var(z) =
_
i
a
2
i
Var(x
i
)
Maurizio Loreti
14
Richiami di teoria della probabilit` a - IV
Pr
_
[x E(x)[
_
=
_
[x
i
E(x)[
p
i
Var(x) = E
_
_
x E(x)
_
2
_
=
_
i
p
i
_
x
i
E(x)
_
2
Var(x)
_
[x
i
E(x)[
p
i
_
x
i
E(x)
_
2
_
[x
i
E(x)[
p
i

2
=
2
_
[x
i
E(x)[
p
i
Da qui si ottiene la diseguaglianza di Bienaym e
Ceby sef: ponendo Var(x) =

2
,
Pr
_
[x E(x)[
_
2
e, ponendo = k,
Pr
_
[x E(x)[ k
_
1
k
2
Maurizio Loreti
15
Altre stime di tendenza centrale
Moda ( x): f( x) f(x)
Mediana (x): F(x) = 0.5
Media geometrica (g): g
N
=
N
i=1
x
i
Media armonica (h):
1
h
=
1
N
N
_
i=1
1
x
i
Media quadratica (q): q =
_
x
2
Quantili:
Quartili: Q
1
Q
3
Decili: D
1
D
9
Percentili: P
1
P
99
Maurizio Loreti
16
Altre stime di dispersione
Range (R): R = x
max
x
min
Semidispersione (r): r =
R
2
Errore medio (): = E
_
[x E(x)[
_
Intervallo Q
3
Q
1
Intervallo P
90
P
10
Maurizio Loreti
17
I momenti - I
Momenti rispetto allorigine:
k
= E
x
k
_
=
_
i
p
i
x
k
i
=
_
+
x
k
f(x) dx
Momenti rispetto alla media:
k
= E
_
_
x E(x)
_
k
_
=
_
i
p
i
_
x
i
E(x)
_
k
=
_
+
_
x E(x)
_
k
f(x) dx
I momenti possono non esistere per popolazioni
composte da un numero innito di individui.
Momenti rispetto allorigine e rispetto alla media
per un campione: deniti analogamente, usando f
i
al posto delle p
i
e x al posto di E(x).
Maurizio Loreti
18
I momenti - II
Corollari:

1
= E
_
x E(x)
_
0
Per distribuzioni simmetriche rispetto alla
media:
2k+1
0

2
=
2
=
2
(
1
)
2
Coefciente di asimmetria (skewness): =

3
3
Coefciente di curt` osi (kurtosis): =

4
4
3
Maurizio Loreti
19
La funzione caratteristica - I
Funzione caratteristica:
x
(t) = E
e
itx
_
=
_
+
e
itx
f(x) dx
(o trasformata di Fourier della f).
La funzione caratteristica esiste sempre.
f(x) =
1
2
_
+
e
ixt
x
(t) dt
(trasformazione inversa di Fourier).
Solo se tutti i momenti esistono,
x
(t) =
_
k=0
(it)
k
k!

k
d
k
x
(t)
dt
k
t=0
= (i)
k
k
Maurizio Loreti
20
La funzione caratteristica - II
Per la somma di N variabili casuali tutte
statisticamente indipendenti:
y =
N
_
k=1
x
k
f(y) dy =
N
k=1
f
k
(x
k
) dx
k
y
(t) =
_
+
e
ity
f(y) dy
=
_
+
k=1
e
itx
k
f
k
(x
k
) dx
k
=
N
k=1
k
(t)
Per una trasformazione lineare y = ax + b:
y
(t) = E
e
ity
_
= E
_
e
it(ax+b)
_
= e
itb
E
e
itax
_
= e
itb
x
(at)
Maurizio Loreti
21
La funzione generatrice dei momenti
Funzione generatrice dei momenti:
M
x
(t) = E
e
tx
_
=
_
+
e
tx
f(x) dx
La funzione generatrice esiste solo se tutti i
momenti esistono. In questo caso risulta anche
M
x
(t) =
_
k=0
(t)
k
k!

k
d
k
M
x
(t)
dt
k
t=0
=
k
Per una trasformazione lineare y = ax + b:
M
y
(t) = e
tb
M
x
(at)
La funzione generatrice della somma di pi ` u variabili
casuali indipendenti ` e uguale al prodotto delle loro
funzioni generatrici.
Funzione caratteristica, funzione generatrice e
momenti sono caratterizzanti.
Maurizio Loreti
22
La funzione caratteristica
delle variabili casuali discrete
Per una variabile discreta x introduciamo la nuova
variabile complessa z = e
it
: la funzione caratteristica
` e
x
(t) =
_
k
p
k
e
itx
k
e rispetto alla z si pu` o scrivere
x
(z) =
_
k
p
k
z
x
k
= E
z
x
_
Per la somma di pi ` u variabili indipendenti, le (z) si
moltiplicano:
t = x + y
t
(z) =
_
jk
Pr(x
j
) Pr(y
k
) z
x
j
+y
k
=
_
j
Pr(x
j
) z
x
j
_
k
Pr(y
k
) z
y
k
=
x
(z)
y
(z)
e similmente per la somma di pi ` u di due variabili
indipendenti:
S =
_
k
x
k

S
(z) =
x
k
(z)
Maurizio Loreti
23
Somma di un numero casuale di variabili casuali
(discrete e indipendenti) - I
Per la somma di N variabili (con N pressato)
provenienti dalla stessa popolazione:
S =
N
_
j=1
x
j
e
S
(z) =
_
x
(z)
_
N
Se anche N ` e una variabile casuale discreta con
funzione caratteristica
N
,
N
(z) =
_
N
Pr(N) z
N
risulter ` a
Pr(S) =
_
N
Pr(N) Pr(S[N)
S
(z) =
_
S
Pr(S) z
S
=
_
S
z
S
_
N
Pr(N) Pr(S[N)
=
_
N
Pr(N)
_
S
Pr(S[N) z
S
=
_
N
Pr(N)
_
x
(z)
_
N
Maurizio Loreti
24
Somma di un numero casuale di variabili casuali
(discrete e indipendenti) - II
In denitiva:
S
(z) =
N
_
x
(z)
_
Se N non ` e propriamente una variabile casuale e pu` o
assumere un unico valore
N = N
0
si ricade nel caso precedente:
N
(z) = z
N
0
S
(z) =
N
_
x
(z)
_
=
_
x
(z)
_
N
0
Maurizio Loreti
25
Cambiamento di variabile casuale - I
Se la corrispondenza tra x e y ` e biunivoca:
y = y(x) ` e strettamente monotona
Esiste la funzione inversa x = x(y)
Se y(x) ` e derivabile lo ` e anche x(y); risulta
y
(x) ,= 0 e
x
(y) =
1
y
[x(y)]
(, = 0)
Linvarianza della probabilit` a su un intervallo
innitesimo, ovvero la condizione f(x) dx g(y) dy,
implica
dx -dy = [y
(x)[ dx
g(y) =
f(x)
[y
(x)[
=
f [x(y)]
[y
[x(y)][
= f [x(y)] [x
(y)[
Maurizio Loreti
26
Cambiamento di variabile casuale - II
Se la corrispondenza non ` e biunivoca bisogna
vedere caso per caso. Se ad esempio
y = x
2
x =
y
un particolare valore per la y corrisponde a due
eventualit` a esclusive per la x; perci ` o
g(y) dy =
_
f(
y) + f(
y)
_
dx
g(y) =
_
f
y
_
+ f
y
__
[x
(y)[
=
f
y
_
+ f
y
_
2
y
Maurizio Loreti
27
Cambiamento di variabile casuale - III
Consideriamo il cambiamento di variabile casuale
x - y = F(x) =
_
x
f(t) dt (y [0, 1])

da cui
y
(x) = F
(x) = f(x)
La corrispondenza ` e biunivoca se risulta ovunque
f(x) > 0
In tal caso
y
(x) > 0
g(y) =
f(x)
[y
(x)[
1
ed abbiamo cos` dimostrato che la funzione di
distribuzione di qualsiasi variabile casuale che possa
assumere tutti i valori di un intervallo continuo ` e a
sua volta distribuita uniformemente in [0, 1].
Maurizio Loreti
28
Variabili casuali bidimensionali - I
Funzione di frequenza congiunta:
f(x, y)
Funzione di distribuzione congiunta:
F(x, y) =
_
x
du
_
y
dv f(u, v)
Funzioni di frequenza marginali:
g(x) =
_
+
f(x, y) dy
h(y) =
_
+
f(x, y) dx
Funzioni di distribuzione marginali:
G(x) =
_
x
g(t) dt = F(x, +)
H(y) =
_
y
h(t) dt = F(+, y)
Condizione di normalizzazione:
F(+, +) = 1
Maurizio Loreti
29
Variabili casuali bidimensionali - II
Per denizione:
f(x, y) dx dy = g(x) dx (y[x) dy
= h(y) dy (x[y) dx
Probabilit` a condizionate:
(y[x) =
f(x, y)
g(x)
(x[y) =
f(x, y)
h(y)
Indipendenza statistica:
(x[y) g(x)
(y[x) h(y)
f(x, y) = g(x) h(y)
Due variabili casuali continue sono statisticamente
indipendenti se (e solo se) la loro densit` a di
probabilit` a congiunta ` e fattorizzabile.
Maurizio Loreti
30
Esempio: decadimento debole della
0
0
p +
e
0
n +
0
Il processo pu` o essere descritto da due variabili
casuali: c (carica del nucleone) e t (tempo di vita
della
0
).
Dalla teoria e dagli esperimenti: la legge di de-
cadimento ` e la stessa per qualunque stato nale
(esponenziale con la stessa vita media ); ed il
branching ratio ` e indipendente dal tempo di vita, e
vale
Pr
0
p +
_
Pr (
0
n +
0
)
= 2
Quindi: g(1) = g(1[t) =
2
3
g(0) = g(0[t) =
1
3
g(c) = g(c[t) =
c + 1
3
h(t) = h(t[0) = h(t[1) =
1
f(c, t) = g(c) h(t) =

c + 1
3
e
Maurizio Loreti
31
Esempio: decadimento debole K
0
e3
K
0
e
+
+
+
e
e K
0
e
+
+
+
e
Variabili casuali: s (1, segno dellelettrone) e t
(tempo di vita). Dalla teoria: la funzione di frequenza,
nellipotesi Q = S ed una volta denito
N(t, s) = e
1
t
+ e
2
t
+ 2s cos(t) e
1
+
2
2
t
(
1
e
2
sono gli inversi delle vite medie del K
0
1
e del
K
0
2
, e ` e la loro differenza di massa) ` e
f(t, s) = N(t, s)/
_
_
s
_
+
0
N(t, s) dt
_
(supposto di osservare tutti i decadimenti a qualsiasi
tempo di vita con efcienza 1): e non ` e fattorizzabile.
h(t) =

1
1
+
2
1
t
+ e
2
t
_
g(s) =
1
2
+
4s
1
2
(
1
+
2
)
2
+ 4
2
h(t[s) =
f(t, s)
g(s)
g(s[t) =
f(t, s)
h(t)
Maurizio Loreti
32
Variabili casuali bidimensionali - III
Valor medio (o speranza matematica) di una
funzione (x, y):
_
+
dx
_
+
dy (x, y) f(x, y)
Momenti rispetto allorigine:
mn
= E [x
m
y
n
]
Momenti rispetto alla media:
mn
= E [(x
10
)
m
(y
01
)
n
]
Maurizio Loreti
33
Variabili casuali bidimensionali - IV
Risulta:

00
1

10
= E(x)

01
= E(y)

20
= E
_
_
x E(x)
_
2
_
= Var(x)

02
= E
_
_
y E(y)
_
2
_
= Var(y)

11
= E
_
_
x E(x)
_
[y E(y)]
_

11
si chiama anche covarianza di x e y, e si
indica col simbolo Cov(x, y).
Maurizio Loreti
34
Variabili casuali bidimensionali - V
xy
(u, v) = E
_
e
i(ux+vy)
_
m+n
xy
u
m
v
n
u=0
v=0
= (i)
m+n
mn
Funzione generatrice:
M
xy
(u, v) = E
_
e
(ux+vy)
_
m+n
M
xy
u
m
v
n
u=0
v=0
=
mn
Maurizio Loreti
35
Variabili casuali bidimensionali - VI
Per un cambiamento di variabili casuali:
u = u(x, y) e v = v(x, y)
Se la corrispondenza ` e biunivoca, esistono le
funzioni inverse:
x = x(u, v) e y = y(u, v)
Se esistono le derivate parziali prime della x e
della y rispetto alla u ed alla v, esiste anche non
nullo il determinante Jacobiano
(x, y)
(u, v)
= det
_
_
_
_
_
_
_
_
x
u
x
v
y
u
y
v
_
_
_
_
_
_
_
_
dotato della propriet` a che
(x, y)
(u, v)
=
_
(u, v)
(x, y)
_
1
Maurizio Loreti
36
Variabili casuali bidimensionali - VII
In tal caso, dalla invarianza della probabilit` a per il
cambiamento di variabili
f(x, y) dx dy = g(u, v) du dv
si ottiene
g(u, v) = f [x(u, v), y(u, v)]
(x, y)
(u, v)
Maurizio Loreti
37
Covarianza e correlazione - I
Cov(x, y) = E
_
[x E(x)] [y E(y)]
_
= E(xy) E(x) E(y)
Condizione necessaria perch` e due variabili sia-
no statisticamente indipendenti ` e che la loro
covarianza sia nulla; in tal caso infatti
E(xy) = E(x)E(y)
La condizione non ` e sufciente: se ad esempio
y = x
2
ne risulta
Cov(x, y) = E(x
3
) E(x) E(x
2
)
nulla per tutte le distribuzioni simmetriche anche
se le variabili sono correlate.
Maurizio Loreti
38
Covarianza e correlazione - II
Per una combinazione lineare z = ax + by di variabili
casuali qualsiasi, per la covarianza vale la
2
z
= a
2
2
x
+ b
2
2
y
+ 2a b Cov(x, y)
Infatti, per valori medi nulli (E(x) = E(y) = 0),
E(z) = 0
2
z
= E(z
2
)
=
_
ik
P
ik
a
2
x
2
i
+ b
2
y
2
k
+ 2abx
i
y
k
_
= a
2
E(x
2
) + b
2
E(y
2
) + 2abE(xy)
= a
2
2
x
+ b
2
2
y
+ 2ab Cov(x, y)
che si generalizza immediatamente alla combinazione
lineare di due variabili a valor medio qualunque.
Maurizio Loreti
39
Covarianza e correlazione - III
Il coefciente di correlazione lineare ` e:
r = r
xy
=
Cov(x, y)
x

y
Adimensionale
Compreso tra 1 e +1; infatti, denendo
z =
y
x
x
y si ricava:
Var(z) =
2
y

2
x
+
2
x

2
y
2
x
y
Cov(x, y)
= 2
_
2
x

2
y

x
y
Cov(x, y)
_
0
da cui la tesi.
Per le combinazioni lineari, z = ax + by:
Var(ax + by) = a
2
2
x
+ b
2
2
y
+ 2a b r
x

y
Maurizio Loreti
40
Covarianza e correlazione - IV
Il coefciente di correlazione lineare vale 1 se le
due variabili sono legate da una relazione lineare:
y = ax + b
E(y) = a E(x) + b
Var(y) = a
2
Var(x)
E(xy) = E(ax
2
+ bx)
= a E(x
2
) + b E(x)
Cov(x, y) = E(xy) E(x) E(y)
= a
_
E(x
2
)
_
E(x)
_
2
_
= a Var(x)
r =
Cov(x, y)
_
Var(x) Var(y)
=
a
[a[
= 1
Non ` e necessariamente vero linverso; punti su una
retta parallela allasse x hanno r indenito (r =
0
0
)
pur essendo perfettamente allineati.
Se le variabili sono legate da una funzione non
lineare, non raggiunge i valori estremi 1
Maurizio Loreti
41
Il caso N-dimensionale - I
Densit` a di probabilit` a congiunta
f
X
_
Funzione di distribuzione
F
X
_
=
_
x
1
dx
1

_
x
N
dx
N
f
X
_
Funzioni marginali
Densit` a di probabilit` a condizionate
Indipendenza statistica di gruppi di variabili casuali
Funzione caratteristica
T
_
=
_
+
dx
1

_
+
dx
N
f
X
_
e
iTX
Cambiamento di variabili:
x
i
y
k
(x
1
, . . . , x
N
)
g
Y
_
= f
_
x
1
Y
_
, . . . , x
N
Y
_
_
X
Y
Maurizio Loreti
42
Il caso N-dimensionale - II
Per combinazioni lineari di variabili casuali
y =
N
_
k=1
a
i
x
i
risulta:
E(y) =
N
_
k=1
a
i
E(x
i
)
Var(y) =
N
_
k=1
a
2
i
Var(x
i
) +
_
i,k
i,=k
a
i
a
k
Cov(x
i
, x
k
)
= A
T
V
`
A
dove V
`
` e la matrice delle covarianze, di elementi
V
ij
= E
_
x
i

i
_
x
j

j
_
_
( ` e il vettore dei valori medi delle x
i
); V
`
` e simmetrica,
e inoltre
V
ii
= Var(x
i
) e V
ij
= Cov(x
i
, x
j
)
Maurizio Loreti
43
La distribuzione uniforme - I
_
_
f(x) = 0 x < a, x > b
f(x) =
1
b a
a x b
_
_
F(x) = 0 x < a
F(x) =
x a
b a
a x b
F(x) = 1 x > b
E(x) =
a + b
2
Var(x) =
(b a)
2
12
Maurizio Loreti
44
La distribuzione uniforme - II
M
x
(t) =
_
+
f(x) e
tx
dx
=
_
b
a
e
tx
b a
dx
=
1
t(b a)
[e
u
]
tb
ta
=
e
tb
e
ta
t(b a)
x
(t) =
e
itb
e
ita
it(b a)
Maurizio Loreti
45
La distribuzione uniforme - III
Esempio: il decadimento del
0
dP d d(cos ) d
Quindi cos e sono variabili casuali sta-
tisticamente indipendenti e con distribuzione
uniforme.
Applicazione: numeri casuali con distribuzione data:
Inversione della funzione di distribuzione;
Il metodo dei rigetti.
Maurizio Loreti
46
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
5 1
-
1
0
1
2
3
0
0
.
5 1
0
1
2
3
M
a
u
r
i
z
i
o
L
o
r
e
t
i
4
7
La distribuzione normale - I
f(x) N(x; , ) =
1
2
e
1
2
(
x
)
2
M
x
(t) =
_
+
e
tx
1
2
e
1
2
(
x
)
2
dx
=
e
t
2
_
+
e
t(x)
e
1
2
(
x
)
2
dx
=
e
t
2
_
+
e
_
2
t
2
2

(x
2
t)
2
2
2
_
dx
= e
_
t+
2
t
2
2
_ _
+
N(x; +
2
t, ) dx
= e
_
t+
2
t
2
2
_
x
(t) = e
_
it
2
t
2
2
_
Maurizio Loreti
48
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
-
5
-
3
-
1
1
3
5
M
a
u
r
i
z
i
o
L
o
r
e
t
i
4
9
La distribuzione normale - II
M
x
(t) = e
_
t+
2
t
2
2
_
M
x
(t) = e
t
M
x
(t) = e
2
t
2
2
d
dt
M
x
(t) = M
x
(t) ( +
2
t)
d
dt
M
x
(t) = M
x
(t)
2
t
d
2
dt
2
M
x
(t) = M
x
(t) (
4
t
2
+
2
)
E(x) =
1
=
dM
x
(t)
dt
t=0
=
Var(x) =
2
=
d
2
M
x
(t)
dt
2
t=0
=
2
Maurizio Loreti
50
La distribuzione normale - III
Per la distribuzione normale:
2k+1
= 0
2k
=
(2k)!
2
k
k!

2k
Per la variabile standardizzata, u =
x E(x)
:
E(u) = 0
Var(u) = 1
M
u
(t) = e
t
2
2
u
(t) = e
t
2
2
Maurizio Loreti
51
La distribuzione normale - IV
TEOREMA: combinazioni lineari di variabili casuali
normali statisticamente indipendenti tra loro seguono
anchesse la distribuzione normale.
y =
_
k
a
k
x
k
x
k
(t) = e
_
it
k
2
k
t
2
2
_
k
= a
k
x
k
k
(t) =
x
k
(a
k
t) = e
_
ita
k
a
2
k

2
k
t
2
2
_
y
(t) =
k
(t)
= e
_
it(
_
k
a
k
k)
t
2
2
(
_
k
a
2
k

2
k
)
_
= e
_
it
t
2
2
2
_
con
=
_
k
a
k

k
e
2
=
_
k
a
2
k
2
k
Maurizio Loreti
52
La distribuzione normale bidimensionale
In due dimensioni,
f(x, y) =
=
e
_
1
2(1r
2
)
_
(
x
x
x
)
2
2r
(x
x
)(y
y
)
x

y
+
_
y
y
y
_
2
__
2
x

y
1 r
2
In funzione delle variabili standardizzate
u =
x E(x)
x
e v =
y E(y)
y
f(u, v) =
e
1
2
u
2
2ruv+v
2
1r
2
2
1 r
2
r = 0 ` e condizione necessaria e sufciente perch` e
x ed y siano indipendenti.
Le distribuzioni marginali sono gaussiane:
_
_
_
g(x) = N(x;
x
,
x
)
h(y) = N(y;
y
,
y
)
Le densit` a condizionate sono anchesse gaussiane;
ad esempio, f(x[y = y
0
).
Maurizio Loreti
53
-3
-2
-1
0
1
2
3
-3 -2 -1 0 1 2 3
r = 0.8
Maurizio Loreti
54
-3
-2
-1
0
1
2
3
-3
-2
-1
0
1
2
3
0
0.25
0.5
0.75
Maurizio Loreti
55
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
2
5
0
.
5
-
5
-
4
-
3
-
2
-
1
0
1
2
3
4
5
S
e
z
i
o
n
e

a

y
=
1

-
-

f
(
x
,
1
)

N
(
0
.
8
,
0
.
6
)
0
0
.
2
5
0
.
5
-
5
-
4
-
3
-
2
-
1
0
1
2
3
4
5
S
e
z
i
o
n
e

a

y
=
2

-
-

f
(
x
,
2
)

N
(
1
.
6
,
0
.
6
)
M
a
u
r
i
z
i
o
L
o
r
e
t
i
5
6
La distribuzione normale N-dimensionale - I
Nel caso pi ` u generale la densit` a di probabilit` a di una
distribuzione Gaussiana N-dimensionale ` e
f(x
1
, x
2
, . . . , x
N
) = Ke
1
2
H(x
1
,x
2
,...,x
N
)
ove H ` e una forma quadratica nelle variabili
standardizzate
t
i
=
x
i
E(x
i
)
i
nella quale i coefcienti dei termini quadratici sono
tra loro tutti uguali; le t
i
generalmente non sono
indipendenti (e quindi H contiene anche i termini
rettangolari del tipo t
i
t
k
).
K ` e poi un fattore di normalizzazione che vale
K =
_

(2)
N
in cui ` e il determinante della matrice (simmetrica)
dei coefcienti della forma quadratica.
Maurizio Loreti
57
La distribuzione normale N-dimensionale - II
La integrabilit` a di f implica che le ipersuperci di
equazione H = cost. siano tutte al nito, e siano
quindi iperellissi nello spazio N-dimensionale dei
parametri.
Le funzioni di distribuzione marginali e condizionate
di qualsiasi sottoinsieme delle variabili sono ancora
normali.
Esiste sempre un cambiamento di variabili x
i
y
k
che cambia H nella forma canonica (senza termini
rettangolari); in tal caso
=
_
N
k=1
Var(y
k
)
_
1
f(y
1
, . . . , y
k
) =
=
1
_
N
_
k=1
[2Var(y
k
)]
e
1
2
N
_
k=1
[y
k
E(y
k
)]
2
Var(y
k
)
Le y
k
sono statisticamente indipendenti (e
normali).
Maurizio Loreti
58
La distribuzione di Cauchy (o di BreitWigner) - I
f(x; , d) =
1
d
1
1 +
x
d
_
2
(d > 0)
F(x; , d) =
1
2
+
1
arctan
_
x
d
_
Nessuno dei momenti esiste (nemmeno la media)
` e la mediana della distribuzione, e d la larghezza
a met` a altezza (FWHM)
x
(t; , d) = e
(it[t[ d)
Variabile standardizzata:
u =
x
d
== x = ud +
f(u) =
1
(1 + u
2
)
F(u) =
1
2
+
1
arctan u
u
(t) = e
[t[
Maurizio Loreti
59
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
.
4
-
1
0
-
8
-
6
-
4
-
2
0
2
4
6
8
1
0
M
a
u
r
i
z
i
o
L
o
r
e
t
i
6
0
La distribuzione di Cauchy (o di BreitWigner) - II
La distribuzione troncata ammette i momenti:
limitandoci alla variabile standardizzata,
f(u[ K u K) =
=
_
_
0 [u[ > K
1
2 arctan K
1
(1 + u
2
)
[u[ K
(discontinua in u = K);
E(u[ K u K) = 0
Var(u[ K u K) =
K
arctan K
1
Maurizio Loreti
61
La distribuzione di Cauchy (o di BreitWigner) - III
Se le x
k
sono N variabili casuali indipendenti che
seguono la distribuzione di Cauchy con mediana
k
e
FWHM d
k
, una loro generica combinazione lineare
y =
N
_
k=1
a
k
x
k
segue la stessa distribuzione. Infatti
x
k
(t) = e
i
k
t[t[ d
k
e, denendo
k
= a
k
x
k
,
k
(t) =
x
k
(a
k
t) = e
ia
k
k
t[t[[a
k
[ d
k
y
(t) =
N
k=1
k
(t) = e
i
y
t[t[ d
y
ove si ` e posto
y
=
N
_
k=1
a
k
k
e d
y
=
N
_
k=1
[a
k
[ d
k
Maurizio Loreti
62
Rapporto tra due variabili indipendenti
Consideriamo il rapporto tra due variabili casuali
statisticamente indipendenti, supponendo che la
seconda non sia nulla:
_
_
x f(x)
y g(y) y ,= 0
_
_
u =
x
y
v = y
_
_
x = uv
y = v
f(x, y) = f(x) g(y)
(u, v) = f(x) g(y)
(x, y)
(u, v)
(x, y)
(u, v)
=
_
_
_
_
_
_
v u
0 1
_
_
_
_
_
_
(u, v) = f(uv) g(v) [v[
Maurizio Loreti
63
La distribuzione di Cauchy (o di BreitWigner) - IV
Il rapporto tra due variabili casuali normali stati-
sticamente indipendenti ` e una variabile che segue la
distribuzione di Cauchy:
f(x), g(y) N(0, 1) (y ,= 0)
(u, v) =
1
2
e
1
2
u
2
v
2
e
1
2
v
2
[v[
dP
du
= 2
_
+
0
(u, v) dv
=
1
_
+
0
e
1
2
v
2
(1+u
2
)
v dv
t =
1
2
v
2
(1 + u
2
) dt = (1 + u
2
) v dv
dP
du
=
1
(1 + u
2
)
_
+
0
e
t
dt
=
1
(1 + u
2
)
_
e
t
_
+
0
=
1
(1 + u
2
)
Maurizio Loreti
64
La distribuzione log-normale - I
y N(y; , )
g(y) =
1
2
e
1
2
2
(y)
2
x = e
y
== y = ln x
(corrispondenza biunivoca); x > 0.
f(x) =
1
2
1
x
e
(ln x)
2
2
2
Il prodotto di due variabili log-normali ed
indipendenti ` e ancora log-normale.
Maurizio Loreti
65
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
0
.
8
0
1
2
3
4
5
6
7
8
9
1
0

=

0
.
2

=

0
.
3

=

0
.
5

=

1
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
0
.
8
0
1
2
3
4
5
6
7
8
9
1
0

=

0

=

1

=

2

=

1
M
a
u
r
i
z
i
o
L
o
r
e
t
i
6
6
La distribuzione log-normale - II
y k
2
_
2
2
2
k
1
2
k
2
2
=
(y )
2
2
2
ky
k
=
_
+
0
x
k
f(x) dx
=
_
+
e
ky
g(y) dy
=
_
+
2
e
_
(y)
2
2
2
ky
_
dy
= e
(k+
1
2
k
2
2
)
_
+
2
e
(
yk
2
)
2
2
2
dy
= e
(k+
1
2
k
2
2
)
E(x)
1
= e
_
+
2
2
_
E(x
2
)
2
= e
(2+2
2
)
Var(x) =
2
(
1
)
2
= e
(2+
2
)
_
e
2
1
_
Maurizio Loreti
67
La distribuzione binomiale (o di Bernoulli) - I
Probabilit` a p costante su N prove (prove
indipendenti):
Pr(x; N) =
N!
x! (N x)!
p
x
q
Nx
Variabile di Bernoulli, y:
E(y) = p
E(y
2
) = p
Var(y) = pq
x =
N
_
i=1
y
i

_
_
E(x) = Np
Var(x) = Np q
Maurizio Loreti
68
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
1
0
2
0
3
0
4
0
N
=
5
0
,

p
=
0
.
0
5
N
=
5
0
,

p
=
0
.
2
N
=
5
0
,

p
=
0
.
5
M
a
u
r
i
z
i
o
L
o
r
e
t
i
6
9
La distribuzione binomiale (o di Bernoulli) - II
Funzione generatrice dei momenti:
M
x
(t) = E
e
tx
_
=
N
_
x=0
e
tx
_
N
x
_
p
x
q
Nx
=
N
_
x=0
_
N
x
_
pe
t
_
x
q
Nx
=
pe
t
+ q
_
N
o anche, ricordando che q = 1 p,
M
x
(t) =
_
1 + p
e
t
1
__
N
Per la variabile standardizzata
z =
x E(x)
x
=
x Np
_
Np q
M
z
(t) = e
Np
Np q
t
_
1 + p
_
e
t
Np q
1
__
N
Maurizio Loreti
70
La distribuzione binomiale (o di Bernoulli) - III
ln M
z
(t) =
=
Np
_
Np q
t + N ln
_
1 + p
_
e
t
Np q
1
__
Sviluppando in serie di MacLaurin prima
ln(1 + x) = x
x
2
2
+
x
3
3
+
e poi
e
x
= 1 + x +
x
2
2!
+
x
3
3!
+
e svolgendo le potenze, si ottiene:
ln M
z
(t) =
1
2
t
2
+ C(t
3
N
1
2
)
Per cui
lim
N
M
z
(t) = e
t
2
2
e la distribuzione binomiale tende asintoticamente ad
una distribuzione normale con la stessa media e la
stessa varianza.
Maurizio Loreti
71
La distribuzione binomiale (o di Bernoulli) - IV
Per la frequenza relativa f =
x
N
nelle N prove:
E(f) =
E(x)
N
= p
Var(f) =
Var(x)
N
2
=
p q
N
Applicazione: gas perfetto
E (N
1
) = Np p =
V
1
V
1
+ V
2
N
1
=
_
Np q
N
1
N
1
_
q
Np
Maurizio Loreti
72
Esercizio
Ci sono 8 dottorandi, ognuno dei quali passa in
Dipartimento il 50% del proprio tempo; quante
scrivanie servono per attrezzare unaula di studio
riservata ai dottorandi, nellipotesi che ognuno dei
presenti possa trovare un posto disponibile per
almeno il 90% del tempo?
Maurizio Loreti
73
Soluzione
p = 0.5; q = 1 p = 0.5. La probabilit` a che
in un gruppo di 8 dottorandi N siano presenti
contemporaneamente ` e data dalla distribuzione di
Bernoulli: P (N) = C
8
N
p
N
q
8N
= C
8
N
0.5
8
. Quello che si
chiede ` e di calcolare il minimo intero N per cui risulti
_
N
i=0
P (i) 0.9
N P (N)
N
_
i=0
P (i)
0 0.004 0.004
1 0.031 0.035
2 0.109 0.145
3 0.219 0.363
4 0.273 0.637
5 0.219 0.855
6 0.109 0.965
7 0.031 0.996
8 0.004 1.000
Servono almeno 6 scrivanie (nel qual caso i dottorandi
presenti troveranno posto nel 96.5% del tempo).
Maurizio Loreti
74
La distribuzione binomiale (o di Bernoulli) - V
Esempio: rapporto di asimmetria, R
R =
F B
F + B
=
F B
N
=
2F
N
1
F =
N(R + 1)
2
Pr(F) =
_
N
F
_
p
F
(1 p)
NF
E(F) = Np
Var(F) = Np (1 p)
Pr(R) =
_
N
N(R+1)
2
_
p
N(R+1)
2
(1 p)
N
N(R+1)
2
E(R) =
2
N
E(F) 1 = 2p 1
Var(R) =
4
N
2
Var(F) =
4p (1 p)
N
Se il numero di eventi nel campione ` e elevato,
p
F
N
q
B
N
E(R) 2
F
N
1 Var(R) 4
FB
N
3
Maurizio Loreti
75
La distribuzione multinomiale
Pr(x
1
, x
2
, . . . , x
M
) =
=
N!
x
1
! x
2
! x
M
!
p
x
1
1
p
x
2
2
p
x
M
M
con
M
_
i=1
x
i
= N
M
_
i=1
p
i
= 1
Risulta:
E(x
i
) = Np
i
i = 1, . . . N
Var(x
i
) = Np
i
(1 p
i
) i = 1, . . . N
Cov(x
i
, x
j
) = Np
i
p
j
i ,= j
Esempio: eventi nei bins di un istogramma
(la frequenza assoluta in due bins ` e correlata
negativamente)
Maurizio Loreti
76
La distribuzione di Poisson - I
Ipotesi:
Pr(1; dt) = dt
Indipendenza statistica
La probabilit` a che pi ` u di un evento si verichi in
un tempo dt ` e innitesima di ordine superiore
a dt
Eventi rari su larga base statistica
P (x; t + dt) =
= P (x 1; t) dt + P (x; t) (1 dt)
d
dt
P (x; t) = P (x; t) + P (x 1; t)
d
dt
P (0; t) = P (0; t)
P (0; t) = e
t
P (x; t) =
(t)
x
x!
e
t
P (x; ) =

x
x!
e
Maurizio Loreti
77
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
1
0
2
0
3
0
4
0
5
0
6
0
7
0
8
0
=
2
=
2
5
=
5
0
M
a
u
r
i
z
i
o
L
o
r
e
t
i
7
8
La distribuzione di Poisson - II
M
x
(t) = E
e
tx
_
=
_
x=0
e
tx

x
x!
e
= e
_
x=0
e
t
_
x
x!
= e
e
e
t
= e
(e
t
1)
E(x) =
Var(x) =
Tende asintoticamente ad una distribuzione
normale
Esempi: decadimenti; urti nei gas; numero di
particelle per burst; numero di interazioni per
unit` a di lunghezza; ionizzazione, bremsstrahlung,
etc. delle particelle; conteggio di cellule; gocce di
pioggia; incidenti stradali; . . .
Maurizio Loreti
79
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
N
N
p
0
N
p

=
G
a
u
s
s
P
o
i
s
s
o
n
B
e
r
n
o
u
l
l
i
M
a
u
r
i
z
i
o
L
o
r
e
t
i
8
0
La distribuzione di Poisson - III
La somma z = x + y di due variabili di Poisson
indipendenti ` e ancora distribuita secondo Poisson:
M
z
(t) = e
(e
t
1)
e
(e
t
1)
= e
(+)(e
t
1)
Il valor medio di z ` e = + .
Non vale per la differenza (che pu` o essere
negativa);
Vale per la somma di un numero qualsiasi di
variabili di Poisson tutte indipendenti.
Maurizio Loreti
81
La distribuzione di Poisson - IV
Applicazione: esperimenti negativi
= N
0
(1 e
) N
0
t
Pr(0) =

0
0!
e
= e
e
N
0
t
Pr(0) > CL >

N
0
t
ln(CL)
Maurizio Loreti
82
La distribuzione esponenziale - I
Sia la variabile casuale , intervallo di tempo tra due
eventi successivi il cui numero x segua la distribuzione
di Poisson:
Pr(x; t) =
(t)
x
x!
e
t
Visto che nel tempo non si vericano eventi,
Pr( > d) Pr(0; d) = e
d
quindi la funzione di distribuzione di ` e
F(d) = Pr( d) = 1 e
d
e la funzione di frequenza ` e esponenziale:
f() =
d F()
d
f() = e
Si pu` o trovare, volendo, la funzione caratteristica;

che vale
(t) =

it
Maurizio Loreti
83
La distribuzione esponenziale - II
I primi due momenti della distribuzione esponenziale
si possono trovare o integrando direttamente f(), o
derivando successivamente
(t):
d
(t)
dt
=
d
dt
_

it
_
=
i
( it)
2
d
(t)
dt
t=0
=
i
= i E()
E() =
1
d
2
(t)
dt
2
=
i 2( it)(i)
( it)
4
=
2
( it)
3
d
2
(t)
dt
2
t=0
=
2
2
= i
2
E(
2
)
E(
2
) =
2
2
Var() = E(
2
)
_
E()
_
2
=
1
2
Maurizio Loreti
84
La distribuzione esponenziale - III
Se la variabile casuale t segue la distribuzione
esponenziale, calcoliamo la probabilit` a che t sia
maggiore di t
0
+ t condizionata dal sapere che t ` e
sicuramente maggiore di t
0
:
Pr
t > t
0
+ t[t > t
0
_
=
Pr(t > t
0
+ t)
Pr(t > t
0
)
=
_
+
t
0
+t
e
t
dt
_
+
t
0
e
t
dt
=
_
e
t
_
+
t
0
+t
[e
t
]
+
t
0
=
e
(t
0
+t)
e
t
0
= e
t
= Pr(t > t)
La distribuzione esponenziale non ricorda la storia
precedente: il presentarsi dellevento nel tempo t
non dipende da t
0
.
Maurizio Loreti
85
Esercizio
Ad un incrocio stradale passa in media unauto ogni
15 secondi; quale ` e la probabilit` a P che tra due
passaggi successivi intercorra un tempo compreso
tra 12 e 16 secondi?
Maurizio Loreti
86
Soluzione
Soluzione I
P =
_
i=1
P (0; 12) P (i; 4)
= P (0; 12)
_
i=1
P (i; 4)
= P (0; 12)
_
1 P (0; 4)
_
= e
12
15
_
1 e
4
15
_
0.4493 [1 0.7659]
10.52%
Soluzione II
f() = e
P =
_
t
2
t
1
f() d =
_
e
_
t
2
t
1
= e
t
1
e
t
2
=
1
15
t
1
= 12
t
2
= 16
_
_
P 10.52%
Maurizio Loreti
87
La distribuzione di Poisson - V
Esempio: rapporto di asimmetria. Nellesempio
precedente abbiamo supposto N dato; invece N ` e
una variabile casuale distribuita secondo Poisson con
media . Indicando con p la probabilit` a Pr(F),
Pr(F, N) =
=

N
N!
e
N!
F! (N F)!
p
F
(1 p)
NF
Ponendo B = N F e q = 1 p,
Pr(F, B) = e
(p)
F
(q)
B
F! B!
=
(p)
F
F!
e
p
(q)
B
B!
e
q
che ` e il prodotto di due funzioni di frequenza di
Poisson.
La composizione di binomiale e Poissoniana equivale al
prodotto di due Poissoniane: il numero di decadimenti
segue la statistica di Poisson; la scelta dello stato
nale quella binomiale; e tutto avviene come se i
decadimenti dei due tipi si vericassero separata-
mente ed indipendentemente secondo la statistica di
Poisson.
Maurizio Loreti
88
La distribuzione di Poisson - VI
Accertato che F e B sono variabili indipendenti che
seguono la statistica di Poisson, per il rapporto
di asimmetria asintoticamente (quindi grandi N) si
ricava:
Var(F) = E(F) F
Var(B) = E(B) B
R =
F B
F + B

E(F) E(B)
E(F) + E(B)
+
+
R
F
_
F E(F)
_
+
R
B
_
B E(B)
_
E(R)
E(F) E(B)
E(F) + E(B)

2F
N
1
Var(R)
_
R
F
_
2
Var(F) +
_
R
B
_
2
Var(B)
=
4
(F + B)
4
_
B
2
Var(F) + F
2
Var(B)
_
=
4FB
(F + B)
3
= 4
FB
N
3
e le cose non cambiano rispetto alla precedente
analisi.
Maurizio Loreti
89
Distribuzione composta di Poisson I
La funzione caratteristica della distribuzione di
Poisson pu` o essere scritta nelle due forme
x
(t) = e
(e
it
1)
e
x
(z) = e
(z1)
Riprendiamo la somma di un numero casuale di
variabili casuali aventi tutte la stessa distribuzione,
S =
N
_
i=1
x
i
Se sia N che ognuna delle x seguono la distribuzione
di Poisson, con medie e rispettivamente,
_
N
(z) = e
(z1)
x
(z) = e
(z1)

S
(z) = e
[e
(z1)
1]
(distribuzione composta di Poisson).
Maurizio Loreti
90
Distribuzione composta di Poisson II
Per la distribuzione composta di Poisson si conosce
dunque la funzione caratteristica di variabile reale
S
(t), che vale
S
(t) = e
_
e
(
e
it
1
)
1
_
Da essa si ricava:
d
S
(t)
dt
=
S
(t) e
(e
it
1)
e
it
i
d
S
(t)
dt
t=0
= i
E(S) =
e, similmente, si potrebbe ottenere
Var(S) = (1 + )
e
Pr(S) =
_
N=0
_
(N)
S
S!
e
N

N
N!
e
_
Maurizio Loreti
91
Esempio: losservazione di un quark isolato I
1. McCusker and Cairns
Evidence of quarks in air-shower cores
Phys. Rev. Lett. 23 (1969), pagg. 658659
2. Adair and Kasha
Analysis of some results of quark searches
Phys. Rev. Lett. 23 (1969), pagg. 13551358
3. Eadie, Drijard, James, Roos e Sadoulet
Statistical methods in experimental physics
pag. 53
In una camera a nebbia il numero medio di gocce
generate per unit` a di lunghezza da tracce di un certo
tipo ` e = 229; ` e stata osservata una traccia con
n = 110 gocce per unit` a di lunghezza sulle 55000
esaminate (f = 1/55000 2 10
5
).
Losservazione
`
e signicativa?
Maurizio Loreti
92
Esempio: losservazione di un quark isolato II
Prima interpretazione
Il processo di generazione delle gocce segue la
statistica di Poisson.
La probabilit` a di osservare una traccia con 110 (o
meno) gocce per unit` a di lunghezza ` e quindi
Pr(n 110) =
110
_
k=0
229
k
k!
e
229
1.6 10
18
13 ordini di grandezza pi ` u piccola della frequenza
sperimentale.
Maurizio Loreti
93
Esempio: losservazione di un quark isolato III
Seconda interpretazione
In ogni scattering elementare vengono prodotte in
media = 4 gocce.
Il numero medio di scattering elementari per unit` a
di lunghezza ` e 229/4 = 57.25.
Levento in questione ne ha 110/4 = 27.5.
La probabilit` a di causare meno di 28 scattering
elementari per unit` a di lunghezza vale
Pr(n 110)
27
_
k=0
57.25
k
k!
e
57.25
6.7 10
6
pi ` u di 33 volte superiore alla frequenza osservata.
Maurizio Loreti
94
Esempio: losservazione di un quark isolato IV
Terza (e ultima) interpretazione
Il numero s di scattering elementari per unit` a di
lunghezza ` e una variabile casuale che segue la
statistica di Poisson con media = 57.25:
Pr(s) P (s; ) =

s
s!
e
Il numero g di gocce prodotte nel singolo scatte-

ring segue anchesso la statistica di Poisson ed
ha probabilit` a P (g; ), con media = 4.
La distribuzione del numero k di gocce per unit` a di
lunghezza quindi segue una distribuzione composta
di Poisson.
Pr(k) =
_
s=0
_
(s)
k
k!
e
s

s
s!
e
_
Pr(k 110) =
110
_
k=0
Pr(k) 4.7 10
5
dello stesso ordine di grandezza della frequenza
osservata.
Maurizio Loreti
95
La distribuzione di Poisson - VII
Ipotesi: un processo sico segue la distribuzione di
Poisson; il valor medio x della distribuzione ` e noto
con un certo errore che supponiamo normale
x N(x; , )
Qual ` e la probabilit` a di osservare 0 eventi?
Maurizio Loreti
96
La distribuzione di Poisson - VIII
Pr
x
_
x, x + dx
__
=
1
2
e
1
2
(x)
2
2
Pr(0[x) = e
x
Pr(0; , ) =
_
+
e
x
N(x; , ) dx
M
x
(1)
= e
_
+
2
2
_
Insomma:
Pr(0; , ) = e
2
2
Pu` o essere maggiore di 1 !!!

Maurizio Loreti
97
La distribuzione di Poisson - IX
Eventi rari in assenza di fondo: la probabilit` a di
un segnale s ` e:
Pr(s) =
S
s
s!
e
S
= P (s; S)
Se S ` e ignoto e sono stati osservati N eventi, si
pu` o dare un limite su S calcolando il valore S
u
per il quale la probabilit` a di osservare un numero
di eventi non superiore a N vale una quantit` a
predeterminata: se
N
_
x=0
P (x; S
u
) =
diremo di poter affermare che S S
u
con un
livello di condenza
C
L
=
intendendo con questo che, se risulta S S
u
,
in una frazione almeno pari ad di esperimenti
analoghi al nostro otterremmo al massimo N eventi.
Maurizio Loreti
98
La distribuzione di Poisson - X
Se il fondo ` e presente, se ` e indipendente dal
segnale e se segue la distribuzione di Poisson
con valore medio noto F, gi ` a sappiamo che la
probabilit` a di osservare N eventi tra fondo e
segnale segue la distribuzione di Poisson con
valore medio F + S:
Pr(N) P (N; F + S) =
(F + S)
N
N!
e
(F+S)
Se sono stati realmente osservati N eventi, si pu` o
determinare un limite superiore su S calcolando il
valore S
u
per il quale la probabilit` a di osservare
un numero di eventi (tra fondo e segnale) non
superiore a N e condizionato allavere ottenuto un
numero di eventi di fondo che non pu` o superare N
vale una quantit` a predeterminata (PDG):
N
_
n=0
P (n; F + S
u
)
N
_
f=0
P (f; F)
= S S
u
(CL = )
Maurizio Loreti
99
Expected background (events)
9
0
%

c
o
n
d
e
n
c
e

c
o
e
f
c
i
e
n
t
u
p
p
e
r

l
i
m
i
t

o
n

s
i
g
n
a
l
0 5 10 15 20
0
5
10
15
0
1
2
3
4
5
6
7
8
9
10 events observed
Limite superiore (per un livello di condenza del 90%) sugli eventi di segnale,
in funzione del numero atteso di eventi di fondo.
Maurizio Loreti
100
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
L
a
d
i
s
t
r
i
b
u
z
i
o
n
e
d
i
P
o
i
s
s
o
n
-
X
I
I
n
p
r
e
s
e
n
z
a
d
i
i
n
d
e
t
e
r
m
i
n
a
z
i
o
n
e
G
a
u
s
s
i
a
n
a
d
e
l
f
o
n
d
o
,
F
N
(
F
;
F
,
F
)
c
o
n
F
:
N
_
n
=
0
_
d
F
P
(
n
;
S
u
+
F
)
e
1 2
_
F
F
_
2
N
_
f
=
0
_
d
F
P
(
f
;
F
)
e
1 2
_
F
F
_
2
=
S
u
(
C
L
=
)
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
0
1
Teoria del campionamento casuale - I
Ipotesi: popolazione innita (o reinserimento); in-
dipendenza statistica delle estrazioni; funzione di
frequenza qualsiasi; esistenza della media.
f(X) = f(x
1
) f(x
2
) f(x
N
)
x ` e essa stessa una variabile casuale:
x =
N
_
k=1
x
k
N
x
(t) =
_
x
_
t
N
__
N
=
_
x
(t
)
_
N
d
x
(t)
dt
= N
_
x
(t
)
_
N1
d
x
(t
)
dt

1
N
x
(t) =
_
+
e
itx
f(x) dx
x
(0) 1
d
x
(t)
dt
t=0
=
d
x
(t
)
dt
=0
E( x) = E(x)
Maurizio Loreti
102
Teoria del campionamento casuale - II
Ipotesi aggiuntiva: esistenza della varianza.
d
2
x
(t)
dt
2
=
= (N 1)
_
x
(t
)
_
N2
_
d
x
(t
)
dt
_
2
1
N
+
+
_
x
(t
)
_
N1
d
2
x
(t
)
dt
2

1
N
E( x
2
) =
N 1
N
_
E(x)
_
2
+
1
N
E(x
2
)
Var( x) = E( x
2
)
_
E( x)
_
2
=
N 1
N
_
E(x)
_
2
+
1
N
E(x
2
)
_
E(x)
_
2
=
1
N
E(x
2
)
1
N
_
E(x)
_
2
Var( x) =
Var(x)
N
Maurizio Loreti
103
Il teorema di

Cebi sef
Applicando la diseguaglianza di Bienaym e
Cebi sef
Pr
_
[x E(x)[
_

Var(x)
2
alla media del campione x si ottiene:
Pr
_
[ x E(x)[
_

Var(x)
N
2
che implica
lim
N
x = E(x)
(teorema di

Cebi sef); lunica ipotesi ` e lesistenza dei
primi due momenti (media e varianza).
Maurizio Loreti
104
La legge dei grandi numeri
Sia un evento casuale A qualsiasi, e y la variabile di
Bernoulli connessa ad una prova:
f =
1
N
N
_
i=1
y
i
Gi ` a sappiamo come risulti
E(y) = p
Applicando alla y il teorema di

Cebi sef, ne discende
come corollario il Teorema di Bernoulli, o legge dei
grandi numeri: la frequenza di un evento casuale
qualsiasi (per cui esista media e varianza) converge
statisticamente alla sua probabilit` a.
Maurizio Loreti
105
Teoria del campionamento casuale - III
Per la distribuzione di Cauchy,
x
(t) = e
(it[t[ d)
x
(t) =
_
x
_
t
N
__
N
=
_
e
_
i
t
N
[t[
N
d
__
N
= e
(it[t[ d)

x
(t)
La media del campione ` e distribuita come la singola
misura; effettuando pi ` u di una misura non si
guadagna alcuna informazione (dalla media del
campione).
In casi come questo si pu` o usare la mediana del
campione, che, si pu` o dimostrare, ha distribuzione
asintoticamente normale con media e varianza
Var(x) =
1
4N[f(x; , d)]
2
e per la quale, ovviamente,
lim
N
Var(x) = 0
Maurizio Loreti
106
Teoria del campionamento casuale - IV
La varianza del campione ` e
s
2
=
1
N
N
_
i=1
(x
i
x)
2
Si prova facilmente che risulta
1
N
N
_
i=1
_
x
i
E(x)
_
2
= s
2
+
_
x E(x)
_
2
Prendendo i valori medi
1
N
N
_
i=1
_
E
_
x
i
E(x)
_
2
_
=
= E(s
2
) + E
_
_
x E(x)
_
2
_
e quindi
Var(x) = E(s
2
) + Var( x) = E(s
2
) +
Var(x)
N
E(s
2
) =
N 1
N
Var(x)
N
Var(x)
Maurizio Loreti
107
Il teorema del limite centrale - I
Siano N variabili indipendenti provenienti dalla stessa
popolazione, avente funzione di frequenza qualsiasi
purch` e dotata di media e di varianza
2
; la
funzione di frequenza della media aritmetica del
campione x ` e sotto queste ipotesi asintoticamente
normale con media e varianza
2
/N.
S =
N
_
k=1
x
k

S
(t) =
_
x
(t)
_
N
E(S) = N Var(S) = N
2
Passando agli scarti dalla media, z = x :
z
(t) = e
it
x
(t)
Se esistono tutti i momenti (restrittivo!)
z
(t) =
_
k=0
(it)
k
k!

k
= 1 + 0
1
2
t
2
2
+ C(t
3
)
Maurizio Loreti
108
Il teorema del limite centrale - II
La variabile standardizzata
y =
S E(S)
S
=
1
N
S
N
N
ha funzione caratteristica
y
(t) = e
i t
N
N

S
_
t
N
_
= e
i t
N
N
_
x
_
t
N
__
N
=
_
e
i
t
N

x
_
t
N
__
N
=
_
z
_
t
N
__
N
=
_
1
1
2
t
2
N
2

2
+ C
_
t
3
N
3
2
__
N
=
_
1
t
2
2N
+ C
_
N
3
2
_
_
N
Maurizio Loreti
109
Il teorema del limite centrale - III
Sfruttando il limite notevole
lim
x+
_
1 +
k
x
_
x
= e
k
si ottiene inne
lim
N+
y
(t) = e
t
2
2
La y ` e asintoticamente normale con media 0 e
varianza 1;
La S ` e asintoticamente normale con media N e
varianza N
2
;
La x ` e asintoticamente normale con media e
varianza

2
N
.
Distribuzione asintotica delle medie dei campioni
Poor mans Gaussian random numbers generator
Il prodotto di molte variabili casuali indipendenti ` e
asintoticamente log-normale.
Maurizio Loreti
110
Stime - I
Sia
x f(x; )
con parametro di valor vero (incognito)
. Si
denisce come funzione di stima (o, brevemente,
stima) una funzione che permetta di attribuire un
valore al parametro a partire da N valori misurati
X:
= (X)
` e una variabile casuale, quindi si possono anche
per essa denire media e varianza.
Maurizio Loreti
111
Stime - II
Propriet` a delle stime
Stime consistenti:
lim
N
=
Stime indistorte:
E() =
Stime efcienti:
Concetto relativo
Il teorema di Cram erRao:
Limite superiore per lefcienza delle stime
Condizioni per lesistenza di una stima di
efcienza massima
Stime sufcienti: in generale
f(
1
,
2
, . . . ,
M
;
) =
= f
M
(
1
;
) (
2
,
3
, . . . ,
M
;
[
1
)
La stima ` e sufciente se non dipende da
.
Maurizio Loreti
112
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
*
S
t
i
m
a

c
o
n
s
i
s
t
e
n
t
e
S t i m a i m p a r z i a l e
*
S
t
i
m
a

i
n
c
o
n
s
i
s
t
e
n
t
e
*
S t i m a d e v i a t a
*
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
1
3
Stime - III
Funzione di verosimiglianza (o di likelihood):
[(X; ) =
N
i=1
f(x
i
; )
Signicato della funzione di verosimiglianza
Stima di massima verosimiglianza,

:
E sempre asintoticamente consistente.
E asintoticamente normale.
E sempre, asintoticamente, la stima pi ` u
efciente.
Se esiste una stima sufciente, essa pu` o
essere espressa come funzione della sola

.
Maurizio Loreti
114
Stime - IV
E spesso preferibile trovare il massimo del
logaritmo della funzione di verosimiglianza, ln([):
ln([) =
N
_
i=1
ln f(x
i
; )
La normalit` a (asintotica) di

implica che la sua
varianza sia approssimativamente data da
Var(
) =
1
d
2
(ln [)
d
2
Maurizio Loreti
115
La stima di massima verosimiglianza
E asintoticamente
consistente: se
f(x; ) ` e continua;
f(x; ) ` e dotata di derivata prima e seconda
rispetto al parametro;
se
_
dx
1
dx
2
dx
N
commuta con

(ovvero
se il dominio di denizione della x non dipende
dal parametro).
normale: se
esistono i primi due momenti della f.
di massima efcienza:
sotto le stesse ipotesi necessarie per la
consistenza.
Maurizio Loreti
116
Un esempio di stima sufciente - I
Sia un campione di N determinazioni indipendenti x
i
di una variabile distribuita secondo Poisson:
Pr(x; ) =

x
x!
e
Pr(x
1
, x
2
, . . . , x
N
) =
=

x
1
x
1
!
e

x
2
x
2
!
e

x
N
x
N
!
e
=

_
i
x
i
e
N
x
1
! x
2
! x
N
!

(N x)!
(N x)!
=

N x
(N x)!
e
N
(N x)!
x
1
! x
2
! x
N
!

N
N x
N
N x
=
_
(N)
N x
(N x)!
e
N
__
(N x)!
x
1
! x
2
! x
N
!
1
N
N x
_
Il primo termine ` e la probabilit` a che la variabile
S =
N
_
i=1
x
i
= N x
abbia un certo valore; Pr(S) segue la statistica di
Poisson (come noto). Si osservi che, essendo noto
N, Pr(S) determina univocamente Pr( x).
Maurizio Loreti
117
Un esempio di stima sufciente - II
Il secondo termine deve allora essere la probabilit` a
che i dati osservati valgano x
1
, x
2
, . . . , x
N
condizio-
nata allavere la loro somma il valore S (o, il che
` e equivalente, condizionata allavere la loro media
il valore x). A posteriori si vede che la statistica
seguita ` e una multinomiale in cui i vari casi sono
tutti equiprobabili: p
1
= p
2
= = p
N
=
1
N
.
Pr(x
1
, x
2
, . . . , x
N
; )
Pr( x, x
1
, x
2
, . . . , x
N
; )
= Pr( x; ) Pr(x
1
, x
2
, . . . , x
N
; [ x)
Il secondo termine non dipende da ; qualunque
sia x, una volta noto il suo valore le x
i
sono
distribuite allo stesso modo (sono equiprobabili).
Quindi x ` e una stima sufciente di .
Maurizio Loreti
118
Un esempio di stima sufciente - III
x riassume la totalit` a delle informazioni contenute
nei dati; non ha alcuna importanza quanto valgano le
singole x
i
: una volta che se ne conosca la somma (o
il valor medio) questo ` e tutto quello che occorre per
stimare .
In effetti, se la densit` a di probabilit` a delle x
i
condizionata dal valore di x non dipende dal pa-
rametro, questo implica che qualunque funzione dei
dati ha densit` a (condizionata) che gode della stessa
propriet` a.
Teorema
a
:

` e una stima sufciente di se e solo
se la funzione di verosimiglianza ` e fattorizzabile nella
forma
[(x
1
, . . . , x
N
; ) = f(
, ) (x
1
, . . . , x
N
)
a
Eadie, Drijard, James, Roos, Sadoulet: Statistical methods in
Experimental Physics, Pag. 96.
Maurizio Loreti
119
Il teorema di Cram er-Rao I
Se
f(x; ) ` e denita in una regione dellasse x
indipendente da ;
esiste ovunque
(ln f)
ed esiste nito il valor

medio del suo quadrato, E
_
_
(ln f)
_
2
_
allora una qualsiasi stima imparziale di ha
varianza che non pu` o essere inferiore al limite di
Cram erRao:
Var(
)
1
N E
_
_
(ln f)
_
2
_
Maurizio Loreti
120
Il teorema di Cram er-Rao II
Il segno di uguaglianza vale se e solo se esiste una
funzione R() del solo parametro per la quale risulti
(ln [)
=
N
_
i=1
(ln f)
(x
1
, x
2
, . . . , x
N
)
R()
e, in tal caso
la stima di minima varianza rende massima la
funzione di verosimiglianza;
questa varianza minima vale R().
La condizione ` e restrittiva, e si pu` o dimostrare come
implichi che la f(x; ) sia di tipo esponenziale.
Maurizio Loreti
121
Esempio: stima del valor medio di una
popolazione normale di varianza nota
f(x
i
; ) =
1
2
e
1
2
2
(x
i
)
2
ln f = ln
1
2
ln(2)
1
2
2
(x
i
)
2
ln [ = Nln
N
2
ln(2)
1
2
2
N
_
i=1
(x
i
)
2
d (ln [)
d
=
1
2
N
_
i=1
(x
i
) =
N
2
( x )
d
2
(ln [)
d
2
=
N
2
< 0
La stima di massima verosimiglianza ` e la media
del campione, = x;
essa ` e (gi ` a lo sapevamo) consistente ed imparziale;
essa ` e (per il teorema di Cram erRao) la stima
avente la minima varianza, che vale
Var( ) =
Var(x)
N
=

2
N
= R()
e quindi la stima di massima efcienza possibile;
Inoltre x ` e una stima sufciente di .
Maurizio Loreti
122
Esempio: stima della vita media - I
Nel processo di decadimento di una particella insta-
bile, indichiamo con lincognita vita media e con t i
tempi (propri) di decadimento osservati, che seguono
la distribuzione esponenziale:
f(t; ) =
1
_
E(t) =
Var(t) =
2
Ammettendo per losservazione una efcienza unitaria,
[ =
N
k=1
f(t
k
; ) =
1
N
e
_
k
t
k
ln([) = Nln
1
N
_
k=1
t
k
= N
_
+ ln
_
d ln([)
d
=
N
2
(
t ) = 0 =

t
d
2
ln([)
d
2
=
N
3
(2
t )
d
2
ln([)
d
2
t
< 0
Maurizio Loreti
123
Esempio: stima della vita media - II
La soluzione di massima verosimiglianza =

t ` e
consistente ed imparziale (essendo il valor medio
del campione);
di varianza minima (per il teorema di Cram erRao);
questa varianza minima ` e inoltre data dalla
Var(
) =
Var(t)
N
=

2
N
= R()
sufciente (riassume tutta linformazione del
campione).
Maurizio Loreti
124
Esempio: stima della vita media - III
Normalmente lefcienza non ` e unitaria; ad esempio
il nostro rivelatore pu` o avere dimensioni confrontabili
col cammino medio. In questo caso bisogna usare le
probabilit` a condizionate:
[ =
N
i=1
_
1
t
i
(t
min
)
i
(t
max
)
i
_
ln([) = Nln +
+
N
_
i=1
_
t
i
ln
_
e
(t
min
)
i
(t
max
)
i
__
e, posto per brevit` a
i
() =
(t
min
)
2
i
e
(t
min
)
i
(t
max
)
2
i
e
(t
max
)
i
(t
min
)
i
(t
max
)
i
si arriva alla
d ln([)
d
=
1
2
_
N
_
i=1
_
t
i

i
()
_
N
_
= 0
che bisogna risolvere in modo numerico.
Maurizio Loreti
125
Esempio: stima della vita media - IV
Non si pu` o garantire che le propriet` a preceden-
temente delineate per (consistenza, normalit` a,
efcienza, . . . ) siano ancora valide, almeno per N
nito.
Pu` o darsi che la funzione di verosimiglianza
ammetta pi ` u di un massimo, e non si sa a priori
quale converger ` a verso
.
Lerrore della stima deve essere ricavato dalla con-
cavit` a della funzione di verosimiglianza, supposta
approssimativamente normale.
Maurizio Loreti
126
Stima del valor medio di una popolazione di Poisson
f(x
i
; ) =

x
i
x
i
!
e
ln [f(x
i
; )] = x
i
ln ln(x
i
!)
ln([) = N x ln
N
_
i=1
ln(x
i
!) N
d ln([)
d
=
N x
N =
N
( x )
d
2
ln([)
d
2
=
N x
2
< 0
= x
Var( ) =

N
Maurizio Loreti
127
Stima di pi ` u parametri I
Il metodo della massima verosimiglianza si generalizza
facilmente alla stima contemporanea di pi ` u parametri:
x f(x;
1
,
2
, . . . ,
M
) = f(x; )
[(X; ) =
N
i=1
f(x
i
; )
ln([) =
N
_
i=1
ln [f(x
i
; )]
k

_
_
[
k
= 0 ,

2
[
2
k
< 0
ln([)
k
= 0 ,

2
ln([)
2
k
< 0
Maurizio Loreti
128
Stima di pi ` u parametri II
Le propriet` a della stima di massima verosimiglianza
rimangono valide:
Le stime

sono asintoticamente consistenti;
La loro distribuzione ` e asintoticamente normale
(in M dimensioni);
Le stime

tendono asintoticamente alla
massima efcienza;
Gli errori sono legati allandamento di [
nellintorno del massimo:
V
`
1
_
ij
= N E
_
2
ln f(x;
1
,
2
, . . . ,
M
)
i

j
_
Maurizio Loreti
129
Stima di probabilit` a ignote
Siano M eventualit` a esaurienti e mutuamente esclu-
sive; in N prove effettuate le frequenze assolute di
ognuna di esse valgano n
i
, con i = 1, 2, . . . , M.
[
M
i=1
p
n
i
i
ln([) = K +
M
_
i=1
n
i
ln(p
i
)
con le p
i
vincolate dalla
_
i
p
i
= 1.
f(p; n) =
M
_
i=1
n
i
ln(p
i
)
_
M
_
i=1
p
i
1
_
f
p
k
=
n
k
p
k
= 0
p
k
=
n
k
N
_
k=1
p
k
=
N
= 1 - = N
p
k
=
n
k
N
Maurizio Loreti
130
Stima dei parametri della popolazione normale - I
Gi ` a sappiamo che
ln [ = Nln
N
2
ln(2)
1
2
2
N
_
i=1
(x
i
)
2
Se ` e supposta ignota, le equazioni di massima
verosimiglianza sono:
_
_
ln([)
=
1
2
N
_
i=1
(x
i
) = 0
ln([)
=
1
3
_
N
_
i=1
(x
i
)
2
N
2
_
= 0
ed hanno lunica soluzione (un massimo)
_
_
=
1
N
N
_
i=1
x
i

2
=
1
N
N
_
i=1
(x
i
)
2
Maurizio Loreti
131
Stima dei parametri della popolazione normale - II
Entrambe le stime sono consistenti; la seconda non
` e imparziale, ma pu` o essere resa tale:

2
s
2
=
N
N 1

2
che ` e appunto imparziale ma non ` e di minima
varianza:
Var(s
2
) =
N
2
(N 1)
2
Var(
2
) > Var(
2
)
Il fatto che la varianza della popolazione abbia un
determinato valore non cambia il fatto che la nostra
migliore stima del valor medio della popolazione
sia comunque data dalla media aritmetica del
campione: valor medio e varianza del campione sono
statisticamente indipendenti.
La matrice delle covarianze vale
V
`
= =
_
_
_
_
_
_
_
_

2
N
0
0

2
2N
_
_
_
_
_
_
_
_
note espressioni della varianza di e di ; la loro
covarianza ` e ovviamente nulla.
Maurizio Loreti
132
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
P o s s i b l e e x p e r i m e n t a l v a l u e s

P
h
y
s
i
c
a
l

q
u
a
n
t
i
t
y

1
(
2
(

e
x
p

a
c
t
u
a
l
c
1
c
2
D
(
)
U
n
p
h
y
s
i
c
a
l
r
e
g
i
o
n

f
o
r

D
e
t
e
r
m
i
n
a
z
i
o
n
e
d
e
g
l
i
i
n
t
e
r
v
a
l
l
i
d
i
c
o
n
d
e
n
z
a
p
e
r
u
n
p
a
r
a
m
e
t
r
o
d
a
c
u
i
d
i
p
e
n
d
e
u
n
a
f
u
n
z
i
o
n
e
d
i
d
i
s
t
r
i
b
u
z
i
o
n
e
n
o
t
a
d
i
u
n
e
s
p
e
r
i
m
e
n
t
o
.
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
3
3
La distribuzione del
2
- I
Come ` e distribuito il quadrato di una variabile casuale
normale standardizzata?
_
_
_
x N(x; 0, 1)
y = x
2
y
(t) = E
_
e
itx
2
_
=
_
+
e
itx
2 1
2
e
x
2
2
dx
=
_
+
2
e
x
2
2
(12it)
dx
e, posto u
2
= x
2
(1 2it),
y
(t) =
1
1 2it
_
+
2
e
u
2
2
du
= (1 2it)
1
2
Maurizio Loreti
134
2
- II
Generalizzando,
_
_
x
i
N(0, 1) (i = 1, 2, . . . , N)
X =
N
_
i=1
x
2
i
X
(t) = (1 2it)
N
2
f(X; N) =
1
2
N
2
_
_
X
2
_N
2
1
e
X
2
M
X
(t) = (1 2t)
N
2
E(X) = N
Var(X) = 2N
X N
2N
N
N(0, 1)
2X
2N 1
N
N(0, 1)
Maurizio Loreti
135
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
5
1
0
1
5
2
0
N
=
1
N
=
2
N
=
3
N
=
5
N
=
1
0
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
3
6
2
- III
Regola di somma del
2
.
Variabili importanti distribuite come il
2
:
X =
N
_
i=1
_
x
i

_
2

2
(N)
X =
N
_
i=1
_
x
i
x
_
2

2
(N 1)
X = (N 1)
s
2
2

2
(N 1)
Maurizio Loreti
137
2
- IV
Consideriamo quella particolare trasformazione lineare
x
j
y
i
=
_
j
A
ij
x
j
in cui
_
_
y
1
=
1
N
(x
1
+ x
2
+ + x
N
)
y
2
=
1
2
(x
1
x
2
)
y
3
=
1
6
(x
1
+ x
2
2x
3
)

y
N
=
x
1
+ x
2
+ + x
N1
(N 1)x
N
_
N(N 1)
ossia
A
ij

_
_
i = 1:
1
N
i > 1:
_
_
j < i:
1
_
i(i 1)
j = i:
i 1
_
i(i 1)
j > i: 0
Maurizio Loreti
138
2
- V
La matrice A
`
` e ortogonale:
N
_
i=1
A
ij
A
ik
=
jk

N
_
i=1
x
2
i
=
N
_
i=1
y
2
i
ed ` e stata scelta in modo che
y
1
=
N x
N
_
j=1
A
2
ij
= 1 i
N
_
j=1
A
ij
= 0 i > 1
per cui
_
_
Var(y
i
) = Var(x) =
2
i
E(y
i
) = 0 i > 1
Insomma le y
i
, per i > 1, sono variabili casuali normali
con media 0 e varianza
2
.
Maurizio Loreti
139
2
- VI
X =
1
2
N
_
i=1
(x
i
x)
2
=
1
2
_
N
_
i=1
x
i
2
N x
2
_
=
1
2
_
N x
2
+
N
_
i=2
y
i
2
N x
2
_
=
N
_
i=2
y
i
2
2
X ` e distribuita come il
2
a (N 1) gradi di libert` a.
La regola generale ` e che il numero di gradi di libert` a
da associare a variabili che seguono la distribuzione
del
2
` e dato dal numero di contributi indipendenti:
ovvero il numero di termini con distribuzione normale
sommati in quadratura (qui N, uno per ogni deter-
minazione x
i
) diminuito del numero di parametri che
compaiono nella formula e che sono stati stimati
dai dati stessi (qui uno, la media della popolazione,
stimata usando la media aritmetica delle misure).
Maurizio Loreti
140
Il test del
2
Dati raccolti in M classi di frequenza.
Ipotesi (ammessa vera la conoscenza della distribu-
zione):
Classi di frequenza ristrette: p
i
< 1, p
2
i
< p
i
, in
modo che la distribuzione (binomiale) nel singolo
bin si possa approssimare con la statistica di
Poisson:
Var (A
i
) = A
i
Alta frequenza attesa: A
i
5, in modo che in
ogni bin si possa ritenere valida lapprossimazione
normale alla distribuzione di Poisson: pertanto
X =
M
_
i=1
(O
i
A
i
)
2
A
i
2
(M 1)
2
(M R 1)
Se vi sono classi con frequenze troppo basse, si
usano classi di ampiezza variabile in modo che
A
i
5 10
Maurizio Loreti
141
Esercizio
In uno dei suoi esperimenti, labate Mendel osserv` o
forma e colore dei frutti di molte piante di piselli,
classicandole in quattro categorie come segue (O
i
` e
qui il numero di piante osservate in ogni categoria):
i Tipo O
i
1 Rotondi e gialli 315
2 Rotondi e verdi 108
3 Oblunghi e gialli 101
4 Oblunghi e verdi 32
Mendel si aspettava un rapporto tra le popolazioni
delle quattro categorie di 9 : 3 : 3 : 1; i risultati sono
in accordo con queste previsioni?
Maurizio Loreti
142
Soluzione
Il numero totale di osservazioni ` e N = 556.
i p
i
A
i
= Np
i
O
i
q
i
V
i
= Np
i
q
i
1
9
16
312.75 315
7
16
136.83
2
3
16
104.25 108
13
16
84.70
3
3
16
104.25 101
13
16
84.70
4
1
16
34.75 32
15
16
32.58
X =
4
_
i=1
(A
i
O
i
)
2
A
i
0.47
` e distribuita come il
2
a 3 gradi di libert` a: un valore
superiore a quello osservato si presenta casualmente
nel 92.54% dei casi.
X
=
4
_
i=1
(A
i
O
i
)
2
V
i
0.56
X

2
(X
; 3) P 90.56%
Maurizio Loreti
143
Esercizio
Il Bortkewitch studi ` o il numero di morti per calci di
cavallo nellesercito prussiano, registrando i decessi
vericatisi in 10 corpi darmata nel corso di 20 anni
(per un totale quindi di N = 200 casi). Le frequenze
assolute n
i
del numero di morti per corpo darmata
e per anno i sono riassunte nella tabella seguente:
i n
i
0 109
1 65
2 22
3 3
4 1
Totale 200
Si chiede di vericare se i dati sono in accordo con
la distribuzione di Poisson.
Maurizio Loreti
144
Soluzione
=
1
N
4
_
i=0
i n
i
0.61
i p
i
A
i
n
i
V
i
0 0.5434 108.67 109 49.62
1 0.3314 66.29 65 44.31
2 0.1011 20.22 22
3 0.0206 4.11 3
4 0.0031 0.63 1
1 0.1252 25.04 26 21.90
X =
(109 108.67)
2
108.67
+
(65 66.29)
2
66.29
+
+
(26 25.04)
2
25.04
0.06291
` e distribuita come il
2
a 1 grado di libert` a: la
probabilit` a di ottenere per motivi puramente casuali
un valore almeno pari a quello osservato ` e dell80.35%.
X
0.07997 P 77.73%
Maurizio Loreti
145
0
50
100
-1 0 1 2 3 4 5
Maurizio Loreti
146
1 2 3 4 5 7 10 20 30 40 50 70 100
0.001
0.002
0.005
0.010
0.020
0.050
0.100
0.200
0.500
1.000
3 4 2 6 8
10
15
20
25
30
40
50
n = 1
2
Il livello di condenza come funzione del valore del
2
e del numero n di gradi
di libert` a.
Maurizio Loreti
147
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
1
0
2
0
3
0
4
0
5
0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
2
.
5
D
e
g
r
e
e
s

o
f

f
r
e
e
d
o
m

n
5
0
%
1
0
%
9
0
%
9
9
%
9
5
%
6
8
%
3
2
%
5
%
1
%
2
/
n
I
l
l
i
v
e
l
l
o
d
i
c
o
n
d
e
n
z
a
c
o
m
e
f
u
n
z
i
o
n
e
d
e
l
2
r
i
d
o
t
t
o
(
2
/
n
)
,
i
n
c
o
r
r
i
s
p
o
n
d
e
n
z
a
d
i
v
a
r
i
g
r
a
d
i
d
i
l
i
b
e
r
t
`
a
n
.
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
4
8
Il metodo del minimo
2
- I
_
_
X =
M
_
i=1
(O
i
A
i
)
2
A
i
=
M
_
i=1
n
i
Np
i
_
2
Np
i
p
i
= p
i
(
1
,
2
, . . . ,
R
)
X
k
=
M
_
i=1
2
n
i
Np
i
_
N
2
p
i
+ N
n
i
Np
i
_
2
N
2
p
i
2
p
i
1
2
X
k
=
M
_
i=1
_
n
i
Np
i
p
i
+
n
i
Np
i
_
2
2Np
i
2
_
p
i
k
Il rapporto tra il secondo termine ed il primo vale
n
i
Np
i
2Np
i
=
1
2p
i
_
n
i
N
p
i
_
N
0
Maurizio Loreti
149
2
- II
Trascurando il secondo termine (lecito asintoticamen-
te; metodo semplicato del minimo
2
):
M
_
i=1
_
n
i
Np
i
p
i
_
p
i
k
= 0
Se i bins coprono tutti i valori permessi,
M
_
i=1
_
n
i
Np
i
p
i
_
p
i
k
=
=
M
_
i=1
n
i
p
i
p
i
k
N
M
_
i=1
p
i
k
e lultimo termine si annulla, essendo
M
_
i=1
p
i
k
=

k
M
_
i=1
p
i
=

k
1 0
quindi
M
_
i=1
n
i
p
i
p
i
k
= 0 (k = 1, 2, . . . , R)
Maurizio Loreti
150
2
- III
Applicando invece il metodo della massima verosimi-
glianza:
[(
1
,
2
, . . . ,
R
)
M
i=1
p
n
i
i
ln([) = K +
M
_
i=1
n
i
ln p
i
_
ln([)
k
=
M
_
i=1
n
i
p
i
p
i
k
= 0 (k = 1, 2, . . . , R)
I due metodi (della massima verosimiglianza e del
2
semplicato) conducono asintoticamente allo stesso
risultato.
Maurizio Loreti
151
Test di omogeneit` a I
Siano Q campioni indipendenti di dati, composti da
n
1
, n
2
, . . . , n
Q
valori ciascuno; e, allinterno di ogni
campione, i dati siano divisi tra P classi esaurienti
e mutuamente esclusive; consideriamo il problema di
vericare lipotesi che i dati provengano dalla stassa
distribuzione.
Campioni
11

12

13

1Q
m
1
21

22

2Q
m
2
Gruppi
31
m
3

P 1

P 2

PQ
m
P
n
1
n
2
n
3
n
Q
N
Ammessa vera lipotesi, si dimostra che
X = N
_
_
i,j
2
ij
m
i
n
j
1
_

2
(X; K)
K = (P 1)(Q 1)
Maurizio Loreti
152
Test di omogeneit` a II
Sia p
i
, con i = 1, 2, . . . , P , la probabilit` a che un dato
scelto a caso appartenga alla i-esima classe; e sia
q
j
(j = 1, 2, . . . , Q) la probabilit` a di appartenenza al
campione j-esimo. Dallinsieme dei dati possiamo
ricavare (P 1) stime indipendenti delle p
i
e (Q 1)
stime indipendenti delle q
j
:
p
i
=
m
i
N
e q
j
=
n
j
N
La variabile casuale
X =
_
i,j
ij
Np
i
q
j
_
2
Np
i
q
j
=
_
i,j
_
ij
_
2
Np
i
q
j
2
ij
+ Np
i
q
j
_
=
_
i,j
ij
_
2
Np
i
q
j
2N + N
=
_
i,j
ij
_
2
Np
i
q
j
N
deve essere distribuita come il
2
.
Maurizio Loreti
153
Test di omogeneit` a III
Sostituendo le espressioni per i valori stimati delle
p
i
e delle q
j
, si ottiene
X = N
_
_
i,j
2
ij
m
i
n
j
1
_
Il numero di gradi di libert` a ` e dato dal numero di
contributi (PQ), diminuito di 1 per tener conto del
vincolo sul numero totale di dati, e di (P 1) +(Q1)
che ` e il numero dei parametri indipendenti stimati
dai dati stessi; e vale quindi
K = PQ 1 (P 1) (Q 1)
= PQ P Q + 1
K = (P 1)(Q 1)
Maurizio Loreti
154
Il test di Kolmogorov e Smirnov
Confronto tra campione e distribuzione:
= max
_
[F(x) (x)[
_
Pr(
0
) = F
KS
(
0
)
F
KS
(x) = 2
_
k=1
(1)
k1
e
2k
2
x
2
0
=
_
N + 0.12 +
0.11
N
_
0
Confronto tra due campioni:
= max
_
[F
1
(x) F
2
(x)[
_
N =
1
1
N
1
+
1
N
2
=
N
1
N
2
N
1
+ N
2
Non richiede la denizione (in genere arbitraria)
delle classi di frequenza;
E (relativamente) indipendente dalla variabile
casuale usata;
E poco sensibile nelle code e molto nella zona
mediana;
Nessun parametro deve essere stato stimato dai
dati.
Maurizio Loreti
155
Esercizio
Per una ricerca statistica si ` e misurato il peso di 345 bambini e 326 bambine
di 11 anni; le frequenze osservate, per classi ampie 2.5 Kg, sono riportate
nella tabella seguente:
Peso M F Peso M F Peso M F
40.0-42.5 1 0 52.5-55.0 80 59 65.0-67.5 4 16
42.5-45.0 3 1 55.0-57.5 72 58 67.5-70.0 2 5
45.0-47.5 9 7 57.5-60.0 41 48 70.0-72.5 1 3
47.5-50.0 33 37 60.0-62.5 27 23 72.5-75.0 0 2
50.0-52.5 65 41 62.5-65.0 7 26
Le osservazioni sono compatibili con popolazioni normali? E sono compatibili
tra di loro?
Maurizio Loreti
156
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
S
o
l
u
z
i
o
n
e
-
I
M
=
5
4
.
6
7
F
=
5
6
.
3
1
M
=
4
.
4
9
7
F
=
5
.
6
3
1
B
a
m
b
i
n
i
:
r
a
g
g
r
u
p
p
i
a
m
o
i
d
a
t
i
P
<
4
7
.
5
e
P
>
6
2
.
5
;
A
i
(
>
6
5
)
=
3
.
7
3
.
M
P
e
s
o
P
M
i
A
M i
O
M i
4
7
.
5
0
.
0
5
5
1
9
.
1
2
1
1
3
4
7
.
5
-
5
0
.
0
0
.
0
9
4
3
2
.
4
6
5
3
3
5
0
.
0
-
5
2
.
5
0
.
1
6
5
5
6
.
9
8
9
6
5
5
2
.
5
-
5
5
.
0
0
.
2
1
4
7
4
.
0
1
6
8
0
5
5
.
0
-
5
7
.
5
0
.
2
0
6
7
1
.
1
3
1
7
2
5
7
.
5
-
6
0
.
0
0
.
1
4
7
5
0
.
5
8
1
4
1
6
0
.
0
-
6
2
.
5
0
.
0
7
7
2
6
.
6
1
1
2
7
6
2
.
5
0
.
0
4
1
1
4
.
0
8
6
1
4
X
M
=
8
_ i
=
1
(
A
M i
O
M i
)
2
A
M i
5
.
4
1
2
(
5
)
P
r
(
X
>
X
M
)
3
6
.
8
%
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
5
7
Soluzione - II
Bambine: raggruppando P > 65
F
Peso P
F
i
A
F
i
O
F
i
47.5 0.059 19.183 8
47.5-50.0 0.072 23.599 37
50.0-52.5 0.118 38.498 41
52.5-55.0 0.159 51.734 59
55.0-57.5 0.176 57.267 58
57.5-60.0 0.160 52.218 48
60.0-62.5 0.120 39.222 23
62.5-65.0 0.074 24.267 26
65.0 0.061 20.012 26
X
F
=
9
_
i=1
(A
F
i
O
F
i
)
2
A
F
i
24.287
2
(6)
Pr(X > X
F
) 0.05%
Maurizio Loreti
158
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
S
o
l
u
z
i
o
n
e
-
I
I
I
T
a
b
e
l
l
a
d
e
l
l
e
c
o
n
t
i
n
g
e
n
z
e
:
r
a
g
g
r
u
p
p
i
a
m
o
P
<
4
7
.
5
e
P
>
6
5
1
3
3
3
6
5
8
0
7
2
4
1
2
7
7
7
3
4
5
8
3
7
4
1
5
9
5
8
4
8
2
3
2
6
2
6
3
2
6
2
1
7
0
1
0
6
1
3
9
1
3
0
8
9
5
0
3
3
3
3
6
7
1
X
3
3
.
7
7
2
(
8
)
P
r
(
2
>
X
)
0
K
o
l
m
o
g
o
r
o
v
&
S
m
i
r
n
o
v
:
o
b
s
=
0
.
1
3
9
6
[
5
5
,
5
7
.
5
]
_
P
r
(
>
o
b
s
)
0
.
2
5
%
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
5
9
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
5
0
4
0
4
5
5
0
5
5
6
0
6
5
7
0
7
5
0
5
0
4
0
4
5
5
0
5
5
6
0
6
5
7
0
7
5
0 1
4
0
4
5
5
0
5
5
6
0
6
5
7
0
7
5
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
6
0
Test basati sulla curva normale
Compatibilit` a del valore misurato con un numero
pressato
Tests two-tailed e tests one-tailed:
u =
x
_
Var(x)
N
N(u; 0, 1)
se lipotesi ` e vera.
Compatibilit` a di due valori misurati:
u =
x y
_
Var(x)
N
x
+
Var(y)
N
y
N(u; 0, 1)
se lipotesi ` e vera.
Limiti della validit` a del test; i piccoli campioni.
Maurizio Loreti
161
Esercizio
Su N campioni scelti a caso dalla lavorazione di un
conduttore di rame si misura la forza F
i
(in Kg-peso;
i = 1, . . . , N) necessaria per spezzare il cavo stesso.
Valor medio ed errore quadratico medio dei valori F
i
valgono rispettivamente (sempre in Kg-peso)
= 261.1 e = 3.8
Supposto che la popolazione delle F segua la legge
normale di distribuzione, e che la dimensione N del
campione ci consenta di ottenere una buona stima
della varianza della popolazione, a quale forza i cavi
resisteranno con un livello di condenza P = 99.99%?
Maurizio Loreti
162
Soluzione I
Ammettendo di conoscere valor medio F
e scarto
quadratico medio
della popolazione delle F, per

ipotesi
dp
dF
= N(F; F
)
e si chiede di stimare un valore F
0
tale che
_
+
F
0
dF
1
2
e
1
2
(
FF
)
2
= P
Sempre per ipotesi,
= ; se fosse anche F
= , la
risposta (one-tailed test alluno per diecimila) sarebbe
F = 3.71 246.9 Kg
F
non ` e nota; per` o si sa che ` e distribuita

normalmente con densit` a di probabilit` a
dp
dF
= N
; ,
_
ove
N
Maurizio Loreti
163
Soluzione II
dp
dF
=
=
_
+
dF
2
e
(FF
)
2
2
2
1
2
e
(F
)
2
2
2
che ` e la convoluzione delle due funzioni N(F; 0, )

e N(F
; ,
). La trasformata di Fourier della

convoluzione di due funzioni ` e il prodotto delle
trasformate, per cui
F
(t) = e
1
2

2
t
2
e
(it
1
2
t
2
)
= e
_
it
t
2
2
(
2
+
2
)
_
che ` e la funzione caratteristica di una distribuzione
ancora normale, con valor medio e varianza
2
+
2
=
N + 1
N

2
per cui la risposta ` e
F
0
= 3.71
_
N + 1
N
Maurizio Loreti
164
La distribuzione di Student - I
t =
u
_
X
N
-
_
_
u N(u; 0, 1)
X
2
(X; N)
(statisticamente indipendenti)
f(t) =
dp
dt
=
N+1
2
_
N
2
_
1
1 +
t
2
N
_
N+1
2
E(t) = 0
Var(t) =
N
N 2
(N > 2)
f(t)
N
N(t; 0, 1)
Per N = 1 la distribuzione di Student si riduce a
quella di Cauchy.
Maurizio Loreti
165
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
-
5
-
4
-
3
-
2
-
1
0
1
2
3
4
5
S
t
u
d
e
n
t
,

n
=
2
S
t
u
d
e
n
t
,

n
=
4
G
a
u
s
s
:

N
(
0
,
1
)
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
6
6
La distribuzione di Student - II
u =
x E(x)
N
N(u; 0, 1)
X = (N 1)
s
2
2

2
(X; N 1)
x =
u
_
X
N 1
=
x E(x)
s
N
t(x; N 1)
Compatibilit` a tra valore misurato e numero pre-
determinato per piccoli campioni: ammessa vera
lipotesi,
x =
x
s
N
t(x; N 1)
Maurizio Loreti
167
La distribuzione di Student - III
Compatibilit` a tra due valori misurati per piccoli
campioni, ammesso che abbiano la stessa varianza
2
:
S
2
=
_
i
_
x
i
x
_
2
+
_
k
[y
k
y]
2
N + M 2
=
(N 1) s
2
x
+ (M 1) s
2
y
N + M 2
X =
(N 1) s
2
x
+ (M 1) s
2
y
2
= (N + M 2)
S
2
2

2
(N + M 2)
u =
( x y) [E(x) E(y)]
_
1
N
+
1
M
_
N(0, 1)
t =
u
_
X
N+M2
t(N + M 2)
e, ammessa vera lipotesi
t =
x y
_
S
2
1
N
+
1
M
_
t(N + M 2)
Maurizio Loreti
168
La distribuzione di Fisher - I
X
2
(M) Y
2
(N)
(statisticamente indipendenti)
w =
X
M
Y
N
f(w; M, N) =
=
M+N
2
_
M
N
_M
2
M
2
_
N
2
_
w
M
2
1
1 +
M
N
w
_M+N
2
E(w) =
N
N 2
N > 2
Var(w) =
2N
2
(M + N 2)
M(N 2)
2
(N 4)
N > 4
Maurizio Loreti
169
La distribuzione di Fisher - II
f(w; M, ) =
1
M

2
(w; M)
f(w; , N) = N
1
2
(w; N)
u t(u; N) u
2
f(u
2
; 1, N)
Per due campioni indipendenti
X = (M 1)
s
2
1
2
1
Y = (N 1)
s
2
2
2
2
w =
s
2
1
s
2
2
2
2
2
1
f(w; M 1, N 1)
Test dellipotesi
1
=
2
: ammessa vera lipotesi
stessa,
w =
s
2
1
s
2
2
f(w; M 1, N 1)
Maurizio Loreti
170
La verica delle ipotesi
Ipotesi nulla ed ipotesi alternativa
Non necessariamente complementari
La regione di rigetto, k
La regione di accettanza, = , k
I possibili errori:
Rigettare unipotesi vera (errori di prima specie):
P
I
= Pr
E k[H
0
_
Accettare unipotesi falsa (errori di seconda
specie):
P
II
= Pr
E [H
a
_
Signicanza del criterio, = 1 P
I
Potenza del criterio, = 1 P
II
Il criterio del rapporto delle verosimiglianze:
k
k

_
=
[(x[H
0
)
[(x[H
a
)
< k
_
Maurizio Loreti
171
Primo esempio I
_
_
x N(x; , ) (con > 0 noto)
H
0
= 0
H
a
= 1
f(x; , ) =
1
2
e
1
2
2
(x)
2
ln f(x
i
; , ) = ln ln
2
_
(x
i
)
2
2
2
ln [ = Nln Nln
2
_
_
i
(x
i
)
2
2
2
= Nln Nln
2
_
_
i
x
2
i
2x
i
+
2
_
2
2
= Nln Nln
2
_
_
i
x
2
i
2N x + N
2
2
2
Maurizio Loreti
172
Primo esempio II
ln = ln [(x; 0, ) ln [(x; 1, )
=
N
2
2
(1 2 x)
k
k

_
ln =
N
2
2
(1 2 x) < ln k
_
_
x >
N 2
2
ln k
2N
= c
_
P
I
=
_
+
c
N
_
x; 0,

N
_
dx
P
II
=
_
c
N
_
x; 1,

N
_
dx
Maurizio Loreti
173
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
0
0
.
2
0
.
4
0
.
6
0
.
8 1
1
.
2
1
.
4
-
1
.
5
-
1
-
0
.
5
0
0
.
5
1
1
.
5
2
2
.
5
c

=

0
.
6
E
r
r
o
r
i

d
i

t
i
p
o

I
I
E
r
r
o
r
i

d
i

t
i
p
o

I
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
7
4
Il lemma di Neyman-Pearson I
Lemma: Se si ha a disposizione un campione di N
valori indipendenti x
i
da utilizzare per discriminare
tra unipotesi nulla ed unipotesi alternativa entrambe
semplici (ovvero del tipo =
0
e =
a
), a parit` a di
signicanza , la massima potenza del test (ovvero
la minima probabilit` a di commettere errori di seconda
specie) si ottiene denendo la regione di rigetto k
k
attraverso una relazione del tipo:
k
k

_
=
[(x[H
0
)
[(x[H
a
)
< k
_
Maurizio Loreti
175
Il lemma di Neyman-Pearson II
Dobbiamo trovare tra tutte le regioni di rigetto k
che soddisfano alla
_
k
[(x;
0
) dx = P
I
= 1
quella che rende massima
=
_
k
[(x;
a
) dx
e dimostrare che ` e
k
k

_
=
[(x[
0
)
[(x[
a
)
< k
_
Ora, per qualunque k e qualunque funzione (x),
k
k
= (k
k
k) (k
k
k)
k = (k k
k
) (k k
k
)
_
k
k
(x) dx
_
k
(x) dx =
=
_
k
k
k
(x) dx
_
kk
k
(x) dx
Maurizio Loreti
176
Il lemma di Neyman-Pearson III
_
k
k
[(x[
a
) dx
_
k
[(x[
a
) dx =
=
_
k
k
k
[(x[
a
) dx
_
kk
k
[(x[
a
) dx
>
1
k
__
k
k
k
[(x[
0
) dx
_
kk
k
[(x[
0
) dx
_
=
1
k
__
k
k
[(x[
0
) dx
_
k
[(x[
0
) dx
_
=
1
k

_
P
I
P
I
_
= 0
Maurizio Loreti
177
Secondo esempio
_
_
H
0
= 0
H
a
> 0
ln [(x; 0, ) = N ln
2
_
1
2
2
N
_
i=1
x
i
2
ln [(x;
a
, ) = N ln
2
_
1
2
2
_
N
_
i=1
x
i
2
2N x
a
+ N
a
2
_
ln = ln [(x; 0, ) [(x;
a
, )
=
N
a
2
2
(
a
2 x) < ln k
k
k

_
x >
N
a
2
2
2
ln k
2N
a
= c
_
P
I
=
_
+
c
N
_
x; 0,

N
_
dx
Maurizio Loreti
178
Il rapporto delle massime verosimiglianze
Sia [ = [(x;
1
,
2
, . . . ,
M
).
Se H
0
consiste nellappartenere P M dei
parametri
i
ad una regione dello spazio dei
parametri, e H
a
nel non appartenervi;
Se [(
S) ` e il massimo valore della funzione di

verosimiglianza nellintero spazio dei parametri;
Se [(
R) ` e il massimo valore della funzione di

verosimiglianza in ;
si pu` o usare come criterio per denire k
k
k
k

_
=
[(
R)
[(
S)
< k
_
Se si conosce la distribuzione di ammessa vera H
0
si pu` o calcolare la signicanza del test:
P
I
= Pr
[0, k][H
0
_
=
_
k
0
g([H
0
) d
e si pu` o dimostrare che comunque
2ln
N

2
(P )
Maurizio Loreti
179
Terzo esempio
_
_
H
0
= 0
H
a
,= 0
ln [ = N ln(
2)
_
i
x
2
i
2N x + N
2
2
2
ln [(
S) = N ln
2
_
_
i
x
2
i
N x
2
2
2
ln [(
R) = N ln
2
_
_
i
x
2
i
2
2
ln = ln [(
R) ln [(
S) =
1
2
2
N x
2
k
k

_
x
2
>
2
2
ln k
N
_
_
[ x[ > c
_
Il criterio di verica ` e sostanzialmente un test sul
2
:
x
2
2
N
> cost.
Maurizio Loreti
180
Quarto esempio
_
_
H
0
p
i
=
i
i 1, 2, . . . , M
_
H
a
p
i
,=
i
i 1, 2, . . . , M
_
[
M
i=1
p
n
i
i
p
i
=
n
i
N
[(
S) =
M
i=1
_
n
i
N
_
n
i
=
1
N
N
M
i=1
n
n
i
i
[(
R) =
M
i=1
n
i
i
=
[(
R)
[(
S)
= N
N
M
i=1
_
i
n
i
_
n
i
k
k
< k
Il criterio di verica dellipotesi ` e differente da quello
dato in precedenza (
2
).
Maurizio Loreti
181
Quinto esempio - I
_
_
x N(x; , ) (con > 0 ignoto)
H
0
=
0
H
a
,=
0
ln [ = N ln
N
2
ln(2)
1
2
2
N
_
i=1
(x
i
)
2
Sappiamo gi ` a che il massimo assoluto si ha per
= x e
2
=
1
N
N
_
i=1
(x
i
)
2
e vale quindi
ln [(
S) =
N
2
ln
_
N
_
i=1
(x
i
x)
2
_
+
+
N
2
ln N
N
2
ln(2)
N
2
Maurizio Loreti
182
Quinto esempio - II
Ammessa vera H
0
ln [ =
= N ln
N
2
ln(2)
1
2
2
N
_
i=1
(x
i

0
)
2
che ha un massimo per
2
=
1
N
N
_
i=1
(x
i

0
)
2
che vale
ln [(
R) =
N
2
ln
_
N
_
i=1
(x
i

0
)
2
_
+
+
N
2
ln N
N
2
ln(2)
N
2
Maurizio Loreti
183
Quinto esempio - III
ln = ln [(
R) ln [(
S)
=
N
2
_
ln
_
N
_
i=1
(x
i

0
)
2
_
ln
_
N
_
i=1
(x
i
x)
2
__
=
N
2
ln
_
_
i
(x
i

0
)
2
_
i
(x
i
x)
2
_
=
N
2
ln
_
1 +
N( x
0
)
2
_
i
(x
i
x)
2
_
=
N
2
ln
_
1 +
t
2
N 1
_
denendo una nuova variabile casuale
t = ( x
0
)
_
N(N 1)
_
i
(x
i
x)
2
=
x
0
s
N
Il criterio di verica dellipotesi ` e un test su una
variabile di Student.
Maurizio Loreti
184
S
c
u
o
l
a
d
i
D
o
t
t
o
r
a
t
o
i
n
F
i
s
i
c
a
D
o
t
t
o
r
a
t
o
d
i
R
i
c
e
r
c
a
i
n
F
i
s
i
c
a
X
I
V
C
i
c
l
o
(
A
n
n
o
A
c
c
a
d
e
m
i
c
o
1
9
9
8
9
9
)
S
t
a
t
i
s
t
i
c
a
A
p
p
l
i
c
a
t
a
a
l
l
a
F
i
s
i
c
a
T
h
e
E
n
d
I
n
r
e
a
l
t
`
a
u
n
l
a
v
o
r
o
s
i
m
i
l
e
n
o
n
t
e
r
m
i
n
a
m
a
i
.
L
o
s
i
d
e
v
e
d
i
c
h
i
a
r
a
r
e
c
o
n
c
l
u
s
o
q
u
a
n
d
o
,
a
s
e
c
o
n
d
a
d
e
l
t
e
m
p
o
e
d
e
l
l
e
c
i
r
c
o
s
t
a
n
z
e
,
s
i
`
e
f
a
t
t
o
i
l
p
o
s
s
i
b
i
l
e
.
J
o
h
a
n
n
W
o
l
f
g
a
n
g
v
o
n
G
o
e
t
h
e
I
t
a
l
i
e
n
i
s
c
h
e
R
e
i
s
e
M
a
u
r
i
z
i
o
L
o
r
e
t
i
1
8
5

Statistica Applicata Alla Fisica

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Statistica Applicata Alla Fisica

Caricato da

Copyright:

Formati disponibili

S

Ceby sef: ponendo Var(x) =

f(t) dt (y [0, 1])

f(c, t) = g(c) h(t) =

Pr(0) > CL >

Si pu` o trovare, volendo, la funzione caratteristica;

Il numero g di gocce prodotte nel singolo scatte-

ed esiste nito il valor

della popolazione delle F, per

non ` e nota; per` o si sa che ` e distribuita

che ` e la convoluzione delle due funzioni N(F; 0, )

). La trasformata di Fourier della

S) ` e il massimo valore della funzione di

R) ` e il massimo valore della funzione di

Potrebbero piacerti anche