Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Si indica con Zibaldone una esposizione non organica (ed incompleta) di tecniche e
nozioni matematiche propedeutiche allo studio del calcolo delle probabilità. E non
solo. Cose già note, o che tali dovrebbero essere, all’allievo matematico.
Alla fine della dispensa sono esposti alcune nozioni di statistica elementare che
costituiscono la base empirica del calcolo delle probabilità.
1
Il modo più facile per calcolare il valore di Ckn è assumere tutte le disposizioni di
n oggetti presi k alla volta, cioè Dn,k , e tener presente che quelle che sono costituite
dagli stessi oggetti sono k! Dunque
( )
n Dn,k n!
= = .
k k! k!(n − k)!
( )
n
Si dimostra che , detto anche coefficiente binomiale, è un numero intero
k
positivo. La potenza n−esima della somma dei numeri reali a e b è
∑n ( )
nn j n−j
(a + b) = ab . (2)
j=0
j
∑n ( )
n j
ζ (1 − ζ)n−j = 1 , ∀ζ ∈ (0, 1) .
j=0
j
ed ancora
( )( ) ( )( )
h+k n n n−h
= .
h h+k h k
Con un po’ di pazienza si verificano le identità combinatorie
∑n ( ) ∑n ( ) ∑n ( )
n n−1 2 n n−2 3 n
j = n2 , j = n(n + 1)2 , j = n2 (n + 3)2n−3 ,
j=0
j j=0
j j=0
j
nonché l’identità
n ( )( )
∑ ( )
n j n n−1
= 2 , k ≤ n.
j=k
j k k
2
( ) ∑ jM ( ) ( )
m+n m n
= , jm = max{k − n, 0}, jM = min{k, m} ,
k j=j
j k − j
m
n ( )2
∑ ( )
n 2n (2n)!
la quale, per m = n = k, diviene = = . Quest’ultima, detta
j=0
j n (n!)2
formula di Lagrange.
Si abbiano n oggetti distinti da ripartire in r gruppi di taglia n1 , n2 , . . . , nr . Il
numero totale dei possibili gruppi distinti è dato dal coefficiente multinomiale
( )
n n!
= . (4)
n1 , n 2 , . . . , n r n1 !n2 ! · · · nr !
( ) ( )
n n
Se r = 2 si ha = , con k = n1 . Valgono poi le identità
n1 , n 2 k
( )
n
=
n1 , n2 , . . . , nr
( ) ( ) ( )
n−1 n−1 n−1
= + + ··· + ,
n1 − 1, n2 , . . . , nr n1 , n2 − 1, . . . , nr n1 , n 2 , . . . , n r − 1
( ) ( ) ( )
n n n
= n! , = .
1, 1, . . . , 1 n1 , n2 , . . . , nk n1 , n2 , . . . , nk , 0, . . . , 0
Lo sviluppo di Leibniz della potenza n−esima della somma di r numeri è
∑ ( )
( )n n
a1 + a2 + · · · + ar = an1 1 an2 2 · · · anr r , (5)
n1 , n 2 , . . . , n r
(n1 ,n2 ,...,nr )∈N
dove N indica l’insieme delle r−ple (n1 , n2 , . . . , nr ) costituite da interi non negativi
con somma pari ad n.
• Esempio.
(a) (Gioco del poker.) Il banco serve 5 carte ad un giocatore. Tenuto conto che il
gioco prevede 32 carte, ne consegue che il numero di tutti le possibili mani che un
giocatore può ricevere è
( )
32 32!
= = 201. 376 .
5 5! · 27!
(b) (Gioco del poker.) Il banco serve 5 carte a quattro giocatori. Il numero di
tutti i possibili modi di servirli (1) è
( )
32 32!
= = 2. 649. 169. 819. 964. 828. 160 ∼
= 2.649 · 1018 .
5, 5, 5, 5, 12 5! · 5! · 5! · 5! · 12!
(32)
1
Il lettore “veloce” è diffidato dal fornire “svelte” risposte tipo 4 · 5 o consimili.
3
(c) (Scopone.) Il banco che dispone di un mazzo di 40 carte distribuisce 10 carte
a quattro giocatori. Il numero di tutti i possibili modi di servire i giocatori è
( )
40 40!
= = 4. 705. 360. 871. 073. 570. 227. 520 ∼
= 4.705·1021 .
10, 10, 10, 10 10! · 10! · 10! · 10!
La prima cosa che balza all’occhio è il fatto che (anche) da numeri “piccoli” si
possano ottenere numeri “grandi” e dunque “poco trattabili. Il modo per maneggiare
coefficienti binomiali e multinomiali consistenti è di ricorrere alla formula asintotica
di Stirling. Vedi piú avanti.
Nello studio della legge multinomiale si fa uso del coefficiente multinomiale (4).
Sia (ζ1 , ζ2 , . . . , ζr−1 ) un vettore costituito da proporzioni, con ζi ≥ 0, ∀i, e con
∑ r−1
i=1 ζi ≤ 1. È facile verificare l’identità
∑ ( )
n xr−1 ( )xr
ζ1x1 ζ2x2 · · · ζr−1 1 − ζ1 − ζ2 − · · · − ζr−1 = 1 . (6)
x1 , x2 , . . . , xr
(x1 ,x2 ,...,xr )∈N
4
È facile verificare
( che )
il coefficiente
( ) (binomiale) (8) gode ancora della già vista
α+1 α α
proprietà ricorsiva = + . La formula di Vandermonde, per
k+1 k k+1
( ) ∑ n ( )( )
α+β α β
α, β ∈ R, diviene = .
n k=0
k n − k
∑∞ ( ) ∑∞
α α j (α − j + 1)j j
(1 + x) = x = x . (9)
j=0
j j=0
j!
( )
α
Se α ∈ N0 , risulta = 0, ∀j > α, e la (9) coincide con la (2). Se nella (9)
j ( )
α
α ∈ R \ N, allora i coefficienti sono positivi ∀j < α, ed a segni alterni ∀j > α.
j
Se α = 12 i coefficienti della (9) sono {1, 21 , − 18 , 16
1
, − 128
5 7
, 256 , − 1024
21
, . . . }. Se α = −1
−1
si ritrova il ben noto sviluppo a segni alterni( ) (1 + x) = 1 − x + x2 − x3 + . . .
α
Si noti poi che per j → ∞ il coefficiente tende ad una certa costante, sicché
j
la (9) si comporta come una serie di potenze a segni alterni. Si ha infatti
(α)
(j + 1)! (α − j + 1)j j+1
lim ( α ) = lim
j
· = lim = −1 .
j→∞
j+1
j→∞ j! (α − j)j+1 j→∞ α − j
Da quanto precede è agevole dedurre che il raggio di convergenza della serie (9)
è x ∈ (−1, 1). (3)
Dalla (9) si ricava facilmente
∑∞ ( ) ∑∞ ( )
1 −α j α+j−1
α
= x = (−1)j xj ,
(1 + x) j=0
j j=0
j
e da questa, sostituendo −x ad x,
∑∞ ( ) ∑∞ ( )
1 −α j j α+j−1 j
= (−1) x = x . (10)
(1 − x)α j=0
j j=0
j
∑∞ ( )
k+j j
Posto k = α − 1 la (10) diviene x = (1 − x)−(k+1) . Posto infine
j=0
j
∑∞ ( )
α+j−1 α
ζ = 1 − x, con ζ ∈ (0, 1), si verifica l’identità ζ (1 − ζ)j = 1, utile
j=0
j
nello studio della legge binomiale negativa.
3
Si faccia attenzione al fatto che la φ(x) = (1 + x)α può esistere anche al di fuori del raggio di
convergenza. Ad esempio, se α = 12 e x = 3, φ(3) = 2.
5
2 Identità
Con un po’ di pazienza è possibile verificare l’dentità assai utile negli sviluppi della
statistica bayesiana
A·B
A (z − a)2 + B (z − b)2 = (A + B) (z − z0 )2 + (a − b)2 ,
A+B
A·a+B·b
dove A, B ∈ R+ e z0 = . Grazie all’ovvia identità
A+B
∑
n ∑
n
(k + 1)α − k α = (n + 1)α − 1 , ∀α ∈ R+ .
k=1 k=1
∑
n ∏
m
1 ∏
m+1
(k + j − 1) = · (n + j − 1) .
k=1 j=1
m + 1 j=1
6
2.1 Sull’uso di certi operatori logici
∩ ∪
Si dànno alcuni esempi d’uso degli operatori e . Se (an )n≥1 è una successione
di numeri reali positivi, con limn→∞ an = 0, si ha
∩
∞ ∩
∞ ∩
∞ ∩
∞
[0, an ] = [0, an ) = {0} , (0, an ] = (0, an ) = Ø .
n=1 n=1 n=1 n=1
∪
∞ ∩
∞
[0, an ] = [0, a1 ] , [0, an ] = [0, ℓ ] .
n=1 n=1
7
3 Successioni serie, limiti notevoli
( ) { }
Si indichi con an n≥1 la successione indefinita dei numeri reali a1 , a2 , a3 , . . . , e con
( )
sn n≥1 la corrispondente successione delle somme ridotte, cioè s1 = a1 , s2 = a1 + a2 ,
. . . , sn = a1 + a(2 +) · · · + an , . . .
Se la serie sn n≥1 converge ad un numero s, ossia limn→∞ sn = s, allora la
( ) ∑
successione an n≥1 è detta convergente. ed s = ∞ n=1 an è detto valore della serie.
∑
N
1
Dalla (12) discende la disuguaglianza < 1.
n=1
n(n + 1)
Limite notevole dell’analisi è
( f )n
lim 1+ = ef , (13)
n→∞ n
8
f )k·n ( ( )
dove f ∈ R non dipende da n. Da esso discende lim = ek·f . Se bn n≥1
1+
n (
f + b n )n
n→∞
Gli sviluppi in serie di McLaurin delle funzioni cos x e sin x sono dati da
∑
∞
x2n ∑∞
x2n+1
cos x = (−1)n , sin x = (−1)n . (14)
n=0
(2n)! n=0
(2n + 1)!
Lo sviluppo di McLaurin della funzione f (x) = ex risulta
x2 x3 ∑∞
xj
x
e = 1+x+ + + ... = . (15)
2! 3! j=0
j!
La serie (15) troncata ad un temine n pari, produce le disuguaglianze
ex ≥ 1 , ex ≥ 1 + x + 12 x2 , ex ≥ 1 + x + 12 x2 + 3!1 x3 + 4!1 x4 , . . .
valide ∀x ∈ R+ , nonché le disuguaglianze, valide ∀x ∈ R− ,
ex ≤ 1 , ex ≤ 1 + x + 12 x2 , ex ≤ 1 + x + 12 x2 + 3!1 x3 + 4!1 x4 , . . .
La serie (15), troncata ad un temine n dispari, fornisce, ∀x ∈ R,
ex ≥ 1 + x , ex ≥ 1 + x + 21 x2 + + 3!1 x3 , ex ≥ 1 + x + 12 x2 + 3!1 x3 + 4!1 x4 + 5!1 x5 , . . .
ex − 1
Dalla disuguaglianza ex ≥ 1 + x segue che ≥ 1, che si può anche dedurre
x
considerando che f1 (x) = x, in x = 0, è tangente alla f2 (x) = ex − 1 che ha sempre
ex − 1
concavità rivolta verso l’alto. (Si tenga conto che lim = 1 e che f2′′ (x) > 0,
x→0 x
∀x.)
Altra utile disuguaglianza è ex + x ≥ ex . Essa si prova considerando che f1 (x) =
2
che sia la f1 (x) che la f2 (x) sono convesse ∀x ∈ R, con f1′′ (x) > f2′′ (x).
1 2
Analogo sviluppo ammettono le funzioni g(x) = e 2 x e h(A) = eA
1 2
∑∞
x2j ∑
∞
Aj
e2x = j j!
, eA = ,
j=0
2 j=0
j!
dove A può essere una costante, una funzione, una matrice, o altro. Confrontando
lo sviluppo
∑
∞
(ix)n ∑
∞
x2n ∑∞
x2n+1
ix n
e = = (−1) +i (−1)n
n=0
n! n=0
(2n)! n=0
(2n + 1)!
9
con le formule (14), segue l’importante formula di Eulero
e−iπ = 1 ,
π
eiπ = −1 , ei 2 = i , |eix | = 1 , etc.
Assai utile negli sviluppi del calcolo delle probabilità è la disuguaglianza, valida
∀x ∈ R, |eix − 1| ≤ |x|. (4)
Con un po’ di pazienza si dimostra l’identità di Eulero-De Moivre
4 Richiami analisi
Si rammentano certe note proprietà di analisi utili in probabilità e statistica.
10
Trasformazioni
{ } monotone utili: (i) z = log f (x), purché f (x) > 0, ∀x; (ii)
z = exp f (x) ; (iii) z = m f (x) + q, con m ̸= 0.
• Esempio. Sia f (y) = y 3 e−y , con y ∈ R+ . Per calcolare il punto di massimo y0
2
11
∫ a
Corollario 2. J(a, β) = t−β dt esiste sse β < 1 e si ha J(a, β) = 1
1−β
· a1−β . ▹
0
∫ ∞
Sia f (t) una funzione continua e limitata. Per stabilire se l’integrale f (t) dt
a
è sommabile non vi è che studiare il comportamento della f ((t), )per t → ∞. Il
teorema 4 assicura che l’integrale è sommabile purché f (t) = o t−1 . (8)
• Esempio. Calcolare il momento k−esimo della v.a. X ∼ GammaInv(x|α, λ) =
λα −(α+1) − λ
x e x , con α, λ ∈ R+ . È agevole verificare che µ′k esiste sse k < α e si ha
Γ(α) ∫ ∞
′ λα −(α−k+1) − λ λk
µk = x e dx =
x . (9)
Γ(α) 0 (a − k)k
5 I simboli di Bachmann-Landau
Sono richiamate le notazioni O e o introdotte in analisi da Bachmann-Landau(10) ,
riguardanti il comportamento limite delle funzioni e delle successioni numeriche. Di
esse si fa largo impiego anche in probabilità e statistica.
Indichiamo con (an )n≥1 , (bn )n≥1 , (cn )n≥1 , . . . , sequenze di numeri che dipendono
a
dall’indice n ∈ N. La scrittura an = bn indica che le sequenze (an )n≥1 e (bn )n≥1
a an
convergono allo stesso numero finito non nullo. E dunque an = bn ⇒ lim = 1.
n→∞ bn
Con riferimento alle successioni numeriche, le notazioni an = O(bn ) e an = o(bn ),
n → ∞, sono cosı́ definite. (11)
12
( ) ( )
In molte applicazioni an n≥1 è la sequenza di interesse, mentre bn n≥1 è la
√
sequenza di confronto, ad es. del tipo, bn = n−1 , bn = n, bn = log n, bn = log log n,
etc. Segue un esempio.
√
Esempio 1. Se an = n(n + log n), bn = 3 − 4n2 , cn = n2 n, allora per n → ∞ si
ha an = O(bn ) e a(n = o(c)n ). Ed ancora: log n = o(nα ), ∀α > 0, sin n−1 = O(n−1 ),
n
cos n−1) = O(1), 1 − n1
( n+1 = O(1), etc. Con un po’ di pazienza si verifica che
Γ 2 √ ( )
n n√
( n ) = O( n) e che 2πn = O(n!) . (12) ▹
Γ 2 e
Da quanto ha preceduto, dovrebbe essere chiaro che non è lecito assumere gli
“enti” O(bn ) e o(bn ) come quantità effettive. Né trattare le notazioni an = O(bn ),
an = o(bn ), etc. come relazioni quantitative. Esse indicano solo il comportamento
asintotico delle serie e/o delle funzioni. Si rifletta sulle affermazioni:
◦ se k ̸= 0 è una costante, si ha an = k + O(1) = O(1) e an = k + o(1) = O(1);
◦ se an =( O(bn ),) segue k · an =( O(bn));
◦ si ha o O(bn ) = o(bn ) e O o(bn ) = o(bn );
◦ è privo di senso dire che dalla an = O(bn ) segue O(bn ) = an ;
◦ se an = o(bn ) e an = o(cn ), non è detto che bn = O(cn );
◦ se an = o(rn ) e bn = o(rn ), non è detto che an = O(bn ).
Il lettore è in grado di verificare, anche mediante esempi, le relazioni algebriche
( ) ( )
ex = o |x|−k , x → −∞ , ∀k ∈ N, ex = O(1) , x → 0, ex = o xx , x → ∞ ,
√ (√ ) 1 ( )
se f (x) = O(x) allora f (x) = O x ed ancora = O x−1 .
f (x)
Ricordando lo sviluppo del binomio di Newton è semplice verificare la relazione
1
= 1 + O(x) , x→0, ∀α ∈ R , (19)
(1 + x)α
12
Si veda la formula di Stirling, la (26), piú avanti in sezione 6.
13
ovvero le relazioni
1
(1 + x)α = 1 + O(x) , x → 0 , = 1 + O(x) , x → 0 , etc.
(1 + x)kα
Dalla (19) è deducibile una lunga serie di relazioni. Segnaliamo tra esse
1 1 (√ )
= 1 + O(e−y ) , y→∞, √ = 1+O x , x→0.
1 + e−y 1+ x
14
6 Funzioni euleriane
Questa sezione presenta una succinta esposizione delle funzioni euleriane di prima
e seconda specie, dette rispettivamente funzione beta e funzione gamma, o anche
integrali euleriani di prima e seconda specie, funzioni che assai ricorrono nella teoria
elementare e nelle applicazioni della probabilità.(13)
. Γ(α + k − 1) Γ(α + k − 1)
Γ(α) = = , (22)
α(α + 1) · · · (α + k − 1) (α)k
13
Le funzioni euleriane rientrano nel vasto capitolo delle funzioni speciali che comprende le fun-
zioni ipergeometriche, le funzioni di Bessel, di Legendre, i polinomi ortogonali, etc. Le funzioni
speciali, ben presenti negli sviluppi della probabilità, hanno grande rilievo nel campo delle equazioni
differenziali, dell’analisi numerica, della teoria dell’approssimazione, etc.
14
Come mostrò Emil Artin (1898-1962), tutti i risultati classici relativi alla funzione gamma
possono essere ricondotti alla proprietà di cui al teorema 5. È immediato constatare che la funzione
Γ(·) è una delle soluzioni della equazione funzionale f (x + 1) = x · f (x) per valori di x ≥ 0.
15
dove k ∈ N è tale che 1 < α + k < 2. Giova osservare che nella (22) la funzione Γ(α)
a primo membro non è un integrale euleriano. ▹
È agevole
∫ ∞ mostrare che ∫ ∞
√ √
− 21 −x
e−x dx = π ∼ = 1.7725 , Γ( 32 ) = 21 π ∼
2
1
Γ( 2 ) = x e dx = = 0.8862 ,
0√ −∞ √
Γ( 52 ) = 3·1
4
π∼ = 1.3293 , Γ( 72 ) = 5·3·1
8
π∼ = 3.3234, etc. Piú in generale
( )
( 1
) (2n − 1)(2n − 3) · · · 3 · 1 √ (2n)! √ 2n n! √
Γ n+ 2 = n
π = 2n
π = π.
2 n! 2 n 22n
Da quest’ultima si ricava l’importante formula di duplicazione
22n ( )
(2n)! = √ · n! Γ n + 12 , (15)
(23)
π
o anche, dopo banali passaggi, l’analoga
22n−1 ( )
Γ(2n) = √ · Γ(n) Γ n + 12 . (24)
π
alla)(22) è possibile, ∀n ∈ N e ∀α ∈ R \ Z−
Grazie ( 0 , calcolare il coefficiente
α 1 Γ(α + 1) (1/2) Γ( 12 )
binomiale = · . Ad esempio: = = − 128
5
;
n n! Γ(α − n + 1) 4
4! Γ(− 2 ) 5
(−1/2) Γ( 12 ) 35
4
= 7 = 128 , risultati già ottenuti.
4! Γ(− 2 )
La funzione gamma è stata tabulata per α ∈ [1, 2]. Per calcolare il valore di Γ(α)
per argomenti esterni all’intervallo [1, 2], si ricorre alla proprietà (i ).
• Esempio. Calcolare i momenti pari della legge normale standard ϕ(x). Si ha
∫ ∞ √ ∫ ∞
x2n e− 2 x dx ,
1 2
2n
E(X ) = x ϕ(x)dx = π2 ·
2n
−∞ 0
◃ La formula di Stirling.
Per il calcolo della funzione gamma si utilizza, per grandi valori di α, lo sviluppo
1 √ { }
Γ(α + 1) = e−α αα+ 2 · 2π · 1 + 12α
1 1
+ 288α 2 − 51840α3 − 2488320α4 + O(α
139 571 −5
) , (25)
16
o anche, in forma logaritmica,
Γ( n+1 ) 1
lim √ 2 n = √ . (28)
n→∞ n · Γ( 2 ) 2
Si ha infatti
√ √
Γ( n+1 ) 1 2π ( n−1 n
) 2 e
− n−1
n−2 ( 1 ) n2 1
√ 2 n ∼
2
= √ ·√ 2
= · 1 + −→ √ .
n · Γ( 2 ) n 2π ( n−2 )
n−1
2 e
− 2
n−2
2en n−2 2
2
Γ( n+1 ) √
Dalla (28) segue 2
n = O( n), per n → ∞.
Γ( 2 )
Nella teoria della funzione gamma ha importanza la derivata logaritmica della
funzione gamma, detta funzione Digamma o funzione Psi, cosı́ definita
Γ′ (α)
ψ(α) = . (29)
Γ(α)
Dal teorema (5) discende facilmente che
1
ψ(α + 1) = + ψ(α) . (30)
α
16
Cioè quando n è molto grande, ad esempio n = NA numero di Avogadro. Nel 2010, per il numero
di Avogadro, il CODATA ha consigliato NA = 6,02214129(27) × 1023 mol−1 ; in parentesi è data la
sd dell’ultima cifra. Per la maggior parte delle applicazioni si assume NA = 6,022 × 1023 mol−1 .
17
Per le necessità del calcolo tornano utili gli sviluppi in serie equivalenti
∞ (
∑ 1 ) ∑∞
1 α
ψ(α) = −γ + − , ψ(α + 1) = −γ + , (31)
j=0
j+1 α+j j=1
j(α + j)
∫
2 1 · 3 · 3 · 5 · 5 · 7··· 24n (n!)4 1 √ √ π
= = lim ( ) e x· 1 − x dx = .
π 2 · 2 · 4 · 4 · 6 · 6··· n→∞ (2n)! 2 (2n − 1) 0 8
18
Il teorema che segue generalizza il teorema 6.
Γ(α1 ) · Γ(α2 ) · · · Γ(αk )
Teorema 7. B(α1 , α2 , . . . , αk ) = . ▹
Γ(α1 + α2 + · · · + αk )
19
∫ ∞ ( ) ( ) ( )
(8 ) N xu, λ−1
0 · N u ψ0 , τ −1
0 du = N x ψ0 , λ −1
1 ;
−∞
∫ 1 ( ) ( ) ( )
(9 ) Bin xθ, n · Beta θα, β dθ = BeBin xα, β, n ;
0
∫ ∞ ( ) ( ) ( )
(10 ) N z µ, ν y −1 · Chi2 y ν dy = Student z µ, 1, ν ;
0
∫ ∞ ( ) ( ) ( )
(11 ) P o xy · Gamma y α, β dy = Bneg x(β + 1)−1 , α ;
0
(12 ) GAMMA-GAMMA
Se p(x) = λ, costante positiva nota, le soluzioni generali delle equazioni (i) e (ii)
risultano rispettivamente
(∫ )
−λx+c −λx
y(x) = e e y(x) = e · e ϕ(x)dx + c . ( 19 )
λx
19
∫
Osservare che eλx ϕ(x)dx è la trasformata di Laplace della funzione ϕ(x).
20
8 Volume della piramide e della sfera (*)
8.1 Volume della piramide
Si calcoli il volume della piramide k−dimensionale
{ ∑
k
}
Pkr = x ∈ Rk : x1 ≥ 0, x2 ≥ 0 . . . xk ≥ 0, xj ≥ r2 , k ≥ 1 .
j=1
Si ha
21
◃ Dim.
Per definizione si ha
∫ ∫ 1 ∫
Vk = dx1 · · · dxk = dxk dx1 · · · dxk−1 .
x21 +x22 +···+x2k ≤1 −1 x21 +x22 +···+x2k−1 ≤1−x2k
∫
( ) k−1
dx1 · · · dxk−1 = Wk−1 (1 − x2k ) = 1 − x2k 2 Vk−1 ,
x21 +x22 +···+x2k−1 ≤1−x2k
∫ ∫ ∫
1 ( ) k−1 1 ( ) k−1 − 12
1 ( ) k+1 −1
y 2 −1 1 − y 2 dy =
1
1− x2k 2
dxk = 1−y 2
y dy =
−1 0 0
( ) ( ) √ ( k+1 )
( 1 k+1 ) Γ 12 Γ k+1 2 π Γ
= B 2, 2 = ( )2 = · ( k2 ) ,
Γ k+2
2
k Γ 2
da cui la formula (34). ▹
Dalla (34) segue la formula del volume della sfera in Rk di raggio unitario
( k+1 )
k−1
2k · π 2
Vk = ·Γ 2
, k = 0, 1, 2, . . . ▹ (35)
k!
5 Vk
4
3
2
1
HkL
5 10 15 20
◃ Nota. Il valore del volume della sfera k−dimensionale di raggio unitario tende a
zero per k → ∞. Al lettore è lasciata la dimostrazione di tale paradossale risultato.
Qui ci si limita a fornire il grafico della (35) in funzione k. Vedasi figura 1. ▹
La (35) poteva essere ricavata usando le trasformazioni sferiche a k−dimensioni.
22
9 Coordinate polari e sferiche (*)
Il sistema di coordinate polari è un sistema di coordinate bidimensionale che ha come
riferimento un punto fisso detto polo, equivalente all’origine del sistema cartesiano
O, e una semiretta (coincidente col verso positivo dell’asse x) avente il polo come
estremo. In tale sistema ogni punto P del piano è identificato da una distanza e da
un angolo.
La prima coordinata, di solito indicata con la lettera ρ, denota la distanza del
punto P dal punto fisso O, la seconda coordinata, di tipo angolare, spesso indicata
con la lettera ϕ e detta angolo azimutale, fornisce l’angolo che la semiretta positiva
dell’asse x deve percorre in senso antiorario per sovrapporsi alla congiungente 0P .
Dunque (ρ, ϕ) ∈ R+ 0 × [0, 2π). Vedi figura 2 (A).
I sistemi di coordinate polari e cartesiane si corrispondono biunivocamente.
Ovvero, ad ogni vettore di coordinate cartesiane (x, y) ne corrisponde uno e uno
solo in coordinate polari (ρ, ϕ), mediante le trasformazioni
{ { √
x = ρ cos ϕ ρ = x2 + y 2
⇔ .
y = ρ sin ϕ ϕ = arctan xy
Passando dalle coordinate cartesiane alle polari, la regola di sostituzione per
integrali multipli stabilisce che si consideri il determinante della matrice jacobiana
∂(x, y) ∂x ∂x
cos ϕ −ρ sin ϕ
|J| = det = ∂ρ ∂ϕ
= = ρ cos2 ϕ + ρ sin2 ϕ = ρ .
∂(ρ, ϕ) ∂y
∂ρ
∂y
∂ϕ sin ϕ ρ cos ϕ
Ρ sin Φ P HAL K
K HBL
Ρ cos Θ P
Ρ Ρ cos Φ Θ Ρ
H2
O
Φ Ρ sin Θ cos Φ Φ
O H H1
Ρ sin Θ sin Φ H
23
I sistemi di coordinate sferiche e cartesiane si corrispondono biunivocamente.
Ovvero, ad ogni vettore di coordinate cartesiane (x, y, z) ne corrisponde uno e uno
solo in coordinate polari (ρ, θ, ϕ), mediante le trasformazioni
√
x = ρ sin θ cos ϕ
ρ= x +y +z
2 2 2
∂(x1 , x2 , . . . , xk )
|J| = det = ρk−1 sink−2 ϕ1 sink−3 ϕ2 · · · sin ϕk−2 .
∂(ρ, ϕ1 , . . . , ϕk−1 )
Vi sono situazioni in cui è piú conveniente ricorrere alla trasformazione λ = ρ2 .
In tal caso il determinante jacobiano risulta
∂(x1 , x2 , . . . , xk )
= 21 λ 2 −1 sink−2 ϕ1 sink−3 ϕ2 · · · sin ϕk−2 .
k
|J| = det
∂(λ, ϕ1 , . . . , ϕk−1 )
◃ Nota 1. L’uso delle coordinate sferiche comporta il calcolo di integrali di potenze
di funzioni trigonometriche. In certi casi, si aggira la difficoltà utilizzando la formula
del volume della sfera k−dimensionale di raggio unitario (35).
Come si è detto nel paragrafo 8.2,{ il valore della
∑ volume della
} sfera k−dimensionale
∫
di raggio r > 0 (e centrata) Skr = x ∈ Rk : kj=1 x2j ≤ r2 , è Wk (r) = S r dx =
( k+1 )
k
k−1
k 2k ·π 2
r · k! · Γ 2 . Ricorrendo alle coordinate k−sferiche si ha
∫
( k+1 )
k−1
2k · π 2
Wk (r) = dx = r · k
·Γ 2
=
Skr k!
24
∫ π ∫ π ∫ π ∫ 2π ∫ r
= sin k−2
ϕ1 dϕ1 sin ϕk−3
2 dϕ2 ··· sin ϕk−2 dϕk−2 dϕk−1 ρk−1 dρ .
0 0 0 0 0
k
r
Tenuto conto che l’ultimo integrale vale si conclude che il valore dei primi
k
( )
k−1
2k · π 2
k − 1 integrali è Ik = · Γ k+1 , k ≥ 2. Dunque I2 = 2π, I3 = 4π, I4 = 2π 2 ,
(k − 1)! 2
I5 = 83 π 2 , I6 = 2π 3 , . . .
◃ Esempio 1. Si consideri l’integrale a simmetria sferica
∫
1 { 1 }
F (w) = √ exp − (x2 + y 2 + z 2 ) dx dy dz ,
2π 2π Cu 2
√
nella variabile reale w > 0, con Cw = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ w}.
Passando alle coordinate sferiche si ha l’integrale a variabili separabili
∫ π ∫ 2π ∫ w
1 { }
F (w) = √ sin θdθ dϕ ρ2 exp − 12 ρ dρ .
2π 2π 0 0 0
√ ∫ w { }
Tenuto conto che I3 = 4π si ha infine F (w) = π2 ρ2 exp − 12 ρ2 dρ.
0
◃ Esempio 2. Si consideri l’integrale a simmetria sferica
∫
1 { 1 }
F (u) = 2 exp − (x21 + x22 + x23 + x24 ) dx1 dx2 dx3 dx4 ,
4π Cu 2
nella variabile reale u > 0, con Cu = {(x1 , x2 , x3 , x4 ) ∈ R4 : x21 + x22 + x23 + x24 ≤ u}.
Trasformando si ha l’integrale a variabili separabili
∫ ∫ ∫ ∫
1 π π 2π u { }
F (u) = 2 2
sin ϕ1 dϕ1 sin ϕ2 dϕ2 dϕ3 λ exp − 12 λ dλ .
8π 0 0 0 0
∫ u { } 1 ( )
Poichè I4 = 2π 2 si ha F (u) = 1
4
λ exp − 12 λ dλ = 1 − e− 2 u 1 + 12 u .
0
25
10 La base empirico-intuitiva della probabilità
Non c’e dubbio che buona parte delle categorie del pensiero probabilistico e degli
oggetti (astratti) del calcolo delle probabilità abbiano come base intutiva le nozioni
empiriche di popolazione, di unità statistica, di esperimento, di risultato di una
prova, di variabile, di mutabile, etc. Richiamiamo dunque alcune elementari nozioni
della statistica descrittiva.
Si intende con popolazione, o universo un ben definito insieme o collettivo di unità
statistiche (d’ora in avanti “u.s.”). Universo e u.s., indicati con Ω e con ω1 , ω2 , . . . ,
sono rappresentabili in un diagramma di Venn.
Non è lecito parlare di universo né di u.s. senza aver chiarito volta per volta
lo scopo e l’ambito dell’indagine (statistica) che si intende eseguire. Ad esempio, se
l’ambito dell’analisi è la Sardegna, e lo scopo dell’analisi riguarda il diabete giovanile,
l’universo è dato dai sardi con meno di 25 anni e l’u.s. è il giovane sardo. Se l’indagine
riguarda i consumi domestici di elettricità, Ω è l’insieme delle famiglie domiciliate in
Sardegna e l’u.s. è la famiglia (e non gli individui che ne fanno parte). Se lo scopo
della ricerca è la nuzialità, Ω è dato dalle coppie di sposi sardi e l’u.s. è la coppia di
sposi. Segue dunque la definizione.
Definizione 7. Prende il nome di unità statistica (d’ora in poi u.s.) l’oggetto min-
imo osservabile (irriducibile ai fini dell’analisi), associato al fenomeno collettivo in
studio. ▹
26
Una volta definiti i caratteri di interesse (ovvero la loro natura) è obbligatorio
possedere un ben preciso protocollo di misura dei caratteri. Protocollo qui inteso
come funzione, diciamo x = x(ω), che a ogni ω ∈ Ω fa corrispondere l’osservazione
x ∈ X , dove X indica l’insieme dei valori o delle modalità che x può assumere.
L’indagine statistica può riguardare tutte le u.s. di Ω o solo una parte di esse
sorteggiate con un qualche criterio di casualità. Nel primo caso si parla di indagine
esaustiva nel secondo di indagine campionaria. Decidere se procedere esaustivamente
oppure a campione è solo questione di convenienza. Il ricorso al campionamento è
conveniente, quando non eludibile, se (i) la popolazione è costituita da un numero
immenso di u.s., ed è impensabile ed inutile condurre indagini esaustive e se (ii ) pur
in presenza di popolazioni limitate, le prove sono lunghe e/o costose e/o distruttive.
Grazie al protocollo di misura e ad un criterio di indagine si può parlare di dati.
Si dà la definizione
27
stesso. Tale escamotage consente di trattare le misure ripetute alla stregua di ogni
altro tipo di osservazioni.
Se la popolazione Ω è molto ridotta può essere utile, in certi casi, assimilare
l’insieme delle sue u.s. ad un campione proveniente da un’ampia popolazione virtuale
detta superpopolazione. A tale concetto si fa largo ricorso in statistica inferenziale.
Ad esempio, nel caso di malattie genetiche rare che colpiscono poche decine di
persone al mondo, la superpopolazione, è virtualmente costituita oltre che dai malati
osservati anche dai malati presenti, passati e futuri, non osservati e/o di cui non si
ha notizia.
Una volta raccolti, i dati devono essere ordinati e rappresentati. Se il carattere
in studio è una variabile, i dati x = (x1 , x2 , . . . , xn ) sono ordinabili su una retta. Si
dànno le definizioni.
Definizione 9. Si definisce campione n−ordinato, e si scrive (x(1) , x(2) , . . . , x(n) ), la
successione delle osservazioni x riordinate in senso crescente. ▹
Si pone xmax = max{x1 , x2 , . . . , xn } e xmin = min{x1 , x2 , . . . , xn }.
Definizione 10. Si definisce range (o campo di variazione) delle osservazioni x la
quantità non negativa range = xmax − xmin = x(n) − x(1) . ▹
Quale che sia la natura delle osservazioni, può essere comodo, quanto piú n è
grande, accorparle in sottogruppi o classi o coorti, in base a qualche criterio di buon
senso. La scelta delle classi non è né univoca né esente da soggettività, specie nel
caso di variabili reali.
Definizione 11. Si definisce partizione di X una qualsiasi collezione finita di classi
{Aj , j = 1, 2, . . . , k}, tale che: (i) ∪kj=1 Aj = X , (ii) Aj ∩ Ah = Ø, ∀j ̸= h. ▹
Se x è un carattere continuo, possiamo partizionare X in classi della forma
Aj = [ξj−1 , ξj ), j = 1, 2, . . . , k. La scelta delle delimitazioni ξ0 , ξ1 , . . . , ξk non è
univoca e risponde solo a criteri di comodità e buon senso. Se xi ∈ X = R+ 0 è
l’energia elettrica (in kW h) consumata dall’utente ωi ∈ Ω, e si assume la partizione:
A1 = [0, 50), A2 = [50, 100), A3 = [100, 200), A4 = [200, 500), A5 = [500, +∞), è
evidente che xi appartiene ad una ed una sola delle classi Aj .
Se x è una discreta la procedura varia di poco. Se l’u.s. è il nucleo familiare
e il carattere x è il numero dei suoi componenti, e dunque xi ∈ X = {1, 2, . . . } =
N, si può assumere una partizione del tipo (A1 , . . . , Aj , . . . , Ak ), dove Aj = {j},
∀j = 1, . . . k − 1, e Ak = {k, k + 1, . . . }. (L’ISTAT assume k = 8.) Poche cautele
in piú se x è una mutabile. Ad esempio, se x è lo stato civile, ogni osservazione xi
assume una (ed una sola) delle 5 modalità: A1 = celibe/nubile, A2 = sposato/a,
A3 = separato/a, A4 = vedovo/a, A5 = divorziato/a.
Le definizioni che seguono sono valide qualunque sia il carattere x.
Definizione 12. Sia x una osservazione, sia A un evento. Si definisce indicatore
dell’evento A (o funzione indicatrice) la funzione y = 1A (x), che assume il valore
y = 1 se x ∈ A ed y = 0 se x ̸∈ A. ▹
Definizione 13. Il carattere x è detto dicotomico se esso si articola in due sole
classi {A, Ā}. Per convenzione, diciamo che x costituisce un successo [insuccesso]
se x ∈ A [x ∈ Ā].
28
Esempi di caratteri dicotomici: presente/assente, maschio/femmina,
∑ +/−, 1 /0,
aperto/chiuso, minorenne/maggiorenne, etc. La somma n1 = ni=1 yi , che conta gli
“1 ” (i successi) in y, coincide con la frequenza di A in x. La differenza n0 = n − n1 ,
il numero di “0 ” (gli insuccessi) in y, è la frequenza di Ā in x.
φ(x1 , x2 , . . . , xn ) = φ(m, m, . . . , m) . ▹
1 ∑
n
x1 + x2 + · · · + xn
m = x̄ = = xi . ▹
n n i=1
29
Definizione 17. Posto che xi > 0 ∀i, si definiscono media armonica e media geome-
trica gli indici
n n
ma = = ∑ ,
1 1 1 1
+ + ··· + n
i=1
x1 x2 xn xi
√ {∏
n } n1
mg = n x1 , ·x2 · · · · · xn = xi .▹
i=1
1∑ 1 1∑
n n
1
Si noti che = e che log mg = log xi . Vale il teorema
ma n i=1 xi n i=1
1 ∑
n
Dev
V ar = s = 2
= (xi − x̄)2 ,
n n i=1
1 ∑
n
n
V arc = s2c = (xi − x̄)2 = V ar . ▹
n − 1 i=1 n−1
30
Devianza, varianza e s.q.m. sono indici di variabilità. La varianza e lo e s.q.m.
sono anche una misure di variabilità. È facile vedere che ∀n V ar < V arc , e che per
n grande V ar ∼ = V arc .
È facile mostrare che la varianza dei dati dicotomici y = (y1 , y2 , . . . , yn ), aventi
frequenza relativa di successo pn , è data da V ar = pn (1 − pn ).
1 ∑ k
n
xk1 + xk2 + · · · + xkn
m′k = = x ,
n n i=1 i
1 ∑ 1 ∑
n n
mk (t) = k
ϵi (t) = (xi − t)k . ▹
n i=1 n i=1
1 ∑ k 1 ∑
n n
mk = ϵi = (xi − x̄)k . ▹
n i=1 n i=1
La varianza s2 , media dei quadrati degli scarti, coincide con il momento secondo
centrato m2 . Si osservi che mk (0) = m′k , che mk (x̄) = mk e che il momento m′1
coincide con la media, etc.
Definizione 25. Per ogni n−pla di osservazioni x la relativa successione delle medie
k−esime {rk′ , k ∈ N}, gode delle seguenti proprietà: (i) r1′ ≤ r2′ ≤ · · · ≤ rk′ ≤ . . . ,
valendo simultaneamente il segno di eguale se e solo se x1 = x2 = · · · = xn ; (ii )
limk→∞ rk′ = x(n) , limk→0 rk′ = mg . ▹
31
10.2 Geometria delle masse ed indici statistici
Tra geometria delle masse e statistica vi sono profonde analogie formali: proprietà
valide in un contesto possono essere utilmente trasferite nell’altro. È facile vedere
che (i) il baricentro di un sistema di n masse puntuali di massa n1 concentrate nelle
xi si trova in x̄; (ii ) i momenti di inerzia calcolati rispetto all’origine e al baricentro
coincidono con m′2 e m2 .
Valgono le importanti proprietà.
Teorema 10. (Christiaan Huygens, 1655.) V ar = m′2 − x̄2 .
Corollario
∑n 3. Per ogni n−pla di osservazioni x è nulla la somma degli scarti
i=1 (xi − x̄) = 0.
In numerosi casi è utile conoscere il valore che, sull’asse delle x, segue la prima
metà delle osservazioni e precede la seconda metà. O, equivalentemente, il valore
prima e dopo il quale si colloca un uguale numero di osservazioni. Formalmente
Definizione 26. Si dice mediana,∑ o punto mediano, delle osservazioni x, il punto
di minimo della funzione SL (t) = ni=1 |xi − t|. Equivalentemente, si dice mediana
il punto me soluzione del sistema di disuguaglianze H(m−e ) ≤ 2 n ≤ H(me ).
1 +
32
Il secondo quartile coincide con la mediana, cioè q2 = me .
SL HtL SL HtL
25 25
20 20
15 15
Hn=5L Hn=6L
10 10
5 5
me Ht,xL me Ht,xL
-2 2 4 6 -2 2 4 6
Si osservi che mentre i quartili sono indici di posizione, gli interquartili e il range
interquartile sono indici di variabilità. Nel caso di osservazioni non negative torna
utile l’indice di variabilità che segue.
∑
Definizione 29. Data n−pla di osservazioni x, con xi ≥ 0, ∀i, con ni=1 xi > 0, si
s
definisce coefficiente di variazione (di K. Pearson) il rapporto qV = . ▹
x̄
Il coefficiente di variazione è un indice adimensionale che esprime la variabilità
relativa del carattere x in relazione all’intensità media √del carattere nel collettivo.
Essendo limitato (è facile dimostrare che 0 ≤ qV ≤ n − 1), qV è un indice di
variabilità relativa.
Tale indice, risulta prezioso quando si debbono mettere a confronto situazioni
e/o popolazioni differenti. Ad esempio, quando si deve paragonare la precisione
(relativa) di strumenti di misura eterogenei (la bilancia del farmacista con la bilancia
dell’ortolano). O anche per stabilire confronti fra differenti specie di viventi (la
variabilità relativa del peso dei pulcini e dei vitelli), etc.
◃ Quale media “scegliere”.
La guida più sicura per scegliere la media è la definizione 15 di Chisini. Chiedersi,
in astratto, quale sia il “miglior valore di sintesi” della n−pla x è domanda priva di
senso. Se, ad esempio, le xi sono i tassi di interesse annui praticati da una banca ad
uno stesso creditore, in n anni consecutivi, è facile
∏n mostrare,1/n in base alla definizione
di Chisini, che il tasso medio annuo è xM = { i=1 (1 + xi )} − 1. Se invece gli xi
sono i tassi di interesse praticati, in un certo anno, ad n clienti a ciascuno dei quali è
stata accordata una stessa somma, è facile vedere che il tasso medio praticato dalla
banca è la media aritmetica x̄. ▹
33
11 Derivate vettoriali
Dati i vettori colonna a, b, x, y, . . . e le matrici A, B, C . . . , di dimensioni tali
che siano possibili i prodotti aT x, Ax, y T Ax, etc. Si ha
∂ T ∂ T ∂ ∂ T T
x a= a x=a, Ax = x A = AT ,
∂x ∂x ∂x ∂x
∂ T ∂2
y A x = AT y , yT A x = A .
∂x ∂x∂y
Sia S una matrice simmetrica. La derivata della forma quadratica Q(x) = xT Sx
è data da
∂ ∂ T ∂2 ∂2 T
Q(x) = x S x = 2Sx , Q(x) = x S x = 2S .
∂x ∂x ∂x2 ∂x2
34