Sei sulla pagina 1di 3

FORMULARIO PER ESAME DI STATISTICA

Probabilita’

P [A] = 1 − P [A]; P [A ∪ B] = P [A] + P [B] − P [A ∩ B]; P [A|B] = P [A ∩ B]/P [B];


P [A1 ∩ A2 ∩ ... ∩ An ] = P [A1 ]P [A2 |A1 ]P [A3 |A1 ∩ A2 ] · · · P [An |A1 ∩ · · · ∩ An−1 ];
indipendenza ⇔ P [A ∩ B] = P [A] · P [B].
X P [Ai ]P [B|Ai ]
Data partizione {Ai } : P [B] = P [Ai ]P [B|Ai ]; P [Ai |B] = P .
i j P [Aj ]P [B|Aj ]

Variabili casuali e valori attesi


Z x X Z X
  
FX (x) = fX (y)dy = fX (xi ) ; E[g(X)] = g(x)fX (x)dx = g(xi )fX (xi ) ;
−∞ xi ≤x R xi
2 2 2 2
µX = E[X]; σX = V ar[X] = E[(X − E[X]) ] = E[X ] − (E[X])

Tchebycheff: per g non negativa vale P [g(X) ≥ a] ≤ E[g(X)]/a; Corollario: P [|X − µX | < tσX ] ≥ 1 − 1/t2

Cov[X, Y ] = E[(X − µX )(Y − µY )] = E[XY ] − µX µY .


k
X k
X Xk k
X X
E[ ai Xi ] = ai E[Xi ]; V ar[ ai Xi ] = a2i V ar[Xi ] + 2 ai aj Cov[Xi , Xj ]
i=1 i=1 i=1 i=1 i<j

Distribuzioni notevoli
 Uniforme discreta: fX (x) = fX (x, N ) = 1/N se x ∈ {1, .., N }; E[X] = (N + 1)/2; V ar[X] = (N 2 − 1)/12
 Bernoulli: fX (x) = fX (x, p) = px (1 − p)
1−x se x ∈ {0, 1}; E[X] = p; V ar[X] = p(1 − p)
n x
 Binomiale: fX (x) = fX (x, n, p) = x p (1 − p)n−x se x ∈ {0, 1, .., n}; E[X] = np; V ar[X] = np(1 − p)
(K )(M −K ) K
 Ipergeometrica: fX (x) = fX (x, M, K, n) = x Mn−x se x ∈ {max(0, n − M + K), .., min(K, n)}; E[X] = n M
(n)
(nA )( nB )
ovvero: fX (x) = fX (x, nA , nB , n) = xnA +nn−x se x ∈ {max(0, n − nB ), .., min(nA , n)}; E[X] = n nAn+n
A
( n B) B

K M −K M −n nA nB nA +nB −n
 
V ar[X] = n M M M −1 ovvero = n nA +nB nA +nB nA +nB −1
x
 Poisson: fX (x) = fX (x, λ) = λx! exp(−λ) se x ∈ N; E[X] = λ; V ar[X] = λ
Binomiale(n, p) Poisson(λ), con λ = np se n ≥ 100, p ≤ 0.05.
X1 ∼ P oisson(λ1 ), X2 ∼ P oisson(λ2 ), indipendenti ⇒ X1 + X2 ∼ P oisson(λ1 + λ2 ).
 Geometrica: fX (x) = fX (x, p) = p(1 − p)x se x ∈ N; E[X] = 1−pp ; V ar[X] = 1−p
p2

 Uniforme continua: fX (x) = fX (x, a, b) = 1/(b − a) se x ∈ [a, b]; E[X] = (a + b)/2; V ar[X] = (b − a)2 /12
2
 Normale N (µ, σ 2 ) : fX (x) = fX (x, µ, σ 2 ) = √ 1 2 exp − 12 (x−µ)
σ 2 ; E[X] = µ; V ar[X] = σ 2
2πσ
Binomiale(n, p) Normale(µ, σ 2 ), con µ = np, σ 2 = np(1 − p) per np(1 − p) ≥ 10.
 Esponenziale: fX (x) = fX (x, λ) = λ exp(−λx) se x ∈ R+ ; E[X] = 1/λ; V ar[X] = 1/λ2
 Weibull: fX (x) = fX (x, α, β) = αβxβ−1 exp(−αxβ ) se x ∈ R+ .

Trasformazione Y = g(X), T = max, Z = min


d −1
g (y)|fX (g −1 (y)) se X continua e g invertibile.
P
fY (y) = xi :g(xi )=y fX (xi ) se X discreta, fY (y) = | dy
R  P 
FY (y) = P [Y ≤ y] = P [g(X) ≤ y] = {x:g(x)≤y} fX (x)dx = {xi :g(xi )≤y} fX (xi ) .
Xi ∼ Fi , indipendenti. T = max{X1 , ...Xn }, Z = min{X1 , ...Xn }.
Y Y
FT (x) = Fi (x), F Z (x) = F i (x), dove F (x) = 1 − F (x).
i i
Processo Poisson
Nλ (t) = numero occorrenze in [0, t]. Nλ (0) = 0; Nλ (t) ∼ P oisson(λt); P [Nλ (t) = 0] = exp(−λt)
Se 0 < t1 < t2 , Nλ (t1 ) ∼ P oisson(λt1 ) e Nλ (t2 − t1 ) = Nλ (t2 ) − Nλ (t1 ) ∼ P oisson(λ(t2 − t1 )) indipendenti.

Distribuzioni campionarie
 Media campionaria X n = (X1 + X2 + ...Xn )/n, E[X n ] = µX , V ar[X n ] = σX 2 /n.
1
 Varianza campionaria corretta Sn2 = n−1 2 E[Sn2 ] = σX
2 .
P
i (Xi − X n ) ,
2 2 2 2
 Distribuzione χ : U ∼ χn se U = Z1 + ... + Zn con Zi ∼ N (0, 1) indipendenti.
 Distribuzione t: T ∼ tn se T = √Z con Z ∼ N (0, 1), U ∼ χ2n indipendenti.
U/n
 Distribuzione F : F ∼ Fm,n se F = U/m
V /n con U ∼ χ2m , V ∼ χ2n indipendenti. fm,n,1−α = 1/fn,m,α .

Stime intervallari (Xi con distribuzione normale, escluso proporzioni)


 Media, varianza nota: (X n − z1−α/2 √σn , X n + z1−α/2 √σn )
√ 2 √ 2
Sn S
 Media, varianza non nota: (X n − tn−1,1−α/2 n , X n + tn−1,1−α/2 √nn )

q 2 q 2
σ σ2 σ σ22 
 Differenza medie, varianze note: (X 1 − X 2 ) − z1−α/2 n11 + n22 , (X 1 − X 2 ) + z1−α/2 n11 + n2
2 (n −1)S 2 +(n −1)S 2 1 1
, Sδ2 = Spool2

 Differenza medie, varianze non note da ritenersi uguali: Spool = 1 n1 +n 1 2
2 −2
2
n1 + n2
q q 
(X 1 − X 2 ) − tn1 +n2 −2,1−α/2 Sδ2 , (X 1 − X 2 ) + tn1 +n2 −2,1−α/2 Sδ2
2 2 
 Varianza: χ2(n−1)Sn , χ(n−1)S
2
n
n−1,1−α/2 n−1,α/2
σ2 S2 S2 
 Rapporto varianze σ22 : S22 fn1 −1,n2 −1,α/2 , S22 fn1 −1,n2 −1,1−α/2
1 q1 1 q
p̂(1−p̂) p̂(1−p̂) 
 Proporzione: p̂ − z1−α/2 n , p̂ + z1−α/2 n
q q
p̂1 (1−p̂1 ) p̂2 (1−p̂2 ) p̂1 (1−p̂1 ) p̂2 (1−p̂2 ) 
 Differenza proporzioni: (p̂1 − p̂2 ) − z1−α/2 n1 + n2 , (p̂ 1 − p̂ 2 ) + z 1−α/2 n1 + n2 .

Test ipotesi (popolazione con distribuzione normale, escluso proporzioni), statistiche da usare

 Media, varianza nota: Z = X nσ−µ0 n ∼ N (0, 1) sotto H0 : µ = µ0 .
n −µ0

 Media, varianza non nota: T = X√ 2
n ∼ tn−1 sotto H0 : µ = µ0 .
Sn
(X 1 −X 2 )−d
 Differenze medie, varianze note: Z = r
2
∼ N (0, 1) sotto H0 : µ1 − µ2 = d.
σ1 σ2
n1
+ n2
2
(X −X )−d
 Differenze medie, varianze non note da ritenersi uguali: T = q 1 q2 ∼ tn1 +n2 −2 sotto H0 : µ1 − µ2 = d.
1
2
Spool n
+ n1
1 2
(n−1)Sn2
 Varianza: V = σ02
∼ χ2n−1 sotto H0 : σ 2 = σ02 .
 Rapporto varianze: F = S12 /S22 ∼ Fn1 −1,n2 −1 sotto H0 : σ12 /σ22 = 1.
 Proporzione: Z = qpbpb−p 0
(1−bp)
∼ N (0, 1), ovvero anche Z = q ppb−p 0
(1−p )
∼ N (0, 1), sotto H0 : p = p0 .
0 0
n n
pb1 −b
 Differenza proporzioni: posto pb = n1npb11 +n
+n2 pb2
2
, vale Z = √ p2
∼ N (0, 1) sotto H0 : p1 − p2 = 0.
pb(1−b
p)(1/n1 +1/n2 )

 Non correlazione: T = √ rXY2 n − 2 ∼ tn−2 sotto H0 : ρXY = 0.
1−rXY

ANOVA
 Anova ad un fattore sotto controllo.
Variazione gdl Somme quadrati Quadrati medi F
2
SSB = n1 kj=1 Y•j2 − Ynk M SB = SS M SB
P ••
tra gruppi k-1 B
k−1 M SW
err sper. k(n-1) SSW = ni=1 kj=1 Yij2 − n1 kj=1 Y•j2 SSW
P P P
M SW = k(n−1)
2
SST C = ni=1 kj=1 Yij2 − nkY ••
P P
totale nk-1
 Anova due fattori sotto controllo.
Variazione gdl Somme quadrati Quadrati medi F
2
SSA = n1 kj=1 Y•j2 − Ynk M SA = SS M SA
P ••
tra colonne k-1 A
k−1 M Sexp
2
SSB = k1 ni=1 Yi•2 − Ynk SSB M SB
P ••
tra righe n-1 M SB = n−1 M Sexp
SSexp
err sper. (k-1)(n-1) SSexp = SST C − SSA − SSB M Sexp = (k−1)(n−1)
Pn Pk 2
totale nk-1 SST C = i=1 j=1 Yij2 − nkY ••

 Anova due fattori e interazioni sotto controllo, p replicazioni.


Variazione gdl Somme quadrati Quadrati medi F
2
Y•••
1 Pk
tra colonne k-1 SSA = np 2
j=1 Y•j• − nkp M SA = SS A
k−1
M SA
M Sexp
2
Y•••
1 Pn 2 SSB M SB
tra righe n-1 SSB = kp i=1 Yi•• − nkp M SB =n−1 M Sexp
2
Y••• SSA×B M SA×B
interazione (k-1)(n-1) SSA×B = p1 ni=1 kj=1 Yij• 2 − SS − SS −
P P
A B nkp M SA×B = (k−1)(n−1) M Sexp
SSexp
err sper. nk(p-1) SSexp = SST C − SSA − SSB − SSA×B M Sexp = nk(p−1)
2 − nkpY 2
SST C = ni=1 kj=1 pl=1 Yijl
P P P
totale nkp-1 •••

 Confronti: Γ = kj=1 cj µ•j con kj=1 cj = 0, oppure Γ = ni=1 ci µi• con ni=1 ci = 0.
P P P P
Stimatore per Γ, e corrispondenti valore atteso e varianza, da determinarsi di conseguenza.

Regressione lineare semplice, modello Yi = β0 + β1 xi + i , i ∼ N (0, σ 2 )


Stimatori di β0 , β1 e σ 2 :
(Yi − Ybi )2
P P
(xi − x)(Yi − Y ) 2
B1 = , B 0 = Y − B 1 x, S res = .
(xi − x)2
P
n−2
Test e intervalli per le stime ottenibili da
σ2 x2 σ2x
   
2 1

B1 ∼ N β 1 , ; B 0 ∼ N β0 , σ + ; Cov[B 0 , B 1 ] = − .
(xi − x)2 (xi − x)2 (xi − x)2
P P P
n
Stimatore della risposta media: Yb0 = B0 + B1 x0 .
2 
 
2 1 (x 0 − x)
Yb0 ∼ N β0 + β1 x0 , σ +P .
n (xi − x)2
Stimatore della risposta singola (previsione): Yb0 = B0 + B1 x0 .
(x0 − x)2 
 
2 1
Y0 ∼ N β0 + β1 x0 , σ 1 + + P
b .
n (xi − x)2
 Anova.
(Yi − Y )2 = (Ybi − Y )2 + (Yi − Ybi )2 ;
P P P
SST ot = SSReg + SSRes ,
MS SS /1
Test F per modello: F = M SReg
Res
= SSResReg
/(n−2) ∼ F1,n−2 sotto H0 : β1 = 0;
Indice determinazione R2 = SSReg /SST ot .
Pp
Regressione lineare multipla, modello Yi = β0 + j=1 βj xij + i , i ∼ N (0, σ 2 )
Stimatori per i βj e σ 2 :
b 0 (Y − Y)
(Y − Y) b
B = (X0 X)−1 X0 Y, 2
Sres = ,
n−p−1
dove  
1 x11 x12 x13 ...
 1 x21 x22 x23 ... 
X=  1 x31

x32 x33 ... 
... ... ... ... ...
 
V ar[B0 ] Cov[B0 , B1 ] Cov[B0 , B2 ] ...
Cov[B 0 , B1 ] V ar[B1 ] Cov[B1 , B2 ] ... 
V (B) = (X0 X)−1 σ 2 = 


 Cov[B0 , B2 ] Cov[B1 , B2 ] V ar[B2 ] ... 
... ... ... ...

Potrebbero piacerti anche