Sei sulla pagina 1di 4

Formulario

Brunero Liseoa , Andrea Tancredib


a Sapienza Università di Roma
b Sapienza Università di Roma

1. Statistica descrittiva
Notazione.
• n è la dimensione della popolazione o del campione
• x1 , x2 , . . . , xn sono i valori del carattere X osservato sulle n unità del collettivo
• x1 , x2 , . . . , xk sono le k possibili modalità che un carattere può assumere.
• n1 , n2 , . . . , nk sono le frequenze assolute con cui le modalità vengono osservate nel collettivo
• f1 , f2 , . . . , fk sono le frequenze relative con cui le modalità vengono osservate nel collettivo. Ovviamente, per ogni
j = 1, . . . , k, fj = nj /n.
• N1 , N2 , . . . , Nk sono le frequenze assolute CUMULATE, dove Nj = ji=1 ni .
P

• F1 , F2 , . . . , Fk sono le frequenze relative CUMULATE, dove Fj =


Pj
i=1 fi . Ovviamente, per ogni j = 1, . . . , k,
Fj = Nj /n.
• x(1) , x(2) , . . . , x(N ) : valori del carattere X osservati, in ordine non decrescente, sulle N modalità del collettivo.

1.1. Indici statistici


• media aritmetica µ
n k k
1X 1X X
µ= xi = xj nj = xj f j
n i=1 n j=1 j=1

• varianza
n k k k
1X 1X X 1X 2
σ2 = (xi − µ)2 = (xj − µ)2 nj = (xj − µ)2 fj = xj nj − µ2
n i=1 n j=1 j=1
n j=1

• Lo scarto quadratico medio σ è definito come la radice quadrata positiva della varianza.
• In assenza di altre informazioni, se le modalità sono espresse in classi, si sostituiscono i valori delle modalità Xj
sopra scritti con i valori centrali delle classi. Se invece si dispone dei totali di classe, i valori delle Xj si sostituiscono
con le medie delle classi.
• mediana M : dopo avere ordinato gli n valori della distribuzione, si definisce M il valore che occupa la posizione
(n + 1)/2 (se n è dispari) oppure qualunque valore compreso tra quelli che occupano le posizioni n/2 ed n/2 + 1
(se n è pari). Nel caso di distribuzioni di frequenza, M è la modalità a cui corrisponde la prima modalità con
frequenza relativa cumulata superiore o uguale a 0.5. Nel caso di distribuzioni con classi di modalità, si trova
prima la classe mediana. Detti a e b gli estremi si calcola
n/2 − Fa
M =a+ (b − a)
Fb − Fa

Preprint submitted to Elsevier January 2, 2023


• coefficiente di variazione: CV = σ/|µ|.
• devianza D = nσ 2
• codevianza: Cxy n
P Pn
i=1 (xi − µx )(yi − µy ) = i=1 xi yi − nµx µy
• covarianza σxy = Cxy /n
• coefficiente di correlazione
σxy Cxy
r= = p
σx σy Dx Dy
• Indice di Laspeyres Pk Pk Pk
i=1 xi wi i=1 (pti /pbi )(pbi qbi ) i=1 pti qbi
L
b t = P k
= P k
= Pk
,
i=1 w i i=1 p bi q bi i=1 pbi qbi

• Indice di Paasche Pk Pk Pk
wi i=1 pti qti pti qti
b Pt = Pk i=1 = Pk = Pki=1 .
i=1 wi /xi i=1 (pbi /pti )(pti qti ) i=1 pbi qti

• Tabelle di contingenza: frequenze teoriche di indipendenza: n∗hj = nh· n·j /n


• indice χ2
r X
s
!2 r Xs r Xs
!
X nhj − n∗hj X (nhj − n∗hj )2 X n2hj
2
χ = n∗hj = =n −1 .
n∗hj n∗hj nho noj
h=1 j=1 j=1
h=1 j=1 h=1

• dipendenza in media Pr
2 Sm (ȳh − ȳ)2 nho
ηy|x = = Ph=1
s .
j=1 (yj − ȳ) noj
Dy 2

• regressione
CXY
ŷ = b0 + b1 x; b1 = ; b 0 = µy − b 1 µX ; ŷi = b0 + b1 xi ; ei = yi − ŷi
DX
N N
X X devianza spiegata
Devianza spiegata = (ŷi − µY )2 Devianza residua = e2i R2 = r 2 =
i=1 i=1
devianza di Y

2. Probabilità
• Unione di eventi: P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
• Intersezione di eventi: P (A ∩ B) = P (A) × P (B|A) = P (B) × P (A|B)
• indipendenza: P (A|B) = P (A|B̄) = P (A)
• coefficiente binomiale: Cn,k = nk = k!(n−k)!
n!


• disposizioni semplici: Dn,k = n!


(n−k)!
• Teorema di Bayes: per ogni j = 1, . . . k,
P (Aj )P (B|Aj )
P (Aj |B) = Pk
h=1 P (Ah )P (B|Ah )

• Distribuzione binomiale, X ∼ Bin(n, p):


!
n j
P (X = j) = p (1 − p)n−j , µX = E(X) = np, 2
Var(X) = σX = np(1 − p).
j

2
• Distribuzione normale: X ∼ N (µ, σ 2 ) se la densità della variabile aleatoria è

(x − µ)2
 
1
f (x) = √ exp − , x ∈ R.
σ 2π 2σ 2

Se X ∼ N (µ, σ 2 ),  
X −µ a−µ a − µ
P (X ≤ a) = P ≤ =Φ
σ σ σ

3. Inferenza

3.1. Inferenza per una proporzione


• Stima puntuale: p̂ = k/n; numero di successi su numero di prove.
• Intervallo di confidenza di livello 1 − α:
r r !
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z1−α/2 ; p̂ + z1−α/2
n n

• Test d’ipotesi: H0 : p = p0 ; H1 : p ̸= p0 . La statistica test è


p̂ − p0
T = q
p0 (1−p0 )
n

con p-value associato alla t osservata t∗


pv = P (|T | > t∗ |H0 )
dove la v.a. T ha distribuzione normale standard

3.2. Inferenza per una media di una popolazione normale


• Stima puntuale: x̄ = 1
Pn
n j=1 xi
• Intervallo di confidenza di livello 1 − α
 
s s
x̄ − tn−1,1−α/2 √ ; x̄ + tn−1,1−α/2 √
n n
dove v
u n
u 1 X
s=t (xj − x̄)2
n − 1 j=1

• Test d’ipotesi: H0 : µ = µ0 ; H1 : µ ̸= µ0 . La statistica test è


ˆ − µ0

T = q
s2
n

con p-value associato alla t osservata t∗


pv = P (|T | > t∗ |H0 )
dove la T è una v.a. t di Student con n − 1 gradi di libertà.

3
3.3. Test χ2
• goodness of fit: Se, per i = 1, . . . , k Oi sono le frequenze osservate nelle k categorie ed Ei sono le frequenze attese
sotto l’ipotesi nulla
k
X (Oi − Ei )2
χ2 =
i=1
Ei

con p-value associato al valore osservato χ2oss

pv = P χ2k−1 > χ2oss |H0




• test di indipendenza H0 : X e Y sono indipendenti.


r Xs r Xs
!
2
X (nhj − n∗hj )2 X n2hj
χ = =n −1 .
j=1
n∗hj j=1
nho noj
h=1 h=1

con p-value associato al valore osservato χ2oss

pv = P χ2d > χ2oss |H0 ,




con d = min(r − 1, s − 1).

Potrebbero piacerti anche