Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1. Statistica descrittiva
Notazione.
• n è la dimensione della popolazione o del campione
• x1 , x2 , . . . , xn sono i valori del carattere X osservato sulle n unità del collettivo
• x1 , x2 , . . . , xk sono le k possibili modalità che un carattere può assumere.
• n1 , n2 , . . . , nk sono le frequenze assolute con cui le modalità vengono osservate nel collettivo
• f1 , f2 , . . . , fk sono le frequenze relative con cui le modalità vengono osservate nel collettivo. Ovviamente, per ogni
j = 1, . . . , k, fj = nj /n.
• N1 , N2 , . . . , Nk sono le frequenze assolute CUMULATE, dove Nj = ji=1 ni .
P
• varianza
n k k k
1X 1X X 1X 2
σ2 = (xi − µ)2 = (xj − µ)2 nj = (xj − µ)2 fj = xj nj − µ2
n i=1 n j=1 j=1
n j=1
• Lo scarto quadratico medio σ è definito come la radice quadrata positiva della varianza.
• In assenza di altre informazioni, se le modalità sono espresse in classi, si sostituiscono i valori delle modalità Xj
sopra scritti con i valori centrali delle classi. Se invece si dispone dei totali di classe, i valori delle Xj si sostituiscono
con le medie delle classi.
• mediana M : dopo avere ordinato gli n valori della distribuzione, si definisce M il valore che occupa la posizione
(n + 1)/2 (se n è dispari) oppure qualunque valore compreso tra quelli che occupano le posizioni n/2 ed n/2 + 1
(se n è pari). Nel caso di distribuzioni di frequenza, M è la modalità a cui corrisponde la prima modalità con
frequenza relativa cumulata superiore o uguale a 0.5. Nel caso di distribuzioni con classi di modalità, si trova
prima la classe mediana. Detti a e b gli estremi si calcola
n/2 − Fa
M =a+ (b − a)
Fb − Fa
• Indice di Paasche Pk Pk Pk
wi i=1 pti qti pti qti
b Pt = Pk i=1 = Pk = Pki=1 .
i=1 wi /xi i=1 (pbi /pti )(pti qti ) i=1 pbi qti
• dipendenza in media Pr
2 Sm (ȳh − ȳ)2 nho
ηy|x = = Ph=1
s .
j=1 (yj − ȳ) noj
Dy 2
• regressione
CXY
ŷ = b0 + b1 x; b1 = ; b 0 = µy − b 1 µX ; ŷi = b0 + b1 xi ; ei = yi − ŷi
DX
N N
X X devianza spiegata
Devianza spiegata = (ŷi − µY )2 Devianza residua = e2i R2 = r 2 =
i=1 i=1
devianza di Y
2. Probabilità
• Unione di eventi: P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
• Intersezione di eventi: P (A ∩ B) = P (A) × P (B|A) = P (B) × P (A|B)
• indipendenza: P (A|B) = P (A|B̄) = P (A)
• coefficiente binomiale: Cn,k = nk = k!(n−k)!
n!
2
• Distribuzione normale: X ∼ N (µ, σ 2 ) se la densità della variabile aleatoria è
(x − µ)2
1
f (x) = √ exp − , x ∈ R.
σ 2π 2σ 2
Se X ∼ N (µ, σ 2 ),
X −µ a−µ a − µ
P (X ≤ a) = P ≤ =Φ
σ σ σ
3. Inferenza
3
3.3. Test χ2
• goodness of fit: Se, per i = 1, . . . , k Oi sono le frequenze osservate nelle k categorie ed Ei sono le frequenze attese
sotto l’ipotesi nulla
k
X (Oi − Ei )2
χ2 =
i=1
Ei