Sei sulla pagina 1di 3

FORMULARIO STATISTICA

Frequenze relative:
ni k
fi = ; i = 1,2,  , k ; ∑ f i = 1 ; n = numero di osservazioni
n i =1
Frequenze percentuali:
ni k
pi = f i *100 = * 100; i = 1,2,  , k ; ∑ pi = 100 ; n = numero di osservazioni
n i =1

Frequenze cumulate:
la frequenza cumulata è il numero totale di osservazioni che hanno un valore inferiore o uguale al valore
specificato. Per calcolare la frequenza cumulata bisogna ordinare in senso crescente le modalità della
variabile e poi sommando le frequenze della modalità specificata insieme a quelle di tutte le modalità
precedenti.

Moda (dati in serie):


Modalità della variabile che si verifica il maggior numero di volte

Moda (dati in classi di uguale ampiezza):


Classe modale è la classe in cui cade il maggior numero di osservazioni

Mediana:
Modalità di una variabile a cui appartiene il caso che divide a metà la distribuzione. Calcolo:
1. ordinare le modalità della variabile in ordine crescente
2. calcolare le frequenze assolute cumulate
3. individuare il valore centrale della distribuzione (il caso mediano):
n +1
se il numero di soggetti n è dispari: C md =
2
n
C md 1 =
2
se il numero di soggetti n è pari ci sono due valori centrali:
n
C md 2 = +1
2
4. osservare in che modalità cade il caso mediano (per n pari e se il tipo di variabile lo consente, la
mediana è la media delle due modalità del carattere corrispondenti ai due valori centrali individuati)

Quartili
Q1= (N+1)/4 Q2=2*(N+1)/4=(N+1)/2 Q3=3*(N+1)/4

Media (dati in serie):


n

∑x i
numero di osservazioni
x= i =1
,n =
n

Media (dati raggruppati per frequenze assolute):


k

∑x
j =1
i * ni
numero di modalità della variabile; n= numero di osservazioni;
k

∑n i =n
x= ,k = i =1
n

1
Media (dati in classi e frequenze assolute):
k

∑m i * ni
; mi = (limite superiore + limite inferiore)/2 = valore centrale classe
x= i =1

Range
xmax - xmin

Varianza (dati in serie):


( xi − x ) 2
n
σ =∑
2
;
i =1 n

Varianza (dati rappresentati con distribuzione di frequenze):


ni ( x i − x ) 2
k k
σ =∑
2

n
, ni = frequenza assoluta nella classe i e ∑n
i =1
i =n
i =1

Varianza (dati in classi):


ni ( m i − x ) 2
k
σ =∑
2
, ni = frequenza assoluta nella classe i; mi= (limite superiore + limite inferiore)/2 =
i =1 n
valore centrale classe

Deviazione standard:
σ = σ2

Distribuzione normale o gaussiana

L’area sotto la curva è pari all’unità.


Definita da due parametri: media ( µ ) e deviazione standard ( σ ).
La distribuzione è unimodale, a forma di campana, e simmetrica intorno a x = µ .
La variabile casuale normale x ammette tutti i valori reali fra − ∞ e + ∞ .
La curva normale standardizzata è definita da µ = 0 e σ = 1 .
x−µ
Normale standardizzata o rapporto critico z=
.4

σ
.3
probabilità f(x)
.2
.1
0

-4 -2 0 2 4
x

2
Inferenza sulle medie

Errore standard:

ES = σ
n
Test di ipotesi

Confronto fra media campionaria e media di popolazione

H 0 : X = µ x −µ x−µ
z= z=

H a : X ≠ µ ES( x ) σ
n

Intervallo di confidenza al 95% per la media della popolazione

IC( µ ) = x ± zα / 2 ⋅ ES( x ) IC( µ ) = x ± 1.96 ⋅ σ


n

Concordanza

Po − PE
K=
100 − PE

dove:
PO = accordo osservato (a+d/N)
PE = accordo casuale atteso a b (a+b)
 ( a + c ) ( a + b )   (b + d ) ( c + d )  c d (c+d)
PE =  * + *  (a+c) (b+d) N
 N N   N N 
100= massimo accordo possibile (100%)