Sei sulla pagina 1di 10

DEFINIZIONI GENERALI DI STATISTICA

(A cura della studentessa Daniela Panzano)

 Definizione 1.1: La statistica

La statistica è la disciplina che elabora i principi e le metodologie che presiedono al processo


di rilevazione e raccolta del dati, alla rappresentazione sintetica e alla interpretazione dei
dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate.

 Definizione 1.2: Collettivo statistico

Si chiama collettivo statistico la molteplicità, l’insieme dei casi individuali, in cui si manifesta
il fenomeno oggetto di studio.

 Definizione 1.3: Unità statistica

Si chiama unità statistica il caso individuale componente del collettivo statistico oggetto di
studio.

 Definizione 1.4: Carattere

Si chiama carattere ogni aspetto elementare, ogni caratteristica oggetto di rilevazione nelle
unità statistiche del collettivo.

 Definizione 1.5: Modalità

Si chiamano modalità del carattere i diversi modi con cui questo si manifesta nelle unità
statistiche del collettivo.

 Definizione 2.1: Distribuzione statistica

Consideriamo un collettivo statistico di N unità, dove si sia osservato il carattere X. Si


chiama distribuzione statistica semplice disaggregata, o unitaria, secondo il carattere X
l’insieme delle osservazioni (rappresentate da numeri o espressioni verbali) relative alle N
unità del collettivo. In simboli, la distribuzione statistica semplice disaggregata sarà indicata
come:

X1, X2, …, XN,

dove X1 è l’osservazione relativa all’unità identificata dal numero 1, X2 l’osservazione relativa

all’unità identificata dal numero 2 e così via.


 Definizione 2.2: Distribuzione di frequenze

Si chiama distribuzione di frequenze lo schema con cui si associa a ciascuna modalità del
carattere X la rispettiva frequenza. In simboli, la distribuzione di frequenze è così
rappresentata:

Modalità Frequenza

x1 n1

x2 n2
. .
. .
. .
xk nk
Totale N

dove n1, n2, …, nk sono le frequenze delle modalità x1, x2, …, xk.

 Definizione 2.3: Frequenze (assolute) cumulate

Consideriamo una distribuzione di frequenze secondo un carattere a modalità ordinabili. Si


chiamano frequenze (assolute) cumulate le quantità :

Ni = n1 + n2 + … + ni, i = 1, 2, …, k.

Modalità Frequenze
ass. cumulate

x1 N1 = n1

x2 N2 = n1 + n2
. .
. .
. .
k
xk Nk = ∑ i=1 ni = N

 Definizione 2.4: Distribuzione di frequenze

Si chiama distribuzione di frequenze di un carattere X suddiviso in classi lo schema con cui si


associa a ciascuna classe la rispettiva frequenza:
Classe Frequenza

c0 – c1 n1

c1 – c2 n2
. .
. .
. .

ck - 1 – ck nk

Totale N

 Definizione 2.5: Densità di frequenza

Sia (ci-1, ci) la generica classe di una distribuzione di frequenze con modalità raggruppate in

classi. Si chiama densità di frequenza della classe il rapporto

frequenza della classe 𝑛𝑖


hi = =
𝑎mpiezza della classe 𝑑𝑖

essendo di = ci – ci-1 l’ampiezza della classe.

 Definizione 3.1: Funzione di ripartizione

Sia X un carattere quantitativo osservato in un collettivo statistico di N unità. Si chiama


funzione di ripartizione, F(x), la funzione che associa a un qualsiasi numero, x, dell’asse
reale la frequenza relativa delle unità del collettivo per cui X≤x.

 Definizione 3.2: Istogramma di frequenza

Si chiama istogramma di frequenza la rappresentazione grafica che si ottiene ponendo

sull’asse delle ascisse gli estremi di classe c0, c1, …, ck e disegnando per ogni classe

(ci-1, ci), i = 1, 2, …, k , un rettangolo avente per base il segmento dell’asse delle ascisse di
𝑛𝑖
estremi ci-1 e ci e per altezza la densità di frequenza .
𝑑𝑖

 Definizione 4.1: Media aritmetica

La media aritmetica di una distribuzione statistica disaggregata è la somma dei termini

 Proposizione 4.1: Media aritmetica


la media aritmetica presenta le proprietà di seguito indicate:

a) È interna, essendo compresa tra il minimo e il massimo dei termini della distribuzione:

x(1) ≤ µ ≤ x(N)

b) La somma dei termini della distribuzione è uguale alla media aritmetica moltiplicata per
il numero di unità:

In altre parole la media aritmetica rispecchia il criterio di invarianza per la funzione


matematica “somma dei termini”.
c) La somma algebrica degli scarti dalla media aritmetica è nulla:

d) La somma dei quadrati degli scarti dei termini della distribuzione da una costante c è
minima quando c è uguale alla media aritmetica:

e) Se si trasformano i termini x1, x2, …, xN secondo la funzione

Yi = a + bi, i = 1, 2, …,N,
con a e b costanti qualsiasi, la media aritmetica µy dei termini trasformati è legata

alla media µx dei termini originati dalla medesima trasformazione, ossia µy = a +

bµx. Tale proprietà è chiamata proprietà di linearità e implica come casi particolari,

ponendo nella funzione di trasformazione b = 1, nel primo caso, e a = 0 nel secondo:


 La proprietà di traslatività: se si aggiunge o si sottrae una costante a ai termini della
distribuzione, la mediana della nuova distribuzione è uguale alla mediana della
distribuzione iniziale aumentata o diminuita della quantità a;
 La proprietà di omogeneità: se i termini della distribuzione sono moltiplicati per la
costante b, la mediana della nuova distribuzione è b volte la mediana della distribuzione
iniziale.
f) Se un collettivo statistico di N unità è suddiviso in L sottoinsiemi disgiunti aventi

numerosità N(1), N(2), …, N(L) e medie aritmetiche µ(1), µ(2), …, µ(L), la media
aritmetica del collettivo può essere calcolata nel modo seguente:

Con riferimento a questa proprietà, si che la media aritmetica è associativa.

 Definizione 4.2: Media armonica

La media armonica di una distribuzione statistica disaggregata, x1, x2, …, xN, i cui termini

sono tutti diversi da 0, è data dal rapporto tra N e la somma dei reciproci dei termini:

 Proposizione 4.2: Media armonica

La media armonica presenta le proprietà di seguito indicate.

a) È interna, essendo compresa tra il minimo e il massimo dei termini della distribuzione :
x(1) ≤ µa ≤ x(N)

b) La somma dei reciproci dei termini della distribuzione è uguale al reciproco della media
armonica moltiplicando per il numero di unità:

Ciò vuol dire che µa soddisfa il criterio di invarianza se come operazione matematica

f(·) si assume la somma dei reciproci termini della distribuzione.


c) La media armonica gode della proprietà di omogeneità: se tutti i termini della
distribuzione sono moltiplicati per una costante b diversa da 0, la media armonica dei
termini così trasformati è b volte la media armonica dei termini originari.
d) La media armonica gode della proprietà associativa, come specificato qui di seguito, se
un collettivo statistico di N unità è suddiviso in L sottoinsiemi disgiunti aventi
(1) (2) (L) (1) (2) (L)
numerosità N ,N , …, N e medie armoniche µ a, µ a, … , µ a, la media
armonica del collettivo può essere calcolata nel modo seguente.

 Definizione 4.3: Media geometrica

la media geometrica di una distribuzione statistica disaggregata, x1, x2, …, xN, in cui i

termini sono tutti maggiori di 0, è data dalla radice N-esima del prodotto dei termini:

dove ∏𝑁
𝑖=1 𝑥 i =x1 · x2 · … · xN .
 Proposizione 4.3: Media geometrica

La media geometrica presenta le proprietà di seguito indicate.

a) È interna, essendo compresa tra il minimo e il massimo dei termini della distribuzione:

x(1) ≤ µg ≤ x(N)
b) Il prodotto dei termini della distribuzione è uguale alla media geometrica elevata a N:

Ciò significa che µg soddisfa il criterio di invarianza se come operazione matematica


f(·) si assume il prodotto dei termini della distribuzione.
c) La media geometrica gode della proprietà di omogeneità: se tutti i termini della
distribuzione sono moltiplicati per una costante b > 0, la media geometrica dei termini
così trasformati è b volte la media geometrica dei termini originari.
d) Il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi dei
termini della distribuzione:

Da cui – poiché la funzione inversa del logaritmo è la funzione esponenziale – si ricava:

e) La media geometrica gode della proprietà associativa, come specificato qui di seguito,
se un collettivo statistico di N unità è suddiviso in L sottoinsiemi disgiunti aventi
(1) (2) (L) (1) (2) (L)
numerosità N , N , …, N e le medie geometriche µg , µg , …, µg , la media
geometrica del collettivo può essere calcolata nel modo seguente:
(1) (2) (L)
dove N = N , N , …, N .

 Proposizione 4.5: Mediana

La mediana presenta le proprietà di seguito indicate.

a) È interna, essendo compresa tra il minimo e il massimo dei termini della distribuzione:

x(1) ≤ m ≤ x(N) .

b) Se si trasformano i dati secondo la funzione

Yi = a + bxi , i = 1, 2, …, N,

la mediana dei dati così trasformati, mY, è legata a quella dei dati iniziali, mx, dalla
relazione

mY = a + b mx .

Tale proprietà è chiamata proprietà di linearità e implica come casi particolari,


ponendo nella funzione di trasformazione b = 1, nel primo caso, e a = 0 nel secondo:

 La proprietà di traslatività: se si aggiunge o si sottrae una costante a ai termini della


distribuzione, la mediana della nuova distribuzione è uguale alla mediana della
distribuzione iniziale aumentata o diminuita della quantità a;
 La proprietà di omogeneità: se i termini della distribuzione sono moltiplicati per la
costante b, la mediana della nuova distribuzione è b volte la mediana della distribuzione
iniziale.
c) La mediana è il valore che minimizza la somma dei valori assoluti degli scarti:

 Definizione 4.6: Media aritmetica ponderata


Siano x1, x2, …, xk le osservazioni e w1, w2, …, wk i rispettivi pesi. Allora la media

aritmetica ponderata di x1, x2, …, xk è data dal rapporto tra la somma delle osservazioni
moltiplicate per i rispettivi pesi e la somma dei pesi:

𝑘
dove W =∑𝑖=1 𝑤 i .

 Proposizione 4.6: Media aritmetica ponderata

Sia [ch(sx), ch(dx)] la classe mediana. Nell’ipotesi di uniforme distribuzione delle unità nella
classe, la mediana è data da

dove Nh e Nh-1 sono le frequenze cumulate, rispettivamente, della classe mediana e della

calle precedente; la quantità Nh-1 va posta uguale a zero quando h = 1.

 Definizione 4.7: Mediana

Sia x1, x2, …, xn una distribuzione statistica disaggregata; sia x(1), x(2), …, x(n), con

x(1) ≤ x(2) ≤ … ≤ x(n), la corrispondente distribuzione dei termini ordinati in senso non
decrescente. Se N è dispari, si chiama mediana della distribuzione la quantità, m, che occupa
il posto centrale, cioè il posto (N + 1)/2, della graduatoria dei termini ordinati. Se n è pari, si
assume come mediana la media aritmetica dei termini che occupano i due posti centrali della
graduatoria dei termini ordinati, ossia le posizioni N/2 e N/2+1. In sintesi:

Se N è dispari,

Se N è pari.

 Definizione 4.8:
Sia x1, x2, …, xN una distribuzione statistica disaggregata; sia x(1), x(2), …, x(N) la
corrispondente distribuzione dei termini ordinati in senso non decrescente, cioè tali che

x(1) ≤ x(2) ≤ … ≤ x(n) . Presa la quantità N · (1/4), con l = 1, 2, 3, e individuati i due interi
consecutivi, h – 1 e h, tali che

h – 1 ≤ N · (1/4) ‹ h,

definiamo come l-esimo quartile della distribuzione la quantità

Se N · (1/4) > h – 1

Se N · (1/4) = h – 1

 Definizione 4.9: Valore centrale

Si data una distribuzione disaggregata x1, x2, …, xN ; sia la corrispondente distribuzione dei
termini ordinati, con . Il valore centrale della distribuzione è la media aritmetica dei valori
estremi:

 Definizione 4.10: Moda

La moda di una distribuzione di frequenze è la modalità che presenta la frequenza più alta.

Medie

Medie analitiche Medie di posizione Altre medie

Medie Medie Valore Moda


centrale
aritmetica quadratica

Medie Medie

armonica geometrica

Potrebbero piacerti anche