Sei sulla pagina 1di 91

Statistica Descrittiva

La statistica si occupa dell’analisi in termini quantitativi di fenomeni collettivi, cioè di


-statistica descrittiva: se io faccio un'indagine statistica per acquisire informazioni ovvero
caratteri statistici vado ad intervistare tutte le unità del mio collettivo quindi se io voglio
studiare il reddito pro capite di tutti i cittadini di Roma andrò ad intervistare tutti i cittadini;
-statistica inferenziale: se io voglio studiare il reddito pro capite di tutti i cittadini di Roma
non vado ad intervistare tutti i cittadini quindi non tutte le unità del mio collettivo ma un
campione rappresentativo dopodiché io avrò il mio reddito pro capite e in base a degli
schemi probabilistici posso estendere i risultati che ho ottenuto dal campione
rappresentativo a tutta la popolazione. Quindi con la statistica inferenziale cioè andando ad
intervistare 1000 cittadini con il campione rappresentativo posso dire che avendo ottenuto
un reddito medio di €1800 con una certa probabilità questo è il reddito meteo di tutti i
cittadini di Roma. Sicuramente ci sono delle differenze con la statistica descrittiva perché
innanzitutto ci impiego meno tempo, costa di meno, ho dei risultati in breve tempo. Quindi a
me serve acquisire la tecnica della statistica inferenziale che è quella che si usa perché le
indagini totali le fa solo l'Istat (Istituto Nazionale di statistica). Quindi nella statistica
inferenziale c'è un certo grado di incertezza che si esprime con le probabilità

Rilevazione statistica (o indagine)

È un insieme di operazioni che richiedono l’osservazione di un insieme di fenomeni


individuali, infatti quando si fa un'indagine statistica si tratta di intervistare un collettivo di
persone chiedendo notizie sui caratteri statistici. Il collettivo di persone prende il nome di
unità statistiche. Quindi la statistica è la scienza che si occupa di raccogliere, elaborare e
valutare i dati che riguardano fenomeni collettivi. La statistica si distingue in due grandi rami:i
che concorrono all'acquisizione dei dati statistici direttamente dalle unità statistiche oggetto
di studio. Per fare una rilevazione statistica:
1. Definizione degli obiettivi dello studio cioè devo sapere che tipo di indagine vado a
fare cioè che caratteri voglio rilevare;
2. La rilevazione attraverso la raccolta dei dati e devo decidere se la voglio fare totale o
parziale e se parziale userò gli strumenti della statistica inferenziale se totale userò
gli strumenti della statistica descrittiva;
3. Lo spoglio e la classificazione dei dati;
4. Elaborazione dei dati che vengono elaborati una volta che ho acquisito il foglio
cartaceo oppure la mia indagine telefonica ecc;
5. Presentazione, interpretazione e utilizzazione dei risultati della ricerca fatti dopo aver
elaborato i dati cioè mettendo in grafici o tabelle i dati ottenuti così sia immediatezza
del fenomen;
6. Applicazione delle indagini.
Definizioni e concetti di base

● Popolazione: (o universo) è insieme di elementi che forma l’oggetto di studio di


un’analisi statistica e riguarda la statistica descrittiva perché si va ad intervistare la
popolazione in completo.
● Campione: è un sottoinsieme ottenuto dalla popolazione originaria e finalizzato ad
un’analisi statistica e riguarda la statistica inferenziale.
● Unità statistiche: oggetto della mia rilevazione. Un’unità statistica può consistere in
un individuo, un oggetto, un’azienda, un animale, ecc. Esse possono essere semplici
(individuo) o complesse cioè un insieme di unità semplici (abitazione). Tutte queste
unità semplici o complesse sono codificate attraverso il concetto di carattere
statistico.
● Carattere statistico: è quello che si rileva dall’unità statistica; in altre parole è la
caratteristica che fa differire un’unità statistica da un'altra unità es. maschio e
femmina.
● Modalità: è l’espressione concreta con la quale il carattere qualitativo si manifesta
nelle unità statistiche. La modalità può consistere in un numero (l’età di un particolare
individuo) così come in una qualità (il genere di un individuo)
● Variabile: è il fenomeno oggetto di studio, rilevato sulle unità statistiche della
popolazione di riferimento e codificato secondo le esigenze dell’analisi statistica.
● Frequenza: è il numero di volte in cui si manifesta la modalità del carattere cioè se si
parla di testo devo vedere quante volte ricorre il carattere femmina e quante volte il
carattere maschio.

Un carattere può essere distinto in:


-variabile: quando assume come modalità dei numeri reali
-mutabile: quando invece le modalità rappresentano aggettivi o attributi

Il carattere inoltre può essere distinto in due categorie:


-qualitativo sono aggettivi o attributi non soggetti ad elaborazioni matematiche ad esempio il
sesso, grado d’istruzione ecc; può essere:
1) ordinale cioè ammette un ordine logico ad esempio il grado d’istruzione
2) nominale cioè il carattere che non ammette un ordine logico ad esempio il sesso è
un carattere qualitativo nominale.
-quantitativo sono valori numerici soggetti ad elaborazioni matematiche e si dividono in
caratteri
1) discreti o discontinui detta anche variabile statistica discreta quando può assumere
come modalità quantitative (si chiamano anche intensità cioè il modo di manifestarsi
del carattere quantitativo) dei numeri interi ad esempio numero di figli;
2) continui detta anche variabile statistica continua e quando assume come modalità o
intensità quantitative dei numeri con valori decimali (caratteri piccolissimi dopo la
virgola) cioè tutti i valori biometrici ovvero peso, altezza, il reddito, il consumo, il
volume, la superficie, le temperature, le lunghezze ecc.
Intensità o modalità e frequenze

Per le intensità (risultato della misurazione del carattere quantitativo) o le modalità


(risultato della misurazione del carattere qualitativo) si usa il simbolo X però se la frequenza
è unitaria nel senso che io ho 10 oggetti e li vado a pesare e tutti hanno peso differente in
questo caso lo stesso carattere peso ricorre un'unica volta non ha frequenza e quindi si dice
che essa è unitaria, il carattere quantitativo si mette in ordine crescente ottenendo così una
successione di intensità però poiché sono quantità numeriche avrò X1, X2… Xi (cioè
l’intensità centrale)... Xn che prende il nome di distribuzione unitaria della variabile X

La tabella prende il nome di distribuzioni unitarie di un carattere quantitativo continuo e


rappresenta una successione di intensità con frequenza unitaria perché un peso specifico
ricorre soltanto una volta.

Unità Carattere
(Peso in kg)

u1 (Giovanna) X1 (50 kg)

u2 (Pietro) X2 (70 kg)

u3 (Maria) X3 (80 kg)

u4 (Francesco) X4 (90 kg)

un (Anna) Xn (100 kg)

Quindi questo è il caso di quando riscontriamo una frequenza unitaria ma visto che
l'indagine statistica è un'indagine collettiva è difficile che su 1000 persone un carattere non
si ripete ma chiaramente si ripete più di una volta e quindi la frequenza non è unitaria e
quindi abbiamo un altro tipo di tabella che prende il nome di distribuzione di frequenza per
variabili discrete che prende anche il nome di variabile statistica (che si riferisce solo ad un
carattere quantitativo perché se è un carattere qualitativo avrò una mutabile statistica).

Modalità o Intensità Frequenza

X1 n1

X2 n2

X3 n3

... ...

... ...

... ...

Xn Nn (totale)
● Xi consiste nella i-esima modalità della X
● ni consiste nella i-esima frequenza assoluta (il numero di volte si manifesta una
modalità del collettivo)
● fi = ni /N consiste nella i-esima frequenza relativa (rapporto tra la frequenza
assoluta ni (n1,n2,n3 ecc) ed il totale delle frequenze (somma delle frequenze
assolute N) ed esprime la frazione dei casi sul totale che hanno una certa modalità
od intensità e deve essere sempre =1
● frequenza relativa percentuale moltiplicando per 100 la frequenza relativa quindi ci
da la percentuale dei casi sul totale (100%) che hanno una certa intensità o modalità
● frequenze cumulate si usano quando voglio sapere le frequenze di una certa
intensità o modalità da X1 ad Xi ( es 7 famiglie hanno da 1 a 3 componenti) la prima
coincide alla frequenza assoluta poi si inizia a sommare con le frequenze assolute
successive es 2...2+3=5...2+3+5=10 ecc

Modalità Freq. Assoluta Freq. Cumulata

X1 n1 N1=n1

X2 n2 N2=n1+n2

X3 n3 N3=n1+n2+n3

... … ...

... ... ...

Xn Nn (totale) ...

Le frequenze cumulate che si ottengono di volta in volta sommando le frequenze assolute


possono a loro volta essere rese relative dividendo ciascuna frequenza cumulata per il
totale delle frequenze assolute

Modalità Freq. Assoluta Freq. Relativa

X1 n1 f1=n1

X2 n2 f2=n2

X3 n3 f3=n3

... … ...

... ... ...


Xn Nn (totale) fi=ni

N
(la somma
finale deve
sempre essere
=1)

Le frequenze relative cumulate possono anche essere rese percentuali andando a


moltiplicare le frequenze relative cumulate per 100 ottenendo così la percentuale delle
frequenze da X1 a Xi (es. il 70% delle famiglie hanno da 1 a 3 componenti).

Esempio di distribuzioni di frequenze


Distribuzione di frequenze secondo il carattere sesso di 60 soggetti. L’unità statistica è
l’individuo il carattere è il sesso e le modalità del carattere sono maschi e femmine.

Sesso Freq.Assolute Freq.Relative

Maschi 23 23/60=0.39

Femmine 37 37/60=0.61

Totale 60 1

ESERCIZIO
Abbiamo chiesto a 10 famiglie da quanti individui (componenti) sono formate ottenendo
questi risultati: 1; 1; 2; 2; 2; 3; 3; 4; 4; 5.
Calcolare:
1) le frequenze assolute
2) le frequenze relative
3) le frequenze cumulate
4) le frequenze relative cumulate
5) le frequenze relative cumulate percentuali.
Per svolgere Questo esercizio dobbiamo costruire una tabella in cui mettere le intensità del
carattere Xi (numero dei componenti) con le rispettive frequenze Ni cioè quante famiglie
hanno un componente. Unità statistica sono le famiglie, le intensità sono il numero dei
componenti, il carattere è quantitativo discreto o discontinuo.

Num. Freq. Freq. Freq. Cumulate Freq. Freq. Relative


componenti Assolute Relative Ci Relative Cumulate
della famiglia Numero di Cumulate Percentuali
Xi famiglie Ni

1 2 2/10 =0.20 2 2/10=0.20 0.20x100=20%

2 3 3/10=0.30 2+3=5 5/10=0.50 0.50x100=50%


3 2 2/10=0.20 2+3+2=7 7/10=0.70 0.70x100=70%

4 2 2/10=0.20 2+3+2+2=9 9/10=0.90 0.90x100=90%

5 1 1/10=0.10 2+3+2+2+1=10 10/10=1.0 1.0x100=100%

TOTALE 10 1

❖ Si calcolano le frequenze relative percentuali perché le frequenze assolute


dipendono da n quindi non possono essere utilizzate per effettuare confronti tra
collettivi con diversa numerosità al contrario le frequenze relative e quelle percentuali
sono numeri puri senza unità di misura e permettono di confrontare distribuzioni di
frequenza riferite a collettivi con diversa numerosità.

Ampiezza della classe

In questo primo esercizio avevamo una distribuzione di frequenze discontinua ma potrebbe


essere anche una distribuzione di frequenze continua ad esempio voglio rilevare il reddito
dei cittadini di Roma e faccio un’indagine anche campionaria su 5000 persone avrò quindi
5000 redditi, il più piccolo avrà reddito 0 perché sarà disoccupato mentre il più grande avrà
5000000 quindi ho tutti redditi diversi che non posso far rientrare in una tabella quindi si
dividono le intensità in classi d’intensità tipo da 0 a 500 euro da 500 a 1000 euro da 1000 a
1500 da 1500 a 3000 da 3000 a 5000 e così via e l’ampiezza delle classi dipende dal
carattere e dalle frequenze. Innanzitutto la classe si indica con Xi e Xi+1 è la generica classe
quindi l'estremo inferiore sarà Xi mentre l'estremo superiore sarà Xi+1. Se abbiamo la classe
possiamo anche definire l'ampiezza della classe che è la differenza fra l'estremo superiore
della classe è l'estremo inferiore e si indica con 𝜶i=Xi+1 (estremo sup)-Xi (estremo inf) di
ciascuna classe.

Unità Freq.Assoluta Freq.Relativa Ampiezza Classe

X0 ≤ X ≤ X1 n1 f1= n1 𝜶i=X1-X0
N

X1 ≤ X ≤ X2 n2 f2= n2 𝜶i=X2-X1
N

... n3 ... ...

Xi+1 ≤ X ≤ Xi ... fi= ni 𝜶i=Xi-Xi+1


N

... ... ... ...

Xk-1 ≤ X ≤ Xk nk fk= nk 𝜶i=Xk-Xk-1


N
Fino ad ora abbiamo visto le tabelle con un solo carattere ma in realtà non è così perché
quando si fa un'indagine si vanno a chiedere più caratteri possibili. Avrò quindi delle tabelle
di questo tipo.

Esempio
Frequenza alle Esito agli esami Sesso Età in anni compiuti
esercitazioni

sì positivo M 19

no negativo F 20

sì positivo F 22

sì positivo M 19

no negativo M 20

no positivo F 19

Tabella di contingenza

La tabella multipla con frequenza unitaria si può trasformare in una tabella di contingenza
o tabella doppia. Sono le frequenze delle varie combinazioni di modalità. Gli studenti che
hanno superato letame con esito positivo sono 4 e rappresenta la frequenza marginale di
colonna. Gli studenti che hanno ha avuto frequenza alle esercitazioni sono 3 il rappresenta
la frequenza marginale di riga. Per avere il totale o faccio la somma tra le frequenze
marginali di colonna o tra le frequenze marginali di riga oppure tra tutti i componenti delle
caselle.

Frequenza alle Esito agli esami


esercitazioni
positivo negativo totale

sì 1;1;1 0 3

no 1 1;1 3

totale 4 2 6

Sesso Esito agli esami

positivo negativo totale

M 1;1 1 3

F 1;1 1 3

totale 4 2 6
Densità di frequenza

Una variabile statistica continua soprattutto quando la frequenza è elevata si deve trattare in
una tabella con le classi di intensità e possiamo definire l'ampiezza di ciascuna classe.
Possiamo quindi avere classi di intensità o classi di modalità. Un'altra elaborazione che si
può fare quando abbiamo la classe è calcolare la densità di frequenza ovvero il rapporto
tra la frequenza assoluta della classe e l'ampiezza della classe.

Classi di modalità Frequenza assoluta Ampiezza classe Densità di frequenza

X0 ≤ X ≤ X1 n1 𝜶1=X1-X0 d1= n1

𝜶1
X1 ≤ X ≤ X2 n2 𝜶2=X2-X1 d2= n2

𝜶2
... ... ... ...

Xi+1 ≤ X ≤ Xi ni 𝜶i=Xi-Xi+1 di= ni

𝜶i
... ... ... ...

Xk-1 ≤ X ≤ Xk nk 𝜶k=Xk-Xk-1 dk= nk

𝜶k

Esempio
Xi-Xi-1 ni 𝜶i=Xi+1-Xi di= ni

𝜶i
2|-4 18 2-4=2 18/2=9.00

4|-8 15 8-4=4 15/4=3.75

8|-16 12 16-8=8 12/8=1.50

16|-|32 10 32-16=16 10/16=0.63

Totale 55
Distribuzione unitaria doppia

Le modalità di 2 caratteri, quantitativi e/o qualitativi, possono essere rappresentati sotto


forma di una distribuzione unitaria doppia cioè sono distribuzioni in cui si vanno al rilevare
su un unico soggetto due o più caratteri alla volta
Unità Carattere Xi Carattere Yi

u1 x1 y1

u2 x2 y2

ui xi yi

un xn yn

Esempio
Xi voto esame di statistica Yj voto esame di economia

18 22

19 21

20 18

21 19

22 19

25 25

28 27
Le unità statistiche sono 7 studenti, i caratteri sono il voto all'esame di statistica è il voto
all'esame di economia

Tabella a doppia entrata


Xi X1 X2 …. Xi …. Xr Totale
Yj i-esima

Y1 n11 n21 ni1 nr1 n.1

Y2 n12 n22 ni2 nr2 n.2

….

Yj n1j n2j nij nrj n.j

….

Ys j-esima n1s n2s nis nrs n.s

Totale n1. n2. ni. nr. n .. (N)


Esempio tabella a doppia entrata
Titolo di studio Licenza media Diploma Laurea Totale riga

Classe di reddito

Fino a 30 10 12 17 39

Da 31 a 50 14 19 18 51

Da 51 a 70 20 22 23 65

Oltre 70 11 21 19 51

Totale Colonna 55 74 77 206

Domande:
1)Quante persone hanno un reddito fino a €30000? 39
2)Quante persone hanno un reddito medio da 31 a €50000? 51
3)Quante persone hanno il titolo di studio licenza media? 55
4)Quante persone hanno il titolo di studio laurea? 77
5)Quante persone hanno il titolo di studio licenza media e hanno un reddito da 51 a €70000?
20
6)Quante persone hanno il titolo di studio laurea e hanno un reddito di oltre €70000? 19

Indice di sommazione

Quando faccio un'indagine statistica avrò tanti valori numerici e quindi c'è la necessità di
sintetizzare questi numeri di cui magari devo fare la somma che si indica con 𝝨 che sta
appunto ad indicare un'operazione di addizione e consente una notevole economia di spazio
nello scrivere le formule che comportano l'operazione di somma. Generalmente viene
premesso di una qualsiasi lettera dell'alfabeto che può essere a b x y z in genere con le
variabili però si usa la Xi e la Yi o Zi ma per convenzione quando si parla di sommatoria si
usa la lettera ai e la i è l’indice di sommazione ed in corrispondenza della lettera che
abbiamo scelto può assumere i successivi valori interi consecutivi che vanno dal primo
valore della tabella che è 1 all'ultimo valore della tabella che è l'ennesimo valore; quindi la
sommatoria di ai con i che abbiamo detto assume in corrispondenza della lettera scelta i
valori interi consecutivi che vanno dal primo all'ultimo valore e se ad esempio il primo valore
è uno e l'ultimo è 4 significa che sviluppando la somma avrò a1 + a2 + a3 + a4 . Per tener
conto del numero dei valori che deve assumere l'indice di sommazione si completa il
simbolo 𝝨 scrivendo al di sotto di esso l'indice i è il primo valore al di sopra del simbolo 𝝨
l'ultimo valore assunto dall'indice di sommazione cioè N:
𝑁
∑ ai
𝑖=1
per cui riguardo l’esempio di prima avremo:

4
∑ ai = a1 + a2 + a3 + a4
𝑖=1

e più in generale:

𝑁
∑ ai =a1 + a2 + a3 + …. + aN
𝑖=1

E si legge così: la sommatoria per i che va da 1 ad N di ai

Esempio 1:
Se ai = i

4 4
∑ ai = ∑ i = 1 + 2 + 3 + 4= 10
𝑖=1 𝑖=1

Esempio 2:
Se ai = i²
4 4
∑ ai = ∑ i² = 1² + 2² + 3² + 4²= 30
𝑖=1 𝑖=1

Esempio 3:
Se ai = 1/i
4 4
∑ ai = ∑ 1/i = 1/1 + 1/2 + 1/3 + 1/4= 25/12
𝑖=1 𝑖=1
Proprietà dell’operatore sommatoria

-Prima proprietà:
Se ai e bi dipendono dall’indice i vale la seguente identità:
𝑁 𝑁 𝑁
∑ (ai+bi) = ∑ ai + ∑ bi
𝑖=1 𝑖=1 𝑖=1

Infatti sviluppando il primo termine si ha:

𝑁
∑ (ai+bi) = (a1+b1) + (a2+b2) + .... + (aN+bN)
𝑖=1

oppure si può anche scrivere così:

𝑁 𝑁
(a1 + a2 + …. + aN) + (b1 + b2 + …. + bN) = ∑ ai + ∑ bi
𝑖=1 𝑖=1

Questa proprietà si estende immediatamente al caso di tre o più termini

ai; bi; ci

-Seconda proprietà:
Se una lettera K non dipende dall’indice di sommazione i essa viene addizionata N volte
nello sviluppo della sommatoria, quindi si ha:

𝑁
∑ K= K + K + …. + K= NK
𝑖=1

Ad esempio:
3
∑ K= K + K = 3K
𝑖=1
-Terza proprietà:
Dalla proprietà 1 e 2 deriva il caso particolare:

𝑁 𝑁
∑ ai + K= ∑ ai + Nk
𝑖=1 𝑖=1

𝑁
∑ (ai + K)= ai + K + a2 + K + … + aN + K
𝑖=1

Si può scrivere anche così:


𝑁
(a1 + a2 + …. + aN) + (K+K+...+K)= ∑ ai + Nk
𝑖=1
-Quarta proprietà
La somma del prodotto tra una costante (non dipende dall’indice i) e una lettera che dipende
da i:

𝑁 𝑁
∑ K= K ∑ ai
𝑖=1 𝑖=1

𝑁 𝑁
∑ K ai = K a1 + K a2 + …. + K aN = K ∑ ai
𝑖=1 𝑖=1

In altri termini la proprietà 4 si esprime dicendo che un fattore (ad esempio la lettera K) che
non dipende dall’indice di sommazione si può portare davanti al simbolo di sommatoria.
Rappresentazioni grafiche

Dopo aver fatto una rilevazione statistica e aver sistemato i nostri caratteri che sono valori
numerici generalmente ma possono essere anche di tipo qualitativo; bisogna rappresentare
in maniera efficiente i risultati dell'indagine con dei grafici che devono essere più semplici
possibile quindi di facile lettura e servono a rendere più evidenti e di facile lettura le
caratteristiche dei collettivi statistici. Un grafico si sceglie innanzitutto secondo cinque
principi ma soprattutto si sceglie dalla natura del carattere cioè se il carattere è qualitativo
oppure quantitativo discreto o continuo:
1) accuratezza: si riferisce la precisione di dettagli con cui è rappresentata la
distribuzione;
2) semplicità: si riferisce all'uso essenziale di elementi grafici senza aggiunta di
elementi superflui;
3) chiarezza: data dalla capacità di comunicare senza ambiguità e in modo immediato
gli aspetti fondamentali del fenomeno studiato;
4) aspetto estetico: deve essere il più possibile armonioso;
5) struttura: gli elementi grafici devono essere posti in maniera gerarchica in modo tale
che è un elemento sia messo tanto più in rilievo quanto più esso è rilevante.

La cosa fondamentale però è distinguere tra caratteri qualitativi e quantitativi perché ci sono
dei grafici che sono esclusivamente per caratteri qualitativi e altri che sono esclusivamente
per caratteri quantitativi discreti i grafici che sono esclusivamente per caratteri quantitativi
continui.

-Rappresentazioni grafiche per caratteri qualitativi

-diagrammi a rettangoli distanziati o barre verticali che sono costituiti da rettangoli


innalzati in corrispondenza di diversi caratteri che si vogliono rappresentare e hanno:
-basi uguali che rappresentano la modalità del carattere
-altezze uguali alle frequenze corrispondenti alle diverse modalità del carattere considerate
(si usano o le frequenze assolute o relative).

Come svolgere l'esercizio?


Condizione professionale Tot M+F

occupati 13090

disoccupati 588

in cerca di prima occupazione 607


altri 118

totale 14403

In questo caso vengono rappresentate le frequenze assolute ma possono essere anche


rappresentate quelle relative facendo ovviamente freq. assoluta diviso il totale.

-diagrammi circolari o grafici a torta che è un tipo di rappresentazione usato per


riprodurre una sola serie di dati, si usa per caratteri qualitativi. La torta è divisa in tanti settori
quanti sono gli elementi da visualizzare: si divide il cerchio in settori circolari aventi un
angolo al centro proporzionale alle frequenze del fenomeno che si rappresenta.

Come svolgere l’esercizio?

Condizione Totale

occupati 20435

disoccupati 996

in cerca di prima occupazione 1152

altri 596
Totale 23179

𝜶i= 360° x ni/N ad esempio 𝜶i=360 x 20435/23179= 317,38°

Viene usato per una sola serie di dati quindi si può rappresentare graficamente un solo
carattere alla volta quindi ad esempio maschi e femmine non va bene perché non si può
sovrapporre quindi bisognerà fare tre grafici a torta uno per i maschi uno per le femmine
infine uno totale maschi più femmine.

-diagrammi a figure o pittogrammi, la frequenza di ogni carattere qualitativo (si può usare
anche per i caratteri quantitativi) vieni rappresenta da una figura stilizzata, oppure da simboli
che ricordano facilmente l'oggetto.
Rappresentazioni grafiche per caratteri quantitativi discreti

-diagrammi cartesiani questo tipo di rappresentazione, basato su un piano cartesiano,


utilizza dei punti, posti in corrispondenza di coppie ordinate di valori X ed Y o X ed N, uniti
tra di loro da una linea spezzata che facilita la comprensione dell'andamento del fenomeno
studiato (ad esempio di una serie storica cioè quando i valori delle X sono rappresentati
dagli anni ed in corrispondenza di essi c'è la frequenza oppure valori della Y).

Esempio 1
Anno Xi n. di famiglia Yi

1901 884

1911 1011

1921 1132

1931 1330

1936 1425

1951 1178

1961 2177

1971 2695

1981 3082

1991 3290

Numero di famiglie. Censimenti dal 1901 al 1991 (dati assoluti in migliaia).

Esempio 2
Xi Ora Yi Verona (°C) Zi Bormio (°C)
3 2 7

6 5 8

9 8 12

12 12 15

15 14 18

16 15 19

18 13 15

21 11 12

24 7 9

Rappresentazioni grafiche per caratteri quantitativi continui


-cartogrammi sono grafici che vengono costruiti generalmente a partire da cartine
geografiche; le intensità del carattere vengono suddivise in classi e a ciascuna viene
assegnato un colore (di solito si utilizza una scala di colori).

Esempio
Carattere: densità della popolazione.

Densità della popolazione residente in Toscana per comune (abitanti per km²)

-istogramma è utilizzato quando la distribuzione si riferisce alle intensità di un carattere


quantitativo continuo. In un sistema di assi cartesiani si collocano una serie di rettangoli
attaccati e non distanziati come i diagrammi a rettangoli distanziati che hanno come base
l'ampiezza delle varie classi di intensità in cui è stata ripartita la variabile di interesse e come
altezza le frequenze (assolute, relative semplici o percentuali anche se in genere si mettono
quelle assolute) se le classi sono di uguale ampiezza. Se le classi sono di ampiezza diversa,
i rettangoli avranno sempre come base l’ampiezza delle classi d’intensità mentre le
frequenze non sono direttamente confrontabili ed è necessario rendere l'altezza
proporzionale. Tale proporzione è un rapporto tra la frequenza assoluta e l'ampiezza di una
classe ed è definita densità di frequenza.

Si definisce ampiezza di una classe la differenza tra l'esterno superiore e l'estremo inferiore
dell'altezza: 𝜶i =Xi+1 - Xi
La densità di frequenza si definisce come il rapporto tra la frequenza assoluta di una
classe e la sua ampiezza: di= ni/Xi+1-Xi = ni/𝜶i

Esempio: Data la seguente distribuzione di frequenze secondo il carattere classe di età,


rappresentare con grafico opportuno

Classi di età Frequenze assolute

0-14 1396

15-34 2626

35-64 7687

65-95 6933

Totale 18642

La prima cosa che dobbiamo chiederci e se le classi hanno uguale ampiezza

Soluzione:
Distribuzione di frequenze secondo il carattere di età

Età Frequenze assolute Ampiezza classe Densità di frequenza

0-14 1396 14 99,71

15-34 2626 19 138,21

35-64 7687 29 265,07

65-95 6933 30 231,10

Totale 18642

Quindi l’ampiezza non è uguale


La base è data dalle ampiezze e l’altezza dei rettangoli dalle densità di frequenza.

Medie analitiche

Le medie servono quando vogliamo rappresentare la distribuzione di un unico carattere


quantitativo perché ovviamente per fare la media servono dei dei numeri ma se abbiamo
delle modalità del carattere ordinario posso anche trovare delle medie non di calcolo ma
cosiddette di posizione. Tutte le medie ci servono se vogliamo rappresentare la distribuzione
invece che con tante intensità con un unico parametro cioè con una sola intensità o modalità
che devono rappresentare la distribuzione che si va a studiare e deve essere un valore
medio infatti servono per individuare la tendenza centrale del fenomeno studiato in maniera
da consentire confronti nel tempo, nello spazio o situazioni differenti. In altre parole si
intende individuare un valore rappresentativo della globalità del fenomeno E tale da
riassumere gli aspetti ritenuti più significativi:
-medie analitiche o di calcolo si ottengono effettuando operazioni su tutti i valori del
carattere quindi devono essere dei valori numerici per trovare medie di calcolo: media
aritmetica, media quadratica, media geometrica ecc. Possono essere calcolate solo per
caratteri quantitativi continui o discontinui.
-medie di posizione la cui determinazione riguarda solo alcuni valori del carattere: sono di
questa tipologia la moda e la mediana. Possono essere calcolate sia per valori numerici che
per caratteri di tipo qualitativo basta però che siano ordinali.

Concetto di media di calcolo

La media analitica è un indice di posizione per variabili quantitative.

-Media secondo Cauchy


La media che si indica con µ(mi) di un valore X è qualsiasi valore compreso tra il minimo ed
il massimo: 𝑋𝑖 ≤µ ≤ 𝑋𝑛. Quindi deve essere un valore interno alla distribuzione cioè se
metto in ordine crescente le intensità della distribuzione la media deve essere un valore
compreso tra il valore più piccolo ed il valore più grande ergo non può coincidere né con il
valore più piccolo né con il valore più grande ma deve essere centrale tra questi due valori.

-Media secondo Chisini


4 individui hanno ciascuno un patrimonio in banca (in migliaia di euro) di:
5; 10; 15; 50
Volendo sostituire i 4 patrimoni diversi, con la stessa identica cifra in euro in modo che la
somma dei patrimoni rimanga invariata qual è l'intensità o patrimonio che può essere
sostituita ai singoli valori della X?

5+10+15+50=80 80/4=20
L'intensità da sostituire è il valore della media aritmetica della distribuzione.
In generale data una variabile X che valori X1+X2+........+Xn costituita ad esempio da una
successione di patrimoni individuali di N persone, si consideri di intensità globale cioè la
somma dei patrimoni, qual è l'intensità o patrimonio che può essere sostituita ai singoli valori
della X in modo che rimane invariata l'intensità globale:
A+A+.....A= X1+X2+ …...+Xn
𝑁 𝑁
nA ∑ Xi da cui la media aritmetica A= ∑ /n
𝑖=1 𝑖=1

In altre parole si fa prima la somma tra i valori che si hanno in partenza dopodiché si divide il
risultato per quanti valori sono ad esempio 1,2,3,4 sono 4 valori quindi si fa prima
1+2+3+4=10 e poi si fa 10/4=2.5 perche facendo 2.5+2.5+2.5+2.5=10.

Quindi il criterio della trasferibilità dice: scelta una funzione “f” la media si definisce
secondo Chisini come quel valore unico che è sostituito alle osservazioni di una
distribuzione non ne muta il valore della funzione (non muta il risultato di certe per azioni). A
seconda del criterio della trasferibilità considerato si distinguono differenti tipologie di media:
- media aritmetica (“f”=somma)
- media armonica (“f”=somma degli inversi)
- media geometrica (“f”=prodotto delle intensità)

Media armonica
Infatti se si assume come invariante distributivo la somma degli inversi delle intensità, la
media H sarà quel valore che sostituito a ciascuna intensità lascia invariata la somma dei
reciproci delle intensità:
1 1 1
𝑋1
+ 𝑋2 + ….. + 𝑋𝑛

1 1 1 1 1 1
𝐻
+ 𝐻
+ ….. + 𝐻
=
𝑋1
+ 𝑋2 + ….. + 𝑋𝑛
𝑁
𝑁 1 𝑁
𝐻
= ∑ 𝑋𝑖
da cui H= 𝑁
1
𝑖=1 ∑ 𝑋𝑖
𝑖=1

Sempre con successioni di intensità con frequenza unitaria.

Media quadratica
Infatti se si assume come invariante distributivo la somma dei quadrati delle intensità, la
media Q Sarà quel valore che sostituito a ciascuno intensità lascia invariata la somma dei
quadrati delle intensità

X1² + X2² + …… + Xn²

Q² + Q² + ….. + Q²= X1² + X2² + ….. + Xn²

𝑁
𝑁 ∑ 𝑋𝑖²
𝑖=1
NQ²= ∑ Xi² da cui Q=
𝑁
𝑖=1

Sempre con successioni di intensità con frequenza unitaria.

Media aritmetica

E l’indice statistico più utilizzato per la facilità di calcolo e per le proprietà di cui gode. A
seconda della distribuzione:
- per distribuzioni semplici con frequenza unitaria si parlerà di media aritmetica
semplice. Ottenuta come somma dei valori assunti dalla distribuzione rapportata al
numero di osservazioni. Si utilizza nel caso in cui ci sia intensità o frequenza unitaria.
- per distribuzioni di frequenza della variabile X si parlerà di media aritmetica
ponderata. Ottenuta come somma dei valori della X ponderati (moltiplicati) per le
rispettive frequenze oppure con i pesi delle intensità è rapportata al numero delle
osservazioni. Abbiamo una tabella con la distribuzione di frequenze in cui ci sono i
valori della Xi e ci sono o le frequenze assolute o le frequenze relative oppure i pesi.

Proprietà della media aritmetica


La media aritmetica gode delle seguenti proprietà:
1. internalità: la media è sempre compresa tra il valore minimo ed il valore massimo
della distribuzione
2. baricentro: la media è pari a quel valore che rende nulla la somma degli scarti (si
definisce scarto la differenza tra ciascuna intensità Xi e la media;
3. minimo della somma degli scarti al quadrato: la media è pari a quel valore che
rende minima la somma degli scarti al quadrato tra ciascuna intensità Xi e la media.
Proprietà della media aritmetica semplice: A= µ

𝑁
2) ∑ (Xi-µ) =0 : la somma delle differenze tra ciascuna intensità e la media aritmetica è
𝑖=1
uguale a zero (baricentro);
𝑁
3) ∑ (Xi - µ)² =min : la somma delle differenze al quadrato tra ciascuna intensità e la
𝑖=1
media aritmetica è un minimo.

Esempio di calcolo della media aritmetica:


Calcolare la media aritmetica delle seguenti 5 intensità:
1,5; 0,6; 2,8; 5,2; 4,9
e verificare la prima proprietà degli scostamenti dalla media aritmetica.
1,5+0,6+2,8+5,2+4,9
Soluzione: A= =3 (media aritmetica)
5

La somma degli scarti dalla media è nulla (baricentro)

5
∑ (Xi-A)= (1,5-3) + (0,6-3) + (2,8-3) + (5,2-3) + (4,9-3) =0 → -4,1+4,1=0
𝑖=1

La somma dei quadrati scarti della media è:


5
∑ (Xi-M)²= (1,5-3)² + (0,6-3)² + (2,8-3)² + (5,2-3)² +(4,9-3)²= 16,5
𝑖=1

(Ricorda: quando si fa il quadrato il meno si toglie e diventa positivo)

La somma dei quadrati scarti da un valore qualsiasi M diverso dalla media aritmetica A è:
esempio com M=2 e M=4

5
∑ (Xi-M)²= (1,5-2)² + (0,6-2)² + (2,8-2)² + (5,2-2)² + (4,9-2)²= 21.50
𝑖=1
5
∑ (Xi-M)²= (1,5-4)² + (0,6-4)² + (2,8-4)² + (5,2-4)² + (4,9-4)²= 21,49
𝑖=1

quindi si dimostra che il primo membro è minore della sommatoria di Xi- M (qualsiasi valore
M diverso dalla media aritmetica) :
𝑁 𝑁
∑ (Xi-µ)² < ∑ (xi-M)²
𝑖=1 𝑖=1

Media aritmetica ponderata usando le frequenze assolute

𝑁
∑ 𝑋𝑖 𝑛𝑖
𝑖=1
A= 𝑁
∑ 𝑁𝑖
𝑖=1

-Media aritmetica ponderata usando le frequenze relative

𝑁
A= ∑ Xi fi
𝑖=1

Esempio:
Distribuzione di famiglie classificate secondo il numero di componenti

Numero Frequenze Xi x Ni 𝑛𝑖 𝑛𝑖
componenti Xi assolute Ni fi= Xi x
𝑁 𝑁
2 3 6 0,1875 0,3750

3 12 36 0,7500 2,2500

5 1 5 0,0625 0,3125

totale 16 47 1,0000 2,9375

Media aritmetica ponderata usando le frequenze assolute


𝑁
∑ 𝑋𝑖 𝑛𝑖
𝑖=1 47
A= 𝑁 = =2,93
16
∑ 𝑁𝑖
𝑖=1

In alternativa: media aritmetica ponderata usando le freq relative

𝑁
A= ∑ Xi fi = 2,93
𝑖=1

Media aritmetica per distribuzioni in classi


In presenza di una distribuzione di frequenza in classi (nel caso di variabili continue), nel
calcolo della media è necessario individuare, per ogni classe un valore rappresentativo
(valore centrale della classe) della stessa.
Esso è ottenuto come semisomma degli estremi di ogni classe

Valori centrali di ogni classe


𝑋𝑖 + 𝑋𝑖+1
𝑋𝑖= 2

La media aritmetica sarà:


𝑁
∑ 𝑋𝑖 𝑛𝑖
𝑖=1
A= 𝑁
∑ 𝑁𝑖
𝑖=1
Commento: la media aritmetica è sensibile ai valori anomali che possono essere legati ad
errori oppure essere valori estremi non dovuti ad errori.

Esempio
Classe di altezze frequenza assoluta valore centrale prodotto
Xi-Xi+1 Ni della classe 𝑋𝑖 𝑋𝑖ni
151- 155 4 (151+155)/2= 153 4x153=612

156- 160 9 (156+160)/2=158 9x158=1422

161- 165 15 (161+165)/2=163 15x163=2445

166- 170 7 (166+170)/2=168 7x168=1176


171- 175 8 (171+175)/2=173 8x173=1384

176- 180 3 (176+180)/2=178 3x178=534

180- 185 3 (180+185)/2=183 3x183=549

186- 190 1 (186+190)/2=188 1x188=188

totale 50 8310

8310
A= =166,2 cm
50
Media armonica

Essa si definisce come rapporto tra il numero delle osservazioni (frequenza) e la somma
degli inversi dei valori della distribuzione nella variabile X

Formulazione della media armonica


Media armonica semplice per distribuzioni unitarie

𝑁
H= 𝑁
1
∑ 𝑋𝑖
𝑖=1

Esempio:
Data la seguente successione di intensità determinare la media armonica
12; 15; 19; 23; 28

5 5 5
H= 1 1 1 1 1 = 0,0833+0,0667+0,0526+0,0435+0,0357 = 0,2818 = 17,74
12
+ 15
+ 19
+ 23
+ 28

Media armonica ponderata

𝑁
∑ 𝑁𝑖
𝑖=1
H= 𝑁
1
∑ 𝑋𝑖
𝑛𝑖
𝑖=1

Xi ni 1 1
x ni
𝑋𝑖 𝑋𝑖
2 3 0,50 1,5
3 12 0,33 3,96
5 1 0,20 0,20

totale 16 5,66

16
H= =2,82
5,66

Media quadratica

Essa si definisce come la radice quadrata della somma dei quadrati dei valori della
distribuzione della variabile X la rapportata al numero di osservazione

Formulazione della media quadratica


Media quadratica semplice per le distribuzioni unitarie

𝑁
∑ 𝑋𝑖²
𝑖=1
Q=
𝑁

Esempio
Calcolare la media quadratica delle seguenti 4 intensità
2; 5; 7; 9

4+25+49+81
Q= =6,305
4

Media quadratica ponderata

𝑁
∑ 𝑋𝑖² 𝑛𝑖
𝑖=1
Q= 𝑁
∑ 𝑁𝑖
𝑖=1
Esempio

Xi ni Xi² Xi² x ni

2 3 4 12
3 12 9 108
5 25 25 25

totale 16 145

145
Q= =3,01
16

Media di potenze di ordine S

La media di potenza (media generalizzata o media s-esima) rappresenta una


generalizzazione delle medie pitagoriche. È definita come la radice s-esima della media
aritmetica delle potenze di esponente s degli n valori considerati:

𝑁
𝑠 ∑ 𝑋𝑖²
𝑖=1
𝑀𝑠 = 𝑛

● Se al posto di s metto 0 avrò la media geometrica se metto 1 avrò la media


aritmetica se metto 2 avrò la media quadratica se invece metto -1 avrà la media
armonica se metto 3 avrò la media cubica e così via. Il risultato della media armonica
sarà minore della media geometrica che sarà minore della media aritmetica che sarà
minore della media quadratica che sarà minore della media cubica.

Molte altre tipologie di media sono casi particolari della media generalizzata, per opportuni
valori di s.

Medie di posizione

le medie di posizione si basano solo su alcuni particolari valori della distribuzione di


frequenza infatti, sono quelle medie il cui calcolo, a differenza delle medie analitiche, non
tiene conto di tutti i valori della distribuzione, ma solo di alcuni di essi.

Tra le medi di posizione possiamo annoverare:


- moda
- mediana

-La moda
La moda Mo detta anche “norma”, è il valore (intensità o modalità) a cui corrisponde la
massima frequenza (interna alla distribuzione statistica) assoluta o relativa. Più
precisamente si chiama moda ogni valore interno all’intervallo (X1-Xn) tale che la sua
frequenza Ni verifichi la seguente disuguaglianza: Ni>Ni-1 Ni>Ni+1 cioè risulti maggiore
della precedente e della successiva.

Esempio
2; 2; 3; 3; 4; 4; 4; 7; 9
La moda di questo campione è 4 in quanto compare ben 3 volte quindi la frequenza è
maggiore del valore precedente 3 che compare solo 2 volte e del successivo 7 che compare
solo 1 volta.

Una distribuzione può presentare più mode:


- distribuzioni unimodali: distribuzioni di frequenza che hanno una sola moda, ossia un
solo punto di massimo (che rappresenta sia il massimo relativo che il massimo
assoluto);
- distribuzioni bimodali o k-modali: distribuzioni di frequenza che presentano due o più
mode, ossia che hanno due (o k) massimi relativi.
Esempio distribuzione unimodale
1;2;2;3;3;3;4;4;4;4;5;5;5;6;6;7;7;8

Esempio di distribuzione bimodale


1;2;2;3;3;3;3;5;6;6;6;6;6;7;7;8;8

La moda può essere calcolata per qualunque carattere statistico, sia esso qualitativo che
quantitativo.

Titolo di studio Frequenza

Nessuno 65

Licenza elementare 67

Licenza media 69

Diploma professionale 56

Diploma superiore 53

Laurea triennale 45

Laurea magistrale 34

Specializzazione post-laurea 70
La moda è il titolo di studio licenza media

Esempio
Data la seguente successione di intensità:
14;17;22;24;12;15
E’ zero modale perché ogni intensità si ha solo una volta.

La moda, tra le misure di tendenza centrale è l’unica che non sempre esiste; nell’esempio
precedente la moda è zero infatti non esiste una intensità con frequenza massima per cui la
moda non esiste.

Esempio della moda di una distribuzione di frequenze


Xi ni

1 15

3 13

5 24

7 17

La moda è 5 quindi Mo=5


Moda per caratteri continui
Nel caso di caratteri continui e per distribuzioni fornite per classi di ampiezza, il calcolo della
moda avviene mediante l'individuazione della classe modale, cioè quella caratterizzata dalla
massima frequenza quindi sempre maggiore della precedente e della successiva..

Se le classe non sono equi-ampie è bene dividere la frequenza assoluta di ogni classe per
l'ampiezza dell’intervallo ottenendo la cosiddetta “densità di frequenza”. La classe modale è
quella con la densità di frequenza più alta.

Ampiezza della classe:


α𝑖= Xi+1 - X

Densità di frequenza:
𝑛𝑖
di=
α𝑖

Esempio del calcolo della classe modale

Classi di età ni Ampiezza classe Densità di frequenza

20-30 100 10 10

30-40 200 10 20

40-60 300 20 15

60-70 100 10 10
totale 700

La classe modale è quella della classe d’età 30-40 perchè è quella con la densità di
frequenza più alta.

-La mediana
Ordinato un insieme di valori in modo crescente o decrescente la mediana Me è il
valore che bipartisce la distribuzione.
Il calcolo della mediana si differenzia a seconda che esso riguardi una distribuzione unitaria
(successione di intensità) o una distribuzione di frequenza con Ni pari o dispari.

NB. Prima di calcolare la mediana bisogna sempre ordinare la distribuzione in ordine


crescente sulla base delle modalità della variabile X.

Formulazione della mediana per determinare il posto

𝑁+1
N dispari: Pme=
2

𝑁 𝑁
N pari: Pme= e P’me= +1
2 2

Esempio 1
N dispari: N=5

X1=2; X2=5; X3=7; X4=11; X5=17

5+1
Pme= = 3 Me=7
2
Esempio 2
N pari: N=6

X1=2; X2=5; X3=7; X4=11; X5=17; X6=19

6
Pme= =3
2

6 7+11
P’me= +1= 4 Me= =9
2 2

Esempio 3
Calcolare la media e la mediana di una seria di 6 dati
13.1; 13.9; 14.2; 14.5; 10.1; 10.8

per calcolare la mediana in primis mettiamo in ordine le intensità


10.1 10.8 13.1 13.9 14.2 14.5

6 6 13.1+13.9
Pme= =3 P’me= +1= 4 Me= =13,5
3 3 2

La media sarà: 10.1+10.8+13.1+13.9+14.2+14.5 /6=12.77 A=12.77


Mediana per distribuzioni di frequenze
Nel caso di distribuzioni di frequenze di un carattere per singoli valori (non suddiviso in
classi) si opera come segue:
- si calcolano le frequenze cumulate
- si calcolano la mediana con le formule precedenti, a seconda che N sia pari o dispari

Esempio con frequenze dispari


Numero componenti Xi Famiglie Ni

1 2

2 4

3 7

4 2

Totale 15

La moda è 3
La mediana in questo caso si calcola con le frequenze cumulate quindi:

Numero componenti Xi Famiglie Ni Freq.cumulata


1 2 2

2 4 6

3 7 13

4 2 15

Totale 15
𝑁+1 15+1
Pme= Pme= =8 Me=3
2 2

Cioè la mediana è il numero di componenti che occupa il 8° posto, cioè 3.


1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 4; 4

Esempio con frequenze pari:


Numero componenti Xi Famiglie Ni Freq. Cumulate

1 2 2

2 4 6

3 7 13

4 3 16

Totale 16
16 16
Pme= =8 P’me= +1=9
2 2

1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4

-Quartili
La mediana corrisponde alla modalità assunta dall'unità statistica che bipartisce la
distribuzione ordinata delle osservazioni (modalità o intensità). Il 50% delle unità statistiche
si trova alla sinistra della mediana, mentre l'altro 50% alla sua destra.

Analogamente possibile definire i seguenti quartili di una distribuzione:


- il primo quartile Q1 corrisponde alla modalità assunta dall'unità statistica per la quale
25% delle unità statistiche presenta valori ad essa inferiori;
- il secondo quartile Q2 coincide con la mediana;
- il terzo quartile Q3 corrisponde alla modalità assunta dall'unità statistica per la quale
75% delle unità statistiche presenta valori ad essa inferiori
- decili: le soglie sono in questo caso 10%; 20%; 30%; 40%;
- percentili generalizzazione dell'indice di posizione a qualunque percentuale della
distribuzione.
Esempio 1
Si considerino i seguenti dati relativi al numero di esami sostenuti da un gruppo di 15
studenti che frequentano il corso di statistica economica:
7; 5; 8; 4; 11; 9; 15; 16; 10; 6; 3; 16; 12; 14; 9

Usando la successione di intensità


1) determinare la mediana; 2) determinare Q1 e Q3

Soluzione:
È necessario Innanzitutto ordinare in senso crescente le modalità assunte dal carattere nelle
diverse unità statistiche
3; 4; 5; 6; 7; 8; 9; 9; 10; 11; 12; 14; 15; 16; 16

15+1
Pme= =8 Me=9
2
1
Pq1= N. =3.75⇒ 4 Q1=6
4
3
Pq3=N. =11.25⇒ 12 Q3=14
4
Esempio 2
La seguente tabella riporta la distribuzione del carattere X numero di stanze di 129 abitazioni
di un quartiere. Calcolare 1° e 3° quartile

N.stanze Xi Abitazioni Ni Ci

1 10 10
2 35 45
3 40 85
4 21 106
5 10 116
6 6 122
7 4 126
8 2 128
9 1 129

129

1
Pq1=129. = 32.25⇒ 33 Q1=2
4
3
Pq3=129. =96.75⇒ 97 Q3=4
4

Variabilità

La variabilità di una distribuzione è l’attitudine di un carattere di assumere diverse modalità.

In un processo mirato alla descrizione di un fenomeno, l’individuazione di un indice di


posizione non può ritenersi esaustivo. Infatti alla conoscenza della tendenza centrale si
accompagna l’esigenza di descrivere quanto l’indice di posizione considerato possa ritenersi
realmente rappresentativo dei valori assunti dalle unità del collettivo. Quindi si vuole capire
quanto le modalità osservate sulla popolazione siano vicine o lontane dal “centro” della
distribuzione.

Pertanto la variabilità di una variabile statistica si traduce nella diversificazione delle


modalità osservate. Se X è quantitativa, tale diversificazione si intende sia come diversità di
valori osservati sia come distanza fra tali valori.

Le misure di variabilità di una distribuzione si distinguono in misure di:


- dispersione rispetto ad un centro
- disuguaglianza dei dati tra loro
Esempio
DISTRIBUZIONE:
A 5 7 8 4 6 Media aritmetica =6
B 6 6 6 6 6 Media aritmetica =6
C 4 8 9 3 6 Media aritmetica =6

Nei tre casi la media è sempre 6 ma nel secondo caso non c’è variabilità (i termini sono tutti
uguali tra loro).
Nel primo la variabilità e bassa, nel terzo la variabilità è più alta. La diversa attitudine che
può assumere il carattere, viene misurata con un indice di variabilità.

Tutti gli indici di variabilità devono avere le seguenti proprietà:


- quando la variabilità e nulla, l’indice di variabilità deve assumere valore 0
- il valore dell’indice di variabilità cresce all’aumentare della variabilità
- l’indice di variabilità non può assumere valori negativi (la variabilità o c’è o non c’è)

Gli indici di variabilità come le medie, si distinguono in indici di posizione e indici di


variabilità di calcolo.

-Indici di variabilità di posizione


Un approccio alternativo, e spesso utile, alla misura della variabilità è quello basato sul
confronto di valori caratteristici della distribuzione.
Gli indici più utilizzati sono:
- il campo di variazione. E’ definito come differenza tra il valore massimo e minimo
delle modalità del carattere R=(X)max-(X)min
- la differenza interquartile. E’ definita come differenza tra il terzo e il primo quartile
della distribuzione. D1=Q3-Q1

Il campo di variazione è una misura molto grossolana che dipende soltanto dai valori
estremi senza tener conto dei valori intermedi che sono generalmente più numerosi.
Esempio: Intensità dei 15 maggiori terremoti (scala Richter) nel periodo 1983/1991
5,5 ; 7,7 ; 7,1 ; 7,8 ; 8,1 ; 7,3 ; 6,5 ; 7,3 ; 6,8 ; 6,9 ; 6,3 ; 6,5 ; 7,7 ; 7,7 ; 6,8

Il campo di variazione risulta R=8,1-5,5=2,6. Esso ci dice che il 100% delle scosse di
terremoto è stata di un'intensità compresa tra 5,5 e 8,1.

Un indice di variabilità meno grossolano del campo di variazione è la differenza


interquartile, che è uguale alla differenza tra il terzo ed il primo quartile della distribuzione.
Altri indici dello stesso tipo si ottengono facendo la differenza tra il nono ed il primo decile.
La differenza interquartile, escludendo le code della distribuzione, è meno influenzata da
valori estremi della stessa anche se ha lo svantaggio di non considerare tutte le informazioni
a disposizione. Identifica quindi l'intervallo centrale della distribuzione di frequenza all’interno
del quale cade il 50% delle osservazioni.

-Campo di variazione (range): R=X(n)-X(1)


-Scarto interquartile: Di=Q3-Q1
Esempio campo di variazione (range)

Voto di esame di statistica Xi Ni

18 5

20 7

23 8

26 8

28 17

30 5

Tot 50

Si ottiene come differenza tra l’estremo superiore e quello inferiore dei valori osservati nella
distribuzione del carattere nel collettivo. R=30-18 =12. Significa che tra il più bravo ed il
meno bravo dei 50 studenti esaminati c’è una diversità di voto di 12 punti.

Esempio differenza interquartile


Voto Xi Studenti Frequenza Cumulata Ci
Esame di statistica Ni

18 5 5

20 7 12

23 8 20

26 8 28

28 17 45

30 5 5

Tot 50

1 1
Pq1= N. = 50. =12.5→13 Q1=23
4 4
3 3
Pq3=N. =50. =37,5→38 Q3=28
4 4

Si ottiene come differenza tra i terzo ed il primo quartile dei valori osservati nella
distribuzione del carattere nel collettivo Di=28-23 =5. Significa che il 50% delle unità
statistiche ha preso un voto compreso tra il 23 ed il 28. la differenza è di 5 punti.

Le misure di variabilità di calcolo si distinguono in due categorie:


- Indici che misurano la variabilità rispetto ad una misura di posizione. Questi si
basano su una sintesi degli scarti delle modalità rispetto al valore centrale di
riferimento (la media aritmetica, mediana, ecc.);
- Indici che misurano la variabilità reciproca tra tutte le modalità considerate due
a due. Effettuano una sintesi dell’insieme delle differenze (in valore assoluto) tra le
intensità della distribuzioni considerati due per volta.

Misure di dispersione

Un indice di variabilità rispetto ad un centro misura la dispersione che caratterizza il


maggiore o minore addensamento delle osservazioni rispetto ad una media prestabilita.
Gli indici maggiormente diffusi si basano sul concetto di “scarto” (o scostamento) delle
modalità rispetto alla media (intesa come media aritmetica).

Tra questi, si ricordano:


- la devianza
- la varianza
- lo scostamento semplice dalla media o dalla mediana
- lo scarto quadratico medio

Scarto dalla media


(X1-A), (X2-A)....,(Xn-A)

-Varianza
Un indice più importante per misurare la variabilità è la varianza per esprimere la variabilità
di una distribuzione rispetto alla media aritmetica.
Essa si definisce come la media degli scarti al quadrato.
Come è facile verificare gode di tutte le caratteristiche necessarie agli indici di variabilità:
1) È una misura (non negativa) varia tra 0 e infinito
2) Cresce al crescere della misura degli scarti e quindi della variabilità della
distribuzione
3) È nulla se le unità assumono tutte lo stesso valore.

La difficoltà nell’interpretazione della varianza deriva dal fatto che essa è espressa nella
unità di misura del fenomeno al quadrato per es. considerando la distribuzione delle stature
degli abitanti di una regione espresse in cm, sappiamo che le differenze dalla media
aritmetica sono valori espressi in cm, ma che elevandole al quadrato otteniamo i valori in
cm².
Per questo motivo è preferibile usare come indice di variabilità lo scarto quadratico medio.
𝑁
∑ (𝑋1−𝐴)²
𝑖=1
Varianza per una distribuzione unitaria: σ²=
𝑁

𝑁
∑ (𝑋1−𝐴)²𝑁𝑖
𝑖=1
Varianza per una distribuzione di frequenza σ²= 𝑁
∑ 𝑁𝑖
𝑖=1

-Devianza
Si definisce devianza la somma degli scarti al quadrato. Essa è pari al numeratore della
varianza.

Per distribuzione unitaria


𝑁
Devianza= ∑ (𝑋1 − 𝐴)²
𝑖=1

Per distribuzioni di frequenza


𝑁
Devianza= ∑ (𝑋1 − 𝐴)²𝑁𝑖
𝑖=1
-Scarto quadratico medio
Si definisce scarto quadratico medio σ la radice della media degli scarti al quadrato. Esso
è pari alla radice quadrata della varianza. Lo SQM è più sensibile di altre misure di
variabilità alla presenza di modalità particolarmente basse o alte. Tra i tre indici, lo SQM è
quello che si presta a più facile interpretazione in quanto espresso nella stessa unità di
misura della variabile X. Lo SQM può leggersi come “lo scostamento medio delle modalità
della distribuzione rispetto alla media”.

Formulazione dello scarto quadratico medio


-Distribuzione unitaria

𝑁
∑ (𝑋𝑖−𝐴)²
𝑖=1
σ= = σ²
𝑁

-Distribuzione di frequenze

𝑁
∑ (𝑋𝑖−𝐴)²𝑁𝑖
𝑖=1
σ= 𝑁 = σ²
∑ 𝑁𝑖
𝑖=1

Esempio
Consideriamo la distribuzione dei voti ottenuti all’esame di statistica da 5 studenti
22; 24; 25; 27; 30

Calcolare
1) la devianza
2) la varianza
3) lo scarto quadratico medio A=25,6

Valori Xi Scarti (X1-A) Quadrati degli scarti (X-A)²

22 22-25,6=-3,6 12,96

24 24-25,6=-1,6 2,56
25 25-25,6=-0,6 0,36

27 27-25,6=1,4 1,96

30 30.25,6=4,4 19,36

Tot 128 0 37,2

𝑁
∑ (𝑋𝑖−𝐴)²
128 𝑖=1 37,2
A=
5
=25,6 σ= 𝑁
=
5
=2,72

37,2
DEV=37,2 Var= =7,44
5

Si definisce scostamento semplice dalla media SA la media degli scarti in valore assoluto
dalla media.

-Distribuzione unitaria
Scostamento semplice dalla media
𝑁
∑ |𝑋𝑖−𝐴|
𝑖=1
SA=
𝑁

-Distribuzione di frequenze
Scostamento semplice dalla media
𝑁
∑ |𝑋𝑖−𝐴|𝑁𝑖
𝑖=1
SA=
𝑁

Si definisce scostamento semplice dalla mediana S(Me) la media degli scarti in valore
assoluto dalla mediana
-Distribuzione unitaria
Scostamento semplice dalla mediana
𝑁
∑ |𝑋𝑖−𝑀𝑒|
𝑖=1
S(Me)=
𝑁

-Distribuzione di frequenze
Scostamento semplice dalla mediana
𝑁
∑ |𝑋𝑖−𝑀𝑒|𝑁𝑖
𝑖=1
S(Me)=
𝑁

Esempio (facendo riferimento all’esercizio di prima)


Valori Xi Scarti in valore assoluto da A Scarti in valore assoluto da Me
|𝑋𝑖 − 𝐴| |𝑋𝑖 − 𝑀𝑒|

22 22-25,6=3,6 22-25=3

24 24-25,6=1,6 24-25=1

25 25-25,6=0,6 25-25=0

27 27-25,6=1,4 25-27=2

30 30-25,6=4,4 30-25=5

Totale 128 11,6 11

𝑁
∑ |𝑋𝑖−𝐴|
𝑖=1 11,6
SA= = =2,32
𝑁 5

𝑁+1 5+1
N dispari: N=5 Pme= = =3 Me=25
2 2

𝑁
∑ |𝑋𝑖−𝑀𝑒|
𝑖=1 11
SMe= = =2,2
𝑁 5

Misure di disuguaglianza

Le differenze medie sono indici di mutua variabilità, che esaminano le differenze in valore
assoluto, tra le modalità a due a due facendone una sintesi con una opportuna media Tali
differenze possono essere:
- con ripetizione, quando contengono tutte le n² differenze possibili
- senza ripetizione, quando contengono sono le n(n-1) differenze diverse (non avendo
considerato i confronti tra ciascuna modalità e se stessa). Si sintetizzano queste
differenze con la media aritmetica ottenendo la differenza semplice media con e
senza ripetizione.

Se si considerano tutte le differenze assolute si ha la differenza media assoluta con


ripetizione
𝑁 𝑁
∑ ∑ |𝑋𝑖−𝑋𝑗|
𝑖=1𝑗=1
∆R= (i≠j)
𝑛²

Se, invece, si escludono le differenze con termini uguali, si ha la differenza media assoluta
senza ripetizione
𝑁 𝑁
∑ ∑ |𝑋𝑖−𝑋𝑗|
𝑖=1𝑗=1
∆= (i≠j)
𝑛(𝑛−1)

Esempio
Sia dato il seguente insieme di numeri:
8; 1; 7; 3

Calcolare la differenza semplice media con e senza ripetizione

Per il calcolo delle differenze medie, considerando il numero non elevato dei valori del
carattere, si può predisporre una matrice quadrata, con i lati disposti in ordine crescente ed
in ogni casella figurano le differenze Xi - X j

1 3 7 8
--------------------------
1 l 0 -2 -6 -7
3 l 2 0 -4 -5
7 l 6 4 0 -1
8l 7 5 1 0

2|2+6+7+4+5+1|
∆R= =3,12
16
2|2+6+7+4+5+1|
∆= =4,16
12

Coefficiente di variazione
Le misure considerate sino ad ora rappresentano degli indici di variabilità assoluta (ad
esempio Kg, litri, euro, ecc). Essi infatti assumono valori in una scala di variazione che
dipende strettamente dall’unità di misura e dall’intervallo in cui la variabile assume valori.
Se le modalità quantitative delle distribuzioni statistiche sono espresse in unità di misura
diverse oppure, se esse sono espresse nella stessa unità di misura, ma con intensità medie
differenti, allora per il confronto si devono usare indici di variabilità relativa (si pensi alla
comparazione tra la variabilità del peso e delle altezze di un gruppo di individui).
Il più diffuso è il coefficiente di variazione (CV) che si ottiene rapportando lo SQM alla
media in valore assoluto.

σ
CV= .100
𝐴

Il risultato è una misura proporzionale della variabilità rispetto alla media. Il CV è


indipendente dall’unità di misura, cioè è un numero puro. Altri indici relativi si ottengono
dividendo lo scostamento semplice medio dalla media per la media o lo scostamento
semplice mediano per la mediana.

𝑆𝑀𝑒
.100
𝑀𝑒

Esempio 1 di calcolo degli indici di variabilità


Calcoliamo lo scarto quadratico medio della distribuzione
3; 5; 7; 8; 9

Dopo aver trovato la media aritmetica


A=(3+5+7+8+9)/5= 32/5= 6,4

Costruiamo la tabella
Valori Xi Scarti (Xi-A) Quadrati degli scarti (x-A)²

3 3-6,4=-3,4 11,56

5 5-6,5=-1,4 1,96

7 7-6,4=0,6 0,36

8 8-6,4=1,6 2,56

9 9-6,4=2,6 6,76

Totale 32 0 23,2
La somma dei quadrati degli scarti è 23,2, che diviso per n=5 dà la varianza 4,64 la cui
radice quadrata è lo scarto quadratico medio
σ=2,15 Devianza= 23,2
23,2
σ²= 5 =4,64
23,2 2,15
σ= =2,15 CV= .100=33,59%
5 6,4

Concentrazione

La concentrazione di una variabile X deriva dalla possibilità di trasferire l'ammontare del


fenomeno da l'unità statistica ad un'altra, avvicinandosi o allontanandosi dalla situazione di
equidistribuzione dell'ammontare complessivo della variabile.

Una variabile (carattere quantitativo) è trasferibile se:


- assume soltanto valori non negativi
- ammette, sotto l'aspetto logico, che l'ammontare della variabile possa essere
trasferito (anche solo idealmente) da un'unità all'altra e, al limite, sia concentrato in
una sola unità statistica.

Variabili trasferibili Variabili non trasferibili

Reddito Forma

Popolazione Altezza

Azioni Peso

Le aree di interesse della concentrazione


- concentrazione dei redditi e della ricchezza
- concentrazione industriale
- concentrazione del mercato internazionale
- concentrazioni finanziarie

Si parla di equidistribuzione dei carattere quando l'ammontare complessivo della variabile


è ripartito in misura uguale tra tutte le unità statistiche.

Quote azioni Xi Azionisti Ni

25 1

25 1

25 1

25 1

Totale 4

Si ha massima concentrazione quando una sola unità del collettivo possiede tutto
l'ammontare del carattere e tutte le altre posseggono 0.
Quote azioni Xi Azionisti Ni

0 1

0 1

0 1

100 1

Totale 4

Per misurare la concentrazione si costruisce un indice che confronta la frazione cumulata di


unità statistiche (frequenze cumulate relative) (pi) con la frazione cumulata di ammontare del
fenomeno (intensità cumulate relative) (qi).

Si supponga di disporre di N modalità di una variabile statistica X (reddito, patrimonio, azioni


ecc.) in ordine crescente:

X1 < X2 < X3 <....< Xi <....< Xn

Indichiamo Inoltre con An il reddito complessivo posseduto dagli N redditieri (il carattere
posseduto dalle N unità) cioè:

An= X1 + X2 + X3 +.... + Xn

L'obiettivo è quello di studiare il modo in cui An (ammontare del carattere) si ripartisce tra gli
N redditieri (persone)

Ad esempio Supponiamo che gli azioni possedute disposte in ordine crescente di 4 persone
siano, in euro:
10; 15; 25; 50

In tal caso N=4

An= 100 somma delle azioni (ammontare del carattere)


Quote azioni Azionisti Ni Ai intensità Qi intensità Ci Pi
Xi cumulate cumulate relative frequenze frequenze
cumulate cumulate
relative

10 1 10 10/100=0,1 1 1/4=0,25

15 1 25 25/100=0,25 2 2/4=0,5

25 1 50 50/100=0,5 3 3/4=0,75

50 1 100 100/100=1,00 4 4/4=1,0

Totale 100 4 si usano le si usa il tot di Xi si usano le si usa il tot


Xi Ni di Ni

1 2
La prima unità statistica rappresenta del numero totale, le prime due ecc. Indicando
𝑁 𝑁
tali frazioni con P1, P2,...,Pn

Si hanno le frazioni cumulate delle N unità osservate o frequenze cumulate relative:


1 2 𝑖 𝑛
P1= ; P2= ;... Pi= ;... Pn= =1
𝑁 𝑁 𝑁 𝑁

Costruiamo analogamente le frazioni di reddito posseduto o intensità cumulate relative:


𝑋𝑖 𝑋𝑖+𝑋2 𝑋1+...+𝑋𝑛
Q1= ; Q2= ;.... Qi= ;... Qn=1
𝐴𝑛 𝐴𝑛 𝐴𝑛

Poiché le Xi sono poste in ordine crescente sarà:


Q1≤P1;...; Qi≤Pi;...;Qn-1≤Pn-1

Il carattere è tanto più concentrato quanto più elevate sono le differenze:


Q1-P1;...; Qi-Pi;...; Qn-1-Pn-1

Se si verifica la situazione di massima concentrazione; in cui tutto l'ammontare del


carattere si trova concentrato in una sola unità risulta:
Q1=Q2=...Qn-1=0; Qn=1

Esempio
Quote azioni Azionisti Ni Ai intensità Qi intensità Ci Pi frequenze
Xi cumulate cumulate frequenze cumulate
relative cumulate relative

0 1 0 0 1 1/4=0,25

0 1 0 0 2 2/4=0,5

0 1 0 0 3 3/4=0,74

100 1 100 100/100=1,00 4 4/4=1,0

Totale 4

Se il carattere (patrimonio, reddito ecc.) forse ugualmente distribuito tra le N unità


(persone), si avrebbe sempre
Q1=P1; Q2=P2;....; Qi=Pi;....; Qn=Pn

Qui l’indice di variabilità è 0


Quote azioni Azionisti Ni Ai intensità Qi intensità Ci Pi frequenze
Xi cumulate cumulate frequenze cumulate
relative cumulate relative

25 1 25 25/100=0,25 1 1/4=0,25

25 1 50 50/100=0,50 2 2/4=0,50

25 1 75 75/100=0,75 3 3/4=0,75

25 1 100 100/100=1,00 4 4/4=1,00

Totale 4

La variabilità e la concentrazione esistono le seguenti relazioni:


- il caso di variabilità nulla corrisponde al caso di concentrazione nulla (ad esempio,
tutti gli individui considerati hanno un reddito uguale);
- la situazione limite di massima concentrazione; cioè (n-1) persone con reddito
nullo ed una con il totale di reddito, identifica anche la situazione di massima
variabilità possibile (massima concentrazione) per un fenomeno trasferibile. Come
misura della concentrazione tu assumersi il seguente rapporto di concentrazione di
𝑁−1
∑ (𝑃𝑖−𝑄𝑖)
𝑖=1
Gini: R= 𝑁−1 . L’indice di Gini è un indice relativo normalizzato che cresce
∑ 𝑃𝑖
𝑖=1
al crescere del livello di concentrazione ed è compreso tra 0 (nel caso di
equidistribuzione perché le differenze tra le P e le Q sono 0) e 1 (nel caso di
massima concentrazione).
Quote Azionisti Ai Qi intensità Ci Pi Pi-Qi
azioni Xi Ni intensità cumulate relative frequenze frequenze
cumulat cumulate cumulate
e relative

10 1 10 10/100=0,1 1 1/4=0,25 0,25-0,1=0,15

15 1 25 25/100=0,25 2 2/4=0,5 0,5-0,25=0,25

25 1 50 50/100=0,5 3 3/4=0,75 0,75-0,5=0,25

50 1 100 100/100=1,00 4 4/4=1,0 -----

Totale 4 0,65
𝑁−1
∑ (𝑃𝑖−𝑄𝑖)
𝑖=1 (0,25−0,1)+(0,5−0,25)+(0,75.−0,5) 0,65
R= 𝑁−1 R= = =0,433
0,25+0,5+0,75 1,5
∑ 𝑃𝑖
𝑖=1
N.B non abbiamo preso in considerazione 1 perché è la sommatoria che va da 1 ad
N-1 quindi in questo caso 0,75.

Un altro strumento che permette di valutare il grado di concentrazione è la curva di Lorenz.


Si tratta di un grafico ottenuto unendo con dei segmenti i punti di coordinate (Pi sull’asse
delle X, Qi sull’asse delle Y). La concentrazione è rappresentata attraverso un grafico, curva
di Lorenz, dove la bisettrice è pari alla situazione di equidistribuzione (infatti viene chiamata
anche retta di equidistribuzione dove le P e le Q sono uguali ovvero la blu) e l’area
compresa tra questa e la curva misura invece l'indice R. Maggiore e l'area tra la curva di
Lorenz (detta anche spezzata di concentrazione quella nera) e la bisettrice, maggiore è la
concentrazione. Se R=0 la curva di Lorenz coincide con la retta di equidistribuzione quando
P=Q.

Esempio
Quote Azionisti Ai Qi intensità Ci Pi Pi-Qi
azioni Xi Ni intensità cumulate relative frequenze frequenze
cumulat cumulate cumulate
e relative

10 1 10 10/100=0,1 1 1/4=0,25 0,25-0,10=0,15

20 1 30 30/100=0,30 2 2/4=0,5 0,5-0,35=0,20

30 1 60 60/100=0,60 3 3/4=0,75 0,75-0,60=0,15

40 1 100 100/100=1,00 4 4/4=1,0 -----

Totale 4 0,65
100
(0,25−0,10)+(0,5−0,30)+(0,75.−0,60)
R= = 0,33 R=0,33
0,25+0,5+0,75

Esempio di concentrazione: distribuzione di frequenza


Xi ni Ni Pi=Ni/N Xi.ni Ai Qi=Ai/An Pi-Qi

100 5 5 0,17 500 500 0,08 0,08

150 6 11 0,37 900 1400 0,24 0,13

175 7 18 0,60 1225 2625 0,44 0,16

250 5 23 0,77 1250 3875 0,66 0,11

280 3 26 0,87 840 4715 0,80 0,07

300 4 30 1,00 1200 5915 1,00

0,55
R= =0,20
2,77

Indici di forma

-Asimmetria
Se la distribuzione è simmetrica media, moda e mediana corrispondono. Per quanto
riguarda l’asimmetria:
- è detta destra (più correttamente a destra), la successione delle 3 misure di
tendenza centrale da sinistra a destra è: moda, mediana, media. In questo caso le
classi più frequenti le ritroviamo prima della media. Si fa l'istogramma con le classi di
intensità e poi si uniscono i punti.

Si parla di asimmetria positiva se la coda più lunga e a destra della media; in questo caso si
notano molti valori inferiori al valore medio della distribuzione.
µ<Me < Mo

- è detta sinistra (più correttamente a sinistra), la successione delle tre misure di


tendenza centrale da sinistra a destra è: media, mediana, moda.

Si parla di asimmetria a sinistra se la coda più lunga si presenta a sinistra della media; in
questo caso si notano molti valori superiori al valore medio della distribuzione.
Caratteristiche: La moda è spostata verso l'estremo superiore della distribuzione
-Box Plot
I diagrammi box plot sono un metodo grafico diffuso recentemente dai programmi
informatici, per la facilità con la quale possono essere costruiti. Servono per rappresentare
visivamente tre caratteristiche fondamentali di una distribuzione statistica:
- il grado di dispersione o variabilità dei dati, rispetto alla mediana e/o alla media;
- la simmetria;
- la presenza di valori anomali.

È costruita di fianco ad una scala che riporta le modalità o valori del carattere e si costruisce
a partire da una linea orizzontale, interna alla scatola che rappresenta la mediana che sarà
poi delimitata da due linee esterne orizzontali che è rappresentano il quartile superiore (terzo
quartile Q3) e il quartile inferiore (primo quartile Q1). Poi ci sono i baffi che sono
rappresentati dal valore adiacente inferiore e dal valore adiacente superiore e se i baffi sono
abbastanza attaccati alla scatola quindi molto corti vuol dire che non ci sono valori anomali
mentre se sono molto lunghi si possono evidenziare dei valori anomali sia particolarmente
piccoli rispetto alla media della distribuzione sia eccessivamente grandi.

Può anche essere sviluppato in orizzontale:

Esempio:
La seguente successione di intensità rappresenta i voti ottenuti da un campione di 14
studenti iscritti al primo anno di economia. Rappresentare graficamente con il diagramma
box plot.

25; 28; 22; 28; 20; 22; 23; 25; 25; 25; 26; 26; 26; 27

20; 22; 22; 23; 25; 25; 25; 25; 26; 26; 26; 27; 28; 28

Xi Ni

20 1

22 2

23 1

25 4

26 3

27 1

28 2

A=25
𝑁 𝑁 25+25
Pme= P’me= +1 Pme=7 P’me=8 =25 Me=25
2 2 2

1
Q1=N. = 3.5→4 Q1=23
4
3
Q3=N. =10.5→11 Q3=26
4
Asimmetrico leggermente a sinistra
Esempio 2
Un gruppo di 7 individui possiede le seguenti azioni di una nota casa farmaceutica:
7; 9; 11; 15; 2, 3; 4

2; 3; 4; 7; 9; 11; 15

Xi Ni

2 1

3 1

4 1

7 1

9 1

11 1

15 1

Mo= zero modale

A=7,29

𝑁+1
Pme= =4 Me=4
2

1
Q1=N. =1.75 →2 Q1=3
4
3
Q3=N. =5.24→6 Q3=11
4

Asimmetrico leggermente a destra

Rapporti statistici

I rapporti statistici sono misure statistiche elementari finalizzate al confronto tra i dati. Un
rapporto statistico è un quoziente tra due termini con i quali esiste un legame logico e può
essere utilizzato per comparazioni sia spaziali (da una regione all'altra) che temporali (tra un
periodo ed un altro). Assumono un valore sempre positivo e non dipendono dalle unità di
misura.

-Tipi di rapporti statistici


Esistono numerosi modi per costruire rapporti statistici:
- rapporto di composizione
- rapporto di coesistenza
- rapporto di derivazione
- rapporto di densità
- numeri indici

-Rapporto di composizione
Rapportiamo le frequenze o l'intensità di una data modalità di un fenomeno alle frequenze o
intensità complessiva dello stesso fenomeno.

𝑃𝑎𝑟𝑡𝑒 𝑑𝑒𝑙 𝑓𝑒𝑛𝑜𝑚𝑒𝑛𝑜


R.comp=
𝑇𝑜𝑡𝑎𝑙𝑒 𝑓𝑒𝑛𝑜𝑚𝑒𝑛𝑜

Esempio: la composizione percentuale della forza lavoro rispetto al sesso, alle fasce di età,
al titolo di studio posseduto, etc,;
𝐴𝑡𝑡𝑖𝑣𝑖 𝑚𝑎𝑠𝑐ℎ𝑖 𝑜 𝑎𝑡𝑡𝑖𝑣𝑒 𝑓𝑒𝑚𝑚𝑖𝑛𝑒
.100
𝐴𝑡𝑡𝑖𝑣𝑖 𝑚𝑎𝑠𝑐ℎ𝑖+𝐹𝑒𝑚𝑚𝑖𝑛𝑒
Alcuni rapporti di composizione noti:
- Tasso di occupazione: rapporto tra occupati e attivi di 15 anni e più ( esclusi
casalinghe, studenti, pensionati ecc
- Tasso di disoccupazione: rapporto tra persone in cerca di lavoro e forza lavoro
- Tasso di scolarità nelle scuole superiori: rapporto tra iscritti e popolazione tra i 14
e i 18 anni

-Rapporto di coesistenza
Il rapporto di coesistenza si determina calcolando il quoziente tra le intensità di due
fenomeni diversi nello stesso luogo o tra le intensità di uno stesso fenomeno in luoghi
diversi.

Esempi:
Indici demografici quali:
𝑚𝑎𝑠𝑐ℎ𝑖
- Rapporto di mascolinità:
𝑓𝑒𝑚𝑚𝑖𝑛𝑒
𝑓𝑒𝑚𝑚𝑖𝑛𝑒
- Rapporto di femminilità:
𝑚𝑎𝑠𝑐ℎ𝑖
𝑎𝑛𝑧𝑖𝑎𝑛𝑖
- Indice di vecchiaia: . L'indice di vecchiaia fornito dal rapporto percentuale
𝑔𝑖𝑜𝑣𝑎𝑛𝑖
tra l'ammontare della popolazione in età 65 anni e oltre diviso quello delle età
giovanili da zero a 14 anni.
- Per studiare il livello di sostegno fornito dalla popolazione in età lavorativa agli
anziani si può utilizzare un indice di dipendenza dato dal rapporto tra l'ammontare
della popolazione di età 65 anni e più diviso quello delle potenziali età attive da 20 a
64 anni (l'indice di dipendenza degli anziani)

-Rapporto di derivazione
Un rapporto di derivazione è ottenuto dividendo l'intensità o la frequenza di un fenomeno per
l'intensità o la frequenza di un altro fenomeno che ne costituisce il necessario e logico
presupposto.

Esempi:
1) Quoziente di natalità che è dato dal rapporto tra i nati e la popolazione in un certo
anno x 1000;
2) Quoziente di fecondità che è dato dal rapporto tra il numero di nati vivi nell'anno e
la popolazione femminile residente di età compresa tra i 15 e i 44 anni;
3) Quoziente di criminalità che dato dal rapporto tra i denunciati per tipo di delitto e la
popolazione residente per 100.000.

-Rapporto di densità
Un rapporto di densità è definito mediante il rapporto tra la dimensione globale di un
fenomeno e una dimensione di spazio di tempo.

Esempi:
- Prodotto interno lordo pro capite che è dato dal rapporto tra il prodotto interno
lordo e la popolazione;
- Densità territoriale della popolazione che è data dal rapporto tra la popolazione
residente e la superficie territoriale in chilometri quadrati;
- Numero medio componenti per famiglia che è dato dal rapporto tra popolazione e
numero di famiglie residenti nello stesso territorio.

-Numero indice
I numeri indice sono particolari rapporti statistici che misurano la variazione di un fenomeno
rilevato in tempi e circostanze diverse. Assumono un valore sempre positivo e non
dipendono dalle unità di misura. Solitamente misurano le variazioni dei prezzi nel tempo e
sul territorio (es. indice di inflazione)

-Numero indice semplice è il rapporto tra due numeri riferiti all'intensità di un fenomeno in
tempi o luoghi diversi I=Xt/Xt-1 Dove la lettera t può riferirsi a tempi o luoghi diversi infatti
vi sono numeri indice temporali e territoriali.

Esempio di indice temporale: la popolazione residente in Italia, ammontava al 1° gennaio


2005 a 58.462 375 unità; diventate poi 58.751.711 al 1° gennaio 2006 e 59.131.287 al 1°
gennaio 2007; il numero indice temporale che misura l'incremento dal 2005 al 2007 è:

I=Xt/Xt-1 I2005,2007=59.131.287-58.462.375 =1,0114 (togliere 1 e moltiplicare per 100)


Ovvero la popolazione residente dal 2005 al 2007 è aumentata del 1,4%

Esempio di indice territoriale: la popolazione residente in Lombardia ed in Campania al


primo gennaio 2007 ammontava rispettivamente a 9.454.441 ed a 5.790.187; il numero
indice territoriale è:

Ic.i =9.454.441/5.790.187= 1,6486 (togliere 1 e moltiplicare per 100). Ci dice che al 1°


gennaio 2007 la popolazione residente in Lombardia superava quella della Campania del
64,86%.
Relazione tra più fenomeni

Una delle finalità più comuni della statistica è la ricerca di relazioni di dipendenza tra
fenomeni, con l'obiettivo di interpretare, prevedere e controllare. Per fare ciò occorre rilevare
e analizzare il contemporaneo presentarsi delle modalità di più variabili per studiarne la
relazione. Quando sulle unità statistiche di una data popolazione si osservano due variabili
(es.altezza/peso) si parla di distribuzione unitaria doppia bivariata dove le modalità dei
due caratteri osservati sono elencate unità per unità. La rilevazione di una variabile doppia
su una data popolazione di N unità, consiste nella collezione delle coppie di osservazioni:
(X1,Y2), (X2,Y2),.…, (Xi,Yi),...., (Xn,Yn) opportunamente misurate sulle unità del collettivo.

Distribuzione unitaria doppia bivariata


Unità Xi Yi

u1 X1 Y1

u2 X2 Y2

... ... ...

Ui Xi Yi

... ... ...

... ... ...

... ... ...

Un Xn Yn

Una variabile doppia può essere:


- qualitativa se entrambe le componenti sono di natura qualitativa es. genere e colore
degli occhi;
- mista se una componente è qualitativa e l'altra quantitativa es. genere e età
- quantitativa entrambe le componenti sono di natura quantitativa es. reddito e
consumo

-Distribuzione doppia di frequenza


Una prima sintesi in forma tabellare della variabile doppia si ottiene attraverso
l'organizzazione di dati in una distribuzione doppia di frequenza o tabella di contingenza.
Supponiamo che la variabile X assuma r modalità distinte e la variabile Y assuma invece s
modalità distinte.
La tabella doppia di frequenza avrà dimensione s x r ovvero righe per colonne
considerando X e Y rispettivamente come variabili di colonna e di riga. Con Nij si indica la
frequenza assoluta congiunta, cioè il numero di unità statistiche che contemporaneamente
assumono la modalità o intensità i della X e la modalità j della Y.

Distribuzione doppia di frequenza


Xi X1 X2 … Xi ... Xr Totale
Yj i-esima

Y1 n11 n21 ... ni1 ... nr1 n.1

Y2 n12 n22 ... ni2 ... nr2 n.2

… ... ... ... ... ... ... ...

Yj n1j n2j ... nij ... nrj n.j

... ... ... ... ... ... ... ...

Ys j-esima n1s n2s ... nis ... nrs n.s

Totale n1. n2. ... ni. ... nr. n .. (N)

Distribuzioni condizionate e marginali

Da una tabella a doppia entrata si desumono le distribuzioni condizionate e le distribuzioni


marginali non condizionate:

a) Le distribuzioni condizionate
Una distribuzione condizionata è una distribuzione semplice ottenuta associando, a doppia
entrata, la riga madre con una qualsiasi delle s righe successive, oppure associando la
colonna madre con una qualsiasi delle r colonne successive. La distribuzione (X/Y=yi) è la
distribuzione condizionata del carattere X con qualsiasi valore yi del carattere Y e si ottiene
dalla seguente tabella.

Xi Freq

X1 n1j

X2 n2j

... ...

Xi nij

... ...

Xn n.j

La distribuzione (Y/X=Xi) è la distribuzione condizionata del carattere Y con qualsiasi Xi del


carattere X e si ottiene dalla seguente tabella
Yi Freq

y1 ni1

y2 ni2

... ...

Yi nij

... ...

Yn ni.

Dalla tabella doppia si desumono:


- s quante sono le righe distribuzioni condizionate del carattere X alle corrispondenti
modalità del carattere Y
- r quante sono le colonne distribuzioni condizionate dal carattere Y alle corrispondenti
modalità del carattere X

b) Le distribuzioni marginali
Una distribuzione marginale cioè non condizionata è una distribuzione semplice ottenuta
associando, in una tabella a doppia entrata, la riga madre con la riga marginale (frequenza
marginale di riga) oppure la colonna madre con la colonna marginale (frequenza marginale
di colonna). La prima distribuzione indica gli elementi della popolazione che possiedono le
modalità X1, X2,..., Xi del carattere X in indipendente da come esse siano associate alle
modalità Y1, Y2,...,Yi del carattere Y.

La prima tabella statistica risultante è la seguente


Xi Frequenza marginale di riga

X1 nj.

X2 n2.

... ...

Xi ni.

... ...

Xn nr.

La seconda distribuzione indica gli elementi della popolazione che possiedono le modalità
Y1,Y2,...,Yi del carattere Y indipendentemente da come se siano associate alle modalità X1,
X2,..., Xi del carattere X.

La seconda tabella statistica risultante è la seguente


Yi Freq marginali di colonna

Y1 n.1

Y2 n.2

... ...

Yi n.j

... ...

Yn n.s

Esempio di distribuzione doppia 1


La seguente tabella riporta la distribuzione degli occupati per settore di attività economica e
per posizione
Settori di attività Posizione professionale Totale

Dipendenti Autonomi

Agricoltura 400 780 1180

Industria 4200 890 5090

Altre attività 4900 2500 7400

Totale 9500 4170 13670

Determinare:
1) Gli occupati nei settori di attività economica a prescindere dalla posizione professionale
(distribuzione marginale non condizionata del carattere occupati per settore di attività
economica)
Settori di attività Occupati

Agricoltura 1180

Industria 5090

Altre attività 7400

Totale 13670

2)Gli occupati per posizione professionale a prescindere dal settore di attività economica
(distribuzione marginale del carattere occupati per posizione professionale).

Posizione professionale Occupati

Dipendenti 9500

Autonomi 4170
Totale 13670

Esempio 2: Un campione di operai di un'industria meccanica è stato classificato secondo il


reddito X annuo (in migliaia di euro) e l'anzianità di servizio Y
Reddito annuo Xi Anzianità di servizio Yj Totale

10-20 20-40

20-30 5 20 25

30-40 15 30 45

40-60 10 40 50

Totale 30 90 120

Calcolare:
1) reddito medio di tutti gli operai
2) anzianità di servizio media di tutti gli operai
3) reddito medio degli operai con anzianità da 10 a 20 anni e lo scarto quadratico medio del
reddito degli operai con anzianità da 10 a 20 anni
4) anzianità di servizio media degli operai con un reddito da 30 a 40 mila euro
5) lo scarto quadratico medio del reddito di tutti gli operai
6) lo scarto quadratico medio della anzianità di servizio di tutti gli operai

1)Reddito medio di tutti gli operai


Reddito Yi Ni

20-30 25

30-40 45

40-60 50

Totale 120

Reddito Yi Valore centrale Ni XiNi (x-Ax)²Ni

20-30 25 25 625 5019,72

30-40 35 45 1575 782,50

40-60 50 50 2500 5864,44

Totale 120 4700 11666,66


(devianza)
4700
1) Ay= =39,17
120
5) lo scarto quadratico medio del reddito di tutti gli operai
11666,66
σy= 120
=9,86

Reddito Annuo Yj Anzianità di servizio Xi Totale

10-20 20-40

20-30 5 20 25

30-40 15 30 45

40-60 10 40 50

Totale 30 90 120

1) L’anzianità di servizio media di tutti gli operai

Anzianità di servizio Xi Ni

10-20 30

20-40 90

Totale 120

Anzianità di Valore centrale Ni XiNi (x-Ax)²Ni


servizio Xi

10-20 15 30 450 3796,88

20-40 30 90 2700 1265,63

Totale 120 3150 5062,51


(devianza che
divisa per 120
da la varianza)

3150
2) Ax =26,25
120
6)Lo scarto quadratico medio dell’anzianità di servizio
5062,51
σx= 120
=6,50

Reddito Annuo Yj Anzianità di servizio Xi Totale

10-20 20-40
20-30 5 20 25

30-40 15 30 45

40-60 10 40 50

Totale 30 90 120
2) Il reddito medio degli operai con anzianità da 10 a 20 anni e scarto q.m del reddito
degli operai con anzianità da 10 a 20 anni

Reddito Yj Ni

20-30 5

30-40 15

40-60 10

Totale 30

Reddito Yj Valore centrale Ni YjNi (yj-Ay)²Ni

20-30 25 5 125 888,44

30-40 35 15 525 166,33

40-60 50 10 500 1361,88

Totale 30 1150 2416,66

1150 2416,66
2) Ay
30
=38,33 σy= 30
=9,98

4) L'anzianità di servizio media degli operai con un reddito da 30 a 40 mila euro

Anzianità di servizio Xi Ni

10-20 15

20-40 30

Totale 45

Anzianità di Valore centrale Ni XiNi (x-Ax)² Ni


servizio Xi

10-20 15 15 225 1500


20-40 30 30 900 750

Totale 45 1125 2250

1125
2) Ax 45
=25
6) Lo scarto quadratico medio dell'anzianità di servizio degli operai con un reddito da 30 a 40
mila euro
2250
σx= 45
=7,07

Dalle distribuzioni condizionate di un carattere quantitativo, oltre alle medie condizionate, è


possibile ottenere anche lo scarto quadratico medio condizionato, che esprimono la
variabilità delle distribuzioni condizionate intorno alle proprie medie condizionate.

Dalle distribuzioni non condizionate di un carattere quantitativo, è possibile ottenere le medie


aritmetiche dei due caratteri (medie marginali)

𝑟
∑ 𝑋𝑖𝑛𝑖
𝑖=1
Ax=
𝑁

𝑠
∑ 𝑌𝑗𝑛𝑗
𝑗=1
Ay=
𝑁

Relazioni tra variabili

Indipendenza
Un collettivo di persone è stato classificato secondo le modalità del carattere grado di
istruzione Xi e colore dei capelli. Verificare se fra i due caratteri esiste indipendenza
assoluta.

Colore dei capelli Grado d’istruzione X


Y

Licenza elementare Licenza media diploma totale

neri 12 15 20 47

castani 24 30 40 94

grigi 36 45 60 141

biondi 48 60 80 188

totale 120 150 200 470


Stabilire se esiste indipendenza assoluta

Dai calcoli di desumono frequenze relative colonna

Colore dei capelli Grado d’istruzione X


Y

Licenza elementare Licenza media diploma totale

neri 12/120=0,1 15/150=0,1 20/200=0,1 47/470=0,1

castani 24/120=0,2 30/150=0,2 40/200=0,2 94/470=0,2

grigi 36/120=0,3 45/150=0,3 60/200=0,3 141/470=0,3

biondi 48/120=0,4 60/150=0,4 80/200=0,4 188/470=0,4

Risulta quindi che se le frequenze relative di colonna sono costanti al valore di X: tra i due
caratteri dunque esiste Indipendenza assoluta cioè le frequenze relative delle distribuzioni
condizionate delle y al variare della x cioè X1, X2,..., Xn non variano, In altre parole le
frequenze relative delle distribuzioni condizionate sono uguali tra loro è uguale alle
frequenze relative delle distribuzioni non condizionate.

Lo studio delle relazioni esistenti tra due variabili statistiche parte dalla definizione del
concetto di indipendenza. Similmente la distribuzione condizionata della X dato Y=yj non
cambia per qualunque J=1,2,....,s

La condizione di indipendenza per la casella generica ijma si scrive:


𝑛1𝑗 𝑛2𝑗 𝑛𝑖𝑗 𝑛.𝑖 𝑛𝑖×𝑛.𝑗
= = = →n*ij= da cui
𝑛1 𝑛2 𝑛𝑗 𝑛.. 𝑛..
𝑛𝑖𝑗 𝑛.𝑖 𝑛𝑖.×𝑛.𝑗
= →n*ij= frequenza teorica
𝑛𝑗. 𝑛.. 𝑛..

Si prende solo la riga centrale


Xi X1 X2 … Xi ... Xr Totale
Yj i-esima

Y1 n11 n21 ... ni1 ... nr1 n.1

Y2 n12 n22 ... ni2 ... nr2 n.2


… ... ... ... ... ... ... ...

Yj n1j n2j ... nij ... nrj n.j

... ... ... ... ... ... ... ...

Ys j-esima n1s n2s ... nis ... nrs n.s

Totale n1. n2. ... ni. ... nr. n .. (N)

Concetto di contingenza

La costruzione di un indice che misura il grado di connessione tra due caratteri statistici X e
y si basa sul concetto di contingenza. Si definisce contingenza cij la differenza tra la
frequenza osservata è la frequenza teorica e se avrebbe nel caso di indipendenza assoluta
di una generica cella ij. Nel caso di indipendenza le contingenze sono tutte nulle mentre
queste cresceranno, in valore assoluto, al crescere del grado di dipendenza tra i caratteri.

Cij= (nij-n*ij) Concetto di contingenza


nij Freq.osservate
n*ij Freq. teoriche

∑Cij=∑(nij-n*ij)=0
𝑖𝑗 𝑖𝑗

Nel caso di indipendenza assoluta la somma delle contingenze è nulla

Indice di connessione di Pearson

Il grado di connessione tra due caratteri statistici si misura attraverso l'indice di associazione
Chi-quadrato proposto da K. Pearson (X²). Esso è ottenuto come somma delle contingenze
quadratiche relative. L'indice assume valori pari a zero in caso di indipendenza (tutte le
contingenze sono nulle) e aumenta al crescere del grado di connessione, assumendo valori
tanto più grandi quanto più le frequenze osservate si differenziano dalle frequenze teoriche.
Solitamente l'indice X² è impiegato per misurare la relazione tra due mutabili. Infatti per
questo tipo di variabili l'unica informazione analizzabile riguarda le frequenze congiunte.

(𝑛𝑖𝑗−𝑛*𝑖𝑗)²
X²=∑ Indice di associazione o connessione di Pearson
𝑛*𝑖𝑗
𝑖𝑗
Ulteriori indici di connessione
Si nota che l'indice Chi-quadrato dipende dalla numerosità del collettivo N. In genere si
preferisce utilizzare indici di associazione normalizzati.

Per non far dipendere il Chi-quadrato da N, sono state proposte numerose varianti tra cui:
-l’indice di contingenza quadratica media ϕ² che calcola la media delle contingenze al
quadrato relative.

𝑥² 1 (𝑛𝑖𝑗−𝑛*𝑖𝑗)²
Esso è ottenuto rapportando il X2 a N ϕ²= =𝑁∑
𝑁 𝑛*𝑖𝑗
𝑖𝑗
-l’indice C di Cramer, che consiste in una versione normalizzata dell’indice di contingenza
media quadratica. Indice di contingenza quadratica media: è un indice relativo normalizzato,
esso sarà pari a 0 nel caso di indipendenza perfetta e pari a 1 nel caso di massima
connessione (dipendenza o interdipendenza perfetta).

Indice di contingenza
ϕ²
C= 0≤C≤1
𝑚𝑖𝑛[(𝑟−1)(𝑠−1)]

Al denominatore c’è il valore più piccolo tra le s righe e le r colonne a cui va sottratto 1.

Esempio
La seguente tabella riporta la distribuzione doppia di un gruppo di 86 studenti di Scienze
Politiche classificati secondo il voto (classi) preso all'esame di statistica (Xi) è il livello di
conoscenza della matematica (Yj) (Freq. Osservate)

Grado di Classi di voto


conoscenza all'esame di
della statistica Xi
matematica Yj

18-22 23-27 28-30 totale

insufficiente 30 15 10 55

sufficiente 2 8 6 16

buono 0 6 4 10

ottimo 0 3 2 5

totale 32 32 22 86

1)Verifico se c’è grado di indipendenza assoluta

Grado di Classi di voto


conoscenza all'esame di
della statistica Xi
matematica Yj

18-22 23-27 28-30 totale

insufficiente 0,93 0,46 0,45 0,64


sufficiente 0,06 0,25 0,27 0,19

buono 0 0,18 0,18 0,12

ottimo 0 0,09 0,09 0,06

2)Calcolo le frequenze teoriche che si avrebbero nel caso di indipendenza assoluta


𝑛𝑖.×𝑛.𝑗
n*ij=
𝑛..

Grado di conoscenza Classi di voto all'esame di


della matematica Yj statistica Xi

18-22 23-27 28-30

insufficiente 20,46 (55x32/86)20,46 14,06

sufficiente 5,95 5,95 4,09

buono 3,72 3,72 2,50

ottimo 1,86 1,86 1,27

3)calcolo delle contingenze (nij-n*ij)

Grado di Classi di voto


conoscenza della all'esame di
matematica Yj statistica Xi

18-22 23-27 28-30

insufficiente 30-20,46=9,54 -5,46 -4,06

sufficiente -3,95 2,05 1,91

buono -3,72 2,28 1,5

ottimo -1,86 1,14 0,73

4)Calcolo del quadrato delle contingenze (nij-n*ij)²

Grado di Classi di voto


conoscenza della all'esame di
matematica Yj statistica Xi
18-22 23-27 28-30

insufficiente 91,01 29,81 16,48

sufficiente 15,60 4,30 3,64

buono 13,83 5,20 2,25

ottimo 3,45 1,30 0,53

(𝑛𝑖𝑗−𝑛*𝑖𝑗)²
5)Calcolo del quadrato delle contingenze rapportate alle frequenze teoriche
𝑛*𝑖𝑗

Grado di Classi di voto


conoscenza della all'esame di
matematica Yj statistica Xi

18-22 23-27 28-30

insufficiente (91,01/20,46)4,45 1,45 1,17

sufficiente 2,62 0,70 0,88

buono 3,71 1,39 0,90

ottimo 1,85 0,69 0,41

X²=4,45+1,45+1,17+2,62+0,70+0,88+3,71+1,39+0,90+1,85+0,69+0,41=20,22 Chi quadrato


di Pearson

𝑥² 20,22
ϕ²= 𝑁
=
86
=0,23 contingenza quadratica media

ϕ² 0,23
C= C= =0,342 l’indice di contingenza di Cramer ci dice che c’è
𝑚𝑖𝑛[(𝑟−1)(𝑠−1)] 2
poca connessione tra i due caratteri quindi il grado di conoscenza della matematica influisce
poco sul voto preso all’esame di statistica.
Rappresentazione analitica di variabili: il concetto di interpolazione

Dopo aver effettuato una numerazione statistica e aver sistemato i dati in tabella emergere
un certo legame tra i valori x & y, questo legame si può da presentare con una funzione
matematica. Inoltre X e Y possono essere:
1) una serie cronologica in tal caso X1, X2,...,Xn sono gli anni e Y1, Y2,...,Yn sono
rappresentate dalle intensità del fenomeno negli anni considerati.
2) una distribuzione doppia con frequenza unitaria in cui si aleix che le Y sono caratteri
statistici.

Si parla di interpolazione statistica (o interpolazione attraverso i punti) quando si intende


rappresentare in maniera sintetica una relazione funzionale tra due variabili. Partendo da
coppia di dati x & y si determina dunque la funzione y=f(x) che descrive il fenomeno.

Xi anni Yi fenomeno

X1 Y1

X2 Y2

... ...

Xi Yi

... ...

Xn Yn
Questa funzione non ha l'obiettivo di passare per tutti i punti ma di rappresentare “al meglio”,
anche se in via sintetica, la relazione esistente tra i due caratteri X e Y.

Obiettivo dell'interpolazione statistica


Gli scopi per cui si cerca una funzione di interpolazione statistica sono:
- descrivere sinteticamente la relazione tra due variabili osservate;
- ricavare eventuali dati intermedi mancanti;
- correggere valori affetti da errori accidentali o perturbati da cause secondarie.

Ruolo delle variabili


Si parla di interpolazione statistica quando è possibile riconoscere un legame di causalità tra
le due variabili statistiche considerate. Più chiaramente, nell'interpolazione si definiscono:
y=f(x)
- variabile esplicativa o indipendente (indicata solitamente con X).
La variabile che, nel nesso logico di causalità, può essere considerata la l'elemento
indipendente
- variabile dipendente (indicata solitamente con Y)
La variabile che gioca invece il ruolo di “conseguente”, cioè di variabile le cui variazioni
dipendono dalla variabile indipendente. Precisiamo che nelle coppie (x,y) i valori di X
indicano i tempi (le date quasi sempre gli anni della serie storica) in cui vengono rilevati i
valori di y. Ecco perché si parla di evoluzione temporale di un fenomeno statistico. Le coppie
mostrano come il fenomeno evolve nel tempo.

Esempio
Gli anni (X) e la produzione di vetture della Fiat (Y)
Gli anni (X) e il tasso di mortalità in Italia (Y)
Gli anni (X) e il tasso di natalità in Italia (Y)
Gli anni (X) e la popolazione residente in Italia (Y)

Interpolazione lineare
Tra le funzioni f(x) che normalmente vengono utilizzate nel interpolazione statistica, quella
lineare gioca un ruolo di primo piano. Con l'interpolazione lineare si intende quindi
descrivere, in maniera sintetica, la relazione esistente tra 2 caratteri statistici attraverso una
retta:
Y*= β0 +β1 X dove β0 rappresenta l'intercetta. Geometricamente è il punto in cui la retta
interseca l'asse delle ordinate e β1 è invece il coefficiente angolare che esprime la
pendenza della retta in termini di variazione della funzione dovuta ad una variabile unitaria
della X.

Criterio dei minimi quadrati

Dato un collettivo di N unità statistiche su cui sono state osservate le variabili X e Y.


L'interpolazione consiste nella determinazione della retta che “meglio interpola in senso
statistico” la nube dei punti osservati. Il criterio adottato per determinare la migliore retta
prende il nome di criterio dei minimi quadrati.

Chiamiamo Dn la deviazione (o errore differenza tra i punti osservati e quelli teorici che sono
sulla retta) fra il valore Yn ed il corrispondente valore della retta/curva (positiva o negativa).

- Una misura della “bontà dell'interpolazione” è la somma D1²+D2²+...+Dn²


- La retta/curva avente la proprietà per cui D1²+D2²+...+Dn² è minima è detta migliore
interpolante o retta/curva dei minimi quadrati.
Data la seguente funzione della retta che passa tra i punti
Y*= β0 +β1 X

Dobbiamo quindi determinare i valori dei parametri per cui


𝑛 𝑛
∑ (Y*t - Yi)²= min ossia ∑ (β0 +β1 Xi - Yi)²=min
𝑖=1 𝑖=1

Da cui, derivando rispetto ai due parametri ed uguagliando a zero:


𝑛
∂𝑆
=2 ∑ (β0 +β1 Xi - Yi) . 1 =0
∂β𝑜
𝑖=1
𝑛
∂𝑆
=2 ∑ (β0 +β1 Xi - Yi) Xi =0
∂β1
𝑖=1

Operativamente i valori dei parametri si ottengono risolvendo il sistema normale

𝑛 𝑛
nβ0 + β1 ∑ Xi = ∑ Yi
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
β0 ∑ Xi + β1 ∑ Xi² = ∑ XiYi
𝑖=1 𝑖=1 𝑖=1

Da cui facendo uso del metodo di Cramer, si ottengono:


|𝑛 𝑛 |
|
β0=| ∑ 𝑌𝑖 ∑ 𝑋𝑖||
|𝑖=1 𝑖=1 |
|𝑛 𝑛 |
| ∑ 𝑋𝑖𝑌𝑖 ∑ 𝑋𝑖²|
| |
|𝑖=1 𝑖=1 |

| 𝑛 |
|𝑛 ∑ 𝑋𝑖|
| |
| 𝑖=1 |
| 𝑛 𝑛 |
| ∑ 𝑋𝑖 ∑ 𝑋𝑖²|
| |
|𝑖=1 𝑖=1 |

𝑛 𝑛 𝑛 𝑛
∑ 𝑌𝑖 ∑ 𝑋𝑖² − ∑ 𝑋𝑖 ∑ 𝑋𝑖𝑌𝑖
𝑖=1 𝑖=1 𝑖=1 𝑖=1
= 𝑛 𝑛
𝑛 ∑ 𝑋𝑖² − ( ∑ 𝑋𝑖)²
𝑖=1 𝑖=1

Esempio di interpolazione
La seguente tabella riporta i dati relativi al fatturato degli ultimi 5 anni (dal 2011 al 2015) di
una nota azienda di giocattoli, il fatturato è espresso in milioni di euro. Per facilitare i calcoli
sostituisco gli anni con le ascisse (di comodo) 1,2,3,4,5

Anno Xi Fatturato Yi

2011 9
2012 11,2

2013 8,9

2014 11,8

2015 14

1)Rappresentare graficamente
2)Trovare i parametri della retta interpolante con il metodo dei minimi quadrati
3)Trovare il valore teorico del fatturato al 2018.

Anno Xi Fatturato Yi Xi² XiYi

1 9 1 9

2 11,2 4 22,4

3 8,9 9 26,7

4 11,8 16 47,2

5 14 25 70

Totale 54,9 55 175,3


𝑛 𝑛
nβ0 + β1 ∑ Xi = ∑ Yi
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
β0 ∑ Xi + β1 ∑ 𝑋𝑖²= ∑ XiYi da cui si deduce il sistema normale
𝑖=1 𝑖=1 𝑖=1

5β0 + 15β1=54,9
15β0+ 55β1= 175,3

Pertanto:
β0=|54, 9 15|
|175, 3 55|

|5 15|
|15 55|

(54,9𝑥55)−(175,3𝑥15) 3019,5−2629,5
= (5𝑥55)−(15𝑥15)
= 275−225
=7,8

β1=|5 54, 9|
|15 175, 3|

|5 15|
|15 55|

(5𝑥175,3)−(15𝑥54,9) 876,5−823,5
= (5𝑥55)−(15𝑥15)
= 275−225
=1,06

Da cui la retta dei minimi quadrati ha equazione:


Y*=7,8+1,06X

3)Trovare il valore teorico del fatturato al 2018


Per trovare il valore teorico del fatturato dell’azienda al 2018 dovrò sostituire nella funzione il
valore dell’ascissa di comodo X=8

Y*=7,8+1,06 x 8 Y*2018=7,8+8,48 Y*2018=16,28

L’ultimo stadio del procedimento di interpolazione consiste nella verifica della riuscita
dell’accostamento ottenuto mediante la funzione rappresentatrice che passa tra i dati
osservati.
Anno Xi Fatturato Yi Xi² XiYi Yi* (Yi*-Yi)²

1 9 1 9 8,86 0,020
2 11,2 4 22,4 9,92 1,638

3 8,9 9 26,7 10,98 4,326

4 11,8 16 47,2 12,04 0,058

5 14 25 70 13,1 0,810

Tot 15 54,9 55 175,3 6,852

Y*=7,8+1,06X
*Per avere il valore teorico si fa ad esempio prendendo il primo numero si sostituisce alla X il
numero 1 che si moltiplica per 1,06 che quindi fa 1,06 che appunti vado a sommare a 7,8 e
viene 8,86

∑(𝑌𝑖*−𝑌𝑖)²
6,852
x100= x100= 35,32% (percentuale dell’errore che vado a
54,9
∑𝑌𝑖

commettere che in questo caso è al limite dell’accettabilità).

La regressione e la correlazione lineare

Il diagramma di dispersione fornisce una descrizione visiva espressa in modo soggettivo,


per quanto precisa, della relazione esistente tra le due variabili della distribuzione doppia
con frequenza unitaria in cui sia le X che le Y sono caratteri statistici. La funzione
matematica detta funzione di regressione della variabile Y sulla variabile X cioè y=f(x) può
esprimere la suddetta relazione in modo oggettivo. Il termine regressione è stato introdotto
da Sir Francis Galton, antropologo inglese, nel 1885. Regressione si riferiva la tendenza dei
figli ad avere altezze più prossime alla media rispetto ai genitori. Attualmente il termine viene
impiegato diffusamente in situazioni in cui non vi è regressione verso la media. Siano X: X1,
X2,... ,Xn e Y: Y1,Y2,...,Yn due variabili statistiche quantitative con frequenze assolute uguali
ad 1 (dati semplici). E’ quindi possibile rappresentare i dati mediante la tabella semplice
seguente:
Xi Yi

X1 Y1

X2 Y2

... ...

Xi Yi

... ..

Xn Yn

Il problema di trovare il tipo di relazione esistente fra le variabili X e Y è il grado di


dipendenza o interdipendenza fra esse. Il problema come detto, può essere affrontato
graficamente oppure facendo ricorso a due tecniche statistiche particolari: la regressione e
la correlazione. L'approccio grafico ha un valore qualitativo Nel senso che non può far
nulla di più che evidenziare l'esistenza di una qualche relazione diretta o inversa.
La regressione (a differenza della correlazione nella regressione ci deve essere un
antecedente logico mentre nella correlazione no) si applica nel caso in cui sia possibile
individuare fra le due variabili quella dipendente e quella indipendente. La tecnica fornisce
come risultato l'espressione matematica della funzione che lega la Y e la X. Nel caso sia
ipotizzabile l'esistenza fra la X e la Y di una relazione lineare si parla di regressione lineare.
Esempi: y=f(x)
- l'età (X variabile indipendente) ed il livello di glicemia nel sangue (Y variabile
indipendente perché funzione della X)
- il reddito di una famiglia (X) ed il livello di consumo della stessa (Y)
- l'età (X) ed il livello di colesterolo nel sangue (Y)
- le precipitazioni in un bacino idrogeologico (X) ed il livello del fiume che lo attraversa
(Y)
- la velocità di percorrenza di un veicolo (X) ed il consumo medio per percorrere un
determinato tragitto (Y)

La correlazione ha lo scopo di studiare il grado di interdipendenza fra le due variabili senza


andare a considerare una variabile come indipendente e l'altra come dipendente. Allo scopo
di studiare la relazione tra le variabili voto all'esame di matematica (esame propedeutico a
quello di statistica) ed il voto all'esame di statistica si rilevano i valori di questi due caratteri
su un campione di 5 studenti della Facoltà di Ingegneria:

voto esame di voto esame di


matematica Xi statistica Yi

20 21

25 24

26 23

30 29

29 28
L'andamento dei punti nel grafico a dispersione (i punti si distribuiscono
approssimativamente come una retta) suggerisce l'esistenza tra le due variabili di una
relazione di tipo lineare.

Sapendo che tra i due caratteri il voto di matematica rappresenta la variabile indipendente X
ed il voto all'esame di statistica quella dipendente y la relazione può essere descritta
mediante la retta di regressione:

𝑌=β0 +βyx X
in cui i coefficienti β0 eβyx (coefficiente di regressione) sono incogniti.

Si deduce che:
- seβyx ≻ 0 fra X ed Y è positiva, ossia al crescere di X cresce anche Y
- seβyx ≺ 0 l’associazione fra X ed Y è negativa, ossia al crescere di X decresce Y
- seβyx = 0 non esiste associazione lineare tra X ed Y.

I parametri β0 +βyx si determinano con il metodo dei minimi quadrati.


𝑛
∑ (β0 +βyx Xi-Yi)² = min
𝑖=1

Da cui, derivando rispetto ai due parametri ed uguagliando a zero si ottiene il sistema


normale

𝑛 𝑛
nβ0 +βxy ∑ Xi = ∑ Yi
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
β0 ∑ Xi +βyx ∑ Xi² = ∑ XiYi
𝑖=1 𝑖=1 𝑖=1
Il sistema si risolve facendo uso del metodo di Cramer: (facendo riferimento all’esercizio
sopra citato)
voto esame di voto esame di Xi² XiYi
matematica Xi statistica Yi

20 21 400 420

25 24 625 600

26 23 676 598

30 29 900 870

29 28 841 812

Totale 130 125 3442 330


𝑛 𝑛
nβ0 +βyx ∑ Xi = ∑ Yi
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
β0 ∑ Xi +βyx ∑ Xi² = ∑ XiYi
𝑖=1 𝑖=1 𝑖=1

5β0 + 130 βyx = 125

130β0 + 3442βyx = 3300

β0= |125 130|


|3300 3442|

|5 130|
|130 3442|

(125𝑥3442)−(3300𝑥130)
= = 4,03
(5𝑥3342)−(130𝑥130)

βyx =|5 125|


|130 3300|

|5 130|
|130 3442|
(5𝑥3300)−(130𝑥125)
= =0,806
(5𝑥3342)−(130𝑥130)
Da cui la retta dei minimi quadrati ha equazione:
Y*=4,04 + 0,808X
Questo sta a significare che all’aumentare del voto di matematica di un punto, il voto di
statistica aumenta mediamente di 0,8 punti.

Proprietà della regressione lineare

- La retta di regressione passa per il baricentro del diagramma a dispersione ovvero


per i punti medi di 𝑋e 𝑌
- Il coefficiente di regressione può essere calcolato dall’espressione seguente dove 𝑋e
𝑌 sono rispettivamente le medie aritmetiche della X e della Y

𝑛
∑ (𝑋𝑖−𝑋)(𝑌𝑖−𝑌)
𝑖=1 𝐶𝑂𝐷 (𝑋𝑌)
βyx= 𝑛 =
𝐷𝐸𝑉 (𝑋)
(COD codevianza)
∑ (𝑋𝑖−𝑋)²
𝑖=1

Nel caso di regressione di X su Y, i coefficienti incogniti si deducono dal sistema normale

𝑋=β'0+ βxy Y

𝑛 𝑛
nβ'0 +βxy ∑ Yi = ∑ Xi
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
β'0 ∑ Yi +βxy ∑ Yi² = ∑ XiYi
𝑖=1 𝑖=1 𝑖=1
Esempio
voto di voto di Xi-𝑋𝑖 Yi-𝑌𝑖 (Xi-𝑋𝑖)(Yi-𝑌𝑖) (Xi-𝑋𝑖)² (Yi-𝑌𝑖)²
matematica statistica
Xi Yi

20 21 -6 -4 24 (non si fa 36 16
0x0 ma si fa
prima -6 x -4 e
poi si fa la
somma tra tutti
i valori che
ottengo in
questo caso
viene 50)

25 24 -1 -1 1 1 1

26 23 0 -2 0 0 4

30 29 4 4 16 16 16

29 28 3 3 9 9 9

Tot 130 125 0 0 50 62 46

130 125
𝑋= 5
=26 𝑌= 5
=25

𝑛
∑ (𝑋𝑖−𝑋)(𝑌𝑖−𝑌)
𝑖=1 50
βyx= 𝑛 =
62
=0,806 y=f(x)
∑ (𝑋𝑖−𝑋)²
𝑖=1
𝑛
∑ (𝑋𝑖−𝑋)(𝑌𝑖−𝑌)
𝑖=1 50
βxy= 𝑛 =
46
=1,087 x=f(y)
∑ (𝑌𝑖−𝑌)²
𝑖=1

Questo sta a significare che all'aumentare del voto di statistica di un punto, il voto di
matematica aumenta mediamente di 1,087 punti.
βyx e βxy siccome il denominatore è sempre positivo perché è al quadrato ed è sempre
positiva anche perché è un indice di variabilità mentre la codevianza non essendo un indice
di variabilità quindi può essere sia positivo che negativo però poiché le due quantità
dipendono dal numeratore possono essere o tutte e due positive o tutte e due
negative non una positiva e l'altra negativa.

Analisi grafica della correlazione

Siano X ed Y due variabili quantitative. Riportando su un sistema di assi cartesiani i valori di


Xi e Yi si ottiene una nuvola di punti. La forma della nuvola, rivela indicazioni circa il legame
tra le due variabili. Al fine di individuare un indice che sintetizzi la dipendenza tra le due
variabili, si considerino gli scarti tra i singoli valori osservati e le rispettive medie di X & Y.

(Xi-𝑋)(Yi-𝑌) i=1….n

Se si sposta l’origine degli assi nel punto medio di 𝑋e di 𝑌si avrà


- Se tra X ed Y esiste una relazione positiva →punti campionari saranno posizionati
𝑛
prevalentemente nel 1° e 3° quadrante e quindi ∑ (Xi-𝑋𝑖)(Yi-𝑌𝑖) >0 COD
𝑖=1
- Se tra X ed Y esiste una relazione negativa→ punti campionari saranno posizionati
𝑛
prevalentemente del 2° e 4° quadrante e quindi ∑ (Xi-𝑋𝑖)(Yi-𝑌𝑖) <0 COD
𝑖=1
- Se tra X ed Y non esiste una relazione prevalente →punti campionari saranno
𝑛
dispersi sui quattro quadranti e quindi ∑ (Xi-𝑋𝑖)(Yi-𝑌𝑖) sarà approssimativamente
𝑖=1
nullo.

Quindi l’indice sintetico


𝑛
Cod (X,Y)= ∑ (Xi-𝑋𝑖)(Yi-𝑌𝑖)
𝑖=1
Denominato codevianza assume valori positivi se prevalgono i prodotti positivi, negativi se
prevalgono i prodotti negativi ed assume valore nullo quando gli scarti tendono a
compensarsi. La codevianza presenta però un difetto: COD(X,Y) dipende dall’unità di misura
dei dati.

Per standardizzare la codevianza si divide per la radice quadrata del prodotto delle devianze
delle variabili X,Y ottenendo il coefficiente di correlazione di Pearson:
𝑛
∑ (𝑋𝑖−𝑋𝑖)(𝑌𝑖−𝑌𝑖)
𝐶𝑂𝐷(𝑋,𝑌)
rxy= Rxy=
𝑖=1

𝐷𝐸𝑉(𝑋)𝑥 𝐷𝐸𝑉(𝑌) 𝑛
∑ (𝑋𝑖−𝑋𝑖)²(𝑌𝑖−𝑌𝑖)²
𝑖=1

Il coefficiente di correlazione lineare varia tra -1 e +1 e ha le seguenti proprietà:


Indica l'interdipendenza, è un valore senza dimensioni e quindi non dipende dalle
unità di misura delle variabili X ed Y;
il suo valore è compreso tra -1 e +1
- se Rxy>0 la correlazione è diretta o positiva
- se Rxy<0 la correlazione è inversa o negativa
- se Rxy=1 la correlazione è perfetta positiva
- se Rxy=-1 la correlazione è perfetta negativa
- se r=0 non esiste correlazione lineare (potrebbe però esserci una relazione curvilinea
quando la funzione interpolante non è lineare).

Esempi
Esempio
Giovani statura X peso Y Xi-𝑋𝑖 Yi-𝑌𝑖 (Xi-𝑋𝑖)(Yi-𝑌𝑖) (Xi-𝑋𝑖)² (Yi-𝑌𝑖)²
(cm) (Kg)

1 161 69 -13,5 -1,2 16,2 182,25 1,44

2 162 58 -12,5 -12,2 152,5 156,25 148,84

3 164 55 -10,5 -15,2 159,6 110,25 231,04

4 165 65 -9,5 -5,2 49,4 90,25 27,04

5 172 73 -2,5 2,8 -7 6,25 7,84

6 179 76 4,5 5,8 26,1 20,25 33,64

7 181 69 6,5 -1,2 -7,8 42,25 1,44

8 184 77 9,5 6,8 64,6 90,25 46,24

9 186 80 11,5 9,8 112,7 132,25 96,04

10 191 80 16,5 9,8 161,7 272,25 96,04

Totale 1745 702 728 1102,5 689,6


1745 702
Risulta 𝑋= =174,5 𝑌= =70,2
10 10
𝑛
∑ (𝑋𝑖−𝑋𝑖)(𝑌𝑖−𝑌𝑖)
𝑖=1 728
Rxy=Rxy= Rxy= =0,83
𝑛 1102,5𝑥689,6
∑ (𝑋𝑖−𝑋𝑖)²(𝑌𝑖−𝑌𝑖)²
𝑖=1
che indica una discreta correlazione lineare diretta tra le due variabili.

Potrebbero piacerti anche