Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
GRAFICHE
Maria Simona Andreano
Maria Simona Andreano “Rappresentazioni grafiche”
Indice
Pag. 2 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 3 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 4 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 5 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 6 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 7 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 8 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Scolarità ni
A 2
O 6
S 8
L 4
Totale 20
Pag. 9 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 10 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 11 di 12
Maria Simona Andreano “Rappresentazioni grafiche”
Pag. 12 di 12
LE DISTRIBUZIONI
DI FREQUENZA
Maria Simona Andreano
Maria Simona Andreano “Le distribuzioni di frequenza”
Indice
Pag. 2 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
1. LE FREQUENZE SEMPLICI
Pag. 3 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
Il simbolo di sommatoria Σ
- indichiamo con Σ l'operazione di somma
Pag. 4 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
In generale
k
a i a1 a2 ... ak
i1
Valgono alcune
proprietà importanti, utili ai fini dello sviluppo
di alcune formule in statistica:
k k
c ai c ai 1.
i1 i1
k k 2
a ai
2
i
2.
i1 i1
Nello specifico, riprendendo le frequenze (assolute) abbiamo la
semplice proprietà:
n i n1 K n k n
i1
Pag. 5 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
2. LA DISTRIBUZIONE DI FREQUENZA
M 5 24 3
F 5 25 2
Tot 10 26 2
ale
27 2
29 1
Tota 10
le
Pag. 6 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
Xi ni
x1 n1
x2 n2
x3 n3
... ...
xk nk
Tota n
le
Con x1, x2, ..., xk si indicano le modalità del carattere X e con n1,
n2, ..., nk le rispettive frequenze.
Pag. 7 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
Reddito frequenze
14.000-20.000 5
20.000-30.000 3
30.000-40.000 2
Totale 10
Pag. 8 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
Xi ni
P 2
M 5
AP 5
MP 3
Tota 15
le
Pag. 9 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
65, 27, 32, 44, 51, 47, 38, 72, 18, 75, 81, 56, 45, 36, 21
Xi ni
0-30 3
30- 8
60
> 60 4
Tota 15
le
Pag. 10 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
Pag. 11 di 12
Maria Simona Andreano “Le distribuzioni di frequenza”
4. ESERCIZI
Pag. 12 di 12
LE DIVERSE TIPOLOGIE
DI FREQUENZA
Maria Simona Andreano
Maria Simona Andreano “Le diverse tipologie di frequenza”
Indice
Pag. 2 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
3, 1, 3, 1, 3, 1, 1, 3, 2, 2, 1, 3, 2, 1, 1, 2, 0, 2, 1,
1, 1, 3, 2, 1, 1, 1, 1, 1, 0, 2, 0, 0, 1, 3, 2, 2, 2, 2,
....
Pag. 3 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
Pag. 4 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
Pag. 5 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
2. LE FREQUENZE CUMULATE
Pag. 6 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
Xi ni fi pi Ni Fi Pi
350 1 100%
Pag. 7 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
Xi ni
0 35
1 51
2 122
3 38
Totale 246
Pag. 8 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
Xi ni Ni pi Pi
0 35 35 14 14
1 51 35 + 51=86 21 14+21=35
3 47 35+...+47=246 19 14+...+19=100
246 100
Pag. 9 di 10
Maria Simona Andreano “Le diverse tipologie di frequenza”
4. ESERCIZI
Pag. 10 di 10
ESERCITAZIONE SULLE
FREQUENZE
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulle frequenze”
Indice
Pag. 2 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Xi ni
Ulivi 210
Vigneti 80
Alberi da frutto 40
Grano 170
Totale 500
Pag. 3 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Xi ni fi pi
Pag. 4 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Pag. 5 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Xi ni
1-5 25
5-10 19
10-20 20
> 20 6
Totale 70
Pag. 6 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Xi ni fi pi
Totale 70 1 100
Xi ni Ni pi Pi
1-5 25 25 35 35
Totale 70 100
Pag. 7 di 8
Maria Simona Andreano “Esercitazione sulle frequenze”
Pag. 8 di 8
CLASSIFICAZIONE DEI
FENOMENI STATISTICI
Maria Simona Andreano
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Indice
Pag. 2 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 3 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Vedremo più avanti che tale modo di elencare i dati unitari, per
elenco, è spesso poco efficiente. Tuttavia andiamo a leggere nel
dettaglio i dati raccolti:
- l’unità individuata con il numero 27 ha sostenuto 2 esami, dove
ha riportato le votazioni di 28 e 25, esprime un grado di
soddisfazione “Ottimo” ed è uno studente “Fuori sede”.
- L’unità individuata con il numero 131 ha sostenuto 1 esame,
dove ha riportato la votazione di 29, esprime un grado di
soddisfazione “ottimo” ed è “Fuori sede”.
- ...
Pag. 4 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 5 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 6 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 7 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Studente Comune
Lucia Anzio
Marco Roma
Luca Roccaraso
Matteo Roma
Pag. 8 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
1a media inf
2a diploma
3a media inf
4a laurea
5a elementare
Pag. 9 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 10 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Studente Voto
Lucia 28
Marco 24
Luca 20
Matteo 26
Pag. 11 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Lucia 56,3
Marco 72,5
Luca 88,7
Matteo 65,4
Pag. 12 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
Pag. 13 di 14
Maria Simona Andreano “Classificazione dei fenomeni statistici”
5. ESERCIZI
1. Lo sport praticato
2. Le ore di sport praticato
3. Il fatturato delle aziende ICT
4. I paesi importatori del made in Italy
5. Le esportazioni di beni made in Italy
6. La dimensione delle aziende agricole
7. Gli stabilimenti posseduti dalle industrie alimentari nella
provincia di Parma
8. Il titolo di studio posseduto dai dipendenti di un ufficio
9. L’anno di corso in cui si è iscritti nella laurea triennale
10. Il sesso degli studenti iscritti al corso di laurea di Economia
Soluzioni
1. qls 2.qtd 3.qtc 4.qls 5.qtc 6.qtc 7.qtd 8.qlo 9.qlo 10.qls
Pag. 14 di 14
L'ISTOGRAMMA
Maria Simona Andreano
Maria Simona Andreano “L'istogramma”
Indice
Pag. 2 di 8
Maria Simona Andreano “L'istogramma”
ai wi1 wi
Le distribuzioni
di caratteri continui possono avere classi con
ampiezza differente. L’ampiezza della classe può essere definita a
priori dalla rilevazione oppure può essere scelta arbiatrariamente dal
ricercatore, in base ai dati raccolti.
Di fatto abbiamo che se un intervallo ha ampiezza maggiore,
sarà più facile contare osservazioni che cadono in quell’intervallo e
quindi osservare una frequenza maggiore di un intervallo meno
ampio.
Ossia le frequenze riportate nella tabella sono condizionate
dalla diversa ampiezza degli intervalli.
Nelle rappresentazioni grafiche abbiamo però l’esigenza di
avere assicurata una proporzionalità tra le aree e le frequenze.
Pertanto nel caso in oggetto sarà necessario effettuare un’operazione
di normalizzazione delle frequenze.
In particolare, per depurare le frequenze dalla diversa
ampiezza delle classi si devono calcolare le densità di frequenza (li)
ni
li
ai
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 3 di 8
Maria Simona Andreano “L'istogramma”
Pag. 4 di 8
Maria Simona Andreano “L'istogramma”
Pag. 5 di 8
Maria Simona Andreano “L'istogramma”
Pag. 6 di 8
Maria Simona Andreano “L'istogramma”
Pag. 7 di 8
Maria Simona Andreano “L'istogramma”
3. ESERCIZI
Xi ni
0 - 10 50
10 - 50 80
50 - 100 200
100-500 180
Pag. 8 di 8
ESERCITAZIONE SULLE
RAPPRESENTAZIONI
GRAFICHE
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
Indice
Pag. 2 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
360 53,53
193
100
La soluzione precedente
si ricava facendo riferimento alle
proporzioni.
Pag. 3 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
: 360 pi :100
360 pi 360 ni
360 f i
100 n
Pag. 4 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
Abbiamo quindi:
AREE ni pi α
Aree artificiali 1273 4,21 15,17
Aree agricole 16174 53,53 192,71
Aree boschive o 12406 41,06 147,82
seminaturali
Altro 361 1,19 4,30
1,19% 4,21%
41,06%
53,53%
Pag. 5 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
2. ESEMPIO ISTOGRAMMA
Classi ni
50-60 10
60-70 12
70-80 18
80-90 46
90-100 50
100-110 24
160
Pag. 6 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
ni
li
ai
Classi ni li = ni/ai
50-60 10 1
60-70 12 1,2
70-80 18 1,8
80-90 46 4,6
90-100 50 5,0
100-110 24 2,4
160
Pag. 7 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
Istogramma di frequenza
6
Altezze o densità di frequenza h
0
50-60 60-70 70-80 80-90 90-100 100-110
Classi
Pag. 8 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
Classi ni
0-1 10
1-6 20
Totale 30
Pag. 9 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
ni n
li i
wi1 wi ai
Pag. 10 di 11
Maria Simona Andreano “Esercitazione sulle rappresentazioni grafiche”
Classi ni wi+1–wi li
0-1 10 1 10
1-6 20 5 4
Totale 30
base altezza = ai li = 1 10 = 10
base altezza = ai li = 5 4 = 20.
Pag. 11 di 11
INTRODUZIONE ALLE
MEDIE
Maria Simona Andreano
Maria Simona Andreano “Introduzione alle Medie”
Indice
Pag. 2 di 11
Maria Simona Andreano “Introduzione alle Medie”
Pag. 3 di 11
Maria Simona Andreano “Introduzione alle Medie”
Pag. 4 di 11
Maria Simona Andreano “Introduzione alle Medie”
2. LE MEDIE DI POSIZIONE
Pag. 5 di 11
Maria Simona Andreano “Introduzione alle Medie”
Pag. 6 di 11
Maria Simona Andreano “Introduzione alle Medie”
3. LA MODA
Definizione:
La moda è la modalità xi di un fenomeno statistico che
presenta frequenza (assoluta, relativa o percentuale) più elevata.
Pag. 7 di 11
Maria Simona Andreano “Introduzione alle Medie”
ni
li
ai
Pag. 8 di 11
Maria Simona Andreano “Introduzione alle Medie”
Può succedere inoltre che ci siano più valori con frequenza più
elevata, allora tutti vengono considerati mode e in questo caso che la
distribuzione è plurimodale.
Pag. 9 di 11
Maria Simona Andreano “Introduzione alle Medie”
Pag. 10 di 11
Maria Simona Andreano “Introduzione alle Medie”
4. ESERCIZI
Xi ni
Roma 210
Milano 315
Torino 97
Palermo 112
Xi ni
0-2 20
2-5 30
5-10 100
10-20 120
Pag. 11 di 11
LA MEDIANA
Maria Simona Andreano
Maria Simona Andreano “La Mediana”
Indice
Pag. 2 di 9
Maria Simona Andreano “La Mediana”
Pag. 3 di 9
Maria Simona Andreano “La Mediana”
Esempio
Livello di studio osservato su 7 individui
LE L D LM L LE L
1. Ordinare i dati:
LE LE LM D L L L
LE LE LM D L L L
Pag. 4 di 9
Maria Simona Andreano “La Mediana”
LE LE LE LM D L L L
Adesso n = 8, pari. Abbiamo quindi due posizioni:
- 1° posizione: n/2 = 8/2 = 4
- 2° posizione (n/2)+1=(8/2)+1=5
Pag. 5 di 9
Maria Simona Andreano “La Mediana”
Xi ni
1 2
2 4
3 8
4 10
5 6
6 5
7 2
Pag. 6 di 9
Maria Simona Andreano “La Mediana”
Xi ni Ni Fi
1 2 2 0.05
2 4 6 0.16
3 8 14 0.38
4 10 24 0.65
5 6 30 0.81
6 5 35 0.95
7 2 37 1.00
Pag. 7 di 9
Maria Simona Andreano “La Mediana”
xi – xi+1
n
N i1
Me x i 2
li
Dove con Ni-1 si indica la frequenza cumulata fino alla classe
esattamente precedente quella della mediana.
Pag. 8 di 9
Maria Simona Andreano “La Mediana”
n
N i1
Me x i 2
li
19 14
15 1
1,6
5 3,125 18,125
Xi ni Ni
0-2 2 2
2-5 4 6
5-10 8 14
10-15 10 24
15-20 6 30
20-30 5 35
30-50 3 38
Pag. 9 di 9
I QUANTILI E I QUARTILI
Maria Simona Andreano
Maria Simona Andreano “I quantili e i quartili”
Indice
1. I QUANTILI ---------------------------------------------------------------------------------------- 3
2. I QUARTILI ---------------------------------------------------------------------------------------- 5
3. ESERCIZI ------------------------------------------------------------------------------------------- 8
Pag. 2 di 8
Maria Simona Andreano “I quantili e i quartili”
1. I QUANTILI
Pag. 3 di 8
Maria Simona Andreano “I quantili e i quartili”
Pag. 4 di 8
Maria Simona Andreano “I quantili e i quartili”
2. I QUARTILI
Pag. 5 di 8
Maria Simona Andreano “I quantili e i quartili”
Pag. 6 di 8
Maria Simona Andreano “I quantili e i quartili”
Pag. 7 di 8
Maria Simona Andreano “I quantili e i quartili”
3. ESERCIZI
x n
1 27
3 35
4 66
7 22
[Soluzioni: 1. c 2. Q3=7]
Pag. 8 di 8
LA MEDIA ARITMETICA
Maria Simona Andreano
Maria Simona Andreano “La media aritmetica”
Indice
Pag. 2 di 11
Maria Simona Andreano “La media aritmetica”
Pag. 3 di 11
Maria Simona Andreano “La media aritmetica”
x i
x i 1
Pag. 4 di 11
Maria Simona Andreano “La media aritmetica”
1a Proprietà:
La media aritmetica è sempre compresa tra la più piccola e la
più grande delle modalità presenti nella distribuzione.
2a Proprietà:
La somma degli scarti tra i valori osservati e la media è
sempre uguale a zero.
Esempio
7 8 10 15 Media = 10
Gli scarti
(7-10) (8-10) (10-10) (15-10)
-3 -2 0 5
Somma di tali scarti: -3 -2 + 0 + 5 = 0!!
Pag. 5 di 11
Maria Simona Andreano “La media aritmetica”
3a Proprietà:
Se tutte le osservazioni vengono aumentate di uno stesso
valore a, anche la media risulterà aumentata di a.
4a Proprietà:
Se tutte le osservazioni vengono moltiplicate per uno
stesso valore b, anche la media risulterà moltiplicata per b.
Pag. 6 di 11
Maria Simona Andreano “La media aritmetica”
Esempio:
5
x F 32 x
9 C
Pag. 7 di 11
Maria Simona Andreano “La media aritmetica”
Xi ni Ni Ci Ci · ni
170├─175 12 12 172,5 172,5 x 12 = 2.070,0
175├─180 28 40 177,5 177,5 x 28 = 4.970,0
180├─185 45 85 182,5 182,5 x 45 = 8.212,5
185├─190 20 105 187,5 187,5 x 20 = 3.750,0
190├─195 11 116 192,5 192,5 x 11 = 2.117,5
195├─200 4 120 197,5 197,5 x 2 = 790,0
120 21.910, 0
Pag. 8 di 11
Maria Simona Andreano “La media aritmetica”
4. CONSIDERAZIONI FINALI
Pag. 9 di 11
Maria Simona Andreano “La media aritmetica”
x i i
x i1
k
i
i1
5a Proprietà:
Se il carattere X è stato osservato su s gruppi con
numerosità ňi e in ogni gruppo è stata calcolata la rispettiva media
xi i 1,...,s
allora la media
complessiva può essere determinata a partire
dalle medie dei gruppi:
x n( i i
x i1
n
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 10 di 11
Maria Simona Andreano “La media aritmetica”
Pag. 11 di 11
ESERCITAZIONE SULLE
MEDIE
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulle medie”
Indice
Pag. 2 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Pag. 3 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Peso in kg ni wi+1–wi
[30,50) 20 20
[50,55) 15 5
[55,60) 18 5
[60,65) 22 5
[65,70) 18 5
[70,75) 7 5
[75,80) 4 5
[80,100) 2 20
Totale 106
Pag. 4 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Peso in kg ni ai li = ni/ai
[30,50) 20 20 1,0
[50,55) 15 5 3,0
[55,60) 18 5 3,6
[60,65) 22 5 4,4
[65,70) 18 5 3,6
[70,75) 7 5 1,4
[75,80) 4 5 0,8
[80,100) 2 20 0,1
Totale 106
Pag. 5 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Peso in kg ni ai li = ni/ai
[30,50) 20 20 1,0
[50,55) 15 5 3,0
[55,60) 18 5 3,6
[60,65) 22 5 4,4
[65,70) 18 5 3,6
[70,75) 7 5 1,4
[75,80) 4 5 0,8
[80,100) 2 20 0,1
Totale 106
Pag. 6 di 12
Maria Simona Andreano “Esercitazione sulle medie”
N°
ni Ni
visitatori
231 2 2
245 3 5
249 4 9
258 3 12
260 4 16
261 3 19
267 5 24
272 3 27
284 2 29
290 3 32
Totale 32
Pag. 7 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Caso 2: n è pari
n/2
(n/2)+1
Pag. 8 di 12
Maria Simona Andreano “Esercitazione sulle medie”
N° visitatori ni Ni
231 2 2
245 3 5
249 4 9
258 3 12
260 4 16
261 3 19
267 5 24
272 3 27
284 2 29
290 1 30
Totale 32
Pag. 9 di 12
Maria Simona Andreano “Esercitazione sulle medie”
Caso 2: n è pari
32/2 = 16
(32/2)+1 = 17
M = 260
1
M = 261
2
Pag. 10 di 12
Maria Simona Andreano “Esercitazione sulle medie”
N° visitatori ni
231 2
245 3
249 4
258 3
260 4
261 3
267 5
272 3
284 2
290 3
Totale 32
x ni i
x i1
n
Pag. 11 di 12
Maria Simona Andreano “Esercitazione sulle medie”
267 5
267 x 5 = 1.335
Totale 32 8.379
E quindi:
x n i i
8.379
x i1
261.8
n 32
Pag. 12 di 12
INTRODUZIONE ALLA
VARIABILITÀ
Maria Simona Andreano
Maria Simona Andreano “Introduzione alla variabilità”
Indice
Pag. 2 di 10
Maria Simona Andreano “Introduzione alla variabilità”
a) 40 50 60 Media = 50
b) 50 50 50 Media = 50
c) 0 0 150 Media = 50
Pag. 3 di 10
Maria Simona Andreano “Introduzione alla variabilità”
Pag. 4 di 10
Maria Simona Andreano “Introduzione alla variabilità”
r x max xmin
Negli esempi precedenti abbiamo:
a) r = 60 – 40 = 20
b) r = 50 – 50 = 0
c) r = 150 – 0 = 150
DQ Q3 Q1
In questo caso si escludono dalla variabilità il 25% dei valori
più piccoli e il 25% dei valori più elevati, e si calcola la differenza tra
Q3 e Q1.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 5 di 10
Maria Simona Andreano “Introduzione alla variabilità”
Esempio:
Temperature rilevate nella settimana di Natale a Cervinia
-2 -1 -5 -8 -6 -12 -1
Pag. 6 di 10
Maria Simona Andreano “Introduzione alla variabilità”
xi ni xi ni
1 5 1 15
2 10 2 20
3 20 3 15
4 30 4 0
5 20 5 15
6 10 6 20
7 5 7 15
tot 100 100
Pag. 7 di 10
Maria Simona Andreano “Introduzione alla variabilità”
xi ni Ni ci∙ni
0 42 42 0
1 81 123 81
2 45 168 90
3 21 189 63
4 8 197 32
5 3 200 15
200 281
Calcoliamo il rango:
r xmax xmin 5 0 5
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 8 di 10
Maria Simona Andreano “Introduzione alla variabilità”
Pag. 9 di 10
Maria Simona Andreano “Introduzione alla variabilità”
DQ Q3 Q1
2 1 1
Pag. 10 di 10
LA VARIANZA E LO
SCARTO QUADRATICO
MEDIO
Maria Simona Andreano
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
Indice
Pag. 2 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
si (xi x ) i 1,...,n
Pag. 3 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
s (x
i i x ) 0 oppure (x i x ) ni 0
Pag. 4 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
Xi ni Xi * ni si si ni
1 2 2 -2,83 -5,66
2 4 8 -1,83 -7,31
3 8 24 -0,83 -6,63
4 10 40 0,17 1,71
5 6 30 1,17 7,03
6 5 30 2,17 10,86
134
x 3,83
35
Tuttavia, per avere una misura di quanto un’osservazione si
discosta dalla media, non è necessario considerare il segno.
Supponiamo infatti di avere una media pari a 8, e due valori
osservati: 7 e 9. Allora sia il valore 7 che il valore 9 si discosta di 1
unità dalla media.
Quindi potremmo considerare, piuttosto che gli scarti, il valore
assoluto degli scarti:
xi x
Pag. 5 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
Pag. 6 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
2. LO SQM E LA VARIANZA
(x i x ) 2
(x i x ) 2 (x i x ) 2 ni
2 2
n n
Pag. 7 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
xi ni xi ni si s2i s2i ni
x i ni 248 (x i x ) 2 ni 277,6
x 24,8 2 27,76
n 10 n 10
(x i x ) 2 (x i x ) 2 ni
n n
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 8 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
(x i x ) 2
n 27,76 5,27
Pag. 9 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
1a Proprietà:
Se il carattere è costante la varianza è nulla.
2a Proprietà:
La varianza non è mai negativa.
3a Proprietà:
La varianza può essere espressa in forma semplificata
nel seguente modo:
(x i x ) 2 ni 1
2 x i2 ni x 2
n n
La formula della varianza (e dello sqm) varia a seconda che i
dati siano riferiti ad una popolazione o ad una indagine campionaria.
Nel caso di dati campionari la formula usata sarà:
(x i x ) 2 ni
s
2
n 1
Pag. 10 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
Pag. 11 di 12
Maria Simona Andreano “La varianza e lo scarto quadratico medio”
Pag. 12 di 12
APPROFONDIMENTI
SULLA VARIABILITÀ
Maria Simona Andreano
Maria Simona Andreano “Approfondimenti sulla variabilità”
Indice
Pag. 2 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
1. LA VARIABILITÀ RELATIVA
Esempio
1a distribuzione dei prezzi di 50cc
2,2 2,5 3 2,8 1,9 2,7
2a distribuzione dei prezzi di auto 2000cv
35 28 38 31 40
x = 2,5 = 0,37
In base agli scostamenti quadratici medi saremmo indotti a
sostenere che la seconda distribuzione presenta una maggiore
variabilità, poichè questa ha un σ maggiore.
Pag. 3 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
CV = 100
x
0,37 4,41
CV1 = 100 =14,8 CV2 = 100 =12,8
2,52 34,4
Pag. 4 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
2. LA STANDARDIZZAZIONE
X−x 1 x
Z= = X−
- circa il 68% delle osservazioni si trova entro uno sqm della media
- circa il 95% delle osservazioni si trova entro 2 sqm della media
- circa il 99% delle osservazioni si trova entro 3 sqm della media
Pag. 5 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
Pag. 6 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
3. IL BOX-PLOT
Pag. 7 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
Pag. 8 di 9
Maria Simona Andreano “Approfondimenti sulla variabilità”
Pag. 9 di 9
ESERCITAZIONE SULLA
VARIABILITÀ
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulla variabilità”
Indice
Pag. 2 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
xi ni
1 34
2 28
3 21
4 8
5 1
6 1
93
(x i x ) 2 ni
2
n
Innanzi tutto calcoliamo la media:
196
x 2,11
93
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 3 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
xi ni xi * ni (xi - X)
1 34 34 1 – 2,11 = -1,11
2 28 56 2 – 2,11 = -0,11
3 21 63 3 – 2,11 = 0,89
4 8 32 4 – 2,11 = 1,89
5 1 5 5 – 2,11 = 2,89
6 1 6 6 – 2,11 = 3,89
93 196
93 196 110,92
Pag. 4 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
(x i x ) 2 ni 110,92
2
1,19 1,19 1,09
n 93
Possiamo allora affermare che mediamente le nostre
osservazioni si discostano dalla media aritmetica di 1.09 unità.
(x i x ) 2 ni
s2
n 1
(x i x ) 2 ni 110,92
s
2
1,21 s 1,21 1,1
n 1 92
r xmax xmin 6 1 5
Pag. 5 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
12,4 125,8
11,4 117,3
15,1 121,9
9,8 131,4
10,3 111,9
16,9 127,1
x 12,65
39,34
2 6,56
6
6,56 2,56
2,56
CV 100 20,24
12,65
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 6 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
xi si si2
39,34
x 122,57
250,99
2 41,83
6
41,83 6,47
6,47
CV 100 5,28
122,57
Pag. 7 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
xi si si2
250,99
CV 20,24 5,28
SQMA>SQMP
Pag. 8 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
Pag. 9 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
3. ESERCIZIO 3 BOX-PLOT
Pag. 10 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
Maschi Femmine
Min 72 80
Q1 90 95
Me 97 100
Q3 103 107
Max 110 110
Pag. 11 di 12
Maria Simona Andreano “Esercitazione sulla variabilità”
Pag. 12 di 12
LA TABELLA DOPPIA
Maria Simona Andreano
Maria Simona Andreano “La tabella doppia”
Indice
Pag. 2 di 10
Maria Simona Andreano “La tabella doppia”
ANALISI BIVARIATA
Pag. 3 di 10
Maria Simona Andreano “La tabella doppia”
Pag. 4 di 10
Maria Simona Andreano “La tabella doppia”
Frequenza
assoluta
congiunta
75/300 = 0,25
65/300 = 0,21
Pag. 5 di 10
Maria Simona Andreano “La tabella doppia”
65/300 = 0,21
Carattere Y
Y1 Y2 … Yj … Yk Totale
X1 n11 n12 … n1j … n1k n1.
Carattere X
Pag. 6 di 10
Maria Simona Andreano “La tabella doppia”
2. LA DISTRIBUZIONE MARGINALE
Pag. 7 di 10
Maria Simona Andreano “La tabella doppia”
Pag. 8 di 10
Maria Simona Andreano “La tabella doppia”
3. LA DISTRIBUZIONE CONDIZIONATA
Pag. 9 di 10
Maria Simona Andreano “La tabella doppia”
Pag. 10 di 10
ESERCITAZIONE SULLA
TABELLA DOPPIA
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulla tabella doppia”
Indice
Pag. 2 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
Pag. 3 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
n ij
f ij
n
Y B M A
X
Pag. 4 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
X n f
S 4 0,27
B 6 0,40
O 5 0,33
15 1
Y n f
B 4 0,27
M 7 0,47
A 4 0,26
15 1
Pag. 5 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
B M A
Y
X=S 1 3 0 4
B M A
Y
Pag. 6 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
B M A
Y
X=B 1 3 2 6
B M A
Y
X=O 2 1 2 4
B M A
Y
B M A
Y
Pag. 7 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
X|Y=B n f
S 1 0,25
B 1 0,25
O 2 0,50
4 1
X|Y=M n X|Y=A n
S 3 S 0
B 3 B 2
O 1 O 2
7 4
Pag. 8 di 9
Maria Simona Andreano “Esercitazione sulla tabella doppia”
X!Y=M n X!Y=A n
S 0,43 S 0,0
B 0,43 B 0,5
O 0,14 O 0,5
1 1
Pag. 9 di 9
LA CONNESSIONE E
L'INDIPENDENZA
INTRODUZIONE ALLA CONNESSIONE
Analizzare le relazioni tra i caratteri, per
comprendere se queste sono legate tra loro.
Le osservazioni della coppia (Xi,Yi) sono raccolte in
una tabella doppia.
I caratteri possono essere entrambi qualitativi non
ordinabili.
La determinazione delle distribuzioni marginali e
condizionate mettono in evidenza se esiste una
connessione tra le variabili osservate.
INTRODUZIONE ALLA CONNESSIONE
Supponiamo di aver osservato la seguente
distribuzione doppia:
Carattere Y
Y1 Y2 Totale
Carattere X
X1 10 20 30
X2 20 40 60
X3 30 60 90
n1 j n2 j nij nkj n. j
... ... j
n1. n2. ni. nk. n..
X3 0 60 60
Totale 20 80 100
DIPENDENZA PERFETTA
Affinchè ci sia dipendenza perfetta di X da Y e di Y
da X è necessario che la tabella sia quadrata, ossia
X e Y devono avere lo stesso numero di modalità.
Y1 Y2 Y3 tot
X1 20 0 0 20
X2 0 10 0 10
X3 0 0 30 30
tot 20 10 30 60
Maria Simona Andreano – L’indice del chi quadrato
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
1 di 8
Maria Simona Andreano – L’indice del chi quadrato
Indice
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
2 di 8
Maria Simona Andreano – L’indice del chi quadrato
Chi quadrato
Nel caso in cui i due caratteri siano indipendenti, vale la seguente condizione tra le frequenze
doppie e marginali:
Pertanto con n* si indicano, date le marginali, le frequenze che si dovrebbero osservare, nel
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
3 di 8
Maria Simona Andreano – L’indice del chi quadrato
ni. n. j
n*ij = , i =1,2,...,k j =1,2,...,h
n..
invece soltanto le frequenze marginali. A partire da tali marginali applichiamo la formula delle
n1. n.1 4 4
n *11 = = = 1,07
n 15
Analogamente per le altre frequenze, nel caso di indipendenza avremmo dovuto osservare:
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
4 di 8
Maria Simona Andreano – L’indice del chi quadrato
n1. n.2 4 7
n *12 = = = 1,87
n 15
n n.3 4 4
n *13 = 1. = = 1,07
n 15
n n.1 6 4
n * 21 = 2. = = 1,60
n 15
...
n n.3 5 4
n * 33 = 3. = = 1,33
n 15
realmente osservate. Se le frequenze osservate non sono TUTTE identiche a quelle calcolate con la
Quanto più le frequenze osservate nij si discostano da quelle teoriche di indipendenza, tanto
Sembra logico basare un indice che misuri la dipendenza tra i due caratteri X e Y sulla
differenza tra le frequenze osservate e quelle che si sarebbero dovute osservare nel caso di
indipendenza.
c ij = (n ij − n *ij )
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
5 di 8
Maria Simona Andreano – L’indice del chi quadrato
(n )
2
h k − n *ij
=
ij
2
i=1 j =1
n *ij
indipendenza:
2 = 0 n ij = n *ij i, j
2 0 n ij n *ij per almeno un i o j
Quanto più le frequenze osservate nij si discostano da quelle teoriche di indipendenza, tanto
più elevato sarà il valore di χ2.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
6 di 8
Maria Simona Andreano – L’indice del chi quadrato
L’indice appena introdotto può assumere un valore massimo qualsiasi, a seconda dei dati a
disposizione. Questo rende complicato la sua interpretazione. Ossia, se χ 2 > 0 non riusciamo a dire
Ai fini di una corretta interpretazione della dipendenza è utile avere un indice che vari tra
2 2
V =
n min[( h −1);(k −1)] n min[( h −1);(k −1)]
L'indice V è chiamato indice di Cramer.
Tale indice può variare tra zero ed uno, e sarà pari a zero nel caso di indipendenza, mentre
Riassumendo, quindi, abbiamo che le Tabelle doppie di frequenze sono utili per analizzare
dipendenza/interdipendenza tra due caratteri con il chi2. Da questo, per superare il difetto di non
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
7 di 8
Maria Simona Andreano – L’indice del chi quadrato
essere un indice “relativo”, possiamo passare all’indice V di Cramer, che invece è un indice relativo
Esercizi
Y1 Y2 Y3 totale
X1 2 5 15 22
X2 4 14 10 28
X3 7 6 12 25
Totale 13 25 37 75
Interpretare i risultati
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da
copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per
gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633).
8 di 8
ESERCITAZIONE SUL CHI
QUADRATO
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sul chi quadrato”
Indice
Pag. 2 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
n
2
h k n *ij
ij
2
i1 j 1 n *ij
2 2
V
1);(k 1)]
n min[(h n min[(h 1);(k 1)]
Pag. 3 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
ni. n. j
n* ij , i 1,2,...,k j 1,2,...,h
n..
c ij (nij n*ij )
Pag. 4 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
Pag. 5 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
χ
2
H K n ij
n' ij
2
87,21
i 1 j1 n' ij
Pag. 6 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
χ2 87,21
V 0,436 0,66
χ 2 max 200
Pag. 7 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
X ci ni ci * ni
18-22 20 25 20 x 25 = 500
100 2497,5
x ni i
2497,5
x i1
24,97
n 100
X ci ni ci * ni
18-22 20 20 20 x 20 = 400
26 563
Pag. 8 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
x ni i
563
x1 i1
21,65
n 24
18-22 20 3 20 x 3 = 60
36 892,5
x n i i
892,5
x2 i1
24,79
n 36
X ci ni ci * ni
18-22 20 2 20 x 2 = 40
38 1042
Pag. 9 di 10
Maria Simona Andreano “Esercitazione sul chi quadrato”
x ni i
1042
x3 i1
27,42
n 38
Pag. 10 di 10
CONCORDANZA E
DISCORDANZA
Maria Simona Andreano
Maria Simona Andreano “Concordanza e discordanza”
Indice
1. GRAFICI DI DISPERSIONE--------------------------------------------------------------------- 3
2. LA COVARIANZA --------------------------------------------------------------------------------- 5
3. CALCOLO DELLA COVARIANZA CON LA FORMULA SEMPLIFICATA ------- 9
Pag. 2 di 11
Maria Simona Andreano “Concordanza e discordanza”
1. GRAFICI DI DISPERSIONE
i-ma unità 1 2 … n
Xi X1 X2 … Xn
Yi Y1 Y2 … Yn
Pag. 3 di 11
Maria Simona Andreano “Concordanza e discordanza”
Pag. 4 di 11
Maria Simona Andreano “Concordanza e discordanza”
2. LA COVARIANZA
Pag. 5 di 11
Maria Simona Andreano “Concordanza e discordanza”
DEFINIZIONE 1:
Dati due caratteri quantitativi X e Y, si ha concordanza tra di
essi, se a valori più piccoli di X corrispondono valori più piccoli di Y e
a valori più grandi di X corrispondono valori più grandi di Y.
DEFINIZIONE 2:
Dati due caratteri quantitativi X e Y, si ha discordanza tra di
essi, se a valori più piccoli di X corrispondono valori più grandi di Y e
a valori più grandi di X corrispondono valori più piccoli di Y.
Per comprendere se si è in presenza di concordanza,
discordanza o assenza di legame, è utile riportare sul grafico il
baricentro, corrispondente al punto di coordinate con le medie:
Pag. 6 di 11
Maria Simona Andreano “Concordanza e discordanza”
1 n
Cov( X , Y ) ( xi x )( yi y)
n i 1
Pag. 7 di 11
Maria Simona Andreano “Concordanza e discordanza”
Pag. 8 di 11
Maria Simona Andreano “Concordanza e discordanza”
Xi Yi
2 12
4 15
5 11
1 8
10 17
3 10
7 20
1 n
Cov( X , Y ) xi yi x y
n i 1
Pag. 9 di 11
Maria Simona Andreano “Concordanza e discordanza”
Xi Yi Xi Yi
2 12 24
4 15 60
5 11 55
1 8 8
10 17 170
3 10 30
7 20 140
x 32 y 93 x y 467
x 4,57 y 13,29
1
Cov(X,Y) 467 4,57 13,29 66,71 60,74 5,97
7
Pag. 10 di 11
Maria Simona Andreano “Concordanza e discordanza”
Pag. 11 di 11
LA CORRELAZIONE
Maria Simona Andreano
Maria Simona Andreano “La correlazione”
Indice
Pag. 2 di 7
Maria Simona Andreano “La correlazione”
1. IL COEFFICIENTE DI CORRELAZIONE
x y xy x y
Da tale disuguaglianza, dividendo tutti i membri per σxσy si
ottiene il coefficiente di correlazione ρ:
xy
1 1
x y
Pag. 3 di 7
Maria Simona Andreano “La correlazione”
Pag. 4 di 7
Maria Simona Andreano “La correlazione”
Pag. 5 di 7
Maria Simona Andreano “La correlazione”
Correlazione spuria
Il coefficiente di correlazione lineare sintetizza con un valore
unico il grado del legame lineare tra le variabili X e Y.
Pag. 6 di 7
Maria Simona Andreano “La correlazione”
Pag. 7 di 7
ESERCITAZIONE SULLA
CORRELAZIONE
Maria Simona Andreano
Maria Simona Andreano “Esercitazione sulla correlazione”
Indice
1. ESERCIZIO 1 SU CORRELAZIONE----------------------------------------------------- 3
2. ESERCIZIO 2 SU CORRELAZIONE----------------------------------------------------- 6
Pag. 2 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
1. ESERCIZIO 1 SU CORRELAZIONE
X Fertilizzante Y Grano
(Kg) (qt)
12 7
10 6
8 4
9 4
5 3
2 2
x, y, x y, x , y 2 2
Pag. 3 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
X
Fertilizzante Y
(Kg) X2 Grano (qt) Y2 XY
12 144 7 49 84
10 100 6 36 60
8 64 4 16 32
9 81 4 16 36
5 25 3 9 15
2 4 2 4 4
1
231 7,67 4,33
6 0.941
1 1
418 7,67 2
130 4,332
6 6
Pag. 4 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
8
7
Produzione grano
6
5
4
3
2
1
0
0 2 4 6 8 10 12 14
Fertilizzante
Pag. 5 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
2. ESERCIZIO 2 SU CORRELAZIONE
X Y
5 3
10 1
0 6
9 2
1 8
25 20
1
n
x y x y
xy
x y 1 1
n
x2 x2
n
y2 y2
Pag. 6 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
X X2 Y Y2 XY
5 25 3 9 15
10 100 1 1 10
0 0 6 36 0
9 81 2 4 18
1 1 8 64 8
25 207 20 114 51
1
51 5 4 10,2 20
5
1 1 16,4 6,8
207 5 2
114 4 2
5 5
9,8
0.92
4,05 2,61
- Il coefficiente di correlazione è negativo, pertanto i due
caratteri sono discordanti: all’aumentare di X, Y
diminuisce; al diminuire di X, Y aumenta.
- Il legame è inverso.
Pag. 7 di 8
Maria Simona Andreano “Esercitazione sulla correlazione”
Pag. 8 di 8
LA RETTA DI
REGRESSIONE
Maria Simona Andreano
Maria Simona Andreano “La retta di regressione”
Indice
Pag. 2 di 10
Maria Simona Andreano “La retta di regressione”
Y f X
Pag. 3 di 10
Maria Simona Andreano “La retta di regressione”
Y 0 1X
Pag. 4 di 10
Maria Simona Andreano “La retta di regressione”
140
Consumo pro-capite del gas
120
100
80
60
40
20
0
20 30 40 50 60 70 80 90 100 110
Pag. 5 di 10
Maria Simona Andreano “La retta di regressione”
160
140
120
100
80
60
40
20
0
0 20 40 60 80 100 120
Pag. 6 di 10
Maria Simona Andreano “La retta di regressione”
2. I MINIMI QUADRATI
Pag. 7 di 10
Maria Simona Andreano “La retta di regressione”
n
min Yi Yi* Yi* 0 1 X i
2
0 , 1
i 1
1
n
xi yi x y
xy
ˆ n i1
2
1
1
n
x
n i1
x i2 x 2
ˆ ˆx
y
0 1
Pertanto
il coefficiente 1 è dato dal rapporto tra la covarianza
e la varianza della variabile indipendente. Mentre l’intercetta viene
specificata dopo aver individuato il coefficiente di regressione 1.
Y * ˆ0 ˆ1 X
Pag. 8 di 10
Maria Simona Andreano “La retta di regressione”
Esempio
Y = 0,5 + 0,65*X
Se X aumenta di 1, Y aumenta di 0,65
Se X diminuisce di 1, Y diminuisce di 0,65
Esempio
Y = 0,5 + 0,65*X
Pag. 9 di 10
Maria Simona Andreano “La retta di regressione”
Esempio
Y = 0,5 + 0,65*X
Y*=0,5 + 0,65*(2,450) = 1,593
Pag. 10 di 10
LA BONTÀ DI
ADATTAMENTO
Maria Simona Andreano
Maria Simona Andreano “La bontà di adattamento”
Indice
Pag. 2 di 11
Maria Simona Andreano “La bontà di adattamento”
Yi Yˆi ei
Pag. 3 di 11
Maria Simona Andreano “La bontà di adattamento”
Dove:
1
Yi y
2
Var(Y ) y2
n
1
Var(e) e2 ei 0
2
n
1
Var(Yˆ ) y2ˆ Yˆi y
2
Pag. 4 di 11
Maria Simona Andreano “La bontà di adattamento”
Pag. 5 di 11
Maria Simona Andreano “La bontà di adattamento”
2. IL COEFFICIENTE DI DETERMINAZIONE
ossia:
y2ˆ e2
R2 1
y2 y2
E’ facile dimostrare matematicamente che: 0 R2 1.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 6 di 11
Maria Simona Andreano “La bontà di adattamento”
Pag. 7 di 11
Maria Simona Andreano “La bontà di adattamento”
3. INTERPRETAZIONE E CALCOLO DI R2
xi yi
1 5
2 7,5
3 12
4 15,5
ˆ0 1,
ˆ1 3,6
Yˆ 1 3,6X
Pag. 8 di 11
Maria Simona Andreano “La bontà di adattamento”
4
1
yˆ y 40 /4 10
4 i1 i
1 4 1 4
y y i yˆ y i 10 16,375
2 2 2
n i1 4 i1
4
1
y i y * i 0,175
2
e2
n i1
e2 0,175
R2 1 2 1 1 0,011 0,989
y 16,375
xy2
R 2 2
2 2
x y
Pag. 9 di 11
Maria Simona Andreano “La bontà di adattamento”
Var(Yˆ ) yˆ
2
R
2
Var(Y ) y2
Var(e) e2
R 12
1 2
Var(Y) y
Pag. 10 di 11
Maria Simona Andreano “La bontà di adattamento”
4. ESERCIZI
[R2=0.49, r = 0,70]
[14%]
Pag. 11 di 11
ESERCITAZIONE SULLA RETTA DI
REGRESSIONE
STIMA DELLA RETTA
Su n= 20 famiglie sono stati osservati il
consumo pro-capite di gas (Y) e il prezzo pagato
per il gas (X):
Prezzo
(X) 30 31 37 42 43 45 50 54 54 57 58 58 60 73 88 89 92 97 100 102
Consumo
pro-
capite (Y) 134 112 136 109 105 87 56 43 77 35 65 56 58 55 49 39 36 46 40 42
140
Consumo pro-capite del gas
120
100
80
60
40
20
0
20 30 40 50 60 70 80 90 100 110
1
N
1
N
(x i x )(y i y )
xi yi x y
ˆ n i1
xy
2
n i1
1 1
N
1
N
n i1
(x i x ) 2 x
n i1
x 2
i x 2
ˆ y
ˆx
0 1
STIMA DELLA RETTA
Ai fini dei calcoli consideriamo soltanto 7 famiglie:
Consumo
Prezzo
(X)
pro-capite (x i x ) (x i x ) 2 (y i y ) (x i y )(yi x )
(Y)
30 134 -9,7 94,4 28,4 -276,2
31
112 -8,7
75,9 6,4 -56,0
37 136 -2,7 7,4 30,4 -82,6
42 109 2,3 5,2 3,4 7,8
43 105 3,3 10,8 -0,6 -1,9
45 87 5,3 27,9 -18,6 -98,2
50 56 10,3 105,8 -49,6 -509,9
327,4 -1016,9
STIMA DELLA RETTA
n
n 1
1
x x i 278 /7 39,7 y y i 739/7 105,6
n i1 n i1
n
1
n
(x i x )(y i y ) 145,3
ˆ i1
1 n 3,1
1 46,8
(x
n i1 i
x ) 2
ˆ y
ˆ x 105,6 (3,1) 39,7 228,7
0 1
STIMA DELLA RETTA
La retta di regressione sarà quindi:
Yˆ 228,7 3,1X
160
140
120
consumo pro capite
100
80
60
40
20
0
20 25 30 35 40 45 50 55
prezzo gas
STIMA DELLA RETTA
Possiamo impostare i calcoli considerando le
formule semplificate:
Consumo
Prezzo
pro-capite X2 XY
(X)
(Y)
30 134 900,0 4020,0
31 112 961,0 3472,0
37 136 1369,0 5032,0
42 109 1764,0 4578,0
43 105 1849,0 4515,0
45 87 2025,0 3915,0
50 56 2500,0 2800,0
STIMA DELLA RETTA
Inseriamo i dati ricavati nella precedente tabella
nelle formule semplificate:
n
1
X iYi x y 28332 39,7 105,6
ˆ n i1
7 3,1
1
1 n
11368
X x
n i1 i
2 2
7
39,7 2
Yˆ 228,7 3,1X
STIMA DELLA RETTA
BONTÀ DI ADATTAMENTO
Dobbiamo quindi aggiungere alla tabella il calcolo
degli errori al quadrato e Y2:
Consu
Pre mo
zzo pro- Y^ Y2 Y-Y^ e2
(X) capite
(Y)
30 134 135,7 17956 -1,7 2,9
31 112 132,6 12544 -20,6 424,4
37 136 114 18496 22 484
42 109 98,5 11881 10,5 110,3
43 105 95,4 11025 9,6 92,1
45 87 89,2 7569 -2,2 4,8
50 56 73,7 3136 -17,7 313,3
BONTÀ DI ADATTAMENTO
Sommando l'ultima colonna, otteniamo:
1 1 1
ei 1431,9 204,6 y 82607 105,62 649,6
2
e
2 2
7 7 7
204,6
R 1
2
0,69
649,6
Indice
1. I RESIDUI -------------------------------------------------------------------------------------------- 3
2. EFFETTO DEGLI OUTLIER -------------------------------------------------------------------- 7
3. INTERPRETAZIONE INDICI ------------------------------------------------------------------- 9
Pag. 2 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
1. I RESIDUI
Yi Yˆi ei
Pag. 3 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 4 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 5 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 6 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 7 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 8 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
3. INTERPRETAZIONE INDICI
0 ˆ1 0
Y * ̂ 0
Pag. 9 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Interpretazione
La Y è costante al variare di X
La X è costante al variare di Y
non è possibile spiegare una variabile rispetto all’altra.
non esiste un legame (lineare) tra le due variabili.
Pag. 10 di 11
Maria Simona Andreano “Approfondimenti sulla retta di regressione”
Pag. 11 di 11