Corso C
Anno accademico 2020/21
Tutors:
I To be defined
Nozioni preliminari
Nozioni preliminari
Introduzione
Caratteri (o variabili) statistici
Distribuzioni di frequenza
Rappresentazioni grafiche
Medie e variabilità
Le medie
Medie analitiche
Medie di posizione
Variabilità
Definizione di variabilità
Variabilità rispetto ad un valore medio
Variabilità rispetto alle osservazioni
Associazione tra due variabili
Interpolazione lineare
Schema del corso
Statistica – corso C 2013 - 2014
STATISTICA
I Parte Concetti generali II Parte
Seconda parte
Distribuzioni di Relazioni tra 2 del corso
frequenza Medie Variabilità variabili
5
Parte I
Nozioni preliminari
Perché è utile conoscere la statistica
55
Esempi: Tasso di occupazione femminile (Eurostat)
Esempi: Costo dell’energia al consumatore
Esempi: Produzione energia solare
Concetti generali
ni fi
LC 16 0.069
LS 68 0.292
LA 36 0.155
ITC 82 0.352
ITA 22 0.094
IP 7 0.030
A 2 0.009
- 233 1.000
Distribuzione di una variabile statistica
Frequenza assoluta cumulata
La frequenza assoluta cumulata di una modalità è pari alla som-
ma della frequenza assoluta della modalità considerata con le
frequenze assolute delle modalità precedenti
j
X
Nj = ni = n1 + n2 + . . . + nj
i=1
j
X j
X
Fj = fi = f1 + f2 + . . . + fj Pj = pi = p1 + p2 + . . . + pj
i=1 i=1
Distribuzione di una variabile statistica
Titolo di Studio ni fi pi Nj Fj Pj
Lic. Elementare - Nessuno 9238 0.18 18 9238+0=9238 0.18 18
Lic. Media 16 804 0.32 32 16804+9238=26042 0.32+0.18=0.50 32+18=50
Diploma 18 656 0.36 36 18656+26042=44698 0.36+0.50=0.86 36+50=86
Laurea e Post-laurea 7355 0.14 14 7355 + 44698 = 52053 0.14+0.86=1 14+86=100
Totale 52 053 1 100 – – –
I La frequenza assoluta/relativa/percentuale cumulata della modalità i-esima esprime il numero/frazione/percentuale di unità del
collettivo che hanno un valore al valore della i-esima modalità
I Es. dai valori N3 , F3 , P3 deduciamo rispettivamente che 45720, una frazione di 0.88 di, l’88% degli individui hanno un titolo di
studio di Diploma o inferiore
I Dall’a↵ermazione precedente si deduce anche che 52171-45720, una frazione di 1-0.88 di, il 100-88% degli individui hanno un
titolo di studio migliore del Diploma
Suddivisioni in classi di una variabile quantitativa
Voto ni
18 17
19 9
20 6
21 11
22 13
23 7
24 11
25 4
26 6
27 7
28 6
29 2
30 15
Tot 114
Suddivisioni in classi di una variabile quantitativa
Esempio
Voto ni Ni fi Fi
[18 22) 43 43 0.377 0.377
[22 26) 35 78 0.307 0.684
[26 30] 36 114 0.316 1.000
Serie storiche
Curiosità : nel 1891 il Censimento non fu fatto a causa di difficoltà finanziarie. Il 1941 si commenta da solo...
Micro-dati e dati raggruppati
I dati relativi ad una o più variabili possono trovarsi nelle seguenti forme
I Micro-dati o distribuzione semplice (tutte le variabili, nessuna
perdita di informazione)
I Distribuzione di frequenza (variabili qualitative e quantitative
discrete, nessuna perdita di informazione)
I Distribuzione di frequenza per classi (variabili quantitative continue
e discrete, perdita di informazione)
Nota: la maggior parte dei dati sono rilasciati sotto forma di distribuzioni
di frequenza, è molto raro trovare disponibilità di micro-dati, tuttavia un
cambiamento in questa direzione è in atto
Rappresentazioni grafiche
I Una variabile statistica sia essa in forma “grezza” sia essa in forma di
distribuzione di frequenza può essere rappresentata anche in forma
grafica
I La rappresentazione grafica ha una grande efficacia comunicativa
I Consente una visualizzazione immediata della struttura della
distribuzione
I Agevola il confronto tra più distribuzioni
I Consente di mettere in evidenza i dati anomali (o outlaiers)
I E’ migliore per scopo divulgativi
Elementi di una rappresentazione grafica
120
80
count
40
0
Maschio Femmina
Genere
Esempi di rappresentazioni grafiche: grafico a barre
50
40
30 Genere
count
Maschio
20 Femmina
10
0
LC LS LA ITC ITA IP A
Diploma
Esempi di rappresentazioni grafiche: grafico a torta
Da evitare (usare il grafico a barre)
Diploma
0
LC
200
1 LS
50 LA
ITC
ITA
150
IP
100
A
count
Esempi di rappresentazioni grafiche: grafico a torta
2012 Se No
2013
Ag Di
Gi Fe
Mag Mar
Ap
Figura: Totale precipitazioni (mm) per il comune di Pisa, anno 2012 e 2013.
Fonte: www.meteopisa.it
Esempi di rappres. grafiche: istogramma (basi uguali)
40
30
Frequenza
20
10
0
150 160 170 180 190 200
Altezza.in.cm
0.03
Densita di frequenza
0.02
0.01
0.00
140 160 180 200
Altezza.in.cm
100
Peso.in.kg
80
60
100
Peso.in.kg
80 Genere
Maschio
Femmina
60
48 51 54 57
Popolazione Residente in Italia (Milioni)
33 36 39 42
27
22
Anno
Figura: Serie storica della popolazione italiana rilevata nei censimenti. Fonte:
ISTAT.
Esempi di rappresentazioni grafiche: cartogramma
Figura:
Rappresentazione del
PIL procapite nominale
per regioni in euro,
anno 2016.
Fonte:Eurostat
Istogramma
I Sia
i = lim. sup. classei lim. inf. classei
l’ampiezza della classe i
I Sia
hi = f i / i
Se per disegnare un istogramma come altezze si usassero le frequenze relative, fi (o assolute ni ), otterremmo una figura errata, ovvero
una figura che non rappresenta correttamente la distribuzione della variabile
0.189
0.185
0.18
0.167
0.15
0.129
Frequenza relativa
Usando, invece, le densità di frequenza come altezze (hi ) si ottiene una corretta rappresentazione della distribuzione
0.038
0.036
0.033
0.03
Densita di frequenza (relativa)
0.006
0.005
Le medie e la variabilità
Le medie
x1 + x2 + . . . + xN = µ + µ + . . . + µ = N · µ
I Segue che
Pk
x1 n1 + x2 n2 + . . . + xk nk xi ni
µ= = Pi=1
k
n1 + n2 + . . . + nk i=1 ni
La media aritmetica per distribuzioni di frequenza
Pk
I Posto che per definizione i=1 ni = N segue che
k
1 X
µ= xi ni
N
i=1
Altezza ni ci
(135, 160] 30 147.5
(160, 165] 35 162.5
(165, 170] 44 167.5
(170, 175] 39 172.5
(175, 180] 42 177.5
(180, 210] 43 195.0
La media aritmetica per distribuzioni di frequenza per classi
N
1 X
µ= xi = (158 + 158 + 165 + 175 + ...)/233 = 172.52
N
i=1
La media aritmetica ponderata
I Segue che
Pk
x1 w1 + x2 w2 + . . . + xk wk xi wi
µ= = Pi=1
k
w1 + w2 + . . . + wk i=1 wi
min(x) µ max(x)
Somma delle osservazioni uguale a N volte µ
PN
Dimostrazione: i=1 xi = Nµ
I Partendo dalla definizione di media aritmetica la dimostrazione è
immediata
N N
1 X X
µ= xi ! Nµ = xi
N
i=1 i=1
Somma degli scarti dalla media uguale a 0
PN
Dimostrazione: i=1 (xi µ) = 0
PN
I Utilizzando la proprietà per cui i=1 xi = Nµ la dimostrazione è
immediata
N
X N
X N
X N
X
(xi µ) = xi µ= xi Nµ = 0
i=1 i=1 i=1 i=1
PN
Nota: i=1 µ = µ + µ + . . . + µ = Nµ
Minimo della somma degli scarti al quadrato
PN
Dimostrazione: min 2R i=1 (xi )2 ! = µ
I Si ha la funzione in (non in x, le x sono costanti numeriche):
N
X
f( )= (xi )2 = (x1 )2 + . . . + (xN )2
i=1
N
X
f 0( ) = 2(x1 ) + . . . + ( )2(xN )= 2 (xi )
i=1
I Porre f 0 ( ) = 0
N
X
2 (xi )=0
i=1
N
X
(xi )=0
i=1
N
X N
X
xi =0
i=1 i=1
N
X
xi N =0
i=1
N
1 X
= xi = µ = 0
N i=1
Minimo della somma degli scarti al quadrato
f 00 ( ) = 2N N 1 per definizione
Dimostrazione:
PNh
I Sia µh = N1 i=1 xi , allora
h
H H Nh
! H Nh N
1 X 1 X 1 X 1 XX 1 X
µh Nh = xi Nh = xi = xi = µ
N N Nh N N
h=1 h=1 i=1 h=1 i=1 i=1
P H P Nh
Infatti la scrittura h=1 i=1 xi significa sommare le xi in tutto il
gruppo per tutti gli H gruppi, ovvero sommare le xi per tutto il
collettivo
Traslatività e omogeneità
Dimostrazione: y = a + bx ! µy = a + bµx
I Si consideri per ogni osservazione xi la trasformazione yi = a + bxi ,
con a e b costanti note
I Sia µx la media aritmetica relativa alla variabile x e sia µy quella
relativa alla variabile trasformata y . Per definizione risulta:
N N N N
1 X 1 X 1 X 1 X
µy = yi = (a + bxi ) = a+ bxi
N N N N
i=1 i=1 i=1 i=1
N
X
1 1
= Na + b xi = a + bµx
N N
i=1
La media quadratica
r
(462 + 472 + 472 + 472 + 482 + 482 )
= = 47.17
6
Osservazione: è sempre vero che µ Q
La media quadratica ponderata
x1 · x2 · . . . · xN = G · G · . . . · G = G N
p
6
= 46 ⇥ 47 ⇥ 47 ⇥ 47 ⇥ 48 ⇥ 48 = 47.16
Osservazione: è sempre vero che G µ
La media geometrica ponderata
M = C (1 + imedio )10
min(x) G µ Q max(x)
dove vale il segno di eguale solo nel caso in cui i dati siano tutti
eguali fra loro
I Le medie analitiche (ponderate) presentate possono essere
sintetizzate con una formula generale
Pk ! 1r
r
r i=1 xi wi
µ = Pk
i=1 wi
ni fi
LC 16 0.069
LS 68 0.292
LA 36 0.155
ITC 82 0.352
ITA 22 0.094
IP 7 0.030
A 2 0.009
I La frequenza maggiore è n4 = 82
I Quindi la moda della variabile “Diploma” è ITC
La moda
Titolo di Studio ni
Lic. Elementare - Nessuno 9238
Lic. Media 16 804
Diploma 18 656
Laurea e Post-laurea 7355
Totale 52 053
I La distribuzione risulta già ordinata, per cui ni ⌘ n(i)
I L’unica frequenza che soddisfa le condizioni n(i) > n(i 1) e
n(i) > n(i+1) è n(3) , infatti n(3) > n(2) e n(3) > n(4)
I Dunque la modalità 3 corrisponde alla moda, Mo = Diploma
La moda
Tabella: Età per gli ultra ottantenni presi tra i 201 individui più ricchi al
mondo, anno 2016 (Forbes)
Età 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 99
ni 3 5 2 3 2 3 4 5 1 2 2 2 1 1 1 1
2-b. N pari:
x( N ) + x( N +1)
2 2
Me =
2
La mediana
Freq. cum.
B’
Fm
B
0.5
A
Fm-1 H H’
Xm-1 Me Xm X
Riepilogo: ✓ ◆
0.5 Fm 1
Me = xm 1+ m
Fm Fm 1
Altezza ni Ni fi Fi
(135, 160] 30 30 0.1287554 0.1287554
(160, 165] 35 65 0.1502146 0.2789700
(165, 170] 44 109 0.1888412 0.4678112
(170, 175] 39 148 0.1673820 0.6351931
(175, 180] 42 190 0.1802575 0.8154506
(180, 210] 43 233 0.1845494 1.0000000
La mediana per distribuzioni di frequenza per classi
3. La mediana dell’altezza è
✓ ◆
0.5 Fm 1
Me = xm 1 + m
Fm Fm 1
✓ ◆
0.5 0.468
= 170 + ⇥ (175 170) = 170.962
0.635 0.468
I Il valore trovato è una approssimazione della vera mediana, che può
essere determinata solo conoscendo tutti i valori che formano la
distribuzione oggetto di studio
I Utilizzando i valori della distribuzione la vera mediana è
Me = x(117) = 173
I Per distribuzioni di frequenza non per classi il calcolo della mediana
è esatto
Proprietà della mediana
I min(x) Me max(x)
P
I min 2R N i=1 |xi | ! = Me
I Esiste sempre per variabili quantitative e qualitative ordinali
I quantili
Definizione
Il quantile Qq è quel valore della variabile x che suddivide la distribuzione
in due parti, lasciando a sinistra una frazione q delle osservazioni e a
destra il restante 1 q, con q 2 [0, 1]
Il quantile estende il concetto di mediana ad un qualunque punto della
distribuzione.
Cosı̀ come la mediana (Me) è quel valore che divide in due parti uguali la
distribuzione, il quantile (Qq ) è quel valore che la divide la distribuzione
in due parti di proporzioni q e 1 q
I quantili
Utilizzando alcuni quantili la sintesi della distribuzione risulta molto più precisa rispetto all’utilizzo
di un unico valore centrale
I Quartili:
1. Primo quartile Q0.25 : è quel valore che lascia a sinistra il 25% dei casi e a destra il
75% dei casi
2. Secondo quartile Q0.50 : è quel valore che lascia sia a sinistra sia a destra il 50% dei
casi, quindi Q0.50 = Me
3. Terzo quartile Q0.75 : è quel valore che lascia a sinistra il 75% dei casi e a destra il
25% dei casi
I Decili:
1. Primo decile Q0.10 : è quel valore che lascia a sinistra il 10% dei casi e a destra il 90%
dei casi
2. Secondo decile Q0.20 : è quel valore che lascia a sinistra il 20% dei casi e a destra
l’80% dei casi
.
.
.
5. Quinto decile Q0.50 : è quel valore che lascia sia a sinistra sia a destra il 50% dei casi,
quindi Q0.50 = Me
.
.
.
9. Nono decile Q0.90 : è quel valore che lascia a sinistra il 90% dei casi e a destra il 10%
dei casi
I quantili
I Dati: x1 = 18 x2 = 29 x3 = 21 x4 = 22 x5 = 22 x6 =
27 x7 = 18 x8 = 27 x9 = 18 x10 = 18
I quantili
Altezza ni Ni fi Fi
(135, 160] 30 30 0.1287554 0.1287554
(160, 165] 35 65 0.1502146 0.2789700
(165, 170] 44 109 0.1888412 0.4678112
(170, 175] 39 148 0.1673820 0.6351931
(175, 180] 42 190 0.1802575 0.8154506
(180, 210] 43 233 0.1845494 1.0000000
I quantili per distribuzioni di frequenza per classi
Definizione
La variabilità è l’attitudine delle variabili ad assumere di↵erenti modalità
La variabilità
I µA = 25; MeA = 25
I µB = 25; MeB = 25
Definizione
La deviazione standard di N valori di una variabile X con media
aritmetica µ è
v
u N
u1 X
=t (xi µ)2 per distribuzioni semplici
N
i=1
v
u N
u1 X
=t (xi µ)2 ni per distribuzioni di frequenza
N
i=1
2
Dimostrazione per cui se x1 = x2 = . . . = xN = k allora = 0 e =0
P
I Posto x1 = . . . = xN = k risulta µ = N1 N 1
i=1 k = N Nk = k
P P
I 2 = N1 N i=1 (xi
N
µ)2 = N1 i=1 (k k)2 = 0
p
I Essendo 2 = 0 ) = 0 = 0
Deviazione standard, varianza e devianza
N
2 1 X
= (xi µ)2
N
i=1
1
= [(61 69.375)2 + (75 69.375)2 + (100 69.375)2
8
(68 69.375)2 + (55 69.375)2 + (65 69.375)2
(58 69.375)2 + (73 69.375)2 = 176.2344 kg2
p
= 176.2344 = 13.28 kg
La deviazione standard per distribuzioni di frequenza
Altezza ni fi ci
(135, 160] 30 0.1287554 147.5
(160, 165] 35 0.1502146 162.5
(165, 170] 44 0.1888412 167.5
(170, 175] 39 0.1673820 172.5
(175, 180] 42 0.1802575 177.5
(180, 210] 43 0.1845494 195.0
La deviazione standard per distribuzioni di frequenza per
classi
N N
2 1 X 1 X 2
= (xi µ)2 = (xi + µ2 2µxi )
N N
i=1 i=1
N N N
1 X 2 1 X 2 1 X
= xi + µ 2µ xi
N N N
i=1 i=1 i=1
1 ⇣1 X
N ⌘
= Q2 + Nµ2 2µ xi = Q 2 + µ2 2µµ
N N
i=1
= Q 2 + µ2 2µ2 = Q 2 µ 2
La deviazione standard: considerazioni
I µx = 7630.4 µy = 3042
I x = 1107.65 y = 498.51 ! x > y
I CVx = 1107.65
7630.4
= 0.145 CVy = 498.51
3042
= 0.164
I Essendo CVx < CVy i tempi dal 1945 al 1949 sono meno variabili rispetto
ai tempi dal 2004 al 2008 (la x è meno variabile della y )
I Se avessimo erroneamente considerato la deviazione standard per
confrontare le due distribuzioni, avremmo dedotto che i tempi dal 1945 al
1949 sono più variabili rispetto ai tempi dal 2004 al 2008 (la x più
variabile della y , ERRORE)
Statistiche chiave per descrivere una distribuzione statistica
I 8i2
/ Sk vale
I xi µ + k ! xi µ k ! (xi µ)2 k 2 2
I xi µ k ! xi µ k ! (xi µ)2 k 2 2
I Risulta N 2
N Ng (µ k xi µ + k ) k 2 2
Teorema di Chebyshev: dimostrazione
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
Distribuzioni doppie di frequenza: frequenze congiunte
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
X Y y1 y2 ... yj ... yh
x1 n11 n12 ... n1j ... n1h n1.
x2 n21 n22 ... n2j ... n2h n2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi ni1 ni2 ... nij ... nih ni.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk nk1 nk2 ... nkj ... nkh nk.
n.1 n.2 ... n.j ... n.h N
Diploma Femmine
x
LC 7
LS 19
LA 30
ITC 42
ITA 6
IP 3
A 2
Tot 109
Distribuzioni doppie di frequenza
Genere ITC
x
Maschio 40
Femmina 42
Tot 82
Distribuzioni doppie di frequenza
X Y y1 y2 ... yj ... yh
x1 f11 f12 ... f1j ... f1h f1.
x2 f21 f22 ... f2j ... f2h f2.
.. .. .. .. .. .. .. ..
. . . . . . . .
xi fi1 fi2 ... fij ... fih fi.
.. .. .. .. .. .. .. ..
. . . . . . . .
xk fk1 fk2 ... fkj ... fkh fk.
f.1 f.2 ... f.j ... f.h 1
I fij = nij
N
I Le frequenze relative congiunte rappresentano la frazione della
popolazione che presenta modalità xi e yj , i = 1, . . . , k e j = 1, . . . , h
Distribuzioni doppie di frequenza: frequenze relative
Frequenze relative di colonna:
X Y y1 y2 ... yj ... yh
x1 f11c f12c ... f1jc ... f1hc
f1.c
x2 f21c f22c ... f2jc ... f2hc
f2.c
.. .. .. .. .. .. .. ..
. . . . . . . .
xi fi1c fi2c ... fijc ... fihc fi.c
.. .. .. .. .. .. .. ..
. . . . . . . .
c c
xk fk1 fk2 ... fkjc ... fkhc fk.c
1 1 ... 1 ... 1 1
I fijc = nij
n.j
; fi.c = ni.
N
X Y y1 y2 ... yj ... yh
x1 f11r f12r ... f1jr ... f1hr
1
x2 f21r f22r ... f2jr ... f2hr
1
.. .. .. .. .. .. .. ..
. . . . . . . .
xi fi1r fi2r ... fijr ... fihr 1
.. .. .. .. .. .. .. ..
. . . . . . . .
r r
xk fk1 fk2 ... fkjr ... fkhr 1
f.1r f.2r ... f.jr ... f.hr 1
I fijr = nij
ni.
; f.jr =
n.j
N
I Con le frequenze relative di riga si possono confrontare a parità di
numerosità (1) le distribuzioni condizionate della Y per ogni modalità
della X (x1 , . . . , xk )
Distribuzioni doppie di frequenza: freq relative congiunte
Distribuzione doppia di frequenze relative congiunte per diploma e genere degli studenti del corso C
I Es. f42 = 0.18 significa che lo 0.18 o (18%) del collettivo è femmina e ha diploma ITC
I Es. f.1 = 0.532 significa che lo 0.532 o (53.2%) del collettivo è maschio
I Es. f2. = 0.292 significa che lo 0.292 o (29.2%) del collettivo ha un diploma di LS
Distribuzioni doppie di frequenza: freq relative di colonna
Distribuzione doppia di frequenza relative di colonna per diploma e genere degli studenti del corso C
I Es. f42 = 0.385 significa che lo 0.385 o (38.5%) delle femmine ha un diploma ITC
I Es. f.1 = 1 (aiuta a capire che le frequenze relative si riferiscono alla distribuzione della
variabile diploma per genere = maschi o femmine)
I Es. f2. = 0.292 significa che lo 0.292 o (29.2%) del collettivo ha un diploma di LS
Distribuzioni doppie di frequenza: freq relative di riga
Distribuzione doppia di frequenza relative di riga per diploma e genere degli studenti del corso C
I Es. f42 = 0.512 significa che lo 0.512 o (51.2%) dei diplomati ITC è femmina
I Es. f.1 = 0.532 significa che lo 0.532 o (53.2%) del collettivo è maschio
I Es. f2. = 1 (aiuta a capire che le frequenze relative si riferiscono alla distribuzione della
variabile genere per le singole modalità di diploma)
Analisi dell’associazione tra due variabili qualitative
Y
X y1 y2 y3 Totale
x1 43 0 0 43
x2 0 0 15 15
x3 0 0 20 20
x4 0 52 0 52
Totale 43 52 35 130
Y
X y1 y2 y3 Totale
x1 43 0 0 43
x2 0 0 15 15
x3 0 52 0 52
Totale 43 52 15 110
Y
X y1 y2 y3 Totale
x1 2 2 6 10
x2 4 4 12 20
x3 6 6 18 30
x4 8 8 24 40
Totale 20 20 60 100
Y
X y1 y2 y3 Totale
x1 0.2 0.2 0.6 1
x2 0.2 0.2 0.6 1
x3 0.2 0.2 0.6 1
x4 0.2 0.2 0.6 1
Totale 0.2 0.2 0.6 1
I Le distribuzioni relative della variabile Y sono uguali per ciascuna modalità della
variabile X e sono uguali anche alla distribuzione marginale di Y
I In questo caso, la conoscenza su una unità della modalità assunta dalla Y non
fornisce nessuna conoscenza sulla modalità assunta per la variabile X
I In altre parole questo significa che la squadra di calcio favorita (Y ) non di↵erisce
in base alla zona di residenza (X )
I Allora, poiché abbiamo mostrato che per i caratteri X e Y le distribuzioni
condizionate di riga, e quindi anche le distribuzioni condizionate di colonna, sono
uguali tra loro, possiamo a↵ermare che i due caratteri sono indipendenti
Frequenze congiunte teoriche in caso di indipendenza
Y
X y1 y2 y3 Totale
x1 2 2 6 10
x2 4 4 12 20
x3 6 6 18 30
x4 8 8 24 40
Totale 20 20 60 100
I n11 = 2 ⇤ =
n11 n1. ·n.1
= 10·20
=2
N 100
I n12 = 2 ⇤ =
n12 n1. ·n.2
= 10·20
=2
N 100
I ...
I n21 = 4 ⇤ =
n21 n2. ·n.1
= 20·20
=4
N 100
I ...
I n43 = 24 ⇤ =
n43 n4. ·n.3
= 40·60
= 24
N 100
I Essendo vero che nij = nij⇤ , i = 1, . . . , 4 e j = 1, . . . , 3 allora X e Y sono
indipendenti
Frequenze congiunte teoriche in caso di indipendenza
I Le frequenza congiunte teoriche nij⇤ hanno gli stessi totali di riga e di
colonna delle frequenze congiunte osservate nij :
k
X k
X
nij⇤ = nij = n.j
i=1 i=1
h
X h
X
nij⇤ = nij = ni.
j=1 j=1
I Dimostrazioni:
k
X k
X k
X k
ni. · n.j n.j n.j X n.j
nij⇤ = = ni. = ni. = · N = n.j
N N N N
i=1 i=1 i=1 i=1
h
X h
X h
X h
ni. · n.j ni. ni. X ni.
nij⇤ = = n.j = n.j = · N = ni.
N N N N
j=1 j=1 j=1 j=1
Analisi dell’associazione tra due caratteri
I Ricapitolando, abbiamo visto come si presentano le frequenze
congiunte della tabella a doppia entrata nel caso di:
I Dipendenza statistica perfetta (o interdipendenza perfetta)
I Indipendenza statistica
I Spesso le frequenze congiunte corrispondono a situazioni intermedie
rispetto a queste due condizioni estreme
I Con un indice che si basa sulle di↵erenze tra le frequenze congiunte
osservate (nij ) e le corrispondenti frequenze teoriche sotto l’ipotesi di
indipendenza (nij⇤ ) è possibile misurare il grado di dipendenza tra le
variabili X e Y
I Ovvero, si identifica se le frequenze sono più vicine alla situazione di
dipendenza perfetta o di indipendenza
I Il grado di associazione (connessione) tra le due variabili sarà tanto
maggiore quanto più le frequenze osservate saranno diverse dalle
frequenze teoriche (cioè quanto più la situazione osservata si
discosta da quella di indipendenza)
Analisi dell’associazione tra due caratteri
Y
X y1 y2 y3 Totale
x1 2 2 6 10
x2 4 4 12 20
x3 6 6 18 30
x4 8 8 24 40
Totale 20 20 60 100
I Indice 2:
2
k X
X h (n
ij nij⇤ )2 (2 2)2 (2 2)2 (6 6)2 (4 4)2
= = + + + +
i=1 j=1
nij⇤ 2 2 6 4
(24 24)2
+ ... + =0 cvd
24
Nota: In questo caso X ha k = 4 modalità , Y ha h = 3 modalità , quindi le
frequenze congiunte (e i termini della sommatoria del 2 ) sono 4 ⇥ 3 = 12
2
L’indice di Pearson: esempio di dipendenza perfetta
I Verificare che 2 = 2max nel caso di dipendenza perfetta (si usa i dati fittizi di
un esempio precedente in cui si è già verificata la perfetta dipendenza):
I Frequenze osservate nij :
Y
X y1 y2 y3 Totale
x1 43 0 0 43
x2 0 0 15 15
x3 0 0 20 20
x4 0 52 0 52
Totale 43 52 35 130
I Frequenze teoriche nij⇤ :
Y
X y1 y2 y3 Totale
43·43 43·52
x1 130
= 14.2 130
= 17.2 11.6 43
x2 5.0 6.0 4.0 15
x3 6.6 8.0 5.4 20
52·35
x4 17.2 20.8 130
= 14.0 52
Totale 43 52 35 130
2
L’indice di Pearson: esempio di dipendenza perfetta
I Allora:
k X
X h
2
(nij nij⇤ )2 (43 14.2)2 (0 17.2)2 (0 11.6)2
= = + +
nij⇤ 14.2 17.2 11.6
i=1 j=1
(0 5)2 (0 14)2
+ + ... + = 260
5 14
I 2
= N · min(k 1, h 1) = 130 · min(4 1, 3 1) = 130 · 2 = 260
max
I Si è verificato che nel caso di dipendenza perfetta 2 = 2max
Tabella: Distribuzione doppia di frequenza (assoluta) di Sesso e Titolo di studio dei residenti
in Italia di età 25-34 anni, dati in migliaia (Fonte: ISTAT, anno 2013)
Sesso (Y )
Titolo di studio (X ) Maschio Femmina Totale
Elemntari - Nessuno 112 93 205
Licenza Media 1013 770 1783
Diploma 1848 1713 3561
Laurea - Post laurea 639 995 1634
Totale 3612 3571 7185
2
k X
X h (n
ij nij⇤ )2
=
i=1 j=1
nij⇤
I Calcolo V di Cramer
s r
2 12.153
a
Va = 2
= = 0.417
max,a 70
s r
2
b 60.76
Vb = 2 = = 0.417
max,b 350
2
L’indice V di Cramer e l’indice
h
1 X
µY |X =xi = yj nij i = 1, . . . , k
ni.
j=1
h
2 1 X
Y |X =xi = (yj µY |X =xi )2 nij i = 1, . . . , k
ni.
j=1
Altezza
(140,160] (160,165] (165,170] (170,175] (175,180] (180,210] Tot
Maschio 1 2 9 27 42 43 124
Femmina 29 33 35 12 0 0 109
Tot 30 35 44 39 42 43 233
Media e varianza condizionata: esempio
Altezza
150 162.5 167.5 172.5 177.5 195 Tot
Maschio 1 2 9 27 42 43 124
Femmina 29 33 35 12 0 0 109
Tot 30 35 44 39 42 43 233
Media e varianza condizionata: esempio
6
1 X 1
µY |X =M = yj n1j = (150 ⇥ 1 + 162.5 ⇥ 2 + 167.5 ⇥ 9
n1. j=1 124
Le medie di Y condizionate dalla X sono tre, una media condizionata di Y per ogni
modalità della X :
h
1 X 1
µY |X =Medie = yj nij = (1 · 43 + 2 · 0 + 5 · 0) = 1
ni. j=1 43
h
1 X 1
µY |X =Superiori = yj nij = (1 · 0 + 2 · 0 + 5 · 15) = 5
ni. j=1 15
h
1 X 1
µY |X =Laurea = yj nij = (1 · 0 + 2 · 52 + 5 · 0) = 2
ni. j=1 52
Dipendenza perfetta in media
Auto possedute (Y )
Titolo di studio (X ) 1 2 5 Totale
Medie 43 0 0 43
Superiori 0 0 15 15
Laurea 0 52 0 52
Totale 43 52 15 110
Le medie di Y condizionate dalla X sono tre, una media condizionata di Y per ogni
modalità della X :
h
1 X 1
µY |X =Medie = yj nij = (1 · 10 + 2 · 4 + 5 · 2) = 1.75
ni. j=1 16
h
1 X 1
µY |X =Superiori = yj nij = (1 · 19 + 2 · 5 + 5 · 4) = 1.75
ni. j=1 28
h
1 X 1
µY |X =Laurea = yj nij = (1 · 40 + 2 · 16 + 5 · 8) = 1.75
ni. j=1 64
Indipendenza in media
Auto possedute (Y )
Titolo di studio (X ) 1 2 5 Totale
Medie 10 4 2 16
Superiori 19 5 4 28
Laurea 40 16 8 64
Totale 69 25 14 108
Le varianze di Y condizionate dalla X sono tre, una varianza condizionata di Y per ogni modalità
della X :
h
2 1 X 2 1 2 2 2
Y |X =Medie = (yj µY |X =xi ) nij = [(1 1.75) · 10 + (2 1.75) · 4 + (5 1.75) · 2] = 1.69
ni. j=1 16
h
2 1 X 2 1 2 2 2
Y |X =Sup = (yj µY |X =xi ) nij = [(1 1.75) · 19 + (2 1.75) · 5 + (5 1.75) · 4] = 1.90
ni. j=1 28
h
2 1 X 2 1 2 2 2
Y |X =Laurea = (yj µY |X =xi ) nij = [(1 1.75) · 40 + (2 1.75) · 16 + (5 1.75) · 8] = 1.69
ni. j=1 64
Indipendenza in media
Le medie condizionate sono uguali tra loro e uguali alla media generale.
Questo è un caso limite!
Associazione tra una variabile qualitativa e una
quantitativa
Definizione
Il rapporto di correlazione ⌘Y2 |X è definito come il rapporto tra la varianza
spiegata e la varianza totale:
2
Media(Y |X )
⌘Y2 |X = 2
y
Dunque risulta:
k
2 1 X
Media(Y |X ) = (µY |X =xi µy )2 ni.
N i=1
1
= [(1 2.02)2 43 + (5 2.02)2 15 + (2 2.02)2 52] = 1.62
110
2
Media(Y |X ) 1.62
⌘Y2 |X = 2
= =1 cvd
y 1.62
Il rapporto di correlazione ⌘Y2 |X
Dunque risulta:
k
2 1 X
Media(Y |X ) = (µY |X =xi µy )2 ni.
N i=1
1
= [(1.75 1.75)2 16 + (1.75 1.75)2 28 + (1.75 1.75)2 64] = 0
108
2
Media(Y |X ) 0
⌘Y2 |X = 2
= =0 cvd
y 1.74
Il rapporto di correlazione ⌘Y2 |X : esempio
Calcolo di ⌘Y2 |X per le variabili genere e altezza
Altezza
150 162.5 167.5 172.5 177.5 195 Tot
Maschio 1 2 9 27 42 43 124
Femmina 29 33 35 12 0 0 109
Tot 30 35 44 39 42 43 233
2
µY |X =M = 181.3 Y |X =M = 114.26
2
µY |X =F = 161.9 Y |X =F = 60.22
2
µy = 172.2 y = 182.78
Dunque risulta:
k
2 1 X 2 1 2 2
Media(Y |X ) = (µY |X =xi µy ) ni. = [(181.3 172.2) 124 + (161.9 172.2) 109] = 93.7
N i=1 233
2
2 Media(Y |X ) 93.7
⌘Y |X = 2
= = 0.513
y 182.78
Il rapporto di correlazione ⌘Y2 |X e l’indice V di Cramer
I 2 2
Media(Y |X ) ! varianza spiegata ( Spiegata ), varianza tra gruppi ( 2
Tra
2 2
o Between ), varianza esterna ( Est )
I 2
y ! varianza, varianza totale
Alternativa per il calcolo di ⌘Y2 |X
X
Analisi dell’associazione tra due variabili quantitative
IV Y⇤ I
X⇤
III II
Analisi dell’associazione tra due variabili quantitative
Rappresentazione grafica
delle variabili scarto X ⇤ e Y ⇤
III II
Analisi dell’associazione tra due variabili quantitative
Definizione
La covarianza tra due variabili (quantitative) è definita come la media dei
prodotti degli scostamenti delle variabili X e Y dalle rispettive medie
N
1 X
xy = (xi µx )(yi µy )
N
i=1
Ovvero
1
xy = [(x1 µx )(y1 µy )+(x2 µx )(y2 µy )+. . .+(xN µx )(yN µy )]
N
Covarianza
PN
Nota: il numeratore della covarianza (cioè i=1 (xi µx )(yi µy )) si
chiama codevianza
Covarianza, esempio
X -1 0 1 2
Y 1 2 2 3
1 1 1
µx = ( 1 + 0 + 1 + 2) = µy = (1 + 2 + 2 + 3) = 2
4 2 4
N
1 X
xy = (xi µx )(yi µy )
N
i=1
1
= [( 1 0.5)(1 2) + (0 0.5)(2 2)
4
3
+ (1 0.5)(2 2) + (2 0.5)(3 2)] =
4
Tra X e Y c’è concordanza ( xy > 0)
Coefficiente di correlazione lineare
⇣X
N ⌘2 N
X N
X
zi wi zi2 wi2
i=1 i=1 i=1
⇣X
N ⌘2 N
X N
X
xi⇤ yi⇤ xi⇤2 yi⇤2
i=1 i=1 i=1
x y xy x y
x y xy x y
x y xy x y
x y x y x y
xy
1 1
x y
Coefficiente di correlazione lineare
Definizione
Il coefficiente di correlazione lineare tra due variabili quantitative X e Y ,
è il rapporto tra la covarianza e il prodotto degli errori standard
xy
rxy = ,
x y
Assenza di correlazione
lineare
I rxy = 0
I In questo caso non vi è
relazione tra le variabili
X eY
I I punti identificati dalle
coppie della
distribuzione doppia
(xi , yi ) sono sparsi
Coefficiente di correlazione lineare
Assenza di correlazione
lineare
I rxy = 0
I In questo caso la
relazione tra le variabili
X e Y è di tipo
parabolico e non di tipo
lineare
I I punti identificati dalle
coppie della
distribuzione doppia
(xi , yi ) giacciono su una
parabola
Coefficiente di correlazione lineare: esempio
µx = ( 2 1 + 1 + 2)/4 = 0 µy = (8 + 2 + 2 + 8)/4 = 5
xy = [( 2 0)(8 5) + ( 1 0)(2 5) + (1 0)(2 5) + (2 0)(8 5)]/4 = 0
x 6= 0 y 6= 0
xy 0
rxy = = = 0 relazione lineare assente
x y x y
PN
I xy = 1
N i=1 (xi µx )yi
N N
1 X 1 X
xy = [(xi µx )(yi µy )] = [yi (xi µx ) µy (xi µx )]
N N
i=1 i=1
N N
1 X 1 X
= yi (xi µx ) µy (xi µx )
N N
i=1 i=1
N N N
1 X 1 X 1 X
= yi (xi µx ) µy (xi µx ) = yi (xi µx )
N N N
i=1 i=1 i=1
| {z }
=0
PN
I xy = 1
N i=1 (yi µy )xi (si dimostra in modo analogo)
Formule alternative per il calcolo della covarianza
PN
I xy = 1
N i=1 xi yi µx µy
N N
1 X 1 X
xy = [(xi µx )(yi µy )] = yi (xi µx )
N N
i=1 i=1
N N N
1 X 1 X 1 X
= (yi xi yi µ x ) = yi xi yi µ x
N N N
i=1 i=1 i=1
N N N
1 X 1 X 1 X
= xi yi µx yi = xi yi µx µy
N N N
i=1 i=1 i=1
| {z }
=µy
Coefficiente rxy : esempio
Per gli studenti del corso C sono note le seguenti statistiche della
distribuzione doppia per peso (X ) e altezza (Y ):
PN
I i=1 xi yi = 2679562
I µx = 66.2, µy = 172.5
PN 2 PN 2
I i=1 xi = 1052416, i=1 yi = 6955947
Calcolo di rxy :
N
1 X 1
xy = xi yi µx µy = 2679562 66.2 ⇥ 172.5 = 75.49
N 233
i=1
2 1052416 p
x = Qx2 µ2x = 66.22 = 131.3 ! x = 131.3 = 11.46
233
2 6955947 p
y = Qy2 µ2y = 172.52 = 90.94 ! y = 90.94 = 9.54
233
xy 75.49
rxy = = = 0.69
x y 11.46 ⇥ 9.54
Interpolazione lineare
I Concetto di interpolazione
I Interpolazione lineare con il metodo dei minimi quadrati
I Modello di regressione (cenni)
I In questa parte del corso X e Y sono sempre variabili quantitative
Interpolazione matematica
y = a0 + a1 x + a2 x 2 + . . . + aN 1x
N 1
I Infatti si ricorda che per N punti passa una e una sola curva
polinomiale di grado N 1
y = a0 + a1 x
y = a0 + a1 x + a2 x 2
Interpolazione matematica
= |yi f (xi )|
f (xi )
yi
xi
PN
Obiettivo: minimizzare i=1 (yi f (xi ))2 rispetto ai parametri a0 , . . . , ak
Il metodo dei minimi quadrati
Funzione da minimizzare:
N
X 2
S(a0 , . . . , ak ) = yi f (xi )
i=1
8 PN PN
< Na + b i=1 xi = i=1 yi
! ! In forma matriciale:
: PN PN PN
a i=1 xi + b i=1 xi2 = i=1 yi xi
2 PN 32 3 2 PN 3
N i=1 xi a i=1 yi
!4 54 5=4 5
PN PN 2 PN
i=1 xi i=1 xi
b i=1 yi xi
Il metodo dei minimi quadrati
Xp = y
Dove
2 PN 3 2 3 2 PN 3
N i=1 xi a i=1 yi
X=4 5 p=4 5 y=4 5.
PN PN PN
i=1 xi i=1 xi
2 b i=1 yi xi
PN
N yi
PN Pi=1
N PN PN PN
i=1 xi i=1 yi xi N i=1 xi yi i=1 xi i=1 yi
b= PN = PN PN 2
N xi N i=1 xi2 i=1 xi
PN Pi=1
N 2
i=1 xi i=1 xi
Il metodo dei minimi quadrati
a = µy bµx
X
Interpolazione lineare: interpretazione dei parametri
Sfruttando i dati riportati nella tabella (con i totali in ultima riga) si ottiene:
I N = 5, µx = 21
5
= 4.2, µy = 37
5
= 7.4
I b= xy
2 =
CODxy
DEVx
= 27.6
26.8
= 1.03
x
I a = µy bµx = 7.4 1.03 · 4.2 = 3.075
I a = 3.07 è il valore assunto dalla variabile Y per x = 0
I b = 1.03 significa che all’aumentare della X di una unità , la Y aumenta
in media di 1.03 unità
Interpolazione lineare: esempio
Rappresentazione grafica
Y y = 3.075 + 1.03x
11
10
5
4
X
1 3 4 5 8
Interpolazione lineare: esempio
57
1881 29 791
54
1891 NA
51
1901 33 778
48
1911 36 921
42
1921 37 856
39
1931 41 043
36
1936 42 399
33
10941 NA
27
1961 50 624
1971 54 137
22
1981 56 557 1861 1881 1901 1921 1936 1951 1971 1991 2011
2001 58 008
2011 59 434
I Dallo scatter plot si intuisce che la retta costituisce un buon modello
matematico (funzione matematica) per l’evoluzione della
popolazione nel tempo
59434
Y = -448953 + 254 X
54137
Popolazione Residente in Italia (Migliaia)
47516
39397
32963
27299
22177
Anno
Interpolazione lineare: esempio
Interpolazione Estrapolazione
Y Y
ŷ = f (x0 )
11 11
10 10
ŷ = f (x0 )
7 7
5 5
4 4
1 3 4 5 x0 8
X 1 3 4 5 8 x0
X
min(x) max(x) min(x) max(x)
4. Bontà di adattamento
distinte caratterizzate
Y
6
4
0 2 4 6 8 10 interpolante
X
I Nel grafico in alto i punti
sono distanti dalla retta
Y = 4,9 + 0,5X
(alta variabilità della Y |X )
9
7
6
0 2 4 6 8 10
alla retta (bassa variabilità
X
della Y |X )
4. Bontà di adattamento
Per costruire un indice che misuri la bontà di adattamento si consideri la
seguente scomposizione per ogni osservazione di coordinata xi , yi :
yi
yi yˆi
ŷi
yˆi µy
µy
X
4. Bontà di adattamento
Definizione
Siano (xi , yi ), i = 1, . . . , N le coppie di valori di una distribuzione doppia
e siano µx e µy le medie di X e Y . Sia yˆi = f (xi ) il valore della funzione
interpolante f (x) nel punto xi . Una misura della bontà di adattamento
della funzione f (x) ai dati osservati (xi , yi ) è data dall’Indice di
Determinazione Lineare:
1
PN 1
PN
2 N i=1 (ŷi µy ) 2 N i=1 (yi ŷi )2
R = 1 PN =1 1
P N
N i=1 (yi µy ) 2 N i=1 (yi µy ) 2
2 2
ŷ e
R2 = 2
=1 2
y y
4. Bontà di adattamento: Indice di Determinazione Lineare
Ricordando che:
I µy = a + bµx (a, b calcolati con il metodo dei minimi quadrati sono
tali che la retta passa per il punto (µx , µy ))
I ŷi = a + bxi
1
PN PN
2 N i=1 (ŷi µy ) 2 + bxi (a + bµx ))2
i=1 (a
R = 1
PN = P N
N i=1 (yi µy ) 2 i=1 (yi µy ) 2
PN PN 2 PN 2
(a + bxi a bµx )2 i=1 b(xi µx ) i=1 b (xi µx ) 2
= i=1PN = P N
= P N
i=1 (yi µy ) 2 i=1 (yi µy ) 2 i=1 (yi µy ) 2
P N P N
b2 (xi µx )2 b2 1 (xi µx )2 b2 2
= PN i=1 = 1NPNi=1 = 2x
i=1 (yi µy ) 2 N i=1 (yi µy ) 2 y
Relazione tra R 2 e rxy
2
I E’ inoltre evidente che b · d = xy
2 2
2
= rxy = R 2 (solo nel caso lineare)
x y
Interpolazione e rxy per distribuzioni doppie di frequenze
I Si consideri il caso in cui i dati di due variabili quantitative siano
disponibili solo sotto forma di distribuzione doppia di frequenza
I Per ottenere rxy e i parametri della retta a e b è necessario calcolare
medie, varianze e covarianza
I Il calcolo di medie e varianze per una distribuzione doppia di
frequenza è già stato a↵rontato
I E’ necessario fornire una formulazione per la covarianza nel caso di
distribuzioni doppie di frequenza
I Siano X e Y due variabili quantitative rispettivamente con k e h
modalità (o classi), la covarianza è :
k h
1 XX
xy = (xi µx )(yj µy )nij
N
i=1 j=1
I µx = 1
(150 ⇥ 30 + 165 ⇥ 79 + 175 ⇥ 81 + 195 ⇥ 43) = 172.1
233
I µy = 1
(45 ⇥ 25 + 60 ⇥ 132 + 80 ⇥ 72 + 105 ⇥ 4) = 65.3
233
Pk Ph
I Covarianza: xy = 1
i=1 j=1 (xi µx )(yj µy )nij
N
1 ⇥
xy = (150 172.1)(45 65.3)10 + (150 172.1)(60 65.3)19 + (150 172.1)(80 65.3)1
233
+ (150 172.1)(105 65.3)0 + (165 172.1)(45 65.3)15 + (165 172.1)(60 65.3)57
+ (165 172.1)(80 65.3)7 + (165 172.1)(105 65.3)0 + (175 172.1)(45 65.3)0
+ (175 172.1)(60 65.3)46 + (175 172.1)(80 65.3)34 + (175 172.1)(105 65.3)1
+ (195 172.1)(45 65.3)0 + (195 172.1)(60 65.3)10
⇤
+ (195 172.1)(80 65.3)30 + (195 172.1)(105 65.3)3 = 96.3
Interpolazione lineare: esempio
Dataset: voto al diploma, età , voto all’esame di economia aziendale 1 e matematica generale di
10 studenti del corso C scelti a caso tra coloro che hanno sostenuto entrambi gli esami
29
25
Aziendale1
24
22
18
80 85 90 95 100
Voto diploma
Figura: Scatter plot di Voto al diploma e voto ad Aziendale 1 per gli studenti del
croso C che hanno passato sia Aziendale sia Matematica
Interpolazione lineare: esempio
I µx = 93.6, µy = 23.7
I b= CODxy
= 44.8
= 0.092,a = µy bµx = 23.7 (0.092) ⇥ 93.6 = 15.08
DEVx 486.4
Interpolazione lineare: esempio
I rxy = xy
=p
CODxy
= p 44.8
= 0.18
x y DEVx DEVy 486.4 ⇥ 126.1
I rxy
2
= 0.182 = 0.03 = R 2
25.0
I y = 15.079 + 0.092x
22.5
I R 2 = 0.03: tramite la
20.0 funzione lineare la variabile
17.5
X spiega il 3% della
80 85 90 95 100
Voto diploma variabilità della Y
Interpolazione lineare: esempio
Relazione tra voto al diploma e voto di aziendale 1 per tutti gli studenti
che hanno passato entrambi gli esami del primo semestre (R 2 = 10.6%)
30.0
27.5
Voto aziendale 1
Genere
25.0
Maschio
22.5 Femmina
20.0
17.5
60 70 80 90 100
Voto al diploma
La matrice varianza-covarianza