Dipendenza in media
Statistica corso C
Prof. Stefano Marchetti
Esercizio 1
Relativamente ad un collettivo di studenti si conosce il livello di conoscenza
di fogli di calcolo e il voto al diploma: Determinare la dipendenza in media
Voto diploma
[60-70) [70-80) [80-90) [90-100]
Folgio calcolo
Poco 28 41 48 51
Avanzato 6 19 11 29
Esercizio 1 - Soluzione
Per comodotià denotiamo con Y la variabile quantitativa voto al diploma e
con X la variabile qualitativa livello di conoscenza dei fogli di calcolo. La
dipendenza in media si misura tramite il rapporto di correlazione di Pearson
σµ2 Y |X
ηY2 |X = ,
σY2
1
Voto diploma
65 75 85 95 Sum
Folgio calc.
Poco 28 41 48 51 168
Avanzato 6 19 11 29 65
Sum 34 60 59 80 233
σµ2 Y |X 1.188
ηY2 |X = = = 0.0104
σY2 114.211
Esercizio 2
Relativamente ad un collettivo di studenti si conosce il voto al diploma e
l’esito degli appelli di matematica generale:
2
Esito Mat Voto diploma
5 Non superato 64
186 Non superato 87
140 Superato 78
36 Superato 65
232 Superato 80
107 Superato 90
223 Non superato 82
136 Non superato 60
20 Superato 60
74 Non superato 68
183 Superato 76
168 Non superato 100
48 Superato 88
104 Superato 90
226 Non superato 77
37 Superato 100
194 Superato 77
157 Non superato 65
108 Superato 82
233 Non superato 63
Esercizio 2 - Soluzione
In questo esercizio i dati non sono sotto forma di distribuzione doppia di
frequenza. Tuttavia le grandezze da calcolare per ottenre il rapporto di
correlaizone di Pearson per determinare la diepndenza in media tra le due
variabili sono gli stessi visti nell’esercizio 1: le medie condizionate e la vari-
anza del voto al diploma. Per comodità denotiamo con Y la variabile voto
al diploma e con X la variabile esito esame di matematica.
Iniziamo calcolando media e varianza del voto al diploma per il collettivo
3
di 20 studenti:
1
µY = (64 + 87 + 78 + 65 + 80 + 90 + 82 + 60 + 60 + 68 + 76 + 100 + 88
20
+ 90 + 77 + 100 + 77 + 65 + 82 + 63) = 77.6
1
σY2 = (64 − 77.6)2 + (87 − 77.6)2 + (78 − 77.6)2 + (65 − 77.6)2
20
+ (80 − 77.6)2 + (90 − 77.6)2 + (82 − 77.6)2 + (60 − 77.6)2
+ (60 − 77.6)2 + (68 − 77.6)2 + (76 − 77.6)2 + (100 − 77.6)2
+ (88 − 77.6)2 + (90 − 77.6)2 + (77 − 77.6)2 + (100 − 77.6)2
+ (77 − 77.6)2 + (65 − 77.6)2 + (82 − 77.6)2 + (63 − 77.6)2 = 149.14
Esercizio 3
Si consideri la distribuzione doppia di frequenza per le variabili numero di
auto e numero di computer posseduti per un collettivo di 100 famiglie:
4
Computer
Auto
0 1 2
0 4 20 16
1 12 34 14
Esercizio 3 - Soluzione
Si procede come fatto nell’esercizio 1, denominando Y il numero di computer
e X il numero di auto (variabile quantitativa discreta, che serve a dividere
il collettivo in due gruppi, quello con 0 e quelli con 1 auto).
1
µY = (0 · 16 + 1 · 54 + 2 · 30) = 1.14
100
1
σY2 = (0 − 1.14)2 16 + (1 − 1.14)2 54 + (2 − 1.14)2 30 = 0.440
100
1
µY |X=0 = (0 · 4 + 1 · 20 + 2 · 16) = 1.30
40
1
µY |X=1 = (0 · 12 + 1 · 34 + 2 · 14) = 1.03
60
1
σµ2 Y |X = (1.3 − 1.14)2 40 + (1.03 − 1.14)2 60 = 0.0175
100
σµ2 Y |X 0.0175
ηY2 |X = 2 = = 0.0398
σY 0.440
Esercizio 4
Di un collettivo di studenti si conosce il voto medio al diploma di 124 maschi
e 109 femmine, che è rispettivamente 81 e 84.5. Inoltre la varianza del voto al
diploma è 145 per i maschi e 135 per le femmine. Determinare la dipendenza
in media del voto al diploma dal sesso.
5
Esercizio 4 - Soluzione
Posto Y il voto al diploma e X il sesso, dai dati nel testo è noto che:
nM = 124
µY |X=M = 81
σY2 |X=M = 145
nF = 109
µY |X=F = 84.5
σY2 |X=F = 135
N = nM + nF = 124 + 109 = 233
1
µY = (81 · 124 + 84.5 · 109) = 82.637
233
1
µσ 2 = (145 · 124 + 135 · 109) = 140.322
Y |X 233
1
σµ2 Y |X (81 − 82.637)2 124 + (84.5 − 82.637)2 109 = 3.050
=
233
σµ2 Y |X σµ2 Y |X 3.050
ηY2 |X = 2 = 2 = = 0.0213
σY σµY |X + µσ2 3.050 + 140.322
Y |X
Esercizio 5 - facoltativo
Di un certo collettivo si conosce la devianza dell’età , pari a 6600 e la de-
vianza dell’età condizionata al sesso, pari rispettivamente a 2500 per i maschi
e 3600 per le femmine. Determinare la dipendenza in media dell’età dal sesso.
Esercizio 5 - Soluzione
2 2500 + 3600
ηeta|sesso =1− = 0.0758
6600
Perché ?
L’esercizio fornisce le devianze dei maschi, delle femmine e totale per
quanto riguarda la variabile età . Non è nota la numerosità del collettivo ne
quella del gruppo dei maschi o delle femmine. Tuttavia avendo le devianze
tale informazione non serve.
6
Si consideri la scomposizione della devianza, possiamo ottenerla facil-
mente a partire da quella della varianza (Y variabile età , X variabile sesso):
k k
1 X 1 X 2
σY2 = (µY |X=Xi − µY )2 ni. + σY |X=Xi ni.
N N
i=1 i=1
k
X k
X
N σY2 = (µY |X=Xi − µY )2 ni. + σY2 |X=Xi ni.
| {z }
i=1 i=1 | {z }
DEVY DEVY |X=Xi
k
X k
X
DEVY = (µY |X=Xi − µY )2 ni. + DEVY |X=Xi
i=1 i=1