Sei sulla pagina 1di 7

Esercizi sulle distribuzioni doppie

Dipendenza in media
Statistica corso C
Prof. Stefano Marchetti

Esercizio 1
Relativamente ad un collettivo di studenti si conosce il livello di conoscenza
di fogli di calcolo e il voto al diploma: Determinare la dipendenza in media

Voto diploma
[60-70) [70-80) [80-90) [90-100]
Folgio calcolo
Poco 28 41 48 51
Avanzato 6 19 11 29

del voto al diploma dalla conoscenza dei fogli di calcolo.

Esercizio 1 - Soluzione
Per comodotià denotiamo con Y la variabile quantitativa voto al diploma e
con X la variabile qualitativa livello di conoscenza dei fogli di calcolo. La
dipendenza in media si misura tramite il rapporto di correlazione di Pearson

σµ2 Y |X
ηY2 |X = ,
σY2

dove σµ2 Y |X è la varianza delle medie di Y condizionate alle diverse modalità


di X e σY2 è la varianza di Y .
Dobbiamo calcolare le medie condizionate di Y |X = Poco e Y |X =
Avanzato, la media (non condizionata) e la varianza di Y . Poichè le modalità
della Y sono presentate nella distribuzione doppia con le classi, attribuiremo
alle unità di una certa classe il suo valore centrale. Di seguito la distribuzione
doppia con il valore centrale delle classi per Y e le distribuzioni marginali di
Y e X:

1
Voto diploma
65 75 85 95 Sum
Folgio calc.
Poco 28 41 48 51 168
Avanzato 6 19 11 29 65
Sum 34 60 59 80 233

Calcoliamo media e varianza di Y :


1
µY = (65 · 34 + 75 · 60 + 85 · 59 + 95 · 80) = 82.94
233
1 
σY2 = (65 − 82.94)2 34 + (75 − 82.94)2 60
233
+(85 − 82.94)2 59 + (95 − 82.94)2 80 = 114.211


Adesso calcoliamo le medie condizionate:


1
µY |X=Poco = (65 · 28 + 75 · 41 + 85 · 48 + 95 · 51) = 82.262
168
1
µY |X=Avanzato = (65 · 6 + 75 · 19 + 85 · 11 + 95 · 29) = 84.692
65
La varianza delle medie condizionate è :
1 
σµ2 Y |X = (82.262 − 82.94)2 168 + (84.692 − 82.94)2 65 = 1.188

233
Infine possiamo calcolare il rapporto di correlazione di Pearson:

σµ2 Y |X 1.188
ηY2 |X = = = 0.0104
σY2 114.211

Praticamente non c’è dipendenza in media tra il voto al diploma e le com-


petenze (dichiarate) nell’utilizzo del foglio di calcolo.

Esercizio 2
Relativamente ad un collettivo di studenti si conosce il voto al diploma e
l’esito degli appelli di matematica generale:

2
Esito Mat Voto diploma
5 Non superato 64
186 Non superato 87
140 Superato 78
36 Superato 65
232 Superato 80
107 Superato 90
223 Non superato 82
136 Non superato 60
20 Superato 60
74 Non superato 68
183 Superato 76
168 Non superato 100
48 Superato 88
104 Superato 90
226 Non superato 77
37 Superato 100
194 Superato 77
157 Non superato 65
108 Superato 82
233 Non superato 63

Determinare la dipendenza in media del voto al diploma dall’esito dell’appello


di matematica.

Esercizio 2 - Soluzione
In questo esercizio i dati non sono sotto forma di distribuzione doppia di
frequenza. Tuttavia le grandezze da calcolare per ottenre il rapporto di
correlaizone di Pearson per determinare la diepndenza in media tra le due
variabili sono gli stessi visti nell’esercizio 1: le medie condizionate e la vari-
anza del voto al diploma. Per comodità denotiamo con Y la variabile voto
al diploma e con X la variabile esito esame di matematica.
Iniziamo calcolando media e varianza del voto al diploma per il collettivo

3
di 20 studenti:
1
µY = (64 + 87 + 78 + 65 + 80 + 90 + 82 + 60 + 60 + 68 + 76 + 100 + 88
20
+ 90 + 77 + 100 + 77 + 65 + 82 + 63) = 77.6
1
σY2 = (64 − 77.6)2 + (87 − 77.6)2 + (78 − 77.6)2 + (65 − 77.6)2
20
+ (80 − 77.6)2 + (90 − 77.6)2 + (82 − 77.6)2 + (60 − 77.6)2
+ (60 − 77.6)2 + (68 − 77.6)2 + (76 − 77.6)2 + (100 − 77.6)2
+ (88 − 77.6)2 + (90 − 77.6)2 + (77 − 77.6)2 + (100 − 77.6)2
+ (77 − 77.6)2 + (65 − 77.6)2 + (82 − 77.6)2 + (63 − 77.6)2 = 149.14


Calcoliamo le medie condizionate e, a seguire, la varianza delle medie


condizionate. Per facilitare l’operazione riscriviamo i dati come due dis-
tribuzioni unitarie, una distribuzione del voto al diploma per chi ha superato
matematica e una per chi non l’ha superato:
Superato: 78,65,80,90,60,76,88,90,100,77,82
Non superato: 64,87,82,60,68,100,77,65,63
1
µY |X=Sup = (78 + 65 + 80 + 90 + 60 + 76 + 88 + 90 + 100 + 77 + 82)
11
= 80.545
1
µY |X=Non sup = (64 + 87 + 82 + 60 + 68 + 100 + 77 + 65 + 63) = 74
9
1
σµ2 Y |X (80.545 − 77.6)2 11 + (74 − 77.6)2 9 = 10.604

=
20
Infine il rapporto di correlazione di Pearson tra il voto al diploma e l’esito
dell’esame di matematica è :
10.604
ηY2 |X = = 0.071
149.14
Non si rileva una dipendenza in media degna di nota tra le due variabili per
il collettivo considerato.
Curiosità : il rapporto di correlazione di Pearson per tutto il collettivo
di studenti (non solo i 20 selezionati casualmente) è 0.038.

Esercizio 3
Si consideri la distribuzione doppia di frequenza per le variabili numero di
auto e numero di computer posseduti per un collettivo di 100 famiglie:

4
Computer
Auto
0 1 2
0 4 20 16
1 12 34 14

Determinare la dipendenza in media del numero di computer rispetto al


numero di auto.

Esercizio 3 - Soluzione
Si procede come fatto nell’esercizio 1, denominando Y il numero di computer
e X il numero di auto (variabile quantitativa discreta, che serve a dividere
il collettivo in due gruppi, quello con 0 e quelli con 1 auto).
1
µY = (0 · 16 + 1 · 54 + 2 · 30) = 1.14
100
1 
σY2 = (0 − 1.14)2 16 + (1 − 1.14)2 54 + (2 − 1.14)2 30 = 0.440

100
1
µY |X=0 = (0 · 4 + 1 · 20 + 2 · 16) = 1.30
40
1
µY |X=1 = (0 · 12 + 1 · 34 + 2 · 14) = 1.03
60
1 
σµ2 Y |X = (1.3 − 1.14)2 40 + (1.03 − 1.14)2 60 = 0.0175

100
σµ2 Y |X 0.0175
ηY2 |X = 2 = = 0.0398
σY 0.440

Esercizio 4
Di un collettivo di studenti si conosce il voto medio al diploma di 124 maschi
e 109 femmine, che è rispettivamente 81 e 84.5. Inoltre la varianza del voto al
diploma è 145 per i maschi e 135 per le femmine. Determinare la dipendenza
in media del voto al diploma dal sesso.

5
Esercizio 4 - Soluzione
Posto Y il voto al diploma e X il sesso, dai dati nel testo è noto che:

nM = 124
µY |X=M = 81
σY2 |X=M = 145
nF = 109
µY |X=F = 84.5
σY2 |X=F = 135
N = nM + nF = 124 + 109 = 233

Con i dati a disposizone possiamo calcolare il rapporto di correlazione di


Pearson ηY2 |X . Un modo possibile è il seguente:

1
µY = (81 · 124 + 84.5 · 109) = 82.637
233
1
µσ 2 = (145 · 124 + 135 · 109) = 140.322
Y |X 233
1 
σµ2 Y |X (81 − 82.637)2 124 + (84.5 − 82.637)2 109 = 3.050

=
233
σµ2 Y |X σµ2 Y |X 3.050
ηY2 |X = 2 = 2 = = 0.0213
σY σµY |X + µσ2 3.050 + 140.322
Y |X

Esercizio 5 - facoltativo
Di un certo collettivo si conosce la devianza dell’età , pari a 6600 e la de-
vianza dell’età condizionata al sesso, pari rispettivamente a 2500 per i maschi
e 3600 per le femmine. Determinare la dipendenza in media dell’età dal sesso.

Esercizio 5 - Soluzione
2 2500 + 3600
ηeta|sesso =1− = 0.0758
6600
Perché ?
L’esercizio fornisce le devianze dei maschi, delle femmine e totale per
quanto riguarda la variabile età . Non è nota la numerosità del collettivo ne
quella del gruppo dei maschi o delle femmine. Tuttavia avendo le devianze
tale informazione non serve.

6
Si consideri la scomposizione della devianza, possiamo ottenerla facil-
mente a partire da quella della varianza (Y variabile età , X variabile sesso):
k k
1 X 1 X 2
σY2 = (µY |X=Xi − µY )2 ni. + σY |X=Xi ni.
N N
i=1 i=1
k
X k
X
N σY2 = (µY |X=Xi − µY )2 ni. + σY2 |X=Xi ni.
| {z }
i=1 i=1 | {z }
DEVY DEVY |X=Xi
k
X k
X
DEVY = (µY |X=Xi − µY )2 ni. + DEVY |X=Xi
i=1 i=1

La devianza interna corrisponde alla somma delle devianze condizionate,


quindi avendo le devianze non serve avere la numerosità dei gruppi. Possi-
amo sfruttare tale informazione anche nell’indice η 2 :
Pk
σµ2 Y |X µσ 2
Y |X
N µσ 2
Y |X
N N1 2
i=1 σY |X=Xi ni.
ηY2 |X = =1− =1− =1−
σY2 σY2 N σY2 DEVY
Pk 2 Pk
i=1 σY |X=Xi ni. i=1 DEVY |X=Xi
=1− =1−
DEVY DEVY

Potrebbero piacerti anche