Sei sulla pagina 1di 4

STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 1

Università degli Studi di Verona


Corso di laurea in Economia e Commercio
A.A. 2011/2012

STATISTICA
Prof. Marco Minozzo

Esercitazione 7. Dipendenza: SOLUZIONI

Esercizio 1

a) La distribuzione marginale relativa del carattere tipo di occupazione è:

Tipo di occupazione
Agricoltura 445/8406 = 0.0529
Industria 2859/8406 = 0.3401
Altri servizi 5102/8406 = 0.6069

b) Le cinque distribuzioni condizionate relative richieste sono le seguenti:

Agricoltura Industria Altre attività Totale


Piemonte 0.0514 = 87/1693 0.3993 0.5493 1
Veneto 0.0541 = 100/1849 0.4143 0.5316 1
Emilia Romagna 0.0714 = 121/1694 0.3495 0.5791 1
Toscana 0.0421 = 57/1353 0.3422 0.6157 1
Lazio 0.0440 = 80/1817 0.1992 0.7568 1

Essendo queste distribuzioni non tutte uguali tra loro, possiamo affermare che esiste dipen-
denza tra i due caratteri.
c) Per il calcolo degli indici richiesti, si consideri la seguente tabella con le frequenze teoriche di
indipendenza ottenute come n̂ij = ni0 · n0j /N :

Agricoltura Industria Altre attività Totale


Piemonte 89.625 575.813 1027.562 1693
Veneto 97.883 628.871 1122.246 1849
Emilia Romagna 89.678 576.153 1028.169 1694
Toscana 71.625 460.175 821.200 1353
Lazio 96.189 617.988 1102.823 1817
Totale 445 2859 5102 8406

dove, ad esempio, 89.625 = 1693 · 445/8406. Da qui si ricava l’indice χ2 che risulta pari a
266.645. L’indice C di dipendenza normalizzato di Cramér in questo caso risulta pari a
√ √
χ2 1 266.645 1
C= · = · = 0.126,
N k 8406 2
dove k = min{s−1; t−1}. L’indice C indica una dipendenza bassa tra il tipo di occupazione
(Y ) e la regione (X).
STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 2

Esercizio 2

a) La distribuzione di frequenza assoluta marginale della risposta al test è pari a: 25, 36, 31, 20. I
valori sono ottenuti sommando le frequenze assolute corrispondenti ai tre gruppi; ad esempio,
25 = 14 + 8 + 3, e cosı̀ via. Quindi, la distribuzione marginale relativa e le distribuzioni
condizionate relative della risposta al test sono date da

elevata discreta moderata negativa Totale


Gruppo 1 0.326 = 14/43 0.279 0.302 0.093 1
Gruppo 2 0.167 = 8/48 0.458 0.250 0.125 1
Gruppo 3 0.143 = 3/21 0.095 0.286 0.476 1
Marginale di Y 0.223 = 25/112 0.321 0.277 0.179 1

b) Le distribuzioni condizionate relative del tipo di patologia (gruppo) data la risposta al test sono
le seguenti

elevata discreta moderata negativa Marginale di X


Gruppo 1 0.56 = 14/25 0.33 = 12/36 0.42 = 13/31 0.20 = 4/20 0.38 = 43/112
Gruppo 2 0.32 0.61 0.39 0.30 0.43
Gruppo 3 0.12 0.06 0.19 0.50 0.19
Totale 1 1 1 1 1

Ovviamente, essendo le distribuzioni condizionate relative non tutte uguali tra loro (“per riga”
o “per colonna”), c’è dipendenza tra i caratteri X ed Y .

c) Per una tabella di dimensione 3 righe (ovvero con 3 modalità per X) per 4 colonne (ovvero con
4 modalità per Y ) ci può essere perfetta dipendenza di X da Y , ma non di Y da X.

d) Per il calcolo dell’indice di dipendenza χ2 consideriamo la seguente tabella

(nij − n̂ij )2
n̂ij
2.0187 0.2400 0.1013 1.7623
0.6876 2.7989 0.1244 0.7714
0.6075 3.3426 0.0060 10.4167
22.8776

dove n̂ij = ni0 · n0j /N . Quindi, l’indice di dipendenza χ2 è pari a 22.8776. L’indice C di
dipendenza normalizzato di Cramér risulta pari a

22.8776 1
C= · = 0.3196.
112 2
Secondo questo indice, nella tabella c’è un grado di dipendenza intermedio.

Esercizio 3

a) Le distribuzioni relative marginali dei due caratteri sono


STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 3

Tipo di produzione Cereali Ortaggi Latte Totale


Marginale di Y 376/856 = 0.439 0.366 0.195 1

Nazione Grecia Italia Spagna Totale


Marginale di X 89/856 = 0.104 0.521 0.375 1

b) Le distribuzioni relative condizionate “per riga” sono date da

Cereali Ortaggi Latte


Grecia 42/89 = 0.472 0.449 0.079 1
Italia 201/446 = 0.451 0.323 0.226 1
Spagna 133/321 = 0.414 0.402 0.184 1

c) Considerando che le frequenze teoriche n̂ij in caso di indipendenza sono

Cereali Ortaggi Latte


Grecia 39.093 32.543 17.363
Italia 195.906 163.082 87.012
Spagna 141 117.375 62.625

si ha che χ2 = 14.5390. Di conseguenza



14.5390 1
C= · = 0.092,
856 2
il che significa che la dipendenza tra i due caratteri è bassa.

Esercizio 4

a) Nel caso di dipendenza perfetta tra i due caratteri, la distribuzione delle frequenze nelle celle
della tabella deve essere tale per cui la realizzazione di una modalità di uno dei due caratteri
implica l’esatta conoscenza della modalità dell’altro carattere. Ciò significa, ad esempio, che,
nel caso di perfetta dipendenza di X da Y e contemporaneamente di Y da X, per ogni riga
e per ogni colonna della tabella vi sarà una sola cella con frequenza congiunta diversa da 0;
le rimanenti frequenze congiunte saranno tutte pari a 0. Considerando N = 20, una possibile
tabella compatibile con la richiesta di dipendenza perfetta tra i due caratteri è data da

y1 y2 y3 Totale
x1 0 9 0 9
x2 4 0 0 4
x3 0 0 7 7
Totale 4 9 7 20

b) Per soddisfare la richiesta di indipendenza tra i due caratteri, è necessario costruire la tabella in
modo che le frequenze assolute congiunte siano pari a n̂ij = ni0 · n0j /N . Equivalentemente,
si potrebbe costruire la tabella in modo tale che le distribuzioni condizionate relative (di X
rispetto a Y , e quindi anche di Y rispetto a X) siano uguali tra loro e quindi uguali alla
corrispondente distribuzione marginale relativa. Una possibile soluzione è data dalla seguente
tabella in cui si ha che le frequenze congiunte nij sono date da ni0 · n0j /N
STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 4

y1 y2 y3 Totale
x1 4 1 7 12
x2 4 1 7 12
x3 8 2 14 24
Totale 16 4 28 48

Si noti, che in tal caso le distribuzioni relative di X condizionate alle modalità di Y sono
uguali tra loro, ed uguali alla corrispondente distribuzione marginale

y1 y2 y3 Marginale di X
x1 0.25 0.25 0.25 0.25
x2 0.25 0.25 0.25 0.25
x3 0.50 0.50 0.50 0.50
Totale 1 1 1 1

cosı̀ come le distribuzioni relative di Y condizionate alle modalità di X sono uguali tra loro,
ed uguali alla alla corrispondente distribuzione marginale

y1 y2 y3 Totale
x1 0.333 0.083 0.583 1
x2 0.333 0.083 0.583 1
x3 0.333 0.083 0.583 1
Marginale di Y 0.333 0.083 0.583 1

Potrebbero piacerti anche