Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
STATISTICA
Prof. Marco Minozzo
Esercizio 1
Tipo di occupazione
Agricoltura 445/8406 = 0.0529
Industria 2859/8406 = 0.3401
Altri servizi 5102/8406 = 0.6069
Essendo queste distribuzioni non tutte uguali tra loro, possiamo affermare che esiste dipen-
denza tra i due caratteri.
c) Per il calcolo degli indici richiesti, si consideri la seguente tabella con le frequenze teoriche di
indipendenza ottenute come n̂ij = ni0 · n0j /N :
dove, ad esempio, 89.625 = 1693 · 445/8406. Da qui si ricava l’indice χ2 che risulta pari a
266.645. L’indice C di dipendenza normalizzato di Cramér in questo caso risulta pari a
√ √
χ2 1 266.645 1
C= · = · = 0.126,
N k 8406 2
dove k = min{s−1; t−1}. L’indice C indica una dipendenza bassa tra il tipo di occupazione
(Y ) e la regione (X).
STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 2
Esercizio 2
a) La distribuzione di frequenza assoluta marginale della risposta al test è pari a: 25, 36, 31, 20. I
valori sono ottenuti sommando le frequenze assolute corrispondenti ai tre gruppi; ad esempio,
25 = 14 + 8 + 3, e cosı̀ via. Quindi, la distribuzione marginale relativa e le distribuzioni
condizionate relative della risposta al test sono date da
b) Le distribuzioni condizionate relative del tipo di patologia (gruppo) data la risposta al test sono
le seguenti
Ovviamente, essendo le distribuzioni condizionate relative non tutte uguali tra loro (“per riga”
o “per colonna”), c’è dipendenza tra i caratteri X ed Y .
c) Per una tabella di dimensione 3 righe (ovvero con 3 modalità per X) per 4 colonne (ovvero con
4 modalità per Y ) ci può essere perfetta dipendenza di X da Y , ma non di Y da X.
(nij − n̂ij )2
n̂ij
2.0187 0.2400 0.1013 1.7623
0.6876 2.7989 0.1244 0.7714
0.6075 3.3426 0.0060 10.4167
22.8776
dove n̂ij = ni0 · n0j /N . Quindi, l’indice di dipendenza χ2 è pari a 22.8776. L’indice C di
dipendenza normalizzato di Cramér risulta pari a
√
22.8776 1
C= · = 0.3196.
112 2
Secondo questo indice, nella tabella c’è un grado di dipendenza intermedio.
Esercizio 3
Esercizio 4
a) Nel caso di dipendenza perfetta tra i due caratteri, la distribuzione delle frequenze nelle celle
della tabella deve essere tale per cui la realizzazione di una modalità di uno dei due caratteri
implica l’esatta conoscenza della modalità dell’altro carattere. Ciò significa, ad esempio, che,
nel caso di perfetta dipendenza di X da Y e contemporaneamente di Y da X, per ogni riga
e per ogni colonna della tabella vi sarà una sola cella con frequenza congiunta diversa da 0;
le rimanenti frequenze congiunte saranno tutte pari a 0. Considerando N = 20, una possibile
tabella compatibile con la richiesta di dipendenza perfetta tra i due caratteri è data da
y1 y2 y3 Totale
x1 0 9 0 9
x2 4 0 0 4
x3 0 0 7 7
Totale 4 9 7 20
b) Per soddisfare la richiesta di indipendenza tra i due caratteri, è necessario costruire la tabella in
modo che le frequenze assolute congiunte siano pari a n̂ij = ni0 · n0j /N . Equivalentemente,
si potrebbe costruire la tabella in modo tale che le distribuzioni condizionate relative (di X
rispetto a Y , e quindi anche di Y rispetto a X) siano uguali tra loro e quindi uguali alla
corrispondente distribuzione marginale relativa. Una possibile soluzione è data dalla seguente
tabella in cui si ha che le frequenze congiunte nij sono date da ni0 · n0j /N
STATISTICA (Dispense a cura di Marco Minozzo e Annamaria Guolo) 4
y1 y2 y3 Totale
x1 4 1 7 12
x2 4 1 7 12
x3 8 2 14 24
Totale 16 4 28 48
Si noti, che in tal caso le distribuzioni relative di X condizionate alle modalità di Y sono
uguali tra loro, ed uguali alla corrispondente distribuzione marginale
y1 y2 y3 Marginale di X
x1 0.25 0.25 0.25 0.25
x2 0.25 0.25 0.25 0.25
x3 0.50 0.50 0.50 0.50
Totale 1 1 1 1
cosı̀ come le distribuzioni relative di Y condizionate alle modalità di X sono uguali tra loro,
ed uguali alla alla corrispondente distribuzione marginale
y1 y2 y3 Totale
x1 0.333 0.083 0.583 1
x2 0.333 0.083 0.583 1
x3 0.333 0.083 0.583 1
Marginale di Y 0.333 0.083 0.583 1