Sei sulla pagina 1di 16

Metodi quantitativi 13

Il test del chi-quadro


Consideriamo una analisi sugli orientamenti di voto:

Centro-DX Centro-Snstr Totali

Uomini 45 49 94
Donne 71 63 134
Totali 116 112 228

che porta alla tabella condizionata (in termini percentuali):


Il numero teorico di uomini che votano centro-destra in ipotesi di
indipendenza è:

94 116 (94)(116)
n t
11  228   47.8
228 228 228

che porta alla tabella:


Centro-DX Centro-Snstr Totali

Uomini 47.8 46.2 94

Donne 68.2 65.8 134

Totali 116 112 228


Tabella empirica:

Centro-DX Centro-Snstr Totali

Uomini 45 49 94
Donne 71 63 134
Totali 116 112 228

Tabella teorica:

Centro-DX Centro-Snstr Totali

Uomini 47.8 46.2 94


Donne 68.2 65.8 134
Totali 116 112 228

Come misurare la differenza?


µ2 (45  47.8)2 (49  46.2)2 (71  68.2)2 (63  65.8)2
1     
47.8 46.2 68.2 65.8
 0.068  0.070  0.115  0.119  0.372.

Problema: come interpretare il valore 0.372?

E’ il risultato di uno stimatore, una variabile casuale quindi, detto


chi-quadro con 1 grado di libertà.

1) Se conosciamo il p-value sappiamo immediatamente quanto verosimile


è l’ipotesi di indipendenza.
2) Le regioni di accettazione e rifiuto possono essere calcolate dalle tavole del
chi-quadro.
Come leggere questa tabella:

Gdl 0.25 0.10 0.05 0.025 0.01 0.005 0.001


1 1.32 2.71 3.84 5.02 6.63 7.88 10.83
Pensando al valore di 0.93 calcolato in precedenza e considerando:

Pr(12  1.32)  0.250


I valori che andranno a definire le regioni di accettazione e di
rifiuto sono:
1) Con significatività al 5%

Pr(12  3.84)  0.05

2) Con significatività all’1%

Pr(12  6.63)  0.01


Abbiamo due tabelle, la prima contiene i dati empirici:

A B Totali

Totali

La seconda i dati teorici:

A B Totali

Totali
La stima della distanza chi-quadro tra le due tabelle è:

(n11  n11) (n21  nt21)2 (n12  n12


t 2 t 2
) (n22  nt22)2
ˆ 
2
1 t
  
n11 nt21 t
n12 nt22

Si osservi che ciascun termine è:

1)

2)

3)
I valori soglia che determinano la regione di accettazione e quella
di rifiuto sono:

u = 3.84 se il livello di confidenza è del 95%.


u = 6.63 se il livello di confidenza è del 99%.

Nell’esempio precedente:
Salire con la dimensione: in generale le tabelle a due vie possono
contenere più di due righe o colonne.

Cinema TV Libro
Nord 23 45 8 76

Centro 31 39 13 83
Sud 14 29 16 59

68 113 37 218
Cinema TV Libro

Nord 0,30 0,59 0,11 1

Centro 0,37 0,47 0,16 1

Sud 0,24 0,49 0,27 1


Tabella empirica:
Cinema TV Libro

Nord 23 45 8 76

Centro 31 39 13 83

Sud 14 29 16 59

68 113 37 218

Tabella teorica in ipotesi di indipendenza:


Cinema TV Libro

Nord 23,7 39,4 12,9 76

Centro 25,9 43,0 14,1 83

Sud 18,4 30,6 10,0 59

68 113 37 218
Nel caso con H righe e K colonne:

K H (nij  nitj)2
ˆ2
(K  1)(H  1)  
j1 i 1 nitj
Nel caso precedente:

K=3
H=3
g=

ˆ42  8.86

Dalle tavole: