Sei sulla pagina 1di 6
 

Esiste una differenza fra gli studenti universitari che svolgono attività di volontariato e quelli che si dedicano solo allo studio? Una ricerca ha analizzato i dati di 57 studenti che hanno partecipato ad alcune attività di volontariato e di altri 17 studenti che invece non hanno mai svolto servizi di questo genere. Una delle variabili di risposta era una misura dell’importanza data all’amici- zia. I risultati sono riassunti nella seguente tabella:

 

Gruppo

Trattamento

n

media

d.s.

 

1

Volontariato

57

105.32

14.68

2

Nessuna attività

17

96.82

14.26

 

19

- 1

 

Una ricerca effettuata su di un gruppo di studenti delle scuole superiori intendeva valutare eventuali differenze di autostima fra i maschi e le femmine. La variabile di interesse era il punteggio ottenuto con un questionario. I risultati sono riassunti nella seguente tabella:

 

Genere

n

media

d.s.

F

31

55.5161

12.6961

 

M

47

57.9149

12.2649

 

19

- 3

Tabella 16.2

Tempi impiegati per girare completamente una manopola

 

Manopola

Manopola

Manopola

Manopola

Soggetto

per destri

per mancini

Soggetto

per destri

per mancini

1 113

137

14

107

87

2 105

105

15

118

166

3 130

133

16

103

146

4 101

108

17

111

123

5 138

115

18

104

135

6 118

170

19

111

112

7 87

103

20

89

93

8 116

145

21

78

76

9 75

78

22

100

116

10 96

107

23

89

78

11 122

84

24

85

101

12 103

148

25

88

123

13 116

147

19 - 5

27/09/2012

 

La seguente tabella riporta il numero di specie di albero diverse in 12 aree intatte del Borneo e in 9 aree simili disboscate 8 anni prima. Il numero medio di specie d’albero si riduce significativamente in un’area a distanza di 8 anni dalla deforestazione?

 

Intatte

22

18

22

20

15

21

13

13

19

13

19

15

Disboscate

17

4

18

14

18

15

15

10

12

 

Area

n

media

 

d.s.

Intatte

12

17.500

 

3.529

 
 

Disboscate

9

13.667

4.500

 

19

- 2

 

Il

modo in cui strumenti e dispositivi sono progettati

 

influisce sul modo in cui le persone riescono ad utilizzarli. In uno studio è stato chiesto a 25 persone destre di girare una manopola (con la loro mano destra) che muoveva un indicatore. C’erano due strumenti identici, uno per destri (la manopola andava girata in senso orario) ed uno per mancini (la manopola andava girata in senso antiorario). Ciascun soggetto ha usato entrambi gli strumenti secondo un ordine casuale. La tabella che segue riporta i tempi in secondi che ciascun soggetto ha impiegato per girare completamente la manopola. Esiste una differenza significativa fra i tempi medi impiegati per girare le due manopole?

 

19

- 4

 

I

messaggi subliminali possono aiutare gli studenti

 

nell’apprendimento della matematica? In una ricerca per verificare la validità di tale ipotesi 18 studenti sono stati suddivisi casualmente in due gruppi. Il gruppo di trattamento era composto da 10 studenti che leggevano il messaggio “Ogni giorno faccio dei progressi in matematica”, mentre il gruppo di controllo (8 studenti) era sottoposto al messaggio neutro “La gente cammina per strada”. Tutto ciò avveniva mentre gli studenti partecipavano ad un corso di recupero in matematica finalizzato alla preparazione dell’esame. La tabella che segue riporta i risultati ottenuti dagli studenti ad un test per valutare le competenze matematiche prima e dopo il messaggio subliminale.

 

19

- 6

Tabella 17.1 Competenze matematiche prima e dopo il messaggio subliminale. 19 - 7

Tabella 17.1 Competenze matematiche prima e dopo il messaggio

subliminale.

19

- 7

Dati appaiati (due campioni dipendenti)

In

questo tipo di confronto si formano delle coppie

di

soggetti, facendo in modo che gli elementi di

ciascuna coppia siano tra di loro il più simili

possibile. Qualche volta la coppia appaiata è costituita dallo stesso soggetto.

Ad un membro della coppia viene somministrato un

trattamento, mentre al restante soggetto si sommi- nistra l’altro. Nel caso in cui la coppia sia costituita

dallo stesso soggetto (che quindi riceve entrambi i trattamenti) l’ordine di somministrazione dovrebbe essere randomizzato.

19 - 9

Il test t per due campioni dipendenti

La verifica dell’ipotesi nulla che le due medie “vere” siano uguali fra loro deve tenere conto dell’appaiamento. Questo si fa analizzando le n differenze individuali. Dopo aver calcolato le n differenze, si calcola la media e la deviazione standard delle n differenze e su queste si esegue un test t di Student per un campione (H 0 : 0 = 0):

t =

x d 0 s n d
x d
0
s
n
d

Se è vera l’ipotesi nulla (e le differenze sono distribuite in modo normale), questa statistica è una t di Student con n 1 gradi di libertà.

19 - 11

27/09/2012

Problemi con due campioni

Nei problemi con due campioni l’obiettivo dell’in- ferenza è confrontare le risposte nei due trattamenti o confrontare le caratteristiche di due popolazioni.

Abbiamo sempre due campioni separati per ogni trattamento o per ogni popolazione.

19 - 8

Tabella 16.2

Tempi impiegati per girare completamente una manopola

Manopola

Manopola

Manopola

Manopola

Soggetto

per destri

per mancini

Soggetto

per destri

per mancini

1 113

137

14

107

87

2 105

105

15

118

166

3 130

133

16

103

146

4 101

108

17

111

123

5 138

115

18

104

135

6 118

170

19

111

112

7 87

103

20

89

93

8 116

145

21

78

76

9 75

78

22

100

116

10 96

107

23

89

78

11 122

84

24

85

101

12 103

148

25

88

123

13 116

147

 

19

- 10

> destri <- c(113,105,130,101,138,

 

+ 118,87,116,75,96,122,

+ 103,116,107,118,103,

+ 111,104,111,89,78,

 

+ 100,89,85,88)

 

> mancini <- c(137,105,133,108,115,

 

+ 170,103,145,78,107,

+ 84,148,147,87,166,

 

+ 146,123,135,112,93,

 

+ 76,116,78,101,123)

 

> delta <- destri - mancini

 

> test.t1c(dati=delta,mu0=0)

media = -13.32

d.s. = 22.936

es = 4.5872

 

n = 25

t critico = 2.063899

 

Intervallo di confidenza al 95% per la media:

 

da -22.78751 a -3.852485

 

Ipotesi nulla: mu = 0 Test t: -2.903732 p-value = 0.00779151

 
 

19

- 12

>

destri <- c(113,105,130,101,138,

+

118,87,116,75,96,122,

+

103,116,107,118,103,

+

111,104,111,89,78,

+

100,89,85,88)

>

mancini <- c(137,105,133,108,115,

+

170,103,145,78,107,

+

84,148,147,87,166,

+

146,123,135,112,93,

+

76,116,78,101,123)

>

>

test.t2cd(cbind(destri,mancini))

Primo

Secondo campione: media = 117.44 d.s. = 27.26273 n = 25

Differenze

n = 25

campione: media = 104.12

: media = -13.32

d.s. = 15.79641

d.s. = 22.936

n = 25

Test t = 2.903732

Intervallo di confidenza al 95% per la differenza:

p-value = 0.00779151

g.l. = 24

da -22.78751 a -3.852485

19 - 13

Un po’ più formalmente: ( 2 ) ( 2 ) X 1 N , X
Un po’ più formalmente:
(
2 )
(
2 )
X 1
N
,
X
N
,
2
1
1
2
2
H
:
=
Vogliamo verificare l’ipotesi nulla
0
1
2
(rispetto ad una alternativa bilaterale) sulla base
dei risultati ottenuti su due campioni fra loro
indipendenti
19 - 15

x ,s

1

2

1

,n

1

x ,s

2

2

2

,n

2

Il test di significatività

Dal momento che i due campioni sono fra loro indipendenti, anche le due medie campionarie lo sono. Possiamo quindi sfruttare la regola che dice che la varianza della differenza di due variabili casuali indipendenti è uguale alla somma delle due varianze.

2 2

n

1 n

2

19 - 17

(

Var X

1

( Var X 1 X 2 ) ( = Var X 1 ) ( + Var

X

2

)

(

= Var X

1

)

(

+ Var X

2

)

(

Var X

1

( Var X 1 X 2 ) = 1 + 2

X

2

)

=

( Var X 1 X 2 ) = 1 + 2

1

+

2

27/09/2012

Condizioni per il confronto delle medie di due cam- pioni indipendenti

Dobbiamo avere due CCS selezionati da due popolazioni differenti. I campioni devono essere indipendenti; vale a dire che non deve esserci alcun tipo di associazione fra le unità del primo e del secondo campione. Possiamo anche avere un unico elenco di soggetti che, completamente a caso, dividiamo in due elenchi (due campioni).

Misuriamo la stessa variabile per entrambi i campioni.

In entrambe le popolazioni la distribuzione è normale. Le medie e le deviazioni standard nelle popolazioni sono sconosciute. In pratica, è sufficiente che le distribuzioni abbiano una forma simile e che i dati non presentino degli outlier eccessivi.

19 - 14

Il test di significatività

Il test per verificare l’ipotesi nulla sarà un rappor-

to in cui al numeratore figura una stima “grezza”

dell’evidenza contro l’ipotesi nulla e al denomina- tore l’errore standard della quantità posta al numeratore.

Numeratore

X X 1 2 ( ) Var X X 1 2
X
X
1
2
(
)
Var X
X
1
2

Denominatore

19 - 16

Il test di significatività Potremo quindi verificare l’ipotesi nulla che le medie delle due “popolazioni”
Il test di significatività
Potremo quindi verificare l’ipotesi nulla che le
medie delle due “popolazioni” sono uguali fra loro
ricorrendo ad un test z:
H
:
=
=
0
0
1
2
1
2
(
x
x
)
0
1
2
z =
2
2
1
+
2
n
n
1
2
19 - 18

Il test di significatività

Se le varianze “vere” non sono conosciute, possia- mo sostituirle con due stime “adeguate” (le rispet- tive varianze campionarie); avremo in questo mo- do un test la cui distribuzione sotto l’ipotesi nulla però non è né z t di Student:

w =

( x x ) 0 1 2 2 2 s s 1 + 2 n
(
x
x
)
0
1
2
2
2
s
s
1
+
2
n
n
1
2

19 - 19

Intervallo di confidenza per la differenza fra due medie

È possibile calcolare un intervallo di confidenza

(di livello C) per la differenza fra le due medie vere

ricorrendo alla formula

2 2 s s ( 2 x x ) 1 ± t + 1 2
2
2
s
s
(
2
x
x
)
1
±
t
+
1
2
, C
n
n
1
2

dove il valore t ,C si desume dalle tavole della distribuzione t di Student con gradi di libertà dati dalla formula della diapositiva precedente.

19 - 21

Il test di significatività

È possibile verificare l’ipotesi nulla che le medie

delle due “popolazioni” sono uguali fra loro ricorrendo ad un test z: H : =
delle due “popolazioni” sono uguali fra loro
ricorrendo ad un test z:
H
:
=
=
0
0
1
2
1
2
(
x
x
)
0
1
2
z =
2
2
+
n
n
1
2

19 - 23

27/09/2012

Il test di significatività

La distribuzione esatta della statistica w dipende dai valori veri delle varianze nelle due popolazioni. Se, però, sia n 1 sia n 2 sono maggiori di 4, è possi- bile approssimare molto accuratamente la distri- buzione della statistica w utilizzando la distribu- zione t di Student con un numero (generalmente

non intero) di gradi di libertà :

w utilizzando la distribu- zione t di Student con un numero (generalmente non intero) di gradi

19 - 20

Semplifichiamo il problema: ( 2 ) ( 2 ) X N , X N ,
Semplifichiamo il problema:
(
2 )
(
2 )
X
N
,
X
N
,
1
1
2
2
H
:
=
Vogliamo verificare l’ipotesi nulla
0
1
2
(rispetto ad una alternativa bilaterale) sulla base
dei risultati ottenuti su due campioni fra loro
indipendenti:
19 - 22

x ,s

1

2

1

,n

1

x ,s

2

2

2

,n

2

Il test di significatività

Se la varianza “vera” non è conosciuta, possiamo sostituirla con una stima “adeguata”; avremo in questo modo un test la cui distribuzione sotto l’ipotesi nulla è t di Student (con n 1 +n 2 2 ) gradi di libertà):

t =

( x x ) 0 1 2 2 2 s s p p + n
(
x
x
)
0
1
2
2
2
s
s
p
p
+
n
n
1
2

19 - 24

La stima della varianza congiunta (pooled)

La stima della varianza congiunta è calcolata fa- cendo la media ponderata delle stime delle due varianze, impiegando come pesi i rispettivi gradi di libertà:

 

n

1

 

1

2

+

 

n

2

1

(

n

1

1

)

+

(

n

2

1

)

s

1

(

n

1

1

)

+

(

n

2

1

)

 

(

n

1

)

 

s

2

+

(

n

2

1

)

 

s

2

 
 

2

s p

=

 

1

 

1

2

 

n

1

+

n

2

2

 

2

2

s p

=

s

2

19 - 25

Esempio 17.4 (pag. 430) - Il volontariato e l’amicizia

> test.t2ci(media1=105.32,ds1=14.68,n1=57,

media2=96.82,ds2=14.26,n2=17)

Primo

campione: media = 105.32 d.s. = 14.68

n = 57

Secondo campione: media = 96.82

d.s. = 14.26

n = 17

Varianza congiunta = 212.8013 ES = 4.031263

Test t = 2.108520

Intervallo di confidenza al 95% per la differenza:

p-value = 0.03846607

g.l. = 72

da 0.4638239 a 16.53618

Errore standard della differenza = 3.967665 Test di Welch = 2.142318 g.l. = 26.94370 p-value = 0.04136102 Intervallo di confidenza al 95% per la differenza:

da 0.3582273 a 16.64177

19 - 27

Esercizio 17.13 (pag. 437) – L’autostima degli studenti

>

test.t2ci(media1=55.5161,ds1=12.6961,n1=31,

+

media2=57.9149,ds2=12.2649,n2=47)

Primo

campione: media = 55.5161 d.s. = 12.6961

n = 31

Secondo campione: media = 57.9149 d.s. = 12.2649

n = 47

Varianza congiunta = 154.6764 ES = 2.877594

Test t = 0.833613

Intervallo di confidenza al 95% per la differenza:

g.l. = 76 p-value = 0.4071114

da -8.130026 a 3.332426

Errore standard della differenza = 2.898327 Test di Welch = 0.8276499 g.l. = 62.78457 p-value = 0.4110037 Intervallo di confidenza al 95% per la differenza:

da -8.191033 a 3.393433

19 - 29

27/09/2012

Intervallo di confidenza per la differenza fra due medie

È possibile calcolare un intervallo di confidenza (di livello C) per la differenza fra le due medie vere ricorrendo alla formula

2 2 s s ( x x ) p p ± t + 1 2
2
2
s
s
(
x
x
)
p
p
±
t
+
1
2
, C
n
n
1
2

dove il valore t ,C si desume dalle tavole della

distribuzione t di Student con = n 1 +n 2 2 gradi di libertà.

19 - 26

Esercizio 17.8 (pag. 432) – La deforestazione della foresta pluviale

> Intatte

> Disboscate <- c(17,4,18,14,18,15,15,10,12)

> gruppo

> test.t2ci(dati=c(Intatte,Disboscate),gruppo=gruppo)

<- c(22,18,22,20,15,21,13,13,19,13,19,15)

<- c(rep(1,12),rep(2,9))

Primo

campione: media = 17.5 d.s. = 3.5291

n = 12

Secondo campione: media = 13.66667

d.s. = 4.5

n = 9

Varianza congiunta = 15.73684 ES = 1.749269

Test t = 2.191392

Intervallo di confidenza al 95% per la differenza:

g.l. = 19 p-value = 0.04108753

da 0.1720715 a 7.494595

Errore standard della differenza = 1.813251 Test di Welch = 2.114067 g.l. = 14.79344 p-value = 0.05191557 Intervallo di confidenza al 95% per la differenza:

da -0.03622486 a 7.702892

19 - 28

Esercizio 17.27 (pag. 446) - I progressi nella matematica

> prima <- c(18,18,21,18,18,20,23,23,21,17,

18,24,20,18,24,22,15,19)

> dopo <- c(24,25,33,29,33,36,34,36,34,27,

29,29,24,26,38,27,22,31)

> gruppo <- c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2)

> delta <- dopo-prima

> test.t2ci(dati=delta,gruppo=gruppo)

Primo

campione: media = 11.4

d.s. = 3.169297

n = 10

Secondo campione: media = 8.25

d.s. = 3.693624

n = 8

Varianza congiunta = 11.61875 ES = 1.616855

Test t = 1.948227

Intervallo di confidenza al 95% per la differenza: da -

0.2775786 a 6.577579

g.l. = 16

p-value = 0.06914983

Errore standard della differenza = 1.646147 Test di Welch = 1.913559 g.l. = 13.91873 p-value = 0.076469 Intervallo di confidenza al 95% per la differenza: da -

0.3825702 a 6.68257

19 - 30

Confronto fra più di due medie Supponiamo di voler verificare l’ipotesi nulla H : =
Confronto fra più di due medie
Supponiamo di voler verificare l’ipotesi nulla
H
:
=
=
=
=
0
1
2
3
k
Potremmo confrontare fra loro a coppie tutte le
medie e rifiutare l’ipotesi nulla se almeno un test
risulta significativo.
Sappiamo però che questa procedura non va bene
a causa dei problemi che si incontrano quando si
fanno confronti multipli.
È necessario sviluppare una procedura in grado
di verificare con un unico test l’ipotesi nulla.
Questo test prende il nome di test F e la
procedura statistica si chiama analisi della
varianza.
19 - 31

27/09/2012