Sei sulla pagina 1di 19

Confronto tra medie

Siamo interessati al confronto tra due gruppi ed in particolare a stabilire


se questi provengono da una stessa popolazione o da due popolazioni
diverse.
Si distingue due diverse situazioni:
- Dati appaiati: i due campioni sono dipendenti, selezionati in base ad
un insieme di caratteristiche comuni. (es. due misure sullo stesso
stesso soggetto). NB le dimensioni dei due campioni sono uguali!
- Dati indipendenti: i due campioni sono selezionati in modo
indipendente l’uno dall’altro.

1
Esempio 1.
Un gruppo di 7 soggetti viene sottoposto a un trattamento per
l’ipertensione. Si misura la pressione diastolica (minima) prima e dopo
un certo numero di giorni di trattamento.
Si vuole valutare se il trattamento ha effetto

Soggetto 1 2 3 4 5 6 7
prima 118 100 108 97 120 102 104
dopo 100 105 89 78 96 97 88

2
Esempio 2.
In uno studio clinico volto a valutare l’efficacia di un certo trattamento
vengono arruolati 14 pazienti, che vengono divisi in modo casuale in
due gruppi. Il primo gruppo di 8 soggetti viene sottoposto a un
trattamento per l’ipertensione, mentre il secondo gruppo di 6 soggetti
viene sottoposto a placebo. Si misura la differenza (prima-dopo) di
pressione diastolica prima e dopo un certo numero di giorni di
trattamento.
Si vuole valutare se il trattamento ha effetto

Trattati 18 -5 19 19 24 5 16 -2
placebo 7 12 -4 16 -16 15

3
• 
Confronto tra medie – Dati appaiati
Dati due campioni di dimensione n, si considerano, per ciascun record
(soggetto), le differenze .

Assunzione: le differenze sono tratte da una distribuzione normale con


media e varianza .

4
•Confronto
  tra medie – Dati appaiati
Procedura:
- Calcolo la media delle differenze

- Calcolo la varianza campionaria delle differenze

- Calcolo l’errore standard della media delle differenze

- Calcolo la statistica test

5
•Confronto
  tra medie – dati appaiati
Eseguo il test di ipotesi secondo la tabella seguente:
Test a due code:

Rifiuto se
o

Test a una coda:

Rifiuto se

6
Esempio 1.
Un gruppo di 7 soggetti viene sottoposto a un trattamento per
l’ipertensione. Si misura la pressione diastolica (minima) prima e dopo
un certo numero di giorni di trattamento.
Si vuole valutare se il trattamento ha effetto

Calcoliamo le differenze, ad esempio prima-dopo


Soggetto 1 2 3 4 5 6 7
prima 118 100 108 97 120 102 104
dopo 100 105 89 78 96 97 88
Diff=prima-dopo 18 -5 19 19 24 5 16

7
• 
Esempio 1
Procedura:
- Calcolo la media delle differenze

- Calcolo la varianza campionaria delle differenze

- Calcolo l’errore standard della media delle differenze

- Calcolo la statistica test

8
•Esempio
  1
In questo caso sono interessato a vedere se il trattamento ha un effetto,
quindi se il trattamento abbassa la pressione.
Avendo definito la differenza=prima-dopo, voglio provare che
differenza>0. Fissiamo
Test a una coda:

Rifiuto se

Devo quindi confrontare con sulla tavola.


, quindi rifiuto .
I dati mostrano evidenza che il trattamento abbassa la pressione.
9
•Confronto
  tra medie – Dati indipendenti
Assunzione:
Dati due campioni di dimensione e rispettivamente, provenienti da
popolazioni gaussiane con media () e varianza .
Si distinguono due casi:
- Varianze omogenee (omoschedasticità)
- Varianze non omogenee (eteroschedasticità)

Per verificare l’ipotesi di omoschedasticità è possibile effettuare un test


di omogeneità delle varianze (F-Fisher).

10
•Confronto
  tra medie – Dati indipendenti – Test di omogenità (F-Fisher)
Procedura:
- Calcolo le medie campionarie nei due gruppi
- Calcolo le varianze campionarie nei due gruppi
- Si determina quale tra è la varianza campionaria maggiore, ed I
rispettivi gradi di libertà. Supponiamo, ad esempio che
- Statistica test:
Test a due code, livello α:

Rifiuto di se

11
Esempio 2.
In uno studio clinico volto a valutare l’efficacia di un certo trattamento
vengono arruolati 14 pazienti, che vengono divisi in modo casuale in due
gruppi. Il primo gruppo di 8 soggetti viene sottoposto a un trattamento
per l’ipertensione, mentre il secondo gruppo di 6 soggetti viene
sottoposto a placebo. Si misura la differenza (prima-dopo) di pressione
diastolica prima e dopo un certo numero di giorni di trattamento.
Si vuole valutare se il trattamento ha effetto

Trattati 18 -5 19 19 24 5 16 -2
placebo 7 12 -4 16 -16 15

12
• 
Esempio 2 – Test di omogenità (F-Fisher)
Calcolo le medie campionarie nei due gruppi 5
Calcolo le varianze campionarie nei due gruppi
Si determina quale tra è la varianza campionaria maggiore, ed I
rispettivi gradi di libertà. I
Statistica test:
Test a due code, livello α=0.05:

Rifiuto di se

Quindi non rifiuto l’ipotesi nulla

13
•Confronto
  tra medie – Dati indipendenti – varianze omogenee
- Calcolo le medie campionarie nei due gruppi
- Calcolo le varianze campionarie nei due gruppi
- Calcolo la varianza campionaria congiunta (pooled)

- Calcolo l’errore standard della differenza tra le medie

- Calcolo la statistica test

14
•Confronto
  tra medie – dati indipendenti – varianze omogenee
Eseguo il test di ipotesi secondo la tabella seguente:
Test a due code:

Rifiuto se
o

Test a una coda:

Rifiuto se

15
Esempio 2.
In uno studio clinico volto a valutare l’efficacia di un certo trattamento
vengono arruolati 14 pazienti, che vengono divisi in modo casuale in due
gruppi. Il primo gruppo di 8 soggetti viene sottoposto a un trattamento
per l’ipertensione, mentre il secondo gruppo di 6 soggetti viene
sottoposto a placebo. Si misura la differenza (prima-dopo) di pressione
diastolica prima e dopo un certo numero di giorni di trattamento.
Si vuole valutare se il trattamento ha effetto

Trattati 18 -5 19 19 24 5 16 -2
placebo 7 12 -4 16 -16 15

16
• 
Esempio 2 – confronto tra medie – varianze omogenee
Calcolo le medie campionarie nei due gruppi 5
Calcolo le varianze campionarie nei due gruppi
Calcolo la varianza campionaria congiunta (pooled)

Calcolo l’errore standard della differenza tra le medie

- Calcolo la statistica test

17
•Esempio
  2 – confronto tra medie – varianze omogenee
Eseguiamo, per esempio, un test a due code
Test a due code:

Rifiuto se
o

Nel nostro caso , mentre


Quindi non possiamo rifiutare l’ipotesi nulla.

18
Confronto tra medie – Dati indipendenti – varianze non omogenee
In questo caso è necessario utilizzare un t-test modificato (test di
Cochran-Cox).

19