Sei sulla pagina 1di 28

I Facoltà di Medicina e Chirurgia

CORSO DI STATISTICA 2
Dott.sa Laura Perrotta
- Lezione 8 - Inferenza statistica: la verifica delle ipotesi -

A.A. 2006/2007
Nei processi logici della ricerca biomedica è prevista la
formulazione e la verifica di ipotesi in base ai risultati
ottenuti su gruppi ristretti di popolazioni.

Le ipotesi formulate vengono verificate, mediante tecniche


opportune, calcolando la probabilità di commettere un
errore nel considerare validi per tutta la popolazione i
risultati osservati nel campione.

Più esattamente, si determina la probabilità di ottenere i


medesimi risultati sperimentali con campioni estratti in
modo casuale da un’unica popolazione, per valutare se le
differenze siano giustificate dal campionamento casuale e
quindi non imputabili ai diversi trattamenti.
Le principali aree di applicazione dell’inferenza statistica
sono due:

 La stima dei parametri


Esempio: si vuole stimare il tempo medio di recupero dall’effetto
dell’anestesia in un gruppo di pazienti operati di appendicite

 La verifica delle ipotesi


Esempio: si vuole determinare se un nuovo prodotto farmaceutico
è più efficace nel trattamento di una certa affezione rispetto ad un
prodotto tradizionale.
L’ipotesi viene formulata dal ricercatore in base a
considerazioni di natura intuitiva o in base a
informazioni parziali in suo possesso.

Per indica una ipotesi statistica si usa la lettera H

H0 è l’ipotesi di base o nulla ed indica l’ipotesi


che verrà sottoposta a verifica

H1 è l’ipotesi alternativa

Una volta formulate le ipotesi statistiche, il ricercatore


vuole stabilire se, sulla base dei risultati campionari, si
debba accettare ad un prefissato livelli di probabilità,
l’ipotesi di base (H0)oppure rifiutarla semplicemente (ne
H0 ne H1) o in favore di quella alternativa (H1).
IL TEST STATISTICO
 Sulla base di un campione, per quanto numeroso esso
sia, non è possibile, in sostanza, stabilire con certezza
se un ipotesi è vera o è falsa.

 Un ricercatore può trarre conclusioni, attraverso l’uso di


test statistici, solo in termini probabilistici.

 Il test statistico è una regola di decisione che consente


al ricercatore, in base ai risultati campionari, di accettare
o rifiutare, in termini probabilistici, l’ipotesi di base.

 Se ci si basa sui risultati campionari la regola di


decisione è soggetta agli errori casuali di
campionamento
 Considerato H l’insieme delle possibili ipotesi, ad ogni ipotesi è
associato uno spazio campionario.

 Lo spazio campionario si bipartisce in due sottoinsiemi


complementari A ed R
 A = area di accettazione
 R = area di rifiuto

in base ad un criterio stabilito che dipenderà da una probabilità α


fissata a priori

 Ottenuto il risultato del test,


 se tale valore appartiene alla zona di accettazione si riterrà
valida, al livello 1 – α, l’ipotesi di base H0

 se tale valore appartiene alla zona di rifiuto si riterrà valida,


con probabilità che indicheremo con 1 – β, l’ipotesi
alternativa H1
Rappresentazione grafica dello spazio campionario:
sulle code è localizzata l’area di rifiuto al livello di significatività α = 5%

Tenendo ben presente che accanto ad ogni test utilizzato va


precisata la probabilità α di rifiutare un ipotesi vera e la
probabilità di accettarne una falsa
Nel processo di verifica di un ipotesi di base si possono
commettere due tipi di errore:
L’errore di tipo I si commette quando si rifiuta l’ipotesi zero
mentre in realtà essa è vera e ad essa è associata la
probabilità α
L’errore di tipo II si commette quando si accetta l’ipotesi di
base pur essendo falsa, con probabilità β

TABELLA DEGLI ERRORI DI TIPO I E II


SI ACCETTA Ho SI RIFIUTA Ho

Ho VERA Conclusione corretta Errore di tipo I


(probabilità 1 – α) (probabilità α)
Ho FALSA Errore di tipo II Conclusione corretta
(probabilità β) (probabilità 1 – β)
β rappresenta la probabilità di accettare per errore
l’ipotesi di base
1 – β rappresenta la probabilità di rifiutare l’ipotesi di base
quando è falsa e quindi 1 – β misura la potenza del
test (cioè indica la capacità di un test di cogliere una
differenza tra campioni)

α rappresenta il livello di significatività e indica la


dimensione della zona di rifiuto:
• quanto più α risulta elevata, tanto più grande diviene la regione di rifiuto e
tanto maggiore diventa la probabilità di commettere un errore di tipo 1;
• riducendo la zona di rifiuto però si accresce la probabilità β di commettere
un errore di secondo tipo (ossia la probabilità di ritenere valida l’ipotesi
zero quando è falsa)

Per ridurre la probabilità di errore, sia di primo e sia di


secondo tipo, si preferisce fissare il livello di
significatività del test ad un livello basso
α = 0.05 e α = 0.01 (rispettivamente α = 5% e α = 1%)
In termini operativi, si individuano nella distribuzione teorica
(solitamente si utilizza la distribuzione normale) le due aree (o zone) di
valori: una di accettazione e una di rifiuto
 La zona di accettazione risulta costituita dall’insieme di
valori per i quali i risultati si possono considerare accettabili
(significativi).
 La zona di rifiuto, complementare alla precedente e
costituita da quei valori che permettono di rifiutare l’ipotesi
zero e di conseguenza di prendere in considerazione l’ipotesi
alternativa.
 Supponiamo che in media un gruppo di pazienti affetti
da raffreddore, utilizzando un farmaco tradizionale A,
impieghi 7 giorni per guarire completamente.
 Si vuole verificare se il nuovo farmaco B è più efficace
di quello tradizionale.
 Il modello statistico applicato in questo caso è il
seguente:
 Consideriamo due popolazioni di individui affetti da
raffreddore:
• quelli a cui è stato somministrato il farmaco A e

• quelli a cui è stato somministrato il farmaco B.

 Sappiamo che il tempo medio di guarigione della


prima popolazione è di circa 7 giorni  A =7
PROCEDIMENTO DELLA VERIFICA
DELLE IPOTESI
 Sulla base di un campione estratto dalla popolazione a
cui è stato somministrato il farmaco B, si formula un
ipotesi di base che la media  B sia minore della  A = 7
H 0 :  A  B
 L’ipotesi viene sottoposta a test statistico
 Dal risultato ottenuto da test si traggono le possibili
conclusioni:
 o si accetta l’ipotesi di base
 o si rifiuta l’ipotesi di base ed eventualmente si
accetta l’ipotesi alternativa
H1 :  A   B
Nello studio inferenziale vengono utilizzate due
tipologie di test:

 I test parametrici:
test di confronto per misure quantitative
(differenze tra medie di campioni)

 I test non parametrici:


test di confronto per misure qualitative e quantitative
(test del Chi – Quadrato)
TEST DI CONFRONTO PER MISURE
QUANTITATIVE

 DIFFERENZA TRA MEDIE DI CAMPIONI


INDIPENDENTI

 DIFFERENZA TRA MEDIE DI CAMPIONI


DIPENDENTI
DIFFERENZA TRA MEDIE DI CAMPIONI
INDIPENDENTI
Il processo inferenziale può essere ampliato per permettere un
confronto statistico dei valori osservati in due (più) campioni (o gruppi).
Per il confronto tra le medie di due gruppi, ovvero quando ci si chiede
se tra la media di un gruppo A e quella di un gruppo B esiste una
differenza significativa, la statistica adatta allo scopo è il test
parametrico della t-student, basato sulle stime campionarie delle medie
e delle loro deviazioni standard.
x A  xB x A  xB
t 
ES ( x A  xB )  (x A  x A ) 2   ( xB  xB ) 2 N A  N B

N A  NB  2 N A  NB
E’ possibile utilizzare il test t in presenza delle seguenti condizioni:
I due campioni sono distribuiti hanno una distribuzione normale;le
osservazioni sono indipendenti; la varianza dei due campioni non è
molto diversa
ESEMPIO
 Si voglia determinare se tra le fasce di età 20-30 anni
(gruppo A) e 40-50 (gruppo B) nei maschi di una
determinata area geografica esistono differenze per una
data concentrazione ormonale.
 Estratti casualmente dalle rispettive popolazioni di
riferimento i due campioni.
 I dati ottenuti risultano i seguenti:
GRUPPO n (numerosità campionaria) Media Devianza
A: 20-30 20 66.10 1402.01
B: 40-50 25 75.76 2783.76

 Si verifichi l’ipotesi zero che i due campioni provengano da


una stessa popolazione H 0 :  A   B
cioè le medie campionarie rappresentano due stime di una
stessa media e la loro differenza è da imputare
esclusivamente alla casualità della scelta campionaria.
ESEMPIO
 Calcoliamo il test t di student:

66.10  75.76
t  3.26
1402.01  2783.76 20  25

20  25  2 20  25

 Dalla tabella dei valori critici del t-Student:


il valore della t corrispondente al livello di significatività
α = 0.05 con 43 g.d.l. è uguale a 2.02, pertanto
possiamo concludere che c’è differenza significativa di
concentrazione ormonale tra le due fasce di età
(rifiutiamo l’ipotesi Ho poiché il risultato della statistica è
superiore al valore critico e quindi ricade nella zona di
rifiuto).
DIFFERENZA TRA MEDIE DI CAMPIONI
DIPENDENTI
Quando c’è dipendenza tra campioni, cioè ogni osservazione di un campione è
accoppiata con una sola osservazione di un altro campione (appaiamento dei
dati), il test che si utilizza è la t di student per dati appaiati.
La situazione più frequente riguarda misurazioni effettuate sugli stessi soggetti
prima e dopo un trattamento.
Nel caso di confronti tra campioni dipendenti il test di riferimento è il t di student
organizzato in modo da eliminare la variabilità individuale.

d d è la media delle differenze campionarie


t  n
sd sd è la stima delle deviazioni standard delle differenze

n è il numero delle differenze


I TEST NON PARAMETRICI
 si possono applicare qualunque si la natura del
carattere

 sono test meno potenti


rispetto ai test di cui si conosce la distribuzione
dalla quale è stato estratto il campione e perciò si è
indetti a commettere con maggiore probabilità un
errore di seconda specie (accettare l’ipotesi di base
quando questa è falsa)

 il più utilizzato è il test del chi-quadrato


TEST DI CONFRONTO PER MISURE
QUALITATIVE

Test del CHI- QUADRATO per campioni indipendenti

 si utilizza quando si vuole stabilire se due percentuali


differiscono oltre la variabilità del caso
 è basato sulle frequenze assolute del riscontro
sperimentale e le frequenza teoriche nell’ipotesi di una
loro distribuzione casuale
 si usa prevalentemente per variabili qualitative e può
essere anche usato per variabili quantitative
 per il test si utilizzano esclusivamente le frequenze
assolute
IL TEST DEL  2

 Le frequenze assolute con cui si presenta il carattere vengono


rappresentate in tabelle (di contingenza) a doppia entrata.
 Il test si basa sulla differenza tra le frequenze assolute osservate
nell’esperimento e le frequenze attese ricavate come proporzione
dei risultati complessivi.
 Il test del chi – quadro nella sua forma più semplice è
(O  A) 2
2  
A
o O sono le frequenze osservate
o A sono le frequenze attese
o ∑ riguarda la somma di tutte le caselle della tabella di
contingenza determinate da m modalità di riga ed n modalità di
colonna
 Nel caso di tabelle 2 x 2 è opportuno applicare la correzione di Yates
per la continuità
( O  A  0.5) 2
 
2

A
TAVOLA DEI VALORI
CRITICI DEL
CHI-QUADRATO

 La famiglia di distribuzioni
del chi-quadrato dipende dai
gradi di libertà

 Il numero dei gradi di


libertà si ottiene in base al
numero di righe m e colonne
n della tabella di contingenza
(quindi delle rispettive
modalità delle variabili) come
G.d.L = (m – 1) * (n – 1)
Esempio 1

In una sperimentazione condotta su 115 pazienti per


valutare due trattamenti riabilitativi si è riscontrato un
miglioramento nell’86% dei casi estratti con una nuova
tecnica e nel 66% dei trattati con una tecnica tradizionale.

I dati si esprimono chiaramente a vantaggio della nuova


tecnica, ma il risultato ha significato solo per i casi
sperimentali o può essere estrapolato a tutti i pazienti con
quella esigenza riabilitativa?
Occorre un confronto statistico tra le due percentuali,
ricavate da un variabile qualitativa (migliorati,non migliorati)
Migliorati Non migliorati Totale
Tecnica nuova 50 8 58
Tecnica tradizionale 38 19 57
Totale 88 27 115

Si pone l’ipotesi di base che le percentuali di migliorati sono uguali


nei due gruppi
Quanto più è grande la differenza tra i valori osservati e i valori
attesi, tanto più aumenta la probabilità di rifiutare l’ipotesi di base
La frequenza attesa assoluta di migliorati con la nuova tecnica si
può calcolare tramite la proporzione

58  88
A : 58  88 : 115 A  44,38
115
Il calcolo delle frequenze attese si effettua semplicemente, per
ogni casella, moltiplicando i corrispondenti totali di riga e di
colonna e dividendo per il totale generale.
Tale procedimento si applica per tutte le caselle dalla tabella di
contingenza

Frequenze Migliorati Non Totale Frequenze Migliorati Non Totale


osservate O migliorati attese A migliorati
Tecnica Tecnica (58*88)/115 (58*27)/115
58
50 8 58 nuova = 44,38 = 13,62
nuova
Tecnica (57*88)/115 (57*27)/115
Tecnica tradizionale = = 57
tradizionale 38 19 57
43,62 13,38
Totale 88 27 115 Totale 88 27 115

Il valore del test chi-quadrato è il seguente:

2 
 50  44,38 2

 8  13, 62  2

 38  43,62  2

 19  13,38 2
 6,11
44,38 13,62 43,62 13,38
VERIFICA DELL’IPOTESI:
se il valore ottenuto dal test supera la soglia critica
in relazione ai gradi di libertà, si può ritenere la
differenza significativa, troppo elevata per essere
attribuita al caso, cioè si rifiuta l’ipotesi nulla;
in caso contrario (se il valore del test è inferiore al
valore riscontrato sulle tavole)si è nella zona di
accettazione dell’ipotesi nulla;

Nel nostro esempio il valore ottenuto dal test è 6,11 ed è


superiore al valore 3,8 al livello di significatività del 5%
per un grado di libertà e pertanto si rifiuta l’ipotesi di
base (le tecniche sono uguali) e si può affermare che
l’effetto della nuova tecnica è migliore rispetto a quella
tradizionale.
Esercizio - 1
Un campione di 164 individui è affetto da sindrome dell’intestino
irritabile. Per alleviare il dolore a 82 individui è stato somministrato
del placebo, ai restanti 82 sono stati somministrati degli antispastici.
I risultati furono i seguenti:

Frequenze Remissione della Non remissione della Totale


sintomatologia sintomatologia
Osservate O
Placebo 52 30 82
Antispastici 44 38 82
Totale 96 68 164

Si provi l’ipotesi Ho che il placebo e gli antispastici siano entrambi


remissivi della sintomatologia dolorifica ad un livello di significatività
dello 0,05.
[Dalle tavole: il valore del Chi-Quadrato ad un livello di significatività
dello 0,05 e con 1 grado di libertà: X²1gdl;0,05 = 3,841
Ho: placebo e antispastici sono remissivi della sintomatologia dolorifica
H1: placebo e antispastici non sono remissivi della sintomatologia
dolorifica

Frequenze Remissione della Non remissione Totale


sintomatologia della sintomatologia
Attese A
Placebo 48 34 82
Antispastici 48 34 82
Totale 96 68 164

2 
 52  48  
 44  48  
 30  34  2

 38  34  2

48 48 34 34
16 16 16 16
     0,33  0,33  0,47  0,47  1,6
48 48 34 34

Poiché X²=1,6 < X²1gdl;0,05 = 3,841 si può accettare l’ipotesi Ho

Potrebbero piacerti anche