Sei sulla pagina 1di 10

Metodi statistici per lo studio dei fenomeni biologici

Alla fine di questa lezione dovreste essere in grado di:


 spiegare i concetti di stima puntuale e stima intervallare
 interpretare gli intervalli di confidenza
 costruire gli intervalli di confidenza di una media
 descrivere la distribuzione t di Student
 utilizzare le tavole della distribuzione t di Student
 costruire gli intervalli di confidenza di una media con

piccoli campioni

Dalla Popolazione al Campione e Ritorno

POPOLAZIONE

CAMPIONAMENTO

PARAMETRO

CAMPIONE

INFERENZA

STIMA

Qual la Media della Popolazione ?

POPOLAZIONE

CAMPIONAMENTO

CAMPIONE

Stimare la Media della Popolazione

1.

La media del gruppo (campione) una stima puntuale del


parametro della popolazione

2.

Ogni media di gruppo fornisce una diversa stima connessa alle


fluttuazioni casuali dovute al campionamento

3.

La stima puntuale non da indicazioni sulla variabilit della stima

4.

Costruisco un intervallo centrato intorno alla media di gruppo sul


quale ho una certa confidenza che il parametro della popolazione
cada nellintervallo

5.

Lintervallo di confidenza la stima intervallare del parametro


della popolazione

Intervallo di Confidenza

1. Gli intervalli di confidenza sono definiti come un


intervallo di valori costruito a partire dai dati
2. Allinterno dellintervallo ho una certa probabilit
(tipicamente 95%) che sia compreso il parametro
della popolazione
3. Per calcolare lintervallo utilizzo le propriet della
distribuzione di campionamento delle medie

Calcolo dellIntervallo di Confidenza al 95%




La distribuzione delle medie campionarie approssima la


distribuzione Gaussiana, quindi il rapporto

Z=


X
n

distribuito come una gaussiana standardizzata nella quale

Pr{ 1.96 Z 1.96} = 0.95




e quindi sostituendo a Z il rapporto standardizzato ottengo

Pr 1.96
1.96 = 0.95

Calcolo dellIntervallo di Confidenza al 95%




Possiamo manipolare la disuguaglianza allinterno delle parentesi

Pr 1.96
1.96 = 0.95

moltiplicando i tre termini per /n


/

Pr 1.96

X 1.96

= 0.95

sottraendo da ciascun termine


x e cambiando di segno

Pr X 1.96

X + 1.96

= 0.95

Esempio di Calcolo dellIntervallo di Confidenza al 95%

X z

, X + z

Informazioni

n = 20
x = 170
= 8.5
z = 1.96

Limite Inferiore

170 1.96*8.5/
20 = 170 3.72 = 166.28
Limite Superiore

170 + 1.96*8.5/
20 = 170 + 3.72 = 173.72

Intervallo di Confidenza e Parametro

161.0
164.5
168.0
171.5
175.0
178.5
182.0

Intervallo di Confidenza e Parametro

161.0
164.5
168.0
171.5
175.0
178.5
182.0

Intervallo di Confidenza e Parametro

Nel 95% circa dei campioni possibili lintervallo di confidenza al


95% comprende il parametro della popolazione (171.5 cm)
161.0
164.5
168.0
171.5
175.0
178.5
182.0

Intervallo di Confidenza
Propriet
1. Maggiore lampiezza dell Intervallo di
Confidenza minore la precisione della stima
2. La sua ampiezza, e quindi la precisione della
stima, varia con la numerosit dello studio e il
grado di confidenza desiderato


Allaumentare della numerosit lampiezza


diminuisce e la precisione aumenta

Allaumentare del grado di confidenza (es.


99% invece di 95%) lampiezza aumenta e la
precisione diminuisce

Se sconosciuta ?
Problema
Se la varianza della popolazione non nota ?
(NB se non nota, probabile che anche non sia nota)

Soluzione
Utilizzo la varianza campionaria s come stima di
(NB nella formula della varianza divido per (n-1): i gradi di libert)

La distribuzione t di student

Z=

X
n

t=

X
s n

Il nuovo rapporto standardizzato non ha una distribuzione


normale standardizzata perch devo tener conto anche
della variabilit di s che sar maggiore quando n piccolo.
Questo rapporto distribuito come una t di student con n-1
gradi di libert

La distribuzione t di student
Caratteristiche
1. una distribuzione continua
2. simmetrica rispetto alla media:
3. Media , mediana e moda coincidono
4. una distribuzione di probabilit
5. Se n basso i valori nelle code sono pi
probabili
6. Al crescere di n la distribuzione approssima la
gaussiana standardizzata

Percentili della distribuzione t di Student


DUE CODE

UNA CODA

PROBABILITA'
GL
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,1
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70

0,05
0,02
12,71 31,82
4,30
6,96
3,18
4,54
2,78
3,75
2,57
3,36
2,45
3,14
2,36
3,00
2,31
2,90
2,26
2,82
2,23
2,76
2,20
2,72
2,18
2,68
2,16
2,65
2,14
2,62
2,13
2,60
2,12
2,58
2,11
2,57
2,10
2,55
2,09
2,54
2,09
2,53
2,08
2,52
2,07
2,51
2,07
2,50
2,06
2,49
2,06
2,49
2,06
2,48
2,05
2,47
2,05
2,47
2,05
2,46
2,04
2,46

PROBABILITA'
0,01
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75

0,05
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70

0,025
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04

0,01
0,00 5
31,82 63,66
6,96
9,92
4,54
5,84
3,75
4,60
3,36
4,03
3,14
3,71
3,00
3,50
2,90
3,36
2,82
3,25
2,76
3,17
2,72
3,11
2,68
3,05
2,65
3,01
2,62
2,98
2,60
2,95
2,58
2,92
2,57
2,90
2,55
2,88
2,54
2,86
2,53
2,85
2,52
2,83
2,51
2,82
2,50
2,81
2,49
2,80
2,49
2,79
2,48
2,78
2,47
2,77
2,47
2,76
2,46
2,76
2,46
2,75

f(x)

Area nella coda superiore

0.5

0.4

0.3

0.2

0.1

0.0
-4.0

-3.0

-2.0

-1.0

0.0

1.0

2.0

3.0

4.0

2,0

3,0

4,0

Area nelle due code


0,5

0,4

0,3

0,2

0,1

0,0
-4,0

-3,0

-2,0

-1,0

0,0

1,0

Distribuzione t di Student e Intervallo di Confidenza

Consideriamo i dati sullaltezza raccolti da


un gruppo di studenti
n = 20
x = 172.0
s = 10.0
Qual lintervallo di confidenza al 95% della
media ?

Distribuzione t di Student e Intervallo di Confidenza

Occorre modificare la formula precedente

X z

, X + z

tenendo conto delle nuove informazioni

X t s

, X + t n 1 s

n 1
n
n

Quali valori della distribuzione t di Student con 19 gradi


di libert lasciano unarea nelle due code pari a 0.05 ?

Percentili della distribuzione t di Student


DUE CODE

UNA CODA

PROBABILITA'
GL
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,1
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70

0,05
0,02
12,71 31,82
4,30
6,96
3,18
4,54
2,78
3,75
2,57
3,36
2,45
3,14
2,36
3,00
2,31
2,90
2,26
2,82
2,23
2,76
2,20
2,72
2,18
2,68
2,16
2,65
2,14
2,62
2,13
2,60
2,12
2,58
2,11
2,57
2,10
2,55
2,09
2,54
2,09
2,09
2,53
2,08
2,52
2,07
2,51
2,07
2,50
2,06
2,49
2,06
2,49
2,06
2,48
2,05
2,47
2,05
2,47
2,05
2,46
2,04
2,46

PROBABILITA'
0,01
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75

0,05
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70

0,025
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04

0,01
0,00 5
31,82 63,66
6,96
9,92
4,54
5,84
3,75
4,60
3,36
4,03
3,14
3,71
3,00
3,50
2,90
3,36
2,82
3,25
2,76
3,17
2,72
3,11
2,68
3,05
2,65
3,01
2,62
2,98
2,60
2,95
2,58
2,92
2,57
2,90
2,55
2,88
2,54
2,86
2,53
2,85
2,52
2,83
2,51
2,82
2,50
2,81
2,49
2,80
2,49
2,79
2,48
2,78
2,47
2,77
2,47
2,76
2,46
2,76
2,46
2,75

f(x)

Area nella coda superiore

0.5

0.4

0.3

0.2

0.1

0.0
-4.0

-3.0

-2.0

-1.0

0.0

1.0

2.0

3.0

4.0

2,0

3,0

4,0

Area nelle due code


0,5

0,4

0,3

0,2

0,1

0,0
-4,0

-3,0

-2,0

-1,0

0,0

1,0

Calcolo dellIntervallo di Confidenza

Inseriamo le informazioni raccolte nella formula

X t s

, X + t n 1 s

n 1
n
n

n = 20
x = 172.0
s = 10.0

172 2.09 10

,172 + 2.09 10

20
20

t = 2.09

I limiti dellintervallo di confidenza sono 167.33 e 176.33

10

Potrebbero piacerti anche