Sei sulla pagina 1di 20

STATISTICA INFERENZIALE

ESERCIZIO 1

Consideriamo la variabile casuale discreta X che nella popolazione ha la seguente


distribuzione

x p(x)
1 0,2
2 0,1
3 0,3
4 0,4
1,0

Costruire tutti i possibili campioni di dimensione n 2 . Calcolare la


probabilit di ogni campione, la media e la varianza campionaria

x1 x2 p(x1) p(x2) p(x1,x2) x s2


1 1 0,2 0,2 0,04 1,0 0,0
1 2 0,2 0,1 0,02 1,5 0,5
1 3 0,2 0,3 0,06 2,0 2,0
1 4 0,2 0,4 0,08 2,5 4,5
2 1 0,1 0,2 0,02 1,5 0,5
2 2 0,1 0,1 0,01 2,0 0,0
2 3 0,1 0,3 0,03 2,5 0,5
2 4 0,1 0,4 0,04 3,0 2,0
3 1 0,3 0,2 0,06 2,0 2,0
3 2 0,3 0,1 0,03 2,5 0,5
3 3 0,3 0,3 0,09 3,0 0,0
3 4 0,3 0,4 0,12 3,5 0,5
4 1 0,4 0,2 0,08 2,5 4,5
4 2 0,4 0,1 0,04 3,0 2,0
4 3 0,4 0,3 0,12 3,5 0,5
4 4 0,4 0,4 0,16 4,0 0,0
1,00
1
Ricavare la distribuzione della media campionaria

x p( x )
1,0 0,04
1,5 0,04
2,0 0,13
2,5 0,22
3,0 0,17
3,5 0,24
4,0 0,16
1

Ricavare la distribuzione della varianza campionaria

s2 p(s2)
0,0 0,30
0,5 0,34
2,0 0,20
4,5 0,16
1,00

ESERCIZIO 2

Consideriamo la variabile casuale continua X che rappresenta laltezza dei


ragazzi fra i 15 e i 30 anni residenti nel comune di Bologna. Supponiamo
che nella popolazione X ha distribuzione normale con media 170 e
varianza 100. Supponiamo di estrarre un CCS di 4 unit indipendenti

(171,5; 180,4; 165,3; 175,9).

2
Calcolare la densit del campione

f ( x1 , x2 , x3 , x4 ) f ( x1 ) f ( x2 ) f ( x3 ) f ( x4 )
f (171,5) f (180,4) f (165,3) f (175,9) 1,0973 106

1 (171,5 170) 2
f (171,5) exp 0,0394
2 100 2 100

1 (180,4 170) 2
f (180,4) exp 0,0232
2 100 2 100

1 (165,3 170) 2
f (165,3) exp 0,0357
2 100 2 100

1 (175,9 170) 2
f (175,9) exp 0,0335
2 100 2 100

ESERCIZIO 3

Consideriamo la variabile casuale X che rappresenta sul numero di ore


trascorse in media ogni giorno davanti al computer da persone tra i 20 e i
50 anni. Viene svolta unindagine in cui viene estratto casualmente un
campione di 15 persone le quali dichiarano di trascorrere quotidianamente
davanti al computer un numero di ore pari a:

4, 5, 7, 3, 8, 2, 4, 1, 3, 0, 6, 2, 3, 0, 3.

Stimare la media delle ore trascorse davanti alla computer nella


popolazione usando uno stimatore corretto

1 n 1 51
x
n
x
i 1 i
15
(4 5 3)
15
3,4

3
Stimare la varianza delle ore trascorse davanti alla computer nella
popolazione usando uno stimatore distorto

~ 1 n
s 2 i 1 ( xi x ) 2
n

1
15

( 4 3,4) 2 (5 3,4) 2 (3 3,4) 2

77,6
5,17
15

Stimare la varianza delle ore trascorse davanti alla computer nella


popolazione usando uno stimatore corretto
1

n
s2 ( xi x ) 2
n 1 i 1


1
14

(4 3,4) 2 (5 3,4) 2 (3 3,4) 2

77,6
5,54
14

ESERCIZIO 4

Si consideri la popolazione di 500 iscritti alla procedura di selezione per


un master. Consideriamo la variabile binaria

X = (0: non ammesso; 1: ammesso)

Viene estratto casualmente un campione di 20 persone

0,1,1,1,0,1,0,0,0,1,0,0,1,0,1,1,0,0,1,0

Stimare la proporzione degli ammessi al master nella popolazione

4
1 n 1
p x
i 1 i
0 1 1 1 0 9 0,45
n 20 20

ESERCIZIO 5

Si consideri la variabile casuale continua X che ha distribuzione N (2,6;4) .


Si consideri un campione casuale di 10 osservazioni e, data la seguente
combinazione lineare

1 10
Y X i 10
2 i1

Indicare la distribuzione di Y

Y ha distribuzione N (3;10)

ESERCIZIO 6

Viene svolta un'indagine in cui la variabile binaria X rappresenta la


preferenza politica in America delle persone tra i 20 e i 30 anni,

X = (0: democratici; 1: repubblicani)

Viene estratto casualmente un campione di 250 persone: 173 dichiarano di


essere democratici mentre 77 dichiarano di essere repubblicani

Stimare la proporzione di repubblicani nella popolazione

5
1 n 77
p
n
x
i 1 i
250
0,308

ESERCIZIO 7

Si consideri la variabile casuale continua X che rappresenta il diametro


dei bulloni prodotti da una certa azienda. In questa popolazione di
riferimento,

E ( X ) 3,5 V ( X ) 0,25

Si esamina un campione casuale di n = 50 bulloni. Indicare il valore


atteso e la varianza della variabile media campionaria X

E ( X ) 3,5 V ( X ) 0,25 / 50 0,005

Indicare la distribuzione della media campionaria X e della varianza


campionaria S 2 se X ha distribuzione N(3,5; 0,25)

X ha distribuzione N(3,5; 0,005)

( n 1) S 2 / 2 ha distribuzione 49
2

Indicare la distribuzione asintotica di X se X ha distribuzione non


normale

Applicando il Teorema del limite centrale, per n sufficientemente grande

X si approssima con una distribuzione N(3,5; 0,005)

6
Indicare la distribuzione della media campionaria X se X ha
distribuzione N (3,5; ) con 2 non nota
2

X
ha distribuzione t 49
S2 /n

Applicando il Teorema del limite centrale, per n sufficientemente grande

X si approssima con una distribuzione N (3,5; S 2 / n)

ESERCIZIO 8

Si consideri il seguente campione di dimensione n = 8 estratto nellambito


di unindagine sulle condizioni lavorative dei laureati in economia dopo il
2000:

Unit 1 2 3 4 5 6 7 8
Sesso F F M F M F M F
Et 33 25 41 37 27 30 26 35
Lavoratore S S S N S N S N

Sulla base di tale campione:

si stimi let media, , dei laureati dopo il 2000 e si costruisca un


intervallo di confidenza al 99%, 95% e 90% per sotto l'ipotesi che
let ha distribuzione normale con varianza 2 30

7
La media campionaria

1 n 1 254
x
8
x (33 25 35)
i 1 i
8 8
31,57

Intervallo di confidenza a livello per


P X z / 2 2 / n X z / 2 2 / n 1

Gli estremi dellintervallo con 0.01 sono

(31,57 2,57 30 / 8; 31,57 2,57 30 / 8; ) ( 26,78;36,73)

Gli estremi dellintervallo di confidenza con 0.05 sono

(31,57 1,96 30 / 8; 31,57 1,96 30 / 8; ) ( 27,95;35,54)

Gli estremi dellintervallo di confidenza con 0.10 sono

(31,57 1,64 30 / 8; 31,57 1,64 30 / 8; ) ( 28,57;34,93)

si costruisca un intervallo di confidenza al 90% per sotto l'ipotesi


che let ha distribuzione normale con varianza non nota

1 229,5

n
s2 ( xi x ) 2 32,79
n 1 i 1
7

Intervallo di confidenza per in caso di varianza non nota


P X t7, / 2, S 2 / n X t7, / 2, S 2 / n 1

Gli estremi dellintervallo con 0.10 sono

(31,57 1,90 32,79 / 8; 31,57 1,90 32,79 / 8; )


( 27,90;35,60)

8
si stimi la frequenza dei lavoratori nella popolazione di riferimento
considerando una variabile binaria X (0: non lavora; 1: lavora) che
nella popolazione ha distribuzione Bernoulliana Be(p), dove p la
frequenza da stimare

1 n 1 5
p
8
x (1 1 0) 0,625
i 1 i
8 8

si stimi la frequenza delle femmine nella popolazione considerando


una variabile binaria X (0: maschio; 1: femmina) che nella
popolazione ha distribuzione Bernoulliana Be(p), dove p la
frequenza da stimare

1 n 1 5
p
8
x (1 1 1) 0,625
i 1 i
8 8

ESERCIZIO 9

Nell'ambito di unindagine sui consumi delle famigli italiane stato


osservato un campione di n 250 unit. E' risultato che le famiglie
intervistate spendono mediamente x 62 euro al mese per l'acquisto di
carne, con una varianza campionaria pari a s 2 289 , e che 187 di esse
possiedono pi di unautomobile.

Si costruisca un intervallo di confidenza al 90% per la spesa media di


carne ( ) delle famiglie italiane

Visto che siamo in presenza di grandi campioni, per il teorema del limite
centrale possiamo approssimare la distribuzione della media campionaria
X con una Normale con varianza s / n 289 / 250 1,16
2

Intervallo di confidenza con varianza non nota per


P X 1,64 S 2 / n X 1,64 S 2 / n 90%

9
Gli estremi dellintervallo con 0.10 sono

(62 1,64 1,16; 62 1,64 1,16 ) (60,23;63,77)

Si stimi la frequenza delle famiglie che possiedono almeno


unautomobile e si costruisca un intervallo di confidenza al 95% per
il parametro p nella popolazione

La stima della frequenza


187
p 0,75
250

Visto che siamo in presenza di grandi campioni, per il teorema del limite
centrale possiamo approssimare la distribuzione di p con una Normale
con varianza p (1 p ) / n 0,75 0,25 / 250 0,001
Intervallo di confidenza asintotico con 0.05 per la frequenza p


P p 1,96 p (1 p ) / n p p 1,96 p (1 p ) / n 95%

Gli estremi dellintervallo con 0.05 sono

(0,75 1,96 0,001; 0,75 1,96 0,001) (0,69;0,81)

Supponendo che la variabile consumo in euro delle famiglie per la


carne ha distribuzione normale, costruire un intervallo di confidenza
al 90% per la varianza 2 ( 0.10)

Intervallo di confidenza per la varianza con 0.10

(n 1) S 2 (n 1) S 2
P 2 2 2 90%
n1, / 2 n1,1 / 2

Dato che s 2 289 , gli estremi dellintervallo sono

10
249 289 249 289 249 289 249 289
2 ; 2 ;
( n1), / 2 ( n1),1 / 2 286,81 213,47

250,90;337,10

N.B. i valori della chi-quadrato sono stati calcolati da pc, nella prova
desame ci saranno esercizi che implicano gradi di libert tali per cui i
valori si possono osservare nelle tavole.

ESERCIZIO 10

Consideriamo due campioni casuali di dimensioni rispettivamente n X 64 e


nY 36 , estratti in modo indipendente da due popolazioni normali.
Lindagine campionaria ha prodotto i seguenti risultati:

x 400 , y 360 , X 20 , Y 25

Determinare la stima per intervallo al livello ci confidenza 90% per


la differenza delle due medie della popolazione
Intervallo di confidenza per la X Y con 0.10 di popolazioni normali
con varianze note

X2 Y2 X2 Y2
P ( x y ) z / 2 X Y ( x y ) z / 2 90%
n n n n
X Y X Y

2 2
( 400 360) 1,645 20 25 (32,007;47,993)
64 36

11
ESERCIZIO 11

Unazienda seleziona un campione casuale di 12 venditori per farli


partecipare ad un corso di formazione finalizzato allincremento delle
vendite. Lanno successivo questi venditori hanno generato un
volume medio di vendite pari a 435.000 con una varianza
campionaria pari a 56.000. Nello stesso periodo stato selezionato
in modo indipendente un altro campione casuale di 15 venditori che
non hanno seguito il corso. Questi ultimi hanno generato un volume
medio di vendite pari a 408.000 con una varianza campionaria pari
a di 43.000.

Ipotizzando che le due popolazioni sono distribuite in modo normale


e abbiano la stessa varianza, determinare lintervallo diconfidenza al
livello 95% per la differenza fra i due volumi di vendita.

Calcoliamo lo stimatore S p2 delle varianze incognite, ma uguali:


(n X 1) s X2 (nY 1) sY2
s 2p 48720
n X nY 2

Dato che le due popolazioni sono normali e i due campioni sono


indipendenti

( X Y ) ( X Y )
tg
1 1
sp
n X nY

dove i gradi di libert g nX nY 2 25


Intervallo di confidenza per la X Y con 0.05 di popolazioni normali
con varianze non note ma uguali

1 1 1 1
P ( X Y ) t g . / 2 S p X Y ( X Y ) t g . / 2 S p 95%
n X nY n X nY

12
con t 25; 0 , 025 2,06


( 435.000 408.000) 2,06 220.7261 1 1
12 15

( 27176.10,5;26823.90)

Costruire lo stesso intervallo di confidenza considerando per


n X 280 e nY 250

Dato che siamo in presenza di grandi campioni possiamo costruire un


intervallo di confidenza asintotico con 0.05 utilizzando una
distribuzione normale
( X Y ) ( X Y )
N (0,1)
S X2 SY2

n X nY

Intervallo di confidenza per la X Y con 0.05 di popolazioni normali


con varianze non note ma uguali in caso di grandi campioni

S2 S2 S2 S2
P ( X Y ) z / 2 X Y X Y ( X Y ) z / 2 X Y 95%
n X nY n X nY

con t 25; 0 , 025 2,06

56.000 43.000
( 435.000 408.000) 1,96
280 250

( 26829.88;27170.12)

13
ESERCIZIO 12

Consideriamo la variabile casuale X che rappresenta sul numero di ore


consecutive che i dipendenti di una certa azienda trascorrono in media
ogni giorno davanti al computer. Viene svolta unindagine dal dipartimento
di medicina del lavoro per verificare se i dipendenti non trascorrano in
media pi di 3 ore consecutive davanti al computer. Viene estratto
casualmente un campione di 15 dipendenti le quali dichiarano di
trascorrere quotidianamente davanti al computer un numero di ore pari a:

4, 5, 7, 3, 8, 2, 4, 1, 3, 0, 6, 2, 3, 0, 3.

Sotto lipotesi che X ha distribuzione normale con varianza nota 2 5,

verificare il seguente schema di ipotesi per il parametro media


(livello di significativit del test 0,05 )

H 0 : 0 3 , H1 : 3

Consideriamo la statistica test media campionaria

1 n 1 51
x
n
x
i 1 i
15
(4 5 3)
15
3,4

Sotto lipotesi nulla, X ha distribuzione N(3; 5/15).

DUE MODI DI RISOLVERE LESERCIZIO:

1. Il valore critico in una normale standard

P ( Z z ) 0,10 z 1,64

Per cui la regione di rifiuto in una normale standard

R : Z 1,64

14
Si standardizza in valore x 3,4 relativo ad una distribuzione
N(3; 5/15)

3,4 3
z 0,69
5 / 15

Dato che 0,69 < 1,64 ,

z z , ACCETTO H0

2. In una distribuzione N(3; 5/15), il valore critico x il valore


tale che,

P ( X x ) 0,10 x 0 z 2 / n

x 3 1,64 5 / 15 3,95

Per cui la regione di rifiuto

R : X 3,95

Dato che 3,4 < 3,95 ,

, ACCETTO H
x x 0

Sotto lipotesi che X ha distribuzione normale con varianza non nota

verificare il seguente schema di ipotesi per il parametro media


(livello di significativit del test 0,10 )

H 0 : 0 3 , H1 : 3

Consideriamo la statistica test media campionaria

1 n
x xi 3,4
n i 1

e stimiamo la varianza attraverso uno stimatore corretto

15
1 n
s2
n
i 1
( xi x ) 2 5,54

Dal momento che siamo in presenza di un piccolo campione (n = 15), non


possiamo usare unapprossimazione Normale per la media campionaria X ,
ma sappiamo che, sotto lipotesi nulla H 0

X 0
T ha distribuzione t14
s2 / n

Il valore critico t14 , il valore tale che,

P (T t14, ) 0,10 t14, 1,345

Per cui la regione di rifiuto

R : T 1,345

Calcoliamo il valore osservato t


3,4 3
t 0,658
5,54 / 15

Dato che
t t , ACCETTO H0

ESERCIZIO 13

Nell'ambito di unindagine sui consumi delle famigli italiane stato


osservato un campione di n 250 unit. E' risultato che le famiglie
intervistate spendono mediamente x 62 euro al mese per l'acquisto di
carne, con una varianza campionaria pari a s 2 289 , e che 187 di esse
possiedono pi di unautomobile.

Sotto lipotesi che X ha distribuzione normale con varianza non nota


16
verificare il seguente schema di ipotesi per il parametro media
(livello di significativit del test 0,05 )

H 0 : 0 100 , H 1 : 100

Dato che siamo in presenza di grandi campioni, per il Teorema del limite
centrale, la distribuzione della statistica test media campionaria X sotto
lipotesi nulla H si pu approssimare con una distribuzione
0

N(100, 289/250).

Il valore critico z in una normale standard

P ( Z z ) 0,05 z 1,64

Per cui la regione di rifiuto in una normale standard

R : Z 1,64

Si standardizza in valore x 62 relativo ad una distribuzione


N(100; 289/250)

62 100
z 35,34
289 / 250

Dato che -35,34 < -1,64 ,

z z , RIFIUTO H0

verificare il seguente schema di ipotesi per il parametro media


(livello di significativit del test 0,10 )

H 0 : 0 50 , H 1 : 50

Dato che siamo in presenza di grandi campioni, per il Teorema del limite
centrale, la distribuzione della statistica test media campionaria X sotto
lipotesi nulla H si pu approssimare con una distribuzione
0

N(50, 289/250).
17
Il test bilaterale perci i valori critici z / 2 in una normale standard
sono
z / 2 1,64

Per cui la regione di rifiuto in una normale standard

R : ( Z 1,64) ( Z 1,64)

Si standardizza in valore x 62 relativo ad una distribuzione


N(50; 289/250)

62 50
z 11,16
289 / 250

Dato che 11,16 > 1,64 ,

z z / 2 , RIFIUTO H0

verificare il seguente schema di ipotesi per il parametro media p


relativo alla proporzione di famiglie che possiedono pi di
unautomobile (livello di significativit del test 0,01 )

H 0 : p p 0 0,6 , H 1 : p 0,6

Dato che siamo in presenza di grandi campioni, per il Teorema del limite
centrale, la distribuzione della statistica test proporzione campionaria p
sotto lipotesi nulla H si pu approssimare con una distribuzione
0

N(0,6; 0,6*0,4/250).

Il test bilaterale perci i valori critici z / 2 in una normale standard


sono
z / 2 2,57

Per cui la regione di rifiuto in una normale standard

R : ( Z 2,57) ( Z 2,57)

18
Si standardizza in valore 187 / 250 0,75
p relativo ad una distribuzione
N(0,6; 0,6*0,4/250)
0,75 0,6
z 4,48
0,6 * 0,4 / 250

Dato che 4,48 > 2,57 ,

z z / 2 , RIFIUTO H0

verificare il seguente schema di ipotesi per il parametro media p


relativo alla proporzione di famiglie che possiedono pi di
unautomobile (livello di significativit del test 0,05 )

H 0 : p p0 0,7 , H 1 : p 0,7

Dato che siamo in presenza di grandi campioni, per il Teorema del limite
centrale, la distribuzione della statistica test proporzione campionaria p
sotto lipotesi nulla H si pu approssimare con una distribuzione
0

N(0,7; 0,7*0,3/250).

Il test bilaterale perci i valori critici z / 2 in una normale standard


sono

z / 2 1,96

Per cui la regione di rifiuto in una normale standard

R : ( Z 1,96) ( Z 1,96)

Si standardizza in valore 187 / 250 0,75


p relativo ad una distribuzione
N(0,6; 0,6*0,4/250)
0,75 0,7
z 1,72
0,7 * 0,3 / 250

Dato che 1,72 < 1,96 ,

19
z z / 2 , ACCETTO H0

verificare il seguente schema di ipotesi per il parametro media p


relativo alla proporzione di famiglie che possiedono pi di
unautomobile (livello di significativit del test 0,05 )

H 0 : p p 0 0,7 , H 1 : p 0,7

In questo caso il test precedente diventa di tipo bilaterale ed il valore


critico z 1,64

Per cui la regione di rifiuto in una normale standard diventa

R : Z 1,64

Dato che 1,72 > 1,64 ,


z z , RIFIUTO H0

20