Sei sulla pagina 1di 4

1

Esercitazione di Statistica e analisi dei dati


Lungo alcuni sentieri di montagna si trovano qua e l`a cespugli di unaltra erba rara, chiamiamola aroma.
Sia la variabile aleatoria che descrive il numero di cespugli di aroma che si incontrano durante una
passeggiata lunga un chilometro, e supponiamo che questa variabile aleatoria segua una legge di Poisson.

Domanda 1
Si esprima, in funzione di = numero medio di cespugli di aroma incontrati in una passeggiata di
un chilometro, la probabilit`
a fX (k) = P (X = k) di incontrare cespugli durante una passeggiata di un
chilometro.
E[X] =
k
P (X = k) = e
k!
Cammino su un sentiero per un chilometro e raccolgo un ramo da tutti i cespugli di aroma che incontro.
Torno in paese e vendo ogni ramo di aroma a 2 euro luno. Sia la variabile aleatoria che descrive il
guadagno dopo una passeggiata.

Domanda 2.a
Si esprima Y in funzione di X.
Y = 2X

Domanda 2b
Si esprima Y = E[Y ] in funzione di

E[Y ] = E[2X] = 2E[X] = 2

Domanda 2.c
Si esprima Y2 di Y in funzione di Y .

var(Y ) = var(2X) = 22 var(X) = 4 = 4X = 2Y

Domanda 2.d
Supponendo che si trovi in media un cespuglio di aroma ogni 500 metri, si calcoli la probabilit`a che la
passeggiata mi frutti pi`
u di 2 euro.
=2
P (Y > 2) = 1 P (Y 2) = 1 P (2X 2) = 1 P (X 1) = 1 (P (X = 0) + P (X = 1)) =
= 1 (e2 + 2e2 ) = 1 3e2
Modelliamo la variabile aleatoria D che indica la distanza tra due cespugli consecutivi di aroma come
una variabile esponenziale di parametro .

Domanda 3.a
Si esprima in funzione di il valore atteso della distanza tra due cespugli consecutivi di aroma (misurata
in chilometri). Si tratterebbe di un processo di Poisson.

1
E[D] =

2

domanda 3.b
Si esprima in funzione di la densit`
a di probabilit`a di D.
pD (x) = ex IR+ (x)
Sto camminando su un sentiero e raccogliendo un ramo da ogni cespuglio di aroma che incontro. Ho
appena raccolto un ramo.

Domanda 3.c
Qual `e la probabilit`
a P (D > s) che nei prossimi chilometri io non incontri altri cespugli di aroma?
P (D > s) = 1 P (D s) = 1 (1 es ) = es

0.1 Domanda 3.d


Dal momento in cui ho raccolto lultimo ramo di aroma ho gi`a percorso chilometri senza incontrare altri
cespugli. Qual `e la probabilit`
a P (D > s + r|D > s) che nei successivi s chilometri io non incontri altri
cespugli? Per assenza di memoria:
P (D > s + r|D > s) = P (D > s) = es
Durante le vacanze ho fatto 10 passeggiate di un chilometro sui sentieri intorno al paese, senza mai
tornare su un tragitto gi`
a percorso. Ho raccolto un ramo di aroma da ogni cespuglio incontrato, e venduto
i rami a 2 euro luno. Ho annotato la somma di denaro ricavata dopo ogni passeggiata
4, 0, 8, 0, 0, 6, 6, 2, 4, 2
Salviamo questi dati in un vettore dati e il numero di osservazioni nella variabile n:
dati = c (4 ,0 ,8 ,0 ,0 ,6 ,6 ,2 ,4 ,2)
n = length ( d a t i )

Domanda 4.a
Fornire una stima di 2Y .
n
1 X
2Y = (dati[i] dati )2
n 1 i=1

d a t i . avg = sum( d a t i ) /n
sigma2hat = sum( ( d a t i d a t i . avg ) 2 ) / ( n1)
# d a t i . avg = 3 . 2
# sigma2hat 8.17

Domanda 4.b
Fornire una stima del guadagno atteso Y a seguito di una passeggiata.
Y = dati.avg

domanda 4.c
Indicando coN M la variabile aleatoria che descrive la statistica usata al punto precedente, indicare la
media e la varianza di M rispettivamente in funzione di Y e di Y2 e n.
n n
1X 1 X n 2
E[M ] = Y var(M ) = var( Yi ) = 2 var( Yi ) = 2 var(Y ) = Y
n i=1 n i=1
n n
0.1. DOMANDA 3.D 3

Domanda 4.d
Utilizzando il teorema del limite centrale, fornire unapprossimazione della probabilit`a P (|M Y | <
) 0.95 in funzione di , Y , n e della funzione di distribuzione cumulativa normale standard.

 M E[M ]    n
P (|M Y | < ) = P ( < < ) = P( <Z< ) = 2( )1
M M M Y Y Y
con
Z N (0, 1)
N.B:
2 Y2 Y
M = sigmaM =
n n

Domanda 4.e
Utilizzando lapprossimazione ottenuta al punto precedente, indicare che relazione deve sussistere tra
,Y , n e la funzione di distribuzione cumulativa normale standard affinche P (|M Y | < ) 0.95
usando la soluzione del punto precedente:
n
P (|M Y | < ) 0.95 = 2( ) 1 0.95
Y
n 1.95
( ) = 0.975
Y 2
n
1 (0.975) = qnorm(0.975) 1.959964 =
Y
n
1.96
M

Domanda 4.f
Sostituendo a n il numero di passeggiate fatte e a Y la stima che consegue da quanto ottenuto al
punto 4.a, determinare per quali valori di sussiste la relazione P (|M Y | < ) >= 0.95, sfruttando
lapprossimazione del punto 4.d.
  1.96
n = 10Y2 8.17 n= 10 1.96 8.17 1.77
Y 8.17 sqrt10

quindi n 1.78

Domanda 4.g
(opzionale) Che conclusioni si possono trarre da quanto ottenuto nei punti da 4.d a 4.f? (Suggerimento,
immaginate di sostituire a M il valore stimato al punto 4.b)

dati.avg = 3.2 = valorestimatoalpunto4.bP (|M Y | < ) = P (M  < Y < M +) P (1.42 < Y < 4.97) 0.95

notando che sto stimando una probabilit`


a di dati fissi (non aleatori!)

Domanda 5
Si determini un numero n0 tale che facendo almeno n0 passeggiate diventa non inferiore a 0.95 la pro-
Y
babilit`
a che la mia stima c
Y disti in valore assoluto dal valore stimato meno di 2 . Ho due strade: 1:
Teorema centrale del limite
Y 2
n ( )

con
Y
= n (2)2 = 42 15, ...
2
4

quindi
n0 = 16 = d42 e
2: Teorema di chebyshev
2
P (|X X | )
2
applicandolo:
Y 2 4 4
P (|M Y | < ) Y = 0.95
 n Y 2 n
quindi
4 2
n( ) 17.72 n0 = 18
0.95

Domanda 6
Si determini un numero n0 tale che facendo almeno n0 passeggiate diventa non inferiore a 0.95 la
probabilit`
a che la mia stima cY disti in valore assoluto dal valore stimato meno di 10 centesimi di
euro.
come sopra sostituendo a  0.10