Sei sulla pagina 1di 4

1

Nome Studente ..........................................

Codice identificativo ..........................................

Facoltà di Economia e Management

27010 – Statistica

Prova d’Esame del 27 Giugno 2019

Durata esame: 2 ore

Materiale autorizzato:

• Calcolatrice scientifica semplice (non grafica o programmabile).

• Un foglio A4 con appunti scritti a mano su entrambi i lati.

Materiale NON autorizzato:

• Telefoni di qualsiasi tipo.

• Calcolatrici grafiche o programmabili.

Istruzioni per gli studenti:

• L’esame contiene 3 problemi per un totale di 33 punti.

• Per ogni problema, si prega di rispondere succintamente ai quesiti.

• Le risposte devono essere scritte direttamente sul presente documento ne-


gli spazi appositi dopo ogni problema se possibile. Se lo spazio non fosse
sufficiente, si possono utilizzare i fogli bianchi aggiuntivi forniti dal docente.

• Vige l’obbligo di lavorare individualmente. Scambiare informazioni con al-


tri studenti porta a terminazione immediata dell’esame e a provvedimenti
disciplinari in sede di Facoltà ed Ateneo.

• Per convenienza di notazione si utilizza il punto “.” come separatore decimale.


Per esempio 1/10 = 0.1.
27010 – Statistica: Esame del 27 Giugno 2019 page 2

1. [11 punti] Al fine di ottimizzare i tempi di percorrenza degli autobus nella pro-
vincia Bolzano, uno studio si propone di verificare possibili scostamenti rispetto
agli orari attesi di arrivo in determinate fermate. Sia X il tempo di attesa di un
passeggero ad una certa fermata dell’autobus a Bolzano. Di seguito si riporta un
campione casuale di tempi d’attesa (in minuti) relativi a 5 passeggeri:

3 2 -1 7 -1

Si assuma che X sia ben rappresentata da una distribuzione normale N (µ, σ 2 ).


Il seguente output da R potrebbe essere utile:

> u <- c(0.9, 0.95, 0.975, 0.99, 0.995)


> qnorm(u)
[1] 1.281552 1.644854 1.959964 2.326348 2.575829
> qt(u, df = 9)
[1] 1.383029 1.833113 2.262157 2.821438 3.249836
> qt(u, df = 5)
[1] 1.475884 2.015048 2.570582 3.364930 4.032143
> qt(u, df = 4)
[1] 1.533206 2.131847 2.776445 3.746947 4.604095

(a) [1 punto] Il tempo d’attesa è una variabile numerica oppure categorica? Se


numerica, è continua o discreta?
Numerica, continua.
(b) [3 punti] Calcolare i quartili del campione e costruire un box plot. Utiliz-
zando il boxplot, si descriva brevemente la distribuzione di questi dati.
Dati ordinati: -1, -1, 2, 3, 7. q̂0.25 = −1, q̂0.5 = 2. q0.75 = 3. Il seguente è uno
sketch di boxplot con estensione degli skewers uguale al minimo e massimo
del campione.
6
4
2
0

(c) [3 punti] Si calcolino la media campionaria x̄ e la deviazione standard


campionaria s.
1
x̄ = (−1 − 1 + 2 + 3 + 7) = 2
5
r
1
s= (−1 − 2)2 + · · · + (7 − 2)2 = 3.32
4

– page 2 –
27010 – Statistica: Esame del 27 Giugno 2019 page 3

(d) [4 punti] Si construisca un intervallo di confidenza con livello di confidenza


pari a 95% per il tempo d’attesa medio µ. Si spieghi brevemente il significato
di “livello di confidenza al 95%”. Sulla base dell’intervallo di confidenza
calcolato, possiamo dire che l’autobus arrivi solitamente in ritardo in questa
particolare fermata?

Un intervallo al 95% di confidenza per µ è 2.4 ± 2.78 × 2.97/ 5, ovvero
(−1.29, 6.09). I dati non forniscono sufficientemente evidenza per affermare
che l’autobus arriva in ritardo dato che il valore µ = 0 è contenuto nell’in-
tervallo. Confidenza al 95% significa che se ipoteticamente calcolassimo IC
nello stesso modo su diversi campioni casuali di grandezza n = 5 presi dalla
stessa popolazione, circa il 95% di tali intervalli conterrebbe il valore vero di
µ.

2. [10 Punti] Una certa città ha recemente implmentato incentivi per promuovere
il trasporto tramite bicicletta al fine di migliorare la qualità della vita dei resi-
denti (diminuzione inquinamento, aumento esercizio fisico e salute). Una ricerca
condotta nel 2019 ha condotto un campionamento trovando che su 150 residen-
ti intervistati 27 utilizza la bicicletta come mezzo di trasporto primario. Prima
dell’introduzione di tali incentivi il 10% della popolazione residente utilizzava la
bicicletta come mezzo di trasporto primario. Il seguente output R potrebbe essere
utile:

> u <- c(0.9, 0.95, 0.975, 0.99, 0.995)


> qt(u, df = 3)
[1] 1.637744 2.353363 3.182446 4.540703 5.840909
> qt(u, df = 6)
[1] 1.439756 1.943180 2.446912 3.142668 3.707428
> qnorm(u)
[1] 1.281552 1.644854 1.959964 2.326348 2.575829

(a) [3 Punti] Si spieghi il significato del livello di significativita’ α nel test


d’ipotesi.

α = P (Errore I tipo) = P (rifiutare H0 |H0 vera).

(b) [4 Punti] I dati forniscono evidenza che la proporzione di residenti che utiliz-
za la bicicletta come mezzo di trasporto primario sia aumentata? Si risponda
svolgendo un test d’ipotesi appropriato utilizzando il livello di significativita’
α = 0.05.
Sia p la proporzione di residenti che usa la bicicletta come mezzo di trasporto
primario. Vogliamo testare H0 : p = 0.1 contro H1 : p > 0.1. La statistica z

p̂ − p0 0.18 − 0.1
z=r =r = 3.27
p0 (1 − p0 ) 0.1(0.9)
n 150
Dato che il valore osservato z = 3.27 è maggiore del valore critico zcrit =
1.645, rifiutiamo l’ipotesi nulla a favore dell’ipotesi alternativa. Questo si-
gnifica che i dati supportano il fatto che l’utilizzo della bicicletta in città
come mezzo di trasporto primario è aumentata.

– page 3 –
27010 – Statistica: Esame del 27 Giugno 2019 page 4

(c) [3 Punti] Quali assunzioni sono necessarie affinché il test d’ipotesi proposto
nel punto (b) funzioni correttamente?
Campione casuale semplice (dati i.i.d.), n sufficientemente grande (come
indicazione np > 10 e n(1 − p) > 10). In questo caso 0.18(150) = 27.

3. [12 Punti] Una certa azienda pubblicizza un annuncio per una posizione lavoar-
tiva manageriale su tre siti specializzati, diciamo A, B e C. Sappiamo che questi
siti sono frequentati da studenti in economia che vedono l’annuncio con proba-
bilità P (A) = 1/3, P (B) = 1/2 e P (C) = 1/6, rispettivamente per i siti A, B e
C. La probabilità che uno studente risponda all’annuncio dopo averlo visto su un
sito è di 0.002, 0.001 e 0.005, rispettivamente per i siti A, B, e C.

(a) [1 punto] Si considerino due studenti in economia selezionati casualmente.


Si calcoli la probabilità che nessuno dei due studenti veda l’annuncio sul sito
A.
(2/3) × (2/3) = 4/9
(b) [1 punti] Si considerino due studenti in economia selezionati casualmente.
Si calcoli la probabilità che esattamente uno studente veda l’annuncio sul
sito A.
(1/3)(2/3) + (2/3)(1/3) = 4/9
(c) [3 punti] Si calcoli la probabilità che uno studente in economia risponda
all’annuncio.
Dalla legge delle probabilità totali si ottiene

0.002(1/3) + 0.001(1/2) + 0.005(1/6) = 0.002.

(d) [3 punti] Se uno studente risponde all’annuncio, qual’è la probabilita’ che


tale studente abbia visto l’annuncio sul sito A?
Applicando il teorema di Bayes si ottiene

0.002(1/3)
= 1/3.
0.002

(e) [4 punti] Sia X il numero di studenti che vede l’annuncio sul sito A in un
campione casuale di 5 studenti.
i. Che distribuzione segue X? Si calcolino E(X) e V ar(X).
X ∼ Bin(n = 5, p = 1/3) con valore atteso E(X) = 5/3 e varianza
V ar(X) = 5(1/3)(2/3) = 10/9.
ii. Sicalcoli P (X = 2).
5 2 3
2 (1/3) (2/3) = 0.79.

– page 4 –

Potrebbero piacerti anche