Sei sulla pagina 1di 6

STATISTICA

Prova scritta del 4.7.2001

Cognome e Nome: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Numero di matricola: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Attenzione: Prima di a rontare la prova si consiglia di leggere attentamente le note che
seguono.
Indicare cognome, nome e numero di matricola senza cancellature.
Consegnare solo questi fogli.
Negli esercizi nali fornire, oltre al risultato richiesto, anche la spiegazione (concisa) della
procedura adottata.
Le domande a risposta multipla sono suddivise in tre gruppi di quesiti (Statistica descrittiva,
Probabilita, Inferenza Statistica) separati da due linee parallele. Anche il compito possa essere
valutato, e necessario rispondere ad almeno quattro domande per ogni gruppo. Per ogni domanda
a risposta multipla sono previste tre possibili risposte di cui una sola e corretta. Per fornire la
risposta ad una domanda barrare la casella corrispondente alla risposta prescelta. Nel caso di
correzioni, fare in modo che sia chiaro quale sia la risposta nale. Il punteggio assegnato ad ogni
quesito e :
1 se si indica la risposta corretta,
0:25 se si indica la risposta errata,
0 se non si fornisce risposta.
La risposta alla maggior parte delle domande puo essere fornita senza fare alcun calcolo. Si
consiglia di e ettuare i calcoli solo se strettamente necessario.
Non e consentita la consultazione di libri o appunti.
Tempo massimo per lo svolgimento: due ore.

Statistica Descrittiva
(1) La mediana di un carattere qualitativo ordinato
2 non puo essere de nita.

e la modalita relativa all'unita che, in un ordinamento crescente delle modalita assunte,


occupa la posizione centrale.
2 La modalita equidistante da quelle estreme.
Gli esercizi numerati da (2) a (7) fanno riferimento alla seguente tabella di contingenza in cui
un collettivo di telespettatori dell'ultima edizione del Festival di San Remo e stato classi cato
secondo il giudizio riportato sulla trasmissione e secondo l'eta .

Giudizio
(8,16]
Molto buono 20
Buono
50
Indi erente
30
Negativo
50
totale
150

Classi di eta
(16,30]
(30,50] (50,70] Totale
30
40
20
110
20
30
20
120
40
30
20
120
20
40
40
150
110
140
100
500

(2) La mediana del carattere \Giudizio" e

Indi erente
2 Buono
2 Negativo

(3) Per veri care l'ipotesi di indipendenza tra i caratteri \Giudizio" ed \Eta " si utilizza il test
2 Binomiale

2
2 t di Student
(4) L'eta media degli spettatori intervistati e
2 38.42

31.86
2 35.28
(5) La percentuale di spettatori, tra quelli con eta superiore ai 50 anni, che ha dato un giudizio
negativo sulla trasmissione e

40%
2 20%
2 8%

(6) La moda del carattere \Eta " e

(8,16]
2 (16,30]

(7) La mediana del carattere \Eta " e

29.32
2 17.02

2 non puo essere calcolata


2 250

Data la distribuzione di frequenze relativa al carattere X


Valori di X Freq. Assolute
0
3
1
3
2
3
3
1
determinare il valore della funzione di ripartizione empirica nel punto 2.3.

0.9
2 0.5
2 non si puo calcolare

Per rappresentare la distribuzione relativa ad un carattere quantitativo suddiviso in classi si


utilizza

Istogramma
2 Diagramma a barre
2 Diagramma a torta

Il coeciente di variazione fornisce

una misura di variabilita adimensionale


2 un'alternativa alla mdeia aritmetica

2 un indice di posizione




|



Probabilita
Si puo andare da Bologna a Roma in tre modi: (A) Autobus, (B) Treno, (C) Automobile.
Se vado in Treno la probabilita di arrivare in ritardo e pari a 0.2, se vado in autobus la
probabilita di arrivare in ritardo e pari a 0.6, se vado in automobile la probabilita di arrivare
in ritardo e pari a 0.4. Per decidere quale mezzo utilizzare lancio un dado e, se il risultato e
1 oppure 2, prendo il treno, con 3 o 4 prendo l'autobus, con 5 o 6 prendo l'automobile. La
probabilita di arrivare in ritardo e

0.4
2 0.5
2 31

Con riferimento al quesito }, supponiamo di essere arrivati in ritardo: qual e la probabilita


che io abbia usato l'automobile?
2 0.4
2 0.5

31
Con riferimento al quesito }, supponiamo che il prezzo del viaggio sia pari a
Lire 40000
se andiamo in Treno
Lire 30000
se andiamo in Autobus
Lire 50000
se andiamo in Automobile
.
Sapendo di essere arrivati in ritardo, qual e il prezzo medio (a posteriori) del viaggio?

38300
2 45000
2 41660
Supponiamo che il coeciente di correlazione tra X e Y sia pari a rX;Y =
V ar(X ) = V ar(Y ) = 4. La varianza della somma V ar(X + Y ) e pari a

6
27
24

Con riferimento al quesito |, se Z =


22
23

32





eW=

la varianza della somma V ar(Z + W ) e

Si dice che Z Exp(), ovvero Z ha distribuzione esponenziale con parametro  se la funzione


di ripartizione di Z vale
FZ (t) = 1

0:5, e che

t  0;

exp( t);

Quando  = 2, la probabilita che Z risulti maggiore di

expf 1g
2 expf 2g
2 1 expf 1g

1
2

(1)

e

Con riferimento al quesito precedente, se il parametro e pari a 4, la probabilita che Z risulti


compresa tra l/2 e 1 e pari a
2 0.135
2 0.883

0.117
Sia Z  N (3; 9) ovvero Z ha distribuzione normale con media 3 e varianza 9. La probabilita
che Z sia maggiore del doppio della media e

0:369
20:631
2 0:738

Si lancia un dado due volte (e possiamo considerare i due lanci indipendenti): la probabilita
che il primo lancio dia un risultato strettamente maggiore del risultato del secondo lancio e

21
36

1
2

15
36

La varianza del risultato del primo lancio e


21
2 2.92
2 5.84

A

Inferenza statistica
Si consideri una popolazione normale con media  e deviazione standard  incognite.
Determinare l'intervallo di con denza al 95% per la media basandoci sul seguente campione
di 9 osservazioni
2; 1:9; 2:1; 3:1; 4:0; 3:0; 3:3; 2:8; 1:9
2 (2:67  0:74)

(2:10; 3:25)
2 (1:28; 4:15)
Sulla base dell'intervallo di con denza calcolato nel quesito precedente, veri care l'ipotesi
nulla che la media  della popolazione sia pari a
 = 0 = 1:4
contro l'alternativa che  sia diversa da 1.4, a livello del 5%.

Ri uto H0
2 Accetto H0
2 Non si puo rispondere a questa domanda
Uno stimatore per un parametro incognito  e consistente se
2 assume valori molto grandi
2 e basato su un campione molto grande

al crescere della dimensione campionaria fornisce valori sempre piu probabilmente vicini al
vero valore del parametro.

Nei prossimi tre esercizi consideriamo un campione casuale di 16 osservazioni


bernoulliane Be(), ovvero variabili che assumono il valore 1 (successo) con
probabilita  e il valore 0 (insuccesso) con probabilita 1 
Se si osservano 7 successi, la funzione di verosimiglianza associata e

2

7=16

(1

 (1

)

9=16

)

16
Xi
i=1
16

B

Se si osservano 4 successi, la stima di massima verosimiglianza e

C

La varianza stimata dello stimatore usato al punto precedente e

^(1 ^)
2 n^(1 ^)
2 ^(1 ^)

1
4

3
4

7
16

Il livello di signi cativita osservato, detto anche p-value, relativo ad un test in cui l'ipotesi
nulla H0 e che un certo parametro assuma il valore  = 0 e l'ipotesi alternativa H1 e che
 6= 0 , e pari a

La probabilita di osservare valori della statistica test ancor piu \sfavorevoli" ad H0 di


quanto lo sia il valore osservato
2 La probabilita che l'ipotesi nulla sia vera
2 La probabilita che l'ipotesi nulla sia falsa
Nel modello di regressione lineare
Yi = 0 + 1 xi + i ;
il coeciente di regressione 1 e de nito come
2 Il rapporto tra le medie osservate di Y e di X
2 Il rapporto tra la somma dei quadrati dei residui e il numero di osservazioni

Il rapporto tra Cov(X; Y ) e V ar(X )


Nel modello di regressione lineare, un coeciente di correlazione lineare pari a zero implica
che

il coeciente di regressione 2e pari a zero


2 le variabili X e Y sono indipendenti
2 il rapporto di correlazione  di Pearson e anch'esso pari a zero

[6 punti] Si consideri la seguente tabella di contingenza

Y
0
1
1
2

-1
1
3
1
0
Totale 3

1 Totale
0
4
3
4
3
8

a) De nire, a parole e in formule, e poi calcolare, la media di Y quando X=-1


La media di Y quando X=-1 e la media di Y condizionata al fatto che X valga -1. Ovvero,
e la media di Y per quelle unita statistiche sulle quali la variabile X assume il valore -1.
E (Y j X = 1) = 1 

3
1
+0 +10 =
4
4

3
4

b) De nire, a parole e in formule, e poi calcolare, la varianza di Y quando X=-1


Per la de nizione della varianza condizionata vale la spiegazione precedente, sostituendo
la parola varianza alla parola media, tenendo conto che gli scarti si calcolano dalla media
condizionata.
9
3
1
9
3 9
= ( 1)2  +0 +12 0
=
= 3=16
16
4
4
16 4 16

V ar(Y j X = 1) = E (Y 2 j X = 1)

2
c) Calcolare il rapporto di correlazione di Pearson y=x

E (Y ) = Y = 0
y=x
2

P
=P

2
i=1
3
j =1

(Yi
(Yj

Y )2 ni
=
Y )2 nj

P
P

2
i=1
3
j =1

9
 4 + 169  4
(Yi )2 ni
3
16
=
=
2
2
2
(Yj ) nj ( 1)  3 + 0  2 + 1  3 4

[6 punti] La tabella seguente mostra le stature in cm. di 13 coppie padre (X)-primo glio (Y).
Assumendo una relazione lineare tra le due grandezze, determinare
Y
X

167 169 181 171 180 176 180 171 179 174 173 176 178
165 170 180 72 179 174 176 168 181 173 170 178 176

a) Determinare la retta di regressione Y = 0 + 1 X .


Y = 26:37 + 0:85X

b) Determinare i residui per le prime cinque unita.


e^i = yi

y^i = yi

(26:37 + 0:85xi )

i = 1;    ; 5

Quindi, e^1 = 0:375; e^2 = 1:875; e^3 = 1:625; e^4 = 1:575; e^5 = 1:475.
c) Qual e la statura prevista per un glio il cui padre e alto 170.5 cm ?
y^170:5 = 26:37 + 0:85  170:5 = 171:3