Sei sulla pagina 1di 30

CORSO DI STATISTICA N.O.

- II CANALE
Esercizi
Dott.ssa CATERINA CONIGLIANI
Facoltà di Economia
Università Roma Tre

1 Esercizi su sintesi di distribuzioni semplici

Esercizio 1.1 Data la seguente distribuzione di frequenze relative degli abbonati alla pay per
view 1997-1998 per squadra di calcio:

Squadra Bari Bologna Lecce Milan Piacenza Roma Sampdoria Vicenza


fi 0.027 0.076 0.023 0.512 0.013 0.259 0.053 0.037

rappresentarla graficamente e calcolare la moda [R: M o = M ilan].

Esercizio 1.2 Data la seguente distribuzione delle macchine vendute per casa produttrice:

Casa Fiat Ford Lancia Opel Renault Volkswagen


ni 77000 19800 14600 18700 13040 16500

rappresentarla graficamente e calcolare la moda [R: M o = F iat].

Esercizio 1.3 Data la seguente distribuzione dei medici a tempo definito secondo la qualifica
degli Istituti generali regionali di cura pubblica 1991:

Qualifica Direttori Vice-direttori Primari Aiuti Assistenti


ni 7 24 1287 4067 3289

rappresentarla graficamente e calcolare la moda e la mediana [R: M o = Aiuti, M e = Aiuti].

1
Statistica n.o. - II canale 2
Esercizio1.4 Data la seguente distribuzione di un insieme di scuole per tipo (Compendio 1996):

Tipo materna elementare media secondaria tot


ni 26914 21418 9728 7887 65947

rappresentarla graficamente e calcolare moda, mediana, quartili [R: M o = materna,


M e = elementare, Q1 = materna, Q3 = media].

Esercizio1.5 Data la seguente distribuzione dei suicidi per il titolo di istruzione (Compendio
1996):
Tipo analfabeta elementare media superiore tot
ni 195 1078 1225 428 2926
rappresentarla graficamente e calcolare moda, mediana, quartili [R: M o = media, M e = media,
Q1 = elementare, Q3 = media].

Esercizio 1.6 Data la seguente distribuzione delle vendite di auto per tipo (Quattroruote, aprile
1996):
X utilitaria media super lusso
n(X) 79730 63970 11540 400
rappresentarla graficamente e calcolare moda, mediana, quartili [R: M o = utilitaria, M e =
utilitaria, Q1 = utilitaria, Q3 = media].

Esercizio 1.7 Rappresentare graficamente la seguente distribuzione relativa a tempi tra sbuffi
di Geyser:
X 43-51 51-59 59-69 69-79 79-88 88-108
n(X) 10 15 10 25 30 10
e individuare classe modale, mediana e media aritmetica. [R: µ = 72.7; M e = 75] .

Esercizio 1.8 Data la seguente distribuzione degli appartamenti dichiarati abitabili a Milano
nel 1932 secondo l’ampiezza:

n. vani 1 2 3 4 5 6 7 8 9 10-15
n(X) 530 2861 2034 917 354 144 86 78 29 29

rappresentarla graficamente e calcolare moda, mediana e quartili [R: M o = 2, M e = 3, Q1 = 2,


Q3 = 3].
Statistica n.o. - II canale 3
Esercizio 1.9 Data la seguente distribuzione di un collettivo di 15 studenti secondo il voto
ottenuto all’esame di Statistica:

voto 18 20 23 24 26 27 28 30
n(X) 1 1 1 2 3 4 2 1

a) rappresentare graficamente la distribuzione;


b) calcolare la media aritmetica, la moda e la mediana;
c) utilizzando i dati della tabella, costruire una distribuzione di frequenza in classi, con classi
18-20, 21-23, 24-26, 27-30, e calcolare la media aritmetica nell’ipotesi di uniforme distribuzione
del carattere all’interno delle classi; confrontare i risultati con quelli del punto b).
[R: b) µ = 25.4, M o = 27, M e = 26; c) µ = 25.63].

Esercizio 1.10 Data la seguente distribuzione di pontefici secondo la durata del pontificato (in
anni):

durata (anni) 0-4 4-8 8-12 12-16 16-20 20-24 24 e più tot
ni 103 57 51 30 10 8 4 263

a) calcolare la mediana e la media aritmetica chiudendo l’ultima classe a 28;


b) calcolare la mediana e la media aritmetica chiudendo l’ultima classe a 40, e commentare;
c) calcolare lo scostamento quadratico medio (chiudendo l’ultima classe a 28);
d) senza rifare tutti i calcoli, calcolare la mediana, la media aritmetica, lo scostamento quadratico
medio della durata del pontificato in mesi (chiudendo l’ultima classe a 28).
[R : a) µ = 7.37, M e = 6; b) µ = 7.46, M e = 6; c) σ = 5.8; d) µ = 88.44, M e = 72, σ = 69.6].

Esercizio 1.11 Data la seguente distribuzione secondo il reddito (in milioni), per cui per ogni
classe è noto l’ammontare di reddito posseduto dagli individui della classe:

reddito 0-3 3-6 6-9 9-15 15-25 25-50 50-100 >100 tot
ni 7976 8763 4130 1176 297 105 18 3 22468
ammontare 12792 40650 29320 12932 5580 3405 1172 532 106383

a) calcolare la media aritmetica utilizzando l’informazione sull’ammontare di reddito per ogni


classe;
b) calcolare la media aritmetica ipotizzando l’uniforme distribuzione del reddito nelle classi;
[R : a) µ = 4.73; b) µ = 4.81].
Statistica n.o. - II canale 4
Esercizio 1.12 Data la seguente distribuzione relativa ai gradi di nuvolosità registrati presso
un osservatorio di Parigi in 2192 giorni:

gradi 0-20 20-40 40-60 60-80 80-100 tot


ni 418 213 269 380 912 2192

a) calcolare la classe modale;


b) calcolare la media aritmetica e la varianza;
c) calcolare la mediana e i quartili.
[R : a) M o = (80 − 100) ; b) µ = 60.5, σ 2 = 972.31; c) M e = 70.3, Q1 = 32.2, Q3 = 88.0].

Esercizio 1.13 Consideriamo le temperature massime registrate a Catania negli anni 1982-
1985:
Anno Temperatura
1982 45.0
1983 41.0
1984 36.4
1985 38.0
1986 40.6
a) Calcolare media e lo scostamento quadratico medio.
b) Senza rifare tutti i calcoli, calcolare media e scostamento quadratico medio delle temperature
misurate in Farenhait (nota: F = 32 + C ∗ 9/5).
[R: a) µ = 40.2; σ = 2.94; b) µ = 104.36; σ = 5.292]

Esercizio 1.14 In un pronto soccorso di un ospedale sono stati registrati il numero delle richieste
di intervento giornaliere (X) su un arco di 100 giorni, ottenendo la seguente distribuzione di
frequenza:
X 0 1 2 3 4 5 6 7 8 9 10
n(X) 2 9 18 22 16 12 9 5 4 2 1
a) Fare la rappresentazione grafica della distribuzione;
b) calcolarne la media, la mediana e la varianza.
[R: µ = 3.84; M e = 3; σ 2 = 4.47]
Statistica n.o. - II canale 5
Esercizio 1.15 In una classe di 24 studenti i voti riportati all’esame di maturità sono stati i
seguenti:
37 42 37 38 50 52 58 40 46 50 52 48
60 48 37 40 46 50 60 46 38 40 42 48
a) calcolare la media aritmetica;
b) costruire la corrispondente distribuzione di frequenza (modalità per modalità), e su di essa
calcolare la media aritmetica; e’ diversa da quella del punto a)? perche’ ?
c) dopo aver effettuato una suddivisione in classi di ampiezza 4, calcolare nuovamente la media
aritmetica ipotizzando l’uniforme distribuzione del carattere nelle classi; e’ diversa da quella del
punto b)? perche’ ?

Esercizio 1.16 Lungo una strada statale vi sono 7 distributori di benzina: due al km 8, tre al
km 40, uno al km 61 e uno al km 106. I distributori hanno uguale capienza, vengono riforniti
uno alla volta e richiedono rifornimenti con uguale frequenza. A quale km della strada si dovrà
costruire un deposito di benzina da cui partano le autobotti con i rifornimenti per i distributori
se si vogliono minimizzare i costi di trasporto, supposti proporzionali alle distanze? Perchè? [R:
M e = km 40]

Esercizio 1.17 Data la seguente distribuzione delle frequenze cumulate relative di un collettivo
rispetto al carattere X:

X 0-2 2-4 4-6 6-10 10-20 20-30 30-50


F(X) 0 0.08 0.32 0.64 0.86 0.96 1

a) fare la rappresentazione grafica della distribuzione;


b) individuare la classe modale;
c) calcolare mediana e media aritmetica;
d) calcolare la media aritmetica e la varianza della variabile Z=1-3X;
e) calcolare la proporzione di unità che presentano un livello di X≤12.
[R: b) classe modale: (4-6); c) µ = 11.4, M e = 8.25; d) µz = −33.2, σz2 = 659.16; e) F (12) =
0.684]

Esercizio 1.18 Una sessione è costituita da tre appelli di esame, a cui si presentano, rispettiva-
mente, 80, 100 e 50 studenti; tutti vengono promossi. Il voto medio riportato al primo appello
risulta pari a 26.4, con scostamento quadratico medio (s.q.m.) pari a 4.5. Al secondo appello
il voto medio risulta pari a 27.2. Al terzo appello si osserva uno s.q.m. pari a 5. Per l’intera
sessione il voto medio risulta pari a 27.
a) Valutare il voto medio relativo al terzo appello.
b) Sapendo che lo s.q.m. complessivo vale 5.5, determinare lo s.q.m. relativo al secondo appello.
[R: µ3 = 27.56; σ2 = 6.36]
Statistica n.o. - II canale 6
Esercizio 1.19 In una popolazione di 1000 alberghi a tre stelle in località di montagna, mare
e città, si è rilevato il prezzo medio (in migliaia di lire) di una stanza doppia per una notte
(per il mese di settembre). I prezzi medi e gli scostamenti quadratici medi di ciasun gruppo e
dell’intera popolazione sono stati i seguenti:

Ubicazione n. alberghi prezzo medio sqm


Montagna 170 125 12.2
Mare 300 131 10
Città 530 148
tot 1000 139 16

ricavare lo scostamento quadratico medio del prezzo degli alberghi in città.


[R: σcittà = 14.09]

Esercizio 1.20 Sia data la seguente distribuzione delle aziende per numero di addetti, per la
quale siano note le medie e gli scostamenti quadratici medi delle classi:

Classi di addetti Aziende N. medio addetti S.q.m.


fino a 5 735 3.1 1.5
6-10 1200 8.6 2.1
11-20 900 15.5 4.2
21-40 150 35.5 12.7
più di 40 15 70.2 20.4

a) Calcolare la media del n. di addetti per azienda.


b) Calcolare la varianza del n. di addetti per azienda.
[R: µ = 10.975; σ 2 = 88.957;]

Esercizio 1.21 Al censimento del 1981 le famiglie italiane secondo il numero di componenti
(X) sono risultate cosı̀ distribuite:

X 1 2 3 4 5 6 7 8 e più
n(X) 3323 4402 4117 4008 1773 629 224 154

a) Fare la rappresentazione grafica della distribuzione.


b) Calcolare moda, mediana e media aritmetica.
c) Calcolare i quartili e il decimo e il trentesimo percentile.
[R: b) M o = 2, M e = 3, µ = 2.985; c) Q1 = 2, Q3 = 4, P10 = 1, P30 = 2]
Statistica n.o. - II canale 7
Esercizio 1.22 Data la seguente tabella:

X 0-1 1-2 2-3 3-5 5-10 10-15 15-30


n(X) 15 13 15 12 15 10 15

a) Fare la rappresentazione grafica della distribuzione di frequenza.


b) Calcolare: la mediana, il primo e il terzo quartile.
[R: M e = 3.67; Q1 = 1.64; Q3 = 10.5; ]

Esercizio 1.23 Sia data la seguente distribuzione dei redditi:

Classi di reddito (milioni) Frequenze relative


fino a 10 0.195
10-20 0.419
20-30 0.221
30-40 0.095
40-50 0.041
oltre 50 0.029
Totale 1.000

Calcolare media, s.q.m., un indice di asimmetria e la proporzione di unità con reddito compreso
nell’intervallo (µ − σ, µ + σ). Commentare i risultati. [R: µ = 19.84; σ = 12.87; γ = 1.41;
F (µ + σ) − F (µ − σ) = 0.725]

Esercizio 1.24 Data la seguente distribuzione di frequenza:

X 0-1 1-2 2-3 3-5 5-10 10-15 15-20 20-30 30-40 40-50 50-100
ni 15 13 12 11 10 10 8 6 6 5 4

a) fare la rappresentazione grafica della distribuzione;


b) calcolare la mediana e la media aritmetica;
c) calcolare lo scostamento quadratico medio;
d) calcolare un indice di asimmetria.
[R: b) M e = 4.8, µ = 13.26; c) σ = 17.61; d) γ = 2.006]
Statistica n.o. - II canale 8
Esercizio 1.25 In una cittadina degli Stati Uniti è stata rilevata la concentrazione media
giornaliera di ozono (X in parti di miliardi) fra l’1/5/74 e il 13/9/74, ottenendo la seguente
distribuzione di frequenza:

X 0-50 50-75 75-100 100-150 150-200 200-250


n(X) 35 29 25 28 11 8

a) Fare la rappresentazione grafica delle frequenze relative.


b) Calcolare un indice di dimensione, uno di variabilità ed uno di asimmetria.
c) Calcolare la proporzione di giorni con concentrazione media compresa nell’intervallo (µ − σ, µ + σ) .
d) Calcolare media e scostamento quadratico medio della variabile Z = 2X − 150.
[R: b) µ = 88.97; σ = 56.19; γ = 0.78; c) F (µ + σ) − F (µ − σ) = 0.672; d) µz = 27.94,
σz = 112.38]

Esercizio 1.26 In un campione di 100 aziende della provincia di Milano è stata rilevata la
superficie, ottenendo i seguenti risultati:

Classe di superficie Numero di aziende


0-10 33
10-50 43
50-100 12
100-500 10
500-1000 2

a) Si rappresentino graficamente i dati nel modo che si ritiene più opportuno.


b) Si determini la classe modale.
c) Si calcolino la mediana e un indice di asimmetria.
d) Si calcoli la proporzione di aziende con superficie ≤50.
e) Si calcoli la proporzione di aziende con superficie ≤40.
f) Si calcoli la proporzione di aziende con superficie >60
µ − Me
[R: b) classe modale: (0-10); c) M e=25.814, = 0.33; d) F (50) = 0.76; e) F (40) = 0.65;
σ
f ) 1 − F (60) = 0.22]
Statistica n.o. - II canale 9
2 Esercizi sulle distribuzioni doppie

Esercizio 2.1 Data la seguente tabella a doppia entrata relativa ai caratteri reddito mensile in
milioni di lire (X) e numero di weekend dedicati a viaggiare (Y):

Y 0−1 2−3 4
X
0-1.5 20 15 3
1.5-2.5 13 21 6
2.5-4 18 10 8
calcolare:
a) la media e la varianza di X, la media e la varianza di Y, la Cov(X,Y), il coefficiente di
correlazione di Bravais;
b) la media di X quando Y è tra 2 e 3 weekend;
c) la media e la varianza di Z=X+Y e di W=X-Y.
[R: a) µx = 1.98, σx2 = 1.01, µy = 1.83, σy2 = 1.67, σxy = 0.11, r = 0.08; b) µx|y∈(2−3) = 1.86; c)
µz = 3.81; σz2 = 2.9; µw = 0.15; σw
2 = 2.46]

Esercizio 2.2 Data la seguente distribuzione doppia:

Y 1 2 3
X
6 2 0 0
12 0 2 1
18 0 0 1
24 0 1 1

a) calcolare la media delle due distribuzioni marginali, le varianze, la covarianza, il coefficiente


di correlazione di Bravais.
b) determinare la distribuzione del rapporto W=X/Y e calcolarne media e varianza.
[R: a) µx = 14.25, µy = 2.125, σx2 = 44.44, σy2 = 0.61, σxy = 3.47, r = 0.67; b) µw = 6.75;
2 = 4.937]
σw

Esercizio 2.3 Data la seguente distribuzione doppia:

Y 0−2 2−4 4−6


X
2 2 12 6
6 3 18 9
10 5 30 15

a) calcolare la media delle due distribuzioni marginali, le varianze, la covarianza, il coefficiente


di correlazione di Bravais;
b) calcolare la media di X quando Y cade nella terza classe;
c) determinare la distribuzione della combinazione lineare Z=X+Y e calcolarne media e varianza;
d) verificare le proprietà delle combinazioni lineari.
[R: a) µx = 7.2, µy = 3.4, σx2 = 9.76, σy2 = 1.44, σxy = 0, r = 0; b) µx|y∈(4−6) = 7.2]
Statistica n.o. - II canale 10
Esercizio 2.4 Data la seguente tabella a doppia entrata relativa ai caratteri spese mensili per
generi alimentari (X) e per generi non alimentari (Y ) in milioni di lire (valori centrali delle
classi) rilevate su un collettivo di 150 famiglie:

Y 1.5 2.5 3.5


X
0.5 18 15 12
0.8 30 26 22
1.2 5 8 14

a) calcolare la media e la varianza di X, la media e la varianza di Y , la Cov(X, Y ), il coefficiente


di correlazione di Bravais;
b) calcolare la media e la varianza di X quando Y = 2.5;
c) costruire la tabella relativa alla distribuzione della spesa complessiva familiare Z = X + Y , e
calcolarne media e varianza;
d) calcolare media e varianza di Z a partire dalle quantità calcolate al punto a) e verificare che
si ottengono gli stessi risultati del punto c).
[R: a) µx = 0.782, µy = 2.467, σx2 = 0.055, σy2 = 0.671, σxy = 0.035, r = 0.183; b) µx|y=2.5 =
2
0.773, σx|y=2.5 = 0.054; c) µz = 3.249; σz2 = 0.796]

Esercizio 2.5 In un collettivo di 50 famiglie è stata rilevata la distribuzione congiunta dei


redditi mensili da lavoro del marito (X) e della moglie (Y ) espressi in migliaia di euro (valori
centrali delle classi):
Y 0 1 2
X
1 6 8 6
2 2 10 2
3 10 6 0
a) fare la rappresentazione grafica delle tre distribuzioni della X condizionate da Y = 0, Y =
1, Y = 2, e calcolarne le medie;
b) calcolare Cov(X, Y ) e il coefficiente di correlazione di Bravais;
c) calcolare il numero di famiglie per le quali il reddito del marito è pari ad almeno 2 mila euro
e quello della moglie ad almeno mille;
d) costruire la tabella relativa alla distribuzione del reddito complessivo familiare Z = X + Y ,
e calcolarne media e varianza.
[R: a) µx|y=0 = 2.22, µx|y=1 = 1.92, µx|y=2 = 1.25; b) σxy = −0.216, r = −0.369; c) 18; d)
µz = 2.72; σz2 = 0.7616]

Esercizio 2.6 Per la seguente serie di coppie di valori:

X 1 2 6 10 X5
Y 7 12 32 Y4 67

si sa che il coefficiente di correlazione rxy =1. Si determinino i due valori mancanti X5 e Y4 . [R:
X5 = 13; Y4 = 52]
Statistica n.o. - II canale 11
Esercizio 2.7 Si consideri il valore dei depositi in miliardi nelle aziende di credito e presso le
amministrazioni postali in Italia nel 1987:

Aziende di credito Amministrazioni postali


Totale 460 000 78 000

I due tipi di deposito sono cosı̀ distribuiti (percentualmente) nelle due ripartizioni del Centro-
Nord e Mezzogiorno:

Aziende di credito Amministrazioni postali


Centro-Nord 79.9% 65.9%
Mezzogiorno 20.1% 34.1%
Totale 100% 100%

a) Sulla base di queste informazioni si costruisca la tabella che classifica congiuntamente i valori
dei depositi per ripartizione territoriale e tipo di deposito.
b) Calcolare un indice adeguato per misurare la dipendenza tra i due caratteri.
[R: χ2 = 7585.39]

Esercizio 2.8 Data la seguente tabella a doppia entrata:

Y 2 4 6 tot
X
1 4
2 6 10
3
tot 10 100

completarla nell’ipotesi di indipendenza assoluta tra i due caratteri. Calcolare poi la media
aritmetica e la mediana di Y. [R: µy = 4.4; M ey = 4]

Esercizio 2.9 Data la seguente tabella:

Y 1 6 tot
X
1 70
3 50
7 30
tot 100 50 150

a) riempirla in modo che risulti χ2rel =1;


b) senza svolgere i calcoli, quanto vale χ2 ?
[R: χ2 = 150]
Statistica n.o. - II canale 12
Esercizio 2.10 Data la seguente tabella a doppia entrata:

Y 1 3 tot
X
1 90
3 50
7 60
tot 150 50 200

a) riempirla in modo che risulti χ2rel = 1;


b) calcolare poi χ2 . [R: χ2 = 200]

Esercizio 2.11 Per saggiare il giudizio sulla corrispondenza fra documentazione statistica e
realtà dei medici, è stato chiesto a un campione di essi se le statistiche ufficiali italiane sulle
malattie infettive rappresentino la situazione reale:

Giudizio
Tutte Solo alcune Nessuna Tot
Ruolo
Medico condotto 14 33 8 55
Mutualistico 35 88 22 145
Ospedaliero 33 89 30 152
Altri 5 14 3 22
Tot 87 224 63 374

Valutare se vi è dipendenza tra giudizio e ruolo dei medici. [R: χ2 = 1.74]

Esercizio 2.12 In 115 supermercati sono stati rilevati il prezzo di vendita (X) ed il numero
delle confezioni vendute (Y) di un certo tipo di prodotto ottenendo la seguente distribuzione
doppia:
Y
50-100 101-170 171-190 Tot
X
0.60-0.70 5 13 21 39
0.70-0.80 8 40 2 50
0.80-0.90 20 6 0 26
Tot 33 59 23 115
a) Valutare se vi è dipendenza assoluta e dipendenza lineare tra prezzo di vendita e numero di
confezioni vendute. Commentare i risultati.
b) Quanti supermercati hanno venduto almeno 170 confezioni ad un prezzo non superiore a
0.80?
Statistica n.o. - II canale 13
Esercizio 2.13 Per la seguente tabella:

Y
Y1 Y2 Y3 Y4
X
5 5 0 20 0
16 0 12 0 10

senza svolgere i calcoli, determinare χ2 e χ2rel . [R: χ2 = 47; χ2rel = 1]

Esercizio 2.14 Data la seguente distribuzione doppia:

X
1 2 3 4
Y
-1 0 9 9 0
0 5 0 0 5
1 4 0 0 4

commentare i valori che si ottengono per il χ2 e per rxy .[R: χ2rel = 0.5; rxy = 0]

Esercizio 2.15 Valutare se vi è dipendenza tra la regione di provenienza e la facoltà di iscrizione


per un campione di studenti iscritti al I anno dell’Università di Bologna nel 1974:

Provenienza
Sud-Isole Centro Nord Tot
Facoltà
A 10 41 29 80
B 34 148 185 367
C 86 122 170 378
D 21 35 38 94
Tot 151 346 422 919

[R: χ2 = 31.294]
Statistica n.o. - II canale 14
3 Esercizi di Calcolo delle Probabilità
Esercizio 3.1 Uno studente universitario ha programmato di sostenere nella sessione estiva
gli esami X e Y. Sia A l’evento
T “supera l’esame X” e sia B l’evento “supera l’esame Y”, con
P(A)=0.7, P(B)=0.5,
S P(A B)=0.4. Calcolare la probabilità che superi almeno uno dei due
esami. [R: P(A B)= 0.8]

Esercizio 3.2 Su 100 visitatori di un negozio, 60 hanno dichiarato di essere stati attratti da
un annuncio pubblicitario. In totale 40 visitatori hanno fatto acquisti, e tra questi 30 avevano
visto l’annuncio pubblicitario.
a) Quale e’ la probabilita’ di fare acquisti per coloro che hanno visto l’annuncio?
b) e per coloro che non l’hanno visto?
[R: a) 0.5; b) 0.25]

Esercizio 3.3 Una scheda elettronica e’ composta di due parti, A e B. Se la scheda risulta
guasta ci sono 50 possibilita’ su 100 che A sia guasta. Se A si guasta, allora la probabilita’ che
anche B risulti danneggiato (per cui bisogna procedere a sostituire sia A e B) e’ 0.7. Se A non e’
guasta, la probabilita’ di dover sostituire B e’ pari a 0.1. Calcolare la probabilita’ di sostituire
A e B. [R: 0.35]

Esercizio 3.4 Una cavia puo’ scegliere tra due strade: quella a destra (D) porta al cibo,
quella a sinistra (S) porta a una scarica elettrica. Da passate esperienze e’ noto che la prova
volta la cavia sceglie D o S a caso. Sottoponendo la cavia a una seconda prova si e’ inoltre
osservato che: se la prima volta e’ andata a D, la seconda va ancora a D con probabilita’ 8/10,
se la prima volta e’ andata a S, la seconda va a D con probabilita’ 6/10. Calcolare la probabilita’
che la cavia vada a D nella seconda prova. [R: 0.7]

Esercizio 3.5 Tre macchine producono rispettivamente il 45%, il 35% ed il 20% dei bulloni
prodotti in una certa fabbrica. Sul totale dei bulloni prodotti da ciascuna delle tre macchine
risultano difettosi rispettivamente il 2%, il 5%, e il 6% dei bulloni. Scelto a caso un bullone,
viene trovato difettoso. Quale e’ la probabilita’ che questo sia stato prodotto dalla macchina A?
[R: 0.234]

Esercizio 3.6 Una fabbrica produce RAM che possono avere due tipi di difetti, il difetto A
e il difetto B. Il responsabile per la qualità della fabbrica afferma che, dall’esperienza passata,
la probabilità che una RAM abbia almeno uno dei due difetti è pari a 0.3; la probabilità che
abbia il difetto A è pari a 0.3; la probabilità che abbia contemporaneamente i due difetti è pari
a 0.2. Calcolare la probabilità che una RAM abbia:
a) il difetto B;
b) il difetto A, dato che si è riscontrato che ha il difetto B.
[R: P(B)=0.2; P(A|B)=1]

Esercizio 3.7 Nel cinema Bianchini ci sono due sale. Marco ha deciso di andare a vedere
il film che viene proiettato nella sala B, ma è in ritardo. Sa che, arrivando all’ultimo momento,
la probabilità di trovare ancora un posto nella sala A è pari a 0.2, la probabilità di trovarlo in
almeno una delle due sale è 0.4, e la probabilità che vi sia ancora un posto nella sala B sapendo
che c’è ancora un posto nella sala A è 0.3. Quale è la probabilità che Marco riesca a vedere il
film che proiettano nella sala B? [R: P(B)=0.26]
Statistica n.o. - II canale 15
Esercizio 3.8 In ciascuna copia di una edizione economica dei Promessi Sposi, il 60% delle
pagine contiene almeno un errore di stampa. Se ne produce una ristampa riveduta in cui errori
di stampa sono contenuti solo nel 20% delle pagine. Da uno scaffale, che contiene 20 libri della
prima edizione e 10 della seconda, si sceglie un libro a caso. Si esamina una pagina, scelta
anch’essa in modo casuale, e si trova un errore di stampa.
a) Quale è la probabilità che il libro sia della prima edizione?
b) E della ristampa?
[R: P(I|E)=0.86; P(II|E)=0.14]

Esercizio 3.9 Un’urna contiene 4 palline bianche e 2 rosse, un’altra ne contiene 2 bianche
e 4 rosse. Da una delle due urne scelta a caso è stata estratta una pallina rossa. Quale è la
probabilità che sia stata estratta dalla prima urna? [R: P(U1 |R)=1/3]

Esercizio 3.10 Un’urna contiene 6 palline rosse e 4 nere, un’altra ne contiene 2 rosse e
8 nere. Se si estraggono con reimmissione 3 palline da una delle due urne scelta a caso, e si
osservano 3 palline nere, quale è la probabilità che queste siano state estratte dalla prima urna?
Come cambia questa
T T probabilità se l’estrazione
T T è fatta senza reimmissione?
[R: P(U1 |N N N)=1/9; P(U1 |N N N)=1/15]

Esercizio 3.11 Due tifosi, Paolo e Carlo, vanno spesso allo stadio. Paolo ha assistito al 70%
delle partite e Carlo ha assistito al 90% delle partite.
a) Sapendo che la presenza di Paolo allo stadio è indipendente dalla presenza di Carlo (e
viceversa), quale è la probabilità che almeno uno dei due tifosi abbia assistito ad una partita?
b) Quale è la probabilità che Paolo abbia assistito a una partita di campionato sapendo che
Carlo ha assistito
S alla stessa partita?
[R: P(P C)=0.97; P(P|C)=0.7]

Esercizio 3.12 Per arrivare ad una cena tra amici, Paolo e Giovanna scelgono, con uguale
probabilità, fra i seguenti mezzi di trasporto: bus, auto e bicicletta. Le probabilità che ciascuno
dei due amici giunga in ritardo, se prendono rispettivamente il bus, l’auto e la bicicletta, sono
pari a 0.6, 0.2 e 0.4.
a) Determinare la probabilità che Paolo arrivi in ritardo.
b) Se Paolo e Giovanna viaggiano indipendentemente, quale è la probabilità che almeno uno
giunga in ritardo?
c) Sapendo che Paolo èSarrivato in ritardo, quale è la probabilità che abbia viaggiato in auto?
[R: P(RP )=0.4; P(RP RG )=0.64; P(A|RP )=0.17]

Esercizio 3.13 Se una moneta lanciata 3 volte produce 2 teste e una croce, quale e’ la
probabilita’ che il primo lancio sia testa? [R: 2/3]

Esercizio 3.14 Quale e’ la probabilita’ che in 3 estrazioni (senza ripetizione) da un mazzo


di carte francesi si ottengano 3 figure? [R: 0.0099]

Esercizio 3.15 Una coppia di sposi decide di avere bambini fino alla nascita di un figlio
maschio (M). Sia X la variabile casuale che descrive il numero di figlie femmine prima della
nascita del maschio. Si assuma che ad ogni parto la probabilita’ che nasca un maschio sia
pari a 0.51, e che vi sia indipendenza tra i diversi parti per quanto riguarda il sesso dei nati.
Determinare la distribuzione di probabilita’ di X.
Statistica n.o. - II canale 16
Esercizio 3.16 La probabilità che durante la produzione giornaliera di una piccola azienda
di componenti elettronici, si verifichino X pezzi difettosi è data da:

P(X=0)=K, P(X=1)=3K, P(X=2)=K, P(X=3)=P(X=4)=2K, P(X ≥ 5)=0.

a) Determinare il valore della costante K.


b) Calcolare valore atteso e varianza della variabile casuale X.
c) Calcolare la probabilità che il numero di pezzi difettosi in un giorno sia tra 1 e 3.
[R: K=1/9; E(X)=2.11; var(X)=1.88; P(1 ≤ X ≤ 3) = 0.67]

Esercizio 3.17 Una variabile casuale discreta X ha la seguente funzione di ripartizione:

F(0)=0, F(1)=0.2, F(2)=0.4, F(3)=0.4, F(4)=0.8, F(5)=1.

a) Calcolarne il valore atteso e la varianza.


b) Calcolare la probabilità che X assuma un valore maggiore di 3.
[R: E(X)=3.2; var(X)=2.16; P(X>3)=0.6]

Esercizio 3.18 Un’urna contiene 5 palline bianche e 5 palline nere. Dall’urna vengono
estratte (senza ripetizione) 2 palline. Sia X la variabile casuale “numero di palline bianche su
due estratte”.
a) Calcolare E(X) e var(X).
b) Calcolare la probabilità che X assuma un valore maggiore o uguale a 1.
[R: E(X)=1; var(X)=0.44; P(X ≥ 1)=0.78]

Esercizio 3.19 Sia X il tempo in minuti che occorre al sig. Rossi per arrivare in ufficio la
mattina con la sua macchina. Supponendo che X abbia distribuzione uniforme nell’intervallo
(25,40), e che il sig. Rossi esce di casa ogni giorno alle 7.25, quale e’ la probabilita’ che arrivi in
ritardo se deve timbrare il cartellino entro le 8.00? [R: 1/3]

Esercizio 3.20 In un grande magazzino, aperto 6 giorni su 7, risulta, dalla passata espe-
rienza, che la vendita settimanale di confezioni di un certo prodotto si distribuisce come una
variabile casuale di Poisson. E’ inoltre noto che il numero medio di confezioni vendute giornal-
mente e’ pari a 0.25. Si vuole determinare di quante confezioni deve essere costituito lo stock di
magazzino perche’ si abbia una probabilita’ almeno pari a 0.95 di soddisfare la domanda di una
settimana. [R: 4 confezioni]

Esercizio 3.21 L’altezza di 450 studenti immatricolati all’Università di Roma Tre nel 1998 è
risultata in media di 170 cm., con uno s.q.m. di 7.5 cm. Nell’ipotesi che la statura si distribuisca
come una Normale, quale è il numero atteso di studenti con altezza
a) maggiore di 180 cm.;
b) minore o uguale a 160 cm.;
c) tra 162.5 e 172.5.
[R: n(X>180)'41; n(X≤160)'41; n(162.5<X<172.5)'212]

Esercizio 3.22 Se Z è una variabile casuale standardizzata, il valore di E Z 2 è




A 0
B 1 se Z è normale
C non ho sufficienti dati per calcolarlo
D 1.
Statistica n.o. - II canale 17
Esercizio 3.23 Sia X una v.c. N (5, 9). Trovare, facendo uso delle tavole:
a) P (6.41 < X < 7.82);
b) la probabilità che la v.c. X assuma un valore compreso fra -1 e 11;
c) il valore di X corrispondente al 30o percentile.
[R: P (6.41 < X < 7.82) = 0.1456; P (−1 < X < 11) = 0.9544; X30 = 3.41]

Esercizio 3.24 Un’urna contiene una pallina nera e nove bianche; vengono estratte 10
palline con ripetizione. Si calcoli la probabilità di estrarre due palline nere facendo uso: a)
della v.c. binomiale; b) dell’approssimazione con la v.c. di Poisson. Confrontare i risultati.[R:
P(N=2)=0.194; P(N=2)=0.184]

Esercizio 3.25 E’ noto che il 35% dei dipendenti di una multinazionale è single. Con-
siderando un campione casuale di 10 dipendenti:
a) determinare la probabilità che almeno due dipendenti siano single;
b) determinare la probabilità che il numero di single sia compreso tra 2 e 4;
c) preso un campione dieci volte più grande, calcolare la probabilità che al più 35 dipendenti
siano single.
[R: P(X≥2)=0.915; P(2≤X≤4)=0.666; P(X≤35)=0.5]

Esercizio 3.26 Si supponga che il numero di orologi a pendolo venduti quotidianamente da


un antiquario sia una variabile casuale di Poisson di parametro λ = 0.1. Si calcoli la probabilità:
a) che siano state effettuate 4 vendite in un periodo di 3 giorni consecutivi;
b) che trascorrano 3 giorni consecutivi senza che si abbiano vendite.
[R: P(X=4)=0.00025; P(X=0)=0.74]

Esercizio 3.27 Una ditta produttrice di fotocopiatrici sa che la durata di una macchina (in
migliaia di copie) si distribuisce come una normale con µ = 1600 e σ 2 = 3600. Essa risarcisce un
milione di lire all’acquirente se la durata della macchina acquistata è inferiore a 1450. Calcolare
la probabilità che:
a) su 5 macchine la ditta debba risarcire al massimo un milione di lire;
b) su 100 macchine la ditta debba risarcire più di un milione.
[R: P(N≤1)=0.9996; P(N>1)=0.1219]

Esercizio 3.28 Il numero di viaggi venduti in una settimana da ciascun agente dell’agenzia
Kalimera, specializzata in viaggi verso la Grecia, si distribuisce come una Poisson con valore
atteso λ=3. Il titolare dell’agenzia decide di dare un premio ai dipendenti che in una settimana
vendono almeno 4 viaggi.
a) Quale è la probabilità che un dipendente vinca il premio?
b) Supposto che non esista nessuna relazione tra il numero di viaggi venduti dai diversi
dipendenti dell’agenzia, calcolare la probabilità che non più di 3 dei 10 operatori complessivi
ricevano il premio.
c) Calcolare quanti viaggi vengono venduti mediamente in un mese.
[R: P(X≥4)=0.35; P(N≤3)=0.513; E(Y)=130]
Statistica n.o. - II canale 18
Esercizio 3.29 Il diametro interno delle guarnizioni prodotte dalla ditta Fido è di 0.502 cm
e la deviazione standard è di 0.005 cm. Gli scopi per i quali queste guarnizioni sono prodotte
permettono una tolleranza massima del diametro fra 0.496 e 0.508 cm, mentre nel caso contrario
le guarnizioni sono considerate difettose. Assumendo la distribuzione dei diametri Normale:
a) determinare la percentuale delle guarnizioni difettose prodotte dalla macchina;
b) determinare quale è la probabilità di trovarne almeno 2 difettose in un campione casuale
di 10 guarnizioni;
c) determinare quale è la probabilità di trovarne più di 22 difettose in un campione casuale
di 100 guarnizioni.
[R: P(D)=0.23; P(N≥2)=0.71; P(N>22)=0.5948]
Esercizio 3.30 Una coppia di dadi è lanciata 100 volte. Utilizzando l’approssimazione della
Binomiale con la Normale, calcolare la probabilità di ottenere non più di 15 volte un numero
pari. [R: P(N≤15)'0].
Esercizio 3.31 Nell’ambito di un collettivo di famiglie omogenee, il consumo giornaliero di
gas metano nel periodo Novembre-Marzo è una v.c. X in m3 , con E(X)=8, var(X)=7. Sapendo
che il gas metano viene fatturato a L. 500 al m3 e che il periodo è costituito da 150 giorni,
calcolare la probabilità che:
a) la spesa complessiva di una famiglia scelta a caso sia maggiore di L. 606000;
b) in un campione casuale di 5 famiglie, almeno 3 abbiano una spesa complessiva superiore
a L. 606000;
c) in un campione casuale di 100 famiglie, almeno 2 abbiano una spesa complessiva superiore
a L. 606000.
[R: P(S>606000)=0.35; P(N≥3)=0.2352]
Statistica n.o. - II canale 19
4 Esercizi di inferenza
Esercizio 4.1 Le cinque unità che compongono una popolazione presentano per la X i seguenti
valori: 3,4,6,12,17. Si considerino tutti i possibili campioni di ampiezza due che possono essere
estratti con ripetizione da questa popolazione. Calcolare:
a) la media della popolazione;
b) lo scarto quadratico medio della popolazione;
c) la distribuzione della media campionaria;
d) verificare che la media campionaria è una stima non distorta della media della popolazione;
e) controllare che la varianza della distribuzione campionaria delle medie è in accordo con il
risultato teorico.[R: µ = 8.4; σ = 5.31]

Esercizio 4.2 Sia X1 , X2 ,...,Xn un campione di ampiezza n (n ≥ 4) estratto da una popo-


lazione X con E (X) = µ e varianza σ 2 . Si considerino i seguenti stimatori alternativi per µ:

X1 X3 + X 4 X2 + X 3 − X4
S1 = 2 − + X2 e S2 = X1 −
n n n
a) Lo stimatore S1 è non distorto? In caso di risposta negativa proporre uno stimatore non
distorto per µ modificando S1 ;
b) lo stimatore S2 è non distorto? In caso di risposta negativa proporre uno stimatore non
distorto per µ modificando S2 ;
c) calcolare l’errore quadratico medio di S1 e di S2 ;
d) S1 e di S2 sono consistenti in media quadratica?
[R: S1 non distorto; S2 distorto, nS2 /(n-1) non distorto; MSE(S1 )=σ 2 6/n2 + 1 , MSE(S2 )=σ 2 3/n2 + 1 +
 

µ2 /n2 ; S1 e S2 non sono consistenti in media quadratica]

Esercizio 4.3 Sia X1 , X2 ,X3 un campione casuale estratto da una popolazione X con dis-
tribuzione di Poisson di parametro λ. Dati i due stimatori di λ:
2X1 + X2 + 2X3 X1 + X 3
T1 = e T2 =
5 2
a) stabilire se sono non distorti;
b) ricavare l’errore quadratico medio di T1 e di T2 ;
c) quale tra i due stimatori è preferibile, e perchè?
[R: T1 e T2 non distorti; MSE(T1 )=9λ/25, MSE(T2 )=λ/2; è preferibile T1 ]

Esercizio 4.4 Il numero di clienti che si presentano ad uno sportello bancario in un giorno
è descritto da una variabile casuale X con distribuzione di Poisson di parametro λ. Al fine di
stimare λ, è stato rilevato per cinque giorni il numero di clienti che si sono presentati a questo
sportello e si è osservato: 10, 13, 8, 14, 12.
a) Verificare se la media campionaria e’ uno stimatore consistente in media quadratica di λ.
b) Calcolarne la stima in corrispondenza del campione osservato.
[R: x = 11.4; lo stimatore è consistente in media quadratica]
Statistica n.o. - II canale 20
Esercizio 4.5 Un’impresa vuole valutare la durata media µ delle batterie prodotte nel
proprio stabilimento. In un campione casuale di n=6 batterie si osservano le seguenti durate in
ore:
x1 = 10, x2 = 40, x3 = 25, x4 = 32, x5 = 27, x6 = 16.
Ipotizzando che la varianza della durata sia pari a µ2 :
a) verificare se la media campionaria e’ uno stimatore non distorto e consistente in media
quadratica per µ e ricavare il valore della stima sulla base del campione dato;
3
b) considerare lo stimatore S= X e verificarne la non distorsione;
4
c) confrontare i due stimatori utilizzando l’errore quadratico medio.
[R: lo stimatore media campionaria è non distorto e consistente; S è distorto; MSE(L)=µ2 /n,
MSE(S)=µ2 (9 + n) /16n]

Esercizio 4.6 In un campione di 100 piccole imprese si sono rilevate le seguenti spese annue
per energia elettrica (in milioni):

X 1-5 5-9 9-12 12-16 16-20 tot


ni 2 37 32 28 1 100

a) Costruire un intervallo di confidenza per la spesa media annua µ al livello di confidenza


0.90, sapendo che la varianza della popolazione risulta essere σ 2 = 9.
b) Quale deve essere la numerosità n del campione affinché l’intervallo calcolato al punto a)
abbia lunghezza minore di 0.8?
[R: (9.618; 10, 602) ; n ≥ 152]

Esercizio 4.7 Per un campione casuale di 14 ragazzi, sono stati osservati i seguenti pesi (in
Kg):
48, 46, 45, 47, 53, 50, 38, 49, 40, 43, 46, 38, 50, 41.
Nell’ipotesi che tale campione provenga da una Normale, trovare l’intervallo di confidenza per
la media µ (incognita) dell’intera popolazione, con 1 − α=0.95. [R: (42.6; 47.98)]

Esercizio 4.8 Supponiamo che X1 , X2 ,...,Xn sia un campione casuale estratto da una popo-
lazione X con distribuzione Normale di media µ incognita e varianza σ 2 nota. Quale deve essere
la numerosità n del campione affinché sia possibile individuare un intervallo di confidenza per
µ, al livello di confidenza 0.95, di lunghezza minore di 0.01σ? [R: n ≥ 153665]

Esercizio 4.9 In un campione di 500 famiglie, l’intervallo al 99% del reddito mensile medio
(in milioni di lire) è dato da 2<µ<4. Se si fosse calcolato l’intervallo di confidenza al 90%, questo
sarebbe stato:
a) più stretto ma con un rischio maggiore di non comprendere il valore vero di µ;
b) più largo, ma con un rischio maggiore di non comprendere il valore vero di µ;
c) piu’ stretto, ma con rischio minore di non comprendere il valore vero di µ;
d) non si può dire nulla sull’ampiezza dell’intervallo.
Statistica n.o. - II canale 21
Esercizio 4.10 Su un campione casuale di n=300 individui è stato rilevato un carattere X,
con distribuzione normale. Al livello di confidenza del 95% si è costruito l’intervallo di confidenza
per la media di X, i cui estremi sono risultati pari a 54 e 56. Quanto valgono la media aritmetica
2
campionaria e la varianza campionaria corretta? [R: X = 55; S = 78.12]

Esercizio 4.11 Si determini l’intervallo di confidenza al 90% per la percentuale di voti che
in una circoscrizione elettorale otterrà un certo partito politico, sapendo che dopo lo spoglio
delle prime 200 schede questo ha ottenuto 70 voti, e che i votanti nel loro complesso sono stati
1000. Come si modifica l’intervallo se, a metà spoglio, quel partito ha ottenuto 175 voti? [R:
(0.295; 0.405); (0.315; 0.385)]

Esercizio 4.12 Per 100 incidenti stradali nella provincia Gonzales, una compagnia di assi-
curazioni ha pagato un risarcimento medio di L. 600 000, con uno s.q.m. di L. 150 000. Per la
totalità dei sinistri ha invece pagato un risarcimento medio pari a L. 450 000. Verificare se il
risarcimento nella provincia Gonzales puo’ essere assunto uguale a quello della media nazionale,
contro l’alternativa unidirezionale piu’ opportuna. Usare un livello di significatività del 5%. [R:
rifiuto l’ipotesi nulla]

Esercizio 4.13 Sia X il ritardo con cui il treno Romolo arriva alla stazione di Roma Termini.
Durante 5 controlli effettuati a caso in giorni diversi, sono stati ottenuti i seguenti ritardi in
minuti: 12, 37, 23, 27, 19. Assumendo che i ritardi si distribuiscono come una v. c. Normale:
a) verificare l’ipotesi che il ritardo medio sia uguale a 15 minuti, contro l’alternativa unidi-
rezionale piu’ opportuna, usando α=0.05;
b) calcolare il livello di significativita’ osservato;
c) calcolare l’intervallo di confidenza al livello del 95% per il ritardo medio. [R: non rifiuto
H0 ; 0.05 < p < 0.10; (12.02; 35.18)]

Esercizio 4.14 Supponendo di voler verificare al livello α=0.10 l’ipotesi nulla che il voto
medio riportato dagli studenti di Economia nell’esame di Statistica sia pari a 27 contro l’ipotesi
alternativa che sia pari a 25.5, quale dovrà essere la numerosità campionaria affinché la potenza
del test risulti almeno pari a 0.95? Ai fini della soluzione si assume che il voto all’esame di
Statistica abbia una distribuzione Normale con varianza pari a 9. [R: n ≥ 35]

Esercizio 4.15 Una società telefonica dichiara che nel 1990 l’importo della bolletta bimensile
pagata dagli abbonati privati ebbe una distribuzione con media 95 000 Lire e s.q.m. di 70 000
Lire.
a) Se si estrae un campione di 50 bollette dagli elenchi degli abbonati del 1990, quale è
approssimativamente la probabilità che la media campionaria degli importi sia maggiore di 100
000?
b) Estraendo un campione di ampiezza 100, la probabilità di cui al punto a) sarebbe maggiore
o minore? Perchè?
c) Una agenzia per la protezione del consumatore estrae un campione di ampiezza 100 ed
osserva una media campionaria degli importi pari a 105 000. Si può concludere che l’importo
medio bimensile pagato nel 1990 sia stato uguale a 95 000? Usare un livello di significatività del
5%.
d) Calcolare il livello di significativita’ osservato.
[R: P(X>100000)' 0.3085; la probabilità al punto a) sarebbe minore; non rifiuto l’ipotesi
nulla; p = 0.0764]
Statistica n.o. - II canale 22
Esercizio 4.16 Per una popolazione Normale(µ,1), si vuole sottoporre a test l’ipotesi H0 :
µ=0 contro l’ipotesi alternativa H1 : µ<0 attraverso un campione casuale di 50 osservazioni.
a) Individuare la regione critica del test per α=0.025.
b) Calcolare la potenza del test per µ=-0.5.
[R: R(α)= X : X < −0.28 ; 1 − β = 0.9406]

Esercizio 4.17 I pesi degli alunni di una scuola si distribuiscono normalmente con varianza
pari a 36 (Kg2 ).
a) Per α=0.07 e n=14, determinare la regione critica del test: H0 : µ=50; H1 : µ 6=50.
b) Sia X=46. A favore di quale ipotesi si conclude?
c) Calcolare il livello di significativita’ osservato.
d) Calcolare
 la potenza
 del test per  µ=45.
[R: X : X > 52.90 ∪ X < 47.1 ; H1 ; p = 0.0128; 1 − β = 0.9049]

Esercizio 4.18 Per una popolazione Normale di varianza unitaria, si vuole fare un test
d’ipotesi per verificare:

H0 : µ = 12.7
H1 : µ = 12

Si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità n=16
e se ne calcola la media campionaria. Se la media campionaria risulta minore di 12.2 si rifiuta
l’ipotesi H0 .
a) Calcolare α.
b) Calcolare β.
c) Supponendo di volere 1 − β ≥ 0.9, quale dovrà essere la numerosità campionaria? [R:
α = 0.0228; β = 0.2119; n ≥ 42]

Esercizio 4.19 Per una popolazione Normale di varianza 2 si vuole fare un test d’ipotesi
per verificare:

H0 : µ = 8
H1 : µ = 8.5

a) Posto α=0.07, sulla base di una numerosità campionaria n=25, trovare la regione critica.
b) Supponendo di aver osservato una media campionaria pari a 8.2, cosa si conclude?
c) Calcolare la potenza del test.
d) Trovare
 la numerosità
campionaria tale che la potenza risulti almeno pari a 0.98.
[R: R: X : X > 8.419 ; non rifiuto H0 ; 1 − β = 0.6141; n ≥ 1306].

Esercizio 4.20 Data una popolazione Normale di varianza unitaria, si vuole sottoporre a
verifica l’ipotesi H0 : µ=10 contro H1 : µ 6=10, attraverso un campione casuale di n = 4 unità. Si
adotta la seguente regola di decisione:

A : si accetta H0 se 8 ≤ X ≤ 11.

a) calcolare α.
b) Calcolare la potenza del test per µ=11.
[R: α = 0.0228; 1 − β = 0.5]
Statistica n.o. - II canale 23
Esercizio 4.21 In un campione di 1000 famiglie con 5 figli, la distribuzione del numero di
figli maschi è la seguente:

n. maschi 0 1 2 3 4 5 tot
n. famiglie 30 150 370 250 170 30 1000

a) Sul totale dei figli, quale è la percentuale di femmine?


b) Sia p la percentuale di femmine nella popolazione. Si vuole sottoporre a verifica l’ipotesi
H0 : p=0.5 contro l’alternativa H1 : p6=0.5, con α=0.05. Individuare la regione di accettazione
(A) del test, e indicare se si rifiuta o meno l’ipotesi H0 .
c) Calcolare il livello di significativita’ osservato.
[R: b
p = 0.506; A={b p : 0.486 < bp < 0.514} ; non si rifiuta H0 ; p = 0.3954]

Esercizio 4.22 La società Broglio decide di lanciare sul mercato un nuovo tipo di detersivo.
A questo scopo ne viene inviato gratuitamente un flacone a 150 persone chiedendo loro di
dichiarare se sono favorevoli all’acquisto. Di queste, solo 30 si dichiarano favorevoli.
a) Costruire un intervallo di confidenza al livello 1 − α = 0.7 per la proporzione di soggetti
che acquisteranno il prodotto;
b) verificare al livello α = 0.05 l’ipotesi nulla che la proporzione di soggetti che acquisteranno
il prodotto sia uguale al 30%.
c) calcolare il livello di significativita’ osservato.
[R: (0.166; 0.234) ; p = 0.0035]

Esercizio 4.23 La seguente tabella riporta i furti commessi scoperti in un grande magazzino
in un anno, a seconda del settore merceologico e dell’età del colpevole.

Settore Età
10-18 18-20 20-60
Abbigliamento 312 913 3367
Bigiotteria 710 377 208
Profumi 248 211 341

Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento, l’età del
colpevole sia 10-18. Costruire un intervallo di confidenza per p al 95%.[R: (0.0606; 0.0752) ; ]

Esercizio 4.24 L’efficacia di una nuova cura dimagrante viene sperimentata su sei soggetti
ottenendo i seguenti risultati:

X 68 56 58 62 74 66
Y 54 50 50 56 58 54

(dove con X si è indicato il peso prima della cura e con Y quello dopo la stessa). Sottoporre a
test l’ipotesi che la cura non abbia avuto effetto. [R: si rifiuta l’ipotesi nulla].

Esercizio 4.25 I voti in Economia (X) ed in Statistica (Y) riportati da dieci studenti sono
stati i seguenti:
X 20 24 28 27 18 22 29 30 23 21
Y 22 24 27 28 18 23 30 29 21 19
Sotto l’assunzione di Normalità, sottoporre a test l’ipotesi di eguaglianza in media dei voti di
Statistica a quelli di Economia. [R: non si rifiuta l’ipotesi nulla]
Statistica n.o. - II canale 24
Esercizio 4.26 In un campione di 100 studenti maschi si sono rilevati i seguenti pesi:

Peso (Kg) N. di studenti


60-63 5
63-66 18
66-69 42
69-72 27
72-75 8

Sottoporre a test l’ipotesi che i dati provengano da una distribuzione Normale. [R: non si rifiuta
l’ipotesi nulla]

Esercizio 4.27 La distribuzione dei pesi (X) dei portieri che hanno giocato nel campionato
di calcio di serie A e B del 1998-99 è risultata la seguente:

X n(X)
<68.5 4
68.5-71.5 12
71.5-74.5 20
74.5-77.5 17
77.5-80.5 19
80.5-83.5 10
>83.5 3

Si sottoponga a test l’ipotesi che i dati provengono da una distribuzione Normale. [R: non si
rifiuta l’ipotesi nulla]

Esercizio 4.28 La distribuzione dei matrimoni celebrati in Italia secondo lo stato civile è
risultata la seguente:

Stato civile delle spose


Stato civile degli sposi Nubili Vedove Divorziate
Celibi 301.933 1.138 2.200
Vedovi 3.964 1.286 577
Divorziati 4.571 330 954

Si controlli l’esistenza di una dipendenza assoluta fra i due caratteri e si commenti il risultato
ottenuto. [R: si rifiuta l’ipotesi nulla di indipendenza].

Esercizio 4.29 Ad un campione di 80 giovani in età compresa tra 25 e 35 anni è stato


chiesto se sono laureati e se hanno un’occupazione. Il risultato della rilevazione è contenuto
nella tabella seguente:

Stato occupazionale
Titolo di studio Occupato Disoccupato
Laureato 22 8 30
Non laureato 16 34 50
38 42 80

Si controlli l’esistenza di una dipendenza assoluta fra i due caratteri e si commenti il risultato
ottenuto. [R: χ2 = 12.845; si rifiuta l’ipotesi nulla di indipendenza]
Statistica n.o. - II canale 25
5 Esercizi sulla regressione
Esercizio 5.1 In 5 famiglie sono stati rilevati i seguenti redditi (X) e risparmi (Y):

X 80 110 90 60 60
Y 16 18 21 27 35

a) stimare i parametri della retta di regressione di Y su X;


b) sulla base della retta individuata al punto a), calcolare il presumibile valore del risparmio per
una famiglia con reddito pari a 50: Y(50);
b
c) determinare il valore del coefficiente di correlazione rxy .
[R: Y=45-0.27X;
b Y(50)=31.5;
b rxy = −0.75]

Esercizio 5.2 Data la seguente distribuzione doppia secondo i caratteri Y = ”età” e X = ”voto
all’esame di statistica”

Y
18-19 19-21 21-30
X
18-22 10 0 0 10
23-26 40 55 5 100
27-30 10 5 5 20
60 60 10 130
stimare i parametri della retta di regressione che esprime il voto in funzione dell’età e valutarne
la bontà di adattamento.[R: γ̂=19.9, δ̂=0.25, R2 =0.12]
Esercizio 5.3 Per due variabili statistiche X e Y si hanno le seguenti coppie di osservazioni:

X 1 3 4 7 8 10
Y 5 4.9 4.5 3 2.2 2

a) Stimare i parametri della retta di regressione di Y su X e valutarne la bontà di adattamento


tramite l’indice R2 .
b) Posto poi che si osservi X=12, sulla base della retta stimata qual’è il presumibile valore della
Y?
b = 5.75, βb = −0.39; R2 = 0.94; Y(12)=1.07]
[R: α b

Esercizio 5.4 Su un collettivo di lavoratori sono stati rilevati i caratteri Y = reddito annuo da
lavoro dipendente (in migliaia di euro) e X = reddito annuo da fabbricati (in migliaia di euro)

Y
0-30 30-60 60-100 100-200
X
0-30 27 3 0 0
30-60 12 20 8 0
60-100 0 3 12 5
100-200 0 0 5 5

a) stimare i parametri della retta di regressione che esprime il reddito annuo da lavoro dipendente
in funzione del reddito annuo da fabbricati e valutarne la bontà di adattamento;
b) sulla base del modello stimato al punto a) prevedere il reddito annuo da lavoro dipendente
per un individuo il cui reddito da fabbricati è 250 mila euro.
[R: α̂ = 9.75, β̂ = 0.80, R2 = 0.59, Yb (250) = 209.75]
Statistica n.o. - II canale 26
Esercizio 5.5 Per una distribuzione doppia si è stimata la retta di regressione X b i =10-2Yi .
Individuare quale, fra le seguenti, è la possibile equazione della retta di regressione di Y su X e
motivare la scelta:
a) Y
b i = 4+0.4Xi
b) Y
b i = -7-0.8Xi
c) Y
b i = -3-0.4Xi
d) Y
b i = 0.8+0.5Xi .

Esercizio 5.6 Data la seguente distribuzione doppia secondo i caratteri Y = reddito mensile
(in euro) e X = spesa mensile per alimenti (in euro)

Y
<800 800-1200 1200-2000 2000-4000
X
0-100 25 35 10 0
100-300 5 15 20 15
300-500 0 10 30 25

a) stimare i parametri della retta di regressione che esprime la spesa in funzione del reddito, e
valutarne la bontà di adattamento;
b) valutare se la relazione tra X e Y è meglio rappresentata dalla retta calcolata al punto a) o
dalla retta di regressione di X su log(Y ).
[R: a) γ=63.4, δ=0.10, R2 =0.37; b) anche in questo caso R2 =0.37]

Esercizio 5.7 Si siano osservate le seguenti coppie di valori per le variabili X e Y:

X 1 3 4 6 8 9 11 14
Y 1 2 4 4 5 7 8 9

stimare i parametri della retta di regressione di Y su X. [R: α


b = 0.548, βb = 0.636]

Esercizio 5.8 Data la seguente distribuzione di un insieme di viaggiatori secondo i caratteri


Y = spesa per vacanze estive 2007 (in migliaia di euro) e X = età

Y
0-0.5 0.5-1 1-2 2e+ tot
X
0-18 10
18-25 30
25-40 20
40-60 40
tot 30 10 20 40 100

a) riempire la tabella sotto l’ipotesi di massima dipendenza tra X e Y;


b) valutare se la relazione tra spesa ed età √
è meglio rappresentata dalla retta di regressione di
Y su X o dalla retta di regressione di Y su X e stimarne i parametri.
[R: si adatta meglio la retta di Y su X con R2 = 0.88; α̂ = −1.06; β̂ = 0.08]
Statistica n.o. - II canale 27
Esercizio 5.9 Su un collettivo di lavoratori sono stati rilevati i caratteri Y = reddito annuo da
lavoro dipendente (in migliaia di euro) e X = reddito annuo da fabbricati (in migliaia di euro)

Y
0-20 20-50 50-100 100 e +
X
0-20 27 2 1 0
20-50 12 19 8 1
50-100 1 3 11 5
100 e + 0 0 5 5

a) stimare i parametri della retta di regressione di Y su X e valutarne la bontà di adattamento;


b) sulla base della retta individuata al punto a), prevedere il reddito annuo da lavoro dipendente
per un individuo il cui reddito da fabbricati è 200 mila euro.
[R: α̂ = 11.46, β̂ = 0.77, R2 = 0.51, Yb (200) = 165.46

Esercizio 5.10 Per le seguenti 5 coppie di osservazioni:

X 1 2 3 4 5
Y 1 5 8 15 28

a) stimare i parametri della retta di regressione di Y su X2 ;


b) valutare la bontà di adattamento di tale funzione.
b = −0.546, βb = 1.086; R2 = 0.98]
[R: α

Esercizio 5.11 Date le seguenti coppie di osservazioni:

X 1 2.5 3 3.5 5
Y 3 19 29 41 87

a) stimare i parametri della retta di regressione di Y su X2 ;


b) confrontare la varianza residua (cioè il danno) che si ha utilizzando tale parabola con quella
che si avrebbe assumendo un modello lineare (vale a dire la retta di regressione di Y su X). Che
cosa possiamo concludere?
b = −2.078, βb = 3.54; V arres X 2 = 0.81, V arres (X) = 47.74]

[R: α

Esercizio 5.12 Per un campione di 8 famiglie con i seguenti redditi Y (in euro):

3.000; 3.250; 3.500; 3.750; 4.000; 4.250; 4.500; 4.750

si sono riscontrate, rispettivamente, le seguenti spese per il vestiario X (in euro):

285; 320; 350; 380; 415; 450; 455; 485

a) si stimino i parametri della retta di regressione della spesa per vestiario (X) in funzione del
reddito (Y), e si determini la bontà di adattamento della relazione stimata;
b) senza rifare tutti i calcoli, si stimino i parametri della retta di regressione della spesa per
vestiario in lire in funzione del reddito in lire.
[R: a) R2 = 0.986, γ b = −53.125, δb = 0.115; b) γb = −102864.344, δb = 0.115]
Statistica n.o. - II canale 28
Esercizio 5.13 Al fine di stabilire se esiste una relazione statistica tra l’altezza degli alberi di
ciliegie (X) ed il diametro medio delle ciliegie prodotte (Y), si considerino le osservazioni della
seguente tabella:
Diametro (cm.) 3.4 4.3 3.0 3.2 2.1
Altezza (m.) 5.5 6.0 5.6 5.1 4.5
a) Si stimino i parametri della retta di regressione di Y su X.
b) Si calcoli l’indice di bontà di adattamento R2 .
c) Si preveda, sulla base della relazione trovata al punto a), il diametro delle ciliegie prodotte
da un albero di altezza 3.5.
d) Si costruisca l’intervallo di confidenza per β con livello di confidenza del 95% e si verifichi
l’ipotesi H0 :β=0 contro l’alternativa H1 :β 6=0 (con un livello di significatività del 5%).
e) Si esprima l’altezza delle piante in centimetri e si indichi con W la corrispondente variabile
statistica. Senza rifare i calcoli, a partire dai parametri della funzione di regressione trovata al
punto a), determinare la funzione di regressione lineare di Y su W.
[R: Yb = 1.26x − 3.53, R2 = 0.82; Yb (3.5) = 0.88; (0.18; 2.34) , si rifiuta l’ipotesi nulla di indipen-
denza lineare; Yb = 0.0126w − 3.53]

Esercizio 5.14 In un campione di 12 famiglie si sono rilevati i pesi del padre (X) e del figlio
primogenito (Y) qui di seguito riportati:
X 75 73 77 74 78 72 80 76 78 77 79 81
Y 78 76 78 75 79 76 78 75 81 77 78 80
a) Stimare i parametri della retta di regressione della Y sulla X e calcolarne l’R2 .
b) Nell’ipotesi di normalità della componente accidentale, sottoporre a test le due ipotesi α=0
e β=1 e commentare i risultati.
[R: Yb = 38.48 + 0.51x, R2 = 0.46; si rifiuta l’ipotesi nulla di assenza di intercetta, si rifiuta
l’ipotesi nulla di coefficiente di regressione unitario]

Esercizio 5.15 In un campione di 15 famiglie si è rilevato il reddito annuo e la spesa per generi
alimentari:
Reddito 25 40 20 32 60 18 24 42 45 36 15 21 34 25 58
Spesa 8.0 11.4 6.5 9.6 16.2 6.0 7.5 12.0 15.0 12.2 6.0 7.5 10.0 8.0 14.1

a) Si stimino i parametri della retta di regressione della spesa per alimenti in funzione del reddito
netto annuo e si determini la bontà di adattamento della relazione stimata;
b) si verifichi l’ipotesi di indipendenza lineare fra le due variabili ad un livello di significatività
del 5%;
c) si verifichi inoltre, per la retta stimata, l’ipotesi di passaggio per l’origine.
[R: Yb = 2.41 + 0.23x, R2 = 0.93; si rifiuta l’ipotesi di indipendenza lineare; si rifiuta l’ipotesi di
passaggio per l’origine

Esercizio 5.16 In una indagine campionaria si sono rilevati i seguenti dati sulla superficie in
ettari (X) e sul rendimento in q/ha (Y) di 10 aziende cerealicole:
(3, 27) (2, 26) (4, 30) (3, 28) (4, 32)
(2, 30) (6, 33) (5, 29) (4, 31) (6, 31)
Si verifichi al livello di significatività del 5% l’ipotesi di indipendenza lineare del rendimento
dalla dimenzione aziendale contro l’ipotesi alternativa più opportuna. [R: α b = 25.64, βb = 1.04;
si rifiuta l’ipotesi di indipendenza lineare]
Statistica n.o. - II canale 29
Esercizio 5.17 Si considerino i seguenti dati relativi al numero di ore di studio (X) di un cam-
pione casuale di 8 studenti per la preparazione dell’esame di statistica ed il voto (Y) riportato:

X 100 95 100 80 75 150 130 160


Y 24 22 21 20 18 30 28 30

Nell’ipotesi di normalità della componente accidentale:


a) Stimare i parametri della retta di regressione della Y sulla X;
b) sottoporre a test l’ipotesi β = 0 contro l’alternativa β > 0;
c) trovare l’intervallo di previsione per il punteggio di uno studente che abbia studiato 110 ore
per la preparazione dell’esame.
[R: Yb = 8.55 + 0.14x; si rifiuta l’ipotesi di indipendenza lineare; (21.02; 26.88)]
Esercizio 5.18 I voti in Economia (X) ed in Statistica (Y) riportati da 10 studenti sono stati i
seguenti:
X 20 24 28 27 18 22 29 30 23 21
Y 22 24 27 28 18 23 30 29 21 19
a) Stimare i parametri della retta di regressione della Y sulla X.
b) Determinare l’intervallo di previsione per il voto in Statistica di uno studente che abbia preso
23 nell’esame di Economia, sotto l’assunzione di Normalità della componente accidentale.
[R: α
b = 0.505, βb = 0.975; (19.32; 26.54)]
Esercizio 5.19 Date le seguenti coppie di valori (X, Y):

(3, 5) (6, 12.5) (9, 14) (15, 35) (25, 65)

a) Determinare se la relazione esistente tra X e Y è meglio approssimata dalla retta di regressione


di Y su X o dalla retta di regressione di Y su X2 , e stimarne i parametri.
b) Nell’ipotesi di Normalità della componente accidentale, sottoporre a test l’ipotesi β = 0.
[R: si adatta meglio la retta di regressione di Y su X, con R2 = 0.984; α b = −5.832, βb = 2.77; si
rifiuta l’ipotesi nulla di indipendenza lineare].
Esercizio 5.20 Data la seguente distribuzione doppia relativa ad un insieme di grilli secondo
il numero di trilli emessi al minuto (carattere Y) e la temperatura del suolo in gradi centigradi
al momento dell’osservazione (carattere X):

Y
45 − 73 74 − 104 105 − 135 tot
X
19 − 23 4 1 0 5
23 − 29 2 4 0 6
29 − 35 0 2 2 4
35 − 39 0 1 6 7
tot 6 8 8 22

a) si stimino i parametri della retta di regressione della “temperatura del suolo” (X) in funzione
del “numero di trilli al minuto” (Y), e si determini la bontà di adattamento della relazione
stimata;
b) si determini inoltre l’intervallo di previsione (con α = 0.05) per la “temperatura del suolo”
in corrispondenza di un numero di trilli al minuto pari a 140.
[R: γ̂ = 9.19, δ̂ = 0.22, R2 = 0.71, (31.85; 48.13)]
Statistica n.o. - II canale 30
Esercizio 5.21 Si considerino i seguenti dati relativi al tasso di disoccupazione (X) e al tasso
di inflazione dei consumi privati (Y) in Italia negli anni 1991-1997:

X 8.8 9.0 10.3 11.4 11.9 12 12.2


Y 6.9 5.6 5.1 4.6 5.7 4.5 4.4

a) Stimare i parametri della retta di regressione del tasso di inflazione dei consumi privati
in funzione del tasso di disoccupazione e determinare la bontà di adattamento della relazione
stimata.
b) Nell’ipotesi di normalità della componente accidentale, verificare al livello di significatività
dell’ 1% l’ipotesi di indipendenza lineare fra le due variabili contro l’ipotesi alternativa più
opportuna.
[R: α̂ = 10.28, β̂ = −0.47, R2 = 0.6; non rifiuto l’ipotesi nulla]