Sei sulla pagina 1di 56

Esercizi di Statistica

per gli studenti di


Scienze Politiche
Universit di Firenze
Esercizi svolti da una selezione di compiti degli Esami
scritti di Statistica
VERSIONE PROVVISORIA Maggio 2003
A cura di
L. Matrone
F.Mealli
L.Mencarini
A.Petrucci
1
Ai nostri studenti dei corsi di Statistica
Con questa nuova versione delle dispense di esercizi svolti di Statistica ci proponiamo, ancora una
volta, lobiettivo di aiutarvi a superare la prova scritta dellesame di Statistica che tante
preoccupazioni, non del tutto fondate, vi crea.
Ed proprio per tener conto di queste vostre preoccupazioni che, sin dalla prima stesura, abbiamo
puntato non a presentare semplicemente degli esercizi di statistica ma ad illustrare lo svolgimento di
esercizi di statistica proposti in alcune sedute desame; inoltre la scelta degli esercizi raccolti stata
fatta in modo da fornire un panorama completo dei possibili temi desame sia dal punto di vista
formale che da quello sostanziale.
In questa nuova edizione, ampliata ed integrata, per ciascun problema sono stati messi in evidenza i
presupposti teorici e concettuali e sono stati indicati i dettagli del procedimento di calcolo necessario
per la determinazione dei risultati numerici richiesti nel tentativo di far comprendere come le
formalizzazioni algebriche delle varie misure statistiche si traducano in valutazioni numeriche a
partire dai dati disponibili.
Gli esercizi proposti sono stati raggrupparti secondo grandi temi: a) statistica descrittiva, b)
probabilit e variabili casuali, c) inferenza statistica, in modo da rendere pi agevole la consultazione.
Naturalmente non vi sfuggir che i molti richiami teorici costituiscono un utile aiuto per fornire le
risposte ai quesiti della cosiddetta Parte teorica della prova desame.
Vogliamo concludere questo nostro messaggio con un invito a voi tutti di segnalarci, non solo gli
eventuali errori, ma tutto ci che vi sembrerebbe utile aggiungere e/o eliminare per migliorare questo
supporto didattico e renderlo pi utile per la vostra preparazione allesame.
Buon lavoro!
I docenti di Statistica della Facolt di Scienze Politiche dellUniversit di Firenze
L.Matrone matrone@ds.unifi.it
F.Mealli mealli@ds.unifi.it
L.Mencarini mencarin@ds.unifi.it
A.Petrucci alex@ds.unifi.it
2
A. ESERCIZI DI STATISTICA DESCRITTIVA
Esercizio 1A.
Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato annuo in milioni di
vecchie lire:
Fatturato [300,500] ]500,800] ]800,1500] ]1500,2000]
Aziende 20 45 56 50
a) Determinare la distribuzione di frequenze relative.
Le frequenze relative si ottengono dividendo ciascuna frequenza assoluta per la numerosit del
collettivo N=

i =1
4
n
i
=20+45+56+50=171
Classi di
modalit
Frequenze
assolute
Frequenze
relative
Ampiezza di
classe
Densit di
frequenza
Valore centrale
X
i
, X
i+1
n
i
n
i
N
o
i
=X
i+1
X
i
d
i
=
n
i
o
i
c
i
=
X
i
+X
i+1
2
[300,500] 20
20
171
=0.117 500-300=200
20
200
=0.10
300+500
2
=400
]500,800] 45 0.2632 800-500=300 0.15 650
]800,1500] 56 0.3275 1500-800=700 0.08 1150
]1500,2000] 50 0.2924 2000-1500=500 0.10 1750
Totale 171 1.0000
b) Qual la percentuale di industrie con fatturato annuo superiore a 500 milioni e non superiore
a 1.5 miliardi?
Il numero di industrie con tali caratteristiche risulta dalla somma delle frequenze assolute delle classi ]
500,800] e ]800,1500]. La percentuale richiesta quindi
45+56
171
100=59.06%
c) Calcolare la classe modale del fatturato
E' la classe con la densita di frequenza pi elevata, che risulta essere la classe ]500, 800].
d) Calcolare il fatturato medio
Essendo le modalit raggruppate in classi necessario fare qualche ipotesi sulla distribuzione del
fatturato all'interno di ciascuna classe. Si pu ipotizzare, ad esempio, che le frequenze siano
concentrate sul valore centrale
c
i
di ogni classe, oppure che il fatturato medio in ogni classe sia pari
al valore centrale. Entrambe queste ipotesi conducono al calcolo del fatturato medio come:
j
X
=
1
N

i=1
4
c
i
n
i
=40020+65045+115056+175050171=1106.14
3
Esercizio 2A.
I tentativi di suicidio nel 1995 secondo l'et sono descritti dalla seguente distribuzione di frequenza:
Et
X
i
, X
i+1

N tentativi
n
i
[14,18[ 133
[18,25[ 499
[25,45[ 1400
[45,65[ 885
[65,75] 409
Si sa inoltre che la somma delle et di coloro che hanno tentato il suicidio pari a 141233 anni,
ovvero

i=1
N
x
i
=141233 .
a) Calcolare l'et media
La numerosit del collettivo N=

i =1
5
n
i
=3326 . Inoltre, poich la somma delle et di coloro che
hanno tentato il suicidio uguale a 141233, l'et media sar data da
j
X
=
141233
3326
=42.46
In questo caso non necessaria alcuna ipotesi semplificatrice per il calcolo della media come invece stato necessario
nell'esercizio 1 in quanto noto l'ammontare complessivo del carattere et nel collettivo.
b) Calcolare la percentuale di minorenni che hanno tentato il suicidio
Essendo i minorenni coloro che hanno et nella classe [14,18[ , tale percentuale risulta pari a
133
3326
100=3.99%
c) Calcolare la percentuale di coloro che hanno tentato il suicidio di et non inferiore a 18 anni e
minore di 65 anni
Il numero di persone che soddisfano la condizione richiesta dato dalla somma delle frequenze
assolute delle tre classi di et [18,25[, [25,45[ e [45,65[. Dunque la percentuale pari a
499+1400+885
3326
100=83.7%
d) Calcolare la classe modale
Essendo le classi di ampiezza diversa, necessario individuare la classe a cui corrisponde la densit di
frequenza pi elevata:
4
Classi di et
X
i
, X
i+1

Frequenze assolute
n
i
Ampiezza intervallo
o
i
=X
i+1
X
i
Densit di frequenza
d
i
=
n
i
o
i
[14, 18[ 133 4 33.25
[18, 25[ 499 7 71.29
[25, 45[ 1400 20 70.00.00
[45, 65[ 885 20 44.25
[65, 75] 409 10 40.90
Totale 3326
La classe modale dunque la classe [18,25[.
Esercizio 3A.
Sia data la variabile X = reddito mensile in milioni di vecchie lire, rilevata su un collettivo di
famiglie come segue:
Reddito
X
i
N di famiglie
n
i
1 1
2 0
3 5
4 4
a) Trovare la moda del reddito
La moda la modalit che si presenta pi frequentemente (ovvero che presenta frequenza assoluta pi
elevata); il reddito modale dunque pari a 3 milioni.
b) Trovare lo scarto quadratico medio del reddito
Lo scarto quadratico medio , o deviazione standard, la media quadratica degli scarti dalla media
c=
.
1
N

i =1
4
( X
i
j)
2
n
i
dove N=

i=1
4
n
i
=10
La media del reddito data da
j=
11+20+35+44
10
=
32
10
=3.2
e quindi
c
2
=
(13.2)
2
1+( 23.2)
2
0+(33.2)
2
5+(43.2)
2
4
10
=0.76
ed infine
c=.0.76=0.87
5
Ricordando che la varianza si pu anche determinare utilizzando la relazione:
c
2
=
1
N

i=1
k
X
i
2
n
i
j
2
si ottiene lo stesso risultato eseguendo i calcoli per la determinazione della varianza come segue:
c
2
=
1
2
1+2
2
0+3
2
5+4
2
4
10
3.2
2
=
1+45+64
10
10.24=0.76
c) Trovare lo scarto quadratico medio del reddito nell'ipotesi che ad ogni famiglia venga dato un
aumento di stipendio di 500 mila lire
Lo scarto quadratico medio, cos come la varianza, invariante per traslazione, ovvero se viene
aggiunta una costante a ciascuna determinazione del carattere lo scarto quadratico medio non
cambia:
c
o+X
=c
X
=0.87
Si ricordi, pi in generale, che date le costanti e si ha
c
o+ X
2
=
2
c
X
2
e di conseguenza
c
o+ X
=c
X
d) Trovare il rapporto di concentrazione per il reddito
Il rapporto di concentrazione definito come: R=
A
2j
ovvero come rapporto fra la differenza media
semplice e il valore che tale indice di variabilit assume nel caso di massima concentrazione.
La differenza media semplice data da
A=

i =1
k

j =1
k
X
i
X
j
n
i
n
j
N ( N1)
Per determinare i
k
2
addendi (k=4 numero di modalit) che compaiono al numeratore
dell'espressione precedente si possono costruire due tabelle nelle quali vengono calcolate le differenze
X
i
X
j

ed i prodotti
n
i
n
j
:
X
i
X
j
n
i
n
j
X
j
n
j
X
i
1 2 3 4 n
i
1 0 5 4
1 0 1 2 3 1 1 0 5 4
2 1 0 1 2 0 0 0 0 0
3 2 1 0 1 5 5 0 25 20
4 3 2 1 0 4 4 0 20 16
6
A questo punto il numeratore della differenza media semplice si ottiene moltiplicando elemento per
elemento le due tabelle precedenti e sommando i prodotti ottenuti:
A=
01+10+25+34+10+00+10+20+25+10+025+120+34+20+120+016
10(101)
A=
84
90
=0.993
e quindi il rapporto di concentrazione dato da
R=
0.993
23.2
=0.146
Esercizio 4A.
Nell'a.a. 1988-89, il numero degli iscritti in corso all'Universit in Italia per Facolt riportato
nella tabella che segue:
Facolt Studenti in corso (in migliaia)
Scientifiche 146
Mediche 100
Ingegneria 193
Economiche-Giuridiche-Sociali 520
Letterarie 239
Come evidente dai dati, l'unit statistica di rilevazione la Facolt ed il carattere il Numero di
studenti in corso, i valori forniti
( x
i
)
costituiscono quindi una successione di osservazioni sulla
variabile Numero di studenti in corso e la numerosit del collettivo N=5.
a) Disegnare il diagramma di Lorenz del numero di studenti.
Il diagramma di Lorenz una rappresentazione grafica che permette di evidenziare la concentrazione
di un carattere trasferibile. Per costruire il grafico necessario ordinare le intensit del carattere in
senso non decrescente; si calcolano poi le cumulate delle intensit assolute c
i
=

j=1
i
x
j
(i =1.N ) , le
cumulate delle intensit relative q
i
=
c
i
c
N
e le cumulate di frequenza relative p
i
=
i
N
, come risulta
nella seguente tabella:
i x
i
Intensit cumulate
c
i
Intensita relative cumulate
q
i
Frequeze relative cumulate
p
i
1 100 100 0.083 0.2
2 146 246 0.210 0.4
3 193 439 0.360 0.6
4 239 678 0.560 0.8
5 520 1198 1 1
Il diagramma di Lorenz si ottiene costruendo la spezzata di concentrazione i cui vertici sono i punti di
coordinate
( p
i
, q
i
) (i =0.N) con la posizione ( p
0
, q
0
)(0,0)
7
b) Calcolare il rapporto di concentrazione.
Il rapporto di concentrazione pu essere calcolato utilizzando l'indice di Gini dato da:
R=

i=1
N1
( p
i
q
i
)

i=1
N1
p
i
Dalla precedente tabella risulta:
i p
i
q
i
p
i
q
i
1 0.2 0.083 0.116
2 0.4 0.205 0.195
3 0.6 0.366 0.233
4 0.8 0.566 234

2 0.779
e quindi
R=
0.779
2
=0.389
Allo stesso risultato si pu giungere calcolando il rapporto di concentrazione come rapporto fra la
differenza media semplice e il doppio della media come di seguito indicato:
x
i
x
j

x
j
x
i
100 146 193 239 520
100 0 46 93 139 420
146 46 0 47 93 374
193 93 47 0 46 327
239 139 93 46 0 281
8
0 0,2 0,4 0,6 0,8 1
0
0,2
0,4
0,6
0,8
1
Diagramma di Lorenz
p
q
520 420 374 327 281 0
Si pu osservare che questa tabella simmetrica rispetto alla diagonale costituita dai valori zero
derivanti dalle differenze di intensit di una unit statistica con se stessa; di conseguenza il calcolo del
numeratore della differenza media semplice pu essere abbreviato moltiplicando per 2 la somma dei
valori al di sopra della diagonale indicata e quindi
A=

i =1
N

j =1
N
x
i
x
j

N ( N1)
=
2(46+93+139+420+47+93+374+46+327+281)
54
=
3732
20
=186.6
j=
100+146+193+239+520
5
=
1198
5
=239.6 2j=479.2
ed in definitiva
R=
A
2j
=
186.6
479.2
=0.389
9
Esercizio 5A.
Il capitale (in miliardi di lire) di una Societ suddiviso tra i soci nel seguente modo:
Socio 1 2 3 4 5
Capitale 3 1 0,5 10 5
a) Calcolare la variabilit del capitale mediante la differenza media semplice.
Le informazioni fornite costituiscono una successione di osservazioni sulla variabile Capitale e quindi
per calcolare la differenza semplice media si pu seguire la stessa procedura dell'esercizio precedente.
x
i
x
j

x
j
x
i
0.5 1 3 5 10
0.5 0 0.5 2.5 4.5 9.5
1 0.5 0 2 4 9
3 2.5 2 0 2 7
5 4.5 4 2 0 5
10 9.5 9 7 5 0
A=
2(0.5+2.5+4.5+9.5+2+4+9+2+7+5)
54
=
246
54
=
46
10
=4.6
b) Rappresentare la concentrazione del capitale mediante la spezzata di Lorenz.
Si pu procedere come fatto al punto a) dell'esercizio precedente.
i x
i
Intensit cumulate
c
i
Intensit relative cumulate
q
i
Frequeze relative cumulate
p
i
1 0.5 0.5 0.0256 0.2
2 1 1.5 0.0769 0.4
3 3 4.5 0.2307 0.6
4 5 9.5 0.4871 0.8
5 10 19.5 1 1
-0,1 0,1 0,3 0,5 0,7 0,9 1,1
-0,1
0,1
0,3
0,5
0,7
0,9
1,1
Diagramma di Lorenz
p
q
10
c) Determinare il rapporto di concentrazione.
Avendo nel punto a) gi calcolato la differenza media semplice, per determinare il rapporto di
concentrazione si deve calcolare la media:
j=
0.5+1+3+5+10
5
=
19.5
5
=3.9
e quindi
R=
A
2j
=
4.6
7.8
=0.5897
Esercizio 6A.
Su un collettivo formato da 120 maschi e 80 femmine stata rilevata l'et in anni compiuti
ottenendo la seguente distribuzione percentuale per genere:
Et % Maschi % Femmine
0 - 19 10 20
20 - 29 10 20
30 - 49 30 30
50 - 89 50 30
Totale 100 100
Le informazioni fornite si riferiscono ad una variabile statistica discreta suddivisa in classi della quale
vengono fornite le distribuzioni percentuali in due sottocollettivi (maschi e femmine). La frequenza
percentuale il numero di unit statistiche per ogni 100 unit del collettivo, ovvero valgono le
seguenti relazioni
p
i
=
n
i
(
N
100
)
=
n
i
N
100

n
i
=
p
i
100
N
p
i
= f
i
100 f
i
=
p
i
100
nella quale
p
i
la frequenza percentuale,
n
i
la frequenza assoluta,
f
i
la frequenza relativa ed N
la numerosit del collettivo.
a) Trovare il numero di unit statistiche nel collettivo di et minore di 20 anni
Per determinare tale numero (q), date le informazioni disponibili, bisogner sommare il 10% dei
maschi di et inferiore a 20 anni al 10% delle femmine con la stessa caratteristica
q=
10
100
120+
20
100
180=12+16=28
b) Trovare la percentuale di unit statistiche nel collettivo di et maggiore o uguale a 50 anni
Bisogner prima determinare il numero di unit statistiche (n) dell'intero collettivo che soddisfano alla
condizione richiesta e poi calcolarne la percentuale (p) rispetto all'intero collettivo:
n=
50
100
120+
30
100
80=60+24=84 e quindi la percentuale richiesta p=
84
120+80
100=42%
11
c) Trovare il numero di maschi di et maggiore o uguale a 30 anni
Il numero richiesto dato da
30+50
100
120=96
d) Trovare le classi modali di et per i maschi e le femmine
Sar necessario individuare per ciascun sottocollettivo la classe cui corrisponde la massima densit di
frequenza; determinare tale classe equivalente a determinare la classe con la massima densit di
frequenza relativa in quanto, dette d
i
, 6
i
e o
i
rispettivamente la densit di frequenza assoluta,
quella relativa e il numero di modalit per la classe i-ma, si ha:
d
i
=
n
i
o
i
=
n
N
N
o
i
=
f
i
o
i
N =6
i
N
dalla quale si deduce che, qualunque sia la classe, la densit di frequenza assoluta proporzionale
secondo N alla densit di frequenza relativa 6
i
Classe
(a
i
, b
i
)
Frequenze
relative
Maschi
f
i M
Frequenze
relative
Femmine
f
i F
Numero di
modalit della
classe
o
i
=b
i
a
i
+1
Densit di
frequenza
relativa
Maschi
6
i M
Densita di
frequenza
relativa
Femmine
6
i F
(0 , 19) 0.10 0.20 20 0.0050 0.0100
(20 , 29) 0.10 0.20 10 0.0100 0.0200
(30 , 49) 0.30 0.30 20 0.0150 0.0150
(50 , 89) 0.50 0.30 40 0.0125 0.0075
Pertanto la classe modale per i maschi (30 , 49) anni, mentre per le femmine la classe (20 , 29)
anni.
Esercizio 7A.
In un collettivo di 200 studenti, di cui 30 sono lavoratori, stato rilevato il voto ad un certo esame
ottenendo la seguente distribuzione percentuale del voto per condizione occupazionale dello
studente:
Voto % Studenti non lavoratori % Studenti lavoratori
18 - 22 10 20
23 - 25 10 40
26 - 28 30 20
29 - 30 50 20
Totale 100 100
12
L'ESERCIZIO SIMILE AL PRECEDENTE, QUINDI VENGONO FORNITI SOLO I RISULTATI
a) Trovare il numero di unit statistiche nel collettivo con voto minore di 23
23 unit
b) Trovare la percentuale di unit statistiche nel collettivo con voto maggiore o uguale a 29
45.5%
c) Trovare il numero di studenti lavoratori con voto maggiore o uguale a 26
12
d) Trovare le classi modali del voto per gli studenti e gli studenti lavoratori
La classe modale per gli studenti quella di voto 29-30, per gli studenti lavoratori invece quella 23-
25.
Esercizio 8A.
Le abitazioni di una citt vengono distinte in quelle abitate dai proprietari e in quelle abitate da
affittuari. Le distribuzioni di frequenza relativa delle abitazioni per numero di vani vengono
riportate nella tabella che segue; si sa inoltre che il numero di abitazioni abitate dai proprietari
4000 e quello delle abitazioni in affitto 6000.
Numero di vani 1 2 3 4 5 6 Totale
Abitate da proprietari 0,05 0,10 0,15 0,16 0,23 0,31 1
Abitate da affittuari 0,17 0,21 0,22 0,18 0,13 0,09 1
a) Calcolare il numero totale di abitazioni con un numero di vani non inferiore a 5
Si sa che le abitazioni abitate da proprietari sono 4000, mentre quelle abitate da affittuari sono 6000.
Il numero di abitazioni, abitate da proprietari, con un numero vani5 sar dato da
(0.23+0.31) 4000=0.544000=2160 mentre quello per le case abitate da affittuari sar
(0.13+0.09) 6000=0.226000=1320 e quindi il numero di abitazioni richiesto dato da
2160+1320= 3480
b) Calcolare il numero medio di vani per il complesso delle abitazioni
Si pu determinare la media richiesta in due modi:
1) costruendo la tabella delle frequenze assolute a partire da quella delle frequenze relative date dal
problema
Numero vani
X
i
1 2 3 4 5 6 Totale
Abitate da proprietari
n
i p
200 400 600 640 920 1240 4000
Abitate da affittuari
n
i a
1020 1260 1320 1080 780 540 6000
Totale
n
i
1220 1660 1920 1720 1700 1780 10000
13
e calcolando la media nel modo usuale
j=
11220+21660+31920+41720+51700+61780
10000
=3.636
2) oppure calcolando le medie per le due sottopopolazioni (proprietari e affittuari) e determinando la
media richiesta come media delle due medie
j
p
=
1200+2400+3600+4640+5920+61240
4000
=4.35
j
a
=
11020+21260+31320+41080+5780+6540
6000
=3.16
j=
4.354000+3.166000
10000
=3.636
c) Rappresentare graficamente le abitazioni per numero di vani abitate da affittuari
Si vuole mettere in evidenza che, nel grafico 1, i bastoncini sono stati disegnati con l'obiettivo di
mettere in evidenza le ordinate dei punti (
X
i
, n
i
) e che lo spessore dei bastoncini del tutto
arbitrario e non ha nessun significato. Il grafico andrebbe fatto rappresentando in un riferimento
cartesiano i punti (
X
i
, n
i
) come nel grafico 2.
1 2 3 4 5 6
0
200
400
600
800
1000
1200
1400
Abitazioni abitate da affittuari
per numero di vani
N vani
N


A
b
i
t
a
z
i
o
n
i
Grafico 1
0 1 2 3 4 5 6 7
0
200
400
600
800
1000
1200
1400
1600
1800
2000
Abitazioni abitate da affittuari
per numero di vani
N Vani
N


A
b
i
t
a
z
i
o
n
i
Grafico 2
14
Esercizio 9A.
In un collettivo di pazienti sono stati rilevati la quantit di colesterolo in milligrammi per 100
millilitri di sangue ed il genere. Dallo spoglio delle osservazioni si ottenuta la seguente
distribuzione doppia di frequenze
Colesterolo Maschio Femmina
[120,160] 40 20
]160,180] 10 12
]180,200] 20 10
]200,240] 10 20
]240,300] 45 10
a) Rappresentare graficamente la distribuzione del colesterolo
Lo spoglio effettuato per il carattere quantit di colesterolo ha generato una variabile quantitativa
continua, suddivisa in classi, pertanto la rappresentazione grafica opportuna costituita
dall'istogramma. Per costruire l'istogramma bisogna valutare la densit di frequenza per classe, tale
valutazione si effettua ipotizzando una uniforme distribuzione della variabile in ciascuna classe e
calcolando quindi la densit come rapporto fra frequenza e ampiezza di classe
Classi

X
i
, X
i+1

Frequenze
assolute
n
i
Ampiezza della
classe
o
i
=X
i+1
X
i
Densit di
frequenza
d
i
=
n
i
o
i
Valori centrali
c
i
=
X
i
+X
i+1
2
[120, 160] 60 40 1.5 140
]160, 180] 22 20 1.1 170
]180, 200] 30 20 1.5 190
]200, 240] 30 40 0.75 220
]240, 300] 55 60 0.91 270
La rappresentazione per istogrammi avviene costruendo tanti rettangoli quante sono le classi, le cui
basi hanno lunghezza uguale all'ampiezza di classe, con gli estremi negli estremi di classe, e le cui
altezze sono pari alla densit di classe, l'area di ciascun rettangolo quindi pari alla frequenza assoluta
della classe.
15
b) Calcolare la media del colesterolo per ciascuno genere
I dati sono raggruppati in classi quindi si pu determinare solo una media approssimata nell'ipotesi di
uniforme distribuzione nella classe, sotto tale ipotesi la media della classe concide con il punto medio
della classe stessa e quindi l'ammontare del carattere nella classe si pu valutare come prodotto fra il il
valore centrale di classe
c
i
e la frequenza di classe
n
i
Di conseguenza per determinare la media
aritmetica approssimata si utilizza l'espressione:
j=

i=1.k
c
i
n
i
N
e quindi
j
maschi
=
14040+17010+19020+22010+27045
125
=203.6
j
femmine
=
14020+17012+19010+22020+27010
72
=192.2
c) Calcolare la classe modale del colesterolo per i maschi
La classe (o le classi modali) sono quelle con densit di frequenza pi elevate
Classi Frequenze assolute
(maschi)
Ampiezza di classe Densit di frequenza
[120, 160] 40 40 1
]160, 180] 10 20 0,5
]180, 200] 20 20 1
]200, 240] 10 40 0,25
]240, 300] 45 60 0,75
Ci sono due classi modali: [120, 160] e ]180, 200].
16
Esercizio 10A.
In un collettivo di 10 studenti stato rilevato il voto riportato all'esame di Statistica e quello
riportato all'esame di Storia Contemporanea:
Studente 1 2 3 4 5 6 7 8 9 10
Voto a Statistica (X) 28 22 18 18 20 30 20 23 23 27
Voto a Storia Contemporanea (Y) 30 28 27 18 28 28 28 27 27 18
a) Costruire la distribuzione doppia di frequenze (X,Y)
Bisogna costruire una tabella a doppia entrata nella quale viene riportato il numero di unit statistiche
sulle quali si osserva la stessa coppia di modalit
( X
i
,Y
j
)
Si ottiene cos la seguente distribuzione bivariata
Voto a Storia contemporanea(Y)
Voto a Statistica (X) 18 27 28 30 Totale di riga
18 1 1 0 0 2
20 0 0 2 0 2
22 0 0 1 0 1
23 0 2 0 0 2
27 1 0 0 0 1
28 0 0 0 1 1
30 0 0 1 0 1
Totale di colonna 2 3 4 1 10
I totali per riga e per colonna costituiscono le frequenze corrispondenti alle variabili marginali X e Y .
b) Calcolare il voto mediano dell'esame di Statistica
Occorre ordinare i voti riportati all'esame di Statistica, ottenendo la seguente successione ordinata
18, 18, 20, 20, 22, 23, 23, 27, 28, 30
Poich il numero di unit statistiche N=10, quindi pari, bisogner considerare i voti riportati dalle
unit statistiche che occupano le posizioni
N
2
=5 e
N
2
+1=6 ,tali voti sono rispettivamente 22 e 23,
la mediana per definizione un qualunque valore fra i due voti individuati: per convenzione si assume
come mediana la media fra i due valori e quindi si ha M
e
=
22+23
2
=22.5 .
c) Stabilire se vi indipendenza in media di X da Y
Vi indipendenza in media di X da Y, se al variare di Y le medie delle condizionate
X /(Y=Y
j
)
rimangono costanti. Determiniamo quindi tali medie:
17
j
X / (Y =18)
=
181+271
2
=22.5
j
X / (Y =27)
=
181+232
3
=21.3
j
X / (Y =28)
=
202+221+301
4
=23
j
X / (Y =30)
=
281
1
=28
Le medie condizionate non sono uguali fra loro e quindi si pu dire che non c' indipendenza in media
di X da Y.
Esercizio 11A.
In un collettivo di giovani si osservato l'atteggiamento verso il fumo per classi di et ottenendo la
seguente distribuzione di frequenze:
Classi di et
[16 , 18] ]18 , 22] ]22 , 25] ]25 , 30]
Fuma 7 8 21 30
Non fuma 16 18 9 10
a) Calcolare la classe modale per l'et di chi fuma e di chi non fuma
Frequenze
assolute
Densit di frequenza

X
i
, X
i+1

Fumatori
n
i , F
Non
fumatori
n
i , NF
Ampiezza
della classe
Valore
centrale
Fumatori
Non
fumatori
n
i
[16, 18] 7 16 2 17 3.5 8 23
]18, 22] 8 18 4 20 2 4.5 26
]22, 25] 21 9 3 23.5 7 3 30
]25, 30] 30 10 5 27.5 6 2 40
Totale 66 53 119
La classe modale per i fumatori ]22, 25] e per i non fumatori ]16, 18]
b) Calcolare il rapporto di correlazione dell'et dall'atteggiamento verso il fumo.
Poich la variabile suddivisa in classi tutti gli indici statistici coinvolti saranno calcolati utilizzando i
valori centrali delle classi.
Il rapporto di correlazione cos definito:
18
j
X / Y
=
Devianza frai gruppi
Devianza totale
=
D
B
D
T
=

j=1
h
(j
j
j)
2
n
. j

i=1
k
(C
i
j)
2
n
i.
nella quale j
j
e j sono rispettivamente la media di X nel j-mo gruppo e nella popolazione e
C
i
sono i valori centrali delle classi.
j=

i=1
4
C
i
n
i.
N
=
1723+2026+23.530+27.540
119
=22.8235
j
fumatori
=

i=1
4
C
i
n
i1
n
.1
=
177+208+23.521+27.530
66
=24.2045
j
non fumatori
=

i =1
4
C
i
n
i2
n
.2
=
1716+2018+23.59+27.510
53
=21.1037
D
B
=( 24.204522.8235)
2
66+(21.103722.8235)
2
53=282.5
D
T
=(1722.8235)
2
23+(2022.8235)
2
26+(23.522.8235)
2
30+( 27.522.8235)
2
40=
=1875.87
j
XY
2
=
282.5
1875.87
=0.1506
Esercizio 12A.
In un collettivo di 420 volontari si osservato la frequenza di attivit di volontariato per classi di
et ottenendo la seguente distribuzione di frequenze relative percentuali:
Classi di et (X)
Frequenza di attivit di volontariato
(Y)
[14,20] ]20,35] ]35,55] ]55,60]
Almeno una volta la settimana 10 15 10 5
Una o pi volte al mese 10 20 20 10
19
a) Quanti sono i volontari con et superiore a 20 anni e non superiore a 55 anni.
La frequenza richiesta data da
15+10+20+20
100
420=273
b) Quanti sono i volontari che prestano la loro attivit almeno una volta la settimana e che
hanno un'et superiore a 55 anni e non superiore a 60 anni.
Il numero di volontari richiesto dato da:
5
100
420=21
c) Determinare il rapporto di correlazione dell'et dalla regolarit del servizio di volontariato.
Prima di procedere nel calcolo del rapporto di correlazione sar necessario individuare i valori centrali
di classe per la variabile X e la sua distribuzione marginale di frequenze percentuali.
Valore centrali
C
i
17 27.5 45.0 57.5
Frequenza percentuale
p
i
20 35 30 15
Indicando con
n
1i
e p
1i
rispettivamente la frequenza assoluta e percentuale di coloro che svolgono
attivit di volontariato almeno una volta la settimana e hanno un'et della classe i-ma, con
n
2i
e p
2i
le corrispondenti frequenze di coloro che svolgono attivit di volontariato una o pi volte
al mese, con N la numerosit del collettivo, con j
1
l'et media di coloro che svolgono attivit di
volontariato almeno una volta la settimana, con j
2
l'et media di coloro che svolgono attivit di
volontariato una o pi volte al mese, con l'et media del collettivo di volontari e tenendo conto di
quanto detto nell'esercizio 6A, si ha
p
1i
=
n
1i
N
100 e quindi
j
1
=

i=1
4
C
i
n
1i
n
1.
=

i=1
4
(
C
i

n
1i
N
100
N
100
)

i =1
4
n
1i
=

i=1
4
C
i
p
1i

i=1
4
n
i1

100
N
=

i =1
4
C
i
p
1i

i =1
4
p
1i
j
1
=
1710+27.515+4510+57.55
40
=
1320
40
=33
ed analogamente
j
2
=
1710+27.520+4520+57.510
60
=36.8
j=
1720+27.535+4530+57.515
100
=35.15
Possiamo ora determinare il rapporto di correlazione dell'et dalla frequenza di attivit di volontariato
j
XY
2
=
Devianza frai gruppi
Devianza totale
=
D
B
D
T
20
D
B
=

j=1
2
(j
i
j)
2
p
j
=(3335.15)
2
40+(36.5835.15)
2
60=307.594
D
T
=

i=1
4
(C
i
j)
2
p
i
D
T
=(1735.15)
2
20+(27.535.15)
2
35+(4535.15)
2
30+(57.535.15)
2
15=19040.23
j
XY
2
=
307.59
19040.23
=0.01615
Esercizio 13A.
Su un collettivo di individui sono stati rilevati i caratteri X (Peso in Kg) e Y (Altezza in cm)
ottenendo la seguente distribuzione congiunta di frequenze:
Y
X 165 170 175
60 2 0 0
70 0 1 0
80 1 0 1
a) Ricostruire la successione ordinata dell'altezza
Al fine di rispondere al quesito costruiamo la distribuzione di frequenze della marginale Y
Y
n
. j
165 3
170 1
175 1
dalla quale otteniamo la successione richiesta
165 , 165 , 165 , 170 , 175
b) Calcolare la media e la mediana dell'altezza
Essendo N=5 (dispari) la mediana il valore che occupa il terzo posto
(
N +1
2
=3
)
nella
successione ordinata; quindi la mediana pari a 165
Per calcolare la media della Y utilizziamo la distribuzione di frequenze costruita al punto precedente
j
y
=
1633+1701+1751
5
=
840
5
=168
c) Calcolare il peso medio per gli individui che hanno un'altezza di 165 cm
j
XY =165
=
602+700+801
3
=66.66
21
d) Calcolare il coefficiente di correlazione lineare tra peso e altezza
Il coefficiente di correlazione lineare dato da:
j
XY
=
c
XY
c
X
c
Y
=
Cov ( X , Y)
.Var ( X )Var (Y)
j
X
=
1
N

i=1
3
X
i
n
i
=
602+701+802
5
=
350
5
=70
c
X
2
=
1
N

i=1
3
( X
i
j
X
)
2
n
i
=
(6070)
2
2+(7070)
2
1+(8070)
2
2
5
=80
c
X
=.80=8.94
c
Y
2
=
1
N

i =1
3
(Y
j
j
Y
)
2
n
j
=
(165168)
2
3+(170178)
2
1+(175168)
2
1
5
=16
c
Y
=.16=4
c
XY
=
1
N

i =1
3

j=1
3
( X
i
j
X
)(Y
j
j
Y
)n
ij
c
XY
=
(6070)(165168)2+(8070)(165168)1
5
+
+
(7070)(170168)1+(8070)(175168)1
5
c
XY
=
6030+0+70
5
=
100
5
=20
j
XY
=
20
48.94
=0.56
Esercizio 14A.
Lo stipendio medio annuo (X), in migliaia di euro, dei dirigenti e il numero di dipendenti (Y) di 9
aziende sono riportati nella tabella che segue:
Azienda 1 2 3 4 5 6 7 8 9
Stipendio 45 30 84 63 62 61 46 43 42
NDipendenti 14 16 46 32 22 21 28 17 24
22
a) Calcolare il coefficiente di correlazione lineare fra X e Y
I dati forniti costituiscono quella che si chiama una successione doppia, infatti per ciascuna delle 9
unit statistiche di rilevazione (aziende) sono riportati i valori delle due variabili Stipendio medio
annuo dei dirigenti e Numero di dipendenti, ci determina una semplificazione delle espressioni per il
calcolo degli tutti indici statistici da utilizzare come appresso indicato

j
X
=
1
9

i=1
9
x
i
c
X
2
=
1
9

i=1
9
( x
i
j
X
)
2
=
1
9

i=1
9
x
i
2
j
X
2
j
Y
=
1
9

i=1
9
y
i
c
Y
2
=
1
9

i=1
9
( y
i
j
Y
)
2
=
1
9

i =1
9
y
i
2
j
Y
2
c
XY
=
1
9

i=1
9
( x
i
j
X
)( y
i
j
Y
)=
1
9

i=1
9
x
i
y
i
j
X
j
Y
j
XY
=
c
XY
c
X
c
Y
e quindi
j
X
=
45+30+84+63+62+61+46+43+42
9
=
476
9
=52.89
j
Y
=
14+16+46+32+22+21+28+17+24
9
=
220
9
=24.44
c
X
2
=
45
2
+30
2
+84
2
+63
2
+62
2
+61
2
+46
2
+43
2
+42
2
9
52.89
2
=
27244
9
2797.23=229.88
c
Y
2
=
14
2
+16
2
+46
2
+32
2
+22
2
+21
2
+28
2
+17
2
+24
2
9
24.44
2
=
6166
9
597.53=87.58
c
XY
=
4514+3016+8446+6332+6121+4628+4317+4224
9
52.8924.44=
=
12662
9
1292.84=114.05
j
XY
=
114.05
.229.88.87.58
=
114.05
15.169.36
=0.8
b) Determinare la mediana del numero di dipendenti
Ricordiamo che la mediana l'intensit del carattere ordinabile posseduta dall'unit statistica che,
nella sucessione ordinata delle modalit, preceduta e seguita dallo stesso numero di unit statistiche
del collettivo; per individuare quindi la mediana sar necessario ordinare le unit statistiche in ordine
crescente (descrescente) secondo il numero di dipendenti, la successione ordinata delle osservazioni
date la seguente
Azienda 1 2 8 6 5 9 7 4 3
NDipendenti 14 16 17 21 22 24 28 32 46
l'unit statistica preceduta e seguita dallo stesso numero di unit statistiche (4) l' Azienda 5 che
possiede un numero di dipendenti pari a 22, quindi la mediana proprio 22; in generale, quando la
numerosit del collettivo dispari, la posizione nella successione ordinata delle modalit dell'unita
statistica mediana data da ( N+1)/ 2 nella quale N la numerosit del collettivo; cos, nel nostro
caso, la posizione mediana (9+1)/ 2=5 e di conseguenza la mediana il 5 valore nella
successione ordinata su costruita, cio 22.
23
B. ESERCIZI DI PROBABILITA' E VARIABILI CASUALI
24
B1. Calcolo delle probabilit
Esercizio 1B1.
In una popolazione di 400 laureati in Scienze Politiche la distribuzione secondo il sesso e lo stato
lavorativo a due anni dalla laurea la seguente:
Occupato Disoccupato
Maschio 100 50
Femmina 150 100
Si estrae a caso un laureato.
Premessa
Al fine di poter effettuare una estrazione casuale di una unit statistica del collettivo si pu pensare di associare a
ciascuna di esse una pallina, di diametro costante e di un dato materiale in determinate condizioni fisico-chimiche, sulla
quale annotare genere e stato occupazionale. Le 400 palline cos costruite vengono inserite in una scatola e mescolate
accuratamente. La prova consiste nell'estrarre una sola pallina dalla scatola. In queste condizioni ciascuna pallina ha la
stessa probabilit di essere estratta. Si cos costruito uno spazio di eventi (le 400 palline) necessari (una pallina verr
estratta), incompatibili (una sola pallina verr estratta) ed equiprobabili (ciascuna pallina ha la stessa probabilit di
essere estratta): ciascuna pallina ha probabilit data da
1
400
.
Il problema di calcolare la probabilita di estrarre una pallina con una particolare annotazione, per esempio femmina, si
risolve considerando tale annotazione (femmina) come un evento composto dalla disgiunzione (unione) di un numero k
(le 250 palline con femmina) di eventi incompatibili ed equiprobabili e quindi la sua probabilit sar data dalla somma
delle probabilit di questi k eventi equiprobabili cio k
1
400
(la probabilit di femmina sar 250 /400), ovvero dal
rapporto fra il numero di casi favorevoli (le 250 palline con femmina) e il numero di casi possibili (le 400 palline).
Dalle considerazioni esposte si pu concludere che la frequenza relativa di una modalita di un carattere pu essere vista
come la probabilit di un evento: quello individuato dalla modalit fissata.
a) Qual la probabilit che sia disoccupato?
Occupato Disoccupato
Maschio 100 50 150
Femmina 150 100 250
250 150 400
Si considerino gli eventi A:={essere disoccupato} e B:={essere maschio}, dalle considerazioni svolte
in premessa si ha:
Pr ( A)=
150
400
=0.375
b) Qual la probabilit che sia disoccupato e maschio?
Pr ( AB)=
50
400
=0.125
c) Qual la probabilit che sia disoccupato dato che stato estratto un maschio?
25
Pr ( AB)=
Pr ( AB)
Pr ( B)
=
50
400
150
400
=
50
150
=0.125
Esercizio 2B1.
Un collettivo di 200 studenti stato classificato secondo il voto riportato ad un dato esame e a
seconda che l'esame in oggetto sia stato il primo ad essere sostenuto o meno
Primo esame
Voto si no
voto 24
40 15
voto 25
45 100
Si estrae a caso dal collettivo uno studente.
Si considerino gli eventi A:={voto 24} e B:={ il primo esame sostenuto}
a) Calcolare Pr(A)
Primo esame
Voto si no
voto 24
40 15 55
voto 25
45 100 145
85 115 200
Pr ( A)=
55
200
=0.275
b) Calcolare Pr(B)
Pr ( B)=
85
200
=0.425
c) Calcolare Pr ( AB)
Pr ( AB)=Pr ( A)+Pr ( B)Pr ( AB)=
55
200
+
85
200

40
200
=
100
200
=0.5
d) Calcolare Pr ( BA)
Pr ( BA)=
Pr ( AB)
Pr ( A)
=
40
200
55
200
=
40
55
=0.727
26
Esercizio 3B1.
Un collettivo di 200 donne stato classificato secondo lo stato civile e l'et come segue:
Stato civile
Et Nubile Coniugata
fino a 25 anni 40 15
pi di 25 anni 45 100
Si estrae dal collettivo casualmente una donna.
Si considerino gli eventi A:={avere una et fino a 25 anni} e B:={essere coniugata}
a) Calcolare Pr(A)
Nubile Coniugata
fino 25 anni 40 15 55
pi di 25 anni 45 100 145
85 115 200
Pr ( A)=
55
200
=0.275
b) Calcolare Pr(B)
Pr ( B)=
115
200
=0.575
c) Calcolare Pr ( AB)
Pr ( AB)=
15
200
=0.075
d) Calcolare Pr ( AB)
Pr ( AB)=Pr ( A)+Pr ( B)Pr ( AB)=0.275+0.5750.075=0.775
e) Calcolare Pr ( BA)
Pr ( BA)=
Pr ( AB)
Pr ( A)
=
0.075
0.275
=0.273
f) A e B sono eventi indipendenti?
Due eventi si dicono stocasticamente indipendenti se Pr ( BA)=Pr ( B) dai risultati ottenuti ai
precedenti punti b) ed e) si deduce che la condizione di indipendenza non verificata.
27
Esercizio 4B1.
Un collettivo di 200 giovani stato classificato secondo lo stato civile e la condizione lavorativa
come segue:
Stato civile
Condizione lavorativa Celibe Coniugato
lavora 50 60
non lavora 70 20
Si estrae dal collettivo casualmente un giovane.
Si considerino gli eventi A:={non lavora} e B:={essere celibe}.
a) Calcolare Pr(A)
Celibe Coniugato
lavora 50 60 110
non lavora 70 20 90
120 80 200
Pr ( A)=
90
200
=0.45
b) Calcolare Pr ( AB)
Pr ( AB)=
70
200
=0.35
c) A e B sono eventi indipendenti?
Due eventi si dicono stocasticamente indipendenti se Pr ( AB)=Pr ( A) ; determiniamo quindi la
probabilit a primo membro della precedente
Pr ( B)=
120
200
=0.6
Pr ( AB)=
Pr ( AB)
Pr ( B)
=
0.35
0.6
=0.583
poich risulta, tenendo conto del punto a), che Pr ( AB)Pr ( A) possiamo concludere che i due
eventi non sono indipendenti.
d) Calcolare Pr ( AB)
Pr ( AB)=Pr ( A)+Pr ( B)Pr ( AB)=0.45+0.60.35=0.7
28
Esercizio 5B1.
Delle auto prodotte da una certa casa automobilistica si sa che 1 su 100 presenta difetti di
carrozzeria e che 4 su 180 presentano difetti meccanici, inoltre fra le auto con difetti di carrozzeria
la probabilit di trovarne una con difetti meccanici pari a 0.002.
Calcolare la probabilit di produrre un'auto con difetti di un tipo o dell'altro.
Definiamo i seguenti eventi:
A:={l'auto presenta difetti di carrozzeria}
B:={l'auto presenta difetti meccanici}
Bisogner determinare la Pr ( AB)
Dai dati del problema sappiamo che:
Pr ( A)=
1
100
=0.01 Pr ( B)=
4
180
=0.022 Pr ( BA)=0.002
dalle quali otteniamo:
Pr ( AB)=Pr ( A)Pr ( BA)=0.010.002=0.00002
ed in conclusione
Pr ( AB)=Pr ( A)+Pr ( B)Pr ( AB)=0.01+0.0220.00002=0.0319
Esercizio 6B1.
Con riferimento ad un collettivo di 600 studenti dell'Universit di Firenze si considerino i seguenti
eventi:
A := {ha superato l'esame di Economia} B := {frequenta il corso di Statistica}.
Sapendo che 400 studenti hanno superato l'esame di Economia, che 300 studenti frequentano il
corso di Statistica e che 200 sono gli studenti che hanno superato l'esame di Economia e
frequentano il corso di Statistica
a) Calcolare Pr(A)
Pr ( A)=
400
600
=0.66
b) Calcolare Pr ( AB)
Pr ( AB)=
200
600
=0.33
c) Calcolare Pr ( AB)
Pr ( AB)=Pr ( A)+Pr ( B)Pr ( AB)=
400
600
+
300
600

200
600
=
500
600
=0.83
29
Esercizio 7B1.
Per un paziente con certi sintomi si considerino i seguenti eventi:
A := { ha l'influenza } B := { ha la polmonite } C := { ha la febbre a 40}
sapendo che:
AB= AB=I Pr ( A)=0.7 Pr (CA)=0.3 Pr (CB)=0.8
dove si posto I :=eventocerto e :=eventoimpossibile
a) Calcolare la probabilit che il paziente abbia la polmonite
Poich gli eventi A e B sono necessari ed incompatibili si ha
Pr ( B)=1Pr ( A)=0.3
b) Calcolare la probabilit che abbia l'influenza dato che ha la febbre a 40
Tenendo conto delle notazioni adottate nel testo del problema bisogna calcolare la Pr ( AC) che
data da
Pr ( AC)
Pr (C)
Si pu ora notare che (vedi anche figura)
Pr (C)=Pr (CI )=Pr (C( AB))=Pr | (CA)(CB)
e tenendo conto del fatto che gli eventi CA e CB sono incompatibili, in quanto lo sono A e B,
si ha
Pr (C)=Pr (CA)+Pr (CB)
e poich
Pr (CA)=Pr (CA)Pr ( A)=0.30.7=0.21
Pr (CB)=Pr (CB)Pr ( B)=0.80.3=0.24
e quindi
Pr (C)=0.45
ed in definitiva la probabilit richiesta data da
Pr ( AC)=
Pr ( AC)
Pr (C)
=
0.21
0.45
=0.47
Naturalmente quanto stato fatto non altro che la derivazione della probabilit a posteriori
dell'evento A sapendo che si verificato C data dal teorema di Bayes.
B
A
AC
BC
C=( AC)( BC)
30
Esercizio 8B1.
Uno studente al primo anno di universit vuole conoscere le sue possibilit di laurearsi entro 4
anni. Gli vengono fornite le seguenti informazioni:
1) il 15% degli iscritti si laurea entro 4 anni;
2) su 10 laureati entro 4 anni 6 hanno riportato il massimo dei voti all'esame di diploma di scuola
media superiore;
3) su 100 laureati con tempi superiori ai 4 anni 10 hanno riportato il massimo dei voti all'esame di
diploma di scuola media superiore.
Sapendo che lo studente in questione ha riportato il massimo dei voti all'esame di diploma di
scuola media superiore, qual la probabilit che si laurei entro 4 anni?
Si considerino i seguenti eventi:
A:={laurea conseguita entro 4 anni}
B:={riportare il massimo dei voti all'esame di diploma di scuola media superiore}
In base ai dati del problema sar:
Pr ( A)=
15
100
=0.15 Pr ( BA)=0.6 Pr ( B

A)=0.1
Si deve quindi calcolare Pr ( AB) , con considerazioni analoghe a quelle dell'esercizio precedente si
ha:
Pr ( BA)=Pr ( A)Pr ( BA)=0.150.6=0.09
Pr (

A)=1Pr ( A)=0.85 Pr ( B

A)=Pr (

A)Pr ( B

A)=0.850.1=0.085
Pr ( B)=Pr ( BA)+Pr ( B

A)=0.09+0.085=0.175
ed in definitiva
Pr ( AB)=
Pr ( AB)
Pr ( B)
=
0.09
0.175
=0.514
Esercizio 9B1.
Un giovane deve decidere se iscriversi all'Universit per conseguire una laurea o mettersi sul
mercato del lavoro. Egli sa che tra i giovani lavoratori il 30% ha la laurea mentre tra i disoccupati
il 20% laureato. Inoltre, data la situazione economica, la probabilit per un giovane di lavorare
0.8.
Consigliereste al giovane di iscriversi all'Universit per conseguire una laurea?
Si considerino gli eventi:
A:={il giovane lavora} B:={il giovane ha la laurea} I:={evento certo}
Dai dati del problema si ha:
Pr ( A)=0.8P(

A)=0.2 Pr (BA)=0.3 Pr ( B

A)=0.2
Al fine di dare una risposta al quesito si dovr stabilire quale fra le due probabilit Pr ( AB) e
31
Pr ( A

B) maggiore.
Con i dati disponibili possiamo calcolare le seguenti probabilit
Pr ( BA)=Pr ( A)Pr ( BA)=0.80.3=0.24
Pr ( B

A)=Pr (

A)Pr ( B

A)=0.20.2=0.04
Pr ( B)=Pr ( BA)+Pr ( B

A)=0.24+0.04=0.28 Pr (

B)=0.72
Osservando che
A=AI =A( BB)=( AB)( AB)
si ha
Pr ( A)=Pr ( AB)+Pr ( A B) Pr ( A B)=Pr ( A)Pr ( AB)=0.80.24=0.56
ed in definitiva quindi
Pr ( AB)=
Pr ( AB)
Pr ( B)
=
0.24
0.28
=0.857
Pr ( AB)=
Pr ( AB)
Pr ( B)
=
0.56
0.72
=0.778
si pu quindi concludere che conviene conseguire una laurea in quanto, possedendo tale titolo,
maggiore la probabilit di trovare un lavoro.
Esercizio 10B1.
In un ufficio le pratiche relative ad una certa procedura amministrativa vengono affidate
casualmente a tre impiegati che indicheremo con A,B,C. La probabilit che una pratica venga
completata entro una settimana per ciascun impiegato indicata nella tabella che segue:
Impiegato A B C
Probabilit 0.4 0.8 0.3
Avendo ricevuto una pratica espletata entro una settimana qual , secondo voi, l'impiegato al
quale era stata affidata?
Si considerino i seguenti eventi:
S:={la pratica completata entro una settimana}
A:={la pratica affidata all'impiegato A}
B:={la pratica affidata all'impiegato B}
C:={la pratica affidata all'impiegato C}
Dai dati del problema si ha:
Pr ( A)=Pr ( B)=Pr (C)=
1
3
in quanto la pratica viene affidata casualmente ad uno dei tre impiegati, inoltre
Pr ( SA)=0.4 Pr (SB)=0.8 Pr ( SC)=0.3
32
Per rispondere alla domanda posta sar necessario stabilire qual la maggiore fra le seguenti tre
probabilit:
Pr ( AS) Pr( BS) Pr (CS)
Utilizzando il teorema di Bayes si ha:
Pr ( AS)=
Pr ( A)Pr (SA)
Pr ( A)Pr (SA)+Pr ( B)Pr ( SB)+Pr (C)Pr ( SC)
Calcoliamo il denominatore della precedente che non altro che la Pr ( S)
Pr (S)=Pr ( A)Pr ( SA)+Pr ( B)Pr (SB)+Pr (C)Pr ( SC)
Pr (S)=
1
3
0.4+
1
3
0.8+
1
3
0.3=
1
3
(0.4+0.8+0.3)=
1
3
1.5
e quindi
Pr ( AS)=
Pr ( A)Pr (SA)
Pr ( S)
=
1
3
0.4
1
3
1.5
=
0.4
1.5
=0.267
ed analogamente
Pr ( BS)=
Pr ( B)Pr (SB)
Pr (S)
=
1
3
0.8
1
3
1.5
=
0.8
1.5
=0.533
Pr (CS)=
Pr (C)Pr ( SC)
Pr (S )
=
1
3
0.3
1
3
1.5
=
0.3
1.5
=0.2
Si pu quindi concludere che l'impiegato B quello che, con maggiore probabilit, ha espletato la
pratica riconsegnata.
Esercizio 11B1.
Si consideri un mazzo di 40 carte costituito da 10 carte per ciascun seme (,,,) e per ciascun
seme le carte sono numerate da 1 a 10. Si estraggano da tale mazzo due carte senza reintroduzione.
a) Calcolare la probabilit che entrambe siano
Poich le estrazioni sono effettuate senza reintroduzione, gli eventi nella prima e seconda prova non
sono indipendenti, inoltre, in ciascuna prova, la probabilit di estrarre una determinata carta data da
1
k
nella quale k il numero di carte rimaste nel mazzo. Consideriamo ora i seguenti eventi:
C
1
:=si verifica una carta di cuori alla prima estrazione
C
2
:=si verifica unacarta di cuori alla seconda estrazione
33
Bisogner calcolare la probabilit dell'evento
C
1
C
2
Pr (C
1
C
2
)=Pr (C
1
)Pr (C
2
C
1
)=
10
40

9
39
=0.250.23=0.0575
b) Calcolare la probabilit che la seconda sia dato che la prima un 2
Consideriamo gli eventi.
2
1
:=si verifica unacarta due alla primaestrazione
P
2
:=si verifica unacarta di picche alla seconda estrazione
2P
1
:=si verifica undue di picche alla prima estrazione
2Q
1
:=si verifica un duedi quadri alla prima estrazione
2C
1
:=si verifica undue di cuori alla prima estrazione
2F
1
:=si verifica undue di fiori alla prima estrazione
ed osserviamo che
2
1
=2P
1
2Q
1
2C
1
2F
1
Pr (2
1
)=Pr ( 2P
1
)+Pr (2Q
1
)+Pr (2C
1
)+Pr (2F
1
)=
1
40
+
1
40
+
1
40
+
1
40
=
4
40
2
1
P
2
=( 2P
1
2Q
1
2C
1
2F
1
)P
2
=( 2P
1
P
2
)(2Q
1
P
2
)( 2C
1
P
2
)( 2F
1
P
2
)
Pr (2
1
P
2
)=Pr (( 2P
1
P
2
)( 2Q
1
P
2
)( 2C
1
P
2
)( 2F
1
P
2
))=
=Pr (2P
1
P
2
)+Pr (2Q
1
P
2
)+Pr( 2C
1
P
2
)+Pr( 2F
1
P
2
)=
=Pr (2P
1
)Pr( P
2
2P
1
)+Pr (2Q
1
)Pr ( P
2
2Q
1
)+Pr (2C
1
)Pr ( P
2
2C
1
)+Pr (2F
1
)Pr( P
2
2F
1
)=
=
1
40

9
39
+
1
40

10
39
+
1
40

10
39
+
1
40

10
39
=
1
40

9
39
+3
1
40

10
39
=
39
4039
=
1
40
e quindi
Pr ( P
2
2
1
)=
Pr (2
1
P
2
)
Pr ( 2
1
)
=
1
40
4
40
=
1
4
=0.25
c) Calcolare la probabilit che la seconda sia
Consideriamo gli eventi:
Q
1
:=si verificauna carta di quadri alla prima estrazione
Q
2
:=si verifica unacarta di quadri alla seconda estrazione
Possiamo osservare che l'evento
Q
2
si verificher quando si verificher uno dei seguenti due eventi
Q
1
Q
2
oppure

Q
1
Q
2
che sono incompatibili e quindi
34
Pr (Q
2
)=Pr (Q
1
Q
2
)+Pr (

Q
1
Q
2
)=Pr (Q
1
)Pr (Q
2
Q
1
)+Pr (

Q
1
)Pr (Q
2

Q
1
)=
=
10
40

9
39
+
30
40

10
39
=
10
40
(
9
39
+
10
39
)=
10
40

39
39
=
1
4
=0.25
Osservazione:
Naturalmente sar 0.25 la probabilit di estrarre alla seconda prova una carta di uno qualunque degli
altri semi e ricordando dal punto b) che
Pr ( P
2
2
1
)=0.25=Pr ( P
2
)
possiamo concludere che, il
sapere il numero della carta alla prima estrazione, non modifica la probabilit del colore della carta
alla seconda estrazione; in altre parole saper il numero non aiuta a prevedere il colore.
Esercizio 12B1.
Vengono estratte, senza reintroduzione, tre carte da un mazzo di 52 contenente 13 carte di ciascun
seme (fiori, quadri, picche, cuori), per ciascun seme le carte sono contrassegnate dai numeri da 2 a
10, da fante, regina, re, asso.
Nella presentazione della soluzione utilizzeremo per gli eventi notazioni analoghe a quelle dell'esercizio precedente.
a) Trovare la probabilit che abbiano tutte lo stesso contrassegno
L'evento E:={tre carte con lo stesso contrassegno} costituito dalla disgiunzione dei 13 eventi
incompatibili ed equiprobabili (S
1
i
S
2
i
S
3
i
) nel quale S
j
i
con i =1.13 e j =1.3 rappresenta una
carta con un determinato contrassegno, l'i-mo, alla j-ma estrazione, per esempio S
2
3
indica il
verificarsi della carta 3 alla seconda estrazione, con queste posizioni calcoliamo la probabilit
richiesta
Pr ( E)=Pr
(

i =1
13
(S
1
i
S
2
i
S
3
i
)
)
=

i=1
13
Pr (( S
1
i
S
2
i
S
3
i
))=13Pr ((S
1
2
S
2
2
S
3
2
))=
=13Pr (S
1
2
)Pr ( S
2
2
S
1
2
)Pr ( S
3
2
( S
1
2
S
2
2
))=13
4
52

3
51

2
50
=130.0770.0590.04=0.0024
b) Trovare la probabilit che nessuna delle tre carte sia asso
Pr (nessuna sia asso)=Pr (

A
1


A
2


A
3
)=Pr (

A
1
)Pr (

A
2

A
1
)Pr (

A
3
(

A
1


A
2
))=
=
48
52

47
51

46
50
=0.9230.9220.92=0.783
35
B2.1. Variabili casuali discrete
Esercizio 1B2.1.
Vi propongono di giocare al seguente gioco: si lanciano due monete, se si verificano due teste si
vince 1 euro, se si verificano due croci si vince 0.5 euro, in tutti gli altri casi non si vince nulla. Per
partecipare al gioco si paga 0.5 euro.
Conviene giocare a questo gioco? (calcolare la vincita media)
Indicando con
T
1
e C
1
gli eventi Testa e Croce per una delle due monete e con
T
2
e C
2
i
corrispondenti eventi per l'altra moneta, lo spazio degli eventi generato dal lancio delle due monete
dato da:
D=(T
1
T
2
) ,(T
1
C
2
) ,(C
1
T
2
) ,(C
1
C
2
)
Supponendo che le due monete siano bilanciate, cio siano uguali le probabilit di Testa e di Croce e
quindi entrambe uguali ad
1
2
, la probabilit di ciascuno dei 4 eventi di sar data da
1
4
in quanto
ciascuna coppia di risultati costituita da eventi indipendenti e di conseguenza la sua probabilit
data dal prodotto delle probabilit dei due eventi che la costituiscono.
Costruiamo ora una variabile casuale G che associa a ciascun evento di la differenza fra vincita e
costo di partecipazione al gioco
G:

(T
1
T
2
)-10.5=0.5 Pr (0.5)=
1
4
(C
1
C
2
)-0.50.5=0 Pr (0)=
1
4
(C
1
T
2
)(T
1
C
2
)-00.5=0.5 Pr (0.5)=
1
4
+
1
4
=
1
2
Il valore atteso della variabile casuale G ci fornir il guadagno atteso del gioco proposto e quindi la
risposta al quesito posto
E| G=0.5
1
4
+0
1
4
0.5
1
2
=0.125
poich il guadagno atteso negativo non conviene partecipare al gioco proposto.
Esercizio 2B2.1.
Unurna contiene palline bianche e nere con probabilit rispettivamente uguale 0.3 e 0.7. La prova
consiste nellestrarre ripetutamente una pallina dallurna rimettendo la pallina nellurna dopo ogni
estrazione.
a) Calcolare la probabilit di ottenere la prima pallina bianca alla decima estrazione.
Poich le estrazioni sono effettuate con reintroduzione non cambia, da un'estrazione all'altra, la
36
composizione dell'urna e quindi la probabilit dei due risultati possibili: la probabilit di ottenere una
pallina di un determinato colore ad una certa estrazione sempre la stessa ad ogni estrazione, ci si
sintetizza dicendo che le estrazioni sono indipendenti.
Indicando con
N
i
l'evento {pallina nera alla i-ma estrazione} e con
B
i
l'evento {pallina bianca alla
i-ma estrazione} bisogna calcolare la probabilit dell'evento
E
10
:=( N
1
N
2
N
3
N
4
N
5
N
6
N
7
N
8
N
9
B
10
)
e quindi
Pr ( E
10
)=
(

1
9
Pr ( N
i
)
)
Pr( B
10
)=0.7
9
0.3
b) Calcolare la probabilit di ottenere la prima pallina bianca fra la settima e la nona estrazione.
Indicando con
E
j
l'evento {la prima pallina bianca si ottiene alla j-ma estrazione} si dovr
determinare la probabilit dell'evento
B:=E
7
E
8
E
9
nel quale i tre eventi
E
7
, E
8
ed E
9
sono incompatibili e quindi:
Pr ( B)=Pr ( E
7
E
8
E
9
)=Pr ( E
7
)+Pr ( E
8
)+Pr ( E
9
)=0.7
6
0.3+0.7
7
0.3+0.7
8
0.3=0.077
Esercizio 3B2.1.
Unurna contiene 7 palline gialle e 3 rosse.
a) Calcolare la probabilit che, estraendo dallurna due palline senza reintroduzione, alla
seconda estrazione si verifichi pallina gialla
Utilizzando notazioni analoghe a quelle dell'esercizio 1B2.1 e tenendo conto che in questo caso le
estrazioni non sono indipendenti in quanto la pallina estratta non viene rimessa nell'urna, si ha:
G
2
=(G
1
G
2
)( R
1
G
2
)
Pr (G
2
)=Pr ((G
1
G
2
)( R
1
G
2
))=Pr (G
1
G
2
)+Pr ( R
1
G
2
)=
=Pr (G
1
)Pr (G
2
G
1
)+Pr ( R
1
)Pr (G
2
R
1
)=
7
10

6
9
+
3
10

7
9
=
7
10
=0.7
b) Calcolare la probabilit che, estraendo dallurna due palline senza reintroduzione, si verifichi
pallina rossa alla prima estrazione e gialla alla seconda
Pr ( R
1
G
2
)=Pr ( R
1
)Pr (G
2
R
1
)=
3
10

7
9
=0.23
37
Esercizio 4B2.1.
La proporzione di studenti di una certa Facolt che hanno superato un determinato esame 0.3 e si
ipotizza di estrarre un campione casuale di 50 studenti della stessa Facolt.
a) Stabilire la probabilit di ottenere una proporzione campionaria di studenti che hanno
superato quellesame pari a 0.4.
La proporzione campionaria una variabile casuale definita da
X
n
nella quale X rappresenta il numero
di successi nelle n estrazioni, in questo caso il valore fissato della proporzione campionaria 0.4 in un
campione di numerosit 50 e quindi x=0.450=20 . Si dovr quindi calcolare la probabilit di
ottenere 20 successi in 50 prove di Bernoulli indipendenti, ciascuna con probabilit di successo pari
a 0.3; a tale scopo utilizziamo la funzione di distribuzione di probabilit della variabile casuale
binomiale (X) che fornisce appunto la probabilit di ottenere x successi in n prove bernoulliane
Pr ( X =x)=
(
n
x
)
0
x
(10)
nx
x=0,1, 2,.n
la probabilit richiesta sar quindi
Pr ( X =20)=
(
50
20
)
0.3
20
(10.3)
5020
=
50!
20!(5020)!
0.3
20
0.7
30
=0.037
Esercizio 5B2.1.
I corsi di Statistica offerti negli atenei italiani richiedono agli studenti di acquistare un numero
variable di libri di testo. Sia X la variabile casuale che rappresenta il numero di libri di testo
richiesti da un corso di Statistica scelto a caso. X pu assumere soltanto i valori 0, 1, 2, 3, 4, 5 e la
tabelle sottostante fornisce la distribuzione di probabilit della variabile causuale X (a meno di una
delle probabilit che mancante):
Numero di libri richiesti x 0 1 2 3 4 5
Probabilit Pr(X=x) ? 0.45 0.24 0.12 0.09 0.05
a) Che valore ha la probabilit mancante?
Affinch la funzione di distribuzione di probabilit Pr(X=x) sia ben definita dovr essere:
Pr ( X =x)0 x=0,1,2,3,4,5

x=0
5
Pr ( X =x)=1
di conseguenza, tenendo conto della seconda delle precedenti condizioni, si dovr avere
Pr ( X =0)+Pr ( X =1)+Pr ( X =2)+Pr ( X =3)+Pr ( X =4)+Pr ( X =5)=1
Pr ( X =0)+0.45+0.24+0.12+0.09+0.05=1
Pr ( X =0)=1(0.45+0.24+0.12+0.09+0.05)=0.05
quindi la probabilit richiesta pari a 0.05, notiamo infine che anche la prima delle condizioni poste
soddisfatta.
38
b) Qual la probabilit che un corso scelto a caso richieda 2 o pi libri di testo?
Bisogna determinare la Pr ( X 2)
Pr ( X 2)=Pr ( X =2)+Pr ( X =3)+Pr ( X =4)+Pr ( X =5)=0.24+0.12+0.09+0.05=0.5
c) Si calcoli il valore atteso della variabile casuale X.
E( X )=

x=0
5
xPr ( X =x)=
=0Pr ( X =0)+1Pr ( X =1)+2Pr ( X =2)+3Pr ( X =3)+4Pr ( X =4)+5Pr ( X =5)=
=00.05+10.45+20.24+30.12+40.09+50.05=1.9
Esercizio 6B2.1.
Sapendo che un certo partito politico ha ottenuto in un determinato collegio elettorale il 35% dei
voti e supponendo di estrarre casualmente,con reintroduzione, fra le schede depositate nellurna 30
schede, calcolare
a) la probabilit di ottenere 15 schede favorevoli al partito
L'urna dalla quale si effettuano le estrazioni pu essere descritta da una variabile casuale di Bernoulli
X
X :

scheda non favorevole -0 Pr ( X =0)=10.35=0.65


scheda favorevole -1 Pr ( X =1)=0.35
e di conseguenza il numero di schede favorevoli nelle 30 estrazioni rappresentato da una variabile
casuale binomiale Y di parametri n=30 e p=0.35 la cui funzione di distribuzione di probabilit
sar
Pr (Y=k )=
(
30
k
)
0.35
k
(0.65)
30k
k=0,1,2 ,.,30
la probabilit richiesta sar quindi
Pr (Y=15)=
(
30
15
)
0.35
15
0.65
(3015)
=
30!
15!(3015)!
0.35
15
0.65
15
=0.035
b) la probabilit di ottenere non meno di 27 schede favorevoli al partito
Sulla base di quanto detto al punto a) la probabilit richiesta data da
Pr (Y27)=

k=27
30
(
30
k
)
0.35
k
0.65
30k
=0.0000000005786
39
B2.2. Variabili casuali continue
Esercizio 1B2.2.
Si rilevato che il tempo di percorrenza di un tratto autostradale da parte degli automobilisti
descritto da una variabile casuale con la seguente distribuzione di probabilit:
Tempo (minuti) Probabilit
[15,20] 0.15
]20,23] 0.25
]23,27] 0.40
]27,31] 0.20
a) Calcolare la probabilit che un automobilista percorra il tratto autostradale in non pi di 23
minuti
Indicando con T il tempo di percorrenza, la probabilit richiesta data da
Pr (T<23)=Pr |(15<T<20)(20T <23)=
=Pr |(15<T<20)+Pr |(20T<23)=0.15+0.25=0.4
b) Calcolare la probabilit di percorrere il tratto autostradale in un tempo non superiore a 27
minuti
Pr (T<27)=1Pr (T<27)=1Pr (27T <31)=10.20=0.8
b) Calcolare la probabilit di percorrere il tratto autostradale in un tempo T tale che 20<T27
Pr (20T<27)=Pr |(20T<23)(23T<27)=
=Pr (20T<23)+Pr (23T <27)=0.25+0.40=0.65
Esercizio 2B2.2.
La quantit P in grammi di farina erogati in ogni confezione da una macchina si distribuisce
normalmente con media 500 g. e scarto quadratico medio 10 g.
a) Calcolare la probabilit che vengano erogati meno di 485 g.
Ricordiamo innanzitutto che, data una qualunque variabile casuale normale (X) di media e scarto
quadratico medio che indichiamo con X N (j, c) . Per la simmetria rispetto alla retta x=j della
sua funzione di densit f(x;,), che per brevit indicheremo con f(x), si ha
f (jk)= f (j+k ) per qualunque k>0
di conseguenza, con semplici trasformazioni della variable di integrazione, ed indicando con 1
X
( x)
la funzione di ripartizione di X si ha
40
Pr ( X <jk )=1
X
(jk)=

jk
f ( x) dx=

+
k
f (jy) dy=

k
+
f (jy) dy=

k
+
f (j+y) dy=
=

j+k
+
f ( x) dx=Pr ( X j+k)=1Pr ( X <j+k)=11
X
(j+k)
Sappiamo inoltre che la standardizzata (Z) di una normale ancora normale con, ovviamente, media
zero e scarto quadratico medio uno, quindi la relazione precedente per Z si scrive
Pr ( Z<0k )=Pr ( Z<k )=
Z
(k )=1
Z
(k )
ricordiamo infine che, preso un qualunque numero reale h si avr
1
X
( h)=Pr ( X <h)=Pr (
X j
c
<
hj
c
)=Pr ( Z<
hj
c
)=1
Z
(
hj
c
)
Con queste premesse possiamo calcolare la probabilit richiesta.
Sappiamo che P ha distribuzione normale di media =500 e varianza 100 e quindi scarto quadratico
medio =10, di conseguenza si ha
Pr ( P485)=Pr
(
Pj
c
<
485j
c
)
=Pr
(
P500
10
<
485500
10
)
=Pr (W1.5)
nella quale con W si indicata la standardizzata di P, tenendo ora conto delle propriet della normale
ricordate prima ed utilizzando la tavola della normale standardizzata si ha
Pr (W<1.5)=Pr (W1.5)=1Pr (W<1.5)=11
W
(1.5)=10.93319=0.06681
b) Calcolare la probabilit che la quantit erogata sia compresa fra 490 g. e 512 g.
Pr (490<P<512)=Pr(
490500
10
<
P500
10
<
512500
10
)=Pr (1<W<1.2)=
=
W
(1.2)
W
(1)=
W
(1.2)(1
W
(1))=0.88493(10.84134)=0.72627
c) Stabilire quel peso
p
0
per il quale la probabilit che la macchina eroghi una quantit di
farina maggiore di
p
0
pari a 0.14
Dobbiamo determinare un
p
0
tale che
Pr ( P>p
0
)=0.14
; possiamo scrivere
Pr ( P>p
0
)=1Pr ( P<p
0
)=1Pr
(
P500
10
<
p
0
500
10
)
=1Pr (W<w
0
)=0.14
nella quale si posto w
0
=
p
0
500
10
e quindi si tratter di determinare quel valore
w
0
della normale
standardizzata tale che
Pr (W<w
0
)=1
W
(w
0
)=10.14=0.86
dalla tavola della normale standardizzata il valore di probabilit pi vicino a 0.86 0.85993 cui
corrisponde il valore di W dato da 1.08; quindi
p
0
=500+10w
0
=500+101.08=510.8
La probabilit che la macchina eroghi una quantit di farina maggiore di 510.8 grammi pari a 0.14.
41
Esercizio 3B2.2.
I laureati di una certa facolt hanno una votazione di laurea media di 100 con uno scarto
quadratico medio di 4. Supponiamo che la distribuzione dei voti sia normale.
a) Calcolare la probabilit che un laureato riporti un voto alla laurea compreso tra 96 e 104
La variabile V, voto alla laurea, per sua natura discreta e quindi assume valori interi,
v
i
,fra 66 e 110;
supporre che sia normale, come indicato nel testo del problema, vuol dire fare le seguenti ipotesi:
i. La variabile V viene prolungata per continuit associando a ciascun valore
v
i
l'intervallo

v
i
0.5 , v
i
+0.5
; costruendo, cio, una nuova variabile casuale continua L che assume valori
nell'intervallo |660.5 , 110+0.5|65.5 , 110.5 .
ii. La variabile L sia uniformememente distribuita in ciascun intervallo
v
i
0.5 , v
i
+0.5
con
funzione di densit data da
g( l )=

Pr( v
i
) l

v
i
0.5 , v
i
+0.5

i=1.45
0 Altrove
nella quale
v
i
=i+65
e quindi
Pr (v
i
0.5L<v
i
+0.5)=

v
i
0.5
v
i
+0.5
g (l ) dl =

v
i
0.5
v
i
+0.5
Pr (v
i
)dl =Pr (v
i
)

v
i
0.5
v
i
+0.5
dl =
=Pr ( v
i
)| v
i
+0.5(v
i
0.5)=Pr ( v
i
)
il che evidenzia che la probabilit di ottenere un certo voto si pu calcolare utilizzando la
funzione di densit della variabile L anzich la funzione di distribuzione di probabilit di V.
iii. La variabile normale FN (100,4) costituisce una buona approssimazione di L nel senso che
f Pr ( L< f )Pr ( F< f ) ovvero che la funzione di ripartizione di L bene
approssimata da quella di F.
Con le ipotesi poste possiamo perci scrivere
Pr (96<V <104)=Pr (960.5L104+0.5)=Pr (95.5L104.5)=1
L
(104.5)1
L
(95.5)
1
F
(104.5)1
F
(95.5)
effettuando la standardizzazione di F ed utilizzando le tavole della normale standardizzata si ha
1
F
(104.5)1
F
(95.5)=1
Z
(
104.5100
4
)1
Z
(
95.5100
4
)=1
Z
(1.125)1
Z
(1.125)=
=1
Z
(1.125)(11
Z
(1.125))=21
Z
(1.125)1=20.868641=0.73728
b) Calcolare la probabilit che un laureato ottenga un voto maggiore di 108
Pr (V>108)=1Pr (V <108)=1Pr ( L<108.5)1Pr ( F<108.5)=11
Z
(
108.5100
4
)=
=11
Z
(2.125)=10.983=0.017
42
c) Calcolare la differenza interquartile
Bisogna determinare la quantit
D=Q
3
Q
1
nella quale
Q
1
e Q
3
sono rispettivamente il primo ed
il terzo quartile; non disponendo della distribuzione empirica di V per determinare i due quartili
necessari utilizzeremo la distribuzione della variabile F.
Q
1
: Pr ( F<Q
1
)=0.25 1
F
(Q
1
)=0.25 1
Z
(
Q
1
100
4
)
=0.25
11
Z
(

Q
1
100
4
)
=0.25 1
Z
(

Q
1
100
4
)
=0.75
ed utilizzando la tavola della normale standardizzata si ha infine

Q
1
100
4
=0.68 Q
1
=10040.68=97.28
procedendo in maniera del tutta analoga alla precedente si ha
Q
3
: Pr( F<Q
3
)=0.75 1
F
(Q
3
)=0.75 1
Z
(
Q
3
100
4
)
=0.75
Q
3
100
4
=0.68
Q
3
=100+40.68 Q
3
=102.72
e quindi
D=Q
3
Q
1
=102.7297.28=5.44
43
C. INFERENZA STATISTICA
44
C1. Stima per intervalli
Esercizio 1C1.
Per analizzare la riuscita scolastica degli adolescenti si estrae un campione casuale semplice con
reintroduzione di 600 studenti della prima classe superiore. In tale campione il numero di ragazzi
bocciati pari a 220.
Calcolare lintervallo di confidenza al 90% per la percentuale dei bocciati nellintera
popolazione.
Indichiamo con X la v.c. che rappresenta lesito della prima classe superiore:
X =

0 promosso Pr ( X =0)=1p
1 bocciato Pr ( X =1)=p
Se B il numero di studenti bocciati in n prove Bernoulliane, la v.c.

P=B/ n , che la proporzione
campionaria di bocciati, segue una distribuzione binomiale relativa con parametri n e p:

P=
B
n
Bin
R
(n , p)
che ha valore atteso p e varianza p(1p)/ n .
Dato che la numerosit del campione pari a 600, la distribuzione della variabile B/ n pu essere
approssimata con una distribuzione normale
B
n
N
(
p ,
p(1p)
n
)
A questo punto possiamo quindi ricondurci al caso della stima di un intervallo di confidenza per la
media di una normale con varianza incognita.
Il corrispondente intervallo di confidenza asintotico per il parametro p (proporzione di bocciati per
lintera popolazione) con livello di confidenza (1o) dato da:
IC
1o
( p):=

Pz
1
o
2
.

P(1

P)
n
<p<

P+z
1
o
2
.

P(1

P)
n
nella quale
z
1o/2
il quantile di ordine 1o/ 2 della normale standardizzata Z
z
1
o
2
: Pr
(
Zz
1
o
2
)
=1
o
2
La stima di p sulla base delle informazioni campionarie data da p=220/ 600=0.36 ; inoltre dai dati
del problema si ha
1o=0.90 o=0.10
o
2
=0.05 1
o
2
=0.95
di conseguenza dalla tavola della normale standardizzata si ha
z
1o/2
=z
0.95
=1.65
e in definitiva la
45
stima dellintervallo di confidenza data da

IC
0.95
( p):=

pz
1
o
2
.
p(1p)
n
<p<p+z
1
o
2
.
p(1p)
n

0.361.65
.
0.36(10.36)
600
<p<0.36+1.65
.
0.36(10.36)
600

0.328<p0.329
Esercizio 2C1.
In una citt ci sono 100000 persone di et compresa fra i 18 e i 25 anni; si estrae da questa
popolazione un campione casuale semplice di 500 soggetti, 194 di questi risultano iscritti
allUniversit.
Determinare un intervallo di confidenza al 95% per la proporzione di persone con et
compresa fra i 18 e i 25 anni che sono iscritte all Universit.
LA SOLUZIONE ANALOGA AL PRECEDENTE ESERCIZIO
In questo situazione si ha
1o=0.95 o=0.05
o
2
=0.025 1
o
2
=0.975
z
1
o
2
=z
0.975
=1.96
p=
194
500
=0.388
e quindi la stima dell'intevallo di confidenza per la proporzione p di iscritti all'Universit data da

IC
0.95
( p):=

pz
1
o
2
.
p(1p)
n
<p<p+z
1
o
2
.
p(1p)
n

0.3881.96
.
0.388(10.388)
500
<p<0.388+1.96
.
0.388(10.388)
500

0.345<p0.431
46
Esercizio 3C1.
Per studiare leffetto della marijuana sulle capacit intellettuali di soggetti (senza esperienze
precedenti) alcuni ricercatori hanno verificato su un campione di soggetti i cambiamenti nei
punteggi ad opportuni test dopo aver fumato della marijuana. I risultati sono presentati nella
seguente tabella:
Soggetto 1 2 3 4 5 6 7 8 9
Differenza punteggio 5 -17 -7 -3 -7 -9 -6 1 3
Si determini lintervallo di confidenza per la media della differenza dei punteggi al 99%.
Si tratta di un problema di stima di un intervallo di confidenza per la media di una popolazione con
varianza incognita. Per dare una risposta al problema bisogna ipotizzare che la differenza dei punteggi
si distribuisca normalmente e quindi si tratta di determinare l'intervallo di confidenza per il valore
medio di una normale di varianza incognita. Esso dato da:
IC
1o
(0) :=

X
n
t
o
2
,n1
S
n
.n
<0<

X
n
+t
o
2
, n1
S
n
.n
nella quale

X
n
=
1
n

i=1
n
X
i
la media campionaria
S
n
2
=
1
n1

i=1
n
( X
i

X )
2
la varianza campionaria corretta
S
n
=
.
S
n
2
t
o
2
,n1
: Pr (T
( n1)
<t
o
2
,n1
)=1
o
2
il quantile di ordine 1
o
2
della variabile T di
Student con n1 gradi di di libert
Per stimare l'intervallo di confidenza dovremo determinare i valori della media campionaria e della
varianza campionaria sulla base del campione osservato

x
n
=
51773796+1+3
9
=
40
9
=4.44
Ricordando ora che la varianza si pu esprimere come media dei quadrati delle determinazioni meno
il quadrato della media, si ha
S
n
2
=
1
n1

i=1
n
( X
i


X
n
)
2
=
n
n
1
n1

i=1
n
( X
i


X
n
)
2
=
n
n1
1
n

i=1
n
( X
i


X
n
)
2
=
=
n
n1
|
1
n

i=1
n
X
i
2


X
2

e quindi la varianza campionaria corretta osservata sar data da


47
s
n
2
=
9
8
|
5
2
+(17)
2
+(7)
2
+(3)
2
+(7)
2
+(9)
2
+(6)
2
+1
2
+3
2
9

4.44
2

=
=
9
8
(
548
9
19.75
)
=
9
8
41.13=46.28 s
n
=
.
s
n
2
=.46.28=6.803
inoltre
1o=0.99
o
2
=0.005 t
0.005,8
=3.355
Dunque, la stima dell'intevallo di confidenza richiesto

4.443.355
6.803
.9
04.44+3.355
6.803
.9

12.05<03.17
48
C2. Verifica delle ipotesi
In questa sezione sono proposti test sui parametri di una popolazione normale. In tutti gli esercizi proposti si
ipotizza che la/le popolazione/i dalla/e quale/i si effettua il campionamento sia/siano normale/i.
Esercizio 1C2.
Una macchina per il riempimento delle buste di patatine ha uno scarto quadratico medio di 6
grammi e una media incognita. La macchina stata costruita per un riempimento medio delle buste
di patatine di 100 grammi. Per verificare la conformit del riempimento a quello previsto dalle
specifiche costruttive si estrae un campione di 100 buste ottenendo un contenuto medio di 99
grammi.
Effettuare un test delle ipotesi per stabilire se il riempimento medio di 100 grammi
accettabile al livello di significativit 0.05.
Il test da effettuare riguarda la media di una normale X N (j,6) di cui nota la varianza. Si deve
sottoporre a test lipotesi
H
0
: j=j
0
=100 come previstodalle specifichecostruttive
contro
H
1
: jj
0
=100
Il test quindi bidirezionale, la statistica test da utilizzare la media campionaria X che sotto
l'ipotesi
H
0
si distribuisce come una normale
X N (j
0
,
c
.n
)
e la regione critica migliore di ampiezza cos definita:
RC (o) :

X j
0
z
1
o
2
c
.n

X j
0
+z
1
o
2
c
.n

nella quale
z
1o/2
il quantile di ordine 1o/ 2 della normale standardizzata Z. Nel nostro caso
quindi la regione critica cos individuata
RC (o) :

X 1001.96
6
.100

X 100+1.96
6
.100

X 98.82X 101.76
di conseguenza la regione di non rifiuto dell'ipotesi nulla data da
RC(o) : 98.82X 101.76
Il valore osservato della media campionaria pari a 99 che appartiene alla regione di non rifiuto per
cui possiamo concludere che, sulla base delle risultanze campionarie non possiamo rifiutare quanto
affermato nelle specifiche costruttive.
Vogliamo a questo punto aggiungere che la regione critica individuata pu anche essere scritta,
effetuando delle semplici trasformazioni, come segue
49
RC (o) :

X j
0
z
1
o
2
c
.n

X j
0
+z
1
o
2
c
.n

X j
0
z
1
o
2
c
.n

X j
0
z
1
o
2
c
.n

X j
0
c
.n
z
1
o
2

X j
0
c
.n
z
1
o
2

nella quale la statistica test data da


Z=
X j
0
c
.n
N (0,1)
e di conseguenza si rifiuter l'ipotesi nulla se il suo valore calcolato in corrispondenza del campione
osservato cade nella regione critica. Dato che
Z
c
=
99100
6
10
=1.67>1.96
non rifiutiamo l'ipotesi nulla.
Esercizio 2C2.
Su un campione di giovani fra i 20 e 25 anni stato rilevato X:=numero di libri letti in un anno
ottenendo i seguenti risultati campionari
Numero di libri letti 4 5 5 2 6 1 4
Si pu confutare lipotesi di un editore che il numero medio di libri letti 2 con un livello di
significativit di 0.05?
Si deve effettuare un test sul valore medio di una popolazione la cui varianza incognita.
Se ipotizziamo che X distribuita normalmente con una media e una varianza
2
, bisogner
effettuare un test delle ipotesi sulla media di una normale di varianza incognita; le ipotesi da mettere a
confronto sono
H
0
: j=j
0
=2 come affermato dall'editore
contro
H
1
: jj
0
=2
in questo caso, poich la varianza della popolazione non nota, la regione critica migliore data da
RC (o) :

T <t
o
2
,n1

Tt
o
2
, n1

nella quale la statistica test T che, sotto l'ipotesi


H
0
si distribuisce come una t di Student con n-1
50
gradi di libert, cos definita
T=
X j
0
S
.n
in cui S la varianza campionaria corretta, inoltre
t
o/2 ,n1
il quantile di ordine 1o/ 2 della t di
Student con n-1 gradi di libert; nel nostro caso la regione critica sar data:
RC (0.05) :

T=
X 2
S
.n
<2.447

T=
X 2
S
.n
2.447

Per effettuare il nostro test dovremo determinare il valore che la statistica test assume dato il
campione osservato; i valori osservati di media campionaria e varianza campionaria corretta sono
x=
4+5+5+2+6+1+4
7
=3.857
s
2
=
7
6
|
4
2
+5
2
+5
2
+2
2
+6
2
+1
2
+4
2
7
3.857
2

=
7
6
|
123
7
3.857
2

=3.143 s=1.773
e quindi
T
c
=
3.8572
1.773
.7
=
1.857
0.67
=2.77
Poich il valore campionario della statistica test appartiene alla regione critica in quanto maggiore
del punto critico possiamo rifiutare l'ipotesi nulla.
Se il quesito posto fosse stato
L'editore afferma che il numero medio di libri letti 2 mentre il responsabile dell'ufficio
vendite convinto che in media si leggono pi di 2 libri, possibbible confutare l'affermazione
dell'editore al livello di significativit di 0.05?
In questa situazione le ipotesi da mettere a confronto sono
H
0
: j=j
0
=2 come affermato dall'editore
contro
H
1
: jj
0
>2 come affermato dal responsabile delle vendite
e la regione critica data da
RC (o) :

Tt
o, n1

RC(0.05) : T1.943
anche in questo caso, come era da attendersi, il valore campionario della statistica test appartiene alla
regione critica e quindi si pu rifiutare l'ipotesi che in media si leggono 2 libri.
51
Esercizio 3C2.
In un campione di pazienti trattati con una terapia per labbassamento del colesterolo si sono
osservati i seguenti valori di colesterolo in milligrammi per 100 millilitri di sangue:
130 145 128 169 132 138 141 153 129 135 140
Sapendo che in una popolazione di persone sane la quantit di colesterolo in media pari a
130 cosa fareste per stabilire se la terapia adottata ha avuto effetto?
SOLUZIONE UGUALE AL PRECEDENTE ESERCIZIO
Le ipotesi da sottoporre a test sono
H
0
: j=j
0
=130 colesterolo per persone sane
contro
H
1
: jj
0
>130 colesterolo alterato
la regione critica data da:
RC (o) :

Tt
o, n1

RC(0.05) : T1.812
T
c
=
140130
12.22
.11
=
10
3.684
=2.714
Il valore campionario della statistica test appartiene alla regione critica, quindi rifiutiamo l'ipotesi
nulla. Possiamo concludere che, al livello di significativit di 0.05, la cura non ha avuto effetto sui
pazienti.
Esercizio 4C2.
Per unindagine sul lavoro femminile sono state rilevate le ore lavorate giornalmente di un
campione di 60 lavoratrici residenti in Toscana e di un campione di 45 lavoratrici residenti in
Lombardia. I risultati sono i seguenti:
Regione Media
Campionari
a
Varianza
campionaria
Numerosit
campionaria
Toscana 5.5 4 60
Lombardia 6.5 9 45
Verificare se le osservazioni campionarie possono suffragare lipotesi che in Toscana ci sia
una tendenza maggiore alluso del part-time (=0.05).
Precisiamo innanzitutto che assumeremo i valori osservati delle varianze campionarie come stime
delle varianze campionarie corrette, inoltre ipotizzeremo che le due popolazioni hanno la stessa
varianza (ipotesi di omoschedasticit) e che i due campioni siano indipendenti.
Con queste premesse il migliore stimatore della varianza comune dato da:
52
S
n ,m
2
=
S
T
2
(n1)+S
L
2
( m1)
n+m2
nella quale i pedici T :=Toscana e L:=Lombardia stanno ad indicare, qui e nel seguito, a quale delle
due popolazioni si riferiscono gli indici, n la numerosit campionaria per la Toscana e m quella della
Lombardia ed infine S
T
2
e S
L
2
sono le varianze campionarie corrette.
Per dare risposta al quesito posto bisogna effettuare un test di confronto tra le medie delle due
popolazioni, ovvero mettere a confronto le ipotesi
H
0
: j
T
=j
L
H
0
: j
T
j
L
=0 nessuna differenza tra le regioni
contro
H
1
: j
T
j
L
H
1
: j
T
j
L
0 pi part-time in Toscana
(ovvero numero medio di ore lavorate inferiore)
La statistica test da utilizzare in questo caso la seguente
T=
( X
T
X
L
)(j
T
j
L
)
S
n, m
.
1
n
+
1
m
che sotto l'ipotesi
H
0
diventa
T=
X
T
X
L
S
n ,m
.
1
n
+
1
m
che si distribuisce come una t di Student con n+m-2 gradi di libert; la regione critica per effettuare il
test richiesto al livello data da
RC (o) :

T<t
o, n+m2

che nel caso in esame diventa


RC(0.05) :

T<t
0.05,103

T<1.66
La statistica test, calcolata sul campione osservato, cos determinata
s
n.m
2
=
(601)4+(451)9
60+452
=
632
103
=6.136 s
n.m
=2.477
T
c
=
5.56.5
2.477
.
1
60
+
1
45
=
1
0.488
=2.047
Poich il valore campionario della statistica test appartiene alla regione critica possiamo rifiutare
l'ipotesi nulla a favore dell'ipotesi alternativa; possiamo qundi affermare, al livello di significativit di
0.05, che in Toscana vi una maggiore propensione delle lavoratrici al part-time che in Lombardia.
53
Esercizio 5C2.
Si supponga di voler comparare la durata media delle lampadine prodotte da due fabbriche e di
disporre delle seguenti informazioni campionarie
Numerosit Durata media (ore)
S/ .n
Fabbrica A 100 107 22
Fabbrica B 80 122 10
nella quale S/ .n la deviazione standard (o errore) della media campionaria.
Sottoporre a test lipotesi di uguaglianza fra le medie al livello di significativit 0.01
LESERCIZIO SIMILE AL PRECEDENTE.
Le ipotesi da sottoporre a verifica sono in questo caso
H
0
: j
A
=j
B
H
0
: j
A
j
B
=0 nessuna differenza di durata
contro
H
1
: j
A
j
B
H
1
: j
A
j
B
0 differenza di durata
Ipotizzando, come nell'esercizio precedente, l'uguaglianza delle varianze delle due popolazioni, lo
stimatore della varianza comune dato da
S
n ,m
2
=
S
A
2
( n1)+S
B
2
(m1)
n+m2
nella quale S
A
2
e S
B
2
si determinano, sulla base delle informazioni fornite, nel modo seguente
S
A
2
=
(
S
A
.n
)
2
n S
A
=
(
S
A
.n
)
.n
S
B
2
=
(
S
B
.m
)
2
m S
B
=
(
S
B
.m
)
.m
e quindi le corrispondenti stime nel nostro caso sono
s
A
2
=(22)
2
100=484100=48400
s
B
2
=(10)
2
80=10080=8000
Di conseguenza la stima della varianza comune
s
n.m
2
=
(1001)48400+(801)8000
100+802
=
5423600
178
=30469.66 s
n.m
=174.55
La statistica test la stessa dell'esercizio precedente e, tenendo conto che in questo caso il test
bilaterale, la regione critica data da
RC(0.01) :

T<t
0.005,178

T t
0.005,178

T <2.58T 2.58
Il valore della statistica test corrispondente alle informazioni campionarie
54
T
c
=
107122
174.55
.
1
100
+
1
80
=
15
26.33
=0.57
poich tale valore non appartiene alla regione di rifiuto si deve concludere che le risultanze
campionarie non ci permettono di rifiutare lipotesi nulla: cio non possiamo rifiutare l'ipotesi che la
durata media delle lampadine delle due fabbriche sia la stessa.
Esercizio 6C2.
Si misurata la durata in ore delle pile prodotte da due diverse industrie su due campioni casuali
estratti dalla produzione di pile delle due marche, i risultati campionari sono riportati nella tabella
che segue:
Marca A 1094 1137 1161 1092 1123 1084
Marca B 1159 1224 1153 1229 1260
Stabilire attraverso un test di ampiezza 0.05 se vi differenza fra la durata delle pile delle due
marche.
Il problema del tutto simile al precedente tranne per il fatto che bisogner stimare le medie e la
varianza comune sulla base delle informazioni campionarie.

x
A
=
1094+1137+1161+1092+1123+1084
6
=1115.167

x
B
=
1159+1224+1153+1229+1260
5
=1205
(n1)s
A
2
=

i=1
6
( x
i

x
A
)
2
=4594.83
(m1)s
B
2
=

i =1
5
( x
i

x
B
)
2
=8782
e di conseguenza
s
n.m
2
=
4594.83+8782
6+52
=
13376.83
9
=1486.314 s
n.m
=38.55
anche in questo caso le ipotesi da porre a confronto sono
H
0
: j
A
=j
B
H
0
: j
A
j
B
=0 nessuna differenza nelle durate medie
contro
H
1
: j
A
j
B
H
1
: j
A
j
B
0 differenza tra le durate medie
e la regione critica data da
RC(0.05) :

T<t
0.025,9

Tt
0.025,9

T<2.262T 2.262
Il valore della statistica test corrispondente alle informazioni campionarie
55
T
c
=
1115.1671205
38.55
.
1
6
+
1
5
=
89.833
23.34
=3.848
che appartiene alla regione critica in quanto minore di -2.262 e quindi possiamo rifiutare, al livello di
significativit 0.05, l'ipotesi che la durata media delle pile delle due marche sia uguale.
56

Potrebbero piacerti anche