Sei sulla pagina 1di 88

Esercitazione Statistica di base del 14.12.2020.

Sergio Pezzulli
Come vedete lo schermo è diviso in due finestre: in una è mostrato questo testo d’esame
e nell’altra avete un editor per scrivere le risposte. Si consiglia di svolgere il compito su
carta e riportare nell’editor solo i risultati numerici di ciascun quesito.
Si possono anche aggiungere annotazioni ed eventuali risultati intermedi, ma non è
necessario farlo per ottenere il massimo punteggio. In ogni caso, deve essere indicato
esplicitamente il numero dell’esercizio (1,2,..,6) e, di volta in volta, la lettera del quesito
(a,b,c, ...) a cui si risponde.
Si consiglia di approssimare alla terza cifra decimale sia i calcoli intermedi che i risultati.
Non sono ammessi libri di testo o altro materiale all’infuori di questo testo e della
calcolatrice tascabile. In alto a sinistra dello schermo è anche disponibile la calcolatrice
della piattaforma e una chat per comunicare col docente. In appendice a questo
documento si trovano le tavole statistiche che potrebbero essere necessarie allo
svolgimento.

Si raccomanda di non uscire dalla piattaforma exam.net, pena l’annullamento del


compito. Al fine di non incorrere nell’esclusione dall’esame, si invita in particolare a non
usare i tasti TAB ed ESC. Durante lo svolgimento della prova lo studente deve restare
connesso alla piattaforma di google meet con camera e microfono accesi. Non è
consentito l’uso di cuffiette auricolari.
La prova consiste in 5 domande e durerà 75 minuti.
Domanda 1.
a) Se si estrae una pallina dall’urna A, contenente 5 palle bianche e 5 nere, e poi si
estrae una pallina dall’urna B, contenente 2 palle bianche e 8 nere, qual’è la
probabilità che almeno una delle due palle estratte sia bianca?

Soluz. 0,6

b) Un tizio ha scelto un’urna a caso tra A e B e ha estratto una palla bianca. Qual’è la
probabilità che l’abbia estratta dall’urna A?

Soluz. 0,714

Domanda 2. Tre eventi mutualmente incompatibili ed esaustivi: 𝐴, 𝐵, e 𝐶, hanno


probabilità 0,3, 0,5 e 0,2 , rispettivamente. Inoltre si sa che, relativamente ad un
quarto evento 𝐸 :
𝑝(𝐸 | 𝐴) = 1
𝑝(𝐸̅ | 𝐵) = 0,3
𝑝(𝐸 | 𝐶) = 0,4

Si calcoli:

(a) 𝑝(𝐴 ∩ 𝐵 )

(b) 𝑝(𝐴 ∪ 𝐵 )

(c) 𝑝(𝐸 | 𝐵 )

(d) 𝑝(𝐸)

(e) 𝑝(𝐵 | 𝐸 )

(f) 𝑝(𝐵 | 𝐸̅ )

Soluz.
a 0
b 0.8
c 0.7
d 0.73
e 0.479
f 0.556
Domanda 3. In un collettivo formato da 40 femmine e 35 maschi è stata investigata la
presenza di una determinata caratteristica 𝐶. Si calcoli:

(a) L’indice Chi-quadro di connessione: 𝜒 2 .

Soluz. 8,036 (8,035 approssimando alla terza cifra)

(b) L’indice di connessione in media quadratica: 𝜓.


Soluz. 0,327
(c) Si può affermare, con livello di significatività del 5%, che la presenza della
caratteristica studiata sia indipendente dal sesso?

Soluz. Usando la stat. Test Chiquadro con 1 gdl, si rifiuta l’ipotesi Ho di indipendenza se
è maggiore di 3,84. Poiché il Chiquadro osservato è 8,036 si rifiuta Ho.

C \ Sesso Femmine Maschi Totali

Presente 10 20 30

Assente 30 15 45

Totali 40 35 75
Domanda 4. In un collettivo, formato da 40 lavoratori, il salario mensile netto ha media
1,2 e scarto quadratico medio 0,8. Si calcoli:
a) un indice percentuale di variabilità;
Soluz. 0,8/1,2= 2/3=66,6%

b) un indice relativo di variabilità.


Soluz. 10,7%

Domanda 5. Secondo una campagna pubblicitaria, un certo yogurt contiene almeno 20


milioni di batteri vivi al grammo. Un biologo curioso effettua 20 campionature e ottiene
una media di 18 milioni e una deviazione standard di 4 milioni. Si sottoponga a test di
verifica la citata affermazione pubblicitaria con livello di significatività del 5%. In
particolare si indichi:
(a) l’ipotesi nulla.
Soluz. Ho : mu maggiore o uguale a 20

(b) L’ipotesi alternativa.


Soluz. H1: mu minore di 20

(c) La regione critica.


La statistica test T è minore di -1,729

(d) Il risultato del test.


Soluz. Poiché T=-4,472 rifiuto Ho
Appendice

Funzione di ripartizione della normale standardizzata F(z)

Seconda cifra decimale di z


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

z 1.282 1.645 1.960 2.326 2.576 3.090 3.291 3.719 3.891 4.265
F( z ) 0.90 0.95 0.975 0.99 0.995 0.999 0.9995 0.9999 0.99995 0.99999
Quantili della distribuzione Tr di Student: q=Fr-1(p)

Es. : r=1

q=1.376

p
r 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995
1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.309 636.619
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.599
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 0.257 0.532 0.859 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 0.256 0.532 0.858 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 0.256 0.532 0.858 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 0.256 0.531 0.857 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 3.421 3.690
28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 0.256 0.530 0.854 1.311 1.699 2.045 2.462 2.756 3.396 3.659
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 0.256 0.530 0.853 1.309 1.696 2.040 2.453 2.744 3.375 3.633
32 0.255 0.530 0.853 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 0.255 0.530 0.853 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 0.255 0.529 0.852 1.307 1.691 2.032 2.441 2.728 3.348 3.601
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
60 0.254 0.527 0.848 1.296 1.671 2.000 2.390 2.660 3.232 3.460
 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291
Quantili della distribuzione 2r : q=Fr-1(p)
Es. : r=3

p=0,95

q=7,81
p
r 0.005 0.010 0.025 0.050 0.100 0.500 0.900 0.950 0.975 0.990 0.995
1 0.00 0.00 0.00 0.00 0.02 0.45 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.10 0.21 1.39 4.61 5.99 7.38 9.21 10.60
3 0.07 0.11 0.22 0.35 0.58 2.37 6.25 7.81 9.35 11.34 12.84
4 0.21 0.30 0.48 0.71 1.06 3.36 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 4.35 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.20 5.35 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 6.35 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 7.34 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 8.34 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 9.34 15.99 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 5.58 10.34 17.28 19.68 21.92 24.72 26.76
12 3.07 3.57 4.40 5.23 6.30 11.34 18.55 21.03 23.34 26.22 28.30
13 3.57 4.11 5.01 5.89 7.04 12.34 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 13.34 21.06 23.68 26.12 29.14 31.32
15 4.60 5.23 6.26 7.26 8.55 14.34 22.31 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 9.31 15.34 23.54 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 10.09 16.34 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 17.34 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 18.34 27.20 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 12.44 19.34 28.41 31.41 34.17 37.57 40.00
21 8.03 8.90 10.28 11.59 13.24 20.34 29.62 32.67 35.48 38.93 41.40
22 8.64 9.54 10.98 12.34 14.04 21.34 30.81 33.92 36.78 40.29 42.80
23 9.26 10.20 11.69 13.09 14.85 22.34 32.01 35.17 38.08 41.64 44.18
24 9.89 10.86 12.40 13.85 15.66 23.34 33.20 36.42 39.36 42.98 45.56
25 10.52 11.52 13.12 14.61 16.47 24.34 34.38 37.65 40.65 44.31 46.93
26 11.16 12.20 13.84 15.38 17.29 25.34 35.56 38.89 41.92 45.64 48.29
27 11.81 12.88 14.57 16.15 18.11 26.34 36.74 40.11 43.19 46.96 49.64
28 12.46 13.56 15.31 16.93 18.94 27.34 37.92 41.34 44.46 48.28 50.99
29 13.12 14.26 16.05 17.71 19.77 28.34 39.09 42.56 45.72 49.59 52.34
30 13.79 14.95 16.79 18.49 20.60 29.34 40.26 43.77 46.98 50.89 53.67
31 14.46 15.66 17.54 19.28 21.43 30.34 41.42 44.99 48.23 52.19 55.00
32 15.13 16.36 18.29 20.07 22.27 31.34 42.58 46.19 49.48 53.49 56.33
33 15.82 17.07 19.05 20.87 23.11 32.34 43.75 47.40 50.73 54.78 57.65
34 16.50 17.79 19.81 21.66 23.95 33.34 44.90 48.60 51.97 56.06 58.96
35 17.19 18.51 20.57 22.47 24.80 34.34 46.06 49.80 53.20 57.34 60.27
36 17.89 19.23 21.34 23.27 25.64 35.34 47.21 51.00 54.44 58.62 61.58
37 18.59 19.96 22.11 24.07 26.49 36.34 48.36 52.19 55.67 59.89 62.88
38 19.29 20.69 22.88 24.88 27.34 37.34 49.51 53.38 56.90 61.16 64.18
39 20.00 21.43 23.65 25.70 28.20 38.34 50.66 54.57 58.12 62.43 65.48
40 20.71 22.16 24.43 26.51 29.05 39.34 51.81 55.76 59.34 63.69 66.77
45 24.31 25.90 28.37 30.61 33.35 44.34 57.51 61.66 65.41 69.96 73.17
50 27.99 29.71 32.36 34.76 37.69 49.33 63.17 67.50 71.42 76.15 79.49
55 31.73 33.57 36.40 38.96 42.06 54.33 68.80 73.31 77.38 82.29 85.75
60 35.53 37.48 40.48 43.19 46.46 59.33 74.40 79.08 83.30 88.38 91.95
65 39.38 41.44 44.60 47.45 50.88 64.33 79.97 84.82 89.18 94.42 98.11
70 43.28 45.44 48.76 51.74 55.33 69.33 85.53 90.53 95.02 100.43 104.21
75 47.21 49.48 52.94 56.05 59.79 74.33 91.06 96.22 100.84 106.39 110.29
80 51.17 53.54 57.15 60.39 64.28 79.33 96.58 101.88 106.63 112.33 116.32
85 55.17 57.63 61.39 64.75 68.78 84.33 102.08 107.52 112.39 118.24 122.32
90 59.20 61.75 65.65 69.13 73.29 89.33 107.57 113.15 118.14 124.12 128.30
95 63.25 65.90 69.92 73.52 77.82 94.33 113.04 118.75 123.86 129.97 134.25
100 67.33 70.06 74.22 77.93 82.36 99.33 118.50 124.34 129.56 135.81 140.17
Domanda 1. Tra i partecipanti ad un concorso per compositori il 50% suona il
pianoforte, il 40% suona il violino e il 10% la chitarra. Il 10% dei pianisti è di nazionalità
italiana, il 20% dei violinisti è italiano e non c’è alcun italiano tra i chitarristi.

a) Qual’è la percentuale complessiva di compositori italiani?


13%

b) Il concorso viene vinto da un italiano. Qual’è la probabilità che suoni il pianoforte?


38,5%

Domanda 2.

a) Quanti anagrammi si possono formare con la parola “baobab”?


60

b) Sia 𝑋 la variabile casuale di Poisson con funzione di probabilità:

3,1𝑥 𝑒 −3,1
𝑓(𝑥) = , 𝑥 = 0,1,2, …
𝑥!

b.1) Quanto vale la media di 𝑋?


3,1

b.2) Detta 𝐹(𝑥) la funzione di ripartizione, quanto vale 𝐹(1,2)?


0,185

Domanda 3. Nella seguente tabella sono date la distribuzione di frequenza di un


carattere qualitativo 𝑋 e le varianze condizionate di un carattere quantitativo associato
𝑌. Sapendo che 𝑉𝑎𝑟(𝑌) = 1,026, calcolare il rapporto di correlazione di 𝑌|𝑋.

x nx Var(Y|x)
A 20 1.032
B 25 0.967
C 23 0.544
0,178
Domanda 4. Una indagine sui consumi delle famiglie ha rilevato il numero di figli per
famiglia e il numero di regali che si presume si troveranno sotto l’albero di Natale
destinati ai componenti il nucelo familiare ristretto. Il risultato dell’indagine su 10
famiglie è esposto in tabella. Si calcoli il coefficiente di correlazione tra numero di figli e
numero di regali.

Numero Numero Numero


Figli Regali Famiglie
0 2 2
1 4 4
2 6 3
3 6 1

0,95

Domanda 5. Il valore di certe azioni è aumentato del 5% nel primo quatrimestre


(rispetto al valore iniziale). Nel secondo quatrimestre è diminuito del 5% (rispetto al
valore raggiunto alla fine del primo quatrimestre) e nel terzo quatrimestre è aumentato
del 2% (rispetto al valore raggiunto alla fine del secondo quatrimestre). Si calcoli il tasso
di incremento medio per quatrimestre.

0,58%
Domanda 6. Alla roulette di un casinò, nelle ultime 100 giocate in cui non si è verificato
lo zero (che non ha colore), si sono osservati 56 volte il rosso e 44 volte il nero.
a) Si verifichi l’ipotesi che (quando si esclude lo zero) la probabilità di rosso sia
𝑝 = 𝑝0 = 0,5, al livello di significatività del 5%, specificando
a.1) la regione critica;
f non compresa nell’intervallo (0,402 , 0,598)

a.2) la statistica test su cui è basata la regione critica;


f=Freq.relativa campionaria
a.3) il valore osservato della statistica test e il risultato del test.
f-osservata =0,56 perciò si accetta Ho

b) Si derivi l’errore di prima specie.


0,05

c) Si derivi l’errore di seconda specie se l’ipotesi alternativa è 𝐻1 : 𝑝 = 0,6.


Beta = P(f appartiene a (0,402 , 0,598) | p=0,6)
= P(f <0,598|p=0,6) - P(f <0,402|p=0,6)=0.484

d) Si derivi il p-valore.
p-val=P(f>0,56 |p=0,5)+P(f<0,44|p=0,5)=2 P(f>0,56 |p=0,5)=0,23
Appendice

Funzione di ripartizione della normale standardizzata F(z)

Seconda cifra decimale di z


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

z 1.282 1.645 1.960 2.326 2.576 3.090 3.291 3.719 3.891 4.265
F( z ) 0.90 0.95 0.975 0.99 0.995 0.999 0.9995 0.9999 0.99995 0.99999
Quantili della distribuzione Tr di Student: q=Fr-1(p)

Es. : r=1

q=1.376

p
r 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995
1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.309 636.619
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.599
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 0.257 0.532 0.859 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 0.256 0.532 0.858 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 0.256 0.532 0.858 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 0.256 0.531 0.857 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 3.421 3.690
28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 0.256 0.530 0.854 1.311 1.699 2.045 2.462 2.756 3.396 3.659
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 0.256 0.530 0.853 1.309 1.696 2.040 2.453 2.744 3.375 3.633
32 0.255 0.530 0.853 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 0.255 0.530 0.853 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 0.255 0.529 0.852 1.307 1.691 2.032 2.441 2.728 3.348 3.601
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
60 0.254 0.527 0.848 1.296 1.671 2.000 2.390 2.660 3.232 3.460
 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291
Quantili della distribuzione 2r : q=Fr-1(p)
Es. : r=3

p=0,95

q=7,81
p
r 0.005 0.010 0.025 0.050 0.100 0.500 0.900 0.950 0.975 0.990 0.995
1 0.00 0.00 0.00 0.00 0.02 0.45 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.10 0.21 1.39 4.61 5.99 7.38 9.21 10.60
3 0.07 0.11 0.22 0.35 0.58 2.37 6.25 7.81 9.35 11.34 12.84
4 0.21 0.30 0.48 0.71 1.06 3.36 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 4.35 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.20 5.35 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 6.35 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 7.34 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 8.34 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 9.34 15.99 18.31 20.48 23.21 25.19
11 2.60 3.05 3.82 4.57 5.58 10.34 17.28 19.68 21.92 24.72 26.76
12 3.07 3.57 4.40 5.23 6.30 11.34 18.55 21.03 23.34 26.22 28.30
13 3.57 4.11 5.01 5.89 7.04 12.34 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 13.34 21.06 23.68 26.12 29.14 31.32
15 4.60 5.23 6.26 7.26 8.55 14.34 22.31 25.00 27.49 30.58 32.80
16 5.14 5.81 6.91 7.96 9.31 15.34 23.54 26.30 28.85 32.00 34.27
17 5.70 6.41 7.56 8.67 10.09 16.34 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 17.34 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 18.34 27.20 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 12.44 19.34 28.41 31.41 34.17 37.57 40.00
21 8.03 8.90 10.28 11.59 13.24 20.34 29.62 32.67 35.48 38.93 41.40
22 8.64 9.54 10.98 12.34 14.04 21.34 30.81 33.92 36.78 40.29 42.80
23 9.26 10.20 11.69 13.09 14.85 22.34 32.01 35.17 38.08 41.64 44.18
24 9.89 10.86 12.40 13.85 15.66 23.34 33.20 36.42 39.36 42.98 45.56
25 10.52 11.52 13.12 14.61 16.47 24.34 34.38 37.65 40.65 44.31 46.93
26 11.16 12.20 13.84 15.38 17.29 25.34 35.56 38.89 41.92 45.64 48.29
27 11.81 12.88 14.57 16.15 18.11 26.34 36.74 40.11 43.19 46.96 49.64
28 12.46 13.56 15.31 16.93 18.94 27.34 37.92 41.34 44.46 48.28 50.99
29 13.12 14.26 16.05 17.71 19.77 28.34 39.09 42.56 45.72 49.59 52.34
30 13.79 14.95 16.79 18.49 20.60 29.34 40.26 43.77 46.98 50.89 53.67
31 14.46 15.66 17.54 19.28 21.43 30.34 41.42 44.99 48.23 52.19 55.00
32 15.13 16.36 18.29 20.07 22.27 31.34 42.58 46.19 49.48 53.49 56.33
33 15.82 17.07 19.05 20.87 23.11 32.34 43.75 47.40 50.73 54.78 57.65
34 16.50 17.79 19.81 21.66 23.95 33.34 44.90 48.60 51.97 56.06 58.96
35 17.19 18.51 20.57 22.47 24.80 34.34 46.06 49.80 53.20 57.34 60.27
36 17.89 19.23 21.34 23.27 25.64 35.34 47.21 51.00 54.44 58.62 61.58
37 18.59 19.96 22.11 24.07 26.49 36.34 48.36 52.19 55.67 59.89 62.88
38 19.29 20.69 22.88 24.88 27.34 37.34 49.51 53.38 56.90 61.16 64.18
39 20.00 21.43 23.65 25.70 28.20 38.34 50.66 54.57 58.12 62.43 65.48
40 20.71 22.16 24.43 26.51 29.05 39.34 51.81 55.76 59.34 63.69 66.77
45 24.31 25.90 28.37 30.61 33.35 44.34 57.51 61.66 65.41 69.96 73.17
50 27.99 29.71 32.36 34.76 37.69 49.33 63.17 67.50 71.42 76.15 79.49
55 31.73 33.57 36.40 38.96 42.06 54.33 68.80 73.31 77.38 82.29 85.75
60 35.53 37.48 40.48 43.19 46.46 59.33 74.40 79.08 83.30 88.38 91.95
65 39.38 41.44 44.60 47.45 50.88 64.33 79.97 84.82 89.18 94.42 98.11
70 43.28 45.44 48.76 51.74 55.33 69.33 85.53 90.53 95.02 100.43 104.21
75 47.21 49.48 52.94 56.05 59.79 74.33 91.06 96.22 100.84 106.39 110.29
80 51.17 53.54 57.15 60.39 64.28 79.33 96.58 101.88 106.63 112.33 116.32
85 55.17 57.63 61.39 64.75 68.78 84.33 102.08 107.52 112.39 118.24 122.32
90 59.20 61.75 65.65 69.13 73.29 89.33 107.57 113.15 118.14 124.12 128.30
95 63.25 65.90 69.92 73.52 77.82 94.33 113.04 118.75 123.86 129.97 134.25
100 67.33 70.06 74.22 77.93 82.36 99.33 118.50 124.34 129.56 135.81 140.17
Domanda 1. Riguardo un determinato collettivo di aziende si sa che:
• la proporzione di piccole aziende (da 1 a 10 addetti) è pari a 0,4 ;
• il 92% delle aziende con più di 10 addetti hanno tra questi almeno un laureato in
economia ;
• la proporzione di aziende che impiegano almeno un laureato in economia è pari a
0,7.
Si calcoli la probabilità che una piccola azienda impieghi almeno un laureato in
economia.
Soluz. 0,37

Domanda 2. La tabella seguente riporta il numero di giorni di assenza per malattia di


402 lavoratori, in un periodo fissato, per tipologia di impiego.

0 1-5 6-10 11-20 Totale


A 50 29 20 8 107
B 75 52 15 12 154
C 80 42 13 6 141
Totale 205 123 48 26 402

Calcolare:

(a) La probabilità che un lavoratore estratto a caso tra quelli che hanno registrato
meno di 6 giorni di assenza appartenga alla classe A.
Soluz. 0,241

(b) La media dei giorni di assenza per l’intero gruppo di lavoratori.


Soluz. 2,876

(c) La varianza dei giorni di assenza per l’intero gruppo di lavoratori.


Soluz. 17,663

(d) Il coefficiente di variazione dei giorni di assenza per l’intero gruppo di lavoratori.
Soluz. 1,461

(e) L’indice relativo di dipendenza in media del numero dei giorni di assenza rispetto
alla tipologia di impiego.
Soluz. 1,2%
Domanda 3. La variabile casuale 𝑋 ha media geometrica 0.12, e media quadratica 0.2.
Determinare l’intervallo dei valori possibili:

(a) della media armonica;


Soluz. (0, 0,12)

(b) della media aritmetica;


Soluz. (0,12 , 0,2)

Domanda 4. Dato il coefficiente angolare della retta di regressione di 𝑌 rispetto ad 𝑋,


pari a 0,8, si calcoli il coefficiente angolare della retta di regressione di 𝑉 = 3𝑌 − 1
rispetto a 𝑊 = 2𝑋 + 9.
Soluz. 1,2

Domanda 5. Sia 𝑋 una variabile casuale di media incognita 𝜇 varianza nota 𝜎 2 = 4.


Dato un campione casuale di dimensione 𝑛 = 10 di determinazioni della variabile 𝑋, si
consideri lo stimatore di 𝜇:
𝑇 = (𝑋1 + 𝑋2 + 8𝑋3 )/10

(a) Si calcoli l’errore quadratico medio di 𝑇.


Soluz. 2,64

(b) Si indichi, se esiste, un valore di 𝜇 in corrispondenza del quale 𝑇 risulta più


1
efficiente della media campionaria 𝑋̅ = ∑10
𝑖=1 𝑋𝑖 .
10

Soluz. L’errore quadratico medio della media campionaria è 0,4, quindi essa è
sempre più efficiente di T.

Domanda 6. In una determinata popolazione, la percentuale di affetti da una certa


malattia è pari all’1%. Un test diagnostico è in grado di rivelarne la presenza con
probabilità 0,9, mentre nel caso di assenza della malattia il test produce un falso
positivo nel 10% dei casi. Se un individuo risulta positivo al test, qual’è la probabilità
che sia affetto dalla malattia?
Soluz. 8,3%
Domanda 7. In un campione di 20 individui da popolazione normale la varianza
campionaria della variabile di interesse è pari a 12,3. Si verifichi l’ipotesi che la varianza
della popolazione sia minore di 10 ad un livello di significatività dell’1%.
Soluz.
RC Varianza campionaria maggiore di 19,047
La Varianza osservata è minore di 19,047, perciò non si rifiuta Ho.
Domanda 1. Per un collettivo di piccole e medie aziende il Governo ha predisposto due
forme non incompatibili di finanziamento agevolato, che chiameremo A e B. Si prevede
che il 30% delle aziende farà richiesta per il finanziamento di tipo A e il 10% di queste
richiederà anche quello di tipo B. Si ritiene, infine, che circa la metà delle aziende non
usufruirà né del tipo A né del tipo B.
Si determini:
a) La percentuale di aziende che richiederanno sia A che B.
b) La percentuale di aziende che richiederanno B.
c) La percentuale di aziende che, avendo richiesto B, non richiederanno A.
Soluz.
I dati del problema sono esposti nella seguente tabella della frequenze relative congiunte
e marginali
A Non A
B 0.03
Non B 0.5
0.3

Quindi, la tabella completa delle frequenze relative congiunte e marginali è


A Non A
B 0.03 0.2 0.23
Non B 0.27 0.5 0.77
0.3 0.7 1

Da cui:
a) 0,03
b) 0,23
c) 0,2/0,23=0,870
Domanda 2. La variabile casuale discreta 𝑋 assume i valori 0,1 e 2 con probabilità 0,1 ,
0,2 e 0,7 , rispettivamente.
Denotando come al solito con 𝑓(𝑥) la funzione di probabilità e con ed 𝐹(𝑥) la funzione
di ripartizione, si calcoli:
a) 𝑓(1,5)
b) 𝐹(1,5)
c) La distanza interquartile
d) 𝑀(𝑋)
e) 𝑉𝑎𝑟(𝑋)
Soluz. I dati del problema si possono mettere in tabella di frequenza:
𝑥 𝑓(𝑥)
0 0,1
1 0,2
2 0,7
Da cui
a) 𝑓(1,5) = 0
Per b) e c), calcoliamo la 𝐹 nei punti di salto
𝑥 𝑓(𝑥) 𝐹(𝑥)
0 0,1 0,1
1 0,2 0,3
2 0,7 1
Perciò
b) 𝐹(1,5) = 0,3

c) 𝑄1 = 𝑥0.25 = 1, 𝑄3 = 𝑥0.75 = 2, quindi ∆𝑞 = 1

Per d) ed e) servono due ulteriori colonne:


𝑥 𝑓(𝑥) 𝐹(𝑥) 𝑥𝑓(𝑥) 𝑥 2 𝑓(𝑥)
0 0,1 0,1 0 0
1 0,2 0,3 0,2 0,2
2 0,7 1 1,4 2,8

Sommando i prodotti 𝑥𝑓(𝑥) si ottiene


d) 𝑀(𝑋) = 1,6

Sommando l’ultima colonna si ottiene 𝑀(𝑋 2 ) = 3, da cui


e) 𝑉𝑎𝑟(𝑋) = 3 − 1,62 = 0,44
Domanda 3. Una variabile statistica 𝑋 > 0 è stata investigata in un collettivo di unità
statistiche, diviso in due gruppi A e B di numerosità rispettivamente pari a 30 e 70.
a) Se la media aritmetica di 𝑋 è pari a 3 nel gruppo A ed è pari a 10 nel gruppo B,
quanto vale la media aritmetica di 𝑋 nell’intero collettivo?

b) S e la media armonica del carattere 𝑋 è pari a 2 nel gruppo A ed è pari a 7 nel


gruppo B, quanto vale la media armonica di 𝑋 nell’intero collettivo?
Soluz.
Questa domanda riguarda la proprietà associativa delle medie analitiche (Lezione 7).
a) La media aritmetica nel collettivo è la media aritmetica ponderata delle medie
aritmetiche dei due gruppi:

3 × 30 + 10 × 70
= 7,9
100

b) La media armonica nel collettivo è la media armonica ponderata delle medie


armoniche dei due gruppi:

−1
1 1
× 30 + × 70
[2 7 ] = 0,25−1 = 4
100
Domanda 4. Un’urna contiene 30 palline di colore bianco e 20 di colore nero.
a) Se si estraggono tre palline senza ripetizione, cioè senza reintrodurle nell’urna,
qual è la probabilità che si ottenga pallina bianca alla prima estrazione e pallina
nera alla seconda e alla terza?

b) Se si estraggono 20 palline con ripetizione, cioè reintroducendo la pallina estratta


nell’urna, qual è la probabilità di ottenere 4 palline bianche e 16 nere?

c) Una seconda urna contiene 25 palline bianche e 25 palline nere. Un tizio ha


scelto a caso una delle due urne ed ha estratto una pallina. Questa pallina risulta
essere di colore bianco. Qual è la probabilità che sia stata estratta dalla prima
urna?
Soluz.
a) Gli eventi non sono indipendenti perché l’urna cambia composizione a seconda
delle palline estratte in precedenza. Alla prima estrazione, la pallina bianca ha
probabilità 𝑝(𝐵) = 30/50
Se alla prima estrazione la pallina è bianca, alla seconda estrazione, la pallina nera
ha probabilità condizionata 𝑝(𝑁|𝐵) = 20/49
Infine, condizionatamente ai risultati precedenti, alla terza estrazione la pallina
nera ha probabilità 𝑝(𝑁|𝐵, 𝑁) = 19/48
Per la regola del concatenamento
30 × 20 × 19
𝑝(𝐵, 𝑁, 𝑁) = 𝑝(𝐵)𝑝(𝑁|𝐵)𝑝(𝑁|𝐵, 𝑁) = = 9,7%
50 × 49 × 48

b) Ora gli eventi sono indipendenti e identicamente distribuiti (iid): la pallina bianca
ha sempre probabilità 30/50 = 0,6, e la nera ha probabilità 0,4.
Se chiamiamo “successo” l’estrazione di pallina bianca, il numero di palline
bianche ottenute dopo 20 estrazioni è il numero di successi in 20 prove
bernoulliane, una variabile casuale 𝑋 ∈ {0,1,2, … ,20} che segue la distribuzione
binomiale di parametri 𝑛 = 20 e 𝑝 = 0,6. Quindi

20 20 × 19 × 18 × 17
𝑝(𝑋 = 4) = ( ) 0,64 0,416 = 0,64 0,416 = 0,03%
4 4×3×2×1

c) Se B rappresenta l’evento “pallina bianca estratta”, mentre con 𝑈1 e 𝑈2


indichiamo gli eventi “urna scelta dal tizio (prima e seconda urna)” , allora

𝑝(𝑈1 ) = 𝑝(𝑈2 ) = 0,5.

30
Inoltre 𝑝(𝐵|𝑈1 ) = = 0,6
50
25
e 𝑝(𝐵|𝑈2 ) = = 0,5
50

Viene richiesta 𝑝(𝑈1 |𝐵), che per il teorema di Bayes è

𝑝(𝑈1 ) 𝑝(𝐵|𝑈1 ) 𝑝(𝑈1 ) 𝑝(𝐵|𝑈1 ) 0,3


𝑝(𝑈1|𝐵) = = = = 54,5%
𝑝(𝐵) 𝑝(𝑈1 ) 𝑝(𝐵|𝑈1 ) + 𝑝(𝑈2 ) 𝑝(𝐵|𝑈2 ) 0,55
Domanda 5. In una fabbrica di componenti elettronici sono operativi tre macchinari
che producono simultaneamente lo stesso componente. Il tempo impiegato per
produrre un pezzo è pari a 2, 3,1 e 2,4 ore rispettivamente.
a) Qual è il tempo medio che la fabbrica impiega per produrre un pezzo?

b) Qual è il tempo medio per macchinario per produrre un pezzo?


Soluz.
a) In un’ora, la prima macchina produce mezzo pezzo (1/2), la seconda ne produce
1/3,1 e la terza 1/2,4 .
Dunque il numero totale di pezzi prodotti all’ora è
1 1 1
+ + ≅ 1,24 (𝑁𝑜. 𝑝𝑒𝑧𝑧𝑖/ℎ)
2 3,1 2,4
Quindi nella fabbrica si produce un pezzo ogni
1/1,24 ≅ 0,81 ore.

b) Se le tre macchine producono 1,24 pezzi all’ora, il numero medio di pezzi all’ora
prodotto da una singola macchina è

1,24
≅ 0,413 (𝑁𝑜. 𝑝𝑒𝑧𝑧𝑖 𝑝𝑒𝑟 𝑚𝑎𝑐𝑐ℎ𝑖𝑛𝑎/ℎ)
3

Quindi il tempo medio per macchina per produrre un pezzo è


1/0,413 ≅ 2,42 ore.

NB Si noti che quest’ultimo è la media armonica dei tempi per pezzo di ciascuna
macchina

1 1 1 −1
1 1.24 −1 + +
2 3,1 2,4
2,42 = =( ) =( )
0,413 3 3
Domanda 6. La tabella che segue mostra i dati raccolti relativi al carattere quantitativo
continuo 𝑋.
𝑥 𝑛𝑥
0-10 35
10-20 32
20-50 27

Si calcolino le seguenti grandezze.


a) La classe modale
b) La media aritmetica
c) Il 95-mo percentile
Soluz.
a) La classe modale è la prima: 0-10 poiché ha massima densità di frequenza pari a
3,5.

b) Assumendo valori concentrati al centro delle classi

5 × 35 + 15 × 32 + 35 × 27
𝑀(𝑋) = = 17,021
94

c) Calcoliamo le frequenze cumulate:


𝑥 𝑛𝑥 𝑁𝑥
0-10 35 35
10-20 32 67
20-50 27 94

Essendo 𝑛𝑝 = 94 × 0.95 = 89,3 , la classe contenente il quantile è 20-50, che ha


ampiezza 30. Assumendo l’equidistribuzione all’interno della classe:
89,3 − 67
𝑥0.95 = 20 + 30 = 44,778
27
Domanda 1. In un collettivo di individui adulti il 10% è laureato ed è disoccupato, il 30%
non è laureato ed è disoccupato. Inoltre, in quel collettivo l’essere occupato e l’essere
laureato sono eventi indipendenti. Calcolare la percentuale di laureati occupati.
Soluz.
Se L ed O indicano l’essere laureato e l’essere disoccupato, i dati del problema sono
𝑝(𝐿, 𝑂̅) = 0,1 e 𝑝(𝐿̅ 0̅) = 0,3.
Quindi 𝑝(𝑂̅) = 0,1 + 0,3 = 0,4 e 𝑝(𝑂) = 0,6.
0,1
Inoltre 𝑝(𝐿|𝑂̅) = = 0,25.
0,4

Poiché L ed O sono indipendenti 𝑝(𝐿) = 𝑝(𝐿|𝑂) = 𝑝(𝐿|𝑂̅) = 0,25.


Perciò, 𝑝(𝐿, 𝑂) = 0,25 × 0,6 = 0,15.
Domanda 2. Una variabile casuale continua 𝑋 ∈ (0,3) ha funzione di densità di
probabilità 𝑓(𝑥) e funzione di ripartizione 𝐹(𝑥) tali che:

𝑎 𝑥 ∈ (0,1)
𝑓(𝑥) = {
𝑏 𝑥 ∈ [1,3)

𝐹(1) = 0,4

Calcolare
a) le costanti 𝑎 e 𝑏.

b) 𝐹(2).
Soluz.
a) Sappiamo che la fdp è una funzione costante a tratti nei due intervalli (0,1) e [1,3).
Inoltre 𝐹(1) = 𝑃(𝑋 ≤ 1) = 0,4.

Quindi l’area sottesa ad 𝑓(𝑥) in (0,1), pari all’area del rettangolo che ha per base
quell’intervallo e altezza 𝑎 deve essere pari a 0,4.
Perciò 𝑎 = 0,4

Analogamente, l’area del rettangolo che ha per base l’intervallo (1,3) e altezza 𝑏 deve
essere pari a 0,6. Perciò 𝑏 = 0,3.

b) 𝐹(2) è l’area sottesa alla fdp lungo l’intervallo (0,2), pari a 0,4 + 1 × 0,3 = 0,7.
Domanda 3.
È data la seguente tabella di frequenza di un carattere discreto.

x nx
0 7
1 9
2 10
3 4
4 2
32

Calcolare
a) Media e Varianza.

b) Mediana e Differenza interquartile.


Soluz.
Per a) occorre calcolare l’ammontare del carattere e l’ammontare dei valori al quadrato
del carattere. Per b) occorre la colonna delle frequenze assolute cumulate.
2
x nx xnx x nx Nx
0 7 7
1 9 16
2 10 26
3 4 30
4 2 32
32 49 117

Quindi
49
a) La media è = 1,531.
32
117
La varianza è − 1,5312 = 1,312.
32

b) La mediana ha rango 16, perciò è pari a 1,5.

Il primo e il terzo quartile hanno rango 8 e 24, quindi Q1=1 e Q3=2 e la differenza
interquartile è pari ad 1.
Domanda 4. Una trasmissione di cucina ha in studio 30 massaie provenienti dalla
Campania, 10 massaie provenienti dal Lazio e 10 massaie provenienti dal Piemonte.
Per una famosa ricetta, è noto che in Campania l’80% dei cuochi usa l’olio e non il burro,
mentre in Piemonte solo il 10% lo userebbe e nel Lazio le preferenze tra olio e burro si
dividono equamente.
Una massaia intervistata dice di preferire il burro. Quali sono le probabilità che sia
campana, laziale o piemontese?
Soluz.
Indicando con B l’uso del burro e con C, L, P le provenienze da Campania, Lazio e
Piemonte, si ha
𝑝(𝐶) = 0,6 , 𝑝(𝐿) = 𝑝(𝑃) = 0,2
Inoltre 𝑝(𝐵|𝐶) = 0,2 , 𝑝(𝐵|𝐿) = 0,5 , 𝑝(𝐵|𝑃) = 0,9

Si richiedono 𝑝(𝐶|𝐵), 𝑝(𝐿|𝐵) 𝑒 𝑝(𝑃|𝐵).


Usando il teorema di Bayes:
𝑝(𝐶, 𝐵) 𝑝(𝐶)𝑝(𝐵|𝐶) 0,6 × 0,2 0,12
𝑝(𝐶|𝐵) = = = =
𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵)

𝑝(𝐿, 𝐵) 𝑝(𝐿)𝑝(𝐵|𝐿) 0,2 × 0,5 0,10


𝑝(𝐿|𝐵) = = = =
𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵)

𝑝(𝑃, 𝐵) 𝑝(𝑃)𝑝(𝐵|𝑃) 0,2 × 0,9 0,18


𝑝(𝑃|𝐵) = = = =
𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵) 𝑝(𝐵)

Quindi 𝑝(𝐵) = 0,12 + 0,10 + 0,18 = 0,40


E finalmente
𝑝(𝐶|𝐵) = 0,3
𝑝(𝐿|𝐵) = 0,25
𝑝(𝑃|𝐵) = 0,45
Domanda 5. Un viaggiatore di commercio 40 giorni su 100 si reca nella località A e nei
restanti giorni si reca nella località B. In entrambi i casi, il viaggiatore mangerà un
panino a mezzogiorno.
Il potere di acquisto relativo al pranzo del viaggiatore, pari alla quantità di panino per
ogni euro speso, è uguale a 0,2 quando si reca in A ed è uguale a 0,3 quando si reca in B.
Quanto vale il potere di acquisto medio del viaggiatore?
Soluz.
𝑞𝑢𝑎𝑛𝑡𝑖𝑡à
Il potere di acquisto: è pari al reciproco del prezzo. Per es. in A un panino costa

1/0,2 = 5€.
Quindi, per avere il suo panino, la spesa giornaliera media del viaggiatore è pari a
1 1
0,4 + 0,6.
0,2 0,3
Perciò il suo potere di acquisto medio è
1 𝑝𝑎𝑛𝑖𝑛𝑜 1
= = 0,25
𝑠𝑝𝑒𝑠𝑎 𝑚𝑒𝑑𝑖𝑎 € 1 1
0,4 + 0,6
0,2 0,3

NB. è la media geometrica (pesata) dei due poteri di acquisto.


Esercizio 1. Quantili
a) Sono date le seguenti osservazioni:
6,6 7,0 7,1 3,5 3,9 3,3 7,9 6,2
Calcolare
a1) La mediana.
a2) Il primo terzile.

a) Data la seguente distribuzione di frequenza di un carattere raggruppato


in classi, si calcoli:

b1) La mediana.
b2) Il primo quartile.
Classi Frequenza
0-3 1
3-5 5
5-8 5
8-10 3
14

b) Data la seguente distribuzione di frequenza si calcoli:


b1) La mediana.
b2) Il terzo quartile.
X Frequenza
0 1
1 6
2 4
3 3
14
Soluzioni
a) I dati ordinati sono
3,3 3,5 3,9 6,2 6,6 7,0 7,1 7,9
n=8, np=4 per la mediana ed np=2,667 per il primo terzile, che quindi sono 6,4
e 3,9 rispettivamente.

b)
Classi Frequenza Cumulate
0-3 1 1
3-5 5 6
5-8 5 11
8-10 3 14
14
Me=5+3/5=5,6
Q1=3+2,5*2/5=4

c)
X Frequenza Cumulate
0 1 1
1 6 7
2 4 11
3 3 14
14
Me=1,5
Q3=2
Esercizio 2. Tabella doppia
È data la seguente tabella delle frequenze di associazione dei caratteri X ed Y
calcolata sulla base di un campione casuale di individui estratti da una
determinata popolazione.
X\Y A B C
0 8 17 75 100
1 16 46 88 150
24 63 163 250

a) Si calcoli 𝑀(𝑋|𝑦 = 𝐵) e 𝑉𝑎𝑟(𝑋|𝑦 = 𝐵).

b) Si determini la tabella teorica di indipendenza.

c) Si calcoli il valore della statistica chi-quadro.


Soluzione
46
a) (𝑋|𝑦 = 𝐵) è una vc bernoulliana con media 𝑝 = = 0,73 e varianza
63
46×17
𝑝𝑞 = = 0,197.
632

b) e c)
La tabella delle frequenze teoriche di indipendenza è la seguente:

X\Y A B C
0 9.6 25.2 65.2
1 14.4 37.8 97.8

Da cui 𝜒 2 = 7,347.
Esercizio 3. Legge della Probabilità Marginale e Teorema di Bayes
Tre borse: B1, B2 e B3 contengono 4 palline ciascuna. B1 contiene 2 palline
rosse e 2 blu, B2 contiene 3 palline rosse e 1 blu e B3 contiene 1 palline rosse e
3 blu. Una borsa viene selezionata a caso e una pallina viene selezionata a caso
da quella borsa.
a) Qual è la probabilità che la pallina estratta sia rossa?

b) Se la pallina estratta fosse rossa, quale sarebbe la probabilità di ciascuna


delle tre borse B1, B2, B3?
Soluzione.
1
Poiché la borsa è scelta a caso: 𝑝(𝐵1) = 𝑝(𝐵2) = 𝑝(𝐵3) = .
3

Inoltre, le probabilità di estrarre pallina rossa condizionate dalla conoscenza


della borsa da cui viene estratta, sono
2 3 1
𝑝(𝑅|𝐵1) = = 0,5 𝑝(𝑅|𝐵2) = = 0,75 𝑝(𝑅|𝐵3) = = 0,25
4 4 4

Perciò:
1 1 1
a) 𝑝(𝑅) = 0,5 + 0,75 + 0,25 = 0,5
3 3 3

1
0,5 1
3
b) 𝑝(𝐵1|𝑅) = =
0,5 3

1
0,75 1
3
𝑝(𝐵2|𝑅) = =
0,5 2

1
0,25 1
3
𝑝(𝐵3|𝑅) = =
0,5 6
Esercizio 4. Media e Varianza
Sono date 𝑀(𝑋) = 1, 𝑉𝑎𝑟(𝑋) = 1, 𝑀(𝑌) = 4 e 𝑀(𝑌 2 ) = 25.
Si calcoli:
a) 𝑀(2𝑋 − 2)

b) 𝑀(4 − 3𝑋)

c) 𝑉𝑎𝑟(2𝑋 − 2)

d) 𝑉𝑎𝑟(4 − 3𝑋)

e) 𝑉𝑎𝑟(𝑌)
Soluzione.
a) 𝑀(2𝑋 − 2) = 2𝑀(𝑋) − 2 = 0

b) 𝑀(4 − 3𝑋) = 4 − 3𝑀(𝑋) = −1

c) 𝑉𝑎𝑟(2𝑋 − 2) = 4𝑉𝑎𝑟(𝑋) = 4

d) 𝑉𝑎𝑟(4 − 3𝑋) = 9𝑉𝑎𝑟(𝑋) = 9

e) 𝑉𝑎𝑟(𝑌) = 25 − 42 = 9
Esercizio 5. Densità di probabilità e quantili.
La variabile casuale continua 𝑋 ∈ (0,4) ha funzione di densità di probabilità

𝑘𝑥 𝑥 ∈ (0,2)
𝑓(𝑥) = {
4𝑘 − 𝑥𝑘 𝑥 ∈ (2,4)

Si consiglia di disegnare il grafico della funzione e quindi calcolare:


a) il valore di 𝑘,

b) I tre quartili.
Soluzione.
Dal grafico si evince la forma triangolare della funzione di densità.

a) Il triangolo rettangolo che ha per base l’intervallo 0-2 ha la stessa area del
triangolo rettangolo che ha per base l’intervallo 2-4. Poiché il totale delle due
aree è pari ad 1, 𝑘 l’area di ciascun triangolo è ½ :
2 × 2𝑘 1
=
2 2
Da cui 𝑘 = 1/4 = 0,25.
b) Per simmetria, la mediana è pari a 2 e i due quartili estremi si trovano alla
stessa distanza dalla mediana ovvero alla stessa distanza dagli estremi 0 e 4,
perciò basta trovare il primo quartile: 𝑄1 , che sarà un valore nell’intervallo 0-2
e poi sarà 𝑄3 = 4 − 𝑄1
Per definizione 𝑄1 è quel valore tale che
𝐹(𝑄1 ) = 𝑃(𝑋 ≤ 𝑄1 ) = 0,25
Perciò, l’area del triangolo che ha per base l’intervallo 0 − 𝑄1 e altezza 𝑓(𝑄1 )
deve esser pari a 0,25. Dalla definizione della fdp, 𝑓(𝑄1 ) = 𝑘𝑄1 = 0,25𝑄1 ,
quindi
𝑄1 × 0,25𝑄1
= 0,25
2
Risolvendola 𝑄1 = √2 e finalmente 𝑄3 = 4 − √2.
Esercizio 1. Tasso di variazione e Numeri Indice.
Il tasso medio annuo di inflazione dei prezzi al dettaglio in Italia negli ultimi sei
anni è stato il seguente.
2021 1,9%
2020 −0,1%
2019 0,6%
2018 1,1%
2017 1,2%
2016 −0,1%

Si calcoli:
a) Il numero indice a base mobile dei prezzi al dettaglio dell’anno 2021.

b) Il numero indice dei prezzi al dettaglio dell’anno 2021 con base 2018.

c) Il tasso medio di inflazione negli ultimi tre anni.


Soluzione.
a) 1 + 0,019 = 101,9%

b) 1,006 × 0,999 × 1,019 = 1,0289 ≅ 102,9%

1
c) (1,006 × 0,999 × 1,019)3 − 1 = 0,007966 ≅ 0,8%
Esercizio 2. Tabella doppia e test Chi-quadro
Un gruppo di studenti formato da 200 maschi e 100 femmine è sottoposto a un
test. Si suppone che la probabilità di passare il test non dipenda dal sesso. Dati
i seguenti risultati, si verifichi la suddetta ipotesi a un livello di significatività del
5%.

M F
Pass. 129 72 201
Non Pass. 71 28 99
200 100 300
In particolare:
a) Si calcoli il valore della statistica chi-quadro.

b) Si determini la regione critica (cioè l’insieme dei valori della statistica chi-
quadro cui corrisponde il rifiuto dell’ipotesi 𝐻0 ).

c) Si specifichi il risultato del test (accetto o rifiuto 𝐻0 ).

d) Si dia una valutazione del p-valore, sia pur grossolana, in base alla tavola
disponibile.

p
r 0.005 0.010 0.025 0.050 0.100 0.500 0.900 0.950 0.975 0.990 0.995
1 0.00 0.00 0.00 0.00 0.02 0.45 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.10 0.21 1.39 4.61 5.99 7.38 9.21 10.60
3 0.07 0.11 0.22 0.35 0.58 2.37 6.25 7.81 9.35 11.34 12.84
4 0.21 0.30 0.48 0.71 1.06 3.36 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 4.35 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.20 5.35 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 6.35 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 7.34 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.70 3.33 4.17 8.34 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 9.34 15.99 18.31 20.48 23.21 25.19
Soluzione

a) La tabella delle frequenze teoriche di indipendenza è la seguente:

M F
Pass. 134 67
Non Pass. 66 33

Da cui 𝜒 2 = 1,696.
b) Quando vale l’ipotesi nulla il chi-quadro ha 1 grado di libertà. Essendo la
significatività richiesta pari al’5%, la soglia che delimita la regione critica è il
95° percentile della distribuzione del chi-quadro con 𝑟 = 1 gradi di libertà, pari
a 3,84. Quindi la regione critica è:
{𝜒 2 : 𝜒 2 > 3,84}

c) Essendo il chi-quadro osservato pari a 1,696, non contenuto nella regione


critica, si può accettare l’ipotesi di indipendenza.

d) Dalle tavole si può notare che il chi-quadro osservato si trova tra la mediana e
il 90° percentile. Quindi il p-valore è compreso tra il 10% e il 50%.
Esercizio 3. Teorema di Bayes e … una distribuzione discreta notevole.
Due urne contengono 100 palline ciascuna. Nella prima: U1, vi sono 20 palline
rosse e 80 blu, nella seconda: U2, vi sono 50 rosse e 50 blu.
a) Qual è la probabilità che estraendo 10 palline con ripetizione dalla prima
urna si ottengano 5 rosse e 5 blu?

b) Un tizio ha scelto un’urna tra U1 e U2 e, poi, ha estratto 10 palline


dall’urna scelta. Si sa che il 90% delle volte il tizio sceglie la prima urna.
Inoltre, si sa che sulle 10 palline estratte ne ha ottenute 5 rosse e 5 blu.
Qual è la probabilità che abbia scelto U1, alla luce del risultato
dell’estrazione?
Soluzione.
a) Il numero di palline rosse su 10 estrazioni da U1 è una vc discreta 𝑋 che segue
la distribuzione binomiale con numero di prove n=10 e probabilità di successo
(pallina rossa) 𝑝(𝑅|𝑈1) = 20%:

𝑋~𝐵𝑖𝑛(10 , 0,2)

10
Quindi 𝑝(𝑋 = 5|𝑈1) = ( ) 0,25 0,85 = 252 × 0,25 0,85 ≅ 0,026
5

b) Sappiamo che X=5 ma non sappiamo da quale urna.


A priori (cioè senza considerare il risultato dell’estrazione) 𝑝(𝑈1) = 0,9.
A posteriori, cioè sapendo che in effetti X=5, possiamo calcolare 𝑝(𝑈1|𝑋 = 5)
col teorema di Bayes:

𝑝(𝑈1)𝑝(𝑋=5|𝑈1) 0,9×0,026
𝑝(𝑈1|𝑋 = 5) = =
𝑝(𝑋=5) 𝑝(𝑋=5)

ove
𝑝(𝑋 = 5) = 𝑝(𝑈1)𝑝(𝑋 = 5|𝑈1) + 𝑝(𝑈2)𝑝(𝑋 = 5|𝑈2)
= 0,9 × 0,026 + 0,1 𝑝(𝑋 = 5|𝑈2)

Per quest’ultima probabilità ragioniamo come in a), sapendo che l’urna scelta è
U2. In tal caso
𝑋~𝐵𝑖𝑛(10 , 0,5)

10
e quindi 𝑝(𝑋 = 5|𝑈2) = ( ) 0,55 0,55 = 252 × 0,510 ≅ 0,246.
5
Sostituendo, otteniamo
𝑝(𝑋 = 5) ≅ 0.048

e finalmente
𝑝(𝑈1|𝑋 = 5) = 0,4875
Esercizio 4 -compito a casa. Varianza, Covarianza e Correlazione
Sono date 𝑉𝑎𝑟(𝑋) = 1, 𝑉𝑎𝑟(𝑌) = 4 e 𝐶𝑜𝑣(𝑋, 𝑌) = 1,5.
Si calcoli:
a) 𝑉𝑎𝑟(𝑋 − 3𝑌 − 2)

b) 𝑉𝑎𝑟(−3𝑌)

c) 𝐶𝑜𝑣(2𝑋 + 𝑌, 6 − 3𝑌)

Indicando con 𝐶𝑜𝑟𝑟( , ) il coefficiente di correlazione, si calcoli


d) 𝐶𝑜𝑟𝑟(𝑋, 𝑌)

e) 𝐶𝑜𝑟𝑟(2𝑋, 𝑌)

f) 𝐶𝑜𝑟𝑟(𝑋, −𝑌)

g) 𝐶𝑜𝑟𝑟(2𝑋 + 1 , 1 − 3𝑌)
Soluzione.
a) 𝑉𝑎𝑟(𝑋 − 3𝑌 − 2) = 1 + 9 × 4 − 6 × 1 × 1,5 = 28

b) 𝑉𝑎𝑟(−3𝑌) = 9 × 4 = 36

c) 𝐶𝑜𝑣(2𝑋 + 𝑌, 6 − 3𝑌) = −6 × 1,5 − 3 × 4 = −21

1,5
d) 𝐶𝑜𝑟𝑟(𝑋, 𝑌) = = 0,75
√1×4

2×1,5
e) 𝐶𝑜𝑟𝑟(2𝑋, 𝑌) = = 0,75
√4×4

−1,5
f) 𝐶𝑜𝑟𝑟(𝑋, −𝑌) = = −0,75
√1×4

−6×1,5
g) 𝐶𝑜𝑟𝑟(2𝑋 + 1 , 1 − 3𝑌) = = −0,75
√4×9×4

Il motivo degli ultimi risultati è spiegato intuitivamente coi grafici qui sotto,
dove si vede come cambia la nuvola dei punti (X,Y) quando Y è sottoposto a
una trasformazione lineare crescente (3Y) o decrescente (-3Y). Le
trasformazioni lineari non cambiano il “grado di linearità” della relazione ma,
eventualmente ne cambiano la direzione (il segno) se sono decrescenti.
Esercizio 1. Intervallo di confidenza su proporzione
Un gruppo di 800 studenti è stato intervistato e 300 di essi hanno dichiarato
che non voteranno alle prossime elezioni studentesche.
Si calcoli la stima intervallare della percentuale di non votanti a livello di
confidenza del 95%.
Sol. La frequenza relativa osservata è
𝑓𝑜𝑠𝑠 = 300/800 = 0,375.

La distribuzione della vc 𝑓 è approssimata con la 𝑁(𝑝, 𝑝𝑞/𝑛), ove p è la


percentuale dei non votanti. 𝑍0,975 𝑒 𝑍0,025 sono ±1,96.

Detto 𝑣 = 𝑝𝑞/𝑛,

𝑃 (𝑓 ∈ ( 𝑝 ± 196√𝑣)) = 𝑃 (𝑝 ∈ ( 𝑓 ± 196√𝑣)) = 0,9

E detto 𝑣𝑜𝑠𝑠 =𝑓𝑜𝑠𝑠 (1 − 𝑓𝑜𝑠𝑠 )/𝑛 otteniamo √𝑣𝑜𝑠𝑠 = 0,0171


e l’IC
𝑓𝑜𝑠𝑠 ± 1,96√𝑣𝑜𝑠𝑠 = ( 0,3415 , 0,4085 )
Esercizio 2. Intervallo di confidenza su proporzione
100 su 800 X-enni intervistati dichiarano di preferire una certa marca di
prodotto. Si calcoli l’intervallo al 95% di confidenza della percentuale nella
popolazione.
Sol. Es.2. 100 su 800 X-enni intervistati dichiarano di preferire una certa marca
di prodotto. Si calcoli l’intervallo al 95% di confidenza della percentuale nella
popolazione.
1
∓ 1,96 × 0,0117 = 0,1021 − 0,1479
8

Esercizio 3. Intervallo di confidenza su proporzione


30 su 800 soggetti Intervistati prendono l’autobus per andare al lavoro. Si
calcoli l’intervallo al 90% di confidenza della percentuale nella popolazione.
Sol.Es.3. 0,0265 − 0,0485
Esercizio 4. Verifica di Ipotesi su proporzione
Un gruppo di 800 studenti è stato intervistato e 300 di essi hanno dichiarato
che non voteranno alle prossime elezioni studentesche. Si verifichi l'ipotesi,
con significatività del 5%, che al massimo il 35% degli aventi diritto sceglie di
non votare. In particolare:
a) si specifichino le ipotesi nulla e l’ipotesi alternativa,
b) si specifichi la regione critica in modo che sia evidente la statistica su cui
è basata
c) si fornisca la conclusione del test a livello di significatività del 5%.
d) Si calcoli e si commenti il p-valore.
Soluzione
a) 𝐻0 : 𝑝 ≤ 𝑝0 = 0,35, 𝐻1 : 𝑝 > 0,35

b) La regione critica può essere scritta in termini della vc frequenza relativa 𝑓 o


della 𝑓 −standardizzata: 𝑍~𝑁(0,1) condizionata a “quando vale Ho”.

𝑓 − 𝑝0
𝑅𝐶 = {𝑍 > 𝑍0,95 } = { > 𝑍0,95 } = { 𝑓 > 𝑝0 + 𝑍0,95 √𝑣0 } = {𝑓 > 𝑓0,95 }
√𝑣0

Ove 𝑣0 = 𝑉𝑎𝑟(𝑓|𝐻0 ) = 𝑝0 𝑞0 /𝑛 e quindi √𝑣0 = 0,0169

2 soluzioni equivalenti:
Prima sol. In termini di 𝑍0,95 = 1,645.

𝑹𝑪 = {𝒁 > 𝟏, 𝟔𝟒𝟓 | 𝑯𝟎 }
Con risultato
𝑧 = (𝑓𝑜𝑠𝑠 − 𝑝0 )/√𝑣0 = 1,479 < 1,645
non appartiene alla RC perciò non rifiuto Ho.

Seconda sol. In termini di 𝑓0,95 .


Calcolato il quantile 𝑓0,95 |𝐻0 = 𝑝0 + 𝑍0,95 √𝑣0 = 0,3778

𝑹𝑪 = {𝒇 > 𝟎, 𝟑𝟕𝟕𝟖}

La freq.osservata
𝑓𝑜𝑠𝑠 = 300/800 = 0,375 < 0,3778
non appartiene alla RC perciò non rifiuto Ho.

c) Si è ottenuto 𝑧 = 1,479. Poiché l’alternativa è unilaterale destra:

𝑝 − 𝑣𝑎𝑙 = 𝑝(𝑍 > 1,479)

Consultando le tavole p-val= 1 − 0.9306 ≅ 7%, di poco sopra la soglia del 5%.
(test incerto).
Esercizio 5. Verifica di ipotesi su proporzione
100 su 800 adulti di una certa età dichiarano di preferire una certa marca di
prodotto.
a) Si verifichi l’ipotesi che la percentuale 𝑝 nella popolazione sia minore del
12% usando il livello di significatività del 5%.

b) Si calcoli la probabilità 𝛽 dell’errore di seconda specie quando 𝑝 = 𝑝1 =


15%.
Esercizio 6. Verifica di ipotesi su proporzione
30 su 800 soggetti Intervistati prendono l’autobus per andare al lavoro.
a) Si verifichi l’ipotesi che almeno il 5% della popolazione prende l’autobus,
usando livello di significatività dell’1%.

b) Si calcoli il p-valore.

c) Si calcoli la probabilità di errore di seconda specie quando la percentuale


che prende l’autobus nella popolazione è il 10%.
Esercizio 7. Verifica di ipotesi sulla media
In un sondaggio su 15 lavoratori di un certa popolazione si è osservata una
media campionaria di 5,8 settimane di ferie pagate all’anno e una varianza
campionaria di 0,25 settimane.

a) Si verifichi l’ipotesi che la media delle ferie annuali nella popolazione sia
pari a 6 settimane con livello di significatività del 10%.

b) Si specifichi l’ipotesi assunta in a).

c) Si calcoli approssimativamente il p-valore.

d) Si deduca il risultato del test al 5% contro l’alternativa che la media nella


popolazione sia minore di 6 settimane.
Esercizio 8. . Verifica di ipotesi sulla media
Una macchina di precisione viene testata. Su 61 pezzi prodotti, la media di una
certa misura è pari a 12,36mm con deviazione standard 0,12.

a) Si verifichi l’ipotesi che la macchina produca in media pezzi di misura


pari a 12,4 a livello di significatività del 5%.

b) Si calcoli approssimativamente il p-valore.


Sol. Esercizio 5.
100 su 800 adulti xx-enni dichiarano di preferire un certa marca di prodotto.
c) Si verifichi l’ipotesi che la percentuale 𝑝 nella popolazione sia minore del
12% a livello di significatività del 5%.
Sol.
Ipotesi. Ho: p0 = 0,12 vs unilat.dx. Z095 = 1,645.
RC={Z>1,645}.
foss =1/8 e v0= (p0q0/n)= 0,0115
e finalmente
Osservato Z=z=0,435 non appartiene alla RC e quindi non si rifiuta Ho.

d) Si calcoli la probabilità 𝛽 dell’errore di seconda specie quando 𝑝 = 𝑝1 =


15%.
Sol.
In termini di frequenza RC={f>f0,95},
ove f0,95 = p0 + 1,645 v0 = 0,1389.
Poiché 𝑓 < 0,1389 definisce la regione di accettazione di Ho:
𝛽 = 𝑃(𝑓 < 0,1389 | 𝑝 = 𝑝1 )
E in tal caso
0,15 × 0,85
𝑣1 = 𝑉𝑎𝑟(𝑓|𝑝1 ) =
800
√𝑣1 = 0,0126

La normalità di 𝑓 implica
0,1389 − 0.15
𝛽 = 𝑃 (𝑍 < ) = 𝑃(𝑍 < −0,889) = 19%
0,0126
Soluz. Esercizio 6.
30 su 800 soggetti Intervistati prendono l’autobus per andare al lavoro.
d) Si verifichi l’ipotesi che almeno il 5% della popolazione prende l’autobus,
usando livello di significatività dell’1%.
Sol.
Ho: 𝑝 = 𝑝0 = 0,05 𝑣𝑠 𝐻1 : 𝑝 < 𝑝0

𝑅𝐶 = {𝑍 < 𝑍0.01 = −2,326}


Essendo √𝑣0 = 0,0077 ed 𝑓𝑜𝑠𝑠 = 0,0375, allora
𝑍 = 𝑧 = −1,623 e si accetta Ho con alfa 0,01.

e) Si calcoli il p-valore.
𝑝 − 𝑣𝑎𝑙 = 𝑃(𝑍 < −1,632) = 5,2%

f) Si calcoli la probabilità di errore di seconda specie quando la percentuale


che prende l’autobus nella popolazione è il 3%.
Qui serve il quantile di 𝑓 che definisce la 𝑅𝐶 = {𝑓 < 𝑓0,01 }:

𝑓0,01 = 0,05 − 2,326 × 0,0077 = 0,0321

Allora

𝛽 = 𝑃(𝑓 > 𝑓0,01 | 𝑝 = 𝑝1 ) = 𝑃(𝑍 > 0.0021/0,006) = 𝑃(𝑍 > 0,35)

Essendo √𝑣1 = 0,006

Finalmente consultando le tavole si ottiene 𝛽 =36,3%.


Sol. Esercizio 7.
In un sondaggio su 15 lavoratori di un certa popolazione si è osservata una
media campionaria di 5,8 settimane di ferie pagate all’anno e una varianza
campionaria di 0,25 settimane.

a) Si verifichi l’ipotesi che la media delle ferie annuali nella popolazione sia
pari a 6 settimane con livello di significatività del 10%.
Come nel caso del test sulla proporzione, anche nel test sulla media la RC
può essere espressa in due modi: in termini della statistica test Z (ovvero T
nel caso della varianza stimata) oppure in termini del quantile della media
campionaria. Il primo è più semplice per effettuare il test e calcolare il p-
valore. Il secondo è comodo per il calcolo dell’errore di seconda specie.
Sol. RC={T(-1,761,+1,761)}, Toss=-1,55 è compreso nell’intervallo di
accettazione. Si accetta Ho.

b) Si specifichi l’ipotesi assunta in a).

Sol. Le ferie siano distribuite normalmente nella popolazione.

c) Si calcoli approssimativamente il p-valore.

Sol. 𝑝 − 𝑣𝑎𝑙 = 𝑃(|𝑇| > |𝑇𝑜𝑠𝑠|) = 2 ∗ 𝑃(𝑇 > 1,55)


Dal 10% al 20%.

d) Si deduca il risultato del test al 5% contro l’alternativa che la media nella


popolazione sia minore di 6 settimane.

Sol. Nel caso bilaterale, con 𝛼 = 0,10

𝑅𝐶 = {𝑇 ∉ (𝑇0,05 , 𝑇0,95 )} = (−∞, 𝑇0,05 ) ∪ (𝑇0,95 , +∞)

D’altra parte, la RC unilaterale sinistra quando 𝛼 = 0,05: (−∞, 𝑇0,05 ),


coincide col primo intervallo della RC del caso bilaterale con alfa doppio.
In a) si è già verificato che z non vi è contenuta, quindi si accetta Ho.
Esercizio 8.
Una macchina di precisione viene testata. Su 61 pezzi prodotti, la media di una
certa misura è pari a 12,36mm con deviazione standard 0,12.

a) Si verifichi l’ipotesi che la macchina produca in media pezzi di misura


pari a 12,35 a livello di significatività del 5%.

Sol. Test ad alternativa bilaterale. t= 0,65 è interno all’intervallo di


accettazione 2, si accetta.

b) Si calcoli il p-valore

Sol. P( |T| > 0,65 ) compreso tra 20% e 30%.

c) Usando le tavole della normale, si dia una valutazione approssimata


della probabilità dell’errore di seconda specie quando la lunghezza
media è 12,4.

Sol. Ora serve l’intervallo di accettazione in termini dei quantili


𝑥̅0,025 𝑒 𝑥̅0,975 . Questi quantili della media campionaria calcolati
assumendo Ho sono 12.319, 12.381.
Le T corrispondenti a 𝜇 = 𝜇1 = 12,4 sono -5.25 e -1.33.
La probabilità di accettare l’ipotesi nulla quando vale 𝐻1 , usando le
tavole della normale, è quindi

𝛽 = 𝑃(𝑓 ∈ (12,319 , 12,381)|𝐻1 ) = 𝑃(𝑇 ∈ (−1,33 , −5,25)) =

= Φ(−1,33) − Φ(−5,25) = (1 − 0,9082) − 0 ≅ 10%.


Appendice

Funzione di ripartizione della normale standardizzata F(z)

Seconda cifra decimale di z


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998

z 1.282 1.645 1.960 2.326 2.576 3.090 3.291 3.719 3.891 4.265
F( z ) 0.90 0.95 0.975 0.99 0.995 0.999 0.9995 0.9999 0.99995 0.99999
Quantili della distribuzione Tr di Student: q=Fr-1(p)

Es. : r=1

q=1.376

p
r 0.60 0.70 0.80 0.90 0.95 0.975 0.990 0.995 0.999 0.9995
1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.657 318.309 636.619
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.327 31.599
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.215 12.924
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.893 6.869
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850
21 0.257 0.532 0.859 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 0.256 0.532 0.858 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 0.256 0.532 0.858 1.319 1.714 2.069 2.500 2.807 3.485 3.768
24 0.256 0.531 0.857 1.318 1.711 2.064 2.492 2.797 3.467 3.745
25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 3.421 3.690
28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 0.256 0.530 0.854 1.311 1.699 2.045 2.462 2.756 3.396 3.659
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 0.256 0.530 0.853 1.309 1.696 2.040 2.453 2.744 3.375 3.633
32 0.255 0.530 0.853 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 0.255 0.530 0.853 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 0.255 0.529 0.852 1.307 1.691 2.032 2.441 2.728 3.348 3.601
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
60 0.254 0.527 0.848 1.296 1.671 2.000 2.390 2.660 3.232 3.460
 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.291
Esercizio 1. Probabilità
Una clinica medica utilizza un test di gravidanza per confermare la gravidanza
in pazienti che sospettano di essere incinta. Storicamente i dati hanno
dimostrato che complessivamente il 70% delle donne a cui viene
somministrato il test di gravidanza in questa clinica è incinta, mentre il restante
30% non lo è.
Il produttore del test indica che se una donna è incinta, il test sarà positivo il
92% delle volte. Ma se una donna non è incinta, il test sarà positivo il 2% delle
volte.
Si calcoli:
a) la probabilità che una donna che viene sottoposta al test in questa
clinica sia incinta e risulti positiva.

b) la probabilità che una donna in questa clinica sia effettivamente incinta


dato che risulta positiva al test.
Soluzione.
Se diciamo:
T= “il test risulta positivo”
E= “la donna è incinta”,
Allora i dati del problema sono:
𝑝(𝐸) = 0,7
𝑝(𝑇|𝐸) = 0,92
𝑝(𝑇|𝐸̅ ) = 0,02

a) 𝑝(𝐸, 𝑇) = 𝑝(𝐸)𝑝(𝑇|𝐸) = 0,644

𝑝(𝐸)𝑝(𝑇|𝐸)
b) 𝑝(𝐸|𝑇) =
𝑝(𝑇)

Ove

𝑝(𝑇) = 𝑝(𝐸 )𝑝(𝑇|𝐸 ) + 𝑝(𝐸̅ )𝑝(𝑇|𝐸̅ ) = 0,644 + 0,006 = 0,65

Da cui
0,644
𝑝(𝐸|𝑇) = = 99,1%
0,65
Esercizio 2. Regressione Lineare Semplice
Relativamente ad un gruppo di 10 studenti, sono dati qui sotto i risultati di un
test riguardante una certa disciplina e il numero settimanale di ore di studio
dedicate ad essa.
Ore Settimanali Punteggio
3 57
4 78
4 72
2 58
5 89
3 63
4 73
5 84
3 75
2 48

a) Si calcoli la migliore previsione lineare nel senso dei minimi quadrati del
punteggio di uno studente che dedica 6 ore alla settimana.

b) Si calcoli e si commenti l’indice della bontà di adattamento della retta di


regressione ai punteggi osservati.
Soluz.
Per la retta di regressione è necessario calcolare le due medie, la covarianza e
la varianza della variabile indipendente (X).
La bontà di adattamento è misurata dall’indice di determinazione lineare 𝜌2 ,
per il quale è necessaria anche la varianza della variabile dipendente (Y).
La tabella dei calcoli è dunque la seguente.
Ore Settimanali (X) Punteggio (Y) X2 XY Y2
3 57
4 78
4 72
2 58
5 89
3 63
4 73
5 84
3 75
2 48
Somme 35 697 133 2554 50085
Medie 3,5 69,7 13,3 255,4 5008,5
Var(X) Cov(X,Y) Var(Y)
1,05 11,45 150,41

a)
11,45
𝑏̂ = = 10,905
1,05
𝑎̂ = 69,7 − 10,905 × 3,5 = 31,533
Quindi, la retta di regressione 𝑦̂ = 31,533 + 10,905 𝑥, fornisce, per 𝑥 = 6 ore
settimanali, una previsione del punteggio pari a 96,963.

b) L’indice di determinazione lineare è pari a


11,452
𝜌2 = = 0,830
1,05 × 150,41
L’83% della varianza dei punteggi viene assorbita o spiegata dalla dipendenza
lineare del punteggio dalle ore di studio settimanali.
Esercizio 3. Regressione Lineare Semplice
La regressione lineare semplice di 𝑌 su 𝑋 basata su 𝑛 = 5 unità statistiche ha
fornito i seguenti valori teorici della retta
𝑦̂ = 1,1 , 2 , 3,1 , 1 , 4
Sapendo che la varianza di 𝑌 è pari a 1,5 e quella di 𝑋 è pari a 2, si calcoli:
a) 𝑦̅

b) L’indice di determinazione lineare.

c) Quali sono i valori possibili della covarianza tra 𝑋 ed 𝑌 ?


Soluz.
a) Sappiamo che i valori teorici riproducono la media dei valori osservati, cioè
M(𝑦̂) = 𝑦̅.
Quindi 𝑦̅ = 2,24.

b) Sappiamo che la varianza spiegata dalla regressione lineare è la varianza dei


valori teorici,

𝑉𝑎𝑟(𝑦̂) = 1,346

Dunque la percentuale di varianza spiegata è

𝑉𝑎𝑟(𝑦̂) 1,346
𝜌2 = = = 89,7%
𝑉𝑎𝑟(𝑦) 1,5

c) Sappiamo che l’indice di determinazione lineare è il quadrato del


coefficiente di correlazione
𝐶𝑜𝑣(𝑥,𝑦)2
𝜌2 = .
𝑉𝑎𝑟(𝑥) 𝑉𝑎𝑟(𝑦)

Dunque
𝐶𝑜𝑣(𝑥, 𝑦)2 = 0,897 𝑉𝑎𝑟(𝑥) 𝑉𝑎𝑟(𝑦) = 2,691

Da cui 𝐶𝑜𝑣(𝑥, 𝑦) = ±1,64


Esercizio 4. Test sulla media, p-val e beta.
Secondo una agenzia immobiliare, il prezzo medio degli appartamenti in
vendita a Roma, zona Acilia, aggiornato alla fine del mese di novembre 2022 è
pari a 2350 €/m².
Al fine di verificare questa affermazione, sono stati rilevati i prezzi di un
campione casuale di 10 appartamenti messi in vendita nella stessa zona e nello
stesso mese, ottenendo una media campionaria pari a 2500 e una deviazione
standard pari a 250.
a) Si sottoponga a verifica di ipotesi l’affermazione dell’agenzia al livello di
significatività del 5%, specificando le due ipotesi, la regione critica e il
risultato del test.
b) Quale assunzione si è posta per procedere al test?

Si fornisca una valutazione approssimata


c) del p-valore,
d) della probabilità dell’errore di seconda specie quando la media dei prezzi
è effettivamente pari a 2500.
Soluz.
a) e b) . Si assume che il prezzo delle case in quella zona e in quel mese
sia una vc distribuita normalmente: 𝑋~𝑁(𝜇, 𝜎 2 ).
Allora, il prezzo medio di un campione casuale di 10 appartamenti è normale:
𝜎2
𝑋̅ ~ 𝑁 (𝜇, ).
10
Inoltre, la media campionaria standardizzata con la deviazione standard
campionaria ha la distribuzione T di Student con 9 gradi di libertà:

𝑋̅ − 𝜇
𝑇= ~ 𝑇9
𝑆/√10
Le ipotesi sono:
𝐻0 : 𝜇 = 𝜇0 = 2350 vs 𝐻1 : 𝜇 ≠ 𝜇0

Dalle tavole della T si ottengono i percentili di ordine 2,5% 𝑒 97,5%, pari a


∓2,262. Quindi, la regione critica, definita rispetto alla vc T calcolata
assumendo 𝐻0 è
𝑅𝐶 = {𝑇 ∉ (∓2,262)}

La T osservata è pari a
2500 − 2350
𝑇𝑜𝑠𝑠 = = 1,90 ∉ 𝑅𝐶
250/√10
Quindi possiamo accettare l’ipotesi nulla.

c) 𝑝 − 𝑣𝑎𝑙 = 𝑝(|𝑇| > 1,9|𝐻0 ).

Dalle tavole della T si nota che il 95° percentile è 1,833. Quindi, la probabilità
che T>1,9 è poco meno del 5% e il p-valore è poco meno del 10%.

d) In termini della media campionaria, la regione critica è


250
𝑅𝐶 = {𝑋̅ ∉ (2350 ∓ 2,262 )} = {𝑋̅ ∉ (2171,2 , 2528,8) }
√10
Perciò
𝛽 = 𝑝(𝑅𝐶̅̅̅̅ |𝐻1 ) = 𝑝{𝑋̅ ∈ (2171,2 , 2528,8) | 𝜇 = 2500}

= 𝑝{𝑇 ∈ (−4,16 , 0,36) } = 𝑝(𝑇 < 0,36) − 𝑝(𝑇 < −4,16)

Dalle tavole si evince che la prima probabilità è compresa tra 0,6 e 0,7, mentre
la seconda è compresa tra 0,001 e 0,005. Quindi
𝛽 ∈ (0,6 − 0,005 , 0,7 − 0,001) = (55,5% , 69,9% ).
Domanda 1. La malattia A colpisce usualmente 1 persona su 20, mentre la malattia B
colpisce il 4% delle persone. Supponendo che i due eventi siano indipendenti, qual è la
probabilità di
a) avere entrambe le malattie?
b) Di averne almeno una?
c) Di averne solo una?
Soluz.
a) 0,05x0,04=0,02
b) 0,05+0,04-0,02=0,07
c) 0,05x0,96+0,95x0,04=0,086
Domanda 2. L’importazione di grano in migliaia di tonnellate negli anni 1991 − 1997 è
stata la seguente:
Anno 1991 1992 1993 1994 1995 1996 1997
Quantità 1534 2323 2340 2150 2460 2470 2510

Si calcoli, per il periodo considerato,


a) l'indice a base mobile medio annuo;
b) il tasso di variazione medio annuo.
Soluz.
1
2510 6
a) (1534) = 1,0855
b) 0,0855
Domanda 3. La varianza campionaria ottenuta da un campione casuale di ampiezza 81 è
risultata pari a 𝑆 2 = 4,5.
a) Si calcoli un intervallo di confidenza per la varianza della popolazione al livello 0,9.
b) Un esperto afferma che la varianza nella popolazione non è inferiore a 5. Si
verifichi tale affermazione al livello di significatività del 5%.
Soluz.
Sappiamo che
(𝑛 − 1)𝑆 2 80 𝑆 2 2
𝑉= 2
= 2
~𝜒80
𝜎 𝜎
Ove 𝜎 2 è la varianza della popolazione.

a) I quantili di ordine 0,05 e 0,95 della vc 𝑉 sono 𝑉(0,05) = 60,39 e 𝑉(0,95) = 101,88. Quindi
l’intervallo richiesto è

80 × 4,5 80 × 4,5
( , ) = (3,53 , 5,96)
101,88 60,39

b) 𝐻0 : 𝜎 2 = 5 vs 𝐻0 : 𝜎 2 < 5 . Perciò

𝑅𝐶 = {𝑉0 < 𝑉(0,05) = 60,39},

ove 𝑉0 è la vc 𝑉 calcolata assumendo vera 𝐻0 , cioè 𝜎 2 = 5.


80×4,5
Poiché 𝑉0 = = 72, l’ipotesi nulla non viene rifiutata.
5
Domanda 4. Un carattere qualitativo X ha tre modalità: A, B e C. Un campione casuale di
unità statistiche provenienti da una determinata popolazione ha fornito la seguente
tabella di frequenze.

x nx
A 18
B 28
C 44
90
Si consideri l’ipotesi 𝐻0 che nella popolazione 𝑝(𝐵) = 𝑝(𝐶) = 𝑝.
a) Si fornisca la stima consistente e corretta di 𝑝(A) e, di conseguenza, la stima di 𝑝
assumendo vera 𝐻0 .

b) Si verifichi l’ipotesi 𝐻0 utilizzando il test Chi-quadro al livello di significatività del


5%.
Soluz.
a) La stima consistente e corretta di A è la frequenza relativa 18/90=20%.
Assumendo eguali probabilità per B e C, la stima di p risulta pari a 0,8/2=40%.

b) La distribuzione ipotizzata è dunque 0,2, 0,4, 0,4, cui corrispondono le


frequenze attese della terza colonna:
nx
x nx
attese
A 18 18
B 28 36
C 44 36
90 90

La statistica chi-quadro è pari a 3,556. Se fosse vera l’ipotesi nulla, la v.c. chi-
quadro avrebbe il 95% percentile pari a 3,84 (con 3-1-1=1 grado di libertà).
Quindi non si rifiuta l’ipotesi nulla.

Potrebbero piacerti anche