Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Esercizio 6. Una ASL sta conducendo uno studio sull’inquinamento industriale nel terri-
torio. In particolare vengono fatte misure di presenza di inquinanti nelle acque di scarico
di due aziende simili, che per semplicità chiameremo azienda X e Y . Le misure sulle acque
di ciascuna azienda vengono fatte a distanza di una settimana ed è ragionevole ritenerle
indipendenti. Vengono fatte n = 31 misure per l’azienda X e m = 25 per Y : i dati che si
ottengono, in opportune unità di misura, sono riassunti dalle seguenti statistiche (media e
deviazione standard campionarie):
q q
2
X̄n = 86.48, SX = 16.00; Ȳm = 83.25, SY2 = 21.84.
È ragionevole assumere che le misure costituiscano due campioni gaussiani indipendenti, con
2
varianze σX e σY2 .
2
1. Ricavare un intervallo di confidenza unilatero per σX /σY2 di livello 99%, del tipo (0, a).
A questo punto gli analisti sospettano che non ci siano differenze tra quantità e variabilità
dell’inquinamento prodotto dalle due aziende, e pertanto, decidono di verificare l’ipotesi che
le distribuzioni gaussiane dei due campioni coincidano.
2. Anzitutto si verifichi, al livello di significatività del 5%, l’ipotesi che le varianze delle
due popolazioni coincidano.
1
3. Se al punto precedente si è concluso che non si può rifiutare l’ipotesi che le varianze delle
due popolazioni coincidano, scrivere le opportune ipotesi (nulla e alternativa) sull’altra
coppia di parametri incogniti per verificare l’ipotesi che le misure di inquinamento nelle
due aziende provengano dalla stessa distribuzione. Cosa si può concludere dai dati a
livello di significatività dell’1%? (Suggerimento: nella lettura dalle tavole dei quantili
di una opportuna distribuzione, utilizzare come gradi di libertà l’intero più vicino al
numero esatto di gradi di libertà).
Esercizio 7. Ci chiediamo se il risultato del test on line (TOL) per l’ingresso alla facoltà
di Ingegneria dell’Ateneo XXX sia indipendente dal tipo di liceo scientifico di provenienza,
tradizionale o di scienze applicate. I dati a disposizione sono riportati in questa tabella:
Scuola\ TOL < 60 [60, 75) [75, 100)
Tradizionale 228 1203 807 .
Scienze Applicate 647 547 273
1. In base ad essi, si può affermare che il tipo di liceo scientifico influisce sul risultato del
TOL? Enunciare ipotesi nulla e alternativa ed eseguire un opportuno test al livello di
significatività dello 0.5%.
Ora ci interessa concentrarci sulla totalità dei dati di risultato al TOL, a prescindere dalla
scuola di provenienza. Grazie a studi precedenti, è stata formulata l’ipotesi che la probabilità
che il voto al TOL sia insufficiente (< 60) è pari alla probabilità che il voto sia almeno 75, e
che la probabilità che appartenga alla classe intermedia sia pari a due volte la probabilità che
sia insufficiente. Si vuole stabilire se i dati in tabella sono in accordo con l’ipotesi formulata.
3. Utilizzando come ipotesi nulla quella ricavata al punto precedente, eseguire un op-
portuno test per stabilire se i dati in tabella sono in accordo con l’ipotesi formulata,
valutandone il p-value.
2
SOLUZIONI 30/06/14
Esercizio 1.
n
1X nµ
1. E X n = E (Xk ) = = µ.
n k=1 n
n
1 X nσ 2 σ2
2. Var X n = 2 Var(Xk ) = 2 = .
n k=1 n n
2 h 2
i σ2
− µ2 = Var X n = .
2
3. Dato che µ = E X n , si ha: distorsione = E X n
n
1. H0 : p = p0 , H1 : p 6= p0
(a) Regione critica: {|Z| > z.025 }. |z| ' 1.4887, z.025 ' 1.960: non rifiuto H0 .
(b) P-value: P(|Z| > |z|) ' 2[1 − Φ(1.489)] ' 2[1 − 0.93176] = 0.13648 ' 13.6%.
2. H0 : p ≤ p0 , H1 : p > p0
(a) Regione critica: {Z > z.05 }. z ' 1.4887, z.05 ' 1.6449: non rifiuto H0 .
(b) P-value: P(Z > z) ' 1 − Φ(1.489) ' 1 − 0.93176 = 0.06824 ' 6.8%.
3
In questo caso risulta
cioè
0.4673 ' 1/2.14 = 1/f0.025,24,30 = f0.975,30,24 < 0.5367 < f0.025,30,24 = 2.21.
Pertanto non si può rifiutare l’ipotesi H0 che le varianze delle due popolazioni coinci-
dano al livello del 5%.
3. Vista la conclusione del punto precedente, verificare che le due distribuzioni coincidano
è equivalente a verificare che le medie di due popolazioni gaussiane con stessa varianza
sono uguali, cioè
2
H0 : µX = µY vs H1 : µX 6= µY con σX = σY2 = σ 2 incognita.
Per stabilire cosa si conclude dai dati a tal proposito, bisogna utilizzare un test t:
si rifiuta H0 al livello α se
1. Vogliamo verificare
4
Per n grande, la statistica test T ∗ , sotto l’ipotesi H0 , ha distribuzione chi-quadrato con
(r − 1)(s − 1) = (2 − 1)(3 − 1) = 2 gradi di libertà:
3 X 2
X (Nij − np̂i q̂j )2 H0 2
T∗ = ∼ χ (2).
j=1 i=1
np̂ i q̂ j
Ricordiamo che
3 X
2
(nij )2 2282 12032 8072 6472 5472
X
∗
t = ni mj −n= 875·2238 + 1750·2238 + 1080·2238 + 875·1467 + 1750·1467
j=1 i=1 n 3705 3705 3705 3705 3705
2732
+ 1080·1467 − 3705 = 4280.04 − 3705 = 575.04.
3705
Poiché t∗ = 575.04 > χ2α,2 = χ20.005,2 = 10.60, si rifiuta H0 a livello di significatività del
5h.
2. In pratica, l’ipotesi formulata è che la variabile aleatoria Y segua una legge discreta
con masse q0,1 = P(Y < 60), q0,2 = P(60 ≤ Y < 75), q0,3 = P(Y ≥ 75), con q0,1 = q0,2 ,
q0,2 = 2q0,1 e q0,1 + q0,2 + q0,3 = 1; pertanto si ricava q0,1 + 2q0,1 + q0,1 = 1, da cui
q0,1 = q0,3 = 41 e q0,2 = 12 .