Sei sulla pagina 1di 4

Esercizio 1

In un campione di 5 studenti sono stati osservati i seguenti punteggi di ansia: 13, 14, 12, 9,
12. Calcolarne:
a) la varianza ____
b) la media ____
c) la mediana ____
d) il secondo terzile ____
Soluzione
∑𝑛 𝑥 𝑖 13+14+12+9+12 60
a) 𝑥̅ = 𝑖=1 = = 5 = 12
𝑛 5
𝑛 2
2
∑𝑖=1(𝑥𝑖 − 𝑥̅ ) (13 − 12)2 + (14 − 12)2 + (12 − 12)2 + (9 − 12)2 + (12 − 12)2
𝑠 = =
𝑛−1 5−1
1 + 22 + 02 + (−3)2 + (0)2 1 + 4 + 0 + 9 + 0 14
2
= = = = 3.5
4 4 4
b) 𝑥̅ = 12

Per le domande c) e d) dispongo preliminarmente le osservazioni in ordine crescente:


9, 12, 12, 13, 14.
c) Se le osservazioni sono in numero dispari, come in questo caso (𝑛 = 5), la mediana è
𝑛+1 5+1 6
data dall’osservazione centrale, cioè quella di posizione 2 = 2 = 2 = 3, cioè in questo
caso la terza osservazione in ordine crescente, ossia 12.
d) Il secondo terzile è un punto che lascia a sinistra due terzi delle osservazioni e a destra
il restante terzo. Esistono diverse definizioni operative: quella che abbiamo dato ricava
2 2 2
prima la posizione dal prodotto (𝑛 + 1) 3 = (5 + 1) 3 = 6 3 = 4. Pertanto il secondo terzile
sarà la quarta osservazione in ordine crescente, vale a dire 13.

Esercizio 2
In una popolazione di studenti universitari, un punteggio che misura le competenze
matematiche ha distribuzione approssimativamente normale con media 24 e deviazione
standard 3.
a) Qual è la probabilità che uno studente abbia un punteggio inferiore a 23? ____%
b) Qual è la probabilità che il punteggio medio in un campione di 9 studenti sia inferiore a
23? ____
Soluzione
a) Standardizzo il valore 𝑥 = 23:
𝑥 − 𝜇 23 − 24 1
𝑧= = = − = −0.33
𝜎 3 3
𝑃(𝑋 < 23) = 𝑃(𝑍 < −0.33) = 𝑃(𝑍 > 0.33) = 1 − 𝑃(𝑍 < 0.33)
Dalle tavole statistiche per la distribuzione standardizzata 𝑍 trovo che 𝑃(𝑍 < 0.33) = 63%,
cosicché 𝑃(𝑋 < 23) = 1 − 0.63 = 37%
b) Stavolta 23 rappresenta un valore soglia per la media campionaria, che ha distribuzione
𝜎
normale con media 𝜇 e deviazione standard 𝑛 (detto errore standard della media), perciò

devo standardizzare rispetto a questi due valori:
𝑥̅ − 𝜇 23 − 24 1
𝑧= = = − = −1
𝜎/√𝑛 3/√9 1
̅
𝑃(𝑋 < 23) = 𝑃(𝑍 < −1) = 𝑃(𝑍 > 1) = 1 − 𝑃(𝑍 < 1) = 1 − 0.84 = 16%
Esercizio 3
In uno studio che vuole valutare l’efficacia di un nuovo trattamento sperimentale per la
depressione, 150 pazienti vengono assegnati al trattamento sperimentale e 150 al
trattamento standard. Riportano un miglioramento 44 pazienti sottoposti al trattamento
sperimentale e 35 pazienti sottoposti al trattamento standard.
A un livello di significatività del 5%, c’è evidenza che le proporzioni di pazienti che
riportano miglioramento coi due trattamenti siano diverse?
a) Ipotesi nulla del test:
o Le proporzioni nei campioni sottoposti ai due trattamenti sono uguali
o Le proporzioni nei campioni sottoposti ai due trattamenti sono diverse
o Le proporzioni nelle popolazioni sottoposte ai due trattamenti sono uguali
o Le proporzioni nelle popolazioni sottoposte ai due trattamenti sono diverse

b) Valore osservato della statistica test (con 2 cifre decimali): ____

c) P-value del test (con 2 cifre decimali): ____

d) Decisione:
o c'è evidenza che le proporzioni siano diverse perché il p-value < 0.05
o non c'è evidenza che le proporzioni siano diverse perché il p-value < 0.05
o c'è evidenza che le proporzioni siano diverse perché il p-value > 0.05
o non c'è evidenza che le proporzioni siano diverse perché il p-value > 0.05
Soluzione
a) La risposta corretta è la terza: l’ipotesi nulla del test è che le proporzioni nelle
popolazioni sottoposte ai due trattamenti siano uguali. Procedendo per esclusione,
l’ipotesi nulla esprime sempre assenza di associazioni, effetti o differenze, onde
escludiamo la seconda e la quarta risposta; inoltre le ipotesi sono sempre sulle
popolazioni e non sui campioni (che sono lo strumento in base al quale prendiamo una
decisione sulle ipotesi), sicché possiamo escludere anche la prima risposta.
b) Si tratta di un test per il confronto tra due proporzioni con campioni indipendenti. Si
utilizza la statistica
𝑝2 − 𝑝1
𝑧=
𝐸𝑆
dove
35
𝑝1 = = 0.23
150
44
𝑝2 = = 0.29
150
l’errore standard ES è:
1 1
𝐸𝑆 = √𝑝(1 − 𝑝) ( + )
𝑛1 𝑛2
dove 𝑝 è la stima pooled dell’unica proporzione che esiste sotto ipotesi nulla (l’ipotesi nulla
44+35 79
è che le due proporzioni di popolazione in realtà siano uguali): 𝑝 = 150+150 = 300 = 0.26

1 1 1 1 2
𝐸𝑆 = √𝑝(1 − 𝑝) ( + ) = √0.26(1 − 0.26) ( + ) = √0.26 ∙ 0.74 ∙ = √0.0026
𝑛1 𝑛2 150 150 150
= 0.051
Quindi:
𝑝2 − 𝑝1 0.29 − 0.23
𝑧𝑜𝑏𝑠 = = = 1.18
𝐸𝑆 0.051
(se avessimo scelto come gruppo 1 quello col trattamento sperimentale avremmo ottenuto
-1.18)

3) 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 ∙ 𝑃(𝑍 > |𝑧𝑜𝑏𝑠 |) = 2 ∙ 𝑃(𝑍 > 1.18) = 2(1 − 𝑃(𝑍 < 1.18)) = 2(1 − 0.88) = 2 ∙
0.12 = 0.24

4) La risposta corretta è la quarta:


𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.24 > 0.05 = 𝛼
cosicché non possiamo rifiutare l’ipotesi nulla che la proporzione (di popolazione) di
migliorati sia uguale coi due trattamenti (ossia non c’è evidenza che le due proporzioni
siano diverse), a un livello di significatività 𝛼 = 0.05.

Esercizio 4
Un campione di 300 matricole di una certa università è composto da 120 maschi e per il
resto da femmine. Delle femmine, il 50% proviene da una scuola a indirizzo scientifico, il
10% da un indirizzo tecnico e il resto da un indirizzo umanistico. Dei maschi, il 70%
proviene da una scuola a indirizzo scientifico, il 10% da un indirizzo umanistico e il resto
da un indirizzo tecnico.
a) Estraendo a caso dal campione uno studente, qual è la probabilità che questi sia
maschio e provenga da una scuola a indirizzo tecnico? ____%
b) Estraendo a caso dal campione uno studente maschio, qual è la probabilità che questi
provenga da una scuola a indirizzo tecnico? ____%
c) Estraendo a caso dal campione uno studente proveniente da una scuola a indirizzo
tecnico, qual è la probabilità che questi sia maschio? ____%
Soluzione
Prima di tutto ricavo la tabella di contingenza 2 (numero di indirizzi scolastici) x 3 (numero
di generi) [avrei potuto equivalentemente creare una tabella 3x2, cioè con 3 righe e 2
colonne]. Dai dati otteniamo subito:
Scientifico Tecnico Umanistico
Maschio 84 (=120*0.70) 12 (=120*0.10) 120
Femmina 90 (=180*0.50) 18 (=180*0.10) 180 (=300-
120)
300

e riempiamo le restanti celle per sottrazione o addizione:


Scientifico Tecnico Umanistico
Maschio 84 24 (=120-84-12) 12 120
Femmina 90 18 72 180
(=180-90-18)
174 (=84+90) 42 (=24+18) 84 (=12+72 300
oppure =300-
174-42)

a) La probabilità congiunta P(maschio e tecnico) che lo studente sia maschio e provenga


da un istituto tecnico è uguale alla proporzione di soggetti da indirizzo tecnico e maschi
rispetto all’intero campione: P(maschio e tecnico) = 24 / 300 = 0.08, cioè l’8%.
b) Calcoliamo la probabilità che uno studente maschio provenga da un indirizzo tecnico,
P(tecnico | maschio) restringendoci all’insieme dei 60 maschi: di questi, una quota pari a
24 / 120 = 0.20, cioè il 20%, proviene da un indirizzo tecnico.
c) Rispetto alla domanda precedente invertiamo il condizionamento: calcoliamo la
probabilità che uno studente da un indirizzo tecnico sia maschio, P(maschio | tecnico)
restringendoci all’insieme dei 42 tecnici: di questi, una quota pari a 24 / 42 = 0.57, cioè il
57%, è maschio.

Esercizio 5
Si misurano i livelli di colesterolo LDL in due campioni, il primo composto da 81 individui che
svolgono attività fisica ed il secondo da 81 individui che conducono vita sedentaria. Sul
primo campione si misura un livello medio di colesterolo LDL pari a 115 mg/d, con
deviazione standard 10, e sul secondo un livello medio pari a 130 mg/dL, con deviazione
standard 10.
a) Fornire una stima intervallare, a un livello di confidenza del 95%, per la differenza del
livello medio di colesterolo tra i soggetti che svolgono attività fisica rispetto ai soggetti
che conducono vita sedentaria. Da: ____ a: _____
b) In base al risultato del punto precedente, c’è evidenza a un livello del 5% che il livello
medio di colesterolo per chi svolge attività fisica sia diverso dal livello medio di
colesterolo per chi conduce vita sedentaria?
Soluzione
a) Si tratta di un intervallo di confidenza al 95% per la differenza tra due medie per
campioni grandi (𝑛1 > 30 ed 𝑛2 > 30), cosicché applichiamo la formula
𝐼𝐶 95% = 𝑥̅2 − 𝑥̅1 ± 𝑧1−𝛼 ∙ 𝑆𝐸
2
dove:
𝑥̅1 = 130
𝑥̅2 = 115
𝑧1−𝛼 = 𝑧0.975 = 1.96 è il 97.5% percentile della distribuzione normale standardizzata Z
2

𝑠12 𝑠22 102 102


𝑆𝐸 = √ + =√ + = √2.47 = 1.57
𝑛1 𝑛2 81 81
cosicché:
𝐼𝐶 95% = 115 − 130 ± 1.96 ∙ 1.57 = −15 ± 3 = (−18, − 12)
b) L’intervallo di confidenza al 95% per la differenza 𝜇2 − 𝜇1 (tra le media di colesterolo
nella popolazione che svolge attività fisica e la media di colesterolo nella popolazione che
conduce vita sedentaria) non contiene il valore 0, quindi possiamo rigettare l’ipotesi (nulla)
che 𝜇2 − 𝜇1 = 0, ossia che le medie siano uguali, a un livello di significatività 𝛼 = 5%: c’è
quindi evidenza che esse siano diverse.

Potrebbero piacerti anche