Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
In un campione di 5 studenti sono stati osservati i seguenti punteggi di ansia: 13, 14, 12, 9,
12. Calcolarne:
a) la varianza ____
b) la media ____
c) la mediana ____
d) il secondo terzile ____
Soluzione
∑𝑛 𝑥 𝑖 13+14+12+9+12 60
a) 𝑥̅ = 𝑖=1 = = 5 = 12
𝑛 5
𝑛 2
2
∑𝑖=1(𝑥𝑖 − 𝑥̅ ) (13 − 12)2 + (14 − 12)2 + (12 − 12)2 + (9 − 12)2 + (12 − 12)2
𝑠 = =
𝑛−1 5−1
1 + 22 + 02 + (−3)2 + (0)2 1 + 4 + 0 + 9 + 0 14
2
= = = = 3.5
4 4 4
b) 𝑥̅ = 12
Esercizio 2
In una popolazione di studenti universitari, un punteggio che misura le competenze
matematiche ha distribuzione approssimativamente normale con media 24 e deviazione
standard 3.
a) Qual è la probabilità che uno studente abbia un punteggio inferiore a 23? ____%
b) Qual è la probabilità che il punteggio medio in un campione di 9 studenti sia inferiore a
23? ____
Soluzione
a) Standardizzo il valore 𝑥 = 23:
𝑥 − 𝜇 23 − 24 1
𝑧= = = − = −0.33
𝜎 3 3
𝑃(𝑋 < 23) = 𝑃(𝑍 < −0.33) = 𝑃(𝑍 > 0.33) = 1 − 𝑃(𝑍 < 0.33)
Dalle tavole statistiche per la distribuzione standardizzata 𝑍 trovo che 𝑃(𝑍 < 0.33) = 63%,
cosicché 𝑃(𝑋 < 23) = 1 − 0.63 = 37%
b) Stavolta 23 rappresenta un valore soglia per la media campionaria, che ha distribuzione
𝜎
normale con media 𝜇 e deviazione standard 𝑛 (detto errore standard della media), perciò
√
devo standardizzare rispetto a questi due valori:
𝑥̅ − 𝜇 23 − 24 1
𝑧= = = − = −1
𝜎/√𝑛 3/√9 1
̅
𝑃(𝑋 < 23) = 𝑃(𝑍 < −1) = 𝑃(𝑍 > 1) = 1 − 𝑃(𝑍 < 1) = 1 − 0.84 = 16%
Esercizio 3
In uno studio che vuole valutare l’efficacia di un nuovo trattamento sperimentale per la
depressione, 150 pazienti vengono assegnati al trattamento sperimentale e 150 al
trattamento standard. Riportano un miglioramento 44 pazienti sottoposti al trattamento
sperimentale e 35 pazienti sottoposti al trattamento standard.
A un livello di significatività del 5%, c’è evidenza che le proporzioni di pazienti che
riportano miglioramento coi due trattamenti siano diverse?
a) Ipotesi nulla del test:
o Le proporzioni nei campioni sottoposti ai due trattamenti sono uguali
o Le proporzioni nei campioni sottoposti ai due trattamenti sono diverse
o Le proporzioni nelle popolazioni sottoposte ai due trattamenti sono uguali
o Le proporzioni nelle popolazioni sottoposte ai due trattamenti sono diverse
d) Decisione:
o c'è evidenza che le proporzioni siano diverse perché il p-value < 0.05
o non c'è evidenza che le proporzioni siano diverse perché il p-value < 0.05
o c'è evidenza che le proporzioni siano diverse perché il p-value > 0.05
o non c'è evidenza che le proporzioni siano diverse perché il p-value > 0.05
Soluzione
a) La risposta corretta è la terza: l’ipotesi nulla del test è che le proporzioni nelle
popolazioni sottoposte ai due trattamenti siano uguali. Procedendo per esclusione,
l’ipotesi nulla esprime sempre assenza di associazioni, effetti o differenze, onde
escludiamo la seconda e la quarta risposta; inoltre le ipotesi sono sempre sulle
popolazioni e non sui campioni (che sono lo strumento in base al quale prendiamo una
decisione sulle ipotesi), sicché possiamo escludere anche la prima risposta.
b) Si tratta di un test per il confronto tra due proporzioni con campioni indipendenti. Si
utilizza la statistica
𝑝2 − 𝑝1
𝑧=
𝐸𝑆
dove
35
𝑝1 = = 0.23
150
44
𝑝2 = = 0.29
150
l’errore standard ES è:
1 1
𝐸𝑆 = √𝑝(1 − 𝑝) ( + )
𝑛1 𝑛2
dove 𝑝 è la stima pooled dell’unica proporzione che esiste sotto ipotesi nulla (l’ipotesi nulla
44+35 79
è che le due proporzioni di popolazione in realtà siano uguali): 𝑝 = 150+150 = 300 = 0.26
1 1 1 1 2
𝐸𝑆 = √𝑝(1 − 𝑝) ( + ) = √0.26(1 − 0.26) ( + ) = √0.26 ∙ 0.74 ∙ = √0.0026
𝑛1 𝑛2 150 150 150
= 0.051
Quindi:
𝑝2 − 𝑝1 0.29 − 0.23
𝑧𝑜𝑏𝑠 = = = 1.18
𝐸𝑆 0.051
(se avessimo scelto come gruppo 1 quello col trattamento sperimentale avremmo ottenuto
-1.18)
3) 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 2 ∙ 𝑃(𝑍 > |𝑧𝑜𝑏𝑠 |) = 2 ∙ 𝑃(𝑍 > 1.18) = 2(1 − 𝑃(𝑍 < 1.18)) = 2(1 − 0.88) = 2 ∙
0.12 = 0.24
Esercizio 4
Un campione di 300 matricole di una certa università è composto da 120 maschi e per il
resto da femmine. Delle femmine, il 50% proviene da una scuola a indirizzo scientifico, il
10% da un indirizzo tecnico e il resto da un indirizzo umanistico. Dei maschi, il 70%
proviene da una scuola a indirizzo scientifico, il 10% da un indirizzo umanistico e il resto
da un indirizzo tecnico.
a) Estraendo a caso dal campione uno studente, qual è la probabilità che questi sia
maschio e provenga da una scuola a indirizzo tecnico? ____%
b) Estraendo a caso dal campione uno studente maschio, qual è la probabilità che questi
provenga da una scuola a indirizzo tecnico? ____%
c) Estraendo a caso dal campione uno studente proveniente da una scuola a indirizzo
tecnico, qual è la probabilità che questi sia maschio? ____%
Soluzione
Prima di tutto ricavo la tabella di contingenza 2 (numero di indirizzi scolastici) x 3 (numero
di generi) [avrei potuto equivalentemente creare una tabella 3x2, cioè con 3 righe e 2
colonne]. Dai dati otteniamo subito:
Scientifico Tecnico Umanistico
Maschio 84 (=120*0.70) 12 (=120*0.10) 120
Femmina 90 (=180*0.50) 18 (=180*0.10) 180 (=300-
120)
300
Esercizio 5
Si misurano i livelli di colesterolo LDL in due campioni, il primo composto da 81 individui che
svolgono attività fisica ed il secondo da 81 individui che conducono vita sedentaria. Sul
primo campione si misura un livello medio di colesterolo LDL pari a 115 mg/d, con
deviazione standard 10, e sul secondo un livello medio pari a 130 mg/dL, con deviazione
standard 10.
a) Fornire una stima intervallare, a un livello di confidenza del 95%, per la differenza del
livello medio di colesterolo tra i soggetti che svolgono attività fisica rispetto ai soggetti
che conducono vita sedentaria. Da: ____ a: _____
b) In base al risultato del punto precedente, c’è evidenza a un livello del 5% che il livello
medio di colesterolo per chi svolge attività fisica sia diverso dal livello medio di
colesterolo per chi conduce vita sedentaria?
Soluzione
a) Si tratta di un intervallo di confidenza al 95% per la differenza tra due medie per
campioni grandi (𝑛1 > 30 ed 𝑛2 > 30), cosicché applichiamo la formula
𝐼𝐶 95% = 𝑥̅2 − 𝑥̅1 ± 𝑧1−𝛼 ∙ 𝑆𝐸
2
dove:
𝑥̅1 = 130
𝑥̅2 = 115
𝑧1−𝛼 = 𝑧0.975 = 1.96 è il 97.5% percentile della distribuzione normale standardizzata Z
2