Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
ki
oo
eb
is
Fondamenti di
Statistica Th
Seconda Parte
ma
by
ed
own
PETRACCA FRANCESCO LUIGI
k is
Statistica Inferenziale
boo
se
Thi
Petracca Francesco L.
This
Quando parliamo statistica inferenziale facciamo riferimento a
metodi che ci consentono di trarre conclusioni su una
ebo
popolazione in base a risultati ottenuti su un campione. Si
tratta di stimare le caratteristiche della popolazione, note
ok
anche come “parametri” e verificare le ipotesi. Dobbiamo
is ow
analizzare le caratteristiche del campione note anche come
“statistiche” e le rispettive distribuzioni. Ricordiamo che i
ned
C1
.it 22
02
C3
C2
0 1
statistiche: σ2campione,
-02
μcampione,……..
0380 02-
Petracca Francesco L.
68- -52
Spesso è consuetudine indicare i parametri della popolazione e le
statistiche dei campioni con il seguente simbolismo:
Popolazione Campione
media μ
varianza σ2 s2
This ebook is owned by massimo.m
Deviazione standard σ s
proporzione φ p
caratteristiche
Petracca Francesco L.
02-03
17-02
01
STATISTICA
2
INFERENZIALE
0
il. it 22
a
hotm
ndo
Si fanno rilevazioni
solo su una parte
o
o.m
della popolazione
mstatistica detta
Campione
ss i
ma y
db
o wne
Si utilizza un procedimento
is
di inferenza:
ok
(statistiche) si ricavano i
parametri della popolazione
is eTh
Petracca Francesco L.
80-5
-0202-03
Fondamenti di Statistica
2020117
PETRACCA FRANCESCO LUIGI
Perché studiare i
tmail.it 2
Campioni?
ondo ho
statistiche
ok is ow
Petracca Francesco L.
Presentazione
Petracca Francesco L.
Indice
Introduzione.……….………………………………………………………………..……….2
1.0 Inferenza statistica…………………………………….………………………………3
1.1 Il Campionamento…..…..………………………………….…………………….….5
1.2 Il Campionamento e il calcolo delle Probabilità…….……………………5
1.3 Stima dei parametri……………………………………..…..……..………………..9
1.4 Lo Spazio campionario……………………………………….………………….…..9
1.5 Calcolo dei parametri μ e σ2 di un campione …………..………………12
1.6 Teoremi…………………………………………………………..………………………14
2.0 Dalle statistiche del campione ai parametri della popolazione …16
2.1 Stima intervallare_1.……………………………………………………….………18
2.2 La distribuzione di Gauss............................................................24
3.0 Stima intervallare_2..............................................................……27
3.1 Considerazioni sulla stima puntuale e intervallare ..….…………… 30
3.2 Test dell’Ipotesi ………………..……..................................................31
3.3 Fasi operative nel Test d’Ipotesi…..……………………………………......32
3.4 La distribuzione T di Student……………………………………………….….39
3.5 Metodi di Campionamento……………………………………………….…..40
Glossario
Bibliografia
ed
own
is
o k
e bo
1 s
i
Th
Petracca Francesco L.
is
Th
Introduzione
2
Petracca Francesco L.
.it
ail
tm
ho
do
calcolare la probabilità di estrarre una pallina rossa, essa è data da
on
o.m
𝐧° 𝐜𝐚𝐬𝐨 𝐟𝐚𝐯𝐨𝐫𝐞𝐯𝐨𝐥𝐢 𝟑
𝒑= = = 𝟎, 𝟑𝟎 = 𝟑𝟎%
𝐧° 𝐜𝐚𝐬𝐢 𝐩𝐨𝐬𝐬𝐢𝐛𝐢𝐥𝐢 𝟏𝟎
sim
as
ym
db
e
wn
so
ki
oo
Viceversa se abbiamo un’urna di cui non conosciamo la composizione
eb
o
sim
Campione
as
estratto m
by
e d
own
inferenza is
o k
Caratteristiche:
parametri ebo Caratteristiche:
statistiche
s
T hi
4
Petracca Francesco L.
1.1 Il Campionamento
Esistono vari metodi di campionamento ma nel testo ci riferiamo al
campionamento casule: le unità statistiche che entrano a far parte
della popolazione sono estratte casualmente dalla popolazione
oggetto di studio. In particolare il campionamento diventa casuale
020 semplice se le estrazioni delle unità statistiche dalla popolazione
a i l .it 22
tm sono indipendenti. Le condizioni che si devono verificare per
ho
o n do
estrazioni indipendenti sono due:
o. m
sim as
by m
Con una popolazione finita le estrazioni devono essere senza
ed n
reinserimento is ow
ook eb
Se la popolazione è infinita o molto più grande del campione
This
allora si possono considerare estrazioni con reinserimento o
senza reinserimento.
5
Petracca Francesco L.
Se pensiamo di avere una popolazione formata per esempio da 4
unità statistiche e vogliamo estrarre senza reinserimento tutti i
possibili campioni di dimensione 2, si ha il seguente schema:
C Popolazione con
A dimensione N=4
D B
A, B A, C A, D B, C B, D C, D
𝐀 𝐁 𝐀 𝐂
media campionaria: 𝝁𝟏 = ; 𝝁𝟐 = . . . .. ; tutto questo ci fa
𝟐 𝟐
pensare ad una variabile aleatoria X che per ogni campione estratto
assume un valore 𝝁𝟏 , 𝝁𝟐 , … con probabilità 𝒑𝟏 , 𝒑𝟐 , 𝒑𝟑 .. ;
bo
6
m
Petracca Francesco L.
o assim
z
807
7tn
𝐩 𝟔
68-
Essendo vera la condizione ∑𝐩𝐢 = 𝟏 possiamo individuare la variabile
𝐩 𝟏
-52
aleatoria discreta X
380
_ 𝝁𝟏 𝝁𝟐 𝝁𝟑
𝐗=
2-0
𝐩𝟏 𝐩𝟐 𝐩𝟑
020
Quella rappresentata è una distribuzione della media campionaria
_
17-
𝐗 (variabile aleatoria) e quindi possiamo determinare la media e la
_
201
deviazione standard 𝝁𝐗_ , 𝝈𝐗_ di 𝐗 . Nella pratica non si prendono in
220
considerazione tutti i possibili campioni estratti dalla popolazione ma
solo un campione e si determina per il campione in esame la media
il.it
estendendola per inferenza alla media della popolazione da cui il
ma
campione è stato estratto. Si tratta di una stima della media vera
hot
blocchi:
ma
by
ned
ow
k is
boo
7
is e
Petracca Francesco L.
Th
Popolazione di 4 unità statistiche (dimensione N=4)
B
D
A
C
parametri: 𝝁 , 𝝈
Spazio dei campioni di dimensione n=2
A, D 𝝁𝟐
𝝁𝟏 A, B 𝒑𝟐
𝒑𝟏
B, D
A, C
C, D
B, C
statistiche: 𝝁𝐗 , 𝝈𝐗
This e
Nella pratica il procedimento di inferenza statistica si effettua con la
book i
s owne
scelta di un campione:
𝑝𝑜𝑝𝑜𝑙𝑎𝑧𝑖𝑜𝑛𝑒
𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒
C, D
Inferenza 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ℎ𝑒: 𝝁𝐗 , 𝝈𝐗
𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑖: 𝝁 , 𝝈
8
Petracca Francesco L.
1.3 Stima dei parametri
Per rispondere alle seguenti domande che formuliamo una volta
determinati i valori 𝝁𝐗 , 𝝈𝐗 del campione casuale preso in esame
Intervallare)
k i
o
ebo
s
9
Petracca Francesco L.
procedere successivamente al sorteggio dall’urna per effettuare il
campionamento.
Formando lo spazio dei campioni con il campionamento casuale
semplice si possono presentare due casi:
Che le unità statistiche estratte siano rimesse nell’universo
statistico (estrazione bernulliana o con ripetizione)
Che le unità statistiche estratte non siano rimesse
nell’universo statistico (estrazione in blocco).
𝟏𝟎!
N°raggruppamenti= (𝟏𝟎 = 𝟏𝟎 ∙ 𝟗 ∙ 𝟖 = 𝟕𝟐𝟎
m
𝟑)!
o.
sim
10
bo
Petracca Francesco L.
e
s
hi T
Esempio_3: supponiamo di avere un’urna con 10 numeri e di doverne
estrarre 3 senza reintroduzione non contando l’ordine degli elementi.
ordinati 𝐧! 𝒏𝐤
(𝐧 − 𝐤)!
Th
is
eb
oo
ki
so
wn
ed
by
ma
11 ss
Petracca Francesco L. im
o.m
1.5 Calcolo dei parametri μ e σ2 di un campione
Supponiamo di avere una popolazione di 4 elementi o unità
statistiche 3, 7, 14, 35.
popolazione
3 35
7 14
Th
Per il calcolo della media 𝝁 e della varianza 𝝈𝟐 della popolazione si
is
ha: eb
oo
𝟑 + 𝟕 + 𝟏𝟒 + 𝟑𝟓 k
𝝁𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞 = is= 𝟏𝟒, 𝟕𝟓
𝟒 ow
(3 − 14,75) + (7 − 14,75) + (14 − 14,75) + (35 − 14,75)
ne
𝜎 = d
by 4
= 152,18 m
as
Se facciamo riferimento al campione possiamo pensare di estrarre il
si
campione con estrazione casuale semplice, mettendo in un’urna 4
m
o.
palline numerate con i numeri 3,7,14,35. Volendo realizzare uno
m
spazio campione di dimensione n=2 possiamo pensare di estrarre le
on
do
palline senza reimmissione. È evidente che il numero di campioni con
ho 𝐍! 𝐍
tm n=2 è dato dalla formula della combinazione semplice =
ai 𝐤!·(𝐧 𝐤)! 𝐤
Con N=4 3 k=2
𝟒!
= 𝟔 (numero di raggruppamenti con k=2)
𝟐!(𝟒 𝟐)!
12
Petracca Francesco L.
T
(35,14)
(3,14) (7,14)
(3,35)
(7,35)
Probabilità 𝟏 𝟏 𝟏 𝟏 𝟏 𝟏
𝟔 𝟔 𝟔 𝟔 𝟔 𝟔
𝟏 𝟏 𝟏 𝟏 𝟏 𝟏
𝝁𝐗_ = 𝟓 · + 𝟖, 𝟓 + 𝟏𝟎, 𝟓 · + 𝟏𝟗 · + 𝟐𝟏 · + 𝟐𝟒, 𝟓 · =14,75
𝟔 𝟔 𝟔 𝟔 𝟔 𝟔
13
Petracca Francesco L.
Thi
se
𝟏 𝟏
𝝈𝟐 𝐗_ = (𝟓 − 𝟏𝟒, 𝟕𝟓)𝟐 · + (𝟖, 𝟓 − 𝟏𝟒, 𝟕𝟓)𝟐
boo
𝟔 𝟔
𝟏 𝟏
+ (𝟏𝟎, 𝟓 − 𝟏𝟒, 𝟕𝟓)𝟐 · + (𝟏𝟗 − 𝟏𝟒, 𝟕𝟓)𝟐 ·
k is
𝟔 𝟔
𝟏 𝟏
own
= 𝟓𝟎, 𝟕𝟐
by
ma
1.6 Teoremi
ssim
1° Teorema
ma
𝛔𝟐 𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞
- 𝝈𝟐 𝐗_ = (estrazione bernulliana)
17-
𝐧
𝛔𝟐 𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞
- 𝝈𝟐 𝐗_ = (estrazione in blocco)
020
𝐧 𝐍 𝟏
14
68-
Petracca Francesco L.
7tn
80
al crescere della dimensione “n” del campione, tende ad una
distribuzione normale con media 𝝁 e varianza 𝝈𝟐 𝐗_ =
𝛔𝟐 𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞
(campionamento con ripetizione) con n≥30
𝐧
𝛔𝟐
𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞
(campionamento in blocco) con n≥30
𝐧 𝐍 𝟏
Thi
s eb
ook
is o
15
Petracca Francesco L.
is
oko
eb
s i
Th
(per dati statistici qualitativi considerando la %)
Esercizio(Stima Puntuale):
Da un lotto di 1000 sacchetti di zucchero confezionati si è estratto
un campione di 50 sacchetti e si è valutato il peso medio
μcampione=980g con scarto quadratico medio s= σcampione=10g. In base
al campione, indicare una misura che valuti il peso medio dei
m sacchetti dell’intero lotto e valutare l’errore medio di
e d by
campionamento.
n
Svolgo:
ow is
ook eb
This
17
Petracca Francesco L.
dell’errore medio di campionamento possiamo farlo in presenza di
^ 𝛔
estrazione bernulliana usando la formula 𝐬𝐱_ =
√𝐧
^
𝐧
dove al posto di σ mettiamo 𝐬 𝟐 = 𝒔𝟐 · e quindi
𝐧 𝟏
^
𝟓𝟎 𝟓𝟎𝟎𝟎
𝐬𝟐 = 𝟏𝟎𝟎 ∙ = e in presenza di estrazione bernulliana
𝟒𝟗 𝟒𝟗
^ 𝛔
ricaviamo lo scarto quadratico medio 𝐬𝐱_ = ossia
√𝐧
𝟏 𝟓𝟎𝟎𝟎
𝒔𝐱_ = = 𝟏. 𝟒𝟑
√𝟓𝟎 𝟒𝟗
Possiamo dire che effettuando una stima puntuale del peso medio
_
dei sacchetti della popolazione come μpopolazione= 𝐱=980g si ha una
stima dell’errore medio di campionamento 𝒔𝐱_ = 1,43 g in presenza
di estrazione bernulliana.
18
Petracca Francesco L.
This ebook is ow
n d o hotm
Spazio campionario:
o .
popolazione
μ= 35 e σ2=16
ned by k is ow
_
𝛔𝟐 𝟏𝟔
aleatoria media campionaria 𝐗 ha media 𝝁𝐗_ =35 e 𝝈𝟐 𝐗_ = = =
𝐧 𝟓𝟎
𝟎, 𝟑𝟐 con distribuzione normale.
_
Dovendo calcolare la probabilità P(34,5<𝐗 medio<35,5) è necessario
ricorrere alla gaussiana standardizzata
_
con varabile Z al posto della
variabile media campionaria 𝐗 .
19
Petracca Francesco L.
20
7-0
11
20
20
_ 𝟐
_ _ 𝐗 𝛍
𝟏
it 2
La funzione densità di probabilità 𝒑(𝐗) = 𝒇(𝐗) = 𝒆 𝟐𝛔𝟐 si
𝛔√𝟐𝛑
ail.
trasforma nella funzione normalizzata standardizzata per una
_
tm
𝐗 𝛍
comodità nel calcolo delle aree. Posto 𝒛 = la nuova
ho
𝛔
funzione densità di probabilità avrà media μ=0 e scarto
do
quadratico medio uguale a σ=1.
on
La nuova funzione densità di probabilità standardizzata avrà la
o.m
forma:
sim 𝟏 𝐳𝟐
as
𝒑(𝒛) = 𝒇(𝒛) = 𝒆 𝟐
ym
√𝟐𝛑
e grafico:
db
ne
ow
is
ok
bo
is e
Th
20
Petracca Francesco L.
_ _
𝐗 𝟏 𝛍𝐜𝐚𝐦𝐩𝐢𝐨𝐧𝐞 𝟑𝟒,𝟓 𝟑𝟓 𝐗 𝟐 𝛍𝐜𝐚𝐦𝐩𝐢𝐨𝐧𝐞
e quindi 𝒛𝟏 = = = −𝟎, 𝟖𝟖 , 𝒛𝟐 = =
𝝈𝐗_ 𝟎,𝟓𝟔𝟔 𝝈𝐗_
𝟑𝟓,𝟓 𝟑𝟓
= +𝟎, 𝟖𝟖
𝟎,𝟓𝟔𝟔
𝟎,𝟖𝟖 𝟎,𝟖𝟖
𝐳𝟐 𝐳𝟐
𝟏 𝟏
𝒆 𝟐 𝐝𝒛 = 𝟐 ∙ 𝒆 𝟐 𝐝𝒛 = 𝟎, 𝟔𝟐𝟏𝟐 = 𝟔𝟐, 𝟏𝟐%
√𝟐𝛑 √𝟐𝛑
𝟎,𝟖𝟖 𝟎
21
Petracca Francesco L.
22
Petracca Francesco L.
Th
is
eb
o
Esercizio:
Se la statura media di una popolazione è μpopolazione= 173,.23 cm con
σpopolazione=5,938, qual è la probabilità che un individuo abbia una
statura X> 1,79cm?
Svolgo:
𝟏𝟕𝟗 𝟏𝟕𝟐,𝟐𝟑
calcolo 𝒁 = = 𝟏, 𝟏𝟒
𝟓,𝟗𝟑𝟖
𝟎 𝟏,𝟏𝟒
𝐳𝟐 𝐳𝟐 𝐳𝟐
is o
𝟏 𝟏 𝟏
𝒆 𝟐 𝐝𝒛 =1-( 𝒆 𝟐 𝐝𝒛 + 𝒆 𝟐 𝐝𝒛) =
√𝟐𝛑 √𝟐𝛑 √𝟐𝛑
wn
𝟏,𝟏𝟒 𝟎
ed
1-(0,5+0,3729)=0,1271=12,71%
b
ym
23
as
Petracca Francesco L.
sim
o.m
2.2 La distribuzione di Gauss
This e
book
is own
Il grafico rappresenta il grafico della funzione densità di probabilità
normale di una variabile aleatoria X di equazione 𝒑(𝑿) = 𝒇(𝑿) =
ed by
(𝐱 𝛍)𝟐
𝟏
𝒆 𝟐𝛔𝟐 con -∞<X<+∞ e parametri μ e σ. Una delle
𝛔√𝟐𝛑
proprietà della funzione di distribuzione normale è che valore
medio, mediana e valore modale coincidono, quindi il m
assim
parametro μ= media, mediana e moda. La curva che
rappresenta la distribuzione normale abbiamo visto che
dipende da due parametri μ e σ, e pertanto esiste una famiglie
di curve che differisce al varire di μ e σ. Noi faremo riferimento
alla curva normale standardizzata che racchiude questa
famiglia di curve, caratterizzata dai valori μ=0 e σ=1 ottenuta
24
Petracca Francesco L.
𝐗 𝛍
con il cambio di variabile 𝒁 = ; la funzione di probabilità
𝛔
della variabile normale standardizzata Z è 𝒑(𝒛) = 𝒇(𝒛) =
𝐳𝟐
𝟏
𝒆 𝟐 con -∞<Z<+∞
√𝟐𝛑
𝟏 𝐳𝟐
𝒇(𝒛) = 𝒆 𝟐
√𝟐𝛑
m
o.
sim
as
m
by
Grafico della funzione f(z) densità di probabilità della variabile z
d
ne
ow
La funzione di distribuzione o funzione di ripartizione della variabile
normale standardizzata Z ha il grafico:
is
k
oo
eb
is
Th
25
Petracca Francesco L.
2 t
il.i a
m
ot h 𝐳
𝐭𝟐
𝟏
do
𝑭(𝒛) = 𝑷(𝒁 ≤ 𝒛) = 𝒆 𝟐 𝐝𝒕 con -∞<z<+∞
√𝟐𝛑
on
m
o.
Dal punto di vista pratico il calcolo dell’integrale improprio si evita
im
ricorrendo all’uso di tabelle predisposte come quella riportata in
s s
a
precedenza che consente senza conoscere il calcolo integrale di
m
determinare il valore dell’area nella zona interessata.
by
d e
wn o
is
k o
bo e
s
hi T
26
Petracca Francesco L.
f(Z) f(X) probabilità
27
Petracca Francesco L.
Popolazione: σ2, μ Campione di dimensione
_
“n” e media 𝐱
𝟐 d
nefissiamo 1-
precedenza determiniamo a ritroso il valore 𝒛𝛂 . Se
𝟐 w
𝟏 𝛂 o
α=0,95=95% determino
𝟐
k is
=0,4750 e dalla tabella ricavo che il
valore di 𝒛𝛂 a cui corrisponde quel valoreoèo 1,96, possiamo quindi
𝟐
scrivere in termini probabilistici che s eb
P(-1,96<Z<1,96)=0,95=95% che
h i
si legge dicendo che la probabilitàT che la variabile Z sia compresa
_
𝐗 𝛍
nell’intervallo indicato è del 95%. Se poniamo 1-α=0,95 e 𝒁 =
𝝈𝐗_
possiamo scrivere generalizzando che:
_
_
𝐗−𝛍
P(- 𝒛𝛂 <
𝝈𝐗_
< 𝒛𝛂 ) = 𝟏 − 𝛂 da cui segue P(- 𝐗 - 𝝈𝐗_ ∙ 𝒛𝛂 <- 𝛍 <-
𝟐 𝟐 𝟐
_
𝐗+ 𝝈𝐗 ∙ 𝒛𝛂)= 𝟏 − 𝛂 da cui moltiplicando tutto pere -1 e cambiando
_
𝟐
28
Petracca Francesco L.
as _ _
il verso della diseguaglianza, si ottiene P( 𝐗 - 𝝈𝐗_ ∙ 𝒛𝛂 < 𝛍 < 𝐗 + 𝝈𝐗_ ∙
m
d by e 𝟐
𝒛 )= 𝟏 − 𝛂
𝛂 wn
𝟐 is o ok bo 𝛔
Ricordiamo ancora che𝝈𝐗_ =
is e e si può ancora scrivere
√𝐧
Th
_ 𝛔 _ 𝛔
P(𝐗- ∙ 𝒛𝛂 <𝛍<𝐗+ ∙ 𝒛𝛂 )= 𝟏 − 𝛂
√𝐧 𝟐 √𝐧 𝟐
𝟏−𝛂 𝛂/𝟐 𝒛𝛂
𝟐
0,95=95% 0,025 𝒛𝛂 = 𝟏, 𝟗𝟔
𝟐
29
Petracca Francesco L.
ail. i
m ot
o h
nd
3.1 Considerazioni sulla stima puntuale e intervallare
o
o.m
Da quanto prima esposto possiamo concludere dicendo che
_
la stima puntuale fatta considerando la “statistica” (s, 𝐗 …)
i m
popolazione.
o
√𝐧 𝟐 √𝐧 𝟐
_
A 𝐗 B
∙ 𝒛𝛂
𝟐
∙ 𝒛𝛂
𝟐
√𝐧
√𝐧
𝛔
𝛔
𝐗+
𝐗-
_
30
Petracca Francesco L.
d by
e
wn
Esercizio:
o
k is
_ 𝛔 _ 𝛔
confidenza 𝟏 − 𝛂=95% si ha che P(𝐗- ∙ 𝒛𝛂 <𝛍<𝐗+ ∙ 𝒛𝛂 )= 𝟏 − 𝛂
√𝐧 √𝐧
his
𝟐 𝟐
𝛔 𝟒
con 𝒛𝛂 =1,96 e = si ha il seguente intervallo di confidenza
T
𝟐 √𝐧 √𝟔𝟎
_ 𝟒 _ 𝟒
𝟑𝟒- ∙ 𝟏, 𝟗𝟔<𝛍<𝟑𝟒+ ∙ 𝟏, 𝟗𝟔 ossia 32,87 <𝛍<35,13
√𝟔𝟎 √𝟔𝟎
_
Distribuzione media campionaria 𝐗 standardizzata
ndo
Regione di rifiuto
o
mo.m
α=5% (livello di significatività)
ss i
5. Ricordiamo che si possono commettere due tipi di errori
ma
nella scelta o rifiuto di una ipotesi:
y
Errori del I° tipo quando si rifiuta una ipotesi che
db
è invece vera
e
Errori del II° tipo quando si accetta una ipotesi
wn
che è invece falsa
is o
6. Ricordiamo che α si chiama livello di significatività e 1-α
ok
si chiama livello di confidenza: il primo rappresenta la
bo
probabilità di rifiutare l’ipotesi nulla (che può essere vera
e
o falsa) mentre il secondo rappresenta la probabilità di
accettarla
i s
7. Il test d’ipotesi si chiama anche test a due code o Th
bilaterale perché la regione di rifiuto è formata da due
code sottese dalla curva normale standardizzata
8. Ricordiamo la seguente tabella da seguire una volta
stabilito il valore di α
33
Petracca Francesco L.
𝟏−𝛂 𝛂/𝟐 𝒛𝛂
𝟐
0,95=95% 0,025 𝒛𝛂 = 𝟏, 𝟗𝟔
𝟐
ssim
ma
by
w ned
o
ok is
e bo
i s
Th
34
Petracca Francesco L.
ESERCIZIO:
36
Petracca Francesco L.
Possiamo notare come questo valore cade nella zona di rifiuto e
pertanto possiamo concludere che l’ipotesi alternativa è corretta,
sapendo che c’è un rischio del 5% che quanto affermato è errato.
√𝐧
b
y ma
ssim
37
o.m
Petracca Francesco L.
ond
This
eboo
Svolgimento:
k is o
Popolazione di rondelle
wn
con 𝝁𝐩𝐨𝐩𝐨𝐥𝐚𝐳𝐢𝐨𝐧𝐞 = 𝟏𝟐, 𝟐𝒎𝒎 Campione di dimensione n=100
con s=0,82
𝛔
Calcoliamo 𝝈𝐗 = anche se non conosciamo σ della popolazione
√𝐧
utilizziamo la deviazione standard del campione s con risultati che
variano di poco avendo un campione con dimensione n=100. Risulta
𝛔 𝟎,𝟖𝟐
pertanto 𝝈𝐗 = = = 𝟎, 𝟎𝟖𝟐 (errore standard)
√𝐧 √𝟏𝟎𝟎
38
Petracca Francesco L.
3.4 La distribuzione T di Student
coda
Th
is Distribuzione T al variare dei gradi di libertà
eb
o
Per n ok ∞ la distribuzione T si avvicica a quella gaussiana e
questo accadei s già per n≈40, si osserva inoltre che la curva gaussiana
o
è più schiacciatawnelle code della curva T con un’area minore rispetto
n distribuzione T.
a quella fornita dallaed
by
m
as
sim
o.
m
on
do
39 ho
tmPetracca Francesco L.
ai
l.it
2
This
ebo
ok i
s ow
ned
by m
ass
imo
.mo
ndo
hotm
ail.it
220
20
Confronto tra la distribuzione T e la normale standard
40
Petracca Francesco L.
l’unità statistica una volta estratta non può essere rimessa
nella popolazione.
2. Nel campionamento sistematico gli N elementi della
popolazione si dividono in n gruppi formati da k elementi
ossia k=N/n, per avere un campione sistematico si scelgono i
k-esimi elementi.
3. Nel campionamento stratificato si suddivide la popolazione
in strati o gruppi sulla base di una caratteristica comune. In
ogni strato si conduce un campionamento casuale semplice
e si combinano. Il campionamento stratificato è più preciso
del campionamento casuale semplice e del campionamento
sistematico perche fornisce una rappresentazione adeguata
del campione scelto nella popolazione circa i parametri da
stimare della popolazione.
4. Nel campionamento a grappolo gli N elementi della
popolazione sono divisi in gruppi, detti grappoli
”sottopopolazioni” in modo che ogni grappolo sia
rappresentativo della popolazione. Si estrae poi un campione
casuale di grappoli e tutti gli oggetti del grappolo estratto
fanno parte del campione.
This ebook is
41
Petracca Francesco L.
GLOSSARIO
Th
aggettivi o nomi dette modalità (colore degli occhi, religione)
is e
(Variabile/Carattere) quantitativa= si esprime con modalità
numeriche (intensità) o intervalli numerici (classi di
bo
intensità), esempio:statura, peso, durata delle batterie.
ok
Unità statistica= qualsiasi elemento portatore del carattere
is o
o dei caratteri; su ciascuna unità statistica possaimo rilevare:
- Una sola variabile/carattere: statistica univariata
wn
- Due caratteri contemporaneamente: statistica bivariata
ed
- Tre o più caratteri contemporaneamente:statistica
by
multivariata
ma
Indice di tendenza centrale= comprendono gli indici di
tendenza centrale (media, mediana, moda)
ssi
mo
Medie
Di posizione Algebriche
-aritmetica
-moda -quadratica
-mediana -geometrica
-armonica
42
Petracca Francesco L.
Statistica Descrittiva= le informazioni provengono dall’intera
popolazione
Statistica inferenziale=le informazioni provengono dal
campione
Frequenza o frequenza assoluta= rappresenta il numero di
volte F in cui si ripete la modalità nel campione esaminato
Frequenza relativa= rappresenta il rapporto tra la frequenza
assoluta F e il numero delle unità statistiche N: f=F/N
Frequenza percentuale= rappresenta la frequenza relativa
per 100: f=(F/N)*100
Frequenza cumulata= rappresenta la somma delle frequenze
delle modalità inferiori o uguali ad una data modalità
Modalità
43
Petracca Francesco L.
wned
is o
ok
Con la statistica descrittiva si raccolgono le informazioni sull’intera
o
popolazione, si organizzano in distribuzioni semplici (univariate) o
b
se
complesse (almeno bivariate) con una successiva sintesi numerica
attraverso indici di tendeza centrale, indici di forma o rapporti
Thi
statistici, per ultimo si rappresentano graficamente le principali
caratterisitche. I risultati che si ricavano dalla statistica descrittica si
definiscono “certi”.
44
Petracca Francesco L.
popolazione detta campione, all’intera popolazione a cui il campione
appartiene. Il campione è scelto solitamente mediante un
esperimento casuale (o aleatorio), detto schema di campionamento.
i
Th
45
Petracca Francesco L.
ricordiamo che campioni diversi con dimensione “n” forniscono
medie campionarie diverse. Ciascuna di queste medie non può essere
usata come stima del parametro da sola, senza tenere conto
dell’incertezza causata dall’errore campionario
Thi
s eb
ook
is o
wne
db
ym
ass
imo
.mo
ndo
hot
ma
il.it
220
201
46
Petracca Francesco L.
0117-0202-038
Bibliografia
02
3) Matematica Sperimentale di Battelli e Moretti – C.P.E.
22
4) Appunti di Statistica prof. Fernando Di Gennaro
5) Matematica per la Scuola Superiore- Giambò A. e Giambò R.
l.i t
6) Blog dell’autore https://matepetracca.blogspot.it
ai
7) Canale youTube “Petracca Francesco” dell’autore
tm
8) Appunti prof. Paola Bortot Dipartimento di Scienze Statistiche
ho
Università di Bologna
do
9) Le Statistiche e la Statistica- prof. Tommaso Di Fonzo- Scuola
Superiore di Statistica e di Analisi Sociali ed Economiche
on
10) “Calcolo Combinatorio e delle Probabilità”- StreetLib- autore
massimo.m
Petracca Francesco Luigi
11) Statistica & Società: rivista quadrimestrale per la diffusione della
cultura statistica anno III / 2014 – Numero Speciale
12) Appunti prof. Claudio Capiluppi Facoltà di Scienze della
Formazione
13) Appunti di Andrea Pavan sulla distribuzione Normale
This ebook is owned by