Sei sulla pagina 1di 38

Statistica Inferenziale

“La prova (esperimento casuale) genera l'evento con una certa probabilità”

-Prova: è un esperimento soggetto ad incertezza.


-Evento: è uno dei possibili risultati della prova e può essere: impossibile, possibile, certo.

L’insieme di tutti i risultati possibili di una prova prende il nome di Spazio Campionario e si
indica con il simbolo Ω.

Tipologia e algebra degli eventi

Tipologia di eventi:
- Eventi incompatibili: se il verificarsi di uno esclude necessariamente il verificarsi
dell’altro.

Ad esempio, lanciando un dado, l’evento E1 uscita della faccia con il numero 2 è


incompatibile con l’evento E2 uscita della faccia con il numero 6.

- Eventi compatibili: si dicono compatibili due eventi che possono verificarsi


contemporaneamente.

L’evento E1 uscita della faccia con il numero 2 è compatibile con l’evento E2 uscita di una
faccia con numero pari.

Algebra degli eventi:


- Unione (o somma logica) di due eventi A e B: simbolo ∪ (simbolo di unione): è
l’evento “si verifica A oppure B”
- Intersezione (o prodotto logico) di due eventi A e B: simbolo ∩ (simbolo di
intersezione): è l’evento “si verificano A e B contemporaneamente”

Introduzione alla probabilità

La probabilità ha ricevuto nel tempo definizioni diverse:


- Definizione classica: la probabilità è il rapporto tra il numero dei risultati favorevoli al
verificarsi di un evento e il numero totale dei possibili risultati, ammesso che questi
siano egualmente possibili.

𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒𝑖 𝑟𝑖𝑠𝑢𝑙𝑡𝑎𝑡𝑖 𝑓𝑎𝑣𝑜𝑟𝑒𝑣𝑜𝑙𝑖 𝑎𝑑 𝐸


p(E)=
𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒𝑖 𝑟𝑖𝑠𝑢𝑙𝑡𝑎𝑡𝑖 𝑝𝑜𝑠𝑠𝑖𝑏𝑖𝑙𝑖

Ad esempio, lanciando un dado perfetto, l’evento E1 uscita della faccia con il numero 5 è ⅙.

Questa definizione presuppone:


- l’equiprobabilità di tutti i casi;
- la conoscenza di tutti i possibili casi che possano verificarsi, e che quindi il numero di
questi casi sia finito .
- Definizione frequentista: la probabilità è il limite della frequenza relativa di un
evento ripetibile quando cresce, oltre ogni limite, il numero delle prove. In altre parole
la probabilità è pari alla frequenza relativa dei successi quando si ripete la prova
all’infinito.

𝐹𝑅𝑛 (𝐸)
p(E)= lim
𝑛
𝑛→∞

Questa definizione presuppone: la ripetibilità della prova all’infinito nelle stesse


condizioni.

Teoria soggettiva della probabilità

La probabilità è la misura del grado di fiducia che un individuo coerente assegna al verificarsi
di un dato evento in base alle sue conoscenze.

La probabilità è un numero che si associa all’evento E che esprime il grado di


aspettativa circa il suo verificarsi.

0≤P(E)≤1
Si può anche esprimere in %

Teoremi fondamentali della probabilità

1) Probabilità totali: eventi incompatibili


Dati due eventi E1 e E2, la probabilità dell'unione di E1 e E2 è pari alla somma delle
singole probabilità. Eventi incompatibili= il verificarsi dell'uno esclude il verificarsi dell'altro.
Ad esempio determinare la probabilità che lanciando una moneta si presenti testa oppure
croce:
E1= testa o E2= croce

Diagramma di Venn

P(E1∪E2)=P(E1) + P(E2)
1 1
P(E1∪E2)= + =1
2 2

Alcuni esempi:
A) Lanciando un dado, l'evento E1 uscita della “faccia pari” è incompatibile con l'evento
E2 uscita della “faccia dispari”. Lanciando un dado Qual è la possibilità che esca un
numero pari o un numero dispari?
L'evento P(E1∪E2) uscita di un numero pari oppure di un numero dispari sarà:
3 3 6
P(E1∪E2)=P(E1)+P(E2)= + = =1
6 6 6
B) Si ha un mazzo di 40 carte, qual è la probabilità che la carta estratta sia un asso E1
oppure una figura E2?
In tal caso si ha:
4 12 16
P(E1∪E2)=P(E1)+P(E2)=
40
+ =
40 40
=0,4

C) Un'urna contiene 4 palline bianche, 3 palline rosse e 7 nere. Qual è la probabilità che
una pallina estratta sia rossa E1 oppure nera E2?
3 7 10
P(E1∪E2)=P(E1)+P(E2)=
14
+ =
14 14
=0,71

2)Probabilità totali: eventi compatibili


Dati due eventi E1 e E2 tra loro compatibili la probabilità della somma logica degli eventi
E1 e E2 è uguale alla somma somma delle probabilità dei singoli eventi diminuita dalla
probabilità dell'evento intersezione dei due eventi.

In questo caso la formula è:


P(E1∪E2)=P(E1) + P(E2) - P(E1∩E2)

Per cui: Dati due eventi E1 e E2, la probabilità dell’unione di E1 e E2 è pari alla somma delle
singole probabilità dei due eventi meno la probabilità dell'intersezione.

Eventi compatibili: il verificarsi dell’uno non esclude il verificarsi dell'altro.

Esempio:
A) Lanciando un dado, l’evento E1 uscita del numero 2 è compatibile con l’evento E2
uscita di un numero pari. La probabilità di E1 o E2 P(E1∪E2) cioè la probabilità
lanciando un dado esca il numero 2 oppure un numero pari è data da:

P(E1∪E2)=P(E1) + P(E2) - P(E1∩E2)


L’evento E1 è compreso nell’evento E2 (numero pari).
1 3 1 3
P(E1∪E2)= + - = =0,5
6 6 6 6
B) Sia dato un mazzo di 40 carte, sia E1 l’evento “esca una carta spade” e E2 l’evento
“esca un asso”. L’evento E1∪E2 è: qual è la probabilità che estraendo una carta dal
mazzo “esca una carta spade oppure un asso” E1 e E2 sono compatibili in quando
può uscire anche l’asso di spade.
10 4
P(E1∪E2)=
40
+ 40 da cui di deve anche togliere la probabilità che esca l’asso di spade
perchè altrimenti sarebbe contata due volte.
10 4 1 13
Per cui: P(E1∪E2)=
40
+ 40 - 40 = 40 =0,325
3) Teoremi delle probabilità composte: eventi indipendenti
Due eventi E1 e E2 si dicono indipendenti quando il verificarsi dell’uno non modifica la
probabilità del verificarsi dell’altro evento.

Il modello di eventi indipendenti è costituito ad esempio dalle estrazioni successive da


un’urna di una pallina con reintroduzione nell’urna di quella estratta precedentemente.
Quando invece la pallina estratta non viene rimessa nell’urna i due eventi “estrazioni
successive” sono dipendenti.

Il principio delle probabilità composte afferma che la probabilità dell’intersezione P(E1


∩E2) di due eventi indipendenti E1 ed E2 (cioè del verificarsi congiuntamente dell’uno e
dell’altro) è uguale al prodotto delle singole probabilità se gli eventi sono indipendenti.

P(E1∩E2)= P(E1) x P(E2)

Esempio:
A) Sia data un’urna con 20 palline bianche, 10 rosse e 5 nere. Facciamo due estrazioni
successive con reintroduzione. Calcolare la probabilità che si verifichi l’evento che le
1° pallina sia bianca e la seconda sia rossa. E1= la 1° estratta sia bianca, E2= la 2°
estratta sia rossa. Gli eventi sono indipendenti.
20 10
Risulta: P(E1∩E2)=P(E1) x P(E2)= x
35 35

B) Sia data un’urna con 20 palline bianche, 10 rosse e 5 nere. Calcolare la probabilità
che si verifichi l’evento che la 1° pallina sia nera e la seconda sia rossa. E1= la 1°
estratta sia nera, E2= la 2° estratta sia rossa. Gli eventi sono indipendenti.
5 10
Risulta: P(E1∩E2)=P(E1) x P(E2)= x
35 35

Se gli eventi sono dipendenti occorre introdurre il concetto di probabilità condizionata.


Si definisce probabilità condizionata la probabilità di un evento E1 condizionata al verificarsi
di un evento E2.
P(E2l E1) “Probabilità dell’evento E2 dato che si è verificato l'evento E1”

Esempio:
A) Con i dati dell’esercizio precedente la stessa probabilità facendo però l’ipotesi che la
1° pallina estratta non venga rimessa nell’urna, in tal caso gli eventi risultano
dipendenti. Sia data un’urna con 20 palline bianche, 10 rosse e 5 nere. Calcolare la
probabilità che si verifichi l’evento che la 1° pallina sia bianca, E2= la 2° estratta sia
rossa. Gli eventi sono dipendenti.
20 10
Risulta pertanto che: P(E1∩E2)= x
35 34

Esempio:
A) Si calcoli la probabilità di estrarre il re di cuori oppure l’asso di picche da un mazzo di
52 carte.
Soluzione: L’evento A “estrarre il re di cuori” e l’evento B “estrarre l’asso di picche” sono
incompatibili pertanto è possibile applicare il teorema della probabilità totale per eventi
incompatibili, quindi: la probabilità di estrarre il re di cuori oppure l’asso di picche da un
mazzo di 52 carte.
1 1
Pr=
52
+ 52 = 0,038

Esercizio:
A) Nel gioco della roulette vi sono 36 numeri più lo zero. Si calcoli la probabilità
dell’uscita alla roulette di un numero compreso tra 5 e 9 (con 5 e 9 compresi) oppure
multiplo di 10 (con 10 compreso).

L’evento A “uscita di un numero compreso tra 5 e 9” e l’evento B “estrarre un multiplo di 10”


sono incompatibili pertanto è possibile applicare il teorema della probabilità totale.
5 3 5 3
P(A)=
37
; P(B)=
37
Pr=
37
+ 37
=0,216

Esercizio:
A)Un’urna contiene 15 palline bianche e 10 rosse e 25 verdi. Qual è la probabilità di estrarre
a caso:
1) una pallina che sia bianca oppure rossa?
2) una pallina bianca e poi, dopo averla reinserita nell’urna, una pallina rossa?

15 10
1)
50
+ 50 =0,5 Probabilità totali: eventi incompatibili
15 10
2)
50
x 50 =0,06 Teoremi delle probabilità composte: eventi indipendenti

B) Abbiamo un sacchetto con 10 palline rosse, 25 viola e 30 nere: trovare la probabilità di


estrarre una pallina viola oppure nera
Teorema della probabilità totale degli eventi incompatibili quindi: P(E1∪E2)=P(E1) + P(E2)
25 30
65
+ 65 =0,846 la probabilità è l’84,6%

C) Abbiamo un'urna con 15 palline bianche, 10 rosse e 30 nere: trovare la probabilità di


estrarre successivamente due palline nere senza rimettere la prima pallina estratta dentro
l’urna.
Probabilità composta di eventi dipendenti
30 29
55
x 54 =0,2929 29,29%

Esempio:
Le classi di voti conseguiti da un gruppo di 87 studenti agli esami di matematica e statistica
sono le seguenti:
Voto di matematica voto di statistica totale
12-22 23-27 28-30

18-22 15 18 13 46

23-27 7 14 5 26

28-30 5 6 4 15

totale 27 38 22 87

1) Determinare la probabilità che scegliendo uno studente a caso questi abbia


conseguito un voto in statistica compreso tra 23 e 27
2) Determinare la probabilità che scegliendo uno studente a caso questi abbia
conseguito un voto in matematica compreso tra 23 e 27 e un voto in statistica
compreso tra 28 e 30

38
1) =0,437
87
5
2) =0,057
87

Valore Casuale

Una variabile casuale può essere: discreta o continua.


Si definisce variabile casuale discreta (v.c) una variabile X che può assumere come
risultato di un esperimento casuale i valori X1, X2, X3,...,Xn rispettivamente con probabilità
𝑛
P1, P2, P3,...,Pn tale che ∑ P(Xi)=1 (i=1,2,3,...,n)
𝑖=1

Xi P(Xi)

X1 P(X1)

X2 P(X2)

X3 P(X3)

... ...

... ...

Xn P(Xn)
1

Esempio: Il lancio di un dado genera una v.c X che assume i valori 1,2,3,4,5,6 con
probabilità ⅙
Xi P(Xi)

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

Tot 1

Valore atteso di una variabile casuale discreta


La media aritmetica µx di una distribuzione di probabilità è il valore atteso della sua variabile
casuale. Questa misura riassuntiva si ottiene moltiplicando ogni possibile risultato Xi per la
sua corrispondente probabilità P(Xi) e sommando i prodotti risultanti
𝑛
µ= µx = E(X)= ∑ XiP(Xi)
𝑖=1
dove X è la variabile casuale discreta oggetto di studio Xi è l’iesimo di X P(Xi) è la probabilità
che si verifichi l’iesimo risultato di X.

Volendo calcolare il valore atteso dei risultati di un lancio di un dado non truccato avremmo:

Xi P(Xi)

1 1/6

2 1/6

3 1/6

4 1/6

5 1/6

6 1/6

Tot 1
𝑛
µx = E(X)= ∑ XiP(Xi)= 1 x ⅙ + 2 x ⅙ + 3 x ⅙ + 4 x ⅙ + 5 x ⅙ + 6 x ⅙ = 3,5
𝑖=1

Varianza e scarto quadratico medio di una variabile casuale discreta


La varianza σ²x di una variabile casuale discreta può essere definita come la media
ponderata delle differenze elevate al quadrato tra ogni possibile risultato e la propria media
aritmetica, con i pesi corrispondente alle probabilità di ciascun risultato.
𝑁
σ²x= ∑ (Xi-µx)² P(Xi)
𝑖=1
Inoltre lo scarto quadratico medio è:

𝑁
σx= ∑ (𝑋𝑖 − µ𝑥)² 𝑃(𝑋𝑖) =
𝑖=1
(1 − 3, 5)² ⅙ + (2 − 3, 5)² ⅙ + (3 − 3, 5)² ⅙ + (4 − 3, 5)² ⅙ + (5 − 3, 5)² ⅙ + (6 − 3, 5)² ⅙ = 3, 5
(Non considerare il risultato non riesco a cancellarlo anzi il risultato è quello che veniva prima
e che si sottrae ad ogni valore)

Esempio:
Si consideri una variabile X che assume i valori 0 e 1 con probabilità PX1=0,75 e
P(X2)=0,25
- Determinare il valore medio e la varianza
Xi P(Xi) Xi P(Xi) (Xi-µx)² P(Xi)

0 0,75 0 0,0469

1 0,25 0,25 0,1406

Tot 1 0,25 0,1875

𝑛
µx = E(X)= ∑ XiP(Xi)= 0 x 0,75 + 1 x 0,25= 0,25
𝑖=1
σ²x= (0-0,25)² 0,75+ (1-0,25)² 0,25 = 0,0469 + 0,1406=0,1875

Esempio:
Si consideri una variabile casuale X che assume i valori 1; 2;4; 6 con probabilità PX1=0,33
PX2=0,25 PX3=0,20 e X
- Determinare valore medio e varianza
X1 P(Xi) Xi P(Xi) (Xi-µx)² P(Xi)

1 0,33 0,33 1,233

2 0,25 0,50 0,217


4 0,20 0,80 0,227

6 X 0,22 1,32 2,069

Tot 1 2,933 3,728

𝑛
µx = E(X)= ∑ XiP(Xi)= 1 x 0,33 + 2 x 0,25 + 4 x 0,20 + 6 x 0,22= 2,933
𝑖=1
σ²x=(1-2,933)² 0,33 + (2-2,933)² 0,25 + (4-2,933)² 0,20 + (6-2,933)² 0,22= 3,728

Variabile casuale Binomiale

Molti degli esempi studiati possono essere pensati come casi particolari di uno schema
generale di prove ripetute, ad esempio successivi lanci di un dado, di una moneta, estrazioni
di palline da un'urna, di carte da un mazzo (in questi ultimi due casi reimmettendo la pallina o
la carta nell'urna o nel mazzo). Lo schema generale può essere descritto mediante la
seguente definizione: si dice esperimento di Bernoulli una sequenza di n prove con le
seguenti caratteristiche:
- il risultato di ogni prova può essere solo “successo” oppure “fallimento”;
- il risultato di ciascuna prova è indipendente dai risultati delle prove precedenti;
- la probabilità p di “successo”, e quindi la probabilità q=1-p di “fallimento”, sono
costanti in ciascuna prova.
Ci proponiamo ora di determinare la probabilità che, in n prove di un esperimento di
Bernoulli, si abbiano esattamente X successi.

L’espressione matematica che rappresenta la probabilità che una variabile casuale discreta
segua una distribuzione binomiale è:

n è il numero delle prove


x è il numero di successi
1-p è la probabilità che si verifichi l’evento insuccesso
P(x) rappresenta la probabilità che, in n prove di un esperimento di Bernoulli, si
abbiano esattamente x successi.
n! si chiama n fattoriale significa che se ad esempio n è 6 scriverò 6x5x4x3x2x1
oppure se è 4 scriverò 4x3x2x1 quindi il valore moltiplicato per tutti i valori precedenti
lo stesso per la x che sta sotto per quanto riguarda la parentesi invece si fa prima la
sottrazione e poi il risultato si moltiplica per i numeri ad esso precedente.
E(X)=n x p (valor medio)
VAR(X)=n x p x (1-p) (varianza)
Esempio:
Un’urna contiene 9 palline di cui 6 bianche e 3 rosse. Si eseguono successivamente 4
estrazioni dall’urna rimettendo ogni volta la pallina estratta nell’urna.
1) Determinare la probabilità di estrarre 2 palline bianche.

n=4 numero totale di estrazioni


x=2 numero di palline bianche (successi), le palline bianche sono 6
6
p= =0,67 probabilità del successo cioè di estrarre una pallina bianca
9
q=(1-p)= (1-0,67)= 0,33 probabilità dell’insuccesso cioè di non estrarre una pallina bianca

4𝑥3𝑥2𝑥1 24
P(x)= x (0,67)² x (0,33)² = x 0,4489 x 0,1089= 0,2933 cioè 29,33%
2 𝑥 1 (4 − 2)! 4

Esempio:
Determinare la probabilità che su n=12 lanci di una moneta buona si ottengano esattamente
x=8 teste

n=12
x=8
p=0,5
q=0,5

12 𝑥 11 𝑥 10 𝑥 9 𝑥 8 𝑥 7 𝑥 6 𝑥 5 𝑥 4 𝑥 3 𝑥 2 𝑥 1 8 4
P(X)= x (0, 5) x (0, 5) =
8 𝑥 7 𝑥 6 𝑥 5 𝑥 4 𝑥 3 𝑥 2 𝑥1 (4 𝑥 3 𝑥 2 𝑥 1)
479001600
x 0,00390625 x 0,0625= 495 x 0,00390625 x 0,0625= 0,1208
40320 (24)
In alternativa si possono usare le tavole

Esempio 2:
Determinare la probabilità che estraendo per n=5 volte una carta da un mazzo da 40
(inserendo ogni volta la carta estratta e rimescolando bene il mazzo) si ottengano:
a) esattamente x=3 figure
(nel mazzo ci sono 12 figure)

n=5
x=3
12
p= =0,30
40
q=0,70

5𝑥4𝑥3𝑥2𝑥1 3 120
P(x)= x (0, 3) x (0,7)²= x 0,027 x 0,49= 10 x 0,027 x 0,49= 0,1323 cioè
3 𝑥 2 𝑥 1 (2 𝑥 1) 12
13,23%
Esercizio 3:
Sapendo che il 60% delle persone con una occupazione è impiegata nel settore dei servizi:
1) calcolare la probabilità che estraendo n=12 persone da un campione casuale, ve ne
siano x=7 impiegate nei servizi.
2) calcolare anche il valore atteso degli impiegati nei servizi.
3) calcolare la varianza

n=12 prove
x= 7 successi
p(x)= 0,60
q= 0,4

12 𝑥 11 𝑥 10 𝑥 9 𝑥 8 𝑥 7 𝑥 6 𝑥 5 𝑥 4 𝑥 3 𝑥 2 𝑥 1 7 5
1) P(x)= x (0, 60) x (0, 40)
7 𝑥 6 𝑥 5 𝑥 4 𝑥 3 𝑥 2 𝑥1 (5 𝑥 4 𝑥 3 𝑥 2 𝑥 1)
479001600
= x 0,0279936 x 0,01024= 792 x 0,0279936 x 0,01024= 0,2270 cioè 22,70%
5040 (120)

2) E=n x p = 12 x 0,60= 7,2


3) VAR(X)=n x p x (1-p)= 7,2 x 0,40= 2,88

Esempio 4:
In un esperimento binomiale con probabilità di successo 0,25 determinare la probabilità di
ottenere:
a) 3 successi in 4 prove
b) 2 successi in 5 prove
c) 4 successi in 5 prove

a) n=4
x=3
p=0,25
q=0,75
4𝑥3𝑥2𝑥1 24
x (0,25)³ x (0,75)= x 0,015625 x 0,75= 0,0469 cioè 4,69%
3 𝑥 2 𝑥 1 (1) 6

b) n=5
x=2
p=0,25
q=0,75
5𝑥4𝑥3𝑥2𝑥1 120
x (0,25)² x (0,75)³= x 0,0625 x 0,421875= 0,2637 cioè 26,37%
2 𝑥 1 (3𝑥 2 𝑥 1) 12
c) n=5
x=4
p=0,25
q=0,75
5𝑥4𝑥3𝑥2𝑥1 4 120
x (0, 25) x (0,75)= x 0,00390625 x 0,75= 0,0146 cioè 1,46%
4 𝑥 3 𝑥 2 𝑥 1 (1) 24

Valore casuale Normale (Gauss)

Quando si rappresentano graficamente i dati raccolti in un'indagine statistica che riguarda sia
fenomeni sociali che naturali se il carattere esaminato è un carattere continuo, si è soliti
rappresentare i valori del fenomeno utilizzando un istogramma, ad esempio se esaminiamo
un campione di 1000 individui maschi classificati secondo le classi di peso avremmo la
seguente tabella la cui rappresentazione grafica sarà fatta attraverso un istogramma.
L'altezza dell’istogramma è dato dalla frequenza assoluta o della frequenza relativa. Il peso
medio sarà 102 kg.
Classi di peso Ni
Xi - xi+1

60-70 26

70-80 56

80-90 145

90-100 230

100-110 235

110-120 182

120-130 82

130-140 31

140-150 12

Totale 1000
I dati hanno un andamento piuttosto regolare: quelli con classi di peso molto basso o molto
alto sono relativamente pochi; in mezzo ci sono quelli con classi di peso medio che sono
molto più frequenti. La distribuzione è rappresentata bene dal diagramma a forma di
Campana o curva di Gauss. Ma in questa rappresentazione non si individuano bene i valori
intermedi (ad esempio 75 kg), cerchiamo quindi di individuare una funzione matematica che
possa restituire una buona approssimazione di questa distribuzione vera. A partire dal
l'istogramma si può disegnare una linea continua che congiunge le altezze dei rettangoli
dell’istogramma. Se si aumenta il numero delle persone intervistate e si riduce l’ampiezza
delle classi, dunque, si ottiene un poligono di frequenze che diventa una curva “normale” o
di Gauss.
La v.c Normale è certamente la v.c continua più importante per le sue innumerevoli
applicazioni e le rilevanti proprietà di cui gode.

Molti fenomeni reali si manifestano con una distribuzione empirica che si approssima
molto bene con una funzione di densità normale ad esempio: distribuzioni di peso,
altezze, pressione arteriosa, livello di colesterolo nel sangue, ma anche in generale
distribuzioni di frequenze di “pezzi” prodotti da fabbriche e classificati con una loro
misura, peso, diametro, durata in ore o resistenza alla rottura.

La v.c normale è detta anche Gaussiana in quanto venne utilizzata per la prima volta dal
matematico Gauss. Essa si indica con N(µ,σ). La distribuzione di Gauss dipende solamente
da due parametri, la media e lo scarto quadratico medio; ed è rappresentata dalla seguente
funzione:

p(x)=
1
σ 2π
𝑒 2 σ ²( )
− 1 𝑥−µ

1) µ= media aritmetica reale;


2) σ= scarto quadratico medio reale;
3) X= valori della variabile casuale continua per -∞< X < +∞;
4) π= 3,1415 (rapporto tra circonferenza e diametro del cerchio);
5) e= 2,7183 (base dei logaritmi neperiani) sono note costanti matematiche.

La curva normale teorica è una curva simmetrica con asse di simmetria verticale coincidente
con il valore della moda della media aritmetica e della mediana della distribuzione.
La simmetria della curva comporta che le osservazioni equidistanti dal massimo centrale
hanno la stessa frequenza.

La curva di Gauss si chiama anche “curva degli errori accidentali”; ciò è dovuto al fatto che
questa curva serva a rappresentare la legge con cui si distribuiscono gli errori di natura
accidentale (peso diverso quando si producono degli oggetti, durata diversa degli
elettrodomestici ecc). Le curve normali possono essere più “larghe” o più “strette” intorno
all’asse di simmetria, a seconda del valore dello scarto quadratico medio; il valore di σinfatti,
contribuisce a dare alla distribuzione la sua forma “a campana”.

Proprietà della Normale

La v.c Normale gode delle seguenti proprietà:


1) è simmetrica rispetto alla media inoltre la media, la moda e la mediana coincidono;
2) ha forma a campana
3) dipende da due parametri, la mediaµe il σ;
4) la funzione di densità di probabilità (la frequenza relativa o assoluta) è massima in
corrispondenza della media µ(mi)
5) ha due punti di flesso in corrispondenza dei valori µ-σ e µ+σ dove cambia la concavità
della curva;
6) è asintotica (continua all’infinito senza mai toccare l’asse delle X) rispetto all’asse
delle ascisse;
7) se prendiamo il valore medio della distribuzione e tracciamo una linea verticale la
distribuzione normale si divide in due parti uguali;
8) l’area sottostante la curva è uguale ad 1 (se uso le frequenze relative) e rappresenta
il 100% dei casi osservati. La frequenza relativa può essere equiparata quindi all’area
sotto la curva delimitata dall’asse delle X e rappresenta la probabilità che facendo a
caso una misura questa misura sia compresa tra X1 e X2.
La curva varia tra -∞e +∞: le due punte della curva non toccano mai l’asse delle ascisse per
cui sono in grado di comprendere tutti i casi possibili, anche quelli più infrequenti.
V.Casuale normale Standardizzata

Nell'esempio precedente se ho una distribuzione di pesi con peso medio di 102 kg Qual è la
probabilità che facendo a caso una misura cioè estraendo a caso un individuo il suo peso sia
inferiore a 102 kg? Se tutta l'aria sotto la curva è 1 o 100% la probabilità misurata dalla
frequenza relativa dicasi sarà 0,5 o 50%. Qual è la probabilità che facendo a caso una
misura cioè estraendo a caso un individuo il suo peso sia superiore a 102 kg? Sempre 0,5 o
50%. Se invece volessi trovare la probabilità che estraendo a caso un individuo il suo peso
sia compreso tra 90 e 110. Per calcolare la probabilità (la frequenza relativa dei casi) che
una v.c normale assuma valori in un intervallo (X1,X2) bisognerebbe quindi integrare la
funzione di densità tra X1 e X2 rispetto ai parametri (µ,σ).

Come visto in precedenza, la curva normale dipende da due parametri: media e scarto
quadratico medio. Da ciò si deduce che esistono infinite v.c normale in quando sono infinite
le coppie (µ,σ) che possono considerarsi.

Per fortuna esiste la possibilità di operare in modo estremamente più semplice, ma a tale fine
occorre definire una particolare v.c normale, detta v.c standardizzata, la cui caratteristica è
quella di avere media pari a zero e σunitario.

Il concetto di standardizzazione viene in aiuto nel calcolo della probabilità di una normale.
Infatti standardizzando è possibile ridurre l’infinità di curve normale as un’unica funzione
standardizzata con paramenti (µ=0,σ=1). Si può dimostrare che data una normale si può
sempre passare ad una N(X;µ,σ) semplicemente trasformando le X in Z con la relazione
N(Z,0,1)
(𝑥−µ)
Z=
σ
Per meglio comprendere il procedimento che porta alla standardizzazione della variabile
casuale può risultare utile il seguente schema:

L’area sottesa dalla curva normale standardizzata è pari ad 1; ma se volessimo calcolare


con quale probabilità X sia compreso tra due valori, ci sono di aiuto le rappresentazioni
tabulari della normale standardizzata.
Dopo aver stabilito che l’intera curva rappresenta il 100% dei casi, con area uguale a 1 si
suddivide l’asse orizzontale X in unità uguali +1σ,+2σ,+3σ a destra e simmetricamente, -1σ
,-2σ,-3σ a sinistra dello zero. In questo modo risulta che circa il 68% dei casi è compreso tra
-1 e +1 (posto σ=1), circa il 95% dei casi tra -2 e 2 e il 99% è compreso tra -3 e +3, come
mostra la figura.

Esistono varie tavole della v.c normale standardizzata le più usate sono le due seguenti:
- Figura tavole della normale standardizzata Φ(z)= corrisponde all’area colorata al di
sotto della f. di densità di probabilità compresa tra -∞e Z
- Tavola P(z)
Supponiamo di voler conoscere l’area compresa tra le ordinate corrispondenti a z=0 e
z=1,96

Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate


corrispondenti a z=-1,00 e z=+1,00
Aree della distribuzione normale standard a=0 e b>0
Esempio 1:
Abbiamo pesato un campione di N=1000 bambini di età da un mese a tre anni, ottenendo
una distribuzione di pesi con media aritmetica µ=10 kg e σ=5 kg. Qual è la probabilità che
estraendo un bambino a caso il suo peso sia compreso tra X1=5 kg e X2= 15 kg?
(𝑥−µ)
Zi=
σ
5−10
Z1= =-1,00
5
15−10
Z2= =1,00
5
Pr(-1≤z≤+1) P(1,00)+P(1.00)
0,3413+0,3413=0,6826 cioe 68,26% oppure 0,3413 x 2

Esempio 2:
La durata media della degenza negli ospedali italiani è di 7 giorni, con scarto quadratico
medio σpari a 2 giorni. Si ipotizzi che la distribuzione (durata della degenza) sia normale.
1) Qual è la probabilità che estraendo a caso un paziente la durata della sua degenza
sia compresa tra 10 e 11 giorni?
2) Qual è la probabilità che una degenza sia inferiore a 11 giorni?
3) Qual è la probabilità che una degenza sia superiore a 11 giorni?

10−7 11−7
1) Z1= =1,5 Z2= =2
2 2
Pr(1,5≤Z≤2)= Φ(2) - Φ(1,5)= 0,9772 - 0,9332 = 0,0440
Con la tavola P sarà P(2) - P(1,5)= 0,4771 - 0,4332= 0,044 cioè il 4,4%
2) Pr (X≤11) cioè standardizzando
Pr(Z≤2) = Φ(2)= 0,9772
Con la tavola P sara P(2)+0,500= 0,4772+0,500= 0,9772 cioè il 97,72%

3) Pr (X≥11) cioè standardizzando


Pr (Z≥2) = 1-Φ(2)= 1-0,9772 = 0,0228 cioè 2,28%
Con la tavola P sarà 0,500 - P(2)= 0,500-0,4772= 0,0228 cioè il 2,28%

Esempio 3:
In una distribuzione normale di media µe sqm σla percentuale dei casi compresi tra µ-1,96 e
µ+1,96 è:
A) L’ 86,64%
B) Il 95,00%
C) Il 99,73%
D) L’ 86,64%
Vedo nella tavola P vado al punto 1,90 e poi fino a 6 e sarà 0,4750 però poiché devo trovare
sia l’area positiva che negativa allora moltiplicherò 0,4750 x 2 e viene 0,95. In altre parole
P(1,96)= 0,4750 x 2= 0,9500 cioè il 95%

Esercizio 4:
In una distribuzione normale di media µe sqmσla percentuale dei casi compresi tra µ-1,5 e µ
+1.5 è:
A) L’86,64%
B) Il 95,45%
C) Il 99,74%
D) L’89,67%

Esercizio 5:
Esempio:
Pr(Z≤0,5)= Φ(0,5)= 0,6915

Esempio:
Pr(Z≥0,5)=1-Φ(0,5)= 1- 0,6915= 0,3085

Inferenza statistica

Le indagini parziali che considerano solo un numero limitato degli individui che
compongono l'intera popolazione sono dette indagini campionarie e gli individui esaminati
costituiscono un campione casuale estratto della popolazione oggetto di studio.
La statistica inferenziale può essere definita come l'insieme dei metodi che permettono la
stima di una caratteristica della popolazione ad esempio la media o lo scarto quadratico
medio basandosi soltanto sul risultato del campione.
Inferenza statistica è quindi il processo attraverso il quale i risultati campionari vengono
utilizzati per trarre conclusioni sulle caratteristiche di una popolazione.
Tale processo consente di stimare caratteristiche non note della popolazione come i
parametri (ad es. la media o lo scarto quadratico medio).
Si definisce popolazione l'insieme di tutti i possibili valori N di tale variabile.
Se invece della popolazione N se ne considera un sottoinsieme di numerosità n si definisce
un campione una v.c della caratteristica X studiata.

Molti caratteri della popolazione originaria non sono osservabili nella loro totalità a causa
delle numerosissime unità del collettivo.
Nasce per questi motivi l'esigenza di servirsi di indagini campionarie che però non forniscono
i veri parametri µ,σ della popolazione, ma soltanto delle stime di essi.

Ci si chiede fino a che punto sono valide le conclusioni cui si perviene basandosi sui dati
campionari e come queste conclusioni possono essere generalizzate alla popolazione o
universo da cui il campione risulta estratto.
L'inferenza statistica e quindi il processo attraverso il quale i risultati campionati vengono
utilizzati per trarre conclusioni sulle caratteristiche di una popolazione.

Tale processo consente di stimare caratteristiche non note della popolazione come i
parametri (ad es. la media o lo scarto quadratico medio ecc.)
Abitualmente l'universo oggetto di studio viene indicato come popolazione originaria è
rappresentato con un'urna che contiene N unità uguali ed uniformi. Questo consente di
applicare gli schemi probabilistici in cui si basa l’inferenza statistica.
I parametri di detta distribuzione sono generalmente ignoti e vengono stimati attraverso
dati forniti da un unico campione estratto di numerosità n con un determinato criterio
della popolazione originaria di N unità statistiche.
Tuttavia perché possa formularsi un giudizio sulla attendibilità di queste stime occorre
immaginare di aver estratto tutti i possibili campioni della stessa dimensione e con il
medesimo schema di estrazione.
Per quanto riguarda le procedure attuabili per eseguire un corretto campionamento, la scelta
casuale paragonabile all'estrazione di una pallina dall'urna è facilmente attuabile se le unità
sono facilmente individuabili e non eccessivamente numerose.
Infatti possono essere individuate (tenendo presente che l'indagine si basa su elenchi
dell'anagrafe ecc.) assegnando ad ogni elemento un ordine progressivo, e stabilendo una
corrispondenza reciproca con altrettante palline. Mettendo questa pallina in un’urna queste
vengono sorteggiate casualmente con lo stesso procedimento del gioco del Lotto. Questo
schema costituisce la proceduta più elementare denominata Campionamento casuale
semplice.

Per quanto riguarda la tecnica, il sorteggio casuale può essere eseguito:


1) Con ripetizione e dando importanza all’ordine di estrazione (campionamento
𝑛
bernoulliano). L’universo dei campioni con ripetizione ordinati contiene ω=𝑁
2) Senza ripetizione e non dando importanza all’ordine di estrazione (campionamento
in blocco). L’universo dei campioni senza ripetizione non ordinati contiene

( )
𝑁 𝑁!
ωs= 𝑛 = 𝑛!(𝑁−𝑛)! (quello in parentesi è senza linea di frazione)

Le indagini parziali che considerano solo un numero limitato degli individui che compongono
l’intera popolazione sono dette indagini campionarie e gli individui esaminati costituiscono un
campione n della popolazione oggetto di studio.
La statistica inferenziale può essere definita come l’insieme dei metodi che permettono la
stima di una caratteristica della popolazione ad esempio la media o lo scarto quadratico
medio basandosi soltanto sul risultato del campione.

Tale processo consente di stimare caratteristiche non note della popolazione come i
parametri ad es. la media o lo scarto quadratico medio.

- Campionamento sistematico
Sia data una popolazione le cui N unità sono aumentate da 1 a N secondo un certo ordine.
Posto k=N/n si estrae un numero casuale r, uguale a k (detto passo di campionamento)
1000/100=10

Distribuzioni campionarie e proprietà degli stimatori

Abbiamo visto che spesso è impossibile conoscere i parametri della popolazione originaria
oppure è molto lungo e dispendioso.
Allora si procede ad estrarre, secondo un certo criterio, un campione di tale popolazione e si
osserva quest'ultimo, Ottenendo un'informazione sulla f.d o sui valori caratteristici della
popolazione.

I valori caratteristici di una popolazione prendono il nome di parametri non noti θ, della
popolazione originaria ad esempio µ,σ invece quelli di un campione prendono il nome di
statistiche o stime puntuali.

Il processo conoscitivo che a partire dall’informazione campionaria risale alla


conoscenza approssimativa (perché affetta da errore) dei parametri di una popolazione
prende il nome di stima statistica parametrica.

Ci sono due approcci fondamentali di stima: le stime puntuali e le stime per intervalli.

Uno stimatore è una variabile casuale: ripetendo più volte l’estrazione di un campione ad
esempio assume valori diversi. 𝑋

La stima puntuale è lo specifico valore assunto dallo stimatore, calcolata in corrispondenza


dei dati campionare e che viene utilizzata per stimare il vero valore non noto di un parametro
di una popolazione ad esempio µ e σ.

- La stima per intervallo è un intervallo di due valori, costruito attorno allo stimatore
puntuale, in modo tale che sia nota e fissata la probabilità β che il parametro
appartenga all’intervallo stesso.

Attraverso gli stimatori possiamo determinare i valori (stime) dei parametri non noti θ(theta)
della popolazione.

Si possono definire una pluralità di stimatori.


∑ 𝑋𝑖
Esempio: la media campionaria 𝑥= è un possibile stimatore di µ; un altro stimatore di µ
𝑛
può essere la mediana campionaria ecc.

Proprietà degli stimatori

E’ necessario, quindi, definire un insieme di criteri o caratteristiche per la scelta degli


stimatori.

Le caratteristiche più importanti sono:


1) Correttezza quando lo stimatore è centrato e non distorto
2) Efficienza
3) Consistenza
4) Sufficienza
La distribuzione della media campionaria

La proprietà di non distorsione o correttezza può essere dimostrata in via empirica mediante
il seguente esempio: consideriamo una popolazione costituita dai N=4 dattilografi, ciascuno
dei quali commette un numero di errori di battitura sotto riportato.
Dattilografo Numero di errori

Ann X1=3

Bob X2=2

Carla X3=1

Dave X4=4

Considerando l’intera popolazione, la media e lo scarto quadratico medio σdegli errori


possono essere calcolati come:
3+2+1+4
µ= 4
=2,5

(3−2,5)² + (2−2,5)² + (1−2,5)² + (4−2,5)²


σ= 4
=1,118

Supponiamo ora di estrarre con reimmissione (campionamento bernoulliano) dalla


𝑛
popolazione N=4 un campione di n=2 dattilografi. In totale potremmo estrarre 𝑁 =4² =16
1) Con ripetizione e dando importanza all’ordine di estrazione (campionamento
𝑛
bernoulliano). L’universo dei campioni con ripetizione ordinati contiene ω=𝑁
(Si considera anche 3,3 2,2 1,1 4,4 e anche tutti quelli che si ripetono tipo 3,2 e 3,2)
𝑛
N=4 n=2 𝑁 =4² =16
3,3 2,3 1,3 4,3
3,2 2,2 1,2 4,2
3,1 2,1 1,1 4,1
3,4 2,4 1,4 4,4

Calcoliamo per ciascun campione le medie campionarie e le riportiamo nella seguente


tabella:
Campione Dattilografi Risultati campionari Medie campionarie 𝑋𝑖

1 Ann, Ann 3,3 3

2 Ann, Bob 3,2 2,5

3 Ann, Carla 3,1 2

4 Ann, Dave 3,4 3,5

5 Bob, Ann 2,3 2,5

6 Bob, Bob 2,2 2

7 Bob, Carla 2,1 1,5

8 Bob, Dave 2,4 3

9 Carla, Ann 1,3 2

10 Carla , Bob 1,2 1,5

11 Carla, Carla 1,1 1

12 Carla, Dave 1,4 2,5

13 Dave, Ann 4,3 3,5

14 Dave, Bob 4,2 3

15 Dave, Carla 4,1 2,5

16 Dave, Dave 4,4 4

Nella tabella seguente è rappresentata la distribuzione delle medie campionarie 𝑋𝑖.


Raggruppando le medie con lo stesso valore si ottiene la distribuzione delle medie
campionarie:

𝑋𝑖 ni (freq. ass) Ni/N freq. rel

1 1 0,062

1,5 2 0,125

2 3 0,188

2,5 4 0,250

3 3 0,188
3,5 2 0,125

4 1 0,062

16 1,00

Nella figura è rappresentata la distribuzione delle medie campionarie 𝑋𝑖 che ha una forma
normale: le medie campionarie di distribuiscono normalmente.

Calcoliamo la media della distribuzione delle medie campionarie:


µ-x è la media che abbiamo calcolato prima cioè 2,5

𝑋𝑖 ni 𝑋𝑖 ni (𝑋𝑖-µ-x)² ni

1 1 1 2,25

1,5 2 3 2

2 3 6 0,75

2,5 4 10 0

3 3 9 0,75

3,5 2 7 2

4 1 4 2,25

16 40 10

La media della popolazione campionaria è uguale alla media della popolazione.

∑𝑥𝑖 𝑛𝑖
40
µ-x = 𝑖
= 16 =2,5
∑𝑛𝑖
𝑖
Lo scarto quadratico medio della distribuzione non è gale allo scarto quadratico medio di
popolazione, tuttavia si osserva che vale la relazione:

∑(𝑋𝑖−µ−𝑥)² 𝑛𝑖
10 σ 1,118
σ𝑥 = 𝑖
= 16
= 0,79 σ𝑥= = =0,79
𝑛 2
∑ 𝑛𝑖
𝑖

2) Senza ripetizione e non dando importanza all’ordine di estrazione


(campionamento in blocco). L’universo dei campioni senza ripetizione non
ordinati contiene N=4 n=2
(quindi in questo caso non si considerano anche 3,3 2,2 1,1 4,4 e nemmeno quelli che si
ripetono tipo 3,2 e 2,3 ovviamente si prende solo una volta)

ωs= ωs= ( )
𝑁
𝑛
=
𝑁!
𝑛!(𝑁−𝑛)!
(quello in parentesi è senza linea di frazione)
4! 4𝑥3𝑥2𝑥1
=
2! (4−2)!
= 2𝑥1 (2𝑥1) =6

Efficienza: uno stimatore è efficiente se la distribuzione delle stime campionarie presenta


una bassa variabilità.

Consistenza: uno stimatore è consistente se all’aumentare della dimensione del campione n


i suoi valori si avvicinano sempre di più al parametro θ

Sufficienza: deve utilizzare tutte le informazioni fornite dal campione circa il parametro da
stimare.

Stima per intervallo

La stima è una determinazione della v.c (stimatore) cioè un singolo valore della sua
distribuzione. Trattandosi di una stima puntuale del parametro incognito θ è piuttosto difficile
che sia precisa, quindi si ha sempre un errore. Sorge quindi la necessità di considerare
questo errore per vedere quanto la stima sia vicina al parametro incognito θ e ridurre il
margine di incertezza (liberarci dal divario tra stima e valore vero del parametro).

Dato un campione che deriva da una popolazione (fenomeno) con distribuzione normale
(X∼> N(µ,σ) dove µè non noto e σ si conosce (ad esempio da un’indagine totale precedente(,
si determini l’intervallo di µ con probabilità pari a β. Bisogna prima calcolare la media del
σ
campione mediante la media campionaria 𝑋 sapendo che essa è 𝑋≈>N(µ, ) e che la
𝑛
𝑋−µ
standardizzata è Z= σ . Fissata una probabilità pari a βindividuo le ascisse simmetriche
𝑛
che contengono tale probabilità. Ad esempio per una probabilità pari a 0,9500 le ascisse
corrispondono a -1,96 e +1,96

Se β= 0,95:2= 0,4750 il valore di Zα/2 =1.96 nella tavola P(Z)


Se β= 0,99:2= 0,4950 il valore di Zα/2 =2,58 nella tavola P(Z)
Se β= 0,90:2= 0,4500 il valore di Zα/2 =1.65 nella tavola P(Z)

Generalizzando quindi si cercano sulle tavole i valori di Z in corrispondenza del valore di β


scelto e dall’α (α/2), cioè ±Zα/2 e si ha:
𝑋−µ
P(-Zα/2 ≤ σ ≤Zα/2 =β
𝑛
che diventa:
σ σ
P(𝑋-1,96 ≤µ≤𝑋+1,96 )=0,95
𝑛 𝑛

che si chiama intervallo di confidenza al 95%


Se β= 0,95:2= 0,4750 il valore di Zα/2 =1.96 nella tavola P(Z)
Se β= 0,99:2= 0,4950 il valore di Zα/2 =2,58 nella tavola P(Z)
Se β= 0,90:2= 0,4500 il valore di Zα/2 =1.65 nella tavola P(Z)

Esempio 1:
Da una popolazione originaria di N=10000 dipendenti da una certa azienda è stato estratto
un campione di n=100 dipendenti ed è stata accertata un’altezza media (del campione) di
𝑋=170 cm. Sapendo che lo s,q,m σ è 5 cm (fornito da un’indagine totale precedente)
determinare gli intervalli di confidenza al 95% ed al 99% dell’altezza media di tutti i
dipendenti.

Se β=0,95:2= 0,4750 il valore di Zα/2 =1.96 nella tavola P(Z)


Se β= 0,99:2= 0,4950 il valore di Zα/2 =2,58 nella tavola P(Z)

σ σ
P(𝑋-1,96 ≤µ≤𝑋+1,96 ) =β
𝑛 𝑛
Se β=0,95 il valore di Zα/2 =1.96 e abbiamo
5 5
P(170-1,96 ≤µ≤170+1,96 )= 0,95 (ricorda si fanno prima le moltiplicazioni)
100 100

Da cui l’intervallo di confidenza al 95% per µè:


= P(169,02≤µ≤170,98)= 0,95

σ σ
P(𝑋-2,58 ≤µ≤𝑋+2,58 ) =β
𝑛 𝑛

Se β=0,99 il valore di Zα/2 =2,58 e abbiamo:


5 5
P(170-2,58 ≤µ≤170+2,58 )= 0,99
100 100

Da cui l’intervallo di confidenza al 99% per µ:


P(168,71≤µ≤171,29) = 0,99

Esempio:
Una fabbrica produce N=5000 candele di cera al giorno la cui durata una volta accese si
distribuisce normalmente. Si estrae un campione di n=5 candele che hanno rispettivamente
durata (in ore)
15,1 11,2 8,9 8,3 10,9
si determini:
1) media campionaria 𝑋
2) stima corretta dello scarto quadratico medio Sc
3) estremi dell’intervallo di confidenza al 99% per µ
4) estremi dell’intervallo di confidenza al 95% per µ

Xi (xi-𝑋)²

15,1 16,16

11,2 0,014

8,9 4,752
8,3 3,168

10,9 0,032

54,4 24,126

∑𝑥𝑖
54,4
1)𝑋=
𝑛
= 5
=10,88

∑ (𝑋𝑖−𝑋)²
24,126
2)Sc= 𝑛−1
= 4
=2,456

𝑆𝑐 𝑆𝑐
3)P(𝑋-Zα/2 ≤µ≤𝑋+Zα/2 )=β
𝑛 𝑛
2,456 2,456
P(10,88-2,58 ≤ µ ≤10,88+2,58 )=0,99
5 5
P(8,25≤µ≤13,91)=0,99
Ampiezza intervallo 13,91-8,25=5,66
La durata di tutte le candele prodotte dalla fabbrica è tre 8,25 e 13,91 ore con una probabilità
del 99%

2,456 2,456
4)P(10,88-1,96 ≤ µ ≤10,88+1,96 )=0,95
5 5
P(8,93≤µ≤13,21)=0,95
Ampiezza intervallo 13,21-8,93=4,28 passando al 95% al 99% l’ampiezza dell’intervallo
aumenta perché aumenta la probabilità che l’intervallo contenga al suo interno la media della
popolazione originariaµ.
PROVA 1
A)I punteggi di un test di socievolezza somministrato a 400 bambini di una scuola elementare di Roma si distribuiscono
normalmente con media pari a 60 e scarto quadratico medio σpari 3.
1)Determinare la probabilità la possibilità di estrarre a caso un bambino con un punteggio compreso tra 60 e 63
60−60
Z1= 3
=0
63−60
Z2= 3
=1 che sulla tavola corrisponde a 0,3413 cioè 34,13%

2)Determinare la probabilità di estrarre a caso un bambino con un punteggio maggiore di 66


66−60
66→ 3 =2→p(2) che sulla tavola corrisponde a 0,4772 → 0,500- 0,4772 = 0,0228 quindi 2,28%

3)Determinare la probabilità di estrarre a caso un bambino con un punteggio minore 64


64−60 4
64→ 3 = 3 =1,33 che sulla tavola corrisponde a 0,4082→ 0,4082 + 0,500= 0,9082 quindi 90,82%

B)Si vogliono analizzare le vendite giornaliere di un prodotto X negli esercizi commerciali nella città di Bologna. In un campione
casuale di sei punti vendita sono state registrate le seguenti quantità vendute del prodotto X (numero di pezzi): 20, 35, 45, 40,
30, 28. Ipotizzando che le quantità vendute si distribuiscano normalmente nella popolazione dei punti vendita, determinare:

Xi (Xi -𝑋)²

20 169

35 4

45 144

40 49

30 9

28 25

Tot 198 400

∑𝑥𝑖
198
4)Media campionaria 𝑋= 𝑛
= 6
=33

∑ (𝑋𝑖−𝑋)²
400
5)Stima corretta dello scarto quadratico medio Sc= = =8,94
𝑛−1 5

6)Estremi dell’intervallo di confidenza al 90% per la quantità media venduta del prodotto X
8,94 8,94
P(33-1,65 ≤ µ ≤33+1,65 )=0,90 26,99≤ µ ≤39,00
6 6
Se β=0,90:2= 0,4500 il valore di Zα/2 =1.65 nella tavola P(Z)

7)Estremi dell’intervallo di confidenza al 95% per la quantità media venduta del prodotto X
8,94 8,94
P(33-1,96 ≤ µ ≤33+1,96 )=0,95 25,85≤ µ ≤40,15
6 6
Se β=0,95:2= 0,4750 il valore di Zα/2 =1.96 nella tavola P(Z) (come si trova quel valore)

C)Un’urna contiene 15 palline bianche, 10 rosse e 25 verdi. Qual è la probabilità di estrarre a caso:
8)Una pallina che sia bianca o rossa?
15 10
50
+ 50 =0,5 probabilità eventi: incompatibili

D)Una fabbrica produce pezzi imperfetti con probabilità del 60%. Calcolare la probabilità che vengano prodotti X=2 pezzi
imperfetti su un campione di N=3 pezzi.
n=3 x=2 p=0,60 q=0,40
3𝑥2𝑥1
P(x)= .(0,60)² . (0,40)= 2𝑥1(1) . 0,36 . 0,40= 0,42

PROVA 2
1)Da una popolazione costituita da N=7 unità, volendo estrarre con l’estrazione in blocco un campione di numerosità n=5, il
numero ωs di tutti i possibili campioni sarà:
7! 7𝑥6𝑥5𝑥4𝑥3𝑥2𝑥1
=
5!(7−5)! 5𝑥4𝑥3𝑥2𝑥1(2𝑥1)
=21

A)Sia X una variabile casuale a distribuzione normale. Servendosi delle tavole della curva normale standardizzata calcolare:
2)P(1,7≤Z≤2,2) = Φ(2,2)-Φ(1,7) = 0,9861-0,9554= 0,0307 = 3,07%
3)P(-1,5≤Z≤2,1) = P(2,1)+P(1,5) = 0,4821+0,4332=0,9152 = 91,52%

B)Una fabbrica produce mattoni il cui peso ha una distribuzioni normale di parametro µignoto. Si estrae un campione di n=16
elementi da cui si ricavano la media campionaria 𝑋che è uguale a 5 kg e la stima puntuale dello scarto quadratico corretto
medio Sc=2 kg
4)Costruire l’intervallo di confidenza di µ al livello di probabilità del 95%
2 2
P(5 - 1,96 ≤ µ ≤5 + 1,96 )=0,95 = 4,02≤ µ ≤5,98 Si conclude quindi che il valore vero di µ, con
16 16
probabilità pari al 95% è compreso tra 4,02 e 5,98

C)In un esperimento binomiale con probabilità di successo 0,20 determinare:


5)La probabilità di ottenere 3 successi in 4 prove
P(X)= .(0,2)³ . (0,8)
4𝑥3𝑥2𝑥1
3𝑥2𝑥1(1)
. 0,008 . 0,8=0,0256

6)Determinare la probabilità di ottenere 4 volte testa in 7 lanci di una moneta


4
P(x=4)= .(0, 5) . (0,5)³
7𝑥6𝑥5𝑥4𝑥3𝑥2𝑥1
4𝑥3𝑥2𝑥1(3𝑥2𝑥1)
. 0,0625 . 0,125= 0,2734

D)Abbiamo un'urna con 5 palline bianche, 10 rosse e 15 nere:


7)Trovare la probabilità di estrarre successivamente due palline bianche senza rimettere la prima pallina estratta nell’urna
La probabilità di estrarre una pallina bianca è di 5/30
La probabilità di estrarre la seconda pallina bianca è di 4/29
5 4
30
x 29 =0,0229 = 2,29%

E)Da una popolazione di N=1000 pazienti si estrae bernullianamente un campione di n=4 persone per le quali risultano le
seguenti pressione arteriose: 98, 110, 120, 134. Determinare:
8)L’intervallo di confidenza della pressione arteriosa media della popolazione originaria ai livelli di confidenza del 99%.
15,264 15,264
P(115,5 - 2,58 ≤ µ ≤115,5 + 2,58 )=0,99 95,81≤ µ ≤135,19
4 4

Xi (Xi-𝑋)²

98 306,25

110 30,25

120 20,25

134 342,25
Tot 462 699,00

∑𝑥𝑖
462
𝑋=
𝑛
= 4
=115,5

∑ (𝑋𝑖−𝑋)²
699,00
Sc= 𝑛−1
= 3
=15,264

Potrebbero piacerti anche