Sei sulla pagina 1di 43

Calcolo probabilità

È una branca molto ampia della matematica, ed è anche quella che ha avuto un successo maggiore,
essendo impiegata in tutti i campi del sapere umano.

Le probabilità hanno a che fare con eventi che devono ancora accadere, a differenza delle frequenze.

La probabilità ha diverse Definizioni.

L’oggetto elementare della probabilità è l’esperimento aleatorio, che è una procedura che può dare origine
a uno degli esiti possibili, ma prima dell’esperimento, non è possibile prevedere quali di questi eventi si
verificherà.

Es: lancio di una moneta, di un dado, esito di una partita di calcio, esito di un esame, performance di un
investimento finanziario (non so quanto produrrà).

Si chiamano eventi elementari, gli esiti che un esperimento aleatorio può produrre.

L’insieme di tutti gli eventi elementari, si chiama spazio campionario o spazio degli eventi elementari.

Eventi: è un sottoinsieme degli eventi elementari, che appartengono allo spazio campionario.

Qual è la probabilità che si verifichi un evento, che abbia determinate caratteristiche?

Es: (continua)

A = “Si è verificato almeno una desta, nel lancio delle due monete”

Interpretazione classica delle probabilità

Si dice che un evento A, si è verificato, se l’esperimento aleatorio ha prodotto uno degli esiti elementari,
contenuti in A.

Altri due eventi speciali:

-Evento impossibile: il fatto che si verifichi un evento che in realtà non contiene nessun evento elementare,
e quindi non si potrà mai verificare.

- Evento certo: evento a cui corrispondono tutti gli eventi elementari.

Algebra degli eventi:

-Eventi complementari
Dato un evento A, si dice evento complementare di A, e si indica con l’evento che si verifica
quando A non è verificato contiene quindi tutti gli eventi elementari non contenuti in A

-Evento intersezione: dati due eventi A e B, dello spazio campionario, l’evento intersezione corrisponde
all’evento che risulta vero, quando entrambi gli eventi A e B, sono entrambi veri.

Contiene gli eventi elementari che appartengo o contemporaneamente sia ad A, sia a B.

-Due eventi A e B, si dicono disgiunti o incompatibili, se l’evento intersezione è impossibile o vuoto.

Gli eventi, si dicono mutuamente esclusivi, se la loro intersezione a coppie, sono tutte vuote, ovvero se Ei

-Evento unione: siano A e B due eventi dello spazio campionario, l’evento unione che si indica con

Si verifica quando almeno uno dei due eventi si è verificato.

Contiene tutti gli eventi elementari contenuti in A, oppure in B.

Es : esperimento aleatorio: lancio di un dado a 6 facce

A = si verifica un risultato pari

B = si verifica un risultato maggiore e uguale a 4”

Si dice che gli eventi E1, E2, Ek, si dicono collettivamente esaustivi, se la loro unione corrisponde all’intero
spazio campionario.
-Se gli eventi sono mutuamente esclusivi e collettivamente esaustivi, si dice che formano una partizione di
omega grande.

Es:

Siano A e B due eventi qualsiasi: a cosa corrispondono gli eventi:

E cosa si può dire circa la loro intersezione ed unione?

Questi eventi sono tra loro disgiunti.

2)Siano A e B due eventi. Si valuti a cosa corrispondono gli eventi

-Interpretazioni del concetto di probabilità.

1)Interpretazione classica: la probabilità di un evento A, è definita come rapporto tra numero di esiti
favorevoli all’evento A e numero di casi di esiti possibili (ugualmente probabili)

2)Interpretazione frequentista: la probabilità di un evento A, è definita come limite della frequenza relativa
con cui l’evento si verifica, ripetendo l’esperimento un numero infinito di volte.

3)Interpretazione soggettiva: definisce la probabilità di un evento A, come il prezzo che si è disposti a


pagare, per entrare in una scommessa che restituisce 1 euro, se l’evento A si verifica, e 0, se non si verifica.

4)Definizione assiomatica: sia lo spazio campionario di un esperimento aleatorio. Si dice probabilita,


una qualsiasi funzione P(.), definita per una classe di eventi che soddisfa le seguenti 3 proprietà:

1) Se A e un evento dello spazio, allora

2)
3) Assioma dell’additivita completa: Siano A1, A2, … una successione infinita di eventi, che sono tra
loro mutuamente esclusivi, allora, deve valere che la probabilità tra l’unione di questi eventi, corrisponda
alla somma delle probabilità degli eventi.

Regole di base per calcolare le probabilità.

1)Sia A un evento con probabilità P(A), allora la probabilità dell’evento complementare ad A, sarà: 1 – P(A)

2)Regole complementare della somma: siano A e B due eventi qualsiasi, con probabilità rispettivamente
P(A) e P(B), allora la probabilità della loro unione è uguale alla probabilità dell’evento + la probabilità
dell’evento B – la probabilità dell’intersezione tra A e B.

Es: esperimento aleatorio: lancio dado a 6 facce

A = “Risultato pari”

B = “Risultato maggiore di A

-Probabilità condizionata (probabilità che si verifichi un evento, condizionatamente al fatto che se ne sia
verificato un secondo)

Siano A e B due eventi ed è necessario che A, abbia una probabilità positiva di verificarsi (> 0): si definisce
probabilità condizionata di B dato A, la seguente espressione: P(B|A)

Es: esperimento aleatorio: estrazione di due carte (senza reimmissione) da un mazzo di carte napoletane
(40 carte).

Vogliamo calcolare la probabilità che la seconda carta estratta sia una carta di spade, sapendo che anche la
prima carta estratta era di spade.

A = “due carte estratte, la prima carta estratta è di spade”


B = “due carte estratte, la seconda carta è di spade”

Ci interessa quindi calcolare la probabilità condizionata P(B|A) (vogliamo calcolare la probabilità di estrarre
una seconda carta di spade, dopo aver estratto la prima di spade).

P(A) =

-Regola delle probabilità composte: è una regola che ci permette di calcolare la probabilità dell’intersezione
di due eventi, assumendo di conoscere la probabilità condizionata di un evento, dato un altro.

-Teorema delle probabilità totali: siano A1, A2, …, An, eventi tali che:

- (mutamenti esclusivi)

- (Collettivamente esaustivi)

- , i = 1, …, n

Allora per un qualsiasi evento B, vale che la probabilità che si verifichi B, e uguale alla:

Es: la forza lavoro in un certo paese ripartita in 5 zone: A1, A2, A3, A4, A5

Nelle percentuali rispettivamente di : 10%, 22%, 19%, 30%, 19%

I tassi di disoccupazione delle diverse regioni sono: 5%, 2%, 3%, 1%, 8%

Estraiamo a caso un lavoratore da questa nazione. Qual è la probabilità che sia un disoccupato?

Siano:

Ai = lavoratore estratto appartiene alla regione i-esima, i = 1, …, 5

Bi = Il lavoratore è disoccupato
Teorema probabilità totali

Presi n eventi A1, A2, … An, che soddisfano le seguenti proprietà:

1)L’intersezione di ogni coppia di questi eventi, e uguale all’insieme vuoto, sono mutuamente esclusivi

2) L’unione di tutti questi eventi sia uguale a tutto l’insieme (collettivamente esaustivi)

3) La probabilità che si verifichi ognuno degli eventi sia positiva

E preso un evento B qualsiasi, vale che la probabilità che si verifichi l’evento B, era uguale alla sommatoria
delle probabilità condizionate di B dato A, moltiplicato per la probabilità di A

Teorema di Bayes, teorema delle probabilità inverse

Ci permette di calcolare la probabilità di A, dato B.

Siano A1, A2, … An, n eventi tali che:

1)L’intersezione a coppie e vuota

2)L’unione di tutti gli eventi e lo spazio campionario

3)Probabilita che si verifica evento A, positiva

Si consideri quindi un altro evento B con probabilità positiva

Allora il teorema dice che la probabilità che si verifica A, dato B, lo possiamo calcolare cosi

Es:

Un azienda produce ii suoi prodotti in 3 diversi stabilimenti, nelle percentuali:

50% produzione primo stabilimento

10% secondo stabilimento

40% terzo stabilimento

Storicamente, le proporzioni di pezzi difettosi prodotti da ogni stabilimento, sono pari a 1%, 5%, 2%.

Si estrae a caso un pezzo dall’intera produzione dell’azienda e si osserva che esso è difettoso. Quali sono le
probabilità che quel pezzo arrivi da un certo stabilimento?
Siano A1, A2, A3, e B i seguenti eventi:

A1 = il pezzo estratto arrivo dallo stabilimento i-esimo

B = pezzo estratto difettoso

P(A1) = 0.50,

P(A2) = 0.10

P(A3) = 0.40

Per il teorema delle probabilità totali

P(B) =

La somma di queste probabilità deve fare 1

Esercizio: usando i dati relativi all’esempio per il teorema delle probabilità totali, si calcoli no le probabilità
che, sapendo che il lavoratore è disoccupato, appartenga a una certa regione.

Indipendenza statistica tra due eventi (o stocastica)

Si considerino due eventi A e B, Supponiamo che il fatto che si sia verificato uno dei due, non ci fornisce
informazioni utili per calcolare la probabilità che si verifichi l’altro, ovvero

PIÙ FORMALMENTE, due eventi A e B s dicono statisticamente indipendenti, se è solo se vale la seguente
condizione:

L’intersezione deve essere uguale al prodotto delle due probabilità di A e B.

A titolo di verifica, se A e B sono indipendenti, si ottiene infatti (per la regola delle probabilità composte):

Non si con fondano i concetti di indipendenza di due eventi con quelli di incompatibilità. A e B sono
incompatibili se la loro intersezione è vuota.

A e B si dicono incompatibili se
A e B si dicono indipendenti se è solo se

Es: spazio campionario omega qualsiasi

Notiamo che:

Sono incompatibili

Ne consegue che la probabilità che succedano insieme, allora

2)

Pertanto, è sono incompatibili, ma non sono indipendenti , poiché la probabilità che succedano
insieme, non è vero che è uguale, è diversa dal prodotto delle due probabilita

Variabili aleatorie:

Nella pratica, interessa spesso valutare le conseguenze di un esperimento aleatorio.

Una variabile aleatoria è una funzione che associa ad ogni evento elementare che appartiene allo spazio
campionario, un numero reale, ovvero X :

Esempio: Supponiamo di lanciare due dadi a 6 facce

Spazio campionario:

Gli eventi elementari si possono considerare equiprobabili con probabilità P({(i, j)}) =

Si consideri quindi la variabile aleatoria, X = “somma dei punteggi”, ovvero X((i, j)) = i + j, con (i, j)

Le variabili aleatorio si indicheranno sempre con lettere maiuscole (X, Y, Z, W, …), mentre i singoli valori che
questa può assumere si indicheranno con le lettere minuscole (x, y, z, w, ..)

La distribuzione di probabilità, di una variabile aleatoria x, e la probabilità che si osservino valori specifici di
x, calcolata utilizzando la probabilità definita su un insieme omega di partenza.
In particolare, sia B contenuto in R, la probabilità con cui x appartiene a b è quindi definita come

Px(B) = P

Le variabili aleatorio si distinguono in variabili discrete e variabili continue

Discrete: quando l’insieme dei valori che può assumere è finito o infinito numerabile.

Continue: quando l’insieme dei valori che può assumere è infinito non numerabile (tipicamente, un
sottoinsieme dei numeri reali).

Variabili aleatorie discrete

Si dicono funzioni di probabilità di una variabile aleatoria discreta x,

Esempio (continua)

X = I + j => si tratta di una v.a. Discreta poichè Rx = {2, 3, …, 11, 12} è un insieme finito

La corrispondente probabilità e

Funzione di ripartizione di una v.a. discreta x, corrisponde a una probabilità di osservare valori della
variabile che sono minori o al più uguali, ad un valore fissato, ovvero

La funzione di ripartizione serve per calcolare le probabilità con cui la v.a. assume valori in un certo
intervallo, ovvero:
Proprietà della funzione di ripartizione di una v.a. x

F(x) è non decrescente

F(x) e “a gradini” con salti corrispondenti a p(xi), xi appartiene a Rx

Esempio:

Esperimento aleatorio: lancio di 4 monete regolari

Spazio campionario: {(T, T, T, T), (T, T, T, C), …..(C, C, C, C)}, con = 2 per 2 per 2 per 2 = 16

E ragionevole ipotizzare che gli eventi elementari siano equiprobabili con P({ }} = 16

Si consideri la v.a. x = “numero di test”

Il supporto di x, Rx, è uguale al l’insieme {0, 1, 2, 3, 4}, quindi x e discreta, perché contiene un numero finito
di elementi.

Funzione di probabilità =

La funzione di ripartizione sarà:

Variabile aleatoria

Esperimento aleatorio

Variabile aleatoria -> funzione


Distribuzione di probabilità della variabile aleatoria x

Variabili aleatorie:

Discrete -> x ha supporto finito o infinito numerabile

Continue -> x ha supporto infinito non numerabile (ovvero un sotto-insieme di )

Variabili aleatorie discrete

-Funzione di probabilità -> p(x)

P(xi) ≥ 0

-Funzione di ripartizione

-Valori di sintesi per una variabile aleatoria discreta x

Valore atteso:

Es: continua

Esperimento aleatorio -> lancio di 4 monete

X = numero di teste -> Rx = {0, 1, 2, 3, 4}

-Fz di probabilità

-Proprietà del valore atteso

Il valore atteso è un operatore lineare, ovvero sia x una variabile aleatoria discreta con valore atteso
E(x). Si considerino 2 costanti a e b che definiscono la seguente trasformazione lineare

Allora il valore atteso di Y è dato da

-Momento k-esimo :
Chiaramente, il momento primo , corrisponde al valore atteso di X.

-Momento centrale k-esimo

-Varianza

Quindi la varianza corrisponde al momento centrale secondo

Es: (continua)

-Proprietà della varianza

La varianza non è un operatore lineare poiché se allora

-Deviazione standard

-Modelli probabilistici notevoli per variabili aleatorie discrete

Variabili aleatorie di Bernoulli

È una variabile x che associa i valori 0 e 1, rispettivamente a 0, se omega = “insuccesso” e invece il valore 1
è associato all’elemento omega = “successo”

Es: contesto economico

Siamo revisori contabili


Vogliamo verificare la correttezza formale delle fatture ricevute da una certa azienda.

Supponiamo di estrarre casualmente una singola fattura dalla contabilità dell’azienda. Storicamente si sa
che la probabilità che una fattura risulti non corretta, è pari al 10%

X = “una singola fattura è non corretta”

“successo”, quindi corrisponde a una fattura non corretta

Pertanto, x è modellabile come una variabile aleatoria di Bernoulli con probabilità di successo pari a p =
10% = 0,10

Variabili aleatorie binomiali

ES: un secondo revisore decide di estrarre 4 diverse fatture dalla contabilità dell’azienda.

Supponiamo di essere interessati a calcolare la probabilità che su 4 fatture estratte, 3 risultino essere non
corrette, sapendo sempre che la probabilità per ogni singola fattura si essere estratta non corretta, è pari al
10%.

Scenari compatibili con x = 3

Scenario X1 X2 X3 X4 Probabilità
1 1 1 1 0 p*p*p*(1-p)
2 1 1 0 1 P*p*(1-p)*p
3 1 0 1 1 P*(1-p)*p*p
4 0 1 1 1 (1-p)*p*p*p

X = 0, x = 1, x = 2, x = 4
X = “numero di successo in n prove bernoulliane indipendenti tra loro”

Dove

Ad esempio:

n=4

Se x è genericamente un binomiale

Se

Allora E(x) =

Es:

n = 4, p = 1
Supponiamo che ci interessi calcolare la probabilità che sulle 4 fatture estratte, almeno 1 risulti essere non
corretta.

Variabili aleatorie continue

Si dice continua, quando il suo supporto è un insieme

Funzione di densità: una funzione f(x) si dice di densità, se soddisfa questi requisiti:

f(X)

Funzione di ripartizione per una variabile aleatoria continua

Sia x una variabile aleatoria continua con densità f(x)

Si definisce funzione di ripartizione di x

F(x) =

Vale che la f(x) =

Es: si consideri una varabile aleatoria x continua, con funzione di densità


f(x) =

F(x) =

Calcolo delle probabilità

-Variabili aleatorie

Discrete: insieme dei valori che può assumere e finito -> funzione di probabilità p(x)

Continue: insieme dei valori che può assumere e infinito -> funzione di densità f(x)

-Indici di sintesi per una variabile aleatoria continua x

Valore atteso -> E(x) =

Es:
Momenti

k-esimo

centrale k-esimo

Varianza

-Modelli probabilistici per Variabili aleatorio continue

Variabile aleatoria uniforme

Variabile aleatoria normale (o gaussiana)

-Variabile aleatoria uniforme

Una variabile aleatoria continua x si dice uniforme, se la sua funzione di densità è data da

Es: funzione di partizione di una variabile aleatoria uniforme

F(x) =
-Variabile aleatoria normale (o gaussiana)

Una variabile aleatoria continua x si dice normale se la sua funzione di densità è data da

-Funzione di ripartizione per una variabile aleatoria normale

-Operazione di standardizzazione
Per calcolare la probabilità con cui una variabile aleatoria normale assume valori in un
intervallo (a, b), è necessario utilizzare la tavola della funzione di ripartizione di una variabile aleatoria
standard.

Es: IA x = “ammontare che sarà speso da un cliente nel prossimo acquisto” si assuma che x sia una variabile
aleatoria normale con valore atteso

Il valore dell’ammontare speso che non sarà superato con probabilità dell’80%

1)

2)
= (simmetria) =

3)

= (stand.) =

4)
- Normal probability plot: è uno strumento grafico per verificare graficamente se un campione di
osservazioni, si può ritenere essere stato generato da una distribuzione normale.

Caso 1: Se i punti nel grafico si dispongono lungo una retta (andamento lineare),la conclusione è che si
conferma la normalità, cioè i dati sono distribuiti in modo normale.

Caso 2: I dati non sono normali, più in particolare c’è una distribuzione asimmetrica a destra.

-Caso 2-bis: distribuzione non è normale, ma asimmetrica a sinistra.

-Teorema centrale del limite

Siano x1, x2, x3, xn una successione di v.a. indipendenti, tutte con media e varianza .

Allora, indipendentemente dalla distribuzione di probabilità delle variabili aleatorie x1, xn, la somma delle n
variabili aleatorie xi, è distribuita in modo normale con media e varianza al crescere di n.
In altri termini:

-Approssimazione normale della distribuzione binomiale

Es: Supponiamo che in un certo istante, ci sono 250 potenziali clienti collegati al sito di e-commerce di una
certa azienda. Storicamente si sa che la probabilità con cui un visitatore del sito concluda la visita con un
acquisto, è del 30%. Si calcoli la probabilità con cui almeno 80 di essi, concludano la visita con un acquisto.

X = numero di visitatori che concluderanno la visita con un acquisto.

“successo” corrisponde a un visitatore che conclude la visita con un acquisto.

Xi = comportamento o decisione del visitatore i-esimo, i = 1, …, 250

Inoltre, le xi sono tra loro indipendenti


MA si noti che

Vettori aleatorio discreti

-Funzione di probabilità del vettore aleatorio discreto (x, y)

-Nel caso di vettori discreti bidimensionali, è prassi indicare la corrispondente funzione di probabilità,
attraverso una tabella a doppia entrata.

Es: esperimento aleatorio: lancio di 3 monete regolari


X = n totale di teste

Y = n di teste negli ultimi 2 lanci

X/y 0 1 2
0 1/8 / /
1 1/8 ¼ /
2 / 1/4 1/8
3 / / 1/8

La somma di tutte queste probabilità deve fare 1.

-Funzioni di probabilità marginali di un vettore aleatorio discreto.

Vettore aleatorio discreto con funzione di prob. Congiunta p(x, y)

-Funzioni di probabilità condizionate di X dato Y = y

-Funzioni di probabilità condizionate di y dato x

Esempio: continua
-Valore atteso condizionato

Di y dato X = x

Esempio: continua

Modello di regressione lineare

-Variabili aleatorie indipendenti

(X, Y) e un vettore aleatorio bidimensionale discreto

Le sue componenti x e y si dicono indipendenti, se

Ne consegue che se x e y sono indipendenti

-(x, y, z, w) queste v.a. si dicono mutuamente i

-Covarianza: sia (x, y) un vettore aleatorio bidimensionale discreto con funzione di probabilità congiunta
p(x, y)La covarianza tra le due componenti Xe y, è definita come
Es: (continua)

X/y 0 1 2
0 1/8
1 1/8
2 /
3 /

-Indice di correlazione lineare tra le componenti di un vettore aleatorio

Esempio: (continua)
Se x e y sono indipendenti, ne consegue

-Ci interesserà calcolare il valore e la varianza di particolari trasformazioni di v.a. x e y. In particolare, ci


interesseranno le seguenti trasformazioni:

-z = x + y

Attenzione: la varianza di una somma di 2 v.a. è uguale la somma delle varianze solo se le due variabili
aleatorie sono non correlate (o indipendenti)

-z = x - y

-Vettori aleatori continui

(x, y) si dice vettore aleatorio continuo bidimensionale, se le sue componenti x e y, sono entrambe variabili
aleatorio continue.

Si dice funzione di densità del vettore aleatorio x di y, la funzione f(x, y) tale che
-Funzioni di densità marginali di X e di y

-Funzioni di densità condizionate di y dato x e di X dato y

-(x, y) sono indipendenti se è solo se f(x, y) = fx(x) fy(y),

-Valgono le stesse identiche proprietà di valore atteso e varianza di una combinazione lineare di variabili
aleatorie
Capitolo 3: statistica inferenziale
Popolazione Vs campione

Parametro Vs statistica

-Distribuzione campionaria di una statistica campionaria qualsiasi

La distribuzione campionaria è la distribuzione di probabilità di tutti i possibili valori che la statistica può
assumere al variare del campione estratto dalla popolazione.

Es: popolazione -> imprese che appartengono a un certo settore industriale

N = 4 aziende, i cui fatturati sono pari a

Azienda Fatturato (milioni)


1 1
2 2
3 2.5
4 3.5

Vogliamo stimare la media del fatturato per l’intero settore industriale:

estraiamo un campione casuale semplice (senza re-immissione) di dimensione n = 2

Dobbiamo proporre una statistica campionaria per stimare

Campioni
{1, 2} 1.5
{1, 2.5} 1.75
{1, 3.5} 2.25
{2, 2.5} 2.25
{2, 3.5} 2.75
{2.5, 3.5} 3

Probabilità
1.5 1/6
1.75 1/6
2.25 2/6
2.75 1/6
3 1/6
Distribuzione campionaria della media campionaria

-Popolazione -> X

-Obiettivo: stimare la media non nota della popolazione

-Si estrae un campione casuale semplice, di dimensione n, che indichiamo come X1, X2, …, Xn

Queste n variabili aleatorie sono distribuite come la popolazione, in particolare

Tra loro indipendenti

X1, X2, Xn, sono I.I.D (indipendenti e identicamente distribuite)

-Per stimare si decide di utilizzare

-La distribuzione campionaria di nella situazione sopra descritta possiede le seguenti proprietà:

1) (non-distorsione)

2)
Ne consegue che

Deviazione standard di

Errore standard di

3) Supponendo di conoscere la dimensione N della popolazione e supponendo che il campione sia “grande”
rispetto alla popolazione -> non è più ragionevole ipotizzare che le osservazioni sono tra loro indipendenti.

In questo contesto la varianza di va modificata come segue: <- fattore di

(cioè almeno il 5% della popolazione)

4) Se la distribuzione F della popolazione è normale, ovvero

5) Se la distribuzione F della popolazione non è normale e se ,

Distribuzione campionaria della proporzione campionaria

-Popolazione ->

-Obiettivo -> voglio stimare il valore del parametro P

-Si estrae un campione casuale semplice X1, X2, …, Xn dalla popolazione


-Per stimare P, si decide di usare la statistica campionaria “Proporzione campionaria”, definita come segue:

-La distribuzione campionaria di possiede le seguenti proprietà

1) (non-distorsione)

2)

3) Se n ≥ 0.05

4) Se np(1-p) > 9 -> Teorema centrale del limite

Distribuzione campionaria della varianza campionaria S 2

-Popolazione ->

-Obiettivo -> vogliamo stimare la varianza della popolazione

-Si estrae un campione casuale semplice X1, X2, …, Xn, tale che

-Per stimare si decide di usare la varianza campionaria


-La distribuzione campionaria di possiede le seguenti proprietà:

1) (non-distorsione)

Varianza campionaria

Statistica inferenziale

Stima Puntuale

Per intervalli

Prova delle ipotesi

Stima puntuale

-Uno stimatore puntuale del parametro di una popolazione, è una funzione delle osservazioni
campionarie e, in quanto tale, è una variabile aleatoria

T = T(X1, X2, …, Xn)

Una sua stima puntuale corrisponde al particolare valore che lo stimatore assume in corrispondenza del
campione osservato x1, x2, …, xn:

t = t(x1, x2, …, xn)

Esempi: Parametro Stimatore

Criteri per valutare la bontà di diversi stimatori alternativi

1)Criterio della non-distorsione:

Sia T uno stimatore (puntuale) per il parametro

T si dice non distorto per se

E(T) =

Esempi: è non distorto per

È non distorto per p

È non distorto per

Per distorsione di uno stimatore, si intende la quantità D(T) = E(T) -

Esempio di stimatore distorto:


Per cui è distorto per , la cui distorsione è pari a:

 Gli stimatori con distorsione che va a zero al crescere di n, si dicono asintoticamente non-distorti

2)Siano T1 e T2, due stimatori puntuali per il parametro entrambi non-distorti

Si dice più efficiente lo stimatore con la varianza più bassa.

Si dice inoltre efficienza relativa di T1 rispetto a T2, il rapporto delle loro varianze.

T1 è più efficiente di T2

Stima per intervalli


-Uno stimatore per intervalli di un parametro di una certa popolazione, è una coppia di variabili aleatorie
(A, B), entrambe funzioni delle osservazioni campionarie (ovvero, A = A(X1, X2, …, Xn) e B = B(X1, X2, …, Xn))
tali per cui

Viene detto livello di confidenza dell’intervallo.

Una stima per intervalli, corrisponde alla coppia di numeri (a, b) ottenute in corrispondenza del particolare
campione che è stato osservato (x1, x2, …, xn), ovvero

a = a(x1, x2, …, xn)

b = b(x1, x2, …, xn)

Una stima per intervalli viene comunemente detta intervallo di confidenza di livello per il
parametro

Interpretazione frequentista del livello di confidenza di uno stimatore per intervalli

Popolazione -> parametro

-Decidiamo di stimare utilizzando uno stimatore per intervalli di livello

-Supponiamo di estrarre un numero elevato di campioni casuali di dimensione n e per ognuno di essi di
calcolare la corrispondente stima per intervalli di

-Allora, il livello di confidenza si può interpretare come la quota di tali stime per intervalli che
contiene il vero valore (non noto) di

Valori comuni di

-0.95 (95%)

-0.99 (99%)

-0.90 (90%)

-Altri valori

Caso A: intervallo di confidenza di livello per la media (non nota) di una popolazione
normale con varianza nota

-Popolazione ->

-Obiettivo -> stimare la media della popolazione


-Campione casuale semplice di dimensione n -> x1, x2, …, xn

-Si propone di utilizzare lo stimatore

-Sappiamo che

Pertanto, in corrispondenza dello specifico campione (x1, x2, …, xn) si ottiene l’intervallo di confidenza di
livello per , media non nota di una popolazione normale con varianza nota, ovvero

La struttura di questo intervallo è del tipo

(stima puntuale margine di errore)


Margine di errore -> ME =

Fattori che influiscono sul margine di errore

1) N -> (-)
2) -> (+)
3) -> (+)

Ampiezza/lunghezza intervallo di confidenza

w=

Es: vogliamo decidere se investire i nostri soldi in un determinato settore industriale in particolare,
decideremo di investire se i profitti medi del settore risulteranno essere superiori a 2M euro. Si assume che
i profitti nel settore sono distribuiti in modo normale con varianza nota pari a =

Per stimare si decide di calcolare un intervallo di confidenza di livello 95% sulla base del seguente
campione casuale di aziende.

Azienda Profitti (M euro)


1 3
2 1
3 -2
4 0
5 10
6 5
7 8
8 -1
9 -5
10 6

CASO A

n = 10
CASO B: intervallo di confidenza di livello per la media (non nota) di una popolazione
normale con varianza non nota

-Popolazione ->

-Obiettivo -> Stimare

-Campione casuale semplice -> (x1, x2, ., xn)

-Utilizziamo come stimatore di

-Sappiamo che

Distribuzione t di Student
-Quando il numero di gradi di libertà (G.L.), tende a infinito la curva di densità della t di student diventa
indistinguibile da quella di una normale standard.

-La distribuzione di t di student ha la sua tavola

Pertanto, l’intervallo di confidenza di livello per di una popolazione normale con varianza
non nota è dato da

Ovvero
Fattori che influiscono sul margine di errore

1)

2)

3)

Esempio: (continua)

Ora assumiamo di non conoscere il valore di (varianza della popolazione)

CASO B

CASO C: Intervallo di confidenza (approx.) di livello per la media non nota di una popolazione
qualsiasi con varianza non nota (campione grande -> n ≥ 25).
CASO D: Intervallo di confidenza di livello (approssimativamente) per la probabilità di successo
p di una popolazione bernoulliana (campione grande -> )

-Popolazione ->

-Obiettivo -> stimare p

-Estrazione campione casuale semplice dalla popolazione

-Come stimatore di p, si propone la proporzione campionaria

-Se np(1 – p) > 9, sappiamo che

(Teorema centrale del limite)

Esempio: siamo interessati a stimare la quota di individui in una popolazione che utilizza il bancomat per la
maggior parte dei suoi pagamenti. A questo proposito si estrae un campione casuale semplice di n = 300
individui dalla popolazione, dei quali 180 hanno risposto di utilizzare principalmente il bancomat. Si calcoli
l’intervallo di confidenza al 90% per la quota sopra descritta.

n = 300

I.C. di livello (approx.) 90% per la quota di individui che utilizzano principalmente il bancomat come
strumento di pagamento.
NON NEL SECONDO PARZIALE

Determinazione dell’ampiezza campionaria n

CASO A: I.C. di livello per , popolazione normale, nota

Supponiamo di voler estrarre un campione di dimensione n* tale per cui la precisione della stima che si
otterrà sia pari a ME*

Esempio: (continua)

Qual è la dimensione del campione che ci consente di raggiungere tale valore del margine di errore?

CASO D: RELATIVO A I.C. di livello (approssimativamente) per p, di una popolazione


bernoulliana.

ME =

ME* =

In questo caso, si può utilizzare un approccio “conservativo” (worst case scenario)


Esempio: (continua)

Qual è la dimensione del campione n* che consente di ottenere una precisione nella stima di p pari a

Potrebbero piacerti anche