Statistica Modulo 2 Prof Venturini Unicatt Cremona

Calcolo probabilità
È una branca molto ampia della matematica, ed è anche quella che ha avuto un successo maggiore,
essendo impiegata in tutti i campi del sapere umano.
Le probabilità hanno a che fare con eventi che devono ancora accadere, a differenza delle frequenze.
La probabilità ha diverse Definizioni.
L’oggetto elementare della probabilità è l’esperimento aleatorio, che è una procedura che può dare origine
a uno degli esiti possibili, ma prima dell’esperimento, non è possibile prevedere quali di questi eventi si
verificherà.
Es: lancio di una moneta, di un dado, esito di una partita di calcio, esito di un esame, performance di un
investimento finanziario (non so quanto produrrà).
Si chiamano eventi elementari, gli esiti che un esperimento aleatorio può produrre.
L’insieme di tutti gli eventi elementari, si chiama spazio campionario o spazio degli eventi elementari.
Eventi: è un sottoinsieme degli eventi elementari, che appartengono allo spazio campionario.
Qual è la probabilità che si verifichi un evento, che abbia determinate caratteristiche?
Es: (continua)
A = “Si è verificato almeno una desta, nel lancio delle due monete”
Interpretazione classica delle probabilità
Si dice che un evento A, si è verificato, se l’esperimento aleatorio ha prodotto uno degli esiti elementari,
contenuti in A.
Altri due eventi speciali:
-Evento impossibile: il fatto che si verifichi un evento che in realtà non contiene nessun evento elementare,
e quindi non si potrà mai verificare.
- Evento certo: evento a cui corrispondono tutti gli eventi elementari.
Algebra degli eventi:
-Eventi complementari
Dato un evento A, si dice evento complementare di A, e si indica con l’evento che si verifica
quando A non è verificato contiene quindi tutti gli eventi elementari non contenuti in A
-Evento intersezione: dati due eventi A e B, dello spazio campionario, l’evento intersezione corrisponde
all’evento che risulta vero, quando entrambi gli eventi A e B, sono entrambi veri.
Contiene gli eventi elementari che appartengo o contemporaneamente sia ad A, sia a B.
-Due eventi A e B, si dicono disgiunti o incompatibili, se l’evento intersezione è impossibile o vuoto.
Gli eventi, si dicono mutuamente esclusivi, se la loro intersezione a coppie, sono tutte vuote, ovvero se Ei
-Evento unione: siano A e B due eventi dello spazio campionario, l’evento unione che si indica con
Si verifica quando almeno uno dei due eventi si è verificato.
Contiene tutti gli eventi elementari contenuti in A, oppure in B.
Es : esperimento aleatorio: lancio di un dado a 6 facce
A = si verifica un risultato pari
B = si verifica un risultato maggiore e uguale a 4”
Si dice che gli eventi E1, E2, Ek, si dicono collettivamente esaustivi, se la loro unione corrisponde all’intero
spazio campionario.
-Se gli eventi sono mutuamente esclusivi e collettivamente esaustivi, si dice che formano una partizione di
omega grande.
Es:
Siano A e B due eventi qualsiasi: a cosa corrispondono gli eventi:
E cosa si può dire circa la loro intersezione ed unione?
Questi eventi sono tra loro disgiunti.
2)Siano A e B due eventi. Si valuti a cosa corrispondono gli eventi
-Interpretazioni del concetto di probabilità.
1)Interpretazione classica: la probabilità di un evento A, è definita come rapporto tra numero di esiti
favorevoli all’evento A e numero di casi di esiti possibili (ugualmente probabili)
2)Interpretazione frequentista: la probabilità di un evento A, è definita come limite della frequenza relativa
con cui l’evento si verifica, ripetendo l’esperimento un numero infinito di volte.
3)Interpretazione soggettiva: definisce la probabilità di un evento A, come il prezzo che si è disposti a

pagare, per entrare in una scommessa che restituisce 1 euro, se l’evento A si verifica, e 0, se non si verifica.
4)Definizione assiomatica: sia lo spazio campionario di un esperimento aleatorio. Si dice probabilita,

una qualsiasi funzione P(.), definita per una classe di eventi che soddisfa le seguenti 3 proprietà:
1) Se A e un evento dello spazio, allora
2)
3) Assioma dell’additivita completa: Siano A1, A2, … una successione infinita di eventi, che sono tra
loro mutuamente esclusivi, allora, deve valere che la probabilità tra l’unione di questi eventi, corrisponda
alla somma delle probabilità degli eventi.
Regole di base per calcolare le probabilità.
1)Sia A un evento con probabilità P(A), allora la probabilità dell’evento complementare ad A, sarà: 1 – P(A)
2)Regole complementare della somma: siano A e B due eventi qualsiasi, con probabilità rispettivamente
P(A) e P(B), allora la probabilità della loro unione è uguale alla probabilità dell’evento + la probabilità
dell’evento B – la probabilità dell’intersezione tra A e B.
Es: esperimento aleatorio: lancio dado a 6 facce
A = “Risultato pari”
B = “Risultato maggiore di A
-Probabilità condizionata (probabilità che si verifichi un evento, condizionatamente al fatto che se ne sia
verificato un secondo)
Siano A e B due eventi ed è necessario che A, abbia una probabilità positiva di verificarsi (> 0): si definisce
probabilità condizionata di B dato A, la seguente espressione: P(B|A)
Es: esperimento aleatorio: estrazione di due carte (senza reimmissione) da un mazzo di carte napoletane
(40 carte).
Vogliamo calcolare la probabilità che la seconda carta estratta sia una carta di spade, sapendo che anche la
prima carta estratta era di spade.
A = “due carte estratte, la prima carta estratta è di spade”

B = “due carte estratte, la seconda carta è di spade”
Ci interessa quindi calcolare la probabilità condizionata P(B|A) (vogliamo calcolare la probabilità di estrarre
una seconda carta di spade, dopo aver estratto la prima di spade).
P(A) =
-Regola delle probabilità composte: è una regola che ci permette di calcolare la probabilità dell’intersezione
di due eventi, assumendo di conoscere la probabilità condizionata di un evento, dato un altro.
-Teorema delle probabilità totali: siano A1, A2, …, An, eventi tali che:
- (mutamenti esclusivi)
- (Collettivamente esaustivi)
- , i = 1, …, n
Allora per un qualsiasi evento B, vale che la probabilità che si verifichi B, e uguale alla:
Es: la forza lavoro in un certo paese ripartita in 5 zone: A1, A2, A3, A4, A5
Nelle percentuali rispettivamente di : 10%, 22%, 19%, 30%, 19%
I tassi di disoccupazione delle diverse regioni sono: 5%, 2%, 3%, 1%, 8%
Estraiamo a caso un lavoratore da questa nazione. Qual è la probabilità che sia un disoccupato?
Siano:
Ai = lavoratore estratto appartiene alla regione i-esima, i = 1, …, 5
Bi = Il lavoratore è disoccupato
Teorema probabilità totali
Presi n eventi A1, A2, … An, che soddisfano le seguenti proprietà:
1)L’intersezione di ogni coppia di questi eventi, e uguale all’insieme vuoto, sono mutuamente esclusivi
2) L’unione di tutti questi eventi sia uguale a tutto l’insieme (collettivamente esaustivi)
3) La probabilità che si verifichi ognuno degli eventi sia positiva
E preso un evento B qualsiasi, vale che la probabilità che si verifichi l’evento B, era uguale alla sommatoria
delle probabilità condizionate di B dato A, moltiplicato per la probabilità di A
Teorema di Bayes, teorema delle probabilità inverse
Ci permette di calcolare la probabilità di A, dato B.
Siano A1, A2, … An, n eventi tali che:
1)L’intersezione a coppie e vuota
2)L’unione di tutti gli eventi e lo spazio campionario
3)Probabilita che si verifica evento A, positiva
Si consideri quindi un altro evento B con probabilità positiva
Allora il teorema dice che la probabilità che si verifica A, dato B, lo possiamo calcolare cosi
Es:
Un azienda produce ii suoi prodotti in 3 diversi stabilimenti, nelle percentuali:
50% produzione primo stabilimento
10% secondo stabilimento
40% terzo stabilimento
Storicamente, le proporzioni di pezzi difettosi prodotti da ogni stabilimento, sono pari a 1%, 5%, 2%.
Si estrae a caso un pezzo dall’intera produzione dell’azienda e si osserva che esso è difettoso. Quali sono le
probabilità che quel pezzo arrivi da un certo stabilimento?
Siano A1, A2, A3, e B i seguenti eventi:
A1 = il pezzo estratto arrivo dallo stabilimento i-esimo
B = pezzo estratto difettoso
P(A1) = 0.50,
P(A2) = 0.10
P(A3) = 0.40
Per il teorema delle probabilità totali
P(B) =
La somma di queste probabilità deve fare 1
Esercizio: usando i dati relativi all’esempio per il teorema delle probabilità totali, si calcoli no le probabilità
che, sapendo che il lavoratore è disoccupato, appartenga a una certa regione.
Indipendenza statistica tra due eventi (o stocastica)
Si considerino due eventi A e B, Supponiamo che il fatto che si sia verificato uno dei due, non ci fornisce
informazioni utili per calcolare la probabilità che si verifichi l’altro, ovvero
PIÙ FORMALMENTE, due eventi A e B s dicono statisticamente indipendenti, se è solo se vale la seguente
condizione:
L’intersezione deve essere uguale al prodotto delle due probabilità di A e B.
A titolo di verifica, se A e B sono indipendenti, si ottiene infatti (per la regola delle probabilità composte):
Non si con fondano i concetti di indipendenza di due eventi con quelli di incompatibilità. A e B sono
incompatibili se la loro intersezione è vuota.
A e B si dicono incompatibili se
A e B si dicono indipendenti se è solo se
Es: spazio campionario omega qualsiasi
Notiamo che:
Sono incompatibili
Ne consegue che la probabilità che succedano insieme, allora
2)
Pertanto, è sono incompatibili, ma non sono indipendenti , poiché la probabilità che succedano
insieme, non è vero che è uguale, è diversa dal prodotto delle due probabilita
Variabili aleatorie:
Nella pratica, interessa spesso valutare le conseguenze di un esperimento aleatorio.
Una variabile aleatoria è una funzione che associa ad ogni evento elementare che appartiene allo spazio
campionario, un numero reale, ovvero X :
Esempio: Supponiamo di lanciare due dadi a 6 facce
Spazio campionario:
Gli eventi elementari si possono considerare equiprobabili con probabilità P({(i, j)}) =
Si consideri quindi la variabile aleatoria, X = “somma dei punteggi”, ovvero X((i, j)) = i + j, con (i, j)
Le variabili aleatorio si indicheranno sempre con lettere maiuscole (X, Y, Z, W, …), mentre i singoli valori che
questa può assumere si indicheranno con le lettere minuscole (x, y, z, w, ..)
La distribuzione di probabilità, di una variabile aleatoria x, e la probabilità che si osservino valori specifici di
x, calcolata utilizzando la probabilità definita su un insieme omega di partenza.
In particolare, sia B contenuto in R, la probabilità con cui x appartiene a b è quindi definita come
Px(B) = P
Le variabili aleatorio si distinguono in variabili discrete e variabili continue
Discrete: quando l’insieme dei valori che può assumere è finito o infinito numerabile.
Continue: quando l’insieme dei valori che può assumere è infinito non numerabile (tipicamente, un
sottoinsieme dei numeri reali).
Variabili aleatorie discrete
Si dicono funzioni di probabilità di una variabile aleatoria discreta x,
Esempio (continua)
X = I + j => si tratta di una v.a. Discreta poichè Rx = {2, 3, …, 11, 12} è un insieme finito
La corrispondente probabilità e
Funzione di ripartizione di una v.a. discreta x, corrisponde a una probabilità di osservare valori della
variabile che sono minori o al più uguali, ad un valore fissato, ovvero
La funzione di ripartizione serve per calcolare le probabilità con cui la v.a. assume valori in un certo
intervallo, ovvero:
Proprietà della funzione di ripartizione di una v.a. x
F(x) è non decrescente
F(x) e “a gradini” con salti corrispondenti a p(xi), xi appartiene a Rx
Esempio:
Esperimento aleatorio: lancio di 4 monete regolari
Spazio campionario: {(T, T, T, T), (T, T, T, C), …..(C, C, C, C)}, con = 2 per 2 per 2 per 2 = 16
E ragionevole ipotizzare che gli eventi elementari siano equiprobabili con P({ }} = 16
Si consideri la v.a. x = “numero di test”
Il supporto di x, Rx, è uguale al l’insieme {0, 1, 2, 3, 4}, quindi x e discreta, perché contiene un numero finito
di elementi.
Funzione di probabilità =
La funzione di ripartizione sarà:
Variabile aleatoria
Esperimento aleatorio
Variabile aleatoria -> funzione

Distribuzione di probabilità della variabile aleatoria x
Variabili aleatorie:
Discrete -> x ha supporto finito o infinito numerabile
Continue -> x ha supporto infinito non numerabile (ovvero un sotto-insieme di )
Variabili aleatorie discrete
-Funzione di probabilità -> p(x)
P(xi) ≥ 0
-Funzione di ripartizione
-Valori di sintesi per una variabile aleatoria discreta x
Valore atteso:
Es: continua
Esperimento aleatorio -> lancio di 4 monete
X = numero di teste -> Rx = {0, 1, 2, 3, 4}
-Fz di probabilità
-Proprietà del valore atteso
Il valore atteso è un operatore lineare, ovvero sia x una variabile aleatoria discreta con valore atteso
E(x). Si considerino 2 costanti a e b che definiscono la seguente trasformazione lineare
Allora il valore atteso di Y è dato da
-Momento k-esimo :
Chiaramente, il momento primo , corrisponde al valore atteso di X.
-Momento centrale k-esimo
-Varianza
Quindi la varianza corrisponde al momento centrale secondo
Es: (continua)
-Proprietà della varianza
La varianza non è un operatore lineare poiché se allora
-Deviazione standard
-Modelli probabilistici notevoli per variabili aleatorie discrete
Variabili aleatorie di Bernoulli
È una variabile x che associa i valori 0 e 1, rispettivamente a 0, se omega = “insuccesso” e invece il valore 1
è associato all’elemento omega = “successo”
Es: contesto economico
Siamo revisori contabili

Vogliamo verificare la correttezza formale delle fatture ricevute da una certa azienda.
Supponiamo di estrarre casualmente una singola fattura dalla contabilità dell’azienda. Storicamente si sa
che la probabilità che una fattura risulti non corretta, è pari al 10%
X = “una singola fattura è non corretta”
“successo”, quindi corrisponde a una fattura non corretta
Pertanto, x è modellabile come una variabile aleatoria di Bernoulli con probabilità di successo pari a p =
10% = 0,10
Variabili aleatorie binomiali
ES: un secondo revisore decide di estrarre 4 diverse fatture dalla contabilità dell’azienda.
Supponiamo di essere interessati a calcolare la probabilità che su 4 fatture estratte, 3 risultino essere non
corrette, sapendo sempre che la probabilità per ogni singola fattura si essere estratta non corretta, è pari al
10%.
Scenari compatibili con x = 3
Scenario X1 X2 X3 X4 Probabilità
1 1 1 1 0 p*p*p*(1-p)
2 1 1 0 1 P*p*(1-p)*p
3 1 0 1 1 P*(1-p)*p*p
4 0 1 1 1 (1-p)*p*p*p
X = 0, x = 1, x = 2, x = 4
X = “numero di successo in n prove bernoulliane indipendenti tra loro”
Dove
Ad esempio:
n=4
Se x è genericamente un binomiale
Se
Allora E(x) =
Es:
n = 4, p = 1
Supponiamo che ci interessi calcolare la probabilità che sulle 4 fatture estratte, almeno 1 risulti essere non
corretta.
Variabili aleatorie continue
Si dice continua, quando il suo supporto è un insieme
Funzione di densità: una funzione f(x) si dice di densità, se soddisfa questi requisiti:
f(X)
Funzione di ripartizione per una variabile aleatoria continua
Sia x una variabile aleatoria continua con densità f(x)
Si definisce funzione di ripartizione di x
F(x) =
Vale che la f(x) =
Es: si consideri una varabile aleatoria x continua, con funzione di densità

f(x) =
F(x) =
Calcolo delle probabilità
-Variabili aleatorie
Discrete: insieme dei valori che può assumere e finito -> funzione di probabilità p(x)
Continue: insieme dei valori che può assumere e infinito -> funzione di densità f(x)
-Indici di sintesi per una variabile aleatoria continua x
Valore atteso -> E(x) =
Es:
Momenti
k-esimo
centrale k-esimo
Varianza
-Modelli probabilistici per Variabili aleatorio continue
Variabile aleatoria uniforme
Variabile aleatoria normale (o gaussiana)
-Variabile aleatoria uniforme
Una variabile aleatoria continua x si dice uniforme, se la sua funzione di densità è data da
Es: funzione di partizione di una variabile aleatoria uniforme
F(x) =
-Variabile aleatoria normale (o gaussiana)
Una variabile aleatoria continua x si dice normale se la sua funzione di densità è data da
-Funzione di ripartizione per una variabile aleatoria normale
-Operazione di standardizzazione
Per calcolare la probabilità con cui una variabile aleatoria normale assume valori in un
intervallo (a, b), è necessario utilizzare la tavola della funzione di ripartizione di una variabile aleatoria
standard.
Es: IA x = “ammontare che sarà speso da un cliente nel prossimo acquisto” si assuma che x sia una variabile
aleatoria normale con valore atteso
Il valore dell’ammontare speso che non sarà superato con probabilità dell’80%
1)
2)
= (simmetria) =
3)
= (stand.) =
4)
- Normal probability plot: è uno strumento grafico per verificare graficamente se un campione di
osservazioni, si può ritenere essere stato generato da una distribuzione normale.
Caso 1: Se i punti nel grafico si dispongono lungo una retta (andamento lineare),la conclusione è che si
conferma la normalità, cioè i dati sono distribuiti in modo normale.
Caso 2: I dati non sono normali, più in particolare c’è una distribuzione asimmetrica a destra.
-Caso 2-bis: distribuzione non è normale, ma asimmetrica a sinistra.
-Teorema centrale del limite
Siano x1, x2, x3, xn una successione di v.a. indipendenti, tutte con media e varianza .
Allora, indipendentemente dalla distribuzione di probabilità delle variabili aleatorie x1, xn, la somma delle n
variabili aleatorie xi, è distribuita in modo normale con media e varianza al crescere di n.
In altri termini:
-Approssimazione normale della distribuzione binomiale
Es: Supponiamo che in un certo istante, ci sono 250 potenziali clienti collegati al sito di e-commerce di una
certa azienda. Storicamente si sa che la probabilità con cui un visitatore del sito concluda la visita con un
acquisto, è del 30%. Si calcoli la probabilità con cui almeno 80 di essi, concludano la visita con un acquisto.
X = numero di visitatori che concluderanno la visita con un acquisto.
“successo” corrisponde a un visitatore che conclude la visita con un acquisto.
Xi = comportamento o decisione del visitatore i-esimo, i = 1, …, 250
Inoltre, le xi sono tra loro indipendenti

MA si noti che
Vettori aleatorio discreti
-Funzione di probabilità del vettore aleatorio discreto (x, y)
-Nel caso di vettori discreti bidimensionali, è prassi indicare la corrispondente funzione di probabilità,
attraverso una tabella a doppia entrata.
Es: esperimento aleatorio: lancio di 3 monete regolari

X = n totale di teste
Y = n di teste negli ultimi 2 lanci
X/y 0 1 2
0 1/8 / /
1 1/8 ¼ /
2 / 1/4 1/8
3 / / 1/8
La somma di tutte queste probabilità deve fare 1.
-Funzioni di probabilità marginali di un vettore aleatorio discreto.
Vettore aleatorio discreto con funzione di prob. Congiunta p(x, y)
-Funzioni di probabilità condizionate di X dato Y = y
-Funzioni di probabilità condizionate di y dato x
Esempio: continua
-Valore atteso condizionato
Di y dato X = x
Esempio: continua
Modello di regressione lineare
-Variabili aleatorie indipendenti
(X, Y) e un vettore aleatorio bidimensionale discreto
Le sue componenti x e y si dicono indipendenti, se
Ne consegue che se x e y sono indipendenti
-(x, y, z, w) queste v.a. si dicono mutuamente i
-Covarianza: sia (x, y) un vettore aleatorio bidimensionale discreto con funzione di probabilità congiunta
p(x, y)La covarianza tra le due componenti Xe y, è definita come
Es: (continua)
X/y 0 1 2
0 1/8
1 1/8
2 /
3 /
-Indice di correlazione lineare tra le componenti di un vettore aleatorio
Esempio: (continua)
Se x e y sono indipendenti, ne consegue
-Ci interesserà calcolare il valore e la varianza di particolari trasformazioni di v.a. x e y. In particolare, ci

interesseranno le seguenti trasformazioni:
-z = x + y
Attenzione: la varianza di una somma di 2 v.a. è uguale la somma delle varianze solo se le due variabili
aleatorie sono non correlate (o indipendenti)
-z = x - y
-Vettori aleatori continui
(x, y) si dice vettore aleatorio continuo bidimensionale, se le sue componenti x e y, sono entrambe variabili
aleatorio continue.
Si dice funzione di densità del vettore aleatorio x di y, la funzione f(x, y) tale che
-Funzioni di densità marginali di X e di y
-Funzioni di densità condizionate di y dato x e di X dato y
-(x, y) sono indipendenti se è solo se f(x, y) = fx(x) fy(y),
-Valgono le stesse identiche proprietà di valore atteso e varianza di una combinazione lineare di variabili
aleatorie
Capitolo 3: statistica inferenziale
Popolazione Vs campione
Parametro Vs statistica
-Distribuzione campionaria di una statistica campionaria qualsiasi
La distribuzione campionaria è la distribuzione di probabilità di tutti i possibili valori che la statistica può
assumere al variare del campione estratto dalla popolazione.
Es: popolazione -> imprese che appartengono a un certo settore industriale
N = 4 aziende, i cui fatturati sono pari a
Azienda Fatturato (milioni)

1 1
2 2
3 2.5
4 3.5
Vogliamo stimare la media del fatturato per l’intero settore industriale:
estraiamo un campione casuale semplice (senza re-immissione) di dimensione n = 2
Dobbiamo proporre una statistica campionaria per stimare
Campioni
{1, 2} 1.5
{1, 2.5} 1.75
{1, 3.5} 2.25
{2, 2.5} 2.25
{2, 3.5} 2.75
{2.5, 3.5} 3
Probabilità
1.5 1/6
1.75 1/6
2.25 2/6
2.75 1/6
3 1/6
Distribuzione campionaria della media campionaria
-Popolazione -> X
-Obiettivo: stimare la media non nota della popolazione
-Si estrae un campione casuale semplice, di dimensione n, che indichiamo come X1, X2, …, Xn
Queste n variabili aleatorie sono distribuite come la popolazione, in particolare
Tra loro indipendenti
X1, X2, Xn, sono I.I.D (indipendenti e identicamente distribuite)
-Per stimare si decide di utilizzare
-La distribuzione campionaria di nella situazione sopra descritta possiede le seguenti proprietà:
1) (non-distorsione)
2)
Ne consegue che
Deviazione standard di
Errore standard di
3) Supponendo di conoscere la dimensione N della popolazione e supponendo che il campione sia “grande”
rispetto alla popolazione -> non è più ragionevole ipotizzare che le osservazioni sono tra loro indipendenti.
In questo contesto la varianza di va modificata come segue: <- fattore di
(cioè almeno il 5% della popolazione)
4) Se la distribuzione F della popolazione è normale, ovvero
5) Se la distribuzione F della popolazione non è normale e se ,
Distribuzione campionaria della proporzione campionaria
-Popolazione ->
-Obiettivo -> voglio stimare il valore del parametro P
-Si estrae un campione casuale semplice X1, X2, …, Xn dalla popolazione

-Per stimare P, si decide di usare la statistica campionaria “Proporzione campionaria”, definita come segue:
-La distribuzione campionaria di possiede le seguenti proprietà
2)
3) Se n ≥ 0.05
4) Se np(1-p) > 9 -> Teorema centrale del limite
Distribuzione campionaria della varianza campionaria S 2
-Popolazione ->
-Obiettivo -> vogliamo stimare la varianza della popolazione
-Si estrae un campione casuale semplice X1, X2, …, Xn, tale che
-Per stimare si decide di usare la varianza campionaria

-La distribuzione campionaria di possiede le seguenti proprietà:
Varianza campionaria
Statistica inferenziale
Stima Puntuale
Per intervalli
Prova delle ipotesi
Stima puntuale
-Uno stimatore puntuale del parametro di una popolazione, è una funzione delle osservazioni
campionarie e, in quanto tale, è una variabile aleatoria
T = T(X1, X2, …, Xn)
Una sua stima puntuale corrisponde al particolare valore che lo stimatore assume in corrispondenza del
campione osservato x1, x2, …, xn:
t = t(x1, x2, …, xn)
Esempi: Parametro Stimatore
Criteri per valutare la bontà di diversi stimatori alternativi
1)Criterio della non-distorsione:
Sia T uno stimatore (puntuale) per il parametro
T si dice non distorto per se
E(T) =
Esempi: è non distorto per
È non distorto per p
È non distorto per
Per distorsione di uno stimatore, si intende la quantità D(T) = E(T) -
Esempio di stimatore distorto:

Per cui è distorto per , la cui distorsione è pari a:
 Gli stimatori con distorsione che va a zero al crescere di n, si dicono asintoticamente non-distorti
2)Siano T1 e T2, due stimatori puntuali per il parametro entrambi non-distorti
Si dice più efficiente lo stimatore con la varianza più bassa.
Si dice inoltre efficienza relativa di T1 rispetto a T2, il rapporto delle loro varianze.
T1 è più efficiente di T2
Stima per intervalli

-Uno stimatore per intervalli di un parametro di una certa popolazione, è una coppia di variabili aleatorie
(A, B), entrambe funzioni delle osservazioni campionarie (ovvero, A = A(X1, X2, …, Xn) e B = B(X1, X2, …, Xn))
tali per cui
Viene detto livello di confidenza dell’intervallo.
Una stima per intervalli, corrisponde alla coppia di numeri (a, b) ottenute in corrispondenza del particolare
campione che è stato osservato (x1, x2, …, xn), ovvero
a = a(x1, x2, …, xn)
b = b(x1, x2, …, xn)
Una stima per intervalli viene comunemente detta intervallo di confidenza di livello per il
parametro
Interpretazione frequentista del livello di confidenza di uno stimatore per intervalli
Popolazione -> parametro
-Decidiamo di stimare utilizzando uno stimatore per intervalli di livello
-Supponiamo di estrarre un numero elevato di campioni casuali di dimensione n e per ognuno di essi di
calcolare la corrispondente stima per intervalli di
-Allora, il livello di confidenza si può interpretare come la quota di tali stime per intervalli che
contiene il vero valore (non noto) di
Valori comuni di
-0.95 (95%)
-0.99 (99%)
-0.90 (90%)
-Altri valori
Caso A: intervallo di confidenza di livello per la media (non nota) di una popolazione
normale con varianza nota
-Popolazione ->
-Obiettivo -> stimare la media della popolazione

-Campione casuale semplice di dimensione n -> x1, x2, …, xn
-Si propone di utilizzare lo stimatore
-Sappiamo che
Pertanto, in corrispondenza dello specifico campione (x1, x2, …, xn) si ottiene l’intervallo di confidenza di
livello per , media non nota di una popolazione normale con varianza nota, ovvero
La struttura di questo intervallo è del tipo
(stima puntuale margine di errore)

Margine di errore -> ME =
Fattori che influiscono sul margine di errore
1) N -> (-)
2) -> (+)
3) -> (+)
Ampiezza/lunghezza intervallo di confidenza
w=
Es: vogliamo decidere se investire i nostri soldi in un determinato settore industriale in particolare,
decideremo di investire se i profitti medi del settore risulteranno essere superiori a 2M euro. Si assume che
i profitti nel settore sono distribuiti in modo normale con varianza nota pari a =
Per stimare si decide di calcolare un intervallo di confidenza di livello 95% sulla base del seguente
campione casuale di aziende.
Azienda Profitti (M euro)

1 3
2 1
3 -2
4 0
5 10
6 5
7 8
8 -1
9 -5
10 6
CASO A
n = 10
CASO B: intervallo di confidenza di livello per la media (non nota) di una popolazione
normale con varianza non nota
-Popolazione ->
-Obiettivo -> Stimare
-Campione casuale semplice -> (x1, x2, ., xn)
-Utilizziamo come stimatore di
-Sappiamo che
Distribuzione t di Student
-Quando il numero di gradi di libertà (G.L.), tende a infinito la curva di densità della t di student diventa
indistinguibile da quella di una normale standard.
-La distribuzione di t di student ha la sua tavola
Pertanto, l’intervallo di confidenza di livello per di una popolazione normale con varianza
non nota è dato da
Ovvero
Fattori che influiscono sul margine di errore
1)
2)
3)
Esempio: (continua)
Ora assumiamo di non conoscere il valore di (varianza della popolazione)
CASO B
CASO C: Intervallo di confidenza (approx.) di livello per la media non nota di una popolazione
qualsiasi con varianza non nota (campione grande -> n ≥ 25).
CASO D: Intervallo di confidenza di livello (approssimativamente) per la probabilità di successo
p di una popolazione bernoulliana (campione grande -> )
-Popolazione ->
-Obiettivo -> stimare p
-Estrazione campione casuale semplice dalla popolazione
-Come stimatore di p, si propone la proporzione campionaria
-Se np(1 – p) > 9, sappiamo che
(Teorema centrale del limite)
Esempio: siamo interessati a stimare la quota di individui in una popolazione che utilizza il bancomat per la
maggior parte dei suoi pagamenti. A questo proposito si estrae un campione casuale semplice di n = 300
individui dalla popolazione, dei quali 180 hanno risposto di utilizzare principalmente il bancomat. Si calcoli
l’intervallo di confidenza al 90% per la quota sopra descritta.
n = 300
I.C. di livello (approx.) 90% per la quota di individui che utilizzano principalmente il bancomat come
strumento di pagamento.
NON NEL SECONDO PARZIALE
Determinazione dell’ampiezza campionaria n
CASO A: I.C. di livello per , popolazione normale, nota
Supponiamo di voler estrarre un campione di dimensione n* tale per cui la precisione della stima che si
otterrà sia pari a ME*
Esempio: (continua)
Qual è la dimensione del campione che ci consente di raggiungere tale valore del margine di errore?
CASO D: RELATIVO A I.C. di livello (approssimativamente) per p, di una popolazione

bernoulliana.
ME =
ME* =
In questo caso, si può utilizzare un approccio “conservativo” (worst case scenario)

Esempio: (continua)
Qual è la dimensione del campione n* che consente di ottenere una precisione nella stima di p pari a

Statistica Modulo 2 Prof Venturini Unicatt Cremona

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Statistica Modulo 2 Prof Venturini Unicatt Cremona

Caricato da

Copyright:

Formati disponibili

Calcolo probabilità

La probabilità ha diverse Definizioni.

Qual è la probabilità che si verifichi un evento, che abbia determinate caratteristiche?

Interpretazione classica delle probabilità

Altri due eventi speciali:

- Evento certo: evento a cui corrispondono tutti gli eventi elementari.

Algebra degli eventi:

Contiene gli eventi elementari che appartengo o contemporaneamente sia ad A, sia a B.

-Due eventi A e B, si dicono disgiunti o incompatibili, se l’evento intersezione è impossibile o vuoto.

Si verifica quando almeno uno dei due eventi si è verificato.

Contiene tutti gli eventi elementari contenuti in A, oppure in B.

Es : esperimento aleatorio: lancio di un dado a 6 facce

A = si verifica un risultato pari

B = si verifica un risultato maggiore e uguale a 4”

Siano A e B due eventi qualsiasi: a cosa corrispondono gli eventi:

E cosa si può dire circa la loro intersezione ed unione?

Questi eventi sono tra loro disgiunti.

2)Siano A e B due eventi. Si valuti a cosa corrispondono gli eventi

-Interpretazioni del concetto di probabilità.

3)Interpretazione soggettiva: definisce la probabilità di un evento A, come il prezzo che si è disposti a

4)Definizione assiomatica: sia lo spazio campionario di un esperimento aleatorio. Si dice probabilita,

1) Se A e un evento dello spazio, allora

Regole di base per calcolare le probabilità.

Es: esperimento aleatorio: lancio dado a 6 facce

A = “due carte estratte, la prima carta estratta è di spade”

Nelle percentuali rispettivamente di : 10%, 22%, 19%, 30%, 19%

Ai = lavoratore estratto appartiene alla regione i-esima, i = 1, …, 5

Presi n eventi A1, A2, … An, che soddisfano le seguenti proprietà:

3) La probabilità che si verifichi ognuno degli eventi sia positiva

Teorema di Bayes, teorema delle probabilità inverse

Ci permette di calcolare la probabilità di A, dato B.

Siano A1, A2, … An, n eventi tali che:

1)L’intersezione a coppie e vuota

2)L’unione di tutti gli eventi e lo spazio campionario

3)Probabilita che si verifica evento A, positiva

Si consideri quindi un altro evento B con probabilità positiva

Un azienda produce ii suoi prodotti in 3 diversi stabilimenti, nelle percentuali:

50% produzione primo stabilimento

10% secondo stabilimento

40% terzo stabilimento

A1 = il pezzo estratto arrivo dallo stabilimento i-esimo

B = pezzo estratto difettoso

Per il teorema delle probabilità totali

La somma di queste probabilità deve fare 1

Indipendenza statistica tra due eventi (o stocastica)

L’intersezione deve essere uguale al prodotto delle due probabilità di A e B.

Es: spazio campionario omega qualsiasi

Ne consegue che la probabilità che succedano insieme, allora

Nella pratica, interessa spesso valutare le conseguenze di un esperimento aleatorio.

Esempio: Supponiamo di lanciare due dadi a 6 facce

Le variabili aleatorio si distinguono in variabili discrete e variabili continue

Variabili aleatorie discrete

Si dicono funzioni di probabilità di una variabile aleatoria discreta x,

F(x) è non decrescente

F(x) e “a gradini” con salti corrispondenti a p(xi), xi appartiene a Rx

Esperimento aleatorio: lancio di 4 monete regolari

Si consideri la v.a. x = “numero di test”

La funzione di ripartizione sarà:

Variabile aleatoria -> funzione

Discrete -> x ha supporto finito o infinito numerabile

Continue -> x ha supporto infinito non numerabile (ovvero un sotto-insieme di )

Variabili aleatorie discrete

-Funzione di probabilità -> p(x)