Sei sulla pagina 1di 61

A.

Albertella - Politecnico di Milano

• media e varianza

• alcune importanti variabili casuali


variabili casuali discrete e continue
key points

• una variabile casuale è una variabile che assume un certo valore numerico
determinato dal risultato di un fenomeno casuale

• una variabile casuale discreta assume un numero numerabile di valori; la


probabilità di ciascun valore di una variabile casuale discreta è un valore tra 0
e 1 e la somma di tutte le probabilità è uguale a 1

• una variabile casuale continua assume tutti i valori un certo intervallo reale; la
sua distribuzione di probabilità è una curva e la probabilità di un evento è
l’area sottesa da questa curva
variabili casuali discrete e continue
key points

• una variabile casuale è completamente de nita se è nota

• o la sua FUNZIONE di DISTRIBUZIONE

• oppure la FUNZIONE DENSITA’ DI PROBABILITA’ (per le v.c. continue), la


sua DISTRIBUZIONE DI PROBABILITA’ (v.c. discrete)
variabile casuale funzione di un’altra
key points

• Sia X una variabile casuale continua e sia g:ℜ→ℜ y = g(x) una


funzione continua e di erenziabile

• da FX(x) o da fX(x) si può determinare la densità di probabilità della nuova


variabile casuale Y = g(X)

fX(x)
fY(y) = con x = g −1(y)
| g′(x) |

ff
Variabile casuale funzione di un’altra

• Sia X una variabile casuale con densità fX(x) e funzione di distribuzione


FX(x), è sempre possibile costruire una nuova variabile casuale Y de nita da
Y = FX(x) tale che quando x percorre l’intervallo di de nizione di X, y varia
sull’intervallo [0,1], si ha:

fX(x)
fY(y) = d
= 1 cioè Y è uniformemente(*) distribuita su [0,1]
• F (x)
dx X
La distribuzione uniforme (*)

La distribuzione uniforme su un intervallo [a, b]


attribuisce la stessa probabilità a tutti i punti
appartenenti all’intervallo [a, b].

1
f(x) = x ∈ [a, b]

b−a

La probabilità su un intervallo qualunque contenuto


in [a, b] è proporzionale alla lunghezza dell’intervallo.

La variabile statistica
(formalmente coincide con una variabile casuale discreta)

• DEF: si dice VARIABILE STATISTICA (a 1 dimensione) una tabella a due righe di valori
numerici; gli elementi della prima riga sono detti valori argomentali, gli elementi della
seconda (che devono essere numeri interi, positivi o nulli) sono le frequenze

• X = {f1 f2 ⋯ fn dove fi = N è la frequenza relativa di un valore


x1 x2 ⋯ xn Ni

argomentale xi (la percentuale di individui caratterizzati dal valore xi)

n ∑i Ni

Si ha fi = = 1 e fi ≥ 0, quindi si de nisce formalmente una
• N
i=1
distribuzione di probabilità concentrata sui valori {x1, x2, ⋯, xn} ponendo
P(X = xi) = fi le frequenze relative si identi cano con le probabilità
Indici descrittivi di una variabile casuale

• dove è localizzata la distribuzione? valore atteso - media

• quanto è dispersa la distribuzione? varianza

• quanto è “simmetrica”? ….


Indici descrittivi di una variabile casuale
dove è localizzata la distribuzione? valore atteso - media

• La media è una misura della “tendenza centrale” di una distribuzione

+∞

∫−∞
variabile casuale continua E{X} = μX = x f(x)dx


n


variabile casuale discreta μX = xi pi


i=1
N
N ∑i=1 xiNi

variabile statistica mX = xi fi =
• N
i=1
Indici descrittivi di una variabile casuale
dove è localizzata la distribuzione? valore atteso - media

• La media di una variabile statistica può essere interpretata come


“realizzazione/estrazione” di una variabile casuale discreta (detta MEDIA
1

CAMPIONARIA) X= Xi

N i
N
N ∑i=1 xiNi

mX = xi fi =

• N
i=1

Notazione

• lettere latine maiuscole = variabile casuale X

• lettere latine minuscole = estrazione/realizzazione di una variabile casuale =


numero reale x

• lettere alfabeto greco = parametri di una distribuzione (modello) μ, σ, σ 2


Indici descrittivi di una variabile casuale
Esempi
X 3 4 5 6

• X variabile discreta in tabella


f(x) 1/4 1/2 1/8 1/8

n
3 4 5 6 33

μX = xi pi = + + + =

• 4 2 8 8 8
i=1

• X ∼ Bernoulli( p ) X 0 1 μX = (1 − p) ⋅ 0 + p ⋅ 1 = p
f(x) 1-p p
Indici descrittivi di una variabile casuale
media: dove è localizzata la distribuzione?

• Se una distribuzione di probabilità è simmetrica rispetto a un valore c:


f(c + h) = f(c − h) ∀h, allora c coincide con la media

1 N

Nel caso di una variabile statistica, mX = xiNi dice che la media della
• N i=1
variabile statistica è la somma di tutti i valori disponibili divisa per la
numerosità della popolazione (Ni è il numero di volte che il valore argomentale
xi è risultato estratto)
Indici descrittivi di una variabile casuale
TEOREMA della MEDIA

• Se Y = g(X) la media di Y è data da: μY = EY{Y} = EX{g(X)} è quindi


possibile fare il cambiamento di variabile nell’operazione di media.

+∞

∫−∞
EX{X} = μX = x fX(x)dx


+∞ +∞

∫−∞ ∫−∞
EY{Y} = μY = y fY(y)dy = EX{g(X)} = g(x) fX(g(x))dx

Indici descrittivi di una variabile casuale
TEOREMA della MEDIA

• Da questo teorema discendono 3 importanti corollari

• la media è un’operatore lineare: se Y = aX + b allora


EY{Y} = aEX{X} + b

• se Y = g(X) sotto opportune ipotesi vale μY ≃ g(μX)

• l’operazione di media è positiva: g(x) ≥ 0 → E{g(X)} ≥ 0; quindi date


due funzioni g(x) ≤ h(x) allora E{g(X)} ≤ E{h(X)}
Indici descrittivi di una variabile casuale
Esempi

• X variabile discreta in tabella

2 1 1 2 X -2 -1 0 1 2
• μX = − 5 − 5 + 0 + 5 + 5 = 0
f(x) 1/5 1/5 1/5 1/5 1/5

4 1 1 4 X^2 4 1 0 1 4
μ =
• X2 5 5 + + 0 + + =2
5 5
Indici descrittivi di una variabile casuale
media: dove è localizzata la distribuzione?

• OSSERVAZIONE

• in presenza di un errore sistematico (il risultato della misura è in uenzata


sempre nello stesso modo) cosa succede alla media?

• un errore sistematico in uisce sul risultato della misura o sempre in eccesso o


sempre in difetto ne segue che anche la media risulta DEVIATA nella stessa
direzione

fl
Indici descrittivi di una variabile casuale
varianza: quanto è dispersa la distribuzione?

La VARIANZA è l’indice che misura il grado di concentrazione di una variabile casuale


attorno alla media, si pone per de nizione
σ 2(X) = σX2 = EX{(X − μX)2} = μX{(X − μX)2} ; esplicitamente si ha

+∞

∫−∞
σ 2(X) = (x − μX)2 fX(x)dx per variabili casuali continue

σ 2(X) = (xi − μX)2 pi per variabili casuali discrete

• ∑
i

2
Ni 2

s (X) = (xi − mX) per variabili statistiche
• N
i

fi
Indici descrittivi di una variabile casuale
varianza: quanto è dispersa la distribuzione?

• La varianza è sempre un numero


positivo.

• La radice quadrata della varianza è lo


SCARTO QUADRATICO MEDIO
(standard deviation)

• Lo scarto quadratico medio ha le


stesse unità di misura delle
realizzazioni della variabile X
Indici descrittivi di una variabile casuale
esercizio

• Quale variabile ha s.q.m. maggiore?


Indici descrittivi di una variabile casuale
esercizio

• Quale variabile ha s.q.m. maggiore?

Y -3 3
μY = 0.5 ⋅ 3 + 0.5 ⋅ (−3) = 0

f(y) 0.5 0.5


σY2 = μ((Y − μY )2) = 9 ⋅ 0.5 + 9 ⋅ 0.5 = 9

(Y-m)^2 9 9

W 10 20 30 40 50
μW = 30

f(w) 0.1 0.2 0.4 0.2 0.1


σW2 = 120
(W-m)^2 400 100 0 100 400
Indici descrittivi di una variabile casuale
Proprietà di media e varianza

• μ(X + Y) = μX + μY

• μ(aX + b) = aμX + b

2 2 2
• σ (X + Y) = σX + σY se X e Y sono indipendenti

2 2 2
• σ (aX + b) = a σX

2 2 2
• σ (X) = μ(X ) − μX
Indici descrittivi di una variabile casuale
varianza

• Siano X1, X2, ⋯, Xn variabili indipendenti e tutte con lo stesso scarto quadratico medio
σXi = 2. Quanto vale lo scarto quadratico medio della loro media X ?

n
Xi indipendenti ⟹ σ 2( Xi) = nσ 2(Xi) = 4n

• ∑
i

2 2
X1 + X2 + ⋯ + Xn 1 2 4

σ (X) = σ ( ) = 2σ ( Xi) =

• n n n
i
2
σ(X) = la media di n misure indipendenti varia “meno” della singola misura
• n
Indici descrittivi di una variabile casuale
Teorema di Tchebyche

• Dato un qualunque numero λ > 1, per una qualunque variabile casuale X, che ammette
1
media e varianza nite, vale la diseguaglianza P( | X − μX | ≤ λσX) ≥ 1 −

λ 2

• Il teorema a erma che più è piccolo lo scarto quadratico medio σX, più è piccolo l’intervallo
1
[μX − λσX, μX + λσX] in cui è sicuri di avere una probabilità che al minimo vale 1 − 2 .

λ
• Minore è la varianza minore è la probabilità che X sia lontana dalla sua media.

• Per esempio: per λ = 2, in un intervallo [μX − 2σX, μX + 2σX] si ha almeno il 75 % di


probabilità; per λ = 3, in un intervallo [μX − 3σX, μX + 3σX] si ha almeno il 89 % di
probabilità.
ff
fi
f
Indici descrittivi di una variabile
casuale
Teorema di Tchebyche

• Il teorema vale per qualsiasi


variabile casuale (devono solo
esistere media e varianza)

• La probabilità nell’intervallo
[μ − λσ, μ + λσ] è almeno pari a
1
1 − 2 , ma può ovviamente
λ
essere maggiore.

• (https://stats.libretexts.org/)

f
Teorema di Tchebycheff
esempio

• Si hanno 50 osservazioni
di cui si conosce la media
(28) e lo scarto quadratico
medio (3).

• Quante osservazioni
cadono nell’intervallo
[22,34]?

• Quante osservazioni
esternamente?
• (https://stats.libretexts.org/)
Teorema di Tchebycheff
esempio

• [22,34]=[ μ − 2σ, μ + 2σ]

1 3
• P > 1 − 22 = 4 = 75 %

• (https://stats.libretexts.org/)
Legge di propagazione della varianza

• Sia Y = g(X) una funzione della variabile casuale X di distribuzione nota, la


varianza della Y può essere calcolata (dal teorema della media) come
σ 2(Y) = E{(Y − μy)2} = E{(g(X) − μy)2} = E{g 2(X)} − E 2{g(X)}

• Si può dimostrare, sotto opportune condizioni di concentrazione della


variabile X e di regolarità della funzione y = g(x) che vale la relazione
approssimata σY2 ≃ [g′(μX)]2σX2

Legge di propagazione della varianza

• Questa relazione diventa esatta quando g (y = ax + b) è lineare; in tal caso


si ha:

• μY = aμX + b σY2 = a 2σX2

• OSS: data una variabile casuale X qualsiasi è possibile sempre costruire una
variabile U che abbia media nulla e varianza uguale a 1. Basta porre
X − μX 1 1
U= ; infatti E{U} = E{(X − μX)} = 0 σ (U) = 2 ⋅ σX2 = 1
2
σX σX σX
Indici descrittivi di una variabile casuale
Mediana

• La mediana me di una distribuzione di probabilità è un indice di posizione


(come la media) ed è de nita come il valore che separa in due parti uguali la
distribuzione:

1
• P(X ≤ me) = 2 = P(X ≥ me)

me +∞
1
∫−∞ ∫m
Per una variabile casuale continua f(x)dx = f(x)dx =
• 2
e

fi
Indici descrittivi di una variabile casuale
Mediana
• In gura sono illustrate le densità di probabilità di tre variabili casuali (rosso,
nero, blu) in due situazioni (A) e (B).

• Quale variabile ha la mediana maggiore?


fi
Indici descrittivi di una variabile casuale
Mediana
• Caso (A)

• le tre mediane coincidono (per


de nizione la mediana q è quel
punto in cui l’area totale si
divide in due parti uguali P=0.5)
fi
Indici descrittivi di una variabile casuale
Mediana
• Caso (B)

• sapendo che l’area in verde


corrisponde a 0.5 si ha che la
curva rossa ha la mediana
maggiore, infatti per questa
curva serve considerare “più
area” per arrivare a 0.5
Indici descrittivi di una variabile casuale
Moda

• La moda mo di una distribuzione di probabilità è un


indice di posizione (come la media e la mediana) e
coincide il valore con la maggiore probabilità (il valore
che compare più spesso in un insieme di dati).

• In una distribuzione di probabilità simmetrica μ, me, mo


coincidono

• WIKIPEDIA Cmglee - Own work


Indici descrittivi di una variabile casuale
Media - mediana - moda
Indici descrittivi di una variabile casuale
Quantili
• Nel caso di una variabile casuale X, con
funzione di distribuzione F(x) il quantile qα
di ordine α è de nito da F(qα) = α.

• α è compreso tra 0 e 1

• L’area a sinistra di qα è uguale ad α

• Sono punti che dividono l’intervallo su cui


è de nita la densità/distribuzione di
probabilità in intervalli di uguale
probabilità.

• La mediana è il quantile di ordine 1/2


fi
fi
Indici descrittivi di una variabile casuale
Quantili
come definire una variabile casuale
riassumendo

• Una variabile casuale è de nita quando si conosce o la sua densità di


probabilità oppure la funzione di distribuzione. I parametri che la
caratterizzano sono la sua media e la sua varianza.

+∞

∫−∞ ∑
μX = xf(x)dx μX = xi p(xi)


i
+∞

∫−∞
σ 2(X) = (x − μ)2 f(x)dx σ 2(X) = (xi − μ)2 p(xi)
• ∑
i

fi
varianza, sqm, standard deviation, RMS

σ 2(X) = (xi − μX)2 pi inoltre si ha: σ 2(X) = μ(X 2) − μX2


varianza:
i
scarto quadratico medio (s.q.m.): (σ 2(X)) = σX

s.q.m. = standard deviation

1
xi2 = μ(X 2)

N∑
root mean square (RMS) = “media quadratica” = ≡
i
per variabili a media nulla RMS = st.dev.
Alcune importanti variabili casuali

• Alcune variabili casuali sono frequentemente utilizzate per la modellazione


stocastica di molti fenomeni, in particolare nell’inferenza statistica che è un
capitolo fondamentale nell’analisi di dati reali.
la distribuzione binomiale

• X una variabile casuale discreta con distribuzione binomiale = ripetizione di n


prove bernoulliane (p) indipendenti X(n, p) = X1 + X2 + ⋯ + Xn dove
Xi ∼ Bernoulli (p).

• X descrive il numero di successi dopo n ripetizioni di Bernoulli

• X ∼ Binomiale (n, p)
Alcune importanti variabili casuali
la distribuzione binomiale

• E’ una variabile discreta applicata a fenomeni di prove indipendenti e ripetute


con due possibili risultati alternativi (successo o insuccesso)

• Si consideri un esperimento stocastico e siano S i suoi possibili risultati; sia


⋃ ⋂
A B = S , A B = 0. Sia inoltre P(A) = p, P(B) = q, p + q = 1.

• Si considerino n ripetizioni dell’esperimento, la probabilità di avere k successi


su n prove si dimostra essere data da P(n, k) = ( ) p q
n k n−k
k = 1,2,⋯n
k
n!
dove ( ) =
n
; si dimostra che μk = np, σk2 = npq
k k!(n − k)!
Alcune importanti variabili casuali
la distribuzione binomiale

• http://www.malinc.se/math/statistics/binomialen.php
Binomiale - esempio

• Durante un esame a risposta multipla con 5 domande e 3 possibili risposte per ogni
domanda, qual è la probabilità che uno studente indovini almeno 4 risposte semplicemente
rispondendo a caso? Qual è il numero medio di risposte indovinate?

• Sia X la variabile casuale che indica il numero di risposte indovinate nelle 5 domande
1
dell’esame. X ha una distribuzione binomiale di parametri n = 5 e p =

3
• P(X ≥ 4) = P(X = 4) + P(X = 5) = 0.0453

• [n= 5, k=4,5, p=1/3]

1
• Numero medio risposte indovinate = np = 5 ⋅ 3 = 1.667
Alcune importanti variabili casuali
la distribuzione normale (o gaussiana)

• La distribuzione normale descrive bene i processi di misura di alta precisione,


in cui nessuna causa di errore ha e etti signi cativamente più alti di altri.

1 (x − μ)2
− 2
La sua densità di probabilità è data da fX(x) = e 2σ
• 2πσ
dove μ e σ sono rispettivamente la media e lo scarto quadratico medio.

• La variabile casuale normale viene anche utilizzata quando si voglia


descrivere esperimenti legati alle misure di quantità prodotte in serie che si
vorrebbero identiche

ff
Alcune importanti variabili casuali
la distribuzione normale (o gaussiana)

1 (x − μ)2
− 2
fX(x) = e 2σ media e varianza de niscono completamente la
• 2πσ
distribuzione ed hanno un particolare signi cato: μ è il polo di simmetria della
funzione densità di probabilità, σ 2 è un indice di dispersione attorno al valor
medio

• Lo scarto quadratico medio, rappresenta la distanza tra la media e il punto di


esso della curva
fl
Alcune importanti variabili casuali
la distribuzione normale (o gaussiana)

1 − (x − 2μ)
2

fX(x) = e 2σ

2πσ
Alcune importanti variabili casuali
la distribuzione normale (o gaussiana)

• Si può dimostrare che

• nell’intervallo (μ − 3σ, μ + 3σ) ∼ 99,7%,

• nell’intervallo (μ − 2σ, μ + 2σ) ∼ 95%,

• nell’intervallo (μ − σ, μ + σ) ∼ 68%

(valori leggermente diversi da quelli derivati dal


teorema di Tchebyche )
ff
Alcune importanti variabili casuali
la distribuzione normale (o gaussiana)

• La probabilità di realizzazione in un certo intervallo è pari all’area sottesa


dalla curva normale con base pari all’intervallo considerato. Tale area è il
risultato di un integrale non calcolabile analiticamente.

X − μX
• Si considera quindi la variabile standardizzata Z = σX della quale sono
disponibili i risultati in tabelle.

• Z∼ (0,1)
𝒩
Alcune importanti variabili casuali
la distribuzione χ 2

• E’ descritta dalla densità di probabilità (dipendente da un parametro)


1 χ2
f(χ 2) = ν/2 e − 2 (χ 2)ν/2−1, questa è detta distribuzione di una
2 Γ(ν/2)
variabile χ 2 a ν gradi di libertà; Γ è una funzione nota (Γ di Eulero); si ricava
facilmente che

• μ(χν2) = ν, σ 2(χν2) = 2ν

• Per ν> 100 si può usare la formula approssimata Z = 2χ 2 − 2ν − 1 ,


dove Z è la normale standardizzata.
Alcune importanti variabili casuali
la distribuzione χ 2

• Si può dimostrare che la χν2 a ν gradi di libertà è la somma di ν normali


standardizzate indipendenti

ν
χν2 =
• ∑ i
i=1
𝒵
Alcune importanti variabili casuali
la distribuzione t di Student

• E’ una distribuzione dipendente da un parametro (detto gradi di libertà della t)


ν+1
Γ( 2 ) 1
f(t) = ν

t2 ν + 1
πνΓ( 2 ) (1 + ν ) 2
2 ν
• si dimostra che μ(t) = 0; σ (t) =

ν−2
• si può dimostrare che la t di Student è pari al rapporto tra due variabili casuali indipendenti:
una normale standardizzata ed la radice di una χ 2 su i suoi gradi di libertà t =
χν2
ν
𝒵
Alcune importanti variabili casuali
la distribuzione t di Student

x=-10:.01:10
y1=tpdf(x, 1)
y2=tpdf(x, 5)
y3=tpdf(x, 10)
y4=tpdf(x, 50)
plot(x,y1, x, y2, x, y3, x, y4
title('densità di probabilità’
legend('k=1','k=5','k=10','k=50'
;

Alcune importanti variabili casuali


la distribuzione F di Fischer

• E’ una distribuzione dipendente da due parametri (detti gradi di libertà della F)


λ+ν
λ λ/2ν ν/2γ( 2 ) λ−2
F 2
f(Fλ,ν) = λ ν λ+ν

Γ( 2 )Γ( 2 ) (λF + ν) 2
2
ν 2 2ν (λ + ν − 2)
• si dimostra che μ(Fλ,ν) = ν − 2 ; σ (Fλ,ν) =
λ(ν − 2) (ν − 4)
2

• La Fλ,ν di Fischer è uguale al rapporto tra due χ 2 indipendenti rispettivamente


a λ e ν gradi di libertà. Inoltre vale F1,r = tr2
Alcune importanti variabili casuali
la distribuzione F di Fischer
Alcune importanti variabili casuali
la distribuzione F di Fischer

• https://homepage.divms.uiowa.edu/~mbognar/applets/f.html
Alcune importanti variabili casuali
la distribuzione uniforme (continua)

La distribuzione uniforme su un intervallo [a, b] attribuisce la


stessa probabilità a tutti i punti appartenenti all’intervallo [a, b].

1
f(x) = ∈ [a, b]

b−a
a+b
μX =

2
2
(b − a)
σX2 =

12
La probabilità su un intervallo qualunque contenuto in [a, b] è
proporzionale alla lunghezza dell’intervallo.
Alcune importanti variabili casuali
la distribuzione uniforme (continua)

Come intervallo spesso ci si riconduce all’intervallo


unitario [0,1] tramite una trasformazione lineare:
distribuzione uniforme standard

1 1
f(x) = 1 x ∈ [0,1] μX = σX2 =

2 12
Se X è uniforme su [0,1], allora Y =: a + (b − a)X è
uniforme su [a, b]

La probabilità su un intervallo qualunque contenuto in


[0,1] è pari alla lunghezza dell’intervallo.

• parte del materiale è stato tratto da MIT OpenCourseWare https://ocw.mit.edu 18.05 Introduction
to Probability and Statistics Spring 2014

Potrebbero piacerti anche