Formule Statistica

Simone Sollena simone.sollena@studenti.unipmn.
it
Formulario di probabilit e statistica
f(x) := funzione di densit di probabilit

F(x) := funzione di ripartizione di probabilit
P(x) := massa di probabilit P(X=x)
+
Normalizzazione della densit di probabilit:

f (x)dx=1
Valore atteso
discreto: E [ X ]= ( x i P ( X = x i ))
i
+
continuo: E [ X ]= x f ( x) dx

E[aX+b] = aE[X]+b
Varianza := Var[X] = E[X2]-E[X]2 = 2

Deviazione standard := Var [ X ]=
Probabilit condizionata
P ( A B)
P ( AB)=
P ( B)
P (BA) P( A)
Formula di Bayes: P ( AB)=
P( B)
Unione: P ( A B)= P( A)+ P (B) P ( A B)
1
Simone Sollena simone.sollena@studenti.unipmn.it
Distribuzione di Bernoulli: X ~ B(p)

Data una variabile aleatoria X con l'insieme degli esiti possibili x {0, 1} e relative
probabilit
P(X=1) = p
P(X=0) = 1-p
X si dice distribuzione bernoulliana di parametro p: X ~ B(p)
E[X] = 1 P(X=1) + 0 P(X=0) = p
Distribuzione binomiale: X ~ B(n, p)

n: numero di ripetizioni indipendenti di esperimenti con una variabile aleatoria di
Bernoulli;
x: numero di successi
X ~ B(n, p) dove p la probabilit di successo della v.a. di Bernoulli.
i ()
P ( X =i)= n p (1 p)
i ni
p ni
P (x=i +1)= P ( X =i)
1 p i+1
n
E [ X ]= E [ X i ]=np
i=1
n
Var ( X )= Var ( X i )=np (1 p)
i=1
Distribuzione di Poisson: X ~ P()

X {0, 1, 2, }
X ~ P()
i
P ( X =i)= e
i!
E[X] =
Var[X] =
Per calcolare i valori successivi/consecutivi:
P ( X =i)= P( X =i1)
i
2
Distribuzione continua uniforme: X ~ U([])
Una variabile aleatoria continua uniforme se la funzione di densit in [, ] :
{
f (x)=
1
0
per x
altrimenti
b
1 ba
P (a< X < b)= dx=
a
[ ]
2 2
1 1 1 x2 1 +
E [ X ]= x f ( x) dx= x dx= x dx= = =
2 2 2
[ ]
+ 3 3 3 2 2
1 1 x ()( + + ) 2 + + 2
E [ X ]= x f ( x) dx= x dx=
2 2 2
= = =
3 3() 3() 3
2 2 2 2 2 2 2
+ + + + + + +2
Var [ X ]= E [ X 2 ] E [ X ] 2=
3
( )2
=
3

4
2 2 2 2 2 2 2
4 +4 + 4 3 3 6 2 + ()
= = =
12 12 12
Distribuzione normale o gaussiana: X ~ N(, 2)

X
Normale standard: Z := Z ~ N(0,1)
(
X b
P ( X <b)= P < = P Z < = ) (
b
) (
b
)
(
a b
) (
b a
P (a< X < b)= P < Z < = P Z < P Z < =
b
) (
a
) ( ) ( )
P (a< Z < a)=2P (Z <a)1
Funzione di densit per la normale:
2
( x)
1
2
2
f (x)= e
(2 )
2
Valore atteso: E[X] =
3
Momento secondo: E[X2] = 2 + 2

Varianza: Var[X] = E[X2]-E[X]2 = 2
Se X ~ N(, 2) e Y= X + Y ~ N(+, 22)
Definiamo z tale che: P (Z > z )==1( z )( z )=1
Distribuzione esponenziale: X ~ ()
X ~ ()
Il parametro indica l'intensit, equivale al reciproco del valore atteso.
f (x)=
0{
e x per x0
per x<0
Funzione di ripartizione
F(x)=P(X x) = 1 - e- x
P(X>x) = e-x
1
E [ X ]=

2 2
E [ X ]= 2

1
Var [ X ]= E [ X 2 ] E [ X ] 2=

Distribuzione Chi-quadro
Se le Zi ~ N(0,1), si definisce Chi-quadro ad n gradi di libert una variabile aleatoria X
tale che
n
X := Z i
i=1
2
X n
P ( X 2 , n )=
Distribuzione T-STUDENT
Date due variabili aleatorie indipendenti, Z ~ N(0,1) e C n ~ n2
Z
T n :=
C n /n
E [T n ]=0, n2
n
Var (T n)= , n3
n2
4
Per simmetria della T-student abbiamo:

P (T nt ,n )==P (T nt ,n )=1 P(T n >t , n)
P (T nt , n)=1
t , n =t 1 , n
Media campionaria vs valore atteso: dato un certo numero n di esperimenti che danno
dei valori Xi, la media campionaria il valore medio di tali esperimenti, e pu variare
ripetendo gli esperimenti, mentre il valore atteso dato dalla somma di tutti i possibili
valori che possiamo ottenere dall'esperimento (es. il lancio di un dato ha 6 possibili
valori) per la loro probabilit, ed fisso. Dato un insieme n di esperimenti abbiamo
lim X =E[ X ]
n
ovvero al crescere di n la media si avvicina sempre pi al valore atteso.
Date n variabili aleatorie, X 1, X2, , Xn, definiamo la media campionaria come:

X + X 2+...+ X n
= 1
X
n
Valore atteso della media campionaria:

]=E
E[ X [ n
=]
X 1+ X 2 +...+ X n E [ X 1 ]+ E [ X 2]+...+ E [ X n ] n
n
=
n
=
Varianza della media campionaria:

]=Var 1
Var [ X ( n
= )
X + X 2+...+ X n Var ( X 1)+Var ( X 2)+...+Var ( X n ) n 2 2
n2
= 2 =
n n
Deviazione standard della media campionaria:
2=
n n
Teorema del limite centrale

Date n variabili aleatorie i.i.d. (indipendenti e identicamente distribuite) con media e
varianza 2,
n
X i N (n , n 2)
i=1
Che possiamo normalizzare, ottenendo
n
( X i )n
i=1
N (0,1) da cui:
n
5
( )
n
( X i )n
i=1
P < x = ( x)
n
Teorema del limite centrale applicato a v. a. binomiali

Data la v.a. Binom. X{0, 1} con P(x=1) = p e P(x=1) = 1-p
sapendo che:
E[Xi]=p
VAR[Xi]=p(1-p)
per n sufficientemente grande abbiamo
X np
N (0,1)
np (1 p)
ovvero, la somma di n variabili aleatorie binomiali X i approssimabile ad una normale
di parametri
X N (=np , 2=np(1 p))
Distribuzione della media campionaria

Data la media campionaria
n
:= 1 X i
X
n i=1
Poich il valore atteso di X e la deviazione standard /n 1/2,

X
N (0,1) (6.3.4)
/ n
ovvero:
2
N ( , )
X
n
Varianza campionaria, S2 Deviazione standard campionaria S = S2

n
1
2
S :=
n1 i=1
)2
( X i X
E[S2] = 2
Varianza campionaria S2 e chi-quadro, 2

S2
(n1) 2 2n1

( )
2
S b
P (S 2 >b)= P (n1) 2 >(n1) 2

6
Deviazione standard campionaria e T-student

X
t n1
S / n
7
Intervalli di confidenza
Intervalli di confidenza a livello 1
per la media conoscendo la varianza
per la media usando la varianza campionaria
per la varianza 2
per ipotesi bilaterale sinistro destro
Nota , x + z ,
x z /2 x z
n n n
Non nota s s s
, con S2 x t /2, n1 , x +t ,n1 x t , n1 , +
n n n
2 non nota (n1)s 2 (n1) s 2 (n1) s 2 (n1)s 2
2
, 2 0, 2 2
,
, n1 1 , n1 1 , n1 , n1
2 2
Nel caso dell'intervallo di confidenza a livello 1 con varianza nota, se si vuol

trovare n tale che che l'intervallo di confidenza bilaterale sia ampio b:
x z /2

n
x b z /2
n
=b n=
z /2
b
n=
z /2 2
b ( )
Intervalli di confidenza della differenza delle medie di due distribuzioni
Dati due campioni indipendenti
X1, X2, , Xn con varianza x2
Y1, Y2, , Ym con varianza y2
l'intervallo di confidenza della differenza delle loro medie a livello 1 dato da:

2 2
x y
x y = x y z /2 +
n m
Con x e y non note ma uguali, utilizzando lo stimatore della varianza comune S p2,
ricavato dalla media pesata delle singole varianze campionarie S x2 e Sy2:

2 2
(n1)S x +(m1)S y
S p= (7.4.9)
n+m2
x y = x y t n+ m2 S p
2,
1 1
+
n m (7.4.11)
Intervalli di confidenza per la media di una distribuzione di Bernoulli

X
Dato p =
n
= p z /2
p (1 p )
n
(7.5.3)
8
Se si vuol trovare n tale che che l'intervallo di confidenza bilaterale sia ampio b/2:
4z2/ 2
n= p (1 p ) (7.5.4)
b
Verifica delle ipotesi

Con varianza 2 nota
Ho H1 Si rifiuta H0 con liv. Di P-dei-dati se:
significativit se:
= 0 0

0
X
/ n
> z
2
2P Z >
( )
0
X
/ n
0
( X /n )
0 > 0 X
> z P Z> 0
/ n
0
P( Z <
/n )
0 < 0 X
X
< z 0
/ n
Con varianza 2 non nota, usando la varianza campionaria S2

significativit se:
= 0 0

0
X
S / n
> t , n1
2 ( )
2P T n1>
0
X
S /n
0
( )
0 > 0 X 0
X
>t P T n1 >
S / n , n1 S / n
0
( )
0 < 0 X 0
X
<t , n1 P T n1 <
S /n S / n
Su una popolazione di Bernoulli (come nel caso di varianza nota)

Data una distribuzione X ~ B(n, p)
E[X] = np =
VAR[X] = np(1-p) = 2
9
Per n grande pu essere approssimata ad una normale, ~ N(np, np(1-p))

np
X
Z= N (0,1)
np (1 p)
significativit se:
p = p0 p p0
np
X
> z
np (1 p) 2 (
2P Z >
np
X
np (1 p) )
X np
( )
p p0 p > p0 np
X
> z P Z>
np (1 p) np(1 p)
np
( np(1 p) )
p p0 p < p0 X np
X
<z P Z<
np (1 p)
Le ipotesi nulle vengono rifiutate a livelli di significativit > p-dei-dati.
10

Formule Statistica

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Formule Statistica

Caricato da

Copyright:

Formati disponibili

Simone Sollena simone.sollena@studenti.unipmn.

Formulario di probabilit e statistica

f(x) := funzione di densit di probabilit

Varianza := Var[X] = E[X2]-E[X]2 = 2

Distribuzione di Bernoulli: X ~ B(p)

Distribuzione binomiale: X ~ B(n, p)

Distribuzione di Poisson: X ~ P()

Distribuzione continua uniforme: X ~ U([])

Una variabile aleatoria continua uniforme se la funzione di densit in [, ] :

Distribuzione normale o gaussiana: X ~ N(, 2)

Valore atteso: E[X] =

Momento secondo: E[X2] = 2 + 2

Se X ~ N(, 2) e Y= X + Y ~ N(+, 22)

Definiamo z tale che: P (Z > z )==1( z )( z )=1

Per simmetria della T-student abbiamo:

Date n variabili aleatorie, X 1, X2, , Xn, definiamo la media campionaria come:

Valore atteso della media campionaria:

Varianza della media campionaria:

Teorema del limite centrale

Teorema del limite centrale applicato a v. a. binomiali

Distribuzione della media campionaria

Varianza campionaria, S2 Deviazione standard campionaria S = S2

Varianza campionaria S2 e chi-quadro, 2

Deviazione standard campionaria e T-student

Nel caso dell'intervallo di confidenza a livello 1 con varianza nota, se si vuol

Intervalli di confidenza per la media di una distribuzione di Bernoulli

Verifica delle ipotesi

Con varianza 2 non nota, usando la varianza campionaria S2

Su una popolazione di Bernoulli (come nel caso di varianza nota)

Per n grande pu essere approssimata ad una normale, ~ N(np, np(1-p))

Le ipotesi nulle vengono rifiutate a livelli di significativit > p-dei-dati.

Potrebbero piacerti anche