Formulario Statistica PDF

se vale zero indica che la distribuzione simmetrica rispetto alla media
Statistica descrittiva se positivo denota una coda verso destra

se negativo denota una coda verso sinistra
indici
coefficiente di curtosi

indici (o misure) di posizione 1
n
xi x
4
media campionaria di n osservazioni x1, x2, ..., xn

curt =
n i=1
n
1 misura quanto la distribuzione appuntita
x = xi
n i=1 correlazioni
per k campioni x ripetuti ciascuno con frequenza fi
1
k
covarianza
x = x f
n i=1 i i di n osservazioni congiunte di 2 variabili {(x1,y1), (x2,y2), ..., (xn,yn)}:
n n
1
propriet xy = x x yi y = 1n x i yi x y
n i=1 i
Posto yi =a xi b : y=a x i=1
se xy 0 x e y sono direttamente correlate: a valori grandi (piccoli) di
mediana m di n osservazioni x1 x2 ... xn x corrispondo valori grandi (piccoli) di y;
se n dispari: m= x n1 /2 se xy 0 x e y sono inversamente correlate: a valori grandi (piccoli)
x n / 2 x n/2 1 di x corrispondo valori piccoli (grandi) di y;
se n pari: m=
2 se xy =0 x e y sono incorrelate;
moda coefficiente di correlazione
punto di massimo della distribuzione di frequenza xy
una distribuzione con un solo punto di massimo detta unimodale xy = ; 1 xy 1
x y
una distribuzione con pi punti di massimo detta plurimodale
indice normalizzato, adimensionale ed invariante per trasformazioni
indici di dispersione lineari delle variabili
varianza di n osservazioni x1, x2, ..., xn regressione lineare

n retta y= a x b che meglio approssima la nuvola di punti xi , y i
1
2 = x x 2
n i =1 i xy y x xy
a = 2 ; b= 2
per k campioni x ripetuti ciascuno con frequenza fi x x
k k
1 1 valori stimati
2 = xi x 2 f i = x 2i f i x 2
n i=1 n i= 1 y i = a xi b
propriet rappresentano i valori stimati di y a partire dalla retta di regressione
2 2 2
posto yi =a xi b : y =a x lineare
residui
deviazione standard o scarto quadratico medio
r i = yi y i
=
2
differenza tra i valori reali e stimati
range di n osservazioni x1 x2 ... xn valore previsto
differenza tra massima e minima osservazione y0= a x 0 b
range= xn x1 x0 un valore diverso dai valori xi gi osservati
p-esimo quantile (o 100p-esimo percentile) di di cambiamento di scala
n osservazioni x1 x2 ... xn log y=a log xb
p 0,1 , si considera il numero np y=e x
b a
se np non intero: k l'intero successivo , Q p = x k

devianza totale
x k xk 1 n
se np intero: k = np , Q p =
2 DEV TOT = DEV REG DEV RES = yi y 2
i=1
quartili n n
DEV REG = y i y ; DEV RES = yi y i

2 2
Q1 primo quartile: quantile per p = 0.25
Q2 secondo quartile: quantile per p = 0.5 (= mediana) i =1 i=1
Q3 terzo quartile: quantile per p = 0.75 coefficiente di determinazione
differenza interquartile (IQR InterQuartile DEV REG DEV RES y
2
R2 = =1 = ; 2
Range) DEV TOT DEV TOT 2y 0 R 1
IQR=Q 3 Q 1 tanto pi esso si avvicina ad uno tanto pi la funzione di regressione
indici di forma trovata buona.
coefficiente di asimmetria (skewness)

n 3
1 x x
sk= i
n i=1
Formulario di Probabilit e Statistica [2005-07-24] - Copyright 2005 Nicola Asuni (info@tecnick.com www.tecnick.com)
*** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 1
Probabilit propriet
P =1
definizioni P =0
eventi elementari P A =1P A
tutti i possibili esiti di un esperimento aleatorio P A B= P A P B P A B

P n=1 A n = P An , con Ai A j = se i j

evento
n =1
ogni sottoinsieme di uno spazio campionario discreto
probabilit classica
spazio campionario la probabilit di un evento il rapporto dei casi favorevoli ed il numero
insieme di tutti gli eventi elementari; pu essere: dei casi possibili
discreto posto di N elementi k (k = 1, 2, .., N) e
se gli elementi sono un numero finito o un'infinit numerabile P { k }= p , eventi elementari equiprobabili , A evento
P { k }= pk qualunque
continuo A A
P A= P { k }= pA= =
se pi numeroso (ad esempio: tutti i numeri reali in un certo A k
N
intervallo) Ail numerodi elementi di A
linguaggio permutazione di n oggetti
insiemi eventi ogni allineamento di n oggetti distinti in n caselle
, intero spazio campionario evento certo P n= n!=n n1n232
propriet di n! (n fattoriale)
, insieme vuoto evento impossibile
0!=1
insieme A l'evento si verifica n!
=n1!
insieme A complementare di A l'evento non si verifica n
n!
A B , (unione) si verifica almeno uno dei due eventi = nn1n 2m1 , con m n
m!
A B , (intersezione) gli eventi si verificano simultaneamente disposizione di n oggetti in k posti
)
A B , ( sottrazione = A B si verifica A e non si verifica B ogni allineamento di k oggetti scelti tra n oggetti distinti in k posti
Dn , k = n n1n2nk 1 , con 1k n
AB= , eventi disgiunti gli eventi sono incompatibili
Dn , n= P n= n!
B A ( B incluso in A ) B implica A disposizione con ripetizione di n oggetti in k
propriet eventi A, B, C sottoinsiemi di posti
A A= A ogni allineamento di k oggetti scelti tra n oggetti e ripetibili, in k posti
k
A A= A Dn , k = n , con k1
A B= B A combinazione di n oggetti di classe k
A B= B A ogni sottoinsieme di k elementi dell'insieme di n oggetti
A BC= ACC (modi per scegliere k oggetti tra n)
A BC = ACC
A BC= A B AC
A BC= A B AC
C n , k=
Pk
=
k
=
k!
D n , k n nn1n2 nk 1
,
con n1 ; 0k n
A= A
coefficiente Binomiale
A=
A=
A= A

n = n =C
k n k
n ,k ;
n =n
1
;
n = n =1
0 n
A A= combinazione con ripetizione di k oggetti scelti
A A= fra n
A B= A B ogni gruppo formato di k oggetti scelti fra n, che possono essere ripetuti
B= A B (modi per disporre k oggetti uguali in n posti)
A
A =A

k
C n , k = n k1 = n k1
n1
probabilit su permutazione con ripetizione di n oggetti uguali
P : P [0,1] fra loro a gruppi
(allineamento in n posti di n oggetti)
n!
Pk =
1, k 2,. .. k r
k 1!k 2!k r !
probabilit condizionata legge (o distribuzione) di una v.a.
applicazione che associa ad ogni intervallo I il numero:
probabilit dell'evento A, condizionata a B P X I = P { : X I }
P A B
P AB= densit discreta di X
P B
funzione che ad ogni valore assunto da X associa la probabilit che X
propriet assuma quel valore
P A B= P BA= P AB PB= P B A P A p X x k = P X =x k
P B A P A
P AB= propriet
P B
probabilit dell'evento X I :
P AB=1 P A B
probabilit totali P X I = pX x k , purch la serie converga
n x k I
P A= P A B j P B j , v.a. indipendenti
j=1
n se scelti n intervalli I 1, I 2, , I n si ha
con j=1 jB = , B i B j = per i j , P B j 0 per ogni j
P X 1 I 1, X 2 I 2, , X n I n = P X 1 I 1 P X 2 I 2 P X n I n
caso notevole:
P A= P AB P B P A
B P
B , valore atteso, o media , o speranza matematica
con {B ,
B } partizione di
X =EX = x k p X xk , per X discreta
formula di Bayes k
P AB k P B k
P Bk A= n , per ogni k X =EX = tf X t dt , per X continua
P AB j P B j
j=1 propriet
indipendenza di eventi E aX b= a EX b , con a , b
E X 1 X 2 X n= EX 1 EX 2 EX n
eventi A, B indipendenti E X 1X 2 X n = EX 1EX 2 EX n ,
lo sono se soddisfano una delle seguenti condizioni
con X 1, X 2, , X n v.a. indipendenti
P A B= P AP B
P AB= P A Ef X = f x k p X x k , purch la serie converga
P B A= P B k
famiglia di eventi indipendenti E aX 1 b= aEX 1b , per ogni a , b per v.a. continue

n eventi A1, A2, ..., An costituiscono una famiglia di eventi indipendenti
se per ogni sottofamiglia di r eventi ( 2r n ), la probabilit di E g X 1 = g t f t dt , per g : per v.a. continue
X1
intersezione di questi r eventi uguale al prodotto delle probabilit di
ciascuno di essi:
P Ai A j = P Ai P A j , per ogni coppia di indici i j varianza
P Ai A j An = P Ai P A j P A n X v.a. discreta:
2 2 2 2
data una famiglia di eventi indipendenti, anche sostituendo alcuni Ai X =VarX = E X EX = E X EX
i , rimane una famiglia di eventi indipendenti. X v.a. continua:
con i complementari A
2
Affidabilit di un sistema 2X =VarX = E X 2 EX 2= t 2 f X t dt t f X t dt

componenti in serie propriet

il sistema funziona se e solo se funzionano tutti i componenti VarX 0
affidabilit (probabilit che il sistema funzioni) VarX = E X 2 EX 2
a =a 1a 2 an Var c=0 , per ogni costante c
2
componenti in parallelo Var aX b=a VarX , per ogni a ,b
il sistema funziona se e solo se funziona almeno un componente
VarX = x k EX 2 p X x k = x 2k pX xk EX 2
affidabilit (probabilit che il sistema funzioni) k k
a=11a1 1a2 1an Var X 1 X 2 X n =VarX 1VarX 2VarX n ,

con X i indipendenti
variabili aleatorie e modelli probabilistici
deviazione standard o scarto quadratico medio
variabili aleatorie X = X = VarX
2
variabile aleatoria (v.a.) discreta covarianza

una qualunque funzione: Cov X , Y =E X EX Y EY = E XY EXEY ,
X : con X , Y v.a. con varianza finita
X I , con I un'abbreviazione di { : X I }
propriet Binomiale di parametri n e p
Cov X , X =VarX X ~ B n , p
Cov X , c=0 , per ogni costante c conta il numero complessivo di successi ottenuti in n prove (estrazione
Cov X ,Y =Cov Y , X con reimissione)
Cov X Y , Z =Cov X , Z Cov Y , Z
Cov Y , Y Z =Cov X ,Y Cov X , Z k
p X k = n p 1 p , k=0,1,2,... , n
k n k
Cov aX , Y =aCov X , Y EX =np ; VarX = np1 p

Cov X , aY =aCov X ,Y 12p 16p 1 p
sk X = ; curt X =3
Var X Y =VarX VarY 2Cov X , Y np1np np1 p
Cov X ,Y VarXVarY dis.Cauchy Swartz
il numero di oggetti di tipo K che si trovano in un campione di n oggetti
correlazione estratti con reimmissione da un insieme di N oggetti che contiene K
due v.a. con varianza finita si dicono incorrelate se: oggetti di un tipo e (N-K) oggetti di un'altro :
Cov X , Y =0 K
X ~ B n ,
in tal caso: N
Var X Y =Var X Var Y
processo di Bernoulli illimitato
coefficiente di correlazione di X, Y sequenza infinita di prove
XY Cov X ,Y Binomiale negativa di parametri -n e p
XY , dove1 XY 1
XY VarXVarY X ~ B n , p

se XY vicino a zero: X e Y sono quasi indipendenti conta il numero di insuccessi che si ottengono prima di ottenere n
se XY positivo: ad X grande corrisponder in genere una Y grande successi
se XY negativo: ad X grande corrisponder in genere una Y piccola p X k =
se XY =1 le v.a. sono una funzione lineare dell'altra: Y =aX b
k
nk1 pn 1 pk , k =0,1,2,. ..

1 p VarX = n 1 p
standardizzata di X EX =n ;
p p2
una v.a. ottenuta da una v.a. X con media e varianza finite:
X X il numero Y di prove necessarie per ottenere n successi:
X =
X
EX =0 ; Var X = 1

k n
P Y = k = P X n= k= P X =k n= k 1 p 1 p ,
n kn
disuguaglianza di Cebicev per k =n , n1, n2,. ..

2
sia X una v.a. di valore atteso X e varianza X finite, allora per Geometrica di parametro p
ogni 0 :
X ~G p
conta il numero di prove necessarie per ottenere il primo successo
1
P X X X , ovvero p X k = p 1 p
k 1
, per k=1,2,3,...
2
1 VarX = 1 p
1 EX = ;
P X X X = P X X X X X 1 p p2
2
Geometrica traslata di parametro p
processo di Bernoulli X ~G ' p
sequenza di esperimenti di Bernoulli indipendenti di uguale parametro conta il numero di insuccessi prima del primo successo
k
p p X k = p 1 p , per k=0,1,2,. ..
esperimento bernulliano o prova di Bernoulli EX =
1 p VarX = 1 p
;
un esperimento aleatorio che pu avere solo due esiti possibili: p p2
successo : con probabilit p Ipergeometrica di parametri (N, K, n)
insuccesso : con probabilit (1-p) X ~G N , K , n , con N k ; N n
p il parametro della prova di Bernoulli conta il numero di oggetti di tipo K che si trovano in un campione di n
oggetti estratti senza reimmissione da un insieme di N oggetti che
processo di Bernoulli limitato contiene K oggetti di un tipo e (N-K) oggetti di un altro.
il numero di prove finito
bernulliana di parametro p
X ~ B p p k =
k n k
K N K
, con 0k n ; k K ; nk N K
n
X
N
descrive l'esito di ogni prova di Bernoulli
p X 1= p ; p X 0 =1 p
VarX =n 1
N N 1
K K K N n
EX = p ; VarX = p 1 p EX =n ;
N N
la probabilit di ottenere, in n prove, una particolare sequenza di k approssimazione Binomiale
successi e (n-k) insuccessi : per N (e quindi K) molto grandi (N > 10n) come se estraessimo con
k nk
p 1 p reimissione:
la probabilit di ottenere, in n prove, almeno un successo : K
n X ~G N , K , n X ~ B n , , per N
11 p N
k
p X k n p 1 p
k nk
, per N , p=
K
N
densit di Cauchy
f X t =
1
EX =np ; VarX =np 1 p

N n
N 1 1t 2
P a X b =
b
1
=1/ arctan barctan a
N n 2
1t
(fattore di correzione per la popolazione finita (< 1)) a
N 1
densit Normale Standard
Poisson di parametro > 0 curva a campana di Gauss, o curva degli errori
Y ~ P 0 , con 0 1 t / 2 2
f X t = e
permette di descrivere quantitativamente situazioni in cui non abbiamo 2
accesso ai valori di N e p, ma possediamo un unica informazione b
1 t /2
P a X b =
2
numerica: il parametro (numero medio di arrivi) e dt

k a 2
pY k = e , per k = 0,1,2,
k! funzione di ripartizione di X (f.d.r.)
EY = ; VarY = equivale alla densit discreta nel caso continuo
1 1 F X t: [0,1]
sk X = ; curt X =3
F X t= P X t , per ogni t
t
propriet F X t= f X y dy , per X continua
se X i ~ P 0 i allora:
X 1 X 2 X n~ P 0 1 2 n F X t= p X xk , per X discreta
x kt
approssimazione della Binomiale
per N molto grande e p molto piccolo: propriet
X ~B N , p Y ~ P 0 Np , P X = k P Y = k se t1 t2 , X t 1 X t2 , P X t 1 P X t2 ,
F X t monotona crescente
processo Poisson di intensit
F X t1 per t
permette di calcolare probabilit di eventi che accadono in un certo
intervallo di tempo diverso da quello su cui abbiamo informazioni di F X t 0 per t
partenza; F X b F X a= P X b P X a= P a X b ,
posto =t con numero medio di arrivi nell'unit di tempo, il con a , b , ab
numero X t di arrivi nell'intervallo di tempo [ 0, t ] dato da la f.d.r. di una v.a. continua sempre una funzione continua
X t ~ P 0 t nei punti in cui la densit continua; in questi punti derivabile:
'
k F X t= f X t
t
p X k =e t , per k = 0,1,2, quantile -esimo (q)
t
k!
EX t = t ; VarX t = t P X q = , con q a , b , 0,1
variabili aleatorie continue
variabili aleatorie legate al processo di
densit continua fx Poisson
determina la legge della v.a. continua X;
una densit di probabilit legge Esponenziale di parametro
P X I f x t dt , con I Y ~ Esp , con 0
I misura l'istante del primo arrivo in un processo di Poisson Xt di
intensit , o il tempo di attesa tra due arrivi successivi;
f x : ; f x t 0 , per ogni t ; f x t dt =1 l'unico modello adeguato a rappresentare il tempo di vita di un
apparecchio non soggetto ad usura
t
propriet F Y t=1e , per t0
P X =t =0 , per ogni t (la probabilit che assuma un F Y t=0 , per t0
t
valore fissato nulla (integrale di un punto)) f Y t =e , per t0
P X a= P X a f Y t =0 , per t0
P a X b= P a X b 1
1
esempi di densit continue E Y = ; Var Y = 2

densit uniforme sk X =2 ; curt X =9
1 stimatore non distorto per legge Esponenziale
f X t = I t , a ,b , ab
b a a , b n1 n1
I a ,b t=1 , per ta , b U =T = n
n
con
I a ,b t=0 , per t a ,b
(funzione indicatrice)
Xi
i=1
1 1
P X J = I a , b t dt= a , b J
J
ba b a
n1 n1 1 modello Normale

= = , stima di
n
n X n
Xi legge Normale standard
i =1
Z ~ N 0,1
legge Gamma di parametri n (intero positivo) e 1
t y 2
(intero positivo) F Z t= e 2
dy t
2
Y ~ n , t 2
1
misura l'istante dell'ennesimo arrivo in un processo di Poisson Xt di f Z t = e 2 t
intensit 2
n1
t
k
E Z =0 ; Var Z =1
F Y t=1 e
t
, per t 0
k=0 k! propriet
F Y t=0 , per t0 t =1 t , simmetria
n 1
t t n1 t calcoli con i quantili
f Y t =e =C n , t e , per t 0 ,
n1! posto z quantile -esimo della legge Normale standard:
f Y t =0 , per t0 z = z 1
n
P Z z =
C n ,=
n1! P Z z 1=
n n P Z z 1/2 =
E Y = ; Var Y = 2
P Z z 1 /2=
legge Gamma di parametri r e (reali positivi)
legge Normale (o gaussiana) di media e
Y ~ r ,
descrive il tempo di vita di un apparecchio la cui propensione al guasto
varianza 2
2
cresce col tempo, fino al limite X ~ N ,
r 1 t
f Y t =C r , t e , per t0 rappresenta bene gli errori di approssimazione
t
f Y t =0 , per t0 F X t=
r r
E Y = ; Var Y = 2 t 2
1 t 1 22
f X t = = e
assenza di memoria 2
P Y T tY T =P Y t EX = ; Var X = 2
P Y T t = P Y tP Y T =0 ; curt X =3 sk X
se una v.a. continua soddisfa questa propriet, allora ha legge X
la v.a. Z = ha legge Normale standard
Esponenziale se continua e legge Geometrica traslata se discreta
istantaneous failure rate (propensione istantanea propriet
al guasto) 2 2
posto X 1~ N 1, 1 , X 2~N 2, 2 indipendenti:
f Y t 2
X 1 X 2 ~ N 1 2, 1 2
2
Z t =
1 F Y t posto a ,b :
2 2
per la legge Esponenziale: aX 1 b~ N a 1b , a 1
Z t = , per t 0 relazione tra legge Normale e legge Normale standard
per la legge Gamma: Z ~ N 0,1 Z ~ N ,
2
n1 n n1
t t 2 X
Z t =C n n1 k = X ~ N , ~ N 0,1
t n1! n1
t
k

k! k!
k=0 k=0 errori
densit di Weibull Y =misura di una grandezza fisica
utile a rappresentare il tempo di vita di un apparecchio =valore vero

posto Z t =c t si trova: X =errore di misura
c t 1
=errore sistematico
F Y t=1e 1 , con 1 E c =errore casuale
1
c t 2
=inacuratezza della misura
f Y t =c t e 1 2
X ~ N , , X = E c
se 0 l'apparecchio invecchia 2
se 10 l'apparecchio migliora col tempo
E c ~ N 0,
se =0 si ritrova la legge Esponenziale E E c =0
EY =
media campionaria
se X i ~ N ,
2
sono v.a. indipendenti ed identicamente
[ ]
distribuite (i.i.d.): 3
3
2 X
sk X = =E
Xn ~ N , 3/2
2
n
coefficiente di curtosi di una v.a. X con '4 finito
2

E Xn = ; Var X n =
n misura quanto la densit di X sia appuntita
[ ]
4
media campionaria standardizzata 4 X 2
Xn curt X = 2 =E , = EX , =Var X
2
S =
n , n=1,2,3,
/ n
teorema del limite centrale statistica inferenziale

P S t t per n , t
n campionamento e stime
approssimazione Normale
2 definizioni
Date X i v.a.i.i.d. , EX i= , VarXi= con n abbastanza
grande: modello statistico

2 famiglia di leggi di v.a., dipendenti da uno o pi parametri incogniti:
t
Xn N , ossia P Xnt n { pX x ; : I }
n un vettore di parametri

n n
t n
X i N n , n 2 ossia P X i t
n
campione casuale di ampiezza n
i=1 i=1 estratto da una popolazione di densit p X x ; una ennupla di v.a.
approssimazione Normale di Gamma per n grande: indipendenti e identicamente distribuite (i.i.d) X 1, X 2, , X n ,
Y ~ n , ciascuna avente legge p X x ; .
n n stima di parametri e stimatori
Y N , 2

stima puntuale dei parametri
F Y t=P Y t
tn
n
stimare il valore vero del parametro (o dei parametri) a partire dal
campione casuale
approssimazione Normale della Binomiale: stima del parametro p della popolazione bernulliana
approssimazione utile in problemi di campionamento p = xn , con xi valori effettivamente osservati
NOTA: vale se: np5 ; n1 p5
statistica T
Y ~ Bn , p
una qualsiasi v.a. T funzione del campione casuale X 1, X 2, , X n
Y N np , np 1 p
di ampiezza n estratto da una popolazione di legge p X x , :
F Y t=P Y t
tnp

np 1 p
, per v.a. continua n
T = f X 1, X 2, , X n , con f :

k 0.5np stimatore del parametro
F Y k= P Y k , statistica che viene usata per stimare il valore del parametro
np1 p
k=0,1,2,, n , per v.a. discreta corretto (non distorto) se ET = altrimenti detto distorto
momenti ed indici di forma per v.a. stima del parametro

f x1, x2, , x n , calcolato a campionamento eseguito
=
momento r-esimo di X
' r stimatore consistente
r = E X var T n 0 per n , conT n stimatore corretto di
'r = xrk p X x k , per X discreta valore atteso della media campionaria
k
E X n=
= x f X x dx , per X continua
' r
r varianza della media campionaria
2

momento r-esimo centrato di X Var Xn =
r
n
r = E X EX
legge dei grandi numeri
r = x k r p X x k , con = EX , per X discreta P {X n} 0 , per n
k
r = x f X xdx , per X continua

r stime
stima di = h
2
coefficiente di asimmetria (skewness) di una v.a. n

1

2
X con '3 finito S 2n X X , varianza campionaria
n 1
i n
misura l'assimetria di X rispetto al valore atteso =i 1
a campionamento effettuato:
di legge N , , allora:
n n 2
1 1 n
s2n x x 2= n1
n1 i=1 i n
xi2 n1 xn 2
Xn
i=1
~ t n 1
stima popolazione Normale S /n 2
n
= xn
calcoli con i quantili
= sn posto t n quantile -esimo della legge t(n):
2 2
se nota: P T t n=
n
1 P T t 1 n=
2 =
2
X i
n = i 1 P Tt 1 / 2 n=
stima popolazione Gamma P T t 1 / 2 n=
x x
2 t 1 n1 z 1 , approssimazione per n120
= 2n ; r = n2 2 2
sn sn
approssimazione di quantili tramite
leggi interpolazione lineare
y= mxq ,
legge Chi quadro con n gradi di libert
equazione della retta che passa per i punti {q 1, t q1 }, {q 2, t q 2 }
n 1
Y ~X n Y ~ , t q 2 t q 1
2
2 2 t x = t q 1 x q1 , con q1 x q 2
Xi sono v.a. indipendenti, ciascuna di legge N(0,1) q2 q1
n t
1
f Y t = c n t 2 e 2 , per t 0 legge di fisher con m e n gradi di libert
U/m
f Y t = 0 , per t 0 X ~ F m , n ; con X = , U ~ X 2m , V ~ X 2n
EY = n ; Var Y =2n V /n
propriet propriet
1
2 2
posto Y 1 ~ X n1 , Y 2 ~ X n 2 indipendenti: ~ F n , m
2 X
Y 1 Y 2 ~ X n1 n2 P X F m , n =
intervallo a cui una v.a. di legge Chi quadro appartiene con probabilit
:
1 1
P =1
P X 1 n Y X 1 n =
2 2 X F m , n
2 2 1
= F 1 n , m
approssimazione Normale di Chi quadro per n grande F m , n
2
X n N n , 2n , per n grande S1
2
= F m1,n 1
t n

2
P Y t S2
2n intervallo di confidenza al livello del 100% per
X n z 2n n
2
h()
approssimazioni Sia X 1, X 2, , X n un campione casuale estratto da una
Sia X i , X 2, , X n un campione casuale estratto da una popolazione popolazione di densit f x ; ; siano T 1=t 1 X 1, X 2, , X n ,
di legge N , , allora:
2
T 2 =t 2 X 1, X 2, , X n due statistiche, e sia h una funzione

n
X i del parametro che si vuole stimare; fissato un numero 0,1 ,

i =1
~ X 2 n l'intervallo aleatorio (T1, T2) si dice intervallo di confidenza al 100%

per h() se:
n
X X
i n ~ X 2 n1 P T 1 h T 2 =

i =1
a campionamento eseguito l'intervallo (t1,t2) si dice calcolato al
2
n1 S n campione;
~ X 2 n1 h() appartiene all'intervallo (t1, t2) con una confidenza del 100%;
2
t1 e t2 sono detti limiti di confidenza
S n e Xn sono tra loro indipendenti
2
intervallo di confidenza per la media

legge t di student a n gradi di libert (di una popolazione Normale o popolazione qualsiasi con n grande
T ~ t n ; con T =
Z
, Z ~ N 0,1 , Y ~ X n
2 n30 )
Y /n
= Xn z 1 / 2
= X n E , con varianza nota

n 1
t2 2 n
f T t = cn 1 , per t

2
n Sn
ET = 0 , tranne per n =1 per cui nonesiste finito Xn t 1 n1
= , con varianzaincognita
2
n
per t la t di student tende alla Normale standard
approssimazioni
Sia X i , X 2, , X n un campione casuale estratto da una popolazione
stima dell'ampiezza per limitare l'errore E0 H0 H1 rifiutare H0 se
2

n =t 1 / 2 n 1
2
2
, con varianza nota = 0 0 z z 1 / 2
E0
0 0 z z 1
intervallo di confidenza per la frequenza p
valido per una popolazione bernoulliana e per grandi campioni 0 0 z z 1
n30
test sulla media di una popolazione Normale di
p= X n z 1/2
n
X n 1 X n
; se: n xn5 , n1 xn 5
stima dell'ampiezza per limitare l'errore E0

varianza incognita
xn0
t=
sn / n

2
z 1/2
n= H0 H1 rifiutare H0 se
2E0
E 0 corrisponde a met dell'intervallo di confidenza. = 0 0 tt 1/ 2 n1
test di ipotesi 0 0 tt 1 n1
ipotesi statistica 0 0 t t1 n1
un'asserzione sul valore vero di un parametro incognito;
si dice semplice se specifica completamente il valore del parametro, test sulla frequenza p di una popolazione
altrimenti si dice composta bernoulliana
ipotesi nulla H0 xn p0
z=
H 0 : 0 p0 1 p0/ n
ipotesi che si ritiene vera fino a prova contraria; H0 H1 rifiutare H0 se
rifiuteremo H0 solo se i dati campionari forniranno una forte evidenza
statistica contro di essa p= p0 p p0 zz 1 /2
ipotesi alternativa H1 p p0 p p0 z z 1
H 1 : 0
ipotesi vera solo se H0 falsa p p0 p p0 z z 1
errore di tipo I test sulla differenza di due medie con varianze
rifiutiamo H0 quando vera;
questo considerato l'errore pi grave
note
estraiamo due campioni n,m da due popolazioni normali indipendenti
errore di tipo II con varianze note;
accettiamo H0 quando falsa questo test non va usato quando una varianza almeno 4 volte l'altra
regione critica o regione di rifiuto X nYm
z=

l'insieme R dei possibili risultati campionari che portano a rifiutare H0 2
X Y
2
data la regola di decisione: si rifiuti H 0 seT X 1, X 2, , X n I :

n n
R={ x1, x 2, , x n : T x1, x2, , x n I }
H0 H1 rifiutare H0 se
la probabilit di rifiutare H0 prima del campionamento:
P T X 1, X 2, , X n I

X =Y X Y z z 1 / 2
ampiezza del test (o livello di significativit) X Y X Y z z 1
=sup P T X 1, X 2, , X n I

0
X Y X Y z z 1
rappresenta la massima probabilit di rifiutare l'ipotesi nulla quando
questa vera; test sulla differenza di due medie con varianze
va stabilito piccolo a priori prima di eseguire il campionamento
incognite
p-value estraiamo due campioni n, m da due popolazioni normali indipendenti
numero pari al minimo livello di significativit a cui i dati campionari con varianze incognite;
consentono di rifiutare l'ipotesi nulla; questo test non va usato quando una varianza almeno 4 volte l'altra
se p-value = 0 siamo praticamente certi di non sbagliare X nYn
t=

varianza campionaria pesata 2 2
media pesata delle varianze campionarie di due campioni n, m 1 1 n1S X m1S Y

n n n m nm2
n1 S 2X m1 S 2Y i=1 X i Xn Y i Yn
i =1
S 2= = X =Y X Y tt 1/2 nm2
nm 2 n m 2
test sulla media di una popolazione Normale di X Y X Y tt 1 nm2
varianza nota X Y X Y tt1 n m2
xn 0
z= nel caso di campioni osservazioni accoppiate si considerano le
/n differenze delle medie
k
test su due frequenze di due popolazioni
bernoulliane indipendenti
classi A1 A2 ... Ak
i =1
estraiamo due campioni n, m da due popolazioni bernoulliane freq. rel. attese p1 p2 ... pk 1
indipendenti X ~ B p 1 , Y ~ B p 2 ; freq. ass. attese np 1 np 2 ... np k n
n m
freq. ass.
questa procedura valida se xi 5 ; y i 5 osservate
N1 N2 ... Nk n
i=1 i=1 2 2 2
scarti quad. np 1 N 1 np 2 N 2 np k N k
xn ym n xn m ym ... Q
z= con p= pesati np 1 np2 npk
1 1 nm
p 1 p le classi andranno accorpate in maniera tale che le frequenze assolute
n m attese siano tutte maggiori o uguali a 5;
H0 H1 rifiutare H0 se Chi quadro calcolato dal campione:
2
zz 1 /2
k
np i N i
p1= p2 p1 p2 Q=
=
i 1
npi
p1 p2 p1 p2 z z 1 2
Q X k1 per n , con pi assegnate a priori
p1 p2 p1 p2 z z 1 2
Q X k1r per n , con pi calcolate dopo
aver stimato r parametri incogniti
inferenze su una varianza
2 fissato , si stabilisce la regola di decisione:
n1 s n
2 si rifiuti H 0 se Q X 1 k 1 r (si calcola tramite tabelle)
2
X =
02 il p-value corrispondente al valore Q :
= P X Q , con X ~ X k 1r
2
2
=0
2 2
0
2 2 2
X X 1 /2 n1 o X X / 2 n1
2 2 test Chi quadro di indipendenza
verifica l'indipendenza o meno di due variabili;
2 2 2 2 2 2
0 0 X X 1 n1 si costruisce una tabella di contingenza di rs classi:
2 2 2 2 2 2
A1 A2 ... A r Tot.
0 0 X X n1 B1 n11 n 21 ... nr1 n1
intervallo di confidenza B2 n12 n 22 ... nr1 n2

... ... ... ... ... ...
n 1 s2n n1 s 2n Bs n 1s n 2s ... nrs ns
,
X 1 n 1 X 1 n 1
2 2
Tot. n 1 n2 ... nr n
2 2
inferenze su due varianze si costruisce una tabella di rs classi:

A1 A2 ... Ar
estraiamo due campioni n, m da due popolazioni normali indipendenti
con medie incognite; n1n1 n2n1 nrn1
2
B1 ...
s X
n n n
F= 2 n1n2 n2n2 nrn2
s Y B2 ...
n n n
... ... ... ... ...
2
=
2 2

2
F F 1/ 2 n1, m1 n1ns n2n s nrns
X Y X Y Bs ...
F F / 2 n1, m1 n n n
ni n j
2
X Y
2 2
X Y
2
F F 1 n1, m1 ciascuna delle frequenze attese deve essere: 5
n
2 2 2 2
F F 1 n1, m1 si calcola il chi-quadro:
X Y X Y 2
ni n j
intervallo di confidenza r s nij
n
Q=

2 2
1 sX 1 sX = =
ni n j
, i 1 j 1
F 1 n1, m1 s 2Y F 1 n1, m1 s 2Y n
2 2 fissato , si stabilisce la regola di decisione:
2
test Chi quadro di adattamento si rifiuti H 0 se Q X 1 r1 s1
ha lo scopo di verificare se certi dati empirici si adattino bene ad una (si calcola tramite tabelle)
distribuzione teorica assegnata;
si costruisce la seguente tabella: il p-value corrispondente al valore Q :
2
=P X Q , con X ~ X r1 s1

Formulario Statistica PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Formulario Statistica PDF

Caricato da

Copyright:

Formati disponibili

se vale zero indica che la distribuzione simmetrica rispetto alla media

Statistica descrittiva se positivo denota una coda verso destra

media campionaria di n osservazioni x1, x2, ..., xn

varianza di n osservazioni x1, x2, ..., xn regressione lineare

se np non intero: k l'intero successivo , Q p = x k

DEV REG = y i y ; DEV RES = yi y i

coefficiente di asimmetria (skewness)

famiglia di eventi indipendenti E aX 1 b= aEX 1b , per ogni a , b per v.a. continue

componenti in serie propriet

a=11a1 1a2 1an Var X 1 X 2 X n =VarX 1VarX 2VarX n ,

variabile aleatoria (v.a.) discreta covarianza

Cov aX , Y =aCov X , Y EX =np ; VarX = np1 p

disuguaglianza di Cebicev per k =n , n1, n2,. ..

EX =np ; VarX =np 1 p

momenti ed indici di forma per v.a. stima del parametro

r = x f X xdx , per X continua

coefficiente di asimmetria (skewness) di una v.a. n

intervallo di confidenza per la media

stima dell'ampiezza per limitare l'errore E0

data la regola di decisione: si rifiuti H 0 seT X 1, X 2, , X n I :

inferenze su due varianze si costruisce una tabella di rs classi:

Potrebbero piacerti anche