Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
all’econometria
Capitoli 1, 2 e 3
Variabili:
• Punteggi nei test del quinto anno (Stanford-9
achievement test, combinazione di matematica e
lettura), media del distretto
• Rapporto studenti/insegnanti (STR) = numero di
studenti nel distretto diviso per numero di insegnanti a
tempo pieno equivalente
Questa tabella non ci dice nulla sulla relazione tra punteggi nei
test e STR.
= 657,4 – 650,0
= 7,4
È una differenza da considerare grande nel mondo
reale?
– Deviazione standard tra i distretti = 19,1
– Differenza tra 60-esimo and 75-esimo percentili della
distribuzione dei punteggi nei test = 667,6 – 659,4 = 8,2
– È una differenza sufficientemente grande da risultare
importante per discussioni sulla riforma della scuola, per i
genitori o per un comitato scolastico?
e “large” (grande), e s
ns 1 i1
(Yi
Ys
) 2 2
(ecc.)
s
Ys Yl 657, 4 650,0 7, 4
t = 4,05
ss2
sl2 19,4 2
17,9 2 1,83
ns nl 238 182
( Ys – Yl ) ± 1,96×SE( Ys – Yl )
= 7,4 ± 1,96×1,83 = (3,8, 11,0)
Due affermazioni equivalenti:
1. L’intervallo di confidenza al 95% per Δ non include 0;
2. L’ipotesi che Δ = 0 è rifiutata al livello del 5%.
Popolazione
• Il gruppo o l’insieme di tutte le possibili unità di interesse
(distretti scolastici)
• Considereremo le popolazioni infinitamente grandi
(∞ è un’approssimazione di “molto grande”)
Variabile casuale Y
• Rappresentazione numerica di un risultato casuale
(punteggio medio nei test del distretto, STR del distretto)
asimmetria =
Y3
= misura di asimmetria di una distribuzione
• asimmetria = 0: la distribuzione è simmetrica
• assimmetria > (<) 0: la distribuzione ha una coda lunga
destra (sinistra)
E Y Y
4
curtosi = Y4
= misura di massa nelle code
= misura di probabilità di valori grandi
• curtosi = 3: distribuzione normale
• curtosi > 3: code pesanti (“leptocurtica”)
E così la correlazione…
cov( X , Z ) XZ
corr(X,Z) = = rXZ
var( X ) var(Z ) X Z
• –1 ≤ corr(X,Z) ≤ 1
• corr(X,Z) = 1 significa associazione lineare positiva perfetta
• corr(X,Z) = –1 significa associazione lineare negativa
perfetta
• corr(X,Z) = 0 significa che non c’è associazione lineare
Distribuzione condizionata
• La distribuzione di Y dato il valore (o i valori) di un’altra
variabile casuale X
• Es: la distribuzione dei punteggi nei test dato STR < 20
Valore atteso condizionato e momento condizionato
• media condizionata = media della distribuzione condizionata
– = E(Y|X = x) (concetto e notazione importanti)
• varianza condizionata = varianza della distribuzione
condizionata
• Esempio: E(Punteggio test|STR < 20) = media dei punteggi
nei test tra i distretti con dimensioni delle classi piccole
La differenza in media è la differenza tra le medie di due
distribuzioni condizionate:
Stima
Y è lo stimatore naturale della media. Ma:
a) quali sono le proprietà di Y?
b) Perché dovremmo usare Y anziché un altro stimatore?
• Y1 (prima osservazione)
• forse pesi non uniformi – non media semplice
• mediana(Y1,…, Yn)
Il punto di partenza è la distribuzione campionaria di Y…
Copyright © 2012 Pearson Italia, Milano – Torino
1-30
(a) La distribuzione campionaria di Y
• Qual è la media di Y ?
– Se E( Y ) = μ = 0,78, allora Y è uno stimatore non
distorto di μ
• Qual è la varianza di Y ?
– In che modo var( Y ) dipende da n (famosa formula 1/n)
• Si avvicina a μ quando n è grande?
– Legge dei grandi numeri:Y è uno stimatore consistente
di μ
• Y – μ assume forma a campana per n grande...
questo è vero in generale?
– In effetti, Y – μ è approssimato da una distribuzione
normale per n grande (teorema limite centrale)
= E[ Y – μY]2
2
1 n
= E Yi Y
n i1
2
=E 1
n
(Yi Y )
n i1
Copyright © 2012 Pearson Italia, Milano – Torino
1-35
2
1 n
quindi var( Y ) = E (Yi Y )
n i1
1 n 1 n
= E (Yi Y ) (Y j Y )
n i1 n j1
1 n n
= 2 E (Yi Y )(Y j Y )
n i1 j1
1 n n
= 2 cov(Yi ,Y j )
n i1 j1
1 n 2
= n2 Y
i1
Y2
= n
Copyright © 2012 Pearson Italia, Milano – Torino
1-36
Media e varianza della distribuzione
campionaria di Y (continua)
E( Y ) = μY
Y2
var( Y ) =
n
Implicazioni:
• Y è uno stimatore non distorto di μY (cioè E( Y ) = μY)
• var(Y ) è inversamente proporzionale a n
– la dispersione della distribuzione campionaria è
proporzionale a 1/ n
– Quindi l’incertezza campionaria associata con Y
è proporzionale a 1/ n (grandi campioni, meno
incertezza, ma legge con radice quadrata)
p
– Y μY (Legge dei grandi numeri)
Y E(Y )
– var(Y ) è approssimata da N(0,1) (TLC)
• Y è non distorto: E( Y ) = μY
p
• Y è consistente: Y μY
• Y è lo stimatore “dein minimi quadrati” di μY; Yrisolve
min m (Yi m)2
i1
act
Dove Y è il valore di Y effettivamente osservato (non
casuale)
Y Y ,0 Y act Y ,0
= PrH0 [| / n || / n |]
Y Y
Y Y ,0 Y Y ,0
act
= PrH [| 0
||
|]
Y Y
~ probabilità sotto code N(0,1) sin+destra
=
dove Y = dev. std della distribuzione di Y = σY/ n.
1 n
2
s Y = (Yi Y )2 = “varianza campionaria di Y”
n 1 i1
Y Y ,0 Y act Y ,0
= PrH [| || |]
0
Y / n Y / n
Y Y ,0 Y act Y ,0
~ Pr [|
= || |]
H (n grande)
0
sY / n sY / n
qindi
valore-p =PrH [| t || t act |] ( Y2 stimato)
0