Sei sulla pagina 1di 21
1
1

ECONOMETRIA

ESERCITAZIONE 1

valentina.tonei@studio.unibo.it

http://www2.dse.unibo.it/orsi/econometria

1 E CONOMETRIA E SERCITAZIONE 1 valentina.tonei@studio.unibo.it http://www2.dse.unibo.it/orsi/econometria
S OMMARIO Nel corso di questa esercitazione ci occuperemo di: Introduzione al software econometrico Gretl

SOMMARIO

Nel corso di questa esercitazione ci occuperemo di:

Introduzione al software econometrico Gretl

Statistiche descrittive

Utilizzo di dataset in Gretl

Esempio di analisi econometrica con dati sezionali

2
2
I NTRODUZIONE A G RETL Il software che utilizziamo per l’analisi dei dati è Gretl:

INTRODUZIONE A GRETL

Il software che utilizziamo per l’analisi dei dati è Gretl:

software che utilizziamo per l’analisi dei dati è Gretl: Il software può essere scaricato dal sito:

Il software può essere scaricato dal sito:

http://gretl.sourceforge.net/gretl_italiano.html#dl 3

dei dati è Gretl: Il software può essere scaricato dal sito: http://gretl.sourceforge.net/gretl_italiano.html#dl 3
dei dati è Gretl: Il software può essere scaricato dal sito: http://gretl.sourceforge.net/gretl_italiano.html#dl 3
Nel sito troviamo: Programma di installazione Manuali Dataset 4

Nel sito troviamo:

Programma di installazione Manuali Dataset

4
4
I MPORTAZIONE DEI DATI I dati di interesse possono: Essere già presenti nei dataset di

IMPORTAZIONE DEI DATI

I dati di interesse possono:

Essere già presenti nei dataset di Gretl Essere disponibili nel formato di Gretl Essere disponibili in altri formati

testo (.txt, .csv, …) foglio di calcolo (.xls, .ods, …) altri software econometrici (E-views, STATA …)

5
5
Si carichi il file dataset_scuola.xls In questo caso abbiamo un file excel con dati sezionali.

Si carichi il file dataset_scuola.xls

In questo caso abbiamo un file excel con dati sezionali. Purtroppo il software può dare problemi nell’importazione dei dati. Per evitarli è utile:

Copiare il file excel sul desktop Inserire solo le serie dei dati che ci interessano

NB: una volta che i dati sono stati importati, il dataset può essere salvato nel formato di Gretl.

6
6
N OZIONI DI BASE SULL ’ UTILIZZO DI G RETL The main window menù :

NOZIONI DI BASE SULLUTILIZZO DI GRETL

The main window menù: da queste tendine è possibile accedere a tutte le funzioni di Gretl

The Gretl toolbar: in questa barra (posizionata in basso) sono presenti scorciatoie utili (es. alla regressione OLS) e l’accesso a due finestre molto importanti :

Terminale di Gretl Finestra icone

7
7
T ERMINALE DI G RETL Dal terminale di Gretl è possibile richiamare ed eseguire qualsiasi

TERMINALE DI GRETL

Dal terminale di Gretl è possibile richiamare ed eseguire qualsiasi operazione che Gretl è in grado di compiere.

Informazioni sui comandi sono reperibili digitando:

help: se si desidera ottenere una lista dei comadi help [comando]: se si desidera ottenere una descrizione sull’utilizzo di un particolare comando. Il software è accompagnato da un manuale esaustivo sui comandi (Gretl command reference)

8
8
F INESTRA ICONE Dalla finestra icone è possibile avere accesso ad informazioni sul dataset e

FINESTRA ICONE

Dalla finestra icone è possibile avere accesso ad informazioni sul dataset e sui risultati ottenuti dall’elaborazione dei dati (qualora siano stati salvati). In particolare:

Informazioni sui dati Note di commento alla sessione Dataset (mostra le serie) Statistiche descrittive, correlazioni e grafici Modelli utilizzati per ottenere stime

9
9
T ORNANDO ALL ’ ESEMPIO … Dataset con dati sezionali, relativi all’anno 1998 in 420

TORNANDO ALLESEMPIO

Dataset con dati sezionali, relativi all’anno 1998 in 420 distretti della California

DIST_CODE READ_SCR

MATH SCR

_

COUNTRY DISTRICT GR_SPAN ENRL_TOT TEACHERS COMPUTERS TESTSCR COMP_STU

EXPN_STU STR AVGINC EL_PCT

10
10
DISTRICT GR_SPAN ENRL_TOT TEACHERS COMPUTERS TESTSCR COMP_STU EXPN_STU STR AVGINC EL_PCT 10
Il problema che viene posto al provveditore di un distretto scolastico è il seguente: deve

Il problema che viene posto al provveditore di un distretto scolastico è il seguente: deve decidere se assumere altri insegnanti e ridurre il numero di studenti per classe, con lo scopo di incrementare il rendimento scolastico degli studenti

Si tratta di confrontare i costi con i benefici.

Costi → salario dei “nuovi “ professori Benefici → miglioramento del rendimento scolastico

Come analizzare la relazione?

11
11
 

OUTPUT DI GRETL

Rapporto medio studenti insegnanti (STR)

Statistiche descrittive, usando le osservazioni 1 - 420 per la variabile 'str' (420 osservazioni valide)

 

Media

19,640

Mediana

19,723

Minimo

14,000

Massimo

25,800

Scarto quadratico medio Coeff. di variazione Asimmetria

1,8918

0,096322

-0,025365

Curtosi

0,60960

Grafico a nuvola di queste 420 osservazioni sui punteggi del test e sul rapporto studenti insegnanti

Correlazione campionaria

12
12
O UTPUT DI GRETL : testscr rispetto a str (con retta dei minimi quadrati) 720

OUTPUT DI GRETL:

testscr rispetto a str (con retta dei minimi quadrati)

720 Y = 699, - 2,28X 700 680 660 640 620 600 13 14 16
720
Y = 699, - 2,28X
700
680
660
640
620
600
13
14
16
18
20
22
24
26
testscr

str

dei minimi quadrati) 720 Y = 699, - 2,28X 700 680 660 640 620 600 13
O UTPUT DI GRETL Matrice di correlazione: corr(testscr, str) = -0,22636275 14

OUTPUT DI GRETL

Matrice di correlazione:

corr(testscr, str) = -0,22636275

14
14
I NTRODUCIAMO IL MODELLO DI REGRESSIONE LINEARE Introduciamo un modello statistico semplice per descrivere

INTRODUCIAMO IL MODELLO DI

REGRESSIONE LINEARE

Introduciamo un modello statistico semplice per descrivere quantitativamente questa relazione

Il modello che utilizziamo è il modello di regressione lineare semplice

Y

i

è il modello di regressione lineare semplice Y i = 0 Variabile dipendente + x +

=

0

Variabile dipendente

+ x + altro 1 i i Variabile indipendente o regressore Termine d’errore 15
+
x + altro
1
i
i
Variabile
indipendente o
regressore
Termine
d’errore
15
Y i = 0 Variabile dipendente + x + altro 1 i i Variabile indipendente o
Ipotesi del modello lineare: Linearità: la funzione di regressione è lineare, ossia y i è

Ipotesi del modello lineare:

Linearità: la funzione di regressione è lineare, ossia y i è indipendente in media da x j dove i ≠ j

Omoschedasticità: la varianza condizionale è costante e non varia a seconda del valore delle variabili esplicative

Incorrelazione: le osservazioni y i sono tra loro incorrelate, subordinatamente a x

16
16
I L MODELLO DI REGRESSIONE LINEARE CON UN SINGOLO REGRESSORE Ciò a cui siamo interessati

IL MODELLO DI REGRESSIONE LINEARE

CON UN SINGOLO REGRESSORE

Ciò a cui siamo interessati è β 1 che rappresenta l’effetto di una variazione di del numero di studenti per classe sul punteggio al test standardizzato

TestScore =

i

0

+

1

STR +

i

i

Purtroppo non conosciamo il valore del coefficiente per la popolazione di riferimento, pertanto dobbiamo stimarlo, attraverso il metodo dei MQO

17
17
I L METODO DEI MINIMI QUADRATI ORDINARI Il metodo più utilizzato è quello dei minimi

IL METODO DEI MINIMI QUADRATI

ORDINARI

Il metodo più utilizzato è quello dei minimi quadrati ordinari

Considerando il modello nei seguenti termini:

Y

i

y

i

=

=

E

(

0

y

i

+

x ) + x

1

i

i

+

i

Lo stimatore dei MQO è quello che fornisce i valori dei parametri della popolazione tali da minimizzare la somma dei quadrati degli scarti, cioè minimizzano l’errore definito come scarto quadratico medio.

18
18
min 0, 1 S ( 0, 1 ) = n ∑ i = 1 (

min

0,

1

S

(

0,

1

)

=

n

i = 1

(

y

i

0

1

x

i

)

2

Dalle soluzioni del sistema delle equazioni

troviamo le stime dei parametri

residui

ˆ

ˆ

0

ˆ

1

e dei

Nel nostro esempio otteniamo come output di Gretl relativo alla stima del modello con i MQO:

19
19

IL METODO DEI MQO : LOUTPUT DI GRETL

Modello 1: OLS, usando le osservazioni 1-420 Variabile dipendente: testscr

 
 

coefficiente

errore std.

rapporto t

p-value

--------------------------------------------------------------

 

const

698,933

9,46749

73,82

6,57e-242 *** 2,78e-06 ***

str

-2,27981

0,479826

-4,751

654,1565

SQM var. dipendente

19,05335

Media var. dipendente Somma quadr. residui

144315,5

E.S. della regressione 18,58097

R-quadro

0,051240

R-quadro corretto

0,048970

F(1, 418)

22,57511

2,78e-06

Log-verosimiglianza -1822,250

P-value(F) Criterio di Akaike Hannan-Quinn

3648,499

Criterio di Schwarz

3656,580

3651,693

Note: SQM = scarto quadratico medio; E.S. = errore standard

20
20
La pendenza della retta definita con i MQO è - 2.28 → un incremento nel

La pendenza della retta definita con i MQO è - 2.28 → un incremento nel rapporto studenti- insegnanti di uno studente per classe è mediamente associato a una riduzione nel punteggio di 2.28 punti.

La pendenza negativa della retta indica una relazione negativa tra numero di studenti per classe e punteggio al test.

Predizione perfetta? No!

21
21