Sei sulla pagina 1di 4

CASCHOOL GRETL

TEST SCR & STR


STR TESTSCR STUDENT TEACHER RATIO AVG TEST SCORE Totale iscritti/Numero di insegnanti Media dei punteggi ottenuti nelle prove di lettura e di mate ENRL_TOT/TEACHERS (READ_SCR+MATH_SCR)/ 2

Statistiche descrittive, usando le osservazioni 1 - 420 per la variabile str (420 osservazioni valide) Media Mediana Minimo 19,6404 19,7232 14,0000 Dev. Std. Coeff. di variazione Asimmetria 1,89181 0,0963223 -0,0253655

Massimo 25,8000 Curtosi 0,609597

Statistiche descrittive, usando le osservazioni 1 - 420 per la variabile testscr (420 osservazioni valide) Media Mediana Minimo Massimo 654,157 654,450 605,550 706,750 Dev. Std. Coeff. di variazione Asimmetria Curtosi 19,0533 0,0291266 0,0916151 -0,254288 Matrice di correlazione corr(str, testscr) = -0,22636275 Sotto l'ipotesi nulla di non correlazione: t(418) = -4,75133, con p-value a due code 0,0000
correlazione campionaria = - 0.23 : classi pi numerose hanno punteggi inferiori nei test

Grafico X-Y a dispersione


testscr rispetto a str (con retta dei minimi quadrati) 720 Y = 699, - 2,28X

700

680

testscr

660

MODELLO

640

OLS

620

600 14 16 18 20 str 22 24 26

Modello 1: OLS, usando le osservazioni 1-420 Variabile dipendente: testscr Errori standard robusti rispetto all'eteroschedasticit, variante HC1 const str Coefficiente 698,933 -2,27981 Errore Std. 10,3644 0,519489 rapporto t 67,4362 -4,3886 p-value <0,00001 0,00001 *** ***

Media var. dipendente Somma quadr. residui R-quadro F(1, 418) Log-verosimiglianza Criterio di Schwarz

654,1565 144315,5 0,051240 19,25943 -1822,250 3656,580

SQM var. dipendente E.S. della regressione R-quadro corretto P-value(F) Criterio di Akaike Hannan-Quinn

19,05335 18,58097 0,048970 0,000014 3648,499 3651,693

Retta di regressione lineare: TESTSCR = 698,933 2,28 STR Lerrore standard per la stima di 1 0,52 mentre lerrore standard per la stima di 0 10,4. La pendenza negativa indica che ad un maggior numero di studenti per insegnante associato sono associati punteggi nei test inferiori. Dunque un incremento nel rapporto studenti-insegnati di 1 alunno per classe associato ad una riduzione nei punteggi dei test, a livello di distretto, di 2,28 punti. LR2 pari a 0.051 indica che il regressore STR spiega il 5.1% della varianza della variabile dipendente TESTSCR. LR2 basso ci dice che altri importanti fattori influenzano i punteggi. Il SER indica che 18.6 la deviazione standard dei resisui della regressione, cio indica che vi unampia dispersione nel grafico a nuvola intorno alla retta di regressione. Tale ampia dispersione indica che previsione fatte usando solo il rapporto studenti-insegnanti per quel distretto saranno spesso largamente sbagliate. Si supponga di voler verificare ad un livello di significativit del 5 % lipotesi nulla H0 : 1 = 0. La statistica t fornisce il valore t = -4,38 e | t | > 1,96 dunque rifiutiamo la nulla al livello di significativit del 5 % . Intervalli di confidenza per i coefficienti: t(418, 0,025) = 1,966 Variabile const str Coefficiente 698,933 -2,27981 Intervallo di confidenza al 95 (678,560, 719,306) (-3,30095, -1,25867)

Il valore 1 = 0 non appartiene allintervallo di confidenza (-3,30, -1,26) e quindi lipotesi nulla 1 = 0 pu essere rifiutato al livello di significativit del 5 %. Lintervallo di confidenza al 95 % per 1 pu essere usato per costruire un intrevallo di confidenza al 95 % per una generica variazione di X. Analizziamo leffetto della riduzione di 2 unit del rapporto insegnanti-studenti. Leffetto della riduzione varia nellintervallo -2 * (-3,30, -1,26) = (2,52 , 6,60) e perci riducendo di due unit il

numero di studenti per insegnante si pu predire un aumento di punteggio nei test compreso tra 2,52 e 6,60 punti con livello di confidenza 95 %. Verifica di ipotesi sul coefficiente di regressione
Vincolo: b[str] = 0 Statistica test: F robusta(1, 418) = 19,2594, con p-value = 1,44674e-005 Stime vincolate: coefficiente errore std. rapporto t p-value -----------------------------------------------------------const 654,157 0,929708 703,6 0,0000 *** str 0,000000 0,000000 NA NA Errore standard della regressione = 19,0533

p-value = 0,0000144 = ( -4,38 ) Dunque questa probabilit circa lo 0,001 % cio se lhp nulla fosse vera, la probabilit di ottenere un valore dello stimatore di 1 lontano dalla nulla almeno quanto il valore effettivamente calcolato inferiore allo 0,001 % e poich tale evento improbabile ragionevole concludere che la nulla sia falsa.

TEST SCR & CLASSPICCOLE


CLASS PICCOLE TESTSCR STUDENT V.a. binaria 1 se str < TEACHER RATIO 20 0 se str > 20 AVG TEST Media dei punteggi ottenuti nelle prove di lettura e di mate SCORE STR < 20 (READ_SCR+MATH_SCR)/ 2

Modello 6: OLS, usando le osservazioni 1-420 Variabile dipendente: testscr Errori standard robusti rispetto all'eteroschedasticit, variante HC1 const classpiccole Coefficiente 649,979 7,37241 Errore Std. 1,32289 1,82358 rapporto t 491,3317 4,0428 p-value <0,00001 0,00006 *** ***

Media var. dipendente Somma quadr. residui R-quadro F(1, 418) Log-verosimiglianza Criterio di Schwarz

654,1565 146504,0 0,036852 16,34445 -1825,410 3662,901

SQM var. dipendente E.S. della regressione R-quadro corretto P-value(F) Criterio di Akaike Hannan-Quinn

19,05335 18,72133 0,034548 0,000063 3654,821 3658,015

Retta di regressione lineare: TESTSCR = 649,98 + 7,37 CLASSPICCOLE

Il punteggio medio ottenuto nel test per la parte di campione con rapporto studenti-insegnanti > 20 650 mentre il punteggio medio nei test per il sottocampione con rapporto studenti-insegnanti < 20 650 + 7,4 = 657,4. La differenza tra i punteggi medi 7,4 e questa la stima per il coefficiente OLS di 1 ossia il coefficiente relativo alla variabile binaria rapporto studenti-insegnanti. La statistica t relativa a 1 t = 4,0428. poich | t | > 1,96 la nulla H0 : 1 = 0, ossia che i punteggi medi nei test dei distretti con rapporto stud-insegnanti alto e basso siano gli stessi, pu essere rifiutata al livello del 5 %.
Vincolo: b[classpiccole] = 0 Statistica test: F robusta(1, 418) = 16,3444, con p-value = 6,28795e-005 Stime vincolate: coefficiente errore std. rapporto t p-value ---------------------------------------------------------------const 654,157 0,929708 703,6 0,0000 *** classpiccole 0,000000 0,000000 NA NA Errore standard della regressione = 19,0533

Intervalli di confidenza t(418, 0,025) = 1,966 Variabile const classpiccole Coefficiente 649,979 7,37241 Intervallo di confidenza al 95 (647,378, 652,579) (3,78788, 10,9569)

Lintervallo di confidenza al 95 % per la vera differenza tra le medie (7.38 1.82*1.96 , 7,38 1.82*1,96) = (3.9 , 10.9) e poich esse eclude 1 = 0, lipotesi 1 = 0 pu essere rifiutata al livello 5%.