Sei sulla pagina 1di 2

MODELLI STATISTICI I

Prova d’esame del 29 agosto 2014


1. Si considerino i seguenti modelli di regressione:
β2
Y i = β1 + + β4 xi2 + σεi (1)
1 + β3 xi1
Yi = (β1 + β2 xi1 + β3 xi2 + σεi )−1 (2)
xi1
Yi = β1 + β2 + 2εi (3)
xi2
s
εi
Yi = β1 xi1 + β2 xi2 + (4)
xi2
con (x1j , . . . , xnj ), per j = 1, 2, vettori di costanti positive fissate, (ε1 , . . . , εn ) varia-
bili casuali N (0, 1) indipendenti, β1 , β2 , β3 , β4 parametri reali ignoti e σ parametro
ignoto positivo.

(a) Si dica, giustificando le risposte, quali dei modelli possono essere scritti nel-
la forma del modello di regressione lineare, eventualmente dopo opportune
trasformazioni.
(b) Per i modelli che soddisfano le assunzioni, eventualmente dopo opportune
trasformazioni, si fornisca la matrice di regressione X.
(c) Per i modelli di cui al punto (b), si scriva lo spazio parametrico.
(d) Per i modelli di cui al punto (b), si indichi la varianza della variabile risposta,
dopo l’eventuale opportuna trasformazione.
(e) Per i modelli di cui al punto (b), si indichi la dimensione dello spazio V generato
dai vettori colonna della matrice X.
(f) Per i modelli di cui al punto (b), siano e1 , . . . , en i residui della regressione. Per
ciascuno di tali modelli si indichi quali delle seguenti identità sono soddisfatte:
n n n n
xi1
ei x2i2
X X X X
ei xi1 = 0 , =0, ei = 0 , ei =0.
i=1 i=1 i=1 i=1 xi2
2. Il dataset dati contiene la variabile risposta y, il regressore quantitativo x1 e il
regressore dicotomico x2 (x2 assume i valori 0 e 1). Un modello di regressione
lineare stimato su tali variabili mediante la funzione lm() di R, ha fornito il seguente
output:

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.6311 0.4525 5.815 9.0e-06 ***
x1 0.7830 0.1991 3.934 0.000761 ***
x2 -3.8747 0.6254 -6.196 3.8e-06 ***
x1:x2 0.3823 0.2439 1.568 0.131919

Residual standard error: 0.9266 on 21 degrees of freedom


Multiple R-squared: 0.8583,Adjusted R-squared: 0.838
F-statistic: 42.4 on 3 and 21 DF, p-value: 4.343e-09
(a) Si scrivano i comandi R per svolgere l’analisi.
(b) Si scriva il modello statistico corrispondente e si fornisca l’espressione del
modello stimato.
(c) Si rappresenti graficamente il modello stimato al punto (b).
(d) Si conduca il test t per verificare l’ipotesi nulla che pone il coefficiente di x1
pari a 1.
(e)vo Si fornisca una previsione sulla variabile risposta per x1=3 e x2=1.
(f)vo Si completino i risultati parziali della seguente analisi:
Analysis of Variance Table

Model 1: y ~ x1 + x2
Model 2: y ~ x1 + x2 + x1:x2
Res.Df RSS Df Sum of Sq F Pr(>F)
1 ? 20.138
2 ? ? ? ? ? ?
(g)vo Si specifichi l’ipotesi nulla e l’ipotesi alternativa del test sviluppati nel punto
(f)vo . Si scrivano i comandi di R che producono i risultati mostrati.

3. Siano y realizzazioni indipendenti di variabili casuali di Poisson con media µi , per


i = 1, . . . , 50. Siano inoltre x1 e x2 due variabili dicotomiche, che assumono valore
0 o 1, di lunghezza 50. Un modello di regressione di Poisson stimato su tali variabili
mediante la funzione glm() di R, ha fornito il seguente output:

glm(formula = y ~ x1 + x2, family = poisson)

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.6300 0.3695 -4.411 ??
x1 1.5892 ?? ?? 1.63e-02
x2 1.8257 0.3143 ?? ??

Null deviance: 78.664 on ?? degrees of freedom


Residual deviance: 37.059 on ?? degrees of freedom

(a) Si scriva il modello statistico corrispondente e si fornisca l’espressione del


modello stimato.
(b) Si completino i risultati dell’output di R.
(c) Si fornisca un intervalo di confidenza di livello 0.95 per il coefficiente di x2.
(d) Si conduca il test per confrontare il modello stimato con il modello con la sola
intercetta.

Potrebbero piacerti anche