Sei sulla pagina 1di 2

Cognome ........................................... Nome .............................. Matricola ............... Crediti .........

Inferenza Statistica gennaio 2016


Simulazione (seconda parte desame)
Il candidato deve:
scrivere cognome, nome, numero di matricola e numero di crediti da conseguire sul presente foglio;
scrivere cognome, nome e numero di matricola sulla prima facciata del primo foglio delle soluzioni
lasciando il resto della prima facciata vuoto;
fornire i vari passaggi dei calcoli eseguiti considerando, ove necessario, almeno 4 cifre decimali.

Esercizio 1
Uno psicologo del lavoro ipotizza che linsoddisfazione per il livello retributivo porti il lavoratore a un
maggior assenteismo. Per verificare tale ipotesi 400 lavoratori di unindustria privata sono stati classificati
secondo il grado di soddisfazione per il livello retributivo da loro espresso. Inoltre per ogni lavoratore stato
rilevato il numero di assenze dal lavoro fatte in un anno. I risultati ottenuti sono riportati nella tabella.
Livello di
soddisfazione
Basso
Medio
Alto

Livello di astensionismo
Basso
Medio
Alto
50
50
80
40
60
30
60
25
5

Verificare, al livello di significativit del 10%, lipotesi dindipendenza tra insoddisfazione e assenteismo.
Esercizio 2
Presi due campioni di 20 universit dellItalia del Nord e 20 dellItalia del Sud, la spesa media per la ricerca
risulta pari rispettivamente a 271 (migliaia di euro) con s.q.m. corretto di 200 e 176 con s.q.m. di 150.
a) Verificare, al livello di significativit del 5%, se le varianze delle due popolazioni possono essere
considerate uguali.
b) Verificare lipotesi nulla che non vi sia in media differenza di spesa media tra nord e sud, al
livello di significativit del 10%.
c) Verificare luguaglianza tra le medie nellipotesi che le due varianze siano note e pari
rispettivamente a 4000 e 3600, al livello di significativit del 10% e del 5%.
Esercizio 3
Un piano di campionamento prevede che si accetti lipotesi nulla H 0 : = 200 se la media di un campione
bernoulliano di n = 64 unit risulta inferiore al valore k = 201 . Dopo aver introdotto le opportune ipotesi e
sapendo che la popolazione ha uno scarto quadratico medio = 16 , determinare:
a) la probabilit dellerrore di prima specie ;
b) la potenza del test nelle seguenti ipotesi alternative H1 :

= 202,

= 204,

= 206,

= 208.

Esercizio 4
Nel file Attitude.xls sono forniti i dati provenienti da un sondaggio su 30 dipendenti di una grande
organizzazione finanziaria finalizzato a misurare il gradimento dei dipendenti verso la loro organizzazione
(variabile rating). Si sono rilevati dati relativi alla percentuale di risposte favorevoli a sei domande misuranti
diversi aspetti del loro lavoro in azienda: complaints (venire incontro alle lamentele/esigenze degli
impiegati), privileges (non permettere privilegi speciali); learning (opportunit di imparare); raises (aumento
stipendio basato sulla performance); critical (eccessivo rigore critico); advance (avanzamento carriera).
Nellottica di un modello lineare in cui si vuole studiare il gradimento dei dipendenti in relazione ai diversi
aspetti del lavoro.
a) Ottenere con la procedura manuale (seguendo cio la procedura dei prodotti matriciali) le stime dei
parametri i, i conseguenti valori stimati di Yi e i residui ei.

b) Valutare, con unopportuna rappresentazione grafica, lipotesi di normalit dei residui. Commentare
i risultati.
c) Attraverso la funzione per lanalisi di regressione di Excel, individuare il miglior modello in termini
di bont di adattamento e di significativit (al 90%) dei parametri (scrivere lequazione del modello
migliore e indicare la bont di adattamento).
d) Dato il modello migliore identificato al punto precedente, calcolare la stima di previsione del
rating dellorganizzazione avente i seguenti valori di regressori: complaints = 60; privileges = 50;
learning = 55; raises = 65; critical = 75; advance = 40.
e) Verificare, tramite il calcolo degli opportuni indici, leventuale presenza di multicollinearit tra tutti i
regressori del modello migliore identificato al punto c) e commentare i risultati.
f) Considerando il modello con un solo regressore (quello pi significativo di tutti), calcolare
lintervallo di confidenza dato dalla formula sotto, per la previsione della stima e rappresentarlo
graficamente.

SS
I = y 0 t 2 (n 2 )
(n 2)

1 (x0 x )2
SS
+
; y 0 + t 2 (n 2 )
(n 2)
SS x
n

1 (x0 x )2
+
,
n
SS
x

g) Considerando il modello con tutti i sei regressori, calcolare il p-value per il coefficiente della
variabile complaints avente statistica test = 2.8 e gradi di libert pari a (n-1-p) (dove n il numero
delle osservazioni totali e p il numero di regressori).
Domanda 1
Del titolo Ferrari quotato alla borsa di New York il 20 ottobre 2015, giorno del suo esordio, si sono osservate
le rilevazioni del volume di azioni scambiate (X) e i relativi prezzi (in $) nei primi 50 giorni, che si
50

riferiscono a un pacchetto azionario detenuto da un gruppo di investitori. Sapendo che

2
t

= 648, 5266 e

t=1
50

che

(e e )
t

t1

= 421,1142 valutare con opportuni strumenti lesistenza di autocorrelazione tra gli errori.

t=2

Domanda 2
Dire se sono vere o false le seguenti affermazioni.
A

Lampiezza dellintervallo di confidenza di E (Y0 | x0 ) costante al variare


di x0.

Vero
B

Falso

Lindice di bont di adattamento R2 dato da: 1


Vero

Devianza spiegata
Devianza Totale

Falso
2

Lindice di bont di adattamento R corretto dato da


C

n 1
~
R 2 = 1 1 R2
n (k + 1)

Vero

Falso

N.B. Restituire tramite Esse3 un file (pdf, Word, Excel) in cui siano riportati i risultati e le principali
osservazioni (si pu anche inviare un file per i risultati e uno delle elaborazioni in Excel).