Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1) Si vuole svolgere una ricerca di mercato, sulle preferenze politiche dei residenti di una piccola città.
Si identificano 3 fasce d’età e si raccoglie un campione in cui la distribuzione delle fasce d’età è
confrontabile con quella dei residenti dell’intera città, tutti i dati vengono raccolti tramite interviste
face to face davanti al centro commerciale locale. Di che tipo di campionamento si tratta?
A) Sono tutte false (Risposta corretta, perché questo è un campionamento per quote, infatti ho
definito le quote che sono le fasce d’età, e all’interno di queste fasce d’età ho fatto un
campionamento per convenienza, dove la convenienza in questo caso è stato andare di fronte
al centro commerciale locale)
B) Campionamento stratificato (FALSO, è simile perché comunque si selezionano degli strati, in
questo caso le fasce d’età, ma nel campionamento stratificato nelle fasce d’età si fa a sua volta
un campionamento casuale. Cosa che non è stata fatta nel nostro caso, perché abbiamo fatto il
campionamento davanti al centro commerciale)
C) Campionamento casuale semplice (FALSO)
D) Campionamento a grappoli (FALSO, perché in questo tipo di campionamento si scelgono dei
cluster randomici, ad esempio aree geografiche, cose che in questo caso non è stata fatta)
E) Campionamento a scelta ragionata (FALSO, perché in questo tipo di campionamento vengono
scelti ad HOC secondo delle logiche prestabilite).
A) Rappresenta la dispersione dei dati attorno al valore mediano di X (FALSO, perché la varianza
rappresenta la dispersione attorno al valore medio e NON mediano)
B) Assume valori compresi tra -∞ e +∞ (FALSO, perché nella formula c’è un elevamento al quadrato,
quindi varianza sempre positiva)
C) Espressa nella stessa unità di misura della variabile X (FALSO, perché l’elevamento al quadrato,
l’unità di misura è il quadrato dell’unità di misura della variabile originale. La deviazione standard
che è la radice quadrata della varianza avrà la stessa unità di misura)
D) È variabilità di misura relativa (FALSO, misura di variabilità assoluta)
E) Sono tutte false (RISPOSTA GIUSTA)
4) In un’analisi di connessione una volta eseguito il test con esito di rifiuto di H0, quindi il rifiuto dell’ipotesi
nulla, si osserva che l’indice di chi quadro pari a 2.18
A) Possiamo affermare che il grado tra le due variabili è forte (FALSO, il valore dell’indice chi quadro
non è sufficiente per dare una valutazione della forza della relazione)
B) Possiamo affermare che il grado tra le due variabili è debole (FALSO, il valore dell’indice chi quadro
non è sufficiente per dare una valutazione della forza della relazione)
C) Le due Variabili sono statisticamente indipendenti (FALSO, perché noi abbiamo rifiutato l’ipotesi
nulla di indipendenza)
D) L’indice chi quadro non è sufficiente per valutare la forza della relazione (RISPOSTA GIUSTA, per
verificare la forza della relazione serve il Cramer V)
E) Sono vere B e C
5) Siano X e Y due variabili quantitativa, il p-value del test di indipendenza lineare tra X e Y è 0.012, mentre
il coefficiente di correlazione lineare p (ro) è 0,18, avendo fissato il livello di significatività di 0,05, si può
concludere che? (p-value o,012 quindi minore del nostro livello alfa, e coefficiente di correlazione ro è
0,018)
A) Le due variabili sono dipendenti in media (FALSO, la dipendenza in media non ha nulla a che fare
con lo studio di due variabili quantitative)
B) Si rifiuta l’ipotesi nulla di assenza di correlazione tra le due variabili (VERO, infatti essendo il p-value
più basso della soglia di significatività rifiuto l’ipotesi nulla e quindi concludo che c’è correlazione
tra le due variabili)
C) Le due variabili sono linearmente indipendenti perché nonostante il test statistico , l’indice di ro sia
minore di 0,2 (FALSA, perché non è il coefficiente di correlazione che ci dà informazioni sulla
presenza o assenza della correlazione, ma è solamente il test che ci dice se c’è o meno correlazione,
e l’indice verrà utilizzato al più per valutare la forza della relazione, anche se l’indice è più basso
della soglia di 0,2 non vuol dire che non ci sia relazione, la correlazione c’è, perché ce lo dice il test
statistico. Un valore ro basso ci dice che la correlazione se pur esistente è di debole intensità, ma
non che le variabili siano indipendenti)
D) Al crescere di X, Y in media non cambia (FALSO, è un modo alternativo di dire che le variabili sono
indipendenti, mentre essendoci dipendenza, all’aumentare dell’uno, l’altra variabile cambia)
E) Sono vere la C e la D (FALSO)
6) Il leverage H (misura che serve a identificare essenzialmente le osservazioni influenti in una regressione
lineare)
A) Più aumenta il regressore associato più diminuisce la probabilità che si verifichi l’evento (Risposta
Giusta, con coefficiente negativo se aumenta la X la probabilità diminuisce, non sappiamo di quanto
perché per questo servono gli odds ratio, ma possiamo comunque avere informazioni sul verso
della relazione)
B) Più diminuisce il regressore associato più diminuisce la probabilità che si verifichi l’evento (FALSO,
l’opposto della risposta corretta)
C) Sono vere A ed E
D) I coefficienti standardizzati non possono essere negativi (FALSO, come un qualunque coefficiente
possono assumere sia valori negativi che positivi)
E) Aumentando di un’unità il regressore associato, diminuisce la probabilità che si verifichi l’evento di
una quantità pari al coefficiente standardizzato (FALSO, perché per quantificare la variazione di
probabilità in una regressione logistica, bisogna utilizzare gli Odds Ratio, il coefficiente
standardizzato non ci dice di quanto varia la probabilità, al più ci dice il verso della relazione)
10) Considerando un modello di regressione lineare con una variabile dipendente Y: spesa per il
prodotto A, e variabile dipendente X: consumo del prodotto B, quindi abbiamo due variabili X e Y in una
regressione lineare). Se il coefficiente associato a X vale 0.3 significa che:
A) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A aumenta di 0.3
unità (Risposta giusta)
B) Se il consumo del prodotto B diminuisce di un’unità, la spesa del prodotto A aumenta del
30% (FALSO, aumenta del valore stesso del coefficiente)
C) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A aumenta del 30%
(FALSO, perché le percentuali non c’entrano nell’interpretazione dei coefficienti della
regressione lineare)
D) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A diminuisce del
70% (Risposta sbagliata)