Sei sulla pagina 1di 3

RISPOSTE A CROCETTE ESAME METODI DEL 29/01 con soluzioni

1) Si vuole svolgere una ricerca di mercato, sulle preferenze politiche dei residenti di una piccola città.
Si identificano 3 fasce d’età e si raccoglie un campione in cui la distribuzione delle fasce d’età è
confrontabile con quella dei residenti dell’intera città, tutti i dati vengono raccolti tramite interviste
face to face davanti al centro commerciale locale. Di che tipo di campionamento si tratta?
A) Sono tutte false (Risposta corretta, perché questo è un campionamento per quote, infatti ho
definito le quote che sono le fasce d’età, e all’interno di queste fasce d’età ho fatto un
campionamento per convenienza, dove la convenienza in questo caso è stato andare di fronte
al centro commerciale locale)
B) Campionamento stratificato (FALSO, è simile perché comunque si selezionano degli strati, in
questo caso le fasce d’età, ma nel campionamento stratificato nelle fasce d’età si fa a sua volta
un campionamento casuale. Cosa che non è stata fatta nel nostro caso, perché abbiamo fatto il
campionamento davanti al centro commerciale)
C) Campionamento casuale semplice (FALSO)
D) Campionamento a grappoli (FALSO, perché in questo tipo di campionamento si scelgono dei
cluster randomici, ad esempio aree geografiche, cose che in questo caso non è stata fatta)
E) Campionamento a scelta ragionata (FALSO, perché in questo tipo di campionamento vengono
scelti ad HOC secondo delle logiche prestabilite).

2) Skeweness pari a 1, maggiore di 0

A) Mediana minore della media (risposta giusta)


B) Distribuzione asimmetrica negativa (FALSA, perché è asimmetrica positiva)
C) Distribuzione simmetrica (Falsa, succede quando skewness è pari a 0)
D) Iponormale (falsa, perché questo riguarda la Kurtosis)
E) Vere C e D

3) Varianza di una variabile X:

A) Rappresenta la dispersione dei dati attorno al valore mediano di X (FALSO, perché la varianza
rappresenta la dispersione attorno al valore medio e NON mediano)
B) Assume valori compresi tra -∞ e +∞ (FALSO, perché nella formula c’è un elevamento al quadrato,
quindi varianza sempre positiva)
C) Espressa nella stessa unità di misura della variabile X (FALSO, perché l’elevamento al quadrato,
l’unità di misura è il quadrato dell’unità di misura della variabile originale. La deviazione standard
che è la radice quadrata della varianza avrà la stessa unità di misura)
D) È variabilità di misura relativa (FALSO, misura di variabilità assoluta)
E) Sono tutte false (RISPOSTA GIUSTA)

4) In un’analisi di connessione una volta eseguito il test con esito di rifiuto di H0, quindi il rifiuto dell’ipotesi
nulla, si osserva che l’indice di chi quadro pari a 2.18

A) Possiamo affermare che il grado tra le due variabili è forte (FALSO, il valore dell’indice chi quadro
non è sufficiente per dare una valutazione della forza della relazione)
B) Possiamo affermare che il grado tra le due variabili è debole (FALSO, il valore dell’indice chi quadro
non è sufficiente per dare una valutazione della forza della relazione)
C) Le due Variabili sono statisticamente indipendenti (FALSO, perché noi abbiamo rifiutato l’ipotesi
nulla di indipendenza)
D) L’indice chi quadro non è sufficiente per valutare la forza della relazione (RISPOSTA GIUSTA, per
verificare la forza della relazione serve il Cramer V)
E) Sono vere B e C

5) Siano X e Y due variabili quantitativa, il p-value del test di indipendenza lineare tra X e Y è 0.012, mentre
il coefficiente di correlazione lineare p (ro) è 0,18, avendo fissato il livello di significatività di 0,05, si può
concludere che? (p-value o,012 quindi minore del nostro livello alfa, e coefficiente di correlazione ro è
0,018)

A) Le due variabili sono dipendenti in media (FALSO, la dipendenza in media non ha nulla a che fare
con lo studio di due variabili quantitative)
B) Si rifiuta l’ipotesi nulla di assenza di correlazione tra le due variabili (VERO, infatti essendo il p-value
più basso della soglia di significatività rifiuto l’ipotesi nulla e quindi concludo che c’è correlazione
tra le due variabili)
C) Le due variabili sono linearmente indipendenti perché nonostante il test statistico , l’indice di ro sia
minore di 0,2 (FALSA, perché non è il coefficiente di correlazione che ci dà informazioni sulla
presenza o assenza della correlazione, ma è solamente il test che ci dice se c’è o meno correlazione,
e l’indice verrà utilizzato al più per valutare la forza della relazione, anche se l’indice è più basso
della soglia di 0,2 non vuol dire che non ci sia relazione, la correlazione c’è, perché ce lo dice il test
statistico. Un valore ro basso ci dice che la correlazione se pur esistente è di debole intensità, ma
non che le variabili siano indipendenti)
D) Al crescere di X, Y in media non cambia (FALSO, è un modo alternativo di dire che le variabili sono
indipendenti, mentre essendoci dipendenza, all’aumentare dell’uno, l’altra variabile cambia)
E) Sono vere la C e la D (FALSO)

6) Il leverage H (misura che serve a identificare essenzialmente le osservazioni influenti in una regressione
lineare)

A) Misura quanto un’osservazione è lontana dal centro dei dati (VERO)


B) Se è basso indica che non c’è correlazione lineare (FALSO, perché quello è il coefficiente di
correlazione)
C) Le osservazioni per cui i leverage H è maggiore di 1 sono potenzialmente osservazione influenti
(FALSO, perché in realtà è quando il leverage H è maggiore di un’altra soglia che non è 1, le
osservazioni sono influenti)
D) Vere la A e la C
E) Misura la variazione del p-value quando un’osservazione viene rimossa (FALSO, perché questo non
c’entra nulla con il p-value)

7) Nell’ambito della regressione logistica la percentuale di concordat

A) È pari alla differenza tra 1 e la somma delle percentuali di discordante e di Tai


B) Test statistico per valutare la bontà del modello (Falso, perché è vero che serve per valutare la
bontà del modello, ma la percentuale di concordant non è un test statistico ma è un indice)
C) Si calcola come rapporto tra numero di concordant e numero di discordant (FALSO, in realtà la
percentuale del concordant sul totale delle coppie o alternativamente la differenza tra 1 e la
somma delle percentuali di discordant e di tai
D) Rappresenta la percentuale di coppie con probabilità stimata maggiore di 0.5 (FALSO, noi andiamo
a vedere se la probabilità stimata della prima osservazione è minore della probabilità stimata dalla
seconda, se è così è una coppia concordant, altrimenti è discordant o tied se le due probabilità sono
uguali)
E) SE è pari a -1 indica che i regressori sono correlati negativamente con la variabile tied (FALSA, è
sempre maggiore di o)
8) Nell’ambito del modello di regressione logistica, un coefficiente standardizzato negativo significa che:
(coefficiente standardizzato, sono i coefficienti di una regressione in cui le variabili sono state
standardizzate. Si utilizzano per valutare l’importanza dei regressori)

A) Più aumenta il regressore associato più diminuisce la probabilità che si verifichi l’evento (Risposta
Giusta, con coefficiente negativo se aumenta la X la probabilità diminuisce, non sappiamo di quanto
perché per questo servono gli odds ratio, ma possiamo comunque avere informazioni sul verso
della relazione)
B) Più diminuisce il regressore associato più diminuisce la probabilità che si verifichi l’evento (FALSO,
l’opposto della risposta corretta)
C) Sono vere A ed E
D) I coefficienti standardizzati non possono essere negativi (FALSO, come un qualunque coefficiente
possono assumere sia valori negativi che positivi)
E) Aumentando di un’unità il regressore associato, diminuisce la probabilità che si verifichi l’evento di
una quantità pari al coefficiente standardizzato (FALSO, perché per quantificare la variazione di
probabilità in una regressione logistica, bisogna utilizzare gli Odds Ratio, il coefficiente
standardizzato non ci dice di quanto varia la probabilità, al più ci dice il verso della relazione)

9) Nell’ambito dell’analisi delle componenti principali, quale affermazione è falsa?

A) L’obbiettivo è di spiegare una variabile dipendente tramite un insieme di variabili indipendenti


(Risposta Giusta, è falso perché questo è l’obiettivo di una regressione lineare o logistica,
mentre l’obiettivo delle componenti principali è quello di sintetizzare il contenuto informativo
di diverse variabili)
B) Le componenti principali non sono correlate tra di loro
C) Le componenti spiegano complessivamente la variabilità delle variabili originali (Questa era
vera, noi non perdiamo informazioni quando svolgiamo le componenti principali, è solo quando
selezioniamo alcune di queste componenti principali, quindi nuovamente in cui selezioniamo i
fattori che andiamo a perdere informazioni)
D) Il numero massimo delle componenti è pari al numero delle variabili manifeste (Questa era
vera, se parto da un set di n variabili, avrò n componenti principali.
E) Considerando il massimo numero di componenti principali le comunalità di tutte le variabili
manifeste valgono 1 (Questa è vera, perché se considerare tutte le componenti principali non ci
fa perdere informazioni, allora la comunalità di tutte le variabili originarie è pari a 1, quindi ogni
variabile è perfettamente spiegata, quindi tutta l’informazione di ogni variabile è contenuta nel
set delle mie componenti principali)

10) Considerando un modello di regressione lineare con una variabile dipendente Y: spesa per il
prodotto A, e variabile dipendente X: consumo del prodotto B, quindi abbiamo due variabili X e Y in una
regressione lineare). Se il coefficiente associato a X vale 0.3 significa che:

A) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A aumenta di 0.3
unità (Risposta giusta)
B) Se il consumo del prodotto B diminuisce di un’unità, la spesa del prodotto A aumenta del
30% (FALSO, aumenta del valore stesso del coefficiente)
C) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A aumenta del 30%
(FALSO, perché le percentuali non c’entrano nell’interpretazione dei coefficienti della
regressione lineare)
D) Se il consumo del prodotto B aumenta di un’unità la spesa del prodotto A diminuisce del
70% (Risposta sbagliata)

Potrebbero piacerti anche