Sei sulla pagina 1di 69

1

 A proposito della moda: a) che cos'è la densità di classe e come si calcola; b) qual'è la formula della moda per valori suddivisi
in classi; c) che cos'è un distribuzione amodale; d) che cos'è una distribuzione plurimodale 13
 Come si definisce la probabilità: a) secondo l'approccio classico; b) secondo l'approccio frequentista; c)secondo l'approccio
soggettivista; d) secondo l'approccio assiomatico 25
 Commentare brevemente: a) il significato di errore di I tipo; b) il significato di errore di II tipo; c) il significato di potenza del
test; d) la interrelazione fra teoria della stima e verifica di ipotesi 52
 Commentare brevemente: a) il significato di ipotesi nulla e alternativa; b) il significato di verifica di ipotesi con test unilatero
dx; c) il significato di verifica di ipotesi con test unilatero sx; d) il significato di verifica di ipotesi con test bilatero 51
 Commentare brevemente: a) la differenza fra stimatore e stima; b) la proprietà di non distorsione o correttezza; c) la proprietà
di efficienza; d) la proprietà di consistenza. 45
 Commentare brevemente: la legge debole dei grandi numeri; la legge forte dei grandi numeri; la disuguaglianza di Markov; la
diseguaglianza di Chebyshev 30
 Con quali formule si calcolano i rapporti: a)di mascolinità; b)di femminilità; c)di senilità; d) di invecchiamento 7
 Con quali script di R si calcolano: a) I Quartile; b) II Quartile; c) III Quartile; d) Box-plot 13
 Con quali script si calcolano: media aritmetica semplice; media aritmetica in frequenza; mediana; coefficiente di variazione 11
 Data due provette relative a due esami microbiologici: a) costruire la tabella a doppia entrata che modella una v.c.
bidimensionale delle frequenze congiunte relative; b) calcolare le probabilità P(X=1;Y=1) ; P(X=1;Y=2) ; c) calcolare le
probabilità P(X=2;Y=1) ; P(X=2;Y=2); d) calcolare la probabilità marginale di I riga 28
 Data l’equazione della retta stimata y(stim)=12,5 + 0,76*x calcolare quale valore stimato si ottiene per la variabile dipendente
y fissati i seguenti valori di x: a) x=13,8; b) 12,4; c) 16,1; d) 15,3 61
 Data la distribuzione di probabilità Bernoulliana con p=0,07 calcolare: a)la probabilità che x=0; b) la probabilità che x= 1; c) il
valore atteso; d) la varianza 33
 Data la distribuzione di probabilità Bernoulliana con p=0,07 con quali script si calcola: a)la probabilità che x=0; b) la
probabilità che x= 1; c) il valore atteso; d)la varianza 32
 Data la distribuzione di probabilità Bernoulliana con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti 32
 Data la distribuzione di probabilità Binomiale con p=0,07 e n=11 con quali script si calcola: a)la probabilità che x=0; b) la
probabilità che x< 3; c) la probabilità che x>2; d) la probabilità che x sia ricompreso fra 3 e 4 33
 Data la distribuzione di probabilità Binomiale con p=0,07 e n=11 calcolare: a)la probabilità che x=0; b) la probabilità che x< 3;
c) la probabilità che x>2; d) la probabilità che x sia ricompreso fra 3 e 4 34
 Data la distribuzione di probabilità Binomiale con p=0,49 ed n=50 e stabilito un livello di significatività dell’5% con quali
script si calcola: a) il limite superiore dell’intervallo di confidenza per la proporzione; b) il limite inferiore dell’intervallo di
confidenza per la proporzione; c) la numerosità campionaria; c) l’ampiezza dell’intervallo 49
 Data la distribuzione di probabilità Binomiale con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti 34
 Data la distribuzione di probabilità Chi-quadrato con n=23 con quali script si calcola: a) la probabilità che x=8; b) la
probabilità che x< 3; c) la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 13 e 20 41
 Data la distribuzione di probabilità Chi-quadrato con n=23 con quali script si calcola: a) la varianza; b) la deviazione standard;
c) l’indice di asimmetria; d) l’indice di curtosi 41
 Data la distribuzione di probabilità Chi-quadrato con quali script si calcola: a) il quantile; b) la probabilità; c) la probabilità
cumulata; d) i numeri casuali estratti 41
 Data la distribuzione di probabilità F di Fisher con g1=16 e g2=24 con quali script si calcola: a) la probabilità che x=18; b) la
probabilità che x< 22; c)la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 14 e 19 42
 Data la distribuzione di probabilità F di Fisher con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti 42
2

 Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 calcolare: a) la probabilità che x=4,1; b) la
probabilità che x< 3,9; c)la probabilità che x> 4,4; d) la probabilità che x sia ricompreso fra 4,2 e 4,5 38
 Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 con quali script si calcola: a) la probabilità che
x=4,1; b) la probabilità che x< 3,9; c)la probabilità che x> 4.4; d) la probabilità che x sia ricompreso fra 4,2 e 4,5 38
 Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 con quali script si calcola: a) la varianza; b) la
deviazione standard; c)l’indice di asimmetria; d)l’indice di curtosi 39
 Data la distribuzione di probabilità Normale con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti 39
 Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 con quali script si calcola: a) la
probabilità che x=2,8; b) la probabilità che x< 3,2; c)la probabilità che x> 3,7; d) la probabilità che x sia ricompreso fra 3,1 e
4,4 39
 Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 con quali script si calcola: a) la varianza;
b) la deviazione standard; c) l’indice di asimmetria; d)l’indice di curtosi 40
 Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 calcolare: a) la probabilità che x=2,8; b)
la probabilità che x< 3,2; c)la probabilità che x> 3,7; d) la probabilità che x sia ricompreso fra 3,1 e 4,4 40
 Data la distribuzione di probabilità Normale standardizzata con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti 40
 Data la distribuzione di probabilità Poissoniana con lambda =3,2 con quali script si calcola: a)la probabilità che x=10; b) la
probabilità che x< 13; c) la probabilità che x>22; d) la probabilità che x sia ricompreso fra 30 e 40 35
 Data la distribuzione di probabilità Poissoniana con lambda =3,2 calcolare: a)la probabilità che x=10; b) la probabilità che x<
13; c) la probabilità che x>22; d) la probabilità che x sia ricompreso fra 30 e 40 36
 Data la distribuzione di probabilità Poissoniana con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti di variazione 35
 Data la distribuzione di probabilità t di Student con n=23 calcolare: a) la probabilità che x=2; b) la probabilità che x< 12; c) la
probabilità che x> 17; d) la probabilità che x sia ricompreso fra 11 e 14 40
 Data la distribuzione di probabilità t di Student con n=23 con quali script si calcola: a) la probabilità che x=2; b) la probabilità
che x< 12; c) la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 11 e 14 41
 Data la distribuzione di probabilità t di Student con n=23 con quali script si calcola: a) la varianza; b) la deviazione standard;
c) l’indice di asimmetria; d) l’indice di curtosi 41
 Data la distribuzione di probabilità t di Student con quali script si calcola: a) il quantile; b) la probabilità; c) la probabilità
cumulata; d) i numeri casuali estratti 40
 Data la distribuzione di probabilità Uniforme continua con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti 37
 Data la distribuzione di probabilità Uniforme continua nell’intervallo 20-50 con quali script si calcola: a) la probabilità che
x=28; b) la probabilità che x< 32; c)la probabilità che x> 37; d) la probabilità che x sia ricompreso fra 31 e 44 36
 Data la distribuzione di probabilità Uniforme continua nell’intervallo 20-50 calcolare: a) la probabilità che x=28; b) la
probabilità che x< 32; c) la probabilità che x> 37; d) la probabilità che x sia ricompreso fra 31 e 44 37
 Data la distribuzione di probabilità Uniforme discreta con N=10 con quali script si calcola: a) la probabilità che x=8; b) la
probabilità che x< 2; c)la probabilità che x> 7; d) la probabilità che x sia ricompreso fra 8 e 4 31
 Data la distribuzione di probabilità Uniforme discreta con N=10 calcolare: a) la probabilità che x=8; b) la probabilità che x< 2;
c) la probabilità che x> 7; d) la probabilità che x sia ricompreso fra 8 e 4 32
 Data la distribuzione di probabilità Uniforme discreta con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti 31
 Data la probabilità P(E)= 0,71; P(F)=0,11 e P(E∩F) = 0,55 calcolare: a) la probabilità condizionata P(EdatoF); b) la probabilità
unione P(E∪F) per eventi compatibili; c)la probabilità unione P(E∪F) per eventi incompatibili; d)la probabilità composta 27
 Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) calcolare: a) il valore
atteso; b) la devianza; c) la varianza; d) la deviazione standard 27
3

 Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) calcolare: a) la
funzione di probabilità; b) la funzione di ripartizione; c) il grafico relativo al punto a); d) il grafico relativo al punto b) 27
 Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) con quali script si
calcola: a) il valore atteso; b) la devianza; c) la varianza; d) lo scarto quadratico medio 27
 Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) con quali script si
calcola: a) la funzione di probabilità; b) la funzione di ripartizione; c) il grafico di cui al punto a); d)il grafico di cui al punto b)
28
 Data la seguente matrice di dati composta di due righe e due colonne (0,1,3,4) relativi al carattere X calcolare: a) le frequenze
marginali di riga e di colonna; b) le frequenze teoriche; c) le contingenze assolute; d) il chi-quadrato 22
 Data la seguente matrice di dati composta di tre righe e quattro colonne (0,1,3,4,1,2,3,0,1,5,3,2) relativi al carattere X con quali
script di R si calcolano: a) le frequenze congiunte assolute; b) le frequenze teoriche; c) le contingenze assolute; d) il chi-
quadrato 21
 Data la tabella di contingenza formata da due righe e due colonne (0,1,3,4) quale script di R si utilizza per calcolare: a) le
frequenze teoriche; b) le contingenze assolute; c) il chi-quadrato; d) il chi-quadrato normalizzato 24
 Data la varianza del peso del tondino pari a 36 gr ed estratto un campione di 397 tondini con un peso medio pari a 987 grammi
e un livello di significatività dell’1% con quali script si calcola: a) il limite superiore dell’intervallo di confidenza per la media
con varianza nota; b) il limite inferiore dell’intervallo di confidenza per la media con varianza nota; c) la numerosità
campionaria; c) l’ampiezza dell’intervallo 47
 Data una distribuzione di valori suddivisa in classi con quali formule si calcolano: a) il I Quartile; b) il II Quartile (o Mediana);
c) il III Quartile; d) la moda 14
 Date le seguenti coppie di valori y (1,2,3) e x(12,11,10): calcolare: a)calcolare il coeff. angolare; b) calcolare l’intercetta; c)
descrivere la retta stimata; d) calcolare il valore di y(stimato) per un valore di x=9 59
 Dati i seguenti dati del carattere X (12,2,3,45) e le relative frequenze assolute (1,4,0,3) calcolare: a) i cinque numeri di sintesi;
b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori singoli; d) l’indice
di asimmetria con la formula del momento terzo per valori suddivisi in classi 18
 Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) con quali script di R si calcolano: la devianza; la varianza; lo scarto
quadratico medio; il coefficiente di variazione 15
 Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative frequenze assolute (0,1,2,3,2,1,3,4) con quali script di R
si calcolano: la media aritmetica semplice; media aritmetica in frequenza assoluta; media aritmetica in frequenza relativa; la
mediana 10
 Dati i seguenti dati del carattere x (22,48,58,61,38,42) calcolare: la devianza; la varianza; lo scarto quadratico medio; il
coefficiente di variazione 15
 Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58) con quali script di R si individuano: le
classi con il metodo soggettivo; le classi con il metodo a radice;le classi con il metodo logaritmico; l’istogramma 9
 Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali formule si
calcolano: a) l’indice di eterogeneità di Gini; b) l’indice di concentrazione di Gini; c)la media aritmetica semplice; d) la
mediana 12
 Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali script di R si
calcolano: l’indice di eterogeneità di Gini; l’indice di concentrazione di Gini; media aritmetica semplice; la mediana 21
 Dati i seguenti valori centrali di claase x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano:
a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo
per valori singoli; d) l’indice di asimmetria con la formula del momento terzo per valori suddivisi in classi 19
 Dati i seguenti valori centrali di classe x (1,2,3,4,5) e le relative frequenze assolute (2,3,1,5,4) calcolare: la varianza per classi;
lo s.q.m.; la devianza per classi; il coefficiente di variazione 16
 Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si calcolano:
a) la media per valori suddivisi in classi; b) lo scarto quadratico medio; c) l’indice di asimmetria con la formula del momento
quarto per valori singoli; d) l’indice di asimmetria con la formula del momento quarto per valori suddivisi in classi 21
4

 Dati i seguenti valori centrali di classe x (3,1,6,5) e le relative frequenze assolute (0,5,1,3) calcolare: a) la media per valori
suddivisi in classi; b) lo scarto quadratico medio; c) l'indice di curtosi utilizzando la formula del momento quarto per valori
singoli; d) l'indice di curtosi utilizzando la formula del momento quarto per valori suddivisi in classi 20
 Dati i seguenti valori centrali di classe xi (2,4,5,1,3) e le relative frequenze assolute ni (2,0,1,4,3) calcolare: la devianza in
frequenza assoluta; la varianza in frequenza assoluta; lo scarto quadratico medio; il coefficiente di variazione 17
 Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) quali script di R si utilizzano per
calcolare: numeri indici a base fissa; numeri indici a base mobile; media aritmetica; media geometrica 7
 Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) calcolare: numeri indici a base fissa;
numeri indici a base mobile; passaggio da base fissa a base mobile; passaggio da base mobile a base fissa 7
 Dati i seguenti valori del carattere X (1450, 1560, 1680, 1940, 2350, 2670, 3120): a) costruire 3 classi aperte a dx e chiuse a sx
b) costruire 3 classi aperte a sx e chiuse a dx; c) costruire classi con il metodo a radice; d) costruire classi con il metodo
logaritmico 8
 Dati i seguenti valori dell’intercetta e del coefficiente angolare pari rispettivamente a 2,4 e 0,58 e dei rispettivi ESQM pari a
1,1 e 0,45: a)calcolare la statistica t di Student per l’intercetta; b) calcolare la statistica t di Student per il coeffciente angolare;
c) spiegare il significato di a); d) spiegare il significato di b) 58
 Dati i seguenti valori della v.c. x (1,2,3,4) con quale script di R si calcolano: a) la devianza; b) la varianza; c) la covarianza; d)
il coefficiente di correlazione di Bravais-Pearson 29
 Dati i valori della devianza di regressione e del residuo e 8 osservazioni calcolare il test F: a) per valori pari rispettivamente a
63692,07 e 2118,636; b) per valori pari rispettivamente a 73692,07 e 2218,636; c) per valori pari rispettivamente a 83692,07 e
3118,636; d) per valori pari rispettivamente a 93692,07 e 4118,636 60
 Dati i valori di P(E)=0,28, P(F)=0,32 e P(EdatoF)=0,18 calcolare: a)la probabilità unione P(E∪F) per eventi compatibili;b) la
probabilità intersezione P(E∩F) per eventi dipendenti; c)la probabilità unione P(E∪F) per eventi incompatibili; d) la
probabilità intersezione P(E∩F) per eventi indipendenti 26
 Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa frequenza assoluta (0,1,2,3) calcolare: a) i valori
centrali di classe; b) la frequenza relativa; c) la frequenza cumulata assoluta; d) la frequenza cumulata relativa 8
 Dato il valore del coefficiente di correlazione pari a 0,93 e la cov(XY) pari a -1,24 calcolare: a) il coefficiente di
determinazione; b) il prodotto delle deviazioni std della X e della Y; c) spiegare il significato del segno della covarianza; d)
spiegare il significato di a) 57
 Dato il valore del coefficiente di determinazione pari a 0,97 e la devianza residua pari a 12,7 calcolare: a) la devianza spiegata;
b) la devianza totale; c) il coefficiente di correlazione; d) scrivere in simboli la formula della devianza residua utilizzando i
valori di y osservati e stimati 63
 Dato il valore dell’intercetta stimata pari a 12,5, un valore della t di Student critica con n-2 gradi di libertà pari a 2,571 ed un
valore del relativo error std par a 34,67; dato il valore del coefficiente angolare stimato pari a 61,4, un valore della t di Student
critica con n-2 gradi di libertà pari a 2,571 ed un valore del relativo error std pari a 13,45 calcolare: a) l’intervallo di
confidenza per l’intercetta; b) l’intervallo di confidenza per il coefficiente angolare; c) accettare o rifiutare H0=0 per
l’intercetta; d) accettare o rifiutare H0=0 per il coefficiente angolare 65
 Dato un campione n=21 con varianza pari a 14,55 e varianza stimata pari a 15,88 si scelga la regola di decisione in questi casi:
a) per un test a 95% (Chi critica alfa=10,85; Chi critica 1-alfa=31,41); b) per un test al 99% (Chi critica alfa=8,26; Chi critica
1-alfa=37,57); c) per un test al 90% (Chi critica alfa=12,44; Chi critica 1-alfa=28,41); d) c) per un test al 97%(Chi critica
alfa=9,9; Chi critica 1-alfa=28,41) 56
 Dato un campione n=24 con varianza corretta pari a 15 si calcoli la numerosità campionaria: a) al 99% con un errore in valore
assoluto non superiore a 2 (Zcritica=2,576); b) al 95% con un errore in valore assoluto non superiore a 1,5 (Z critica=1,96); al
90% con un errore in valore assoluto non superiore a 2,5(Zcritica=1,64); d) al 97% con un errore in valore assoluto non
superiore a 2 (Z critica)=2,17) 51
 Dato un campione n=24 con varianza corretta pari a 15 si imposti la notazione per il calcolo dello stimatore intervallo di
confidenza: a) al 99%; b) al 95%; al 90%; d) al 97% 50
 Dato un campione n=24 con μ =22, media campionaria=21 e varianza nota pari a 15 si scelga la regola di decisione in questi
casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilatero (Z
critica=1,96); d); c) per un test bilatero (Z critica=1,64) 53
5

 Dato un campione n=33 con μ =35, media campionaria=34 e varianza ignota e stimata pari a 15,88 si scelga la regola di
decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test
bilatero (Z critica=1,96); d) c) per un test bilatero (Z critica=1,64) 54
 Dato un campione n=41 con una % di pezzi difettosi pari al 2% e una proporzione stimata di 2,3% si scelga la regola di
decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test
bilatero (Z critica=1,96); d) per un test bilatero (Z critica=1,64) 55
 Dato un Modello di Regressione lineare semplice con 7 osservazioni quali gradi di libertà si assegnano: a) alla regressione; b)
al residuo; c) al totale; d) spiegare molto sinteticamente il significato di gradi di libertà. 59
 Dato un Modello di Regressione lineare semplice con i valori della a(stimata) e b(stimato) con quali script si calcola: a) la t
empirica dell’intercetta; b) l’intervallo di confidenza per l’intercetta all’1%; c) la t empirica del coefficiente angolare; )
l’intervallo di confidenza per il coefficiente angolare al 5% 66
 Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-
10;255-11;365-14;485-18;592-25) con quali script si calcolano: a) i coefficienti di regressione; b) l’output della regressione; c)
la media di x; c) la media di y 61
 Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-
10;255-11;365-14;485-18;592-25) con quali script si calcola: a) la devianza spiegata; b) la devianza residua; c) la devianza
totale; d) il coefficiente di determinazione 63
 Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-4;250-
10;255-11;365-14;485-18;592-25) con quali script si calcola: a) l’ESQM della regressione; b) l’ESQM dell’intercetta; c)
ll’ESQM del coefficiente angolare; d) della devianza della x 67
 Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) il coeff. angolare; b) l’intercetta; c) la
devianza spiegata; d) la devianza residua 60
 Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’intervallo di confidenza per
l’intercetta; b) l’intervallo di confidenza per il coefficiente angolare; c) spiegare il significato del punto a); d) spiegare il
significato del punto b 65
 Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’errore standard quadratico medio
(ESQM) per la regressione; b) l’errore standard quadratico medio (ESQM) per l’intercetta; c) l’errore standard quadratico
medio (ESQM) per il coefficiente angolare; d) la devianza residua. 66
 Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’intervallo di confidenza per la
variabile dipendente media; b) l’intervallo di confidenza per la previsione; c) spiegare il significato del punto a); d) spiegare il
significato del punto b) 69
 Dato un Modello di Regressione lineare semplice quali sono le formule per calcolare: a) la devianza totale; b) R2; c) R2
aggiustato; d) test F 62
 Dato un Modello di Regressione lineare semplice spiegare molto sinteticamente il significato di: a) residui e relative
rappresentazioni grafiche; b) valori anomali; c) bontà del modello; d) finalità del modello 64
 Dato un mu =200, un campione n=92 e una media campionaria=198 con quali script si calcola: a) la zeta empirica; b) il p-
value all’1%; c) il p-value al 5%; c) il p-value al 10% 52
 Definire sinteticamente: a) concetto di stimatore intervallo di confidenza o di fiducia; b) il livello di confidenza; c) il livello di
significatività; d) dati i valori di sigma=12; n=28; un livello di confidenza pari al 5% per cui la zeta empirica è pari a 1,96 e
una media campionaria =21 calcolare l’intervallo di confidenza per la media con varianza nota 46
 Descrivere sinteticamente il significato delle ipotesi base cui sottostà il Modello di Regressione lineare semplice: a) linearità
sui regressori; b) normalità dei residui; c) valore atteso dei residui nullo; d) varianza costante dei residui 64
 In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione b(stim) pari a 1,48 ed un
error standard pari a 0.89 e si vuole sceglier la regola di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576);
b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilateroM(Z critica=1,96); d) c) per un test bilatero (Z critica=1,64)
67
 In una v.c. continua unidimensionale X quale è la probabilità che essa sia compresa tra due valori positivi a e b 7
6

 In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione a(stim) pari a 11,432 ed un
error standard pari a 2,8 9 e siMvuole sceglier la regola di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576);
b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilatero (Z critica=1,96); d) c) per un test bilatero (Z critica=1,64)
68
 In una distribuzione della media campionaria per popolazioni finite o senza ripetizione quale notazione si utilizza per
calcolare: a) la media campionaria; b) la varianza campionaria corretta; c) la deviazione standard; d) il coefficiente di
variazione 43
 La v.c. X è la sommatoria di 80 v.c. bernoulliane e quindi è una v.c. binomiale con parametri p=0,23 e n=80 Bin~(80;0,23).
Calcolare: a) il valore atteso; b) la varianza; c) la probabilità che p(X<3);d) la probabilità che P(X>2) 42
 Nel calcolo combinatorio se si vogliono disporre tre oggetti a tre a tre con quali script si calcolano: a) disposizioni semplici
senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione; d) combinazioni
semplici senza ripetizione 25
 Nel calcolo combinatorio si vogliono disporre tre oggetti a tre a tre e si vogliono calcolare le: a) disposizioni semplici senza
ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione; d) combinazioni semplici
senza ripetizione 24
 Nell’Analisi della varianza spiegare il significato: a) della devianza spiegata; b) della devianza residua; c) dei relativi gradi di
libertà; d) del test F 68
 Quali grafici sono più appropriati per rappresentare: a) una distribuzione dei costi indiretti di una produzione; b) una
distribuzione generica di valori suddivisi in classi; c) una relazione fra due variabili x ed y; d)una distribuzione di probabilità
discreta 10
 Quali sistemi di ipotesi si impostano per: a) per un test bilatero per l’intercetta; b) per un test unilatero dx per l’intercetta; c)
per un test unilatero sx per l’intercetta; d) per un test bilatero per il coefficiente angolare 66
 Si devono individuare 2 unità da scegliere tra 6 impiegati (quadri) sulla base degli anni di esperienza che risultano essere: 4 8
12 12 14 16 con quali script si calcola: a)Il numero campioni ordinati di numerosità 2 (con ripetizione); b) Il numero campioni
ordinati di numerosità 2 (senza ripetizione); c) numero campioni non ordinati di numerosità 2 (con ripetizione); d)numero
campioni non ordinati di numerosità 2 (senza ripetizione) 43
 Si è svolta un’analisi di Connessione tra il carattere (X) che assume le modalità 1,2 e 3 e il carattere (Y) che assume le
modalità A, B e C. I dati rilevati di X sono: (1,1,3,2,3,2,1,3); quelli di (A,A,B,C,A,C,B,A) e si vuole: a)costruire la relativa
matrice di dati; b)calcolare le frequenze congiunte assolute e teoriche; c) le contingenze assolute; d) il chi-quadrato 23
 Si estrae un campione casuale di 300 prodotti da cui si rileva una difettosità media del 2% e si vuole calcolare: a) la probabilità
che 10 prodotti siano difettosi; b) la probabilità di riscontrare un numero di prodotti difettosi minore di 8; c) la probabilità di
riscontrare un numero di prodotti difettosi compreso fra 5 e 9;d) il valore atteso 44
 Si estrae un campione di 24 contenitori e si vuole calcolare la probabilità di riscontrare una varianza campionaria: a) minore di
0,45; b) maggiore di 0,48; c) compresa fra 0,38 e 0,53; d) pari a 0,39 45
 Si vuole calcolare: a) l’intervallo di confidenza al 95% (zempirica=1,96) per la proporzione campionaria pari a 0,47 su un
campione di 98 elettori; b) l’intervallo di confidenza al 99% (zempirica=2,67) per la proporzione campionaria pari a 0,47 su un
campione di 320 elettori; c) l’intervallo di confidenza al 90% (zempirica=1,64) per la proporzione campionaria pari a 0,47 su
un campione di 980 elettori; d) l’intervallo di confidenza al 95% (zempirica=1,96) per la proporzione campionaria pari a 0,47
su un campione di 1550 elettori 48
 Sia X è una v.c. continua bidimensionale con quali notazioni si calcolano: il valore atteso; la varianza; la deviazione standard;
il coefficiente di variazione. 30
 Sia X è una v.c. unidimensionale continua con quali notazioni si calcolano: a) il valore atteso; b) la varianza; c) la deviazione
standard; d) il coefficiente di variazione 29
 Stimata la varianza campionaria pari a 12,8 e stabilito un livello di significatività dell’5% con quali script si calcola: a) il limite
superiore dell’intervallo di confidenza per la media con varianza ignota; b) il limite inferiore dell’intervallo di confidenza per
la media con varianza ignota; c) la numerosità campionaria; c) l’ampiezza dell’intervallo 47
 Stimata la varianza campionaria pari a 2,8 e stabilito un livello di significatività dell’1% con quali script si calcola: a) il limite
superiore dell’intervallo di confidenza per la varianza; b) il limite inferiore dell’intervallo di confidenza per la varianza; c) la
numerosità campionaria; c) l’ampiezza dell’intervallo 49
7

Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) quali script di R si utilizzano per
calcolare: numeri indici a base fissa; numeri indici a base mobile; media aritmetica; media geometrica
# CODICE DI R BASE FISSA 2017 #
p_2017 <- c(12.4-12.5-11.9,12.9-13.1-11.1)
Fissa <- function(P, Base) P/Base
Fissa(p_2017, 12.4)
# CODICE DI R BASE MOBILE 2017 #
p_2017 <- c(12.4-12.5-11.9,12.9-13.1-11.1)
Mobile <- function(P_t2, P_t1) P_t2/P_t1
Mobile(p_2017[-1],p_2017[-6])
#CODICE DI R MEDIA ARITMETICA E CODICE DI R MEDIA GEOMETRICA#
X <- c(12.4-12.5-11.9,12.9-13.1-11.1)
Mean(x)
Media <-Sum(x)/6
Library (labstatR)
Meang (p_2017)

Con quali formule si calcolano i rapporti: a)di mascolinità; b)di femminilità; c)di senilità; d) di invecchiamento
I rapporti di coesistenza sono molto usati in demografia e permettono di misurare :
- la struttura per sesso di una certa popolazione attraverso i rapporti di mascolinità e femminilità
- la struttura per età di una certa popolazione attraverso i rapporti o indici di senilità e di invecchiamento; i rapporti di
decessi per parto e di procreazione.
Im=Pm/Pf ; If= Pf/Pm ; Is=Ps/Pg ; Ii=Ps/Pa
Dove Pm è il numero di maschi e Pf è il numero di femmine della popolazione osservata.
Ps è il numero di maschi e di femmine oltre i 65 anni di età; Pg è il numero di maschi e di femmine di meno di 15 anni. Pa è il
numero di maschi e di femmine tra i 15 e i 65 anni.
Se moltiplicati per 100 si ottengono gli omonimi indici percentuali.

Dati i seguenti valori dei prezzi del I semestre 2017 (12,4-12,5-11,9;12,9-13,1-11,1) calcolare: numeri indici a base fissa;
numeri indici a base mobile; passaggio da base fissa a base mobile; passaggio da base mobile a base fissa
tempo prezzi NIBF NIBM DA NIBM A NIBF DA NIBF A NIBM
GEN 17 12.4 12,4/12,4 = 1 - 1 -
FEB 17 12,5 12,5/12,4 = 1,008 12,5:12,4=1,008 1*1,008= 1,008 1,008/1= 1,008
MAR 17 11,9 11,9/12,4 = 0,9597 11,9:12.5=0,952 1,008*0,952= 0,9596 0,9596/1,008=0,9519
APR 17 12,9 12,9/12,4 = 1,040 12,9:11,9=1,084 0,9596*1,084=1,040 1,040/0,9596=1,0837
MAG 17 13,1 13,1/12,4 = 1,055 13,1:12,9=1,016 1,040*1,016= 1,057 1,057/1,040=1,0163
GIU 17 11,1 11,1/12,4 = 0,894 11,1:13,1=0,847 1,057*0,847= 0,895 0,855/1,057=0,8088

In una v.c. continua unidimensionale X quale è la probabilità che essa sia compresa tra due valori positivi a e b
Una v.c. è definita discreta solo se assume un numero finito di valori.
Sia x una variabile causale discreta che assume le modalità o valori x1, x2,x3,….xn disposti in qualsiasi ordine. Si supponga
che questi valori assunti con probabilità date da: P(X=xk)=f(xk) dove k = 1,2,….
La funzione di probabilità, che viene definita anche distribuzione di probabilità, può essere denotata nel modo seguente:
P(X=x)=f(x). Si può dire che f(x) è una funzione di probabilità se f(x)≥ 0 o se .
8

Dati i seguenti valori del carattere X (1450, 1560, 1680, 1940, 2350, 2670, 3120): a) costruire 3 classi aperte a dx e chiuse
a sx b) costruire 3 classi aperte a sx e chiuse a dx; c) costruire classi con il metodo a radice; d) costruire classi con il
metodo logaritmico

Dati le seguenti classi equi ampie (12-16; 16-20; 20-24; 24-28) e la relativa frequenza assoluta (0,1,2,3) calcolare: a) i
valori centrali di classe; b) la frequenza relativa; c) la frequenza cumulata assoluta; d) la frequenza cumulata relativa

classi Fre ass Val centr Fre rel Fre cum ass Fre cum rel
12-16 0 14 0,00 0 0
16-20 1 18 0,17 1 0,17
20-24 2 22 0,33 3 0,5
24-28 3 26 0,5 6 1
tot 6 1,00
9

Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58) con quali script di R si individuano:
le classi con il metodo soggettivo; le classi con il metodo a radice;le classi con il metodo logaritmico; l’istogramma
# CLASSI CALCOLATE CON IL METODO SOGGETTIVO #
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x
k <- 5 ; k
n <- length(x);n
Classi <- seq(min(x), max(x), length.out = k + 1); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
#CLASSI CALCOLATE CON IL METODO A RADICE #
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x
n<- length(x); n
Classi <- ceiling(sqrt(n)); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
#CLASSI CALCOLATE CON IL METODO LOGARITMICO #
x<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58); x # Dati di imput del carattere Età #
n <- length(x); n
k<- ceiling(1+3.322*log10(n)); k
a <- (max(x) - min(x)) / k ; a
Classi <- seq(min(x),max(x),length.out = k + 1); Classi
plot(h,ylab="Frequenze relative",xlab="Classi di Età",main="Istogramma Classi di Età")
axis(1,at = Classi,cex.axis = 1.1)
axis(2,at = c(0,round(h$counts,digits = 2)),cex.axis =1.1)
#ISTOGRAMMA# (classi metodo soggettivo)
H<- hist (x, classi1, main=“istogramma di x”)
10

Quali grafici sono più appropriati per rappresentare: a) una distribuzione dei costi indiretti di una produzione; b) una
distribuzione generica di valori suddivisi in classi; c) una relazione fra due variabili x ed y; d)una distribuzione di
probabilità discreta
Se si prende in considerazione la distribuzione dei costi indiretti di una produzione generica, questi possono essere
rappresentati attraverso un grafico a torta. Questo grafico, infatti, è molto utile quando si vuole rappresentare la composizione
di un “tutto” in parti. Il grafico cartesiano mette in relazione due variabili sui due assi (X,Y), associando normalmente la
variabile indipendente o esplicativa all’asse delle ascisse e la variabile dipendente o risposta all’asse delle ordinate.
Con il grafico a bolle viene rappresentato il fenomeno statistico in modo simile a quello a dispersione tanto che alcuni lo
considerano come vera e propria variante a tale grafico e come una via di mezzo tra il grafico e il cartogramma. Il grafico a
bolle deve essere letto in modo che le aree delle stesse debbano considerarsi proporzionali alla densità del carattere osservato.
L’utilizzo del grafico a bolle è particolarmente indicato per presentazioni di coppie di dati la cui somma ha un qualche
significato da un punto di vista aziendalistico. Il grafico ad anello è simile a quello a torta. La differenza consiste nel fatto che
vengono rappresentati in più anelli concentrici serie diverse di dati ed ogni anello è suddiviso in parti corrispondenti
normalmente alle frequenze percentuali del carattere osservato.

a) Grafico a bolle b) Istogramma c) Cartesiano d) Grafico a barre orizzontale o verticale

Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) e le relative frequenze assolute (0,1,2,3,2,1,3,4) con quali script
di R si calcolano: la media aritmetica semplice; media aritmetica in frequenza assoluta; media aritmetica in frequenza
relativa; la mediana
#DATI#
Carattere X<-c(12,2,3,45,64,32,1,87) fre. ass. <-c(0,1,2,3,2,1,3,4)
#MEDIA ARTITMETICA SEMPLICE#
n<-pength(x)
sum(x)/n
#OPPURE
Mean(x)
#MEDIA ARTITMETICA FREQUENZA ASSOLUTA#
Sum(x* fre. ass.)/sum(fre. ass.)
#MEDIA ARTITMETICA FREQUENZA RELATIVA#
Freq_rel<- fre. ass./sum(fre. ass.)
Sum(x*freq_rel)
#MEDIANA#
x<-sort(x)
Median (x)
#VARIANZA PER VALORI SINCOLI#
var<-mean((x-mean(x))^2
#SCARTO QUADRATICO MEDIO PER VALORI SINGOLI#
sqm_x <-sqrt(var(x))
#COEFFICIENTE DI VARIANZIONE# a<-sqm/mean(x)
11

Con quali script si calcolano: media aritmetica semplice; media aritmetica in frequenza; mediana; coefficiente di
variazione
#MEDIA ARTITMETICA SEMPLICE#
n<-pength(x)
sum(x)/n
#OPPURE
Mean(x)
#MEDIA ARTITMETICA FREQUENZA ASSOLUTA#
Sum(x* fre. ass.)/sum(fre. ass.)
#MEDIA ARTITMETICA FREQUENZA RELATIVA#
Freq_rel<- fre. ass./sum(fre. ass.)
Sum(x*freq_rel)
#MEDIANA#
x<-sort(x)
Median (x)
#VARIANZA PER VALORI SINCOLI#
var<-mean((x-mean(x))^2
#SCARTO QUADRATICO MEDIO PER VALORI SINGOLI#
sqm_x <-sqrt(var(x))
#COEFFICIENTE DI VARIANZIONE#
a<-sqm/mean(x)
12

Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali formule si
calcolano: a) l’indice di eterogeneità di Gini; b) l’indice di concentrazione di Gini; c)la media aritmetica semplice; d) la
mediana
13

Con quali script di R si calcolano: a) I Quartile; b) II Quartile; c) III Quartile; d) Box-plot


a) I Quartile;
x<-c(4,6,9,11,12,15,21,27,29)
quantile (x, probs=0,25)
b) II Quartile o (mediana)
X<-c(4,6,9,11,13,16,18,21,24)
n<-lenghth(x)
0,5(x[n/2]+x[n/2+1]
Median (x)
c) III Quartile;
x<-c(1,3,5,9,11,17,18,23,27)
quantile 8x, probs=0.75)
d) Box-plot
x<-c(24,71,89,12,31,45,66)
boxplot(x)

A proposito della moda: a) che cos'è la densità di classe e come si calcola; b) qual'è la formula della moda per valori
suddivisi in classi; c) che cos'è un distribuzione amodale; d) che cos'è una distribuzione plurimodale
a) che cos'è la densità di classe e come si calcola;
Quando le classi sono equi-ampie si può utilizzare, ai fini del calcolo delle misure centrali e di variabilità, il valore centrale di
classe, tenendo conto che tale procedura presenta un certo grado di approssimazione dei risultati.
Qualora, invece, le classi non sono equi-ampie è necessario disegnare per ogni classe un rettangolo che ha per altezza la
densità di classe, data dal rapporto fra la frequenza assoluta ni e l’ampiezza di classe (ai-1, ai) e per base l’ampiezza di classe
stessa.
b) qual'è la formula della moda per valori suddivisi in classi;

Mo=Lmo+ ∗𝐴𝑐𝑙𝑎𝑠𝑠𝑒 dove:

Lmo è l’estremo inferiore della classe modale.


∆finf è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe immediatamente inferiore
a quella modale.
∆fsup è la differenza fra la frequenza assoluta della classe modale e lafrequenza assoluta della classe immediatamente
superiore a quella modale.
Aclasse è l’ampiezza della classe modale.
c) che cos'è un distribuzione amodale;
Presenta frequenze tutte uguali.
d) che cos'è una distribuzione plurimodale
La Moda può essere definita come: una misura di tendenza centrale che si applica ai caratteri qualitativi e quantitativi
ordinabili, in modo crescente o decrescente. Rappresenta la modalità di un carattere che si presenta più volte o che evidenzia il
valore di frequenza più elevato in un insieme di osservazioni.
Una distribuzione di valori di un carattere può presentare più mode (in questo caso si definisce “plurimodale”), quando si
registra più volte la stessa frequenza.
14

Data una distribuzione di valori suddivisa in classi con quali formule si calcolano: a) il I Quartile; b) il II Quartile (o
Mediana); c) il III Quartile; d) la moda
a) il I Quartile;

= + DOVE:

IQ1 è l’estremo inferiore della classe dove cade il I quartile.


Fq1-1 è la frequenza relativa cumulata fino alla classe precedente a quella cui cade il I quartile
Fq1 è la frequenza relativa cumulata fino alla classe che contiene il I quartile.
∆_Q1 è l’ampiezza della classe che contiene il I quartile.
b) II Quartile (o Mediana)

= +( )𝑐 dove :

Lme è la media tra l’estremo inferiore della classe mediana e l’estremo superiore della classe che precede quella mediana.
N è la frequenza totale.
freq.cum.ass.Me-1è la frequenza cumulata assoluta della classe inferiore a quella mediana.
Freq. ass. Me è la frequenza assoluta della classe mediana.
C è l’ampiezza della classe mediana.
c) il III Quartile;

= + dove:

IQ3 è l’estremo inferiore della classe dove cade il Q3


Fq3-1 è la frequenza relativa cumulata fino alla classe precedente a quella in cui cade il Q3
Fq3 è la frequenza relativa cumulata fino alla classe che contiene il Q3
∆_Q3 è l’ampiezza della classe che contiene il Q3.
d) la moda

Mo=Lmo+ ∗𝐴𝑐𝑙𝑎𝑠𝑠𝑒 dove:

Lmo è l’estremo inferiore della classe modale.


∆finf è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe immediatamente inferiore
a quella modale.
∆fsup è la differenza fra la frequenza assoluta della classe modale e la frequenza assoluta della classe immediatamente
superiore a quella modale.
Aclasse è l’ampiezza della classe modale.
15

Dati i seguenti dati del carattere x (12,2,3,45,64,32,1,87) con quali script di R si calcolano: la devianza; la varianza; lo
scarto quadratico medio; il coefficiente di variazione
X<-c(12,2,3,45,64,32,1,87);
#DEVIANZA#
Dev_x <-sum(x-media_x)^2
1 metodo var_x <-var(x)
2 metodo n<-8
#VARIANZA#
Var_x<-dev_x/n
Var x
#SCARTO QUADRATICO#
Sqm_x<-sqrt(var_x)
#COEFFICIENTE DI VARIAZIONE#
Cv_x<-sqm_x/media_x; cuv_x

Dati i seguenti dati del carattere x (22,48,58,61,38,42) calcolare: la devianza; la varianza; lo scarto quadratico medio; il
coefficiente di variazione
Media = =44,83

Dev= + + =
=1020,8334
Var= = ∗( + +( =
∗1020,8334 =170,1389 (≅170,14)

c.v. = =0,2910 (29,10%)


16

Dati i seguenti valori centrali di classe x (1,2,3,4,5) e le relative frequenze assolute (2,3,1,5,4) calcolare: la varianza per
classi; lo s.q.m.; la devianza per classi; il coefficiente di variazione
17

Dati i seguenti valori centrali di classe xi (2,4,5,1,3) e le relative frequenze assolute ni (2,0,1,4,3) calcolare: la devianza in
frequenza assoluta; la varianza in frequenza assoluta; lo scarto quadratico medio; il coefficiente di variazione
18

Dati i seguenti dati del carattere X (12,2,3,45) e le relative frequenze assolute (1,4,0,3) calcolare: a) i cinque numeri di
sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del momento terzo per valori
singoli; d) l’indice di asimmetria con la formula del momento terzo per valori suddivisi in classi
19

Dati i seguenti valori centrali di claase x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si
calcolano: a) i cinque numeri di sintesi; b) l’indice di asimmetria di Bowley; c) l’indice di asimmetria con la formula del
momento terzo per valori singoli; d) l’indice di asimmetria con la formula del momento terzo per valori suddivisi in
classi
20

Dati i seguenti valori centrali di classe x (3,1,6,5) e le relative frequenze assolute (0,5,1,3) calcolare: a) la media per
valori suddivisi in classi; b) lo scarto quadratico medio; c) l'indice di curtosi utilizzando la formula del momento quarto
per valori singoli; d) l'indice di curtosi utilizzando la formula del momento quarto per valori suddivisi in classi
21

Dati i seguenti valori centrali di classe x (12,2,3,45) e le relative frequenze assolute (1,2,0,4) con quali script di R si
calcolano: a) la media per valori suddivisi in classi; b) lo scarto quadratico medio; c) l’indice di asimmetria con la
formula del momento quarto per valori singoli; d) l’indice di asimmetria con la formula del momento quarto per valori
suddivisi in classi
x<-(12,2,3,45) senza pesi
x<1<-(12,2,2,45,45,45,45)
media_x_1<-sqrt(var(x_1))/ media_x_1
media_x<-mean(x) #singoli
sqm_x<-sum(((x-media_x)/sqm_x)14)/n
I_curt_x_1<-sum((x_1-media_x_1)14/ 9 x (sqm_x_1)14

Dati i seguenti dati del carattere x (22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37) con quali script di R si
calcolano: l’indice di eterogeneità di Gini; l’indice di concentrazione di Gini; media aritmetica semplice; la mediana
X<-c(22,48,58,61,38,42,53,64,37,58,21,24,34,44,46,58,20,39, 41,37)
Library (labstartR)
E(x)
Gini (x)
Mean(x)
Median(x) oppure Q_2<-quantile (x, probs= 0,5)

Data la seguente matrice di dati composta di tre righe e quattro colonne (0,1,3,4,1,2,3,0,1,5,3,2) relativi al carattere X
con quali script di R si calcolano: a) le frequenze congiunte assolute; b) le frequenze teoriche; c) le contingenze assolute;
d) il chi-quadrato
22

Data la seguente matrice di dati composta di due righe e due colonne (0,1,3,4) relativi al carattere X calcolare: a) le
frequenze marginali di riga e di colonna; b) le frequenze teoriche; c) le contingenze assolute; d) il chi-quadrato
23

Si è svolta un’analisi di Connessione tra il carattere (X) che assume le modalità 1,2 e 3 e il carattere (Y) che assume le
modalità A, B e C. I dati rilevati di X sono: (1,1,3,2,3,2,1,3); quelli di (A,A,B,C,A,C,B,A) e si vuole: a)costruire la
relativa matrice di dati; b)calcolare le frequenze congiunte assolute e teoriche; c) le contingenze assolute; d) il chi-
quadrato
24

Data la tabella di contingenza formata da due righe e due colonne (0,1,3,4) quale script di R si utilizza per calcolare: a)
le frequenze teoriche; b) le contingenze assolute; c) il chi-quadrato; d) il chi-quadrato normalizzato

Nel calcolo combinatorio si vogliono disporre tre oggetti a tre a tre e si vogliono calcolare le: a) disposizioni semplici
senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione; d) combinazioni
semplici senza ripetizione
25

Nel calcolo combinatorio se si vogliono disporre tre oggetti a tre a tre con quali script si calcolano: a) disposizioni
semplici senza ripetizione; b) disposizioni semplici con ripetizione; c) permutazioni semplici senza ripetizione; d)
combinazioni semplici senza ripetizione

Come si definisce la probabilità: a) secondo l'approccio classico; b) secondo l'approccio frequentista; c)secondo
l'approccio soggettivista; d) secondo l'approccio assiomatico
Secondo l’approccio classico la probabilità si definisce come il rapporto fra l’evento probabile e tutti gli eventi possibili purché
egualmente probabili. P=EPROB/E1+E2+........+Ei dove EPROB è l’evento probabile e la sommatoria di Ei è l’insieme degli
eventi possibili equiprobabili.
Secondo l’approccio frequentista definito anche come approccio o concezione statistica la probabilità è espressa in termini
quantitativi da un valore empirico osservato: la frequenza relativa. Se si osserva un fenomeno attraverso un esperimento
costituito da un certo numero di prove in condizioni costanti, si definisce frequenza relativa il rapporto fra il numero k, ovvero
il numero delle volte nelle quali l’evento E si è verificato ed il numero totale n delle prove ovvero k/n. A questo concetto di
misurazione statistica della probabilità si associa la cosiddetta ”legge empirica del caso”, attraverso la quale si constata che al
crescere di n la frequenza relativa tende, ancorché oscillando, ad un valore stabile.
Secondo l’approccio soggettivista la probabilità è la misura che il ricercatore assegna a priori ad un evento sulla base del suo
grado di fiducia che lo stesso si verifichi.
Secondo l’approccio assiomatico la definizione di probabilità presuppone il ricorso al concetto di funzione che associ ad ogni
evento elementare dello spazio campionario Ω una probabilità P. A differenza della funzione classica nel caso della funzione
di probabilità sull’asse reale vengono riportati gli insiemi o eventi elementari. Anche in questo caso la caratterizzazione della
funzione avviene attraverso l’individuazione del dominio denotato con la lettera D (n.d.a), che coincide con il totale degli
insiemi o eventi elementari dello spazio campionario Ω e della probabilità P. In simboli i tre oggetti soprarichiamati {D, Ω, P}
costituiscono il cosiddetto spazio di probabilità.
26

Dati i valori di P(E)=0,28, P(F)=0,32 e P(EdatoF)=0,18 calcolare: a)la probabilità unione P(E∪F) per eventi compatibili;b) la
probabilità intersezione P(E∩F) per eventi dipendenti; c)la probabilità unione P(E∪F) per eventi incompatibili; d) la probabilità
intersezione P(E∩F) per eventi indipendenti
27

Data la probabilità P(E)= 0,71; P(F)=0,11 e P(E∩F) = 0,55 calcolare: a) la probabilità condizionata P(EdatoF); b) la
probabilità unione P(E∪F) per eventi compatibili; c)la probabilità unione P(E∪F) per eventi incompatibili; d)la
probabilità composta
a. ;
b.
c.
d.

Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) calcolare: a) il
valore atteso; b) la devianza; c) la varianza; d) la deviazione standard
a. Media= 0x0,90+1x0,07+2x0,02+3x0,01= 0,14
b. Devianza= var x n = 0,2204x100=2,204
c. Varianza= 0^2 x 0,90 + 1^2 x0,07+ 2^2 x 0,02 + 3^2 x 0,01 – (0,14)^2=0,2204

d. Sd=

Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) calcolare: a) la
funzione di probabilità; b) la funzione di ripartizione; c) il grafico relativo al punto a); d) il grafico relativo al punto b)
x <- 0:3;x
fx <- c(0.90, 0.07, 0.02, 0.01);fx
par(mfrow=c(1,2))
par(bg="cornsilk")
plot(x, fx, type="h", main="Grafico della funzione di probabilità")
y <- c(0, 1, 2, 3)
Fy <- c(0.90, 0.97, 0.99, 1);Fy
plot(x, Fy, type="h", main="Grafico della funzione di ripartizione")

Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) con quali script
si calcola: a) il valore atteso; b) la devianza; c) la varianza; d) lo scarto quadratico medio
28

Data la seguente distribuzione di frequenza della v.c. discreta x (0,1,2,3) con f(x)(0.90, 0.07, 0.02, 0.01) con quali script
si calcola: a) la funzione di probabilità; b) la funzione di ripartizione; c) il grafico di cui al punto a); d)il grafico di cui al
punto b)

Data due provette relative a due esami microbiologici: a) costruire la tabella a doppia entrata che modella una v.c.
bidimensionale delle frequenze congiunte relative; b) calcolare le probabilità P(X=1;Y=1) ; P(X=1;Y=2) ; c) calcolare le
probabilità P(X=2;Y=1) ; P(X=2;Y=2); d) calcolare la probabilità marginale di I riga
29

Dati i seguenti valori della v.c. x (1,2,3,4) con quale script di R si calcolano: a) la devianza; b) la varianza; c) la
covarianza; d) il coefficiente di correlazione di Bravais-Pearson

Sia X è una v.c. unidimensionale continua con quali notazioni si calcolano: a) il valore atteso; b) la varianza; c) la
deviazione standard; d) il coefficiente di variazione
Se si vuole studiare il livello medio o quello di variabilità dei valori che compongono la distribuzione di probabilità medesima,
occorre analizzare i concetti di valore atteso, di varianza e di deviazione standard.
La media o valore atteso di una v.c. continua unidimensionale: Dove l’integrale, purchè esista e sia
infinito, rappresenta la somma nel continuo di tutti i valori assunti dalla v.c. continua X.
La varianza è data: .

La deviazione standard o scarto quadratico medio è data dalla radice quadrata della varianza:

Il coefficiente di variazione è definito dal rapporto fra deviazione standard e media espressa in valore assoluto:
30

Sia X è una v.c. continua bidimensionale con quali notazioni si calcolano: il valore atteso; la varianza; la deviazione
standard; il coefficiente di variazione.
Se si vuole studiare il livello medio o quello di variabilità dei valori che compongono la distribuzione di probabilità medesima,
occorre analizzare i concetti di valore atteso, di varianza e di deviazione standard.
La media o valore atteso di una v.c. continua bidimensionale: ; dove il
doppio integrale, qualora esista e sia finito, si riferisce a tutti i valori di x e y assunti dalla v.c. discreta bidimensionale g(X,Y).
La variabile di una v.c. continua bidimensionale si propone il concetto di varianza condizionata in Y che coincide con quella
nel discreto data da: ; dove la X|Y=yc rappresenta i valori della x condizionati
a quelli della y.
Mentre, la varianza condizionata in X sarà data dalla seguente notazione:
dove la Y|X=xc rappresentai valori della y condizionati a quelli della x.

Il coefficiente di variazione è definito dal rapporto fra deviazione standard e media espressa in valore assoluto:

Commentare brevemente: la legge debole dei grandi numeri; la legge forte dei grandi numeri; la disuguaglianza di
Markov; la diseguaglianza di Chebyshev
Si può utilizzare la Disuguaglianza di Chebyshev per avere informazioni sulla varianza. Essa stabilisce che, per ogni
distribuzione di dati di una popolazione, la percentuale di essi non si allontanano dalla media per una certa quantità dello scarto
quadratico medio è pari almeno a: . La disuguaglianza può assumere la notazione completa rappresentata
dalla seguente disuguaglianza: dove k è la quantità espressa da un numero puro positivo.

Dalla diseguaglianza di Chebyshev deriva la Legge dei grandi numeri che assume due connotazioni: quella forte e quella
debole.
Legge debole. Date n variabili mutuamente indipendenti con media μ e varianza σ2 ed un numero positivo a si può affermare
che il limite per x che tende a ∞ della probabilità della differenza tra la media delle v.c. stesse e il valore atteso μ in termini
assoluti sia maggiore di un valore intero positivo a è uguale a zero. In simboli si avrà: limx->∞ P[l (X1+X2+….+Xn)/n]-
μl>a]=0
Si può dedurre che la media μ converge in probabilità alla media aritmetica delle Xi per i=1,…,n.
Legge forte. Date n variabili mutuamente indipendenti con media μ e varianza , si può affermare che la probabilità che al
limite per n che tende a +∞ la media aritmetica delle stesse sia uguale a µ in valore assoluto, è pari a 1.
In simboli si avra: .

Disuguaglianza di Markov. Nella situazione in cui non si è a conoscenza della distribuzione della v.c., si potrebbe avere
l’esigenza di definire dei limiti alla probabilità. In questa circostanza può tornare utile, pur con forti limiti, utilizzare la
disuguaglianza di Markov dove la probabilità della v.c. X, che deve essere maggiore o uguale alla quantità h, non deve
superare il rapporto tra la media e la stessa quantità h e quindi può essere trovata conoscendo solo il valore atteso.
La notazione è: dove X è una v.c. non negativa e x è la media o il valore atteso.
31

Data la distribuzione di probabilità Uniforme discreta con N=10 con quali script si calcola: a) la probabilità che x=8; b)
la probabilità che x< 2; c)la probabilità che x> 7; d) la probabilità che x sia ricompreso fra 8 e 4

Data la distribuzione di probabilità Uniforme discreta con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti
32

Data la distribuzione di probabilità Uniforme discreta con N=10 calcolare: a) la probabilità che x=8; b) la probabilità
che x< 2; c) la probabilità che x> 7; d) la probabilità che x sia ricompreso fra 8 e 4

Data la distribuzione di probabilità Bernoulliana con p=0,07 con quali script si calcola: a)la probabilità che x=0; b) la
probabilità che x= 1; c) il valore atteso; d)la varianza

Data la distribuzione di probabilità Bernoulliana con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti
33

Data la distribuzione di probabilità Bernoulliana con p=0,07 calcolare: a)la probabilità che x=0; b) la probabilità che
x= 1; c) il valore atteso; d) la varianza

Data la distribuzione di probabilità Binomiale con p=0,07 e n=11 con quali script si calcola: a)la probabilità che x=0; b)
la probabilità che x< 3; c) la probabilità che x>2; d) la probabilità che x sia ricompreso fra 3 e 4
34

Data la distribuzione di probabilità Binomiale con p=0,07 e n=11 calcolare: a)la probabilità che x=0; b) la probabilità
che x< 3; c) la probabilità che x>2; d) la probabilità che x sia ricompreso fra 3 e 4

Data la distribuzione di probabilità Binomiale con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti
35

Data la distribuzione di probabilità Poissoniana con lambda =3,2 con quali script si calcola: a)la probabilità che x=10;
b) la probabilità che x< 13; c) la probabilità che x>22; d) la probabilità che x sia ricompreso fra 30 e 40

Data la distribuzione di probabilità Poissoniana con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti di variazione
36

Data la distribuzione di probabilità Poissoniana con lambda =3,2 calcolare: a)la probabilità che x=10; b) la probabilità
che x< 13; c) la probabilità che x>22; d) la probabilità che x sia ricompreso fra 30 e 40

Data la distribuzione di probabilità Uniforme continua nell’intervallo 20-50 con quali script si calcola: a) la
probabilità che x=28; b) la probabilità che x< 32; c)la probabilità che x> 37; d) la probabilità che x sia ricompreso fra
31 e 44
37

Data la distribuzione di probabilità Uniforme continua nell’intervallo 20-50 calcolare: a) la probabilità che x=28; b) la
probabilità che x< 32; c) la probabilità che x> 37; d) la probabilità che x sia ricompreso fra 31 e 44

Data la distribuzione di probabilità Uniforme continua con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti
38

Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 calcolare: a) la probabilità che x=4,1; b) la
probabilità che x< 3,9; c)la probabilità che x> 4,4; d) la probabilità che x sia ricompreso fra 4,2 e 4,5

Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 con quali script si calcola: a) la probabilità
che x=4,1; b) la probabilità che x< 3,9; c)la probabilità che x> 4.4; d) la probabilità che x sia ricompreso fra 4,2 e 4,5
39

Data la distribuzione di probabilità Normale con quali script si calcola: a) il quantile; b) la probabilità; c)la probabilità
cumulata; d) i numeri casuali estratti

Data la distribuzione di probabilità Normale con media =4,7 e dev.std=2,1 con quali script si calcola: a) la varianza; b)
la deviazione standard; c)l’indice di asimmetria; d)l’indice di curtosi

Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 con quali script si calcola: a) la
probabilità che x=2,8; b) la probabilità che x< 3,2; c)la probabilità che x> 3,7; d) la probabilità che x sia ricompreso fra
3,1 e 4,4
a. P2_8<-pnom(2.8,0,1),P2_8
b. P3_2<-pnom(3.2,0,1);p3_2
c. P3_7<-1-pnom(3.7,0,1);p3_7
d. P4_4<-pnom(4.4,0,1); p3_1<-pnom(3.1,0,1); p4_4 – p3_1
40

Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 con quali script si calcola: a) la
varianza; b) la deviazione standard; c) l’indice di asimmetria; d)l’indice di curtosi
a. Var<-ds^2; var
b. Ds<-1
c. Sim<-0
d. Kurt<-3

Data la distribuzione di probabilità Normale standardizzata con quali script si calcola: a) il quantile; b) la probabilità;
c)la probabilità cumulata; d) i numeri casuali estratti
a. Q<-qnom(x,0,1);q
b. P<-pnom(x,0,1);p
c. D<-dnom(x,0,1);d
d. Rum< rnom (x,0,1); rnum

Data la distribuzione di probabilità Normale standardizzata con media=0 e dev.std=1 calcolare: a) la probabilità che
x=2,8; b) la probabilità che x< 3,2; c)la probabilità che x> 3,7; d) la probabilità che x sia ricompreso fra 3,1 e 4,4
a.
b.
c.
d.

Data la distribuzione di probabilità t di Student con quali script si calcola: a) il quantile; b) la probabilità; c) la
probabilità cumulata; d) i numeri casuali estratti
a. q<-qt(x,df);q
b. p<-pt(x.df);p
c. d<-dt(x,df);d
d. num<-rt(x,df); num

Data la distribuzione di probabilità t di Student con n=23 calcolare: a) la probabilità che x=2; b) la probabilità che x<
12; c) la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 11 e 14
41

Data la distribuzione di probabilità t di Student con n=23 con quali script si calcola: a) la probabilità che x=2; b) la
probabilità che x< 12; c) la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 11 e 14
a. p2<-pt(2,23);p2
b. p12<-pt(12,239;p12
c. p17<-1-pt(17,23);p17
d. p14<-pt(14,23); p11<-pt(11,23); p14-p11

Data la distribuzione di probabilità t di Student con n=23 con quali script si calcola: a) la varianza; b) la deviazione
standard; c) l’indice di asimmetria; d) l’indice di curtosi
A. g<-23; var <-g/(g-z); var
B. sqm <- sqrt (var); sqm
C. assimetria <- 0
D. kurt<- 6 / (g-4); kurt

Data la distribuzione di probabilità Chi-quadrato con n=23 con quali script si calcola: a) la probabilità che x=8; b) la
probabilità che x< 3; c) la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 13 e 20
a. p8 <- pchisq (8,23) ; p8
b. p3<- pchisq (3,23)
c. p17<-1-pchisq(17,23); p17
p20<-pchisq (20,23) ; p20- p13
d. p13<- pchisq (13,23)

Data la distribuzione di probabilità Chi-quadrato con quali script si calcola: a) il quantile; b) la probabilità; c) la
probabilità cumulata; d) i numeri casuali estratti
a. q<- qchisq (x, df); q
b. d<- dchisq (x, df): d
c. p<- pchisq (x,df); p
d. num<- rchiusq (x, df); num

Data la distribuzione di probabilità Chi-quadrato con n=23 con quali script si calcola: a) la varianza; b) la deviazione
standard; c) l’indice di asimmetria; d) l’indice di curtosi
g<- 23
a. var <- 2^g ; var
b. sd<- sqrt 8var) ; sd
c. asim <- sqrt (g/8) ; asim
d. curt <- 12/g
42

Data la distribuzione di probabilità F di Fisher con quali script si calcola: a) il quantile; b) la probabilità; c)la
probabilità cumulata; d) i numeri casuali estratti
a. q<- qf (x, df1, df2); q
b. p<-pf(x,df1,df2);p
c. d<-df(x,df1,df2); d
d. num<- rf (x, df1, df2) ; num

Data la distribuzione di probabilità F di Fisher con g1=16 e g2=24 con quali script si calcola: a) la probabilità che x=18;
b) la probabilità che x< 22; c)la probabilità che x> 17; d) la probabilità che x sia ricompreso fra 14 e 19

La v.c. X è la sommatoria di 80 v.c. bernoulliane e quindi è una v.c. binomiale con parametri p=0,23 e n=80
Bin~(80;0,23). Calcolare: a) il valore atteso; b) la varianza; c) la probabilità che p(X<3);d) la probabilità che P(X>2)
43

Si devono individuare 2 unità da scegliere tra 6 impiegati (quadri) sulla base degli anni di esperienza che risultano
essere: 4 8 12 12 14 16 con quali script si calcola: a)Il numero campioni ordinati di numerosità 2 (con ripetizione); b) Il
numero campioni ordinati di numerosità 2 (senza ripetizione); c) numero campioni non ordinati di numerosità 2 (con
ripetizione); d)numero campioni non ordinati di numerosità 2 (senza ripetizione)
Calcolo del numero di campioni ordinati e non ordinati con e senza ripetizione #
x<-c(4,8,12,12,14,16)
K<-2
N<-6
# NUMERO CAMPIONI ORDINATI DI NUMEROSITA` 2 (CON RIPETIZIONE)
number<-N^K;number
sample(x,number,replace=TRUE)
# NUMERO CAMPIONI ORDINATI DI NUMEROSITA` 2 (SENZA RIPETIZIONE)
number<-factorial(N)/factorial(N-K); number
# NUMERO CAMPIONI NON ORDINATI DI NUMEROSITA` 2 (CON RIPETIZIONE)
number<-factorial(N+K-1)/(factorial(K)*factorial(N-1)); number
# NUMERO CAMPIONI NON ORDINATI DI NUMEROSITA` 2 (SENZA RIPETIZIONE)
number<-factorial(N)/(factorial(K)*factorial(N-K)); number

In una distribuzione della media campionaria per popolazioni finite o senza ripetizione quale notazione si utilizza per
calcolare: a) la media campionaria; b) la varianza campionaria corretta; c) la deviazione standard; d) il coefficiente di
variazione
a) Il valore atteso della media campionaria è espresso dalla seguente notazione: .

b) Il valore della varianza campionaria diventa varianza campionaria corretta: , in questo caso essa
è minore rispetto allo schema di campionamento per popolazioni infinite.
c) La radice quadrata della varianza campionaria esprime la deviazione standard o scarto quadratico medio campionario

ed è espressa dalla seguente notazione: .


d) Il coefficiente di variazione campionario è il rapporto fra la deviazione standard e il valore atteso campionari ed è

espresso dalla seguente notazione: .


44

Si estrae un campione casuale di 300 prodotti da cui si rileva una difettosità media del 2% e si vuole calcolare: a) la
probabilità che 10 prodotti siano difettosi; b) la probabilità di riscontrare un numero di prodotti difettosi minore di 8;
c) la probabilità di riscontrare un numero di prodotti difettosi compreso fra 5 e 9;d) il valore atteso
45

Si estrae un campione di 24 contenitori e si vuole calcolare la probabilità di riscontrare una varianza campionaria: a)
minore di 0,45; b) maggiore di 0,48; c) compresa fra 0,38 e 0,53; d) pari a 0,39

Commentare brevemente: a) la differenza fra stimatore e stima; b) la proprietà di non distorsione o correttezza; c) la
proprietà di efficienza; d) la proprietà di consistenza.
Per quanto riguarda la stima puntuale non si può dire a priori che essa sia buona o cattiva in quanto non conoscendo il vero
valore del parametro, essendo esso incognito, non è possibile fare confronti. Con stimatore affidabile o non affidabile, si
intende fare riferimento al metodo di stima impiegato le cui proprietà non sono valutabili facendo riferimento ad un singolo
campione, ma all’universo di tutti i campioni possibili.
Le proprietà degli stimatori “ottimali” sono la: distorsione o correttezza; efficienza e consistenza.
Distorsione. Lo stimatore T si dice corretto o non distorto se il suo valore medio o atteso è dato da: E(T)=μ per tutti i possibili
valori di μ. La distorsione dello stimatore T è data dalla differenza fra il suo valore medio o atteso e il valore del parametro
della popolazione da stimare ovvero: B(T)=E(T)-μ.
Efficienza. Lo stimatore T si dice efficiente se la differenza fra se stesso e il valore del parametro della popolazione da stimare
è il più basso possibile ovvero l’efficienza è una misura di dispersione o di variabilità dello stimatore. Se si hanno più stimatori
(T1,T2,......,Tn), il confronto tra di essi in termini di efficienza viene svolto attraverso il confronto fra le relative varianze; si
dirà, ad esempio, che T1 è più efficiente di T2 se la Var(T1)< Var(T2) e via di seguito e quindi si ha una efficienza relativa.
Se invece lo stimatore T1, ad esempio, è più efficiente di qualsiasi altro stimatore del parametro di interesse si può dire che
esiste una efficienza assoluta.
Consistenza . Uno stimatore T si dice consistente se la sua precisione aumenta all’aumentare della dimensione campionaria.
Si dice che uno stimatore T è asintoticamente consistente se al tendere all’infinito della numerosità campionaria il suo valore o
realizzazione tende al valore del parametro ignoto della popolazione. Ciò è possibile solo se lo stimatore T è consistente in
media quadratica ovvero se tende a zero l’errore quadratico medio.
46

Definire sinteticamente: a) concetto di stimatore intervallo di confidenza o di fiducia; b) il livello di confidenza; c) il


livello di significatività; d) dati i valori di sigma=12; n=28; un livello di confidenza pari al 5% per cui la zeta empirica è
pari a 1,96 e una media campionaria =21 calcolare l’intervallo di confidenza per la media con varianza nota
47

Stimata la varianza campionaria pari a 12,8 e stabilito un livello di significatività dell’5% con quali script si calcola: a)
il limite superiore dell’intervallo di confidenza per la media con varianza ignota; b) il limite inferiore dell’intervallo di
confidenza per la media con varianza ignota; c) la numerosità campionaria; c) l’ampiezza dell’intervallo

Data la varianza del peso del tondino pari a 36 gr ed estratto un campione di 397 tondini con un peso medio pari a 987
grammi e un livello di significatività dell’1% con quali script si calcola: a) il limite superiore dell’intervallo di
confidenza per la media con varianza nota; b) il limite inferiore dell’intervallo di confidenza per la media con varianza
nota; c) la numerosità campionaria; c) l’ampiezza dell’intervallo
48

Si vuole calcolare: a) l’intervallo di confidenza al 95% (zempirica=1,96) per la proporzione campionaria pari a 0,47 su
un campione di 98 elettori; b) l’intervallo di confidenza al 99% (zempirica=2,67) per la proporzione campionaria pari a
0,47 su un campione di 320 elettori; c) l’intervallo di confidenza al 90% (zempirica=1,64) per la proporzione
campionaria pari a 0,47 su un campione di 980 elettori; d) l’intervallo di confidenza al 95% (zempirica=1,96) per la
proporzione campionaria pari a 0,47 su un campione di 1550 elettori
49

Data la distribuzione di probabilità Binomiale con p=0,49 ed n=50 e stabilito un livello di significatività dell’5% con
quali script si calcola: a) il limite superiore dell’intervallo di confidenza per la proporzione; b) il limite inferiore
dell’intervallo di confidenza per la proporzione; c) la numerosità campionaria; c) l’ampiezza dell’intervallo

Stimata la varianza campionaria pari a 2,8 e stabilito un livello di significatività dell’1% con quali script si calcola: a) il
limite superiore dell’intervallo di confidenza per la varianza; b) il limite inferiore dell’intervallo di confidenza per la
varianza; c) la numerosità campionaria; c) l’ampiezza dell’intervallo
intervallo per la varianza 2.8, n=50, alfa= 0.01
DATI
varcamp<-2.8
n<-50
alpha<-0.01
I DUE CHI QUADRO DA TAVOLA
chi_sup<-qchisq(alpha/2, n-1)
chi_sup
chi_inf<-qchisq(1-alpha/2, n-1)
chi_inf
ESTREMO INFERIORE
inf<-varcamp*(n-1)/chi_inf; inf
ESTREMO SUPERIORE
sup<-varcamp*(n-1)/chi_sup; sup
AMPIEZZA
ampiezza<-sup-inf; ampiezza la numerosità campionaria non è calcolabile
50

Dato un campione n=24 con varianza corretta pari a 15 si imposti la notazione per il calcolo dello stimatore intervallo
di confidenza: a) al 99%; b) al 95%; al 90%; d) al 97%
51

Dato un campione n=24 con varianza corretta pari a 15 si calcoli la numerosità campionaria: a) al 99% con un errore
in valore assoluto non superiore a 2 (Zcritica=2,576); b) al 95% con un errore in valore assoluto non superiore a 1,5 (Z
critica=1,96); al 90% con un errore in valore assoluto non superiore a 2,5(Zcritica=1,64); d) al 97% con un errore in
valore assoluto non superiore a 2 (Z critica)=2,17)

Commentare brevemente: a) il significato di ipotesi nulla e alternativa; b) il significato di verifica di ipotesi con test
unilatero dx; c) il significato di verifica di ipotesi con test unilatero sx; d) il significato di verifica di ipotesi con test
bilatero
Il concetto di test parametrico presuppone di affrontare la verifica di ipotesi sui parametri di una popolazione normale da cui
sono estratti i campioni. L’approccio di Neyman e Pearson, noto come test di ipotesi, prende in considerazione esplicitamente
l’ipotesi alternativa rispetto a quella di interesse o nulla. Per ipotesi si intende stabilire un valore a priori riguardante un
parametro della popolazione di interesse. Le due ipotesi in opposizione sono: quella nulla o di interesse, definita H0 e quella
alternativa, definita H1. L’ipotesi H0 è quella considerata vera fino a prova contraria. L’ipotesi H1 è quella in
contrapposizione.
Le procedure che permettono di decidere se accettare o rifiutare una data ipotesi o di stabilire se un dato campione osservato
differisce dai risultati attesi sono definite test statistici o test d’ipotesi o test di significatività dette anche regole di decisione.
Se l’ipotesi nulla H0 è un’affermazione sul valore assunto da un parametro incognito di una popolazione, l’ipotesi alternativa
H1 risponde ad una delle seguenti affermazioni: il parametro è maggiore o uguale del valore ipotizzato (test unilatero con coda
a destra); il parametro è minore o uguale del valore ipotizzato (test unilatero con coda a sinistra); il parametro è diverso del
valore ipotizzato (test bilatero o a due code).
52

Dato un mu =200, un campione n=92 e una media campionaria=198 con quali script si calcola: a) la zeta empirica; b) il
p-value all’1%; c) il p-value al 5%; c) il p-value al 10%

Commentare brevemente: a) il significato di errore di I tipo; b) il significato di errore di II tipo; c) il significato di


potenza del test; d) la interrelazione fra teoria della stima e verifica di ipotesi
Se si rifiuta l’ipotesi di interesse sotto quella alternativa quando si sarebbe dovuta accettare, si commette un errore del I tipo.
Se si accetta l’ipotesi di interesse sotto quella alternativa quando si sarebbe dovuta rifiutare, si commette un errore del II tipo.
In entrambi i casi si assume una decisione errata o si commette un errore di valutazione. In linea generale è più grave
commettere un errore del I tipo che uno del II.
Potenza del test
Si consideri un’ipotesi alternativa H1:μ=μ0. La potenza del test è il complemento a 1 dell’errore di II tipo (1-β). Si può
affermare che la potenza del test corrisponde alla probabilità di rifiutare H0 quando questa è falsa. Quindi si cerca di avere un
valore molto alto di questa probabilità, come si ribadisce che α deve avere un valore molto basso al fine di garantire una bassa
probabilità di commettere l’errore di I tipo.
Interrelazioni fra teoria della stima e verifica di ipotesi
Dalle considerazioni svolte finora si può notare che esiste una interrelazione tra la teoria della stima che coinvolge gli intervalli
fiduciari e la teoria dei test di ipotesi. Se si prende a riferimento la verifica delle ipotesi per test bidirezionali su una media
campionaria nel caso di grandi campioni (n>30) distribuiti normalmente, il sistema di ipotesi relativo sarà: H0:μ=μ0 vs
H1:μ≠μ0.
53

Dato un campione n=24 con μ =22, media campionaria=21 e varianza nota pari a 15 si scelga la regola di decisione in
questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test
bilatero (Z critica=1,96); d); c) per un test bilatero (Z critica=1,64)
54

Dato un campione n=33 con μ =35, media campionaria=34 e varianza ignota e stimata pari a 15,88 si scelga la regola
di decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c)
per un test bilatero (Z critica=1,96); d) c) per un test bilatero (Z critica=1,64)
55

Dato un campione n=41 con una % di pezzi difettosi pari al 2% e una proporzione stimata di 2,3% si scelga la regola di
decisione in questi casi: a) per un test unilatero dx (Z critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per
un test bilatero (Z critica=1,96); d) per un test bilatero (Z critica=1,64)
56

Dato un campione n=21 con varianza pari a 14,55 e varianza stimata pari a 15,88 si scelga la regola di decisione in
questi casi: a) per un test a 95% (Chi critica alfa=10,85; Chi critica 1-alfa=31,41); b) per un test al 99% (Chi critica
alfa=8,26; Chi critica 1-alfa=37,57); c) per un test al 90% (Chi critica alfa=12,44; Chi critica 1-alfa=28,41); d) c) per un
test al 97%(Chi critica alfa=9,9; Chi critica 1-alfa=28,41)
57

Dato il valore del coefficiente di correlazione pari a 0,93 e la cov(XY) pari a -1,24 calcolare: a) il coefficiente di
determinazione; b) il prodotto delle deviazioni std della X e della Y; c) spiegare il significato del segno della covarianza;
d) spiegare il significato di a)
58

Dati i seguenti valori dell’intercetta e del coefficiente angolare pari rispettivamente a 2,4 e 0,58 e dei rispettivi ESQM
pari a 1,1 e 0,45: a)calcolare la statistica t di Student per l’intercetta; b) calcolare la statistica t di Student per il
coeffciente angolare; c) spiegare il significato di a); d) spiegare il significato di b)
59

Date le seguenti coppie di valori y (1,2,3) e x(12,11,10): calcolare: a)calcolare il coeff. angolare; b) calcolare l’intercetta;
c) descrivere la retta stimata; d) calcolare il valore di y(stimato) per un valore di x=9

Dato un Modello di Regressione lineare semplice con 7 osservazioni quali gradi di libertà si assegnano: a) alla
regressione; b) al residuo; c) al totale; d) spiegare molto sinteticamente il significato di gradi di libertà.
a. G.d.l regressione = k parametri K = 1
b. G.d.l. residuo = n- k- 1 = 7-1-1 = 5
c. G.d.l totali = n -1 = 7- 1 = 6
d. I gradi di libertà di una variabile aleatoria o di una statistica in genere esprimono il numero minimo di dati sufficienti
a valutare la quantità d'informazione contenuta nella statistica. Infatti, quando un dato non è indipendente,
l'informazione che esso fornisce è già contenuta implicitamente negli altri. È possibile quindi calcolare le statistiche
utilizzando soltanto il numero di osservazioni indipendenti, consentendo in questo modo di ottenere una maggiore
precisione nei risultati.
Il concetto di gradi libertà venne introdotto in statistica da Ronald Fisher negli anni '20.
Regressione e residuo = 7-2 ; totale = 7-1
60

Dati i valori della devianza di regressione e del residuo e 8 osservazioni calcolare il test F: a) per valori pari
rispettivamente a 63692,07 e 2118,636; b) per valori pari rispettivamente a 73692,07 e 2218,636; c) per valori pari
rispettivamente a 83692,07 e 3118,636; d) per valori pari rispettivamente a 93692,07 e 4118,636

Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) il coeff. angolare; b)
l’intercetta; c) la devianza spiegata; d) la devianza residua
61

Data l’equazione della retta stimata y(stim)=12,5 + 0,76*x calcolare quale valore stimato si ottiene per la variabile
dipendente y fissati i seguenti valori di x: a) x=13,8; b) 12,4; c) 16,1; d) 15,3

Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-
4;250-10;255-11;365-14;485-18;592-25) con quali script si calcolano: a) i coefficienti di regressione; b) l’output della
regressione; c) la media di x; c) la media di y
62

Dato un Modello di Regressione lineare semplice quali sono le formule per calcolare: a) la devianza totale; b) R2; c) R2
aggiustato; d) test F

La devianza totale è data da : DT = DS + DR.


Dalla notazione della devianza totale in forma compatta si può ricavare il coefficiente di determinazione:

Il coefficiente di determinazione può essere definito, anche, dalla seguente notazione:


Dove (psy)2 è il coefficiente di correlazione Bravais - Pearson.
63

Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-
4;250-10;255-11;365-14;485-18;592-25) con quali script si calcola: a) la devianza spiegata; b) la devianza residua; c) la
devianza totale; d) il coefficiente di determinazione
X<-c (4,10,11,14,18,25);x
Y<- c (0,250,255,365,485,592);y
Modello<-lm(formula= y ~x, x=t, y=t); modello
Stimati<-modello $fitted. values; stimati
Ds<-sum((stimati-mean(y))^2);ds
Dr<-sum((y-stimati)^2):dr
Dt<-ds+dr;dt;
determinazione <- ds/dt; determinazione

Dato il valore del coefficiente di determinazione pari a 0,97 e la devianza residua pari a 12,7 calcolare: a) la devianza
spiegata; b) la devianza totale; c) il coefficiente di correlazione; d) scrivere in simboli la formula della devianza residua
utilizzando i valori di y osservati e stimati
64

Descrivere sinteticamente il significato delle ipotesi base cui sottostà il Modello di Regressione lineare semplice: a)
linearità sui regressori; b) normalità dei residui; c) valore atteso dei residui nullo; d) varianza costante dei residui
Le ipotesi di base del Modello di Regressione lineare semplice sono quelle di: linearità, omoschedasticità (o varianza costante
degli errori), indipendenza e normalità.
La prima ipotesi che si analizza è quella di linearità. Oppure si può studiare il grafico dei residui che offre la misura della
variabilità dei dati osservati rispetto ad un valore 0. La distribuzione dei valori al di sopra o al di sotto del valore zero mostra
quanto il modello sottostà a tale ipotesi. Se si rilevasse un valore del rapporto di determinazione molto basso, ciò non significa
che in assoluto non esiste una correlazione tra le due variabili osservate. Si può affermare soltanto che il modello di
regressione non evidenzia un legame lineare, senza escludere che tra le due variabili si potrebbe configurare, invece, un legame
non lineare.
Ipotesi di omoschedasticità (o di varianza costante)
Se la varianza delle Yi è costante, l’analisi del grafico dei residui mostra una distribuzione regolare dei valori intorno, sopra e
sotto lo zero ovvero all’aumentare dei valori della Yi disposti sull’asse delle ascisse, la distanza dei valori sotto lo zero
eguaglia la distanza di quelli sopra lo zero e viceversa. Nel caso di varianza non costante (eteroschedasticità), invece, la
distanza dei residui positivi o negativi rispetto allo zero aumenta all’aumentare dei valori della Yi e cioè si può osservare una
distribuzione dei residui intorno allo zero detta “ad imbuto”.
Ipotesi di indipendenza dei residui (o errori)
Una considerazione particolare va fatta sull’analisi della varianza di una relazione funzionale lineare fra due variabili
(dipendente ed esplicativa) Y e X rispetto al momento in cui le osservazioni vengono rilevate. Si può dire genericamente che
gli errori (residui) non sono indipendenti se la loro distribuzione assume uno sviluppo intorno allo zero ovvero, se nell’istante
0 l’errore (residuo) assume un valore positivo, molto probabilmente nell’istante 1 l’errore assumerà ugualmente un valore
positivo. In questo caso si può affermare di essere in presenza di non indipendenza o autocorrelazione positiva. Nel caso
contrario si ha autocorrelazione negativa.
In situazione di autocorrelazione si verificano gli stessi inconvenienti osservati per l’eteroschedasticità (o varianza non
costante) ovvero la relazione funzionale lineare fra due variabili (dipendente ed esplicativa) Y e X comporta che gli stimatori
dei regressori, ottenuti con il metodo dei minimi quadrati, pur rimanendo corretti (o non distorti), non sono più efficienti
ovvero non hanno la più bassa varianza e quindi il loro uso può determinare risultati errati che inducono, soprattutto per quanto
riguarda le procedure inferenziali previsive, ad errori.
Ipotesi di Normalità degli errori
L’ipotesi di Normalità degli errori ha una grande importanza nell’inferenza statistica. Per verificare tale ipotesi si usa la
metodologia dei residui standardizzati che prende in considerazione il rapporto tra i residui e l’errore standard della
regressione.

Dato un Modello di Regressione lineare semplice spiegare molto sinteticamente il significato di: a) residui e relative
rappresentazioni grafiche; b) valori anomali; c) bontà del modello; d) finalità del modello
Gli stimatori, ottenuti con il metodo dei minimi quadrati, possono essere utilizzati per stimare i parametri di interesse che
mostrano evidenza statistica su quelli incogniti della popolazione. Qualora una o più ipotesi di base non sia soddisfatta, il
modello non è ben specificato e il suo utilizzo presenta alcuni limiti. Esiste una tecnica metodologica che permette di
analizzare le cause di una “bad specification” detta analisi dei residui.
Nell’analisi delle osservazioni della relazione lineare fra la variabile dipendente e la variabile esplicativa Y e X si osservano n
realizzazioni campionarie. Si può verificare che alcune di esse presentino valori del tutto diversi e si dispongano sul piano
cartesiano in modo anomalo ovvero molto distanti dal trend relativo alla maggior parte delle osservazioni.
In questo caso siamo in presenza di valori anomali (o outliers) che evidenziano una relazione diversa tra la variabile
dipendente (o risposta) e quella indipendente o esplicativa. L’analisi del modello di regressione è condizionato da questi valori
che inducono ad una stima dei coefficienti di regressione (o regressori) ovviamente errata con conseguenze sia di natura
inferenziale descrittiva che soprattutto previsiva. Infatti il valore dell’intercetta, se presente nella relazione, e quello del
coefficiente angolare della retta stimata con il MMQ saranno condizionati da queste realizzazioni anomale. Svolta l’analisi
inferenziale che deve cercare di comprendere le ragioni dell’anomalia, si escludono i valori anomali supponendo che tali
osservazioni non incidono sulla bontà dell’adattamento dei valori stimati rispetto a quelli osservati.
65

Dato il valore dell’intercetta stimata pari a 12,5, un valore della t di Student critica con n-2 gradi di libertà pari a 2,571
ed un valore del relativo error std par a 34,67; dato il valore del coefficiente angolare stimato pari a 61,4, un valore
della t di Student critica con n-2 gradi di libertà pari a 2,571 ed un valore del relativo error std pari a 13,45 calcolare:
a) l’intervallo di confidenza per l’intercetta; b) l’intervallo di confidenza per il coefficiente angolare; c) accettare o
rifiutare H0=0 per l’intercetta; d) accettare o rifiutare H0=0 per il coefficiente angolare

Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’intervallo di confidenza per
l’intercetta; b) l’intervallo di confidenza per il coefficiente angolare; c) spiegare il significato del punto a); d) spiegare il
significato del punto b
Dopo aver calcolato i regressori stimati b(stimato) ed a(stimato) estratti da un campione essi vengono utilizzati per fare
inferenza sui relativi parametri a e b della popolazione da cui è estratto il campione.
66

Quali sistemi di ipotesi si impostano per: a) per un test bilatero per l’intercetta; b) per un test unilatero dx per
l’intercetta; c) per un test unilatero sx per l’intercetta; d) per un test bilatero per il coefficiente angolare
Verifica di ipotesi sul coefficiente angolare
Sistema di ipotesi bilaterale:
H0 : β1 = β1* ipotesi nulla; H1 : β1 ≠ β1* ipotesi alternativa dove β1* `e un valore noto che fissiamo noi, sulla base delle
nostre esigenze.
Fissiamo un valore α, 0 < α < 1, che chiameremo livello di significatività del test, e vogliamo che la probabilità di ritenere
falsa H0 quando in realt`a H0 `e vera sia proprio pari ad α.

Se H0 `e vera: statistica test

Valore osservato della statistica test: determinazione campionaria di T


Quindi se Se H0 `e vera, P(|T| > |tn−2,1−α/2|) = α e se decidiamo di ritenere falsa H0 quando |toss | > |tn−2,1−α/2|,
rischiamo di rifiutare H0 quando essa `e vera con probabilità α.
Per la Verifica di ipotesi sull’intercetta Si ripetono gli stessi ragionamenti che valgono per il coefficiente angolare.
Sistema di ipotesi bilaterale: H0 : β0 = β0* ipotesi nulla, H1 : β0 6= β0* ipotesi alternativa.

Se H0 è vera: statistica test ; Valore osservato della statistica test: determinazione


campionaria di T.
Al livello di significatività α, rifiutiamo H0 quando |toss | > |tn−2,1−α/2| o, equivalentemente, quando ˆα < α, con
αˆ = P(|T| > |toss | quando `e vera H0).
Sistema di ipotesi unilaterale: H0 : β0 = β0*(≤ β0*) ipotesi nulla; H1 : β0 > β0*ipotesi alternativa.
Al livello di significatività α, rifiutiamo H0 quando toss > tn−2,1−α o, equivalentemente, quando ˆα < α, con αˆ = P(T > toss
quando `e vera H0).

Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’errore standard quadratico
medio (ESQM) per la regressione; b) l’errore standard quadratico medio (ESQM) per l’intercetta; c) l’errore standard
quadratico medio (ESQM) per il coefficiente angolare; d) la devianza residua.

ESQM REGRESSIONE:

ESQM INTERCETTA:

ESQM COEFF. ANGOLARE:

Dato un Modello di Regressione lineare semplice con i valori della a(stimata) e b(stimato) con quali script si calcola: a)
la t empirica dell’intercetta; b) l’intervallo di confidenza per l’intercetta all’1%; c) la t empirica del coefficiente
angolare; ) l’intervallo di confidenza per il coefficiente angolare al 5%
a_stim<-mean(y)_b*mean(x)
ic_sup_a_stim<-a_stim+qt(0.025,n-2)*esqm_int;ic_sup_a_stim
ic_inf_a_stim<-a_stim-qt(0.025,n-2)*esqm_int;ic_inf_a_stim
b_stim<-cov(xy)/var(x)
ic_sup_b_stim<-b_stim+qt(0.025,n-2)*esqm_coefang;ic_sup_b_stim
ic_inf_b_stim<-b_stim-qt(0.025,n-2)*esqm_coefang;ic_inf_b_stim
67

Dato un Modello di Regressione lineare semplice con le seguenti coppie di valori rispettivamente della y e della x (0-
4;250-10;255-11;365-14;485-18;592-25) con quali script si calcola: a) l’ESQM della regressione; b) l’ESQM
dell’intercetta; c) ll’ESQM del coefficiente angolare; d) della devianza della x
x<-c (4,10,11,14,18,25)
y<-c (0,250,255,365,485,592)
n<-6
modello<-lm(y~x)
summary(modello)
stimati<-modello$fitted.values
DR<-sum((y-ystim)^2);DR
esqm_regr<-sqrt(1/(n-2)*DR);esqm_regr
esqm_int<-(esqm_regr)*sqrt((1/n+((sum(x/n)^2))/dev));esqm_int
esqm_coefang<-(esqm_regr)/sqrt(dev);esqm_coefang

In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione b(stim) pari a 1,48 ed
un error standard pari a 0.89 e si vuole sceglier la regola di decisione in questi casi: a) per un test unilatero dx (Z
critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilateroM(Z critica=1,96); d) c) per un test
bilatero (Z critica=1,64)
68

In un Modello di regressione lineare semplice si è trovato un valore del coefficiente di regressione a(stim) pari a 11,432
ed un error standard pari a 2,8 9 e siMvuole sceglier la regola di decisione in questi casi: a) per un test unilatero dx (Z
critica=2,576); b) per un test unilatero sx (Z critica=-2,576 ; c) per un test bilatero (Z critica=1,96); d) c) per un test
bilatero (Z critica=1,64)

Nell’Analisi della varianza spiegare il significato: a) della devianza spiegata; b) della devianza residua; c) dei relativi
gradi di libertà; d) del test F
L’analisi della varianza (o Anova) si basa sul concetto di scomposizione della varianza totale che si esprime attraverso la
seguente notazione: (DT)/n=(DS)/n+(DR)/n dove DT è la devianza totale; DS è la devianza spiegata e DR è la devianza
residua ed n è il numero di osservazioni; (DT)/n è la varianza totale; (DS)/n è la varianza spiegata e (DR)/n è la varianza
residua.
Ad ognuno di questi valori viene associato il relativo numero di gradi di libertà. Questo numero è dato dal totale delle
osservazioni n meno il o i vincoli (o restrizioni) a cui le quantità devono sottostare:
- per la varianza totale (DT)/n il numero di gradi di libertà è pari a n-1
- per la varianza spiegata (DS)/n esso è pari a 1
- per la varianza residua (DR)/n pari a n-2
Infatti poiché DT/n=DS/n+DR/n i relativi gradi di libertà saranno (n-1)=1+(n-2)
Nell’analisi della varianza si prende in considerazione la statistica test F (o di Fisher) il cui valore esprime la misura per
l’accettazione (o non rifiuto) o il rifiuto (o non accettazione) dell’ipotesi nulla. Più il valore della F è prossimo a 1 più si tende
ad accettare (o a non rifiutare) l’ipotesi di interesse H0 mentre qualora la statistica test F fosse molto più grande di 1, si tende a
rifiutare (o non accettare) l’ipotesi nulla H0 ed accettare ( o non rifiutare) l’ipotesi alternativa . Il test F può essere espresso
dalla seguente notazione: F=(R2/k-1)/(1-R2/n-k) dove k è il numero dei regressori e n il numero di osservazioni.
69

Dato un Modello di Regressione lineare semplice quale sono le formule per calcolare: a) l’intervallo di confidenza per la
variabile dipendente media; b) l’intervallo di confidenza per la previsione; c) spiegare il significato del punto a); d)
spiegare il significato del punto b)
Dopo aver studiato gli intervalli di confidenza per i regressori si passa ad analizzare quelli per il valore atteso della variabile
dipendente media ad un livello di fiducia pari a (1-α). L’intervallo di confidenza per il valore atteso della variabile dipendente
ad un livello di fiducia (1-α) è dato dalla seguente notazione: Yˆi±tα/2s(Yˆi) . Per l’analisi inferenziale sulla previsione si deve
prendere in considerazione la stima di un valore singolo che, ovviamente, non è stato ancora osservato. L’intervallo di
confidenza per il valore atteso della variabile dipendente ad un livello di fiducia (1-α) è dato dalla seguente notazione :
Yˆi±tα/2s(Yi - Yˆi)

Potrebbero piacerti anche