1. Dopo aver definito le nozioni di spazio campionario e di evento casuale, si indichi come si
assegnano le probabilità agli eventi con il metodo classico.
RISPOSTA:
Lo spazio a pio a io è l’i sie e di tutti gli eventi elementari possibili. Può essere discreto,
ua do gli eve ti ele e ta i so o u e a ili, o o ti uo ua do uesti so o u ’i fi ità o
numerabile.
Un evento casuale è un qualsiasi insieme di eventi elementari ovvero un sottoinsieme dello spazio
campionario.
La p o a ilità dell’eve to A, se o do il etodo lassi o, è il appo to del u e o di asi favo evoli
al verificarsi di A e il numero di casi possibili. Questa è compresa tra 0 e 1.
2. Si illustri il concetto di probabilità condizionata di un evento dato un altro evento. Sulla base
di uesta defi izio e, si ost i o e la p o a ilità dell’i te sezio e t a due eve ti i dipe de ti
si possa calcolare come prodotto delle probabilità dei due eventi presi singolarmente.
RISPOSTA:
La probabilità condizionata di due eventi A e B è definita come la probabilità che si verifichi
l’eve to B sape do he l’eve to A si è già ve ifi ato.
3. Si dia la definizione di variabile casuale (nel caso di spazi campionari discreti) e della relativa
funzione di probabilità. Si dia, inoltre, un esempio numerico di distribuzione di probabilità
considerando una variabile casuale che può presentare quattro valori distinti.
RISPOSTA:
Una variabile casuale è una funzione che associa ad ogni evento elementare dello spazio
campionario un valore reale x.
Questa è detta discreta se assume un numero finito o un infinità numerabile di valori.
Si può ottenere una distribuzione di probabilità che associa a ciascun valore di x i rispettivi livelli di
probabilità.
La funzione di probabilità f(x)=P(X=x) gode di due proprietà:
1-
2-
Esempio: lancio di una moneta per tre volte con conteggio delle volte che esce testa
S X(e)=x X f(x)
TTT 3 0 0.125
TTC 2 1 0.375
TCT 2 2 0.375
CTT 2 3 0.125
CCT 1
CTC 1
TCC 1
CCC 0
4. Si definisca la funzione di ripartizione sia nel caso discreto che nel caso continuo. Con
riferimento al caso continuo, si chiarisca, poi, il ruolo di tale funzione per la determinazione dei
quantili.
RISPOSTA:
La funzione di ripartizione è una funzione che associa ad ogni valore di x la somma delle
probabilità corrispondenti ad x e ai valori inferiori.
Nel caso discreto e graficamente è rappresentata da un grafico a
gradini.
Nel caso di variabile casuale continua, questa è descritta da una funzione di densità rappresentata
da una curva a campana. In tal caso la funzione di ripartizio e i di a l’a ea sottesa alla u va della
funzione, cioè .
Nel caso particolare in cui si voglia calcolare la probabilità che la v.c. assuma valori compresi
ell’i te vallo a, sa à .
Questa può assumere una diverse forme, come rettangolare o esponenziale.
Il quantile è la funzione inversa della funzione di ripartizione: fissato un livello di probabilità p, si
chiama quantile di livello p la quantità , in corrispondenza della quale la funzione di ripartizione
assume valore p.
. La dist i uzio e i o iale: se e illust i il sig ifi ato o ife i e to all’app op iato
esperimento campionario, se ne dia la funzione di probabilità mettendo in luce il significato
delle grandezze in essa coinvolte.
RISPOSTA:
data una v.c. discreta , questa è descritta dalla seguente funzione di probabilità:
assumendo due parametri
- n, numero tentativi effettuati
- p, probabilità di successo
Con
Con
E
11. Si chiarisca come la distribuzione di probabilità del campione casuale dipenda dal modello
descrittivo della popolazione. In particolare, si scriva la distribuzione di probabilità di un
campione casuale di 5 unità proveniente da una popolazione Bernoulliana del tipo Bern(0,4).
Il campione casuale è l'insieme di unità della popolazione selezionate con criteri di casualità, esso
può essere con o senza ripetizioni, a seconda che l'unità estratta venga rimessa o non rimessa
nella popolazione.
Quantificare alcune grandezze della popolazione significa indagare su alcune costanti di sintesi
della popolazione stessa, i cd parametri .
Per stimare il parametro di interesse c'è bisogno di un campione casuale che gode delle seguenti
proprietà:
-ogni variabile casuale ha la stessa distribuzione della popolazione
- le variabili casuali sono indipendenti in quanto il campione è con ripetizione
Avremo vari tipi di popolazione a seconda della distribuzione: popolazioni bernoulliane,
popolazioni normali, ecc. Il modello descrittivo della variabile casuale verrà indicato con
, dove indica il parametro che è diverso a seconda della distribuzione: p per la
Bernoulliana, e per la normale.
Esempio:
x P(x) E(x)=0.4
1 0.4 V(x)=0.24
0 0.6
Siccome sono richieste 5 unità utilizzo la funzione Binomiale con n=5 e p=0.4
12. Si definisca la nozione di campione casuale indicando in particolare come si calcola la
probabilità (o densità) di un campione osservato (supponendo di conoscere il modello
descrittivo della popolazione).
RISPOSTA:
il campione casuale di ampiezza n consiste nella sequenza di n variabili casuali , che
godono delle seguenti proprietà:
-ogni variabile casuale ha la stessa distribuzione della popolazione
- le variabili casuali sono indipendenti in quanto il campione è con ripetizione
I pa ole pove e è l’i sie e di u ità di una popolazione selezionata con criteri di casualità.
Al campione casuale può essere associato una funzione di probabilità congiunta, per calcolare la
probabilità di ogni singola estrazione in caso di più unità nel campione
13. Si definiscano i concetti di spazio campionario e di spazio dei parametri nel contesto
dell’i fe e za statisti a.
RISPOSTA:
Lo spazio a pio a io è l’i sie e dei campioni della stessa ampiezza che possono essere estratti
casualmente dalla popolazione di riferimento.
Lo spazio dei parametri, , è l’i sie e dei valo i possi ile he può assu e e il pa a et o .
14. Si definisca il concetto generale di statistica campionaria; si presentino, poi, due esempi di
statistiche campionarie di rilievo applicativo illustrandone le proprietà.
RISPOSTA:
Si chiama statistica campionaria una qualsiasi funzione della variabile casuale , che
compongono il campione casuale. La statistica campionaria serve per fare una sintesi dei dati del
campione.
Tra le molte statistiche campionarie quelle di maggior rilievo sono:
la media campionaria , ed ha e
la varianza campionaria ed ha e
con indice di disnormalità che indica il grado di allontanamento della popolazione dalla
normalità.
15. (Facoltativo) Si illustri la distribuzione di probabilità della varianza campionaria per campioni
provenienti da una popolazione normale.
RISPOSTA:
Qualunque sia la popolazione generatrice,la varianza campionaria ha:
il valore atteso
la varianza
con indice di disnormalità che indica il grado di allontanamento della popolazione dalla
normalità. Qua do la popolazio e ge e at i e è o ale allo a il valo e del pa a et o β si azze a.
Se X ha distribuzione normale allora si ha:
Per il caso dei grandi campioni abbiamo che se n è sufficientemente grande, la distribuzione
campionaria può essere approssimata con una normale . Un campione si può ritenere
sufficientemente grande se la numerosità è maggiore di 30.
Tale risultato va sotto il nome di teorema del limite centrale:
17. Si discuta la media campionaria concentrandosi sulle sue proprietà come stimatore della
edia della popolazio e. “i ipo ti o, i pa ti ola e, le esp essio i della disto sio e e dell’e o e
quadratico medio.
RISPOSTA:
Stimare significa attribuire un valore plausibile ad un parametro incognito. Si definisce stimatore
del parametro ogni statistica campionaria utilizzata per stimare .
Per stimare un parametro possiamo utilizzare diversi stimatori come la media , la mediana,
eccetera. Esistono dunque dei criteri che servono ad individuare lo stimatore più appropriato per
ogni situazione. Uno stimatore del parametro si dice non distorto se il valore
atteso dell'errore di stima è uguale a zero per qualunque valore del parametro.
Comunque, in generale era la media campionaria è uno stimatore non distorto, consistente, ed
efficiente.
19. Il teorema del limite centrale: si indichi il significato del teorema facendo riferimento allo
stimatore del parametro di una popolazione Bernoulliana.
RISPOSTA
In caso di popolazione bernoulliana, il teorema del limite centrale afferma che se n è
sufficientemente grande la distribuzione campionaria di può essere approssimata con una
normale ) ovvero:
Di conseguenza:
20. (Facoltativo) Si illustri il concetto di campione casuale distintamente nel caso di una
popolazione finita e nel caso di una popolazione infinita.
21. (Facoltativo) Si illustri il procedimento per il calcolo della probabilità che la varianza
a pio a ia sia o p esa ell’i te vallo a, b), nel caso di campioni provenienti da una
popolazione normale con varianza nota.
RISPOSTA
La distribuzione campionaria della statistica assume una forma ben definita quando la
popolazione generatrice è normale con media e varianza . Sia la varianza di un campione
casuale di ampiezza n proveniente da tale popolazione. Allora, la distribuzione campionaria della
variabile casuale
È una v.c. chi-quadrato con n-1 gradi di libertà.
22. Si illustri il procedimento di calcolo della probabilità che la media campionaria sia compresa
ell’i tervallo (a, b) sia nel caso di popolazione normale sia nel caso dei grandi campioni,
assumendo come note la media e la varianza della popolazione.
RISPOSTA
Per calcolare la probabilità che la media campionaria sia compresa nell'intervallo (a,b) di una
popolazione normale devo applicare la seguente formula:
all'aumentare dell'ampiezza del campione,la distribuzione campionaria della media tende ad una
forma sempre più stabile.
Per il caso dei grandi campioni abbiamo che se n è sufficientemente grande, la distribuzione
campionaria può essere approssimata con una normale . Un campione si può ritenere
sufficientemente grande se la numerosità è maggiore di 30.
23. Si inquadri il problema della selezione dello stimatore migliore tra più stimatori (alternativi)
di u o stesso pa a et o. “i etta o i lu e le agio i he po ta o ad assu e e l’e o e
quadratico medio come criterio principale di scelta dello stimatore.
RISPOSTA:
Vogliamo mettere a confronto due stimatori di uno stesso parametro per scegliere quello in grado
di stimare in modo migliore tale parametro. Riferendoci alle proprietà desiderabili di uno
stimatore ovvero la non distorsione e la consistenza, potremmo trovarci nella situazione in cui
entrambi gli stimatori possiedono queste proprietà. Di conseguenza per il criterio di scelta
dov e o affida i all’effi ie za ovve o al ola e l’e ore quadratico medio:
Quindi dati due stimatori dello stesso parametro, , si dice che il primo è più efficiente del
secondo se:
In cui si assume che per almeno un valore del parametro vale la disuguaglianza in senso stretto.
24. Si dia la formula della varianza campionaria e si illustrino le proprietà asintotiche di questo
stimatore.
RISPOSTA:
la varianza campionaria espressa dalla seguente formula:
La varianza campionaria è consistente dato che per ogni vale la seguente relazione:
25. Si descrivano le proprietà asintotiche che sono desiderabili per lo stimatore di un certo
parametro.
RISPOSTA:
Le proprietà asintotiche riguardano il comportamento di uno stimatore di quando la dimensione
del campione tende ad infinito.
Preso uno stimatore del parametro e fissato un numero positivo piccolo , consideriamo la
probabilità che T differisca da , in valore assoluto, per meno di .
Uno stimatore è consistente(in senso debole) se per ogni vale la seguente relazione:
. “i spieghi o e l’e o e uad ati o edio sia la isu a fo da e tale della p e isio e di u o
stimatore, indicando il collegamento di questa grandezza con la distorsione.
RISPOSTA
Vogliamo mettere a confronto due stimatori di uno stesso parametro per scegliere quello in grado
di stimare in modo migliore tale parametro. Riferendoci alle proprietà desiderabili di uno
stimatore ovvero la non distorsione e la consistenza, potremmo trovarci nella situazione in cui
entrambi gli stimatori possiedono queste proprietà. Di conseguenza per il criterio di scelta
dov e o affida i all’effi ie za ovve o al ola e l’e ore quadratico medio, funzione che misura
in media le oscillazione delle stime intorno al valore vero del parametro:
In cui si assume che per almeno un valore del parametro vale la disuguaglianza in senso stretto.
27. Si parli del problema della stima puntuale del parametro p della popolazione Bernoulliana. Si
indichino, poi, le proprietà dello stimatore naturale del parametro (frequenza relativa di
su esso el a pio e .
RISPOSTA:
La f e ue za elativa dell’eve to su esso el a pio e , è u o sti ato e o disto to del
parametro p della popolazione bernoulliana da cui proviene il campione essendo, .
L’e o e uad ati o edio di è dato da
Il criterio fondamentale che permette di vedere quale stimatore sia più efficiente è il metodo della
assi a ve osi iglia za. Nel aso di u a popolazio e e oullia a l’appli azio e di uesto
metodo produce come stimatore del parametro p, la frequenza relativa di successo , stimatore
che risulta essere il più efficiente tra tutti i possibili stimatori non distorti.
Lo stimatore naturale è la frequenza relativa dei successi nel campione che è una particolare
media campionaria.
Le probabilità di questo stimatore sono:
-non distorsione
-consistenza
-efficienza rispetto a tutti i possibili stimatori non distorti di p
Allora
L’i te vallo di o fide za è dato da che sono i valori numerici assunti da nel
a pio e osse vato. L’a piezza dell’i te vallo è : .
Allora
Nel caso di campioni con dimensione sufficientemente grande la distribuzione di probabilità può
essere approssimata con la normale standardizzata: da cui con procedimento simile a quello
p e ede te otte ia o gli est e i dell’i te vallo:
dato ,
. “i s iva la fo ula dell’intervallo di confidenza per la media di una popolazione normale con
varianza incognita nel caso di piccoli campioni. Se ne indichi il significato e si illustri il
procedimento per ottenerlo.
Uguale alla domanda precedente??
33. Si illustrino in generale i concetti di errore di I tipo, di errore di II tipo e di potenza del test. Si
fornisca, poi, un esempio di procedimento per la verifica di ipotesi sulla media di una
popolazione normale con varianza nota.
RISPOSTA:
nel condurre una statistica test possiamo incorrere in due tipi di errori:
- = , è la p o a ilità dell’e o e di p i o tipo, ovvero quando si rifiuta
u ’ipotesi ulla ve a.
- , è la p o a ilità dell’e o e di se o do tipo, ovve o quando si
a etta u ’ipotesi ulla falsa
34. La verifica di ipotesi su una media nel caso di grandi campioni: si illustri in particolare il
p o edi e to di ve ifi a dell’ipotesi H0 : μ μ o t o l’alte ativa H1 : μ > μ0 con la tecnica del
livello di significatività osservato.
RISPOSTA
Se il campione ha dimensione sufficientemente grande, qualunque sia la popolazione generatrice ,
la statistica test da assumere è:
- allora
- allora oppure
36. Si illustri il procedimento per la verifica di ipotesi sul parametro p di una popolazione
Be oullia a, fa e do ife i e to all’ipotesi alte ativa H1: p > p0, sia con il procedimento base
sia con la tecnica del livello di significatività osservato.
RISPOSTA
Consideriamo un campione casuale con ampiezza n , proveniente da una popolazione
bernoulliana.
“e l’a piezza è suffi ie te e te g a de, la edia a pio a ia , ovvero la frequenza relativa dei
successi, ha distribuzione prossima alla normale con media e varianza .
Qui di data l’ipotesi ulla la statistica test sarà: