Sei sulla pagina 1di 12

Probabilit e Statistica Domande Orali by Nixen

Disclaimer/Attenzione/Warning: Questo file solo un aiuto per preparare la parte scritta-orale dell'esame di statistica, NON SI GARANTISCE la correttezza di alcuna risposta, d'altronde io non sono un professore e nemmeno uno che si intende della materia. Premessa: Le domande che trovate di seguito sono la maggioranza di quelle fatte agli orali di statistica nei mesi e negli anni passati, tendono a ripetersi dunque in teoria basterebbe impararle per passare senza problemi. Per questione di non-voglia non ho le ho fatte tutte, in fondo al file trovate quelle senza risposta. Domanda 1: Definizione di impostazione assiomatica di probabilit: gli assiomi di Kolmogorov e le propriet che da essi si deducono. Viene detta misura di probabilit ogni applicazione

che associa un valore reale ad ogni sottoinsieme di e per cui valgono le seguenti propriet: Per ogni A sottoinsieme di esiste ed unico un numero P(A) 0. P()=1. Data la famiglia di eventi numerabili {Ai, i elemento di I sottoinsieme di N} di eventi incompatibili vale:

Per ogni A sottoinsieme di vale P(A) <= 1. Per ogni A,B sottoinsiemi di se A sottoinsieme di B allora P(A)<=P(B). Per ogni A,B sottoinsiemi di anche incompatibili, vale P(AUB) = P(A) + P(B) - P(AB) Per ogni A sottoinsieme di vale P() = 1 P(A) infatti 1= P(AU) = P(A)+P() - P(A) = P(A) + P() - 0. Domanda 2: Definizione di spazio campione L'insieme che pu contenere un numero finito o infinito di elementi detto Spazio Campione, ogni sottoinsieme di viene detto Evento Elementare se costituito da un elemento singolo di altrimenti viene detto elemento composto. Domanda 3: Definizione di probabilit condizionate

Siano dati uno spazio campione ed una misura di probabilit P definita sul suo insieme delle parti p(), secondo l'impostazione assiomatica di probabilit, considerati due eventi A e B con P(B) > 0, detta probabilit di A condizionata da B la quantit

Domanda 4: Definizione di indipendenza stocastica Due eventi A,B elementi di p() sono detti stocasticamente indipendenti se vale la seguenti condizione: P(A) = P(A|B) ovvero se vale P(B) = P(B|A) o ancora se P(AB) = P(A)P(B). Domanda 5: Definizione di formula del prodotto Si pu ricavare dalla formula della probabilit condizionata che P(AB) = P(A|B)P(B), questa formula pu essere generalizzata al caso dell'intersezione di pi eventi, in tal caso prende il nome di formula del prodotto e diviene

ed valida qualunque n sia scelto come famiglia Ai di sottoinsiemi di . Domanda 6: Definizione di probabilit totale Consideriamo una partizione {Ai,i=1..n;Ai sottoinsieme di } dello spazio campione ovvero una famiglia di eventi mutuamente incompatibili tali che la loro unione sia stesso. La probabilit totale data da

Domanda 7: Definizione di Bayes spiegandone le propriet e le condizioni per applicarle. (n.b. molti hanno omesso il fatto che le variabili per la prob totale e bayes dovessero essere mutualmente incompatibili, cio sotto-insiemi disgiunti, ATTENZIONE PER L'ORALE BISOGNA COLLEGARE LA FORMULA DEL PRODOTTO, LA PROBABILIT TOTALE PER CAVARE FUORI BAYES ). La formula di Bayes per eventi B tali che P(B)>0 data da :

ed valida per ogni i=1,..,n. necessario richiedere che la famiglia di eventi mutualmente incompatibili {Ai, i=1...n, Ai sottoinsieme di } sia una partizione dello spazio campione . Domanda 8: Definizione di variabile aleatoria unidimensionale discreta e continua Dato uno spazio campione detta variabile aleatoria un'applicazione X: R che associa un numero reale ad ogni elemento di . Esistono poi due categorie di variabili aleatorie cio quella discreta e quella continua, una variabile aleatoria detta discreta nel caso in cui l'insieme S di valori che pu assumere finito o costituito da un'infinit di valori discreti altrimenti nel caso di valori continui detta continua. Domanda 9: Definizione di funzione di ripartizione Ad ogni variabile aleatoria X associata una funzione che esprime in modo chiaro le valutazioni che assumer. Tale funziona la funzione di ripartizione

definita come

per ogni valore di t elemento di R. Le funzioni di ripartizione godono delle seguenti propriet

Domanda 10: Definizione di densit di probabilit

Se esiste una funzione tale che

allora tale funziona detta Densit di Probabilit di X.

Valgono le seguenti propriet:

Domanda 11: Definizione di Distribuzione discreta di probabilit. Sia S l'insieme di valori che pu assumere una variabile aleatoria discreta X, viene detta Distribuzione discreta di probabilit la funzione

definita come segue

possiede due propriet:

Domanda 12: Scrivere le relazioni che intercorrono tra la densit di probabilit, la distribuzione di probabilit e la funzione di ripartizione La funziona di ripartizione la funzione integrale della densit, quindi per ottenere la densit, data la funzione di ripartizione si ha

Tra le funzioni discrete di probabilit e la funzioni di ripartizione di variabili discrete esiste una corrispondenza biunivoca e valgono le seguenti relazioni:

La densit di probabilit e la distribuzione discreta di probabilit sono lo stesso concetto, uno applicato alle variabili aleatorie continue e l'altro alle discrete. Definizione di Funzione ripartizione congiunta e densit e pure le due marginali da fare Domanda 13: Definizione di Variabili aleatorie multidimensionali, definire i diversi indici di tendenza centrale per una variabile aleatoria ( valore atteso, moda, mediana, quantile ). Dato uno spazio campione detta variabile aleatoria bidimensionale una funzione del tipo:

Qua ci riferiamo ad una variabile bidimensionale ma il concetto facilmente estendibile a qualsiasi dimensione n. Gli indici di tendenza centrale sono: Il valore atteso. Data una variabile aleatoria unidimensionale X avente supporto S sottoinsieme di R , detto valore atteso di X la quantit:

Gode di alcune propriet: Per ogni a elemento di R, se X=a con probabilit uguale ad 1 allora E[X]=a. E[a X+b]=a E[X] + b.

Il valore atteso pu anche non esistere se la sommatoria o l'integrale non convergono. Moda: detta moda di una variabile aleatoria X la quantit Y elemento di R in cui la funzione di densit o la distribuzione discreta di probabilit assume valore massimo, non detto che tale valore sia unico, in questo caso si distingue tra unimodale e multimodale. Mediana: Data una variabile aleatoria continua X diciamo mediana una quantit Y elemento di R che soddisfa la seguente disuguaglianza

Nel caso di variabili discrete la mediana il valore dell'ascissa in cui la funzione di ripartizione passa da un valore minore di 0.5 ad uno superiore. Anche la mediana pu non essere unica. Nel caso che le funzione di ripartizione sia continua ed invertibile allora la mediana diventa:

Quantile: Dato un valore

detto quantile p-esimo della variabile aleatoria X il valore

Nel caso in cui la funzione di ripartizione sia continua ed invertibile allora

Domanda 14: Definizione di convergenza in distribuzione Consideriamo una successione

di variabili aleatorie e sia Fn la funzione di ripartizione della generica variabile Xn della successione. Diremo che la successione converge in distribuzione alla variabile X avente funzione di ripartizione F se vale

per ogni t elemento di R che sia punto di continuit in F.

Domanda 15: Definizione di legge dei grandi numeri La legge dei grandi numeri dice che se consideriamo una successione di variabili aleatorie indipendenti ed identicamente distribuite

per cui esistono valore atteso e varianza allora possiamo affermare che la successione

delle corrispondenti media aritmetiche tende, al crescere di n, ad una variabile che assume certamente il valore

Domanda 16: Definizione di teorema del limite centrale Consideriamo una successione di variabili aleatorie

che soddisfa l'ipotesi della legge dei grandi numeri. Consideriamo la variabile aleatorie Sn cosi definita:

dalle seguenti relazioni

osserviamo che vale

da questo si ricava che vale

cio sostanzialmente per n sufficientemente grande possiamo approssimare le variabili

con delle variabili aventi distribuzione normale.

Domanda 17: Definizione di stimatore, stimatore puntuale, stima puntuale + propriet (correttezza, consistenza, miglior stimatore) Sia un parametro incognito della popolazione X. Una statistica campionaria detta Stimatore puntuale quando viene utilizzata per stimare il parametro incognito. detta stima puntuale del parametro

il valore assunto dallo stimatore puntuale

nella realizzazione

del campione casuale. Ogni stimatore puntuale deve godere almeno di due propriet per essere tale. Uno stimatore detto corretto, se qualunque sia l'effettivo valore del parametro risulta

Uno stimatore

detto consistente se qualunque sia l'effettivo valore di risulta per ogni epsilon > 0. Uno stimatore detto miglior stimatore di un parametro

se pi efficiente di ogni altro stimatore corretto e consistente. Domanda 18: Definizione formale di stima intervallare e sua applicazione alla media campionarie Alle stima puntuali vengono preferite le stime intervallari che sono stime espresse sotto forma di intervalli nei quali con buona probabilit si trova il vero valore del parametro da stimare. Per tale motivo pensiamo ad un intervallo

Quando nota la distribuzione campionaria possibile calcolare esattamente le probabilit al variare di e1 ed e2. Dato

si determinano i corrispondenti valori di e1 ed e2 tali che risulti

dove una realizzazione dello stimatore. Il valore alfa detto livello di confidenza della stima e l'intervallo detto intervallo di confidenza. Esistono quattro applicazioni di stime intervallari per la media in base al tipo di popolazione ed al fatto che la varianza sia o meno nota. Popolazione non normalmente distribuita e varianza nota. In questo caso la media campionaria

approssimabile con n>=30 tramite una variabile con distribuzione normale di media e deviazione standard

In questo caso dunque

perci vale la relazione

da questo possiamo dire che il parametro incognito

compreso nell'intervallo

con probabilit 1-alfa. Popolazione non normalmente distribuita e varianza non nota. In questo caso bisogna sostituire al valore

la sua stima

Per n sufficientemente grande la variabile

pu essere approssimata ad una distribuzione normale standardizzata pertanto vale

Popolazione normalmente distribuita e varianza nota. esattamente lo stesso procedimento applicato alla popolazione non normalmente distribuita con varianza nota solo che in questo caso non vi alcuna richiesta sulla numerosit del campione. Popolazione normalmente distribuita e varianza non nota.

La variabile che si utilizza in questo caso

che distribuita secondo una t di Student con n-1 gradi di libert quindi il parametro incognito compreso nell'intervallo

con probabilit 1- alfa. Domanda 19: Errori di I e II specie, spiegare la curva di potenza (di quelli di II specie bisognava scrivere anche pi-greca di teta cappuccio... e beta di teta cappuccio... riportando l'osservazione sulla possibilit di aumentare alfa senza aumentare la probabilit beta) Quando effettuiamo un'ipotesi nulla ed un'ipotesi alternativa e verifichiamo che siano o meno rifiutabili possiamo commettere due errori detti Errori di prima specie ed Errori di seconda specie. Negli Errori di prima specie rifiutiamo l'ipotesi nulla quando vera, la probabilit di commettere errori di prima specie nota e coincide con livello di significativit alfa. Negli Errori di seconda specie accettiamo l'ipotesi nulla quando falsa. La probabilit di compiere un errore di seconda specie va pensata come una funzione detta comunemente curva di potenza del test, sia

il parametro a cui si riferisce il test e sia

il valore specificato nell'ipotesi nulla , denotiamo beta(teta capuccio) come

allora viene detta curva di potenza del test la funzione

un test risulta tanto migliore quanto la funzione si avvicina al valore 1.

Domande senza risposta: Domanda 20: Definizione di Funzione ripartizione congiunta e densit e pure le due marginali da fare. Domanda 21: Definizioni di varianza campionaria corretta e non corretta, covarianza e devianza. Domanda 22: Test sulla media, differenza tra medie, varianza . Domanda 23: Test sulla differenza di varianze(uguaglianza di varianze), ipotesi richieste (popolazioni normalmente distribuite), statistica utilizzata e relativa distribuzione, ipotesi nulla e possibili ipotesi alternative, zone critiche. Domanda 24: Definizione test di incorrelazione. Domanda 25: Definizione di Stima delle costanti del modello regressivo,ipotesi fondamentali. Domanda 26: Definizione di devianza totale, spiegata e residua. Definizione test R2.