Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Disclaimer/Attenzione/Warning: Questo file solo un aiuto per preparare la parte scritta-orale dell'esame di statistica, NON SI GARANTISCE la correttezza di alcuna risposta, d'altronde io non sono un professore e nemmeno uno che si intende della materia. Premessa: Le domande che trovate di seguito sono la maggioranza di quelle fatte agli orali di statistica nei mesi e negli anni passati, tendono a ripetersi dunque in teoria basterebbe impararle per passare senza problemi. Per questione di non-voglia non ho le ho fatte tutte, in fondo al file trovate quelle senza risposta. Domanda 1: Definizione di impostazione assiomatica di probabilit: gli assiomi di Kolmogorov e le propriet che da essi si deducono. Viene detta misura di probabilit ogni applicazione
che associa un valore reale ad ogni sottoinsieme di e per cui valgono le seguenti propriet: Per ogni A sottoinsieme di esiste ed unico un numero P(A) 0. P()=1. Data la famiglia di eventi numerabili {Ai, i elemento di I sottoinsieme di N} di eventi incompatibili vale:
Per ogni A sottoinsieme di vale P(A) <= 1. Per ogni A,B sottoinsiemi di se A sottoinsieme di B allora P(A)<=P(B). Per ogni A,B sottoinsiemi di anche incompatibili, vale P(AUB) = P(A) + P(B) - P(AB) Per ogni A sottoinsieme di vale P() = 1 P(A) infatti 1= P(AU) = P(A)+P() - P(A) = P(A) + P() - 0. Domanda 2: Definizione di spazio campione L'insieme che pu contenere un numero finito o infinito di elementi detto Spazio Campione, ogni sottoinsieme di viene detto Evento Elementare se costituito da un elemento singolo di altrimenti viene detto elemento composto. Domanda 3: Definizione di probabilit condizionate
Siano dati uno spazio campione ed una misura di probabilit P definita sul suo insieme delle parti p(), secondo l'impostazione assiomatica di probabilit, considerati due eventi A e B con P(B) > 0, detta probabilit di A condizionata da B la quantit
Domanda 4: Definizione di indipendenza stocastica Due eventi A,B elementi di p() sono detti stocasticamente indipendenti se vale la seguenti condizione: P(A) = P(A|B) ovvero se vale P(B) = P(B|A) o ancora se P(AB) = P(A)P(B). Domanda 5: Definizione di formula del prodotto Si pu ricavare dalla formula della probabilit condizionata che P(AB) = P(A|B)P(B), questa formula pu essere generalizzata al caso dell'intersezione di pi eventi, in tal caso prende il nome di formula del prodotto e diviene
ed valida qualunque n sia scelto come famiglia Ai di sottoinsiemi di . Domanda 6: Definizione di probabilit totale Consideriamo una partizione {Ai,i=1..n;Ai sottoinsieme di } dello spazio campione ovvero una famiglia di eventi mutuamente incompatibili tali che la loro unione sia stesso. La probabilit totale data da
Domanda 7: Definizione di Bayes spiegandone le propriet e le condizioni per applicarle. (n.b. molti hanno omesso il fatto che le variabili per la prob totale e bayes dovessero essere mutualmente incompatibili, cio sotto-insiemi disgiunti, ATTENZIONE PER L'ORALE BISOGNA COLLEGARE LA FORMULA DEL PRODOTTO, LA PROBABILIT TOTALE PER CAVARE FUORI BAYES ). La formula di Bayes per eventi B tali che P(B)>0 data da :
ed valida per ogni i=1,..,n. necessario richiedere che la famiglia di eventi mutualmente incompatibili {Ai, i=1...n, Ai sottoinsieme di } sia una partizione dello spazio campione . Domanda 8: Definizione di variabile aleatoria unidimensionale discreta e continua Dato uno spazio campione detta variabile aleatoria un'applicazione X: R che associa un numero reale ad ogni elemento di . Esistono poi due categorie di variabili aleatorie cio quella discreta e quella continua, una variabile aleatoria detta discreta nel caso in cui l'insieme S di valori che pu assumere finito o costituito da un'infinit di valori discreti altrimenti nel caso di valori continui detta continua. Domanda 9: Definizione di funzione di ripartizione Ad ogni variabile aleatoria X associata una funzione che esprime in modo chiaro le valutazioni che assumer. Tale funziona la funzione di ripartizione
definita come
per ogni valore di t elemento di R. Le funzioni di ripartizione godono delle seguenti propriet
Domanda 11: Definizione di Distribuzione discreta di probabilit. Sia S l'insieme di valori che pu assumere una variabile aleatoria discreta X, viene detta Distribuzione discreta di probabilit la funzione
Domanda 12: Scrivere le relazioni che intercorrono tra la densit di probabilit, la distribuzione di probabilit e la funzione di ripartizione La funziona di ripartizione la funzione integrale della densit, quindi per ottenere la densit, data la funzione di ripartizione si ha
Tra le funzioni discrete di probabilit e la funzioni di ripartizione di variabili discrete esiste una corrispondenza biunivoca e valgono le seguenti relazioni:
La densit di probabilit e la distribuzione discreta di probabilit sono lo stesso concetto, uno applicato alle variabili aleatorie continue e l'altro alle discrete. Definizione di Funzione ripartizione congiunta e densit e pure le due marginali da fare Domanda 13: Definizione di Variabili aleatorie multidimensionali, definire i diversi indici di tendenza centrale per una variabile aleatoria ( valore atteso, moda, mediana, quantile ). Dato uno spazio campione detta variabile aleatoria bidimensionale una funzione del tipo:
Qua ci riferiamo ad una variabile bidimensionale ma il concetto facilmente estendibile a qualsiasi dimensione n. Gli indici di tendenza centrale sono: Il valore atteso. Data una variabile aleatoria unidimensionale X avente supporto S sottoinsieme di R , detto valore atteso di X la quantit:
Gode di alcune propriet: Per ogni a elemento di R, se X=a con probabilit uguale ad 1 allora E[X]=a. E[a X+b]=a E[X] + b.
Il valore atteso pu anche non esistere se la sommatoria o l'integrale non convergono. Moda: detta moda di una variabile aleatoria X la quantit Y elemento di R in cui la funzione di densit o la distribuzione discreta di probabilit assume valore massimo, non detto che tale valore sia unico, in questo caso si distingue tra unimodale e multimodale. Mediana: Data una variabile aleatoria continua X diciamo mediana una quantit Y elemento di R che soddisfa la seguente disuguaglianza
Nel caso di variabili discrete la mediana il valore dell'ascissa in cui la funzione di ripartizione passa da un valore minore di 0.5 ad uno superiore. Anche la mediana pu non essere unica. Nel caso che le funzione di ripartizione sia continua ed invertibile allora la mediana diventa:
di variabili aleatorie e sia Fn la funzione di ripartizione della generica variabile Xn della successione. Diremo che la successione converge in distribuzione alla variabile X avente funzione di ripartizione F se vale
Domanda 15: Definizione di legge dei grandi numeri La legge dei grandi numeri dice che se consideriamo una successione di variabili aleatorie indipendenti ed identicamente distribuite
per cui esistono valore atteso e varianza allora possiamo affermare che la successione
delle corrispondenti media aritmetiche tende, al crescere di n, ad una variabile che assume certamente il valore
Domanda 16: Definizione di teorema del limite centrale Consideriamo una successione di variabili aleatorie
che soddisfa l'ipotesi della legge dei grandi numeri. Consideriamo la variabile aleatorie Sn cosi definita:
Domanda 17: Definizione di stimatore, stimatore puntuale, stima puntuale + propriet (correttezza, consistenza, miglior stimatore) Sia un parametro incognito della popolazione X. Una statistica campionaria detta Stimatore puntuale quando viene utilizzata per stimare il parametro incognito. detta stima puntuale del parametro
nella realizzazione
del campione casuale. Ogni stimatore puntuale deve godere almeno di due propriet per essere tale. Uno stimatore detto corretto, se qualunque sia l'effettivo valore del parametro risulta
Uno stimatore
detto consistente se qualunque sia l'effettivo valore di risulta per ogni epsilon > 0. Uno stimatore detto miglior stimatore di un parametro
se pi efficiente di ogni altro stimatore corretto e consistente. Domanda 18: Definizione formale di stima intervallare e sua applicazione alla media campionarie Alle stima puntuali vengono preferite le stime intervallari che sono stime espresse sotto forma di intervalli nei quali con buona probabilit si trova il vero valore del parametro da stimare. Per tale motivo pensiamo ad un intervallo
Quando nota la distribuzione campionaria possibile calcolare esattamente le probabilit al variare di e1 ed e2. Dato
dove una realizzazione dello stimatore. Il valore alfa detto livello di confidenza della stima e l'intervallo detto intervallo di confidenza. Esistono quattro applicazioni di stime intervallari per la media in base al tipo di popolazione ed al fatto che la varianza sia o meno nota. Popolazione non normalmente distribuita e varianza nota. In questo caso la media campionaria
approssimabile con n>=30 tramite una variabile con distribuzione normale di media e deviazione standard
compreso nell'intervallo
con probabilit 1-alfa. Popolazione non normalmente distribuita e varianza non nota. In questo caso bisogna sostituire al valore
la sua stima
Popolazione normalmente distribuita e varianza nota. esattamente lo stesso procedimento applicato alla popolazione non normalmente distribuita con varianza nota solo che in questo caso non vi alcuna richiesta sulla numerosit del campione. Popolazione normalmente distribuita e varianza non nota.
che distribuita secondo una t di Student con n-1 gradi di libert quindi il parametro incognito compreso nell'intervallo
con probabilit 1- alfa. Domanda 19: Errori di I e II specie, spiegare la curva di potenza (di quelli di II specie bisognava scrivere anche pi-greca di teta cappuccio... e beta di teta cappuccio... riportando l'osservazione sulla possibilit di aumentare alfa senza aumentare la probabilit beta) Quando effettuiamo un'ipotesi nulla ed un'ipotesi alternativa e verifichiamo che siano o meno rifiutabili possiamo commettere due errori detti Errori di prima specie ed Errori di seconda specie. Negli Errori di prima specie rifiutiamo l'ipotesi nulla quando vera, la probabilit di commettere errori di prima specie nota e coincide con livello di significativit alfa. Negli Errori di seconda specie accettiamo l'ipotesi nulla quando falsa. La probabilit di compiere un errore di seconda specie va pensata come una funzione detta comunemente curva di potenza del test, sia
Domande senza risposta: Domanda 20: Definizione di Funzione ripartizione congiunta e densit e pure le due marginali da fare. Domanda 21: Definizioni di varianza campionaria corretta e non corretta, covarianza e devianza. Domanda 22: Test sulla media, differenza tra medie, varianza . Domanda 23: Test sulla differenza di varianze(uguaglianza di varianze), ipotesi richieste (popolazioni normalmente distribuite), statistica utilizzata e relativa distribuzione, ipotesi nulla e possibili ipotesi alternative, zone critiche. Domanda 24: Definizione test di incorrelazione. Domanda 25: Definizione di Stima delle costanti del modello regressivo,ipotesi fondamentali. Domanda 26: Definizione di devianza totale, spiegata e residua. Definizione test R2.