Sei sulla pagina 1di 8

Probabilit e Statistica Bicocca 2009 Esercizi svolti da Nixen Revisione n4.

Disclaimer/Attenzione/Warning: Questo file solo un aiuto per preparare la parte scritta dell'esame di statistica, NON SI GARANTISCE la correttezza di alcun esercizio, d'altronde io non sono un professore e nemmeno uno che si intende della materia. Introduzione e spiegazione modalit d'esame:
In questo pdf mostrer come si svolgono alcuni esercizi degli appelli del 2008, da quanto ho notato la tipologia negli appelli successivi (2009) rimasta simile o uguale. Se imparate a fare quelli che vi sto per proporre dovreste riuscire a passare la parte scritta dell'esame senza morire dalla sofferenza.

Esercizi che utilizzano la formula di Bayes


Esercizio 1 maggio 2008 Tema A Si considerino due urne U1 e U2, dai seguenti contenuti: U1: 8 palline bianche 3 palline nere 2 palline gialle U2: 1 pallina bianche 7 palline nere 8 palline gialle Lurna U1 viene selezionata per lestrazione, la cui natura verr precisata in seguito, con probabili pari a 0.55. Lestrazione consiste nel selezionare unurna, in base alla probabilit specificata in precedenza, ed estrarre da essa tre oggetti in sequenza senza reimmissione. a) Quale la probabilit che i tre oggetti selezionati siano 2 palline nere e una gialla? b) Se i tre oggetti estratti sono 1 pallina bianca e due palline gialle quale la probabilit che lurna da cui sono stati estratti lurna U2 ? Dunque cominciamo, essendo le urne 2 ed avendo che la probabilit che l'urna U1 sia selezionata per l'estrazione si ricava anche la probabilit dell'urna U2 Perci P(U1) = 0,55 e P(U2)=1-P(U1)=0,45 Per rispondere al primo quesito abbiamo bisogno di calcolare la probabilit che i tre oggetti siano 2 palline nere ed 1 gialla (e questo lo consideriamo l'evento E) da entrambe le urne dunque P(E|U1) e P(E|U2).

Tranquilli ora spiego come ho fatto, prendiamo per esempio la prima. Quante palline volete prendere? 3. Perfetto. Quante palline ci sono in totale nell'urna U1? 13. Dovreste aver capito il senso del denominatore. Stessa cosa per il numeratore. Quante palline nere vi servono? 2. Ottimo. Quante palline nere ci sono in totale nell'urna U1? 3. Quante palline gialle vi servono? 1. Quante palline gialle ci sono in totale nell'urna U1? 2. Ora che avete capito il senso di queste due probabilit vi fornisco i risultati. P(E|U1)=0,021 e P(E|U2)=0,3 . Per sicurezza inserisco una formula nel caso non sappiate cos' il coefficiente binomiale va... non si sa mai.

Finiamo allora sto cazzo di primo quesito, ora che abbiamo le due probabilit che facciamo? Semplice facciamo questo:

dunque abbiamo calcolato la probabilit che le 3 palline siano 2 nere ed una gialla in base al contenuto di U1 per la probabilit che siano estratte da U1 sommando la probabilit che le 3 palline siano 2 nere ed una gialla in base al contenuto di U2 per la probabilit che siano estratte da U2. Dunque la risposta P(E)=0,1465 cio il 14,65%. Passiamo al secondo quesito. Sostanzialmente la domanda dice: qual' la probabilit che 1 pallina bianca e 2 gialle (e questo lo consideriamo l'evento E) siano estratte dell'urna U2?. In termini statistici ci sta chiedendo di trovare P(U2|E) che significa probabilit dell'una U2 dato E. Qui arriva l'amico Bayes con la sua formula

Vi faccio vedere come la applichiamo al nostro problema cosi sar pi chiaro.

Dunque al denominatore semplicemente bisogna mettere P(E) che poi diventa quella roba li, al numeratore invece prendiamo la probabilit che le tre palline siano 1 bianca e 2 gialle in base al contenuto di U2 per la probabilit che siano estratte da U2. Semplice dai, al denominatore tutte le probabilit, al numeratore invece solo quella che ci interessa (cio quella riguardante U2). Ora abbiamo tutto quello che ci serve per calcolare P(U2|E), si procede allo stesso modo che abbiamo visto analizzando la soluzione del primo punto, vi lascio comunque i risultati se volete provare. P(E|U2) = 0,05 P(E|U1) = 0,028 e P(U2|E) = 0,59 che la soluzione. Mi sembrano abbastanza facili questi esercizi no? Bisogna solo capire il meccanismo, nel dubbio comunque ve ne risolvo un altro che richiede sempre l'utilizzo di Bayes. Esercizio 1 Luglio 2008 Tema A Una ditta acquista la materia prima da tre fornitori diversi, A, B e C, nelle seguenti proporzioni: 50%, 35% e 15%. I tre fornitori offrono la materia prima con livelli diversi di qualit: nello specifico A offre materia prima con probabilit di scarto pari a p A = 0.011 , B offre materia prima con probabilit di scarto pari a p B = 0.025 ed infine C offre materia prima con probabilit di scarto pari a pC = 0.035 .

a) Qual la probabilit che la materia prima acquistata sia di scarto ? b) Se la materia prima di scarto, qual la probabilit che essa sia stata acquistata da C ? Partiamo dal primo quesito. L'evento E in questo caso che la materia sia di scarto. Come si calcola? Solito modo che abbiamo visto anche nell'esercizio di prima

in questo caso non dobbiamo nemmeno sbatterci a calcolare P(E|A),P(E|B) e P(E|C) perch li da addirittura l'esercizio stesso e sono P(E|A)=0,011 P(E|B)=0,025 e P(E|C)=0,035. Il risultato P(E) = 0,0195 cio il 1,95%. Il secondo quesito chiede qual' la probabilit che la materia di scarto sia stata acquistata da C, statisticamente chiede la P(C|E). Bayes 4ever.

Solita storia spiegata prima, in questo caso non dobbiamo calcolare nulla di incredibile. Il denominatore l'abbiamo gi ed 0,0195 (in questo caso i professori sono stati davvero gentili rispetto all'esercizio precedente). Ok il risultato P(C|E) = 0,26 cio il 26%.

Esercizio sulla distribuzione binomiale ed approssimazione di Poisson alla Normale.


Esercizio 1 giugno 2008 Tema A Grazie ad uno studio empirico noto che la probabilit che un automobilista si veda comminare una sanzione amministrativa. causa infrazione al codice della strada, nellarco di un anno, pari a 0.002. Qual la probabilit che vi siano almeno tre multati nellarco di un anno, in un gruppo di 5000 automobilisti? Si risolva lo stesso problema tramite lapprossimazione di Poisson alla distribuzione vera. Il primo metodo per risolvere questo problema consiste nell'utilizzare la distribuzione binomiale assegnando p=0,002 e n=5000, a livello base se vogliamo trovare la probabilit che vi siano almeno 3 multati (questo l'evento E) dovremmo sommare tutte le probabilit che vanno da P(X=3) fino a P(X=5000), ma qua la statistica ci viene in aiuto perch invece che dichiararci scemi possiamo fare:

Dunque calcoliamo la probabilit della negazione dell'evento E (il simbolo di negazione piccolo ma se notate bene c', non potevo far di meglio) cio:

come si calcolano queste probabilit? Ripassiamo un secondo la distribuzione binomiale

Ora che sappiamo tutto basta calcolarci la probabilit di E negato ed applicare la formula in alto per trovare la probabilit dell'evento E. Vabbe dai per gentilezza vi mostro un attimo come procedere

Il risultato a grandi linee 0,003 dunque applicando la formula P(E)=1-0,003=0,997 cio il 99,7%. Passiamo al secondo quesito, questo chiede di risolvere lo stesso problema approssimando la distribuzione di Poisson alla distribuzione vera, in realt per distribuzione vera non si intende quella dell'acqua vera (battutone!) ma sta chiedendo di approssimare la Poisson alla Binomiale (quella che appunto abbiamo usato prima), qualcuno si chieder : ma perch ? Ed io che non voglio lasciarvi nell'ignoranza pi totale vi spiego: La Poisson non altro che il limite per n->inf della Binomiale in cui si assume che =np. Ripassiamo un secondo la formula generale di Poisson:

Ora usiamo lo stesso ragionamento fatto sopra solo che al posto di usare la Binomiale usiamo la Poisson dunque

lo facciamo diventare

applichiamo ancora

ed otterremo P(E) = 0,9972, in linea con il risultato che avevamo ottenuto precedentemente.

Esercizio sulle ripartizioni


Esercizio 3 Luglio 2009 Tema A Una giuria letteraria costituita da 12 membri e decide di costituire 3 sottogiurie (ogni membro dei 12 appartiene ad una ed una sola sottogiuria). Le sottogiurie sono narrativa costituito da 5 membri, fantascienza, costituito da 4 membri e saggistica.

a) In quanti modi possono essere ripartiti i 12 membri della giuria? b) Sapendo che uno dei 12 membri della giuria desidera appartenere alla sottogiuria saggistica qual' la probabilit che selezionando a caso la formazione delle tre sottogiurie la soluzione trovata non vada bene per tale membro? Allora, dai questa la facciamo in fretta! La risposta al primo quesito :

Per rispondere al secondo quesito calcoliamo l'evento negato cio

al numeratore non si parte da 12 perch suppongo che un membro sia gi stato selezionato per saggistica, per trovare il risultato dunque dobbiamo applicare la solita formula

in modo da ottenere la probabilit dell'evento.

Disclaimer/Attenzione/Warning: Fino a qui gli esercizi dovrebbero essere corretti, anche se non garantisco nulla come al solito. D'ora in poi per le formule che utilizzer sono quelle prese dell'eserciziario della puntoexe , alcune differiscono da quelle inserite nelle slide del professor Fagiuoli anche se teoricamente dovrebbero essere equivalenti, le varianze si suppongono tutte corrette. NON SI GARANTISCE NULLA, se vi va male l'esame non abbiate nemmeno il minimo pensiero di rompermi le scatole, gi mi sono fatto due mazzi cosi per scrivere tutto questo.

Esercizio sulla differenza tra medie con varianze non note


Esercizio 2 maggio 2008 Tema A Si considerino due prodotti software (PS1, PS2) per recuperare file erroneamente cancellati. Vogliamo stimare la media della differenza di efficacia tra i due prodotti (cio il numero medio di file recuperati) e per tale ragione consideriamo una situazione nella quale su ognuno di 30 calcolatori siano stati cancellati erroneamente 100 file (50 file vengono trattati con PS1 e i restanti 50 vengono trattati con PS2, i file hanno tutti caratteristiche identiche). Dalla sperimentazione si osserva che il
2 = 4.2 mentre per PS2 si ottiene un numero medio di file recuperati con PS1 X 1 = 36.5 con s1 2 = 7.4 . numero medio di file recuperati X 2 = 41.1 con s2

Si costruisca lintervallo di confidenza per la vera differenza tra di efficacia media dei due prodotti software (si adotti una confidenza pari ad ).

L'esercizio ci fornisce due varianze campionarie (si suppone corrette), da queste dobbiamo tentare di trovare una stima della varianza delle due popolazioni, il puntoexe propone questa formula:

Leggendo il testo del problema evinciamo che n1=n2=30 siccome entrambi i software operano su 30 calcolatori. Il risultato del calcolo S2 = 5,85 . Scriviamo allora a quali valori compresa la differenza tra medie di questo esercizio. Diamo prima la formula generale

da questa formula ricaviamo che l'intervallo di confidenza per la differenza tra medie :

inseriamo i nostri dati nella formula

l'esercizio finisce qua, il professore non vuole che calcoliate i valori dell'intervallo siccome non fornisce la tavole statistiche e nemmeno il valore di . Altro giro altra corsa!

Esercizio sul Test sulla differenza tra media di due popolazioni se non sono note la varianze
Esercizio 1 maggio 2008 Tema B Si considerino due prodotti software (PS1, PS2) per recuperare file erroneamente cancellati. Vogliamo stimare la media della differenza di efficacia tra i due prodotti (cio il numero medio di file recuperati) e per tale ragione consideriamo una situazione nella quale su ognuno di 30 calcolatori siano stati cancellati erroneamente 100 file (50 file vengono trattati con PS1 e i restanti 50 vengono trattati con PS2, i file hanno tutti caratteristiche identiche). Dalla sperimentazione si 2 = 1.2 mentre per osserva che il numero medio di file recuperati con PS1 X 1 = 42.8 con s1 2 PS2 si ottiene un numero medio di file recuperati X 2 = 38.1 con s2 = 4.5 .

C ragione di pensare che il prodotto software PS1 sia migliore del prodotto software PS2, ovvero garantisca efficienza media pi alta? (si adotti una significativit pari ad ). Sostanzialmente abbiamo ste cazzo di due medie e ste cazzo di varianze campionarie, dobbiamo vedere se il software PS1 sia migliore di PS2 per questo buttiamo in tavola due ipotesi H0 ed H1

Non avendo la varianza delle due popolazioni mi devo ripescare questa formula:

S2=2,85 in questo caso. Ora dobbiamo utilizzare la seguente statistica-test

Sostituendo i valori troviamo che t=4,7, ora dobbiamo chiederci se questo valore entri o meno nella regione critica, la regione critica per questo test quella che va tra (t;58, +inf), se il valore di t calcolato entra nella ragione critica allora si rifiuta l'ipotesi H0 e dunque PS1 migliore di PS2 perch vale l'ipotesi H1, altrimenti se il valore fuori dalla regione critica allora non si rifiuta l'ipotesi H0 dunque non vi sostanziale differenza tra il software PS1 ed il software PS2. Fine dell'esercizio.

Esercizio sul Test della varianza di una popolazione


Esercizio 2 Luglio 2009 Tema A La deviazione standard del diametro dei cilindri prodotti da una macchina deve essere non maggiore di 0.75mm. In caso contrario la macchina viene arrestata e tarata. Oggi un campione di 25 cilindri stato estratto dalla produzione della macchina e si misurato il diametro dei 25 cilindri ottenendo, dal campione, una deviazione standard uguale a s=1,34. Basandosi su tale informazione ed in ottemperanza alla procedura di arresto della macchina cosa dobbiamo fare, sulla base del risultato di un opportuno test statistico? (arrestare o non arrestare la macchina) (si adotti una significativit pari ad ). Questo esercizio stato uno di quelli che non mi ha permesso di passare l'esame di statistica (a luglio appunto), grande stronzo che non altro, ma ora siccome mi sono attrezzato intellettualmente tenter di risolverlo spiegandovi come al solito il metodo. un test di ipotesi sulla varianza, si formulano come al solito le ipotesi H0 ed H1

ovviamente ho messo 0,5625 perch la deviazione la radice quadrata della varianza dunque 0.752=0,5625. La statistica da usare

applicando i dati ricaviamo che X2=76,61, la regione critica (X21-;24, +inf), se il valore 76,61

rientra nella regione critica allora necessario arrestare la macchina altrimenti non necessario arrestarla. Fine dell'esercizio.

Esercizio sulla Regressione


Esercizio 1 Luglio 2009 Tema A Si considerino i seguenti dati: X 3 6 4 11 9 8 Y 4 7 5 16 10 11

a) Stimare i coefficienti della regressione di y su x b) Si calcoli l'intervallo di confidenza del coefficiente della regressione x per un livello di confidenza 1-a generico. c) Stimare il valore atteso della variabile di risposta y quando il regressore vale 0.