Probabilit: teoremi e distribuzioni
La teoria della probabilit applicabile a tutti quelle situazioni in cui lesito/evento di una prova/esperimento aleatorio non certo o determinabile con sicurezza in anticipo, ma si verifica con una certa probabilit.
Non si sicuri dellesito dellesperimento Levento pu verificarsi con una certa probabilit Incertezza su quale evento si verificher
Esempio LOTTERIA
Evento, Prova e Probabilit
EVENTO: uno dei possibili risultati di una PROVA PROVA: Ogni esperimento soggetto ad incertezza che genera risultati e produce conoscenza. Consiste nella descrizione di una serie di azioni da compiere o di fatti da osservare PROBABILITA: un numero associato al verificarsi di un evento
Linsieme di tutti i possibili eventi costituisce lo SPAZIO CAMPIONARIO.
EVENTI SEMPLICI
EVENTI COMPLESSI
Singoli risultati di un esperimento/evento casuale
Insieme di due o pi eventi semplici
Probabilit che da un mazzo di carte esca lasso di fiori
Probabilit che da un mazzo di carte esca una carta di cuori
Probabilit come un indice di quanto avverabile un certo evento
Probabilit di successo = il verificarsi di un evento favorevole; P(A) Probabilit di insuccesso = il verificarsi di un evento non favorevole; P(nonA)
Levento A uno dei possibili risultati di un evento
Faccia 5 di un dado P(A)
Se si verifica un evento diverso da quello da noi scelto parliamo di EVENTO CONTRARIO o nonA
Faccia 6 dello stesso dado P(nonA)
Il loro insieme costituisce tutti i possibili esiti della prova
P(A) P(nonA)
La somma delle probabilit di tutti gli eventi possibili 1
PROBABILITA DELLEVENTO CERTO
ASSIOMI FONDAMENTALI
LA PROBABILITA CHE UN EVENTO CASUALE SI VERIFICHI E SEMPRE COMPRESA TRA 0 E 1 P(A) + P(nonA) = 1: ci significa che i due eventi sono COMPLEMENTARI ed esauriscono lintero spazio campionario
EVENTI INDIPENDENTI vs DIPENDENTI
Due eventi A e B si dicono indipendenti se il verificarsi delluno non influenza il verificarsi dellaltro
EVENTI MUTUALMENTE ESCLUDENTISI
Due eventi A e B si dicono mutualmente escludentisi se il verificarsi delluno non consente il verificarsi dellaltro
Definizioni del concetto di probabilit
Ipotesi frequentista
Ipotesi classica
Ipotesi soggettiva
IPOTESI CLASSICA
LANCIO MONETA
- Dato un esperimento ben specificato Uscita della TESTA - Dato un evento E, - detto m il numero dei possibili risultati che danno luogo allevento E TESTA o CROCE - Detto n il numero di tutti i possibili risultati dellesperimento, purch tutti gli n risultati siano ugualmente possibili
TESTA o CROCE
LA PROBABILITA DELLEVENTO E E DATA DAL RAPPORTO TRA m/n
IPOTESI CLASSICA
La probabilit che si verifichi un evento data dal rapporto tra i casi favorevoli e quelli ugualmente possibili
La probabilit di ottenere il numero 5 dal lancio di un dado 1 (caso/evento favorevole) 6 (casi/eventi possibili)
Per definire la probabilit necessario presupporre che gli esiti siano tutti UGUALMENTE POSSIBILI!!!!!!!
IPOTESI FREQUENTISTA
La probabilit che si verifichi un certo evento uguale alla frequenza relativa con cui levento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.
Frequenza con cui si verifica levento A nelle n prove prove Numero di prove molto grande
Probabilit del verificarsi dellevento A
CARATTERISTICA PRINCIPALE
Permette di conoscere la probabilit di un evento solo dopo aver effettuato un numero di prove (A Posteriori)
GLI EVENTI DEVONO ESSERE RIPETIBILI, cio ripetuti nelle stesse condizioni
Un evento favorevole pu essere definito da pi eventi distinti A e B allinterno dello spazio campionario.
EVENTI DISGIUNTI
Il verificarsi di quello evento presuppone il verificarsi di ognuno dei singoli eventi (A o B)
SIGNIFICA ANDARE A SOMMARE LA PROBABILITA CHE OGNUNO DEI SINGOLI EVENTI DISGIUNTI SI VERIFICHINO
PRINCIPIO DELLA SOMMA o principio delle probabilit totali
La probabilit che si verifichino due eventi mutualmente escludentisi data dalla SOMMA delle probabilit del verificarsi dei singoli eventi
Prova: lanciare due volte una moneta Evento : ottenere TESTA al primo lancio A
Testa Testa
Testa Croce
P(A o B) = + =
1/4
1/4
prova: lanciare due volte una moneta Evento : ottenere almeno una CROCE nei due lanci
A
B
Testa Testa Testa Croce Croce Testa Croce Croce
1/4
1/4
C D
1/4 1/4
P(A o B o C o D) =++=
e quando i due eventi sono NON mutualmente escludentisi?
Quando due eventi Indipendente si verificano congiuntamente ed il verificarsi delluno NON MODIFICA la probabilit del verificarsi dellaltro
REGOLA DEL PRODOTTO PER EVENTI CONGIUNTI
PRINCIPIO DEL PRODOTTO o delle probabilit composte
La probabilit del verificarsi degli eventi indipendenti A e B, ordinatamente in s prove, data dal prodotto delle probabilit relative al verificarsi dei singoli eventi considerati:
prova: lanciare due dadi: uno rosso ed uno nero
A B
Numero 4 sul dado rosso Numero 5 sul dado nero
1/6
1/6
P(A e B) = 1/6 x 1/6 = 1/36
e cosa accade quando gli eventi sono dipendenti?
Gli eventi si definiscono DIPENDENTI quando il verificarsi delluno MODIFICA la probabilit del verificarsi dellaltro evento
SI RIDUCE LO SPAZIO CAMPIONARIO
una situazione tipica delle estrazioni senza reinserimento
Cosa accade quando gli eventi sono dipendenti? La probabilit del verificarsi di una certa successione di eventi
semplici dipendenti E1, E2, En, data dal prodotto della probabilit del verificarsi di E1, per la probabilit di E2 subordinata al verificarsi di E1 e cos via
prova: gioco del poker con mazzo di 32 carte Evento: fare poker dassi in una mano di cinque carte
E1 E2 E3
Asso di cuori Asso di quadri Asso di fiori
1/32 1/31
E4 E5
Asso di picche Una delle restanti carte
1/29
28/28
1/30
Esempi
Eventi: somma delle facce di due dadi 2
Eventi indipendenti
APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO
E1 E2
Faccia 1 sul dado 1 Faccia 1 sul dado 2
1/6 1/6
Eventi: somma delle facce di due dadi 3
Eventi mutualmente escludentisi
APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO E DELLA SOMMA
E1 E2 E3 E4
Faccia 1 sul dado 1 Faccia 2 sul dado 2
1/6 1/6 1/6 1/6
Faccia 2 sul dado1
Faccia 1 sul dado2
Cenni dellAnalisi combinatoria
COMBINAZIONI
Si dicono COMBINAZIONI di n oggetti a r a r tutte le possibili rple che si costruiscono con gli n oggetti senza tener conto dellordine degli oggetti. Le r-ple differiscono tra loro per almeno un elemento Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2 Gruppi: AB AC AD BC BD CD
Numero degli stimoli Ampiezza dei gruppi
n Fattoriale: Prodotto di tutti i numeri interi della serie naturale fino ad n
(n-r) Fattoriale: Prodotto di tutti i numeri interi della serie naturale fino ad n - r n=4 n! = 4! = 4 x 3 x 2 x 1 = 24
Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2 Gruppi: AB AC AD BC BD CD
CI DICE IN QUANTI MODI POSSIAMO DISPORRE IN ORDINE n OGGETTI
PERMUTAZIONI Dato un insieme di n oggetti, si dice PERMUTAZIONE ogni serie ordinata/sottoinsieme degli n oggetti presi n a n.
Numero degli elementi che dobbiamo moltiplicare
Immaginiamo di avere 4 stimoli A, B, C e D
DISPOSIZIONI
Si dicono DISPOSIZIONI di n oggetti a r a r tutte le possibili rple che si possono formare con gli n oggetti in modo tale che differiscano per lordine in cui sono gli oggetti
Ogni disposizione distinta dalle altre sia per gli elementi presenti sia per lordine degli elementi allinterno
Immaginiamo di avere 4 stimoli A, B, C, D e E Ampiezza r=2
Le distribuzioni di probabilit
E-mail: [Link]@[Link] Ricevimento: Luned 11:00 12:00 Materiale didattico su: [Link]
Che cosa una VARIABILE CASUALE?
Qualsiasi caratteristica misurabile denominata variabile. Se una variabile pu assumere numerosi valori tali che qualsiasi risultato determinato dal caso, essa nota come variabile casuale Una VARIABILE CASUALE/UNIVARIATA definita come una regola che associa ad ogni evento un unico numero reale
Variabile casuale discreta quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali, in un insieme finito e numerabile
Variabile casuale continua quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali
Ad ogni evento possibile associare una probabilit la cui distribuzione definita in base proprio a questo evento. Una distribuzione di probabilit una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilit che questi si presentino
Evento = x Distribuzione della probabilit dellevento x = f(x) Numero di prove eseguibili = n
DISTRIBUZIONE BINOMIALE
DALLA DISTRIBUZIONE BERNOULLIANA ALLA DISTRIBUZIONE BINOMIALE
la distribuzione di probabilit di una variabile casuale discreta tale che il valore della variabile casuale sia il numero di successi in una serie di esperimenti identici ed indipendenti
ESPERIMENTO EVENTO X
lancio di una moneta numero di teste che deriva da un lancio
Un tale esperimento denominato una prova di Bernoulli e la variabile casuale che corrisponde al numero di successi denominata una variabile di Bernoulli.
DISTRIBUZIONE BINOMIALE Se l'esperimento (o prova) ripetuto pi volte e le ripetizioni sono indipendenti tra loro, allora la distribuzione di probabilit della variabile casuale X in n prove indipendenti di Bernoulli denominata distribuzione binomiale.
Probabilit che levento desiderato non si verifichi Numero di prove Combinazioni possibili Probabilit che si verifichi levento desiderato
ESEMPIO
Unurna contiene 10 palline di cui 3 bianche. Si eseguono 4 successive estrazioni rimettendo ogni volta la pallina estratta nellurna.
Probabilit di estrarre 1 pallina bianca Probabilit di estrarre 3 palline bianche 1/10
3/10
ESEMPIO
Un soggetto stato sottoposto ad un test di 20 item, in cui doveva scegliere tra 2 risposte (una corretta ed una sbagliata). Alla risposta corretta viene assegnata un punteggio di 1 mentre a quella errata un punteggio di 0. Il soggetto potr rispondere in maniera corretta alle 20 domande (punteggio di 20) oppure in modo errato (punteggio di 0). Vogliamo sapere qual la probabilit che il soggetto ottenga un punteggio di 17.
Probabilit di dare una risposta corretta
= 0,5
Probabilit di dare una risposta errata n =20
= 0,5
Punteggio di 17
Evento X
PROPRIETA DELLA DISTRIBUZIONE BINOMIALE
Il valore medio il risultato pi probabile. Man mano che ci si allontana dalla media il risultato diviene meno probabile fino ad una probabilit tendente allo zero
simmetrica se la probabilit di verificarsi dellevento favorevole p=0,50 asimmetrica positiva se p<0,50 asimmetrica negativa se p>0,50 Lasimmetria diminuisce allaumentare di n per qualunque valore di p0,50
PROPRIETA DELLA DISTRIBUZIONE BINOMIALE
Le probabilit di pi eventi favorevoli: Se in un test di 20 item dicotomici si vuole sapere la probabilit di ottenere un punteggio massimo di 8 si pu applicare il principio della SOMMA
Tutti i possibili valori interi da 0 a 8
Per ogni punteggio da 0 a 8 calcoliamo le singole probabilit e poi le sommiamo
La probabilit di avere un punteggio di 8 sar dato dalla somma di tutte queste probabilit
0,252
e quando le variabili sono continue
DISTRIBUZIONE NORMALE O GAUSSIANA
Le distribuzioni normali sono una famiglia di curve simmetriche a forma di campana e unimodali (moda ,media e mediana coincidono). Hanno tutte la stessa forma ma sono caratterizzate dai due valori: media e varianza N(,2).
Caratteristiche di una distribuzione Normale
La curva Normale Unimodale e simmetrica rispetto alla sua media ()
La curva ASINTOTICA rispetto allasse delle ascisse La funzione f(x) tende ad annullarsi senza mai raggiungere lo 0 se non ai valori di ascissa - e +
La media, la mediana e la moda della distribuzione coincidono
La Deviazione Standard, indica la quantit di dispersione delle osservazioni intorno alla media
I parametri e definiscono in modo completo la curva
Se invece rimane costante e varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma pi o meno appiattita, secondo il valore di .
Se varia e rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati.
2 distribuzioni normali che differiscono sia per la media sia per la dispersione dei dati
Caratteristiche di una distribuzione Normale
Come per le distribuzioni discrete la somma di tutte le probabilit uguale a 1, anche per la distribuzione normale si applica questo concetto
Rappresenta larea racchiusa dalla curva
La funzione della distribuzione sar:
Sono la media e la varianza della popolazione
La probabilit che un valore estratto a caso da una N(,2) sia compreso nellintervallo ( - , +) pari a 0.683 e che sia compreso tra ( -2 , +2) pari a 0,954
Il 95% dei valori centrali di una distribuzione Normale cadono nellintervallo ( - 1.96 , +1.96) ed il 99% nellintervallo ( 2.58 , +2.58)
Non ci sono tavole di probabilit per tutti i possibili valori di e , esiste una tavola unica che pu essere usata per tutte le variabili Normali.
Tale tavola si riferisce ad una particolare distribuzione: la distribuzione Normale Standardizzata.
La distribuzione normale standardizzata o normale ridotta, si ottiene mediante il cambiamento di variabile X in un punto z secondo la formula:
La standardizzazione una trasformazione che consiste nel:
rendere la media nulla ( = 0), poich ad ogni valore viene sottratta la media; prendere la deviazione standard come unit di misura ( = 1) della nuova variabile. La distribuzione normale ridotta viene indicata con N(0,1), che indica appunto una distribuzione normale con media 0 e varianza uguale a 1. In ogni distribuzione Normale con media e , la probabilit tra x1 e x2 la stessa che tra z1 e z2 nella distribuzione Normale Standardizzata, dove z1=(x1- )/ z2=(x2- )/
Probabilit della curva normale standardizzata e relative tavole
Le tavole di probabilit della distribuzione normale vengono utilizzate per due scopi:
1.
2.
Per calcolare larea compresa tra due determinati valori della variabile oggetto di studio; Per conoscere la quantit dei punteggi compresi tra due valori di una variabile casuale.
Probabilit della curva normale standardizzata e relative tavole
Osservando la tavola si troveranno i punti z nella colonna di sinistra con una cifra decimale; la seconda cifra decimale posta nella prima riga in alto della stessa tavola.
49
In termini pratici
Supponiamo di voler conoscere larea compresa tra le ordinate corrispondenti a z=0 e z=1,96.
50
Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9 e, rimanendo nella stessa riga fino a trovarsi in quella indicata con 6.
Il punteggio che troverete in quel punto indica la porzione di area compresa tra le due ordinate:
Poich larea totale sotto la curva alla destra dellordinata corrispondente a z=0,00 0,5000, larea alla destra dellordinata di z =1,96 sar: 0,5000-0,4750= 0,0250.
52
Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate corrispondenti a z=-1,00 e z=+1,00.
Cercando nella tabella troverete che la porzione di area sotto la curva compresa z=0,00 e z=1,00 0,3413. Dalla porzione opposta della curva si trover ovviamente lo stesso valore
quindi la proporzione di area si otterr sommando i due valori: 0.3413+0,3413=0,6826.
Supponiamo ora di voler trovare larea sotto la curva compresa tra z=0,50 e z=2,50.
56
Poich le tavole danno solo le aree a partire dal punto z=0,00, il calcolo richiede il seguente passaggio:
Calcolare larea tra le ordinate corrispondenti a z=0,00 e z=0,50
Calcolare larea tra z=0,00 e z=2,50
Sottrarre la porzione,4938 di area che va z=0,00 a z=0,50 a quella - ,1915 = da ,3023 che va da z=0,00 a z=2,50
Esercizio
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm.
Qual la probabilit di incontrare un individuo estratto da tale popolazione e di altezza superiore a cm 190?
X = 190 =172,5 = 6,25
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm. Qual la probabilit di incontrare un individuo estratto da tale popolazione con unaltezza compresa tra cm 165 e175?
X1 = 165 X2 = 175
=172,5 = 6,25
0,3849
0,1554
P(X1)=P( 0<X1<Z1)= 0,3849 P(X2)= P(0<X2<Z2)= 0,1554
derivazioni della curva normale
DISTRIBUZIONE DEL CHI QUADRATO Date n variabili casuali indipendenti x1, x2, , xn, normalmente distribuite con = 0 e = 1, il 2 una variabile casuale data dalla somma dei loro quadrati.
un metodo di inferenza statistica che non richiede delle ipotesi a priori sul tipo o sulle caratteristiche della distribuzione.
molto utile nella fase iniziale dellanalisi statistica quando si cercano le variabili pi significative e le relazioni tra esse.
DISTRIBUZIONE DEL CHI QUADRATO
Si basa sul confronto fra FREQUENZE OSSERVATE NEL CAMPIONE e FREQUENZE ATTESE
La funzione di densit del 2 determinata solo dal parametro numero di gradi di libert, pertanto viene scritta come 2 ().
La distribuzione 2 parte da GDL=1 e al suo aumentare assume forme sempre diverse, fino ad una forma approssimativamente normale per GDL = 30
Caratteristiche della distribuzione del 2
una somma di quadrati e per questo motivo i suoi valori sono sempre positivi e compresi nellintervallo (0; +) asimmetrica Tende alla simmetria quando i gdl tendono ad infinito asintotica
Caratteristiche della distribuzione del 2
Il test statistico perde di attendibilit quando il numero di osservazioni inferiore a 30 Con pochi dati le variazioni casuali divengono molto ampie tanto da non poter rifiutare mai lIpotesi nulla con una probabilit ragionevolmente bassa.
Per campioni di dimensioni inferiori a 200 (o 100) ma comunque superiori a 30 si deve apportare la CORREZIONE DI YATES
derivazioni della curva normale
DISTRIBUZIONE DELLA t DI STUDENT
Considera le relazioni tra media e varianza, in campioni di piccole dimensioni, quando si utilizza la varianza del campione.
Quando non si conosce la varianza della popolazione usiamo la VARIANZA CAMPIONARIA s2
Gdl= N-1
Rispetto alla curva normale pi bassa simmetrica Le frequenze sono maggiori agli e quando il numero dei GDl molto piccolo Quando i Gdl tendono allinfinito la curva si approssima a quella normale
derivazioni della curva normale
DISTRIBUZIONE F di FISHER
Corrisponde al rapporto di 2 variabili casuali 2 indipendenti, divise per i rispettivi gradi di libert Questo rapporto varia tra 0 e + La curva dipende dai Gdl e dal livello di probabilit