Sei sulla pagina 1di 70

Probabilit: teoremi e distribuzioni

La teoria della probabilit applicabile a tutti quelle situazioni in cui lesito/evento di una prova/esperimento aleatorio non certo o determinabile con sicurezza in anticipo, ma si verifica con una certa probabilit.

Non si sicuri dellesito dellesperimento Levento pu verificarsi con una certa probabilit Incertezza su quale evento si verificher

Esempio LOTTERIA

Evento, Prova e Probabilit


EVENTO: uno dei possibili risultati di una PROVA PROVA: Ogni esperimento soggetto ad incertezza che genera risultati e produce conoscenza. Consiste nella descrizione di una serie di azioni da compiere o di fatti da osservare PROBABILITA: un numero associato al verificarsi di un evento

Linsieme di tutti i possibili eventi costituisce lo SPAZIO CAMPIONARIO.


EVENTI SEMPLICI
EVENTI COMPLESSI

Singoli risultati di un esperimento/evento casuale

Insieme di due o pi eventi semplici

Probabilit che da un mazzo di carte esca lasso di fiori

Probabilit che da un mazzo di carte esca una carta di cuori

Probabilit come un indice di quanto avverabile un certo evento


Probabilit di successo = il verificarsi di un evento favorevole; P(A) Probabilit di insuccesso = il verificarsi di un evento non favorevole; P(nonA)

Levento A uno dei possibili risultati di un evento


Faccia 5 di un dado P(A)

Se si verifica un evento diverso da quello da noi scelto parliamo di EVENTO CONTRARIO o nonA
Faccia 6 dello stesso dado P(nonA)

Il loro insieme costituisce tutti i possibili esiti della prova


P(A) P(nonA)

La somma delle probabilit di tutti gli eventi possibili 1

PROBABILITA DELLEVENTO CERTO

ASSIOMI FONDAMENTALI
LA PROBABILITA CHE UN EVENTO CASUALE SI VERIFICHI E SEMPRE COMPRESA TRA 0 E 1 P(A) + P(nonA) = 1: ci significa che i due eventi sono COMPLEMENTARI ed esauriscono lintero spazio campionario

EVENTI INDIPENDENTI vs DIPENDENTI


Due eventi A e B si dicono indipendenti se il verificarsi delluno non influenza il verificarsi dellaltro

EVENTI MUTUALMENTE ESCLUDENTISI


Due eventi A e B si dicono mutualmente escludentisi se il verificarsi delluno non consente il verificarsi dellaltro

Definizioni del concetto di probabilit

Ipotesi frequentista

Ipotesi classica

Ipotesi soggettiva

IPOTESI CLASSICA
LANCIO MONETA

- Dato un esperimento ben specificato Uscita della TESTA - Dato un evento E, - detto m il numero dei possibili risultati che danno luogo allevento E TESTA o CROCE - Detto n il numero di tutti i possibili risultati dellesperimento, purch tutti gli n risultati siano ugualmente possibili
TESTA o CROCE

LA PROBABILITA DELLEVENTO E E DATA DAL RAPPORTO TRA m/n

IPOTESI CLASSICA
La probabilit che si verifichi un evento data dal rapporto tra i casi favorevoli e quelli ugualmente possibili

La probabilit di ottenere il numero 5 dal lancio di un dado 1 (caso/evento favorevole) 6 (casi/eventi possibili)
Per definire la probabilit necessario presupporre che gli esiti siano tutti UGUALMENTE POSSIBILI!!!!!!!

IPOTESI FREQUENTISTA
La probabilit che si verifichi un certo evento uguale alla frequenza relativa con cui levento si verifica in un numero di prove sufficientemente grande, ripetute nelle medesime condizioni.
Frequenza con cui si verifica levento A nelle n prove prove Numero di prove molto grande

Probabilit del verificarsi dellevento A

CARATTERISTICA PRINCIPALE
Permette di conoscere la probabilit di un evento solo dopo aver effettuato un numero di prove (A Posteriori)

GLI EVENTI DEVONO ESSERE RIPETIBILI, cio ripetuti nelle stesse condizioni

Un evento favorevole pu essere definito da pi eventi distinti A e B allinterno dello spazio campionario.
EVENTI DISGIUNTI

Il verificarsi di quello evento presuppone il verificarsi di ognuno dei singoli eventi (A o B)

SIGNIFICA ANDARE A SOMMARE LA PROBABILITA CHE OGNUNO DEI SINGOLI EVENTI DISGIUNTI SI VERIFICHINO

PRINCIPIO DELLA SOMMA o principio delle probabilit totali


La probabilit che si verifichino due eventi mutualmente escludentisi data dalla SOMMA delle probabilit del verificarsi dei singoli eventi

Prova: lanciare due volte una moneta Evento : ottenere TESTA al primo lancio A
Testa Testa

Testa Croce

P(A o B) = + =

1/4

1/4

prova: lanciare due volte una moneta Evento : ottenere almeno una CROCE nei due lanci

A
B

Testa Testa Testa Croce Croce Testa Croce Croce

1/4

1/4

C D

1/4 1/4

P(A o B o C o D) =++=

e quando i due eventi sono NON mutualmente escludentisi?

Quando due eventi Indipendente si verificano congiuntamente ed il verificarsi delluno NON MODIFICA la probabilit del verificarsi dellaltro

REGOLA DEL PRODOTTO PER EVENTI CONGIUNTI

PRINCIPIO DEL PRODOTTO o delle probabilit composte


La probabilit del verificarsi degli eventi indipendenti A e B, ordinatamente in s prove, data dal prodotto delle probabilit relative al verificarsi dei singoli eventi considerati:

prova: lanciare due dadi: uno rosso ed uno nero

A B

Numero 4 sul dado rosso Numero 5 sul dado nero

1/6

1/6

P(A e B) = 1/6 x 1/6 = 1/36

e cosa accade quando gli eventi sono dipendenti?


Gli eventi si definiscono DIPENDENTI quando il verificarsi delluno MODIFICA la probabilit del verificarsi dellaltro evento

SI RIDUCE LO SPAZIO CAMPIONARIO

una situazione tipica delle estrazioni senza reinserimento

Cosa accade quando gli eventi sono dipendenti? La probabilit del verificarsi di una certa successione di eventi
semplici dipendenti E1, E2, En, data dal prodotto della probabilit del verificarsi di E1, per la probabilit di E2 subordinata al verificarsi di E1 e cos via

prova: gioco del poker con mazzo di 32 carte Evento: fare poker dassi in una mano di cinque carte

E1 E2 E3

Asso di cuori Asso di quadri Asso di fiori

1/32 1/31

E4 E5

Asso di picche Una delle restanti carte

1/29

28/28

1/30

Esempi
Eventi: somma delle facce di due dadi 2
Eventi indipendenti

APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO

E1 E2

Faccia 1 sul dado 1 Faccia 1 sul dado 2

1/6 1/6

Eventi: somma delle facce di due dadi 3


Eventi mutualmente escludentisi

APPLICAZIONE DEL PRINCIPIO DEL PRODOTTO E DELLA SOMMA

E1 E2 E3 E4

Faccia 1 sul dado 1 Faccia 2 sul dado 2

1/6 1/6 1/6 1/6

Faccia 2 sul dado1


Faccia 1 sul dado2

Cenni dellAnalisi combinatoria


COMBINAZIONI
Si dicono COMBINAZIONI di n oggetti a r a r tutte le possibili rple che si costruiscono con gli n oggetti senza tener conto dellordine degli oggetti. Le r-ple differiscono tra loro per almeno un elemento Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2 Gruppi: AB AC AD BC BD CD
Numero degli stimoli Ampiezza dei gruppi

n Fattoriale: Prodotto di tutti i numeri interi della serie naturale fino ad n


(n-r) Fattoriale: Prodotto di tutti i numeri interi della serie naturale fino ad n - r n=4 n! = 4! = 4 x 3 x 2 x 1 = 24

Immaginiamo di avere 4 stimoli A, B, C e D Ampiezza r=2 Gruppi: AB AC AD BC BD CD

CI DICE IN QUANTI MODI POSSIAMO DISPORRE IN ORDINE n OGGETTI

PERMUTAZIONI Dato un insieme di n oggetti, si dice PERMUTAZIONE ogni serie ordinata/sottoinsieme degli n oggetti presi n a n.
Numero degli elementi che dobbiamo moltiplicare

Immaginiamo di avere 4 stimoli A, B, C e D

DISPOSIZIONI

Si dicono DISPOSIZIONI di n oggetti a r a r tutte le possibili rple che si possono formare con gli n oggetti in modo tale che differiscano per lordine in cui sono gli oggetti

Ogni disposizione distinta dalle altre sia per gli elementi presenti sia per lordine degli elementi allinterno

Immaginiamo di avere 4 stimoli A, B, C, D e E Ampiezza r=2

Le distribuzioni di probabilit

E-mail: r.romanelli@unich.it Ricevimento: Luned 11:00 12:00 Materiale didattico su: http://www.psicometria.unich.it

Che cosa una VARIABILE CASUALE?


Qualsiasi caratteristica misurabile denominata variabile. Se una variabile pu assumere numerosi valori tali che qualsiasi risultato determinato dal caso, essa nota come variabile casuale Una VARIABILE CASUALE/UNIVARIATA definita come una regola che associa ad ogni evento un unico numero reale

Variabile casuale discreta quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali, in un insieme finito e numerabile

Variabile casuale continua quella che pu assumere tutti i possibili valori in un dato intervallo di numeri reali

Ad ogni evento possibile associare una probabilit la cui distribuzione definita in base proprio a questo evento. Una distribuzione di probabilit una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilit che questi si presentino

Evento = x Distribuzione della probabilit dellevento x = f(x) Numero di prove eseguibili = n


DISTRIBUZIONE BINOMIALE

DALLA DISTRIBUZIONE BERNOULLIANA ALLA DISTRIBUZIONE BINOMIALE

la distribuzione di probabilit di una variabile casuale discreta tale che il valore della variabile casuale sia il numero di successi in una serie di esperimenti identici ed indipendenti

ESPERIMENTO EVENTO X

lancio di una moneta numero di teste che deriva da un lancio

Un tale esperimento denominato una prova di Bernoulli e la variabile casuale che corrisponde al numero di successi denominata una variabile di Bernoulli.

DISTRIBUZIONE BINOMIALE Se l'esperimento (o prova) ripetuto pi volte e le ripetizioni sono indipendenti tra loro, allora la distribuzione di probabilit della variabile casuale X in n prove indipendenti di Bernoulli denominata distribuzione binomiale.

Probabilit che levento desiderato non si verifichi Numero di prove Combinazioni possibili Probabilit che si verifichi levento desiderato

ESEMPIO
Unurna contiene 10 palline di cui 3 bianche. Si eseguono 4 successive estrazioni rimettendo ogni volta la pallina estratta nellurna.
Probabilit di estrarre 1 pallina bianca Probabilit di estrarre 3 palline bianche 1/10

3/10

ESEMPIO
Un soggetto stato sottoposto ad un test di 20 item, in cui doveva scegliere tra 2 risposte (una corretta ed una sbagliata). Alla risposta corretta viene assegnata un punteggio di 1 mentre a quella errata un punteggio di 0. Il soggetto potr rispondere in maniera corretta alle 20 domande (punteggio di 20) oppure in modo errato (punteggio di 0). Vogliamo sapere qual la probabilit che il soggetto ottenga un punteggio di 17.
Probabilit di dare una risposta corretta

= 0,5

Probabilit di dare una risposta errata n =20

= 0,5
Punteggio di 17

Evento X

PROPRIETA DELLA DISTRIBUZIONE BINOMIALE

Il valore medio il risultato pi probabile. Man mano che ci si allontana dalla media il risultato diviene meno probabile fino ad una probabilit tendente allo zero

simmetrica se la probabilit di verificarsi dellevento favorevole p=0,50 asimmetrica positiva se p<0,50 asimmetrica negativa se p>0,50 Lasimmetria diminuisce allaumentare di n per qualunque valore di p0,50

PROPRIETA DELLA DISTRIBUZIONE BINOMIALE


Le probabilit di pi eventi favorevoli: Se in un test di 20 item dicotomici si vuole sapere la probabilit di ottenere un punteggio massimo di 8 si pu applicare il principio della SOMMA
Tutti i possibili valori interi da 0 a 8

Per ogni punteggio da 0 a 8 calcoliamo le singole probabilit e poi le sommiamo

La probabilit di avere un punteggio di 8 sar dato dalla somma di tutte queste probabilit

0,252

e quando le variabili sono continue


DISTRIBUZIONE NORMALE O GAUSSIANA

Le distribuzioni normali sono una famiglia di curve simmetriche a forma di campana e unimodali (moda ,media e mediana coincidono). Hanno tutte la stessa forma ma sono caratterizzate dai due valori: media e varianza N(,2).

Caratteristiche di una distribuzione Normale


La curva Normale Unimodale e simmetrica rispetto alla sua media ()

La curva ASINTOTICA rispetto allasse delle ascisse La funzione f(x) tende ad annullarsi senza mai raggiungere lo 0 se non ai valori di ascissa - e +

La media, la mediana e la moda della distribuzione coincidono

La Deviazione Standard, indica la quantit di dispersione delle osservazioni intorno alla media
I parametri e definiscono in modo completo la curva

Se invece rimane costante e varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma pi o meno appiattita, secondo il valore di .

Se varia e rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati.

2 distribuzioni normali che differiscono sia per la media sia per la dispersione dei dati

Caratteristiche di una distribuzione Normale

Come per le distribuzioni discrete la somma di tutte le probabilit uguale a 1, anche per la distribuzione normale si applica questo concetto
Rappresenta larea racchiusa dalla curva

La funzione della distribuzione sar:


Sono la media e la varianza della popolazione

La probabilit che un valore estratto a caso da una N(,2) sia compreso nellintervallo ( - , +) pari a 0.683 e che sia compreso tra ( -2 , +2) pari a 0,954
Il 95% dei valori centrali di una distribuzione Normale cadono nellintervallo ( - 1.96 , +1.96) ed il 99% nellintervallo ( 2.58 , +2.58)

Non ci sono tavole di probabilit per tutti i possibili valori di e , esiste una tavola unica che pu essere usata per tutte le variabili Normali.

Tale tavola si riferisce ad una particolare distribuzione: la distribuzione Normale Standardizzata.

La distribuzione normale standardizzata o normale ridotta, si ottiene mediante il cambiamento di variabile X in un punto z secondo la formula:

La standardizzazione una trasformazione che consiste nel:


rendere la media nulla ( = 0), poich ad ogni valore viene sottratta la media; prendere la deviazione standard come unit di misura ( = 1) della nuova variabile. La distribuzione normale ridotta viene indicata con N(0,1), che indica appunto una distribuzione normale con media 0 e varianza uguale a 1. In ogni distribuzione Normale con media e , la probabilit tra x1 e x2 la stessa che tra z1 e z2 nella distribuzione Normale Standardizzata, dove z1=(x1- )/ z2=(x2- )/

Probabilit della curva normale standardizzata e relative tavole

Le tavole di probabilit della distribuzione normale vengono utilizzate per due scopi:
1.

2.

Per calcolare larea compresa tra due determinati valori della variabile oggetto di studio; Per conoscere la quantit dei punteggi compresi tra due valori di una variabile casuale.

Probabilit della curva normale standardizzata e relative tavole


Osservando la tavola si troveranno i punti z nella colonna di sinistra con una cifra decimale; la seconda cifra decimale posta nella prima riga in alto della stessa tavola.

49

In termini pratici
Supponiamo di voler conoscere larea compresa tra le ordinate corrispondenti a z=0 e z=1,96.

50

Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9 e, rimanendo nella stessa riga fino a trovarsi in quella indicata con 6.
Il punteggio che troverete in quel punto indica la porzione di area compresa tra le due ordinate:

Poich larea totale sotto la curva alla destra dellordinata corrispondente a z=0,00 0,5000, larea alla destra dellordinata di z =1,96 sar: 0,5000-0,4750= 0,0250.
52

Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate corrispondenti a z=-1,00 e z=+1,00.

Cercando nella tabella troverete che la porzione di area sotto la curva compresa z=0,00 e z=1,00 0,3413. Dalla porzione opposta della curva si trover ovviamente lo stesso valore

quindi la proporzione di area si otterr sommando i due valori: 0.3413+0,3413=0,6826.

Supponiamo ora di voler trovare larea sotto la curva compresa tra z=0,50 e z=2,50.

56

Poich le tavole danno solo le aree a partire dal punto z=0,00, il calcolo richiede il seguente passaggio:
Calcolare larea tra le ordinate corrispondenti a z=0,00 e z=0,50

Calcolare larea tra z=0,00 e z=2,50

Sottrarre la porzione,4938 di area che va z=0,00 a z=0,50 a quella - ,1915 = da ,3023 che va da z=0,00 a z=2,50

Esercizio
Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm.

Qual la probabilit di incontrare un individuo estratto da tale popolazione e di altezza superiore a cm 190?

X = 190 =172,5 = 6,25

Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media () =172,5 cm e deviazione standard () = 6,25 cm. Qual la probabilit di incontrare un individuo estratto da tale popolazione con unaltezza compresa tra cm 165 e175?

X1 = 165 X2 = 175
=172,5 = 6,25

0,3849

0,1554

P(X1)=P( 0<X1<Z1)= 0,3849 P(X2)= P(0<X2<Z2)= 0,1554

derivazioni della curva normale


DISTRIBUZIONE DEL CHI QUADRATO Date n variabili casuali indipendenti x1, x2, , xn, normalmente distribuite con = 0 e = 1, il 2 una variabile casuale data dalla somma dei loro quadrati.

un metodo di inferenza statistica che non richiede delle ipotesi a priori sul tipo o sulle caratteristiche della distribuzione.
molto utile nella fase iniziale dellanalisi statistica quando si cercano le variabili pi significative e le relazioni tra esse.

DISTRIBUZIONE DEL CHI QUADRATO


Si basa sul confronto fra FREQUENZE OSSERVATE NEL CAMPIONE e FREQUENZE ATTESE

La funzione di densit del 2 determinata solo dal parametro numero di gradi di libert, pertanto viene scritta come 2 ().
La distribuzione 2 parte da GDL=1 e al suo aumentare assume forme sempre diverse, fino ad una forma approssimativamente normale per GDL = 30

Caratteristiche della distribuzione del 2


una somma di quadrati e per questo motivo i suoi valori sono sempre positivi e compresi nellintervallo (0; +) asimmetrica Tende alla simmetria quando i gdl tendono ad infinito asintotica

Caratteristiche della distribuzione del 2


Il test statistico perde di attendibilit quando il numero di osservazioni inferiore a 30 Con pochi dati le variazioni casuali divengono molto ampie tanto da non poter rifiutare mai lIpotesi nulla con una probabilit ragionevolmente bassa.

Per campioni di dimensioni inferiori a 200 (o 100) ma comunque superiori a 30 si deve apportare la CORREZIONE DI YATES

derivazioni della curva normale


DISTRIBUZIONE DELLA t DI STUDENT

Considera le relazioni tra media e varianza, in campioni di piccole dimensioni, quando si utilizza la varianza del campione.
Quando non si conosce la varianza della popolazione usiamo la VARIANZA CAMPIONARIA s2

Gdl= N-1

Rispetto alla curva normale pi bassa simmetrica Le frequenze sono maggiori agli e quando il numero dei GDl molto piccolo Quando i Gdl tendono allinfinito la curva si approssima a quella normale

derivazioni della curva normale


DISTRIBUZIONE F di FISHER

Corrisponde al rapporto di 2 variabili casuali 2 indipendenti, divise per i rispettivi gradi di libert Questo rapporto varia tra 0 e + La curva dipende dai Gdl e dal livello di probabilit