Sei sulla pagina 1di 26

|  

     

 | || 
   
                       

A.A. 2006/2007
"##| |   "" $$||%
| h ! le cui manifestazioni o eventi non
possono essere previste con certezza sono detti
 o   .

G 
 
 
 
  

    

˜o strumento adatto a studiare e misurare i fenomeni


aleatori (casuali) è la teoria della probabilità.

|l        è alla base della


biostatistica, consente di stimare e esaminare i dati
del passato e fornire indizi sul futuro.
$$||% | &# "'"# "
| "
Dn (  può risultare:
·  (se si verifica sempre)
Î Estrazione di una pallina rossa da un¶urna contenente
solo palline rosse
Î ˜a morte in caso di coma irreversibile

· |!  (non si verifica mai)


Î Estrazione di una pallina bianca da un¶urna
contenente solo palline nere
Î Effettuare un¶analisi senza reagenti necessari

·       (può verificarsi oppure no)


Î Estrazione di una pallina bianca da un¶urna
contenente sia palline bianche che rosse
Î ˜a sopravvivenza di un individuo fino all¶età di 75 anni
"| "   "" $$||%

˜¶insieme di tutti i possibili risultati di un fenomeno


costituisce % (  o lo   !  ) 
   * + (omega, lettera greca)
 )+* , -

Si usa il termine   per segnalare che si è


verificato l¶evento considerato e   il caso
contrario.

|l numero di successi in una serie di osservazioni o


prove può essere definita come frequenza relative,
cioè come rapporto tra il numero di eventi favorevoli
rispetto al numero dei casi esaminati.
       (  è il rapporto tra i casi favorevoli
e i casi possibili rilevati in una lunga serie di prove ripetute
sotto condizioni simili.

˜a       (  " si calcola come:

)"* , !    
!     

. / )"* / - ˜a probabilità è un numero che varia


tra 0 e 1 ( in percentuali tra o e
100)

)"* , . Se l¶evento è impossibile


la probabilità è zero

)"* , - Se l¶evento è certo la probabilità


che si verifichi è 1
Se E indica un dato evento, l¶evento che non si
verifica si definisce (  ! !  0
˜a probabilità di un evento si indica con
P(E) = p e P(Ē) = q;

Tra i due eventi esiste la seguente relazione:

)"* , - 1 )Ē* , - 1 2 , 

con  3 2 , -
 h     ( 

· Dn evento casuale che può essere suddiviso in eventi


elementari (semplici) è un (  !4

· —ue o più (  si dicono !  se il verificarsi


di uno di essi non esclude il verificarsi dell¶altro (o degli
altri);

· —uo o più (  si dicono   se uno di essi


deve obbligatoriamente verificarsi;
      h 2  
· Secondo la    h 2  :
˜a     di un evento è la frequenza relativa con
cui l¶evento si verifica in una lunga serie di prove ripetute
sotto condizioni simili.

· Secondo la     :


se un evento può presentarsi in K modi su un totale di N
modi possibili ugualmente verosimili (con la stessa
probabilità di verificarsi), allora la     di
successo risulta essere P = k / N
ÿ 
|l lancio di una moneta ha come possibili risultati: Testa,
Croce. Qual è la probabilità che esca testa?

P(E) = P(Testa) = 1 / 2
P(E) = P(Testa) = 1 ± P(Ē) = 1 - P(Croce) = 1 / 2

ÿ  
Nel lancio del dado la possibilità che esca la faccia 3 è
data dalla probabilità dell¶evento pari a :

P(E) = P(3) = k / N = 1 / 6 = 0,166


N = 6 sono tutti i casi possibili
E = evento faccia 3 del dato
K = quante volte può presentarsi il 3 = 1 volta
" ||$&5|#| | $$||%
Si definisce          l¶insieme
delle probabilità associate a tutti i possibili eventi
casuali di uno spazio campione.

ÿ  
    

  


 


 
  
  
 
 



   

 
  


˜e distribuzioni di probabilità sono suddivise in due


gruppi:
Î Per variabili discrete
º   
  ! " 
#
Î Per variabili continue
º   
  ! $ 
$ 



 !!

%& #
'       6
||$&5|#" $|#
|"

Dn evento si verifica con probabilità


P(E) = p
oppure non si verifica con probabilità complementare
P(Ē) = 1- p = q
Sotto il vincolo p+q=1

Considerando N ripetizioni (³prove´ o ³tentativi´)


indipendenti tra loro di uno stesso evento, per conoscere la
probabilità dei singoli risultati si utilizza la distribuzione
binomiale
||$&5|#" $|#
|"
˜a probabilità di un evento che si verifica k volte (esattamente k
successi) su N prove, indipendenti tra loro, si calcola utilizzando la
distribuzione binomiale:
  ù 6ù
   ù Ñ    
ù 
   è il  hh   !  6 indica il
 numero di volte con cui si può
ù  ù 6 ù Ñ verificare l¶evento

  6Ñ  6 Ñ  6 6ÑÑ


7 si legge 8 h  9

  ù

ù  Ñ     6ù

ù  ù  ù 
" !  :
Si lancino due monete separatamente. Qual è la
probabilità che esca testa alla seconda moneta
lanciata?

· CAS| POSS| |˜|: TT; CT; TC; CC n=4


· CAS| FAVOREVO˜|: TT; CT k=2
· p = 0,5 q =0,5
  

          Ñ   Ñ  Ñ   Ñ 
    6 Ñ
     
Ñ   Ñ  Ñ   Ñ 
  Ñ   Ñ

6*(0,5)²*(0,5)² =6*0,25*0,25= 6*0,0625 = 0,37

Abbiamo il 37% delle possibilità


" !  ;
Sapendo che la probabilità che un neonato nasca di
sesso maschile è 0,52. Qual è la probabilità che una
famiglia con tre figli abbia 1, 2, 3 o nessuna femmina?
P(F) = p = 0,48 P(M) = 1 ± p = q = 0,52

· P(Nessuna F) = 0,14
· P(1 F) = 0,38
· P(2 F) = 0,35
· P(3 F) = 0,11

  ù 6 ù

ù   Ñ    
ù  ù ù 

       
 
Ñ  Ñ 6    
Ñ Ñ 6   
Ñ  Ñ 6    
Ñ Ñ  6
     
       
˜a somma delle quattro probabilità deve risultare uguale a 1
    h    ! 

· ˜a forma della distribuzione binomiale a parità di N,


dipende dalla probabilità dell¶evento p.

· Nel caso particolare di p = q = 0,5 la curva della


binomiale si distribuisce simmetricamente rispetto alla
media.

· |n particolare in       !  ha

Î  !   ) (  *   


Î   (      
Rh   %  !  ;
$
  = x = 1,92;  = s = 0,99

Distri uzione di pro a ilit
0,5

0,4 
0, 8

0, 5

 $ $
0, x-s x+s


0,2

ro a ilit


 0,14
0,11
0,1

0,0 
0 1 2

Numero di fi lie
$
=1,92

NOTA: ˜a curva non è simmetrica rispetto alla media perché p=0,48 e q=0,58 sono diversi da 0,5
'       6
||$&5|#" #
"    

· ˜a distribuzione normale può essere immaginata come


una distribuzione binomiale, che per un numero infinito
di prove diventa continua.
R
' 

 
  
 

' 
 

G


  
  


º




   #

· E¶ ritenuta la distribuzione più importante nell¶analisi


statistica perché permette di stabilire la probabilità di
riscontrare valori entro un determinato intervallo.
||$&5|#" #
"
Si consideri una grandezza , rilevata infinite volte, si
otterrà un insieme di misure più o meno scostate dal
valore vero della media ȝ (per effetto dell¶errore o della
variabilità).

Si osserva che gli scarti dal valore vero (x-m), uguali ma


di segno opposto, hanno la stessa probabilità di
verificarsi.

Secondo le leggi probabilistiche è più probabile trovare un


unità con valore vicino alla media. Pertanto maggiore è
l¶ampiezza dello scarto e minore sarà la probabilità di
riscontrare un valore molto distante dalla media.
Supponendo che la maggior parte dei soggetti presenti un
valore intorno al valore medio ȝ e la frequenza dei soggetti
decresca nelle code della distribuzione, quanto più si
allontana dalla media.

Graficamente un fenomeno
i #!)<4=*
che si distribuisce come
una !  !   <
 (     =
si rappresenta come in
figura.

˜a h          6  
di una distribuzione  6 
normale è
 Ñ
 
   
|"%" &#5|#"
R&|#
˜a funzione gaussiana può essere applicata se si conoscono
i parametri della popolazione: il valore vero della !   del
carattere < e la  (     =

˜a distribuzione normale ha una h!  !  ed è


 !!   rispetto al valore della media ed  ! con
media, moda e mediana coincidenti

Per valori di + ’ e - ’ la curva     !   .,


cioè la curva si avvicina sempre più all¶asse delle ascisse
senza mai raggiungerlo
Al variare della media la distribuzione si sposta lungo
l¶asse delle ascisse; in base alla deviazione standard si
allarga e si stringe l¶ampiezza della ³campana´ creando
due punti di flesso

|l valore della deviazione standard assume il ruolo di


unità di misura lungo l¶asse delle ascisse da

)! 1 > =*4 ?)! 1 =*4 !4 )! 3 =*4 ?)! 3 > =* @

%  !    h   %  


  ( per tutto il dominio della variabile x (+’; -’) è
uguale a 1, cioè          -..A 
  2  !     %  (
 ) B! / B / B 3! *
||$&5|#" #
" #|55

 h   ! h      h     


     h!   (  

  5  ( (  
6


     !     ( 

 6
 Ñ   

C  !!     %     ) , .   B ,
<*     h   , -  , 3-
&        
Qualsiasi distribuzione normale può essere standardizzata con
una curva che abbia media ȝ = 0 e deviazione standard ı = 1

Per questa distribuzione esistono tabelle predisposte che


permettono, con semplici calcoli, di stabilire la probabilità di
osservare casualmente valori entro un intervallo prescelto

˜a tabella maggiormente adottata segnala l¶area delle due code


simmetriche rispetto al valore z
        56
Area al di la di z nelle due code della distribuzione ( V = valore di tabella)
Generalmente, in statistica, si utilizza l¶intervallo che comprende il 95%
dei casi che corrisponde a (± 1,96 < z < + 1,96 ).

95%

2,5%
2,5%

Z=±1,96 Z=+1,96

'| #"'| " ||$&5|#" 5


5   !       %  ( )43*
%  ( )4 3* )       *
1 0,68 § 68% 0,32 § 32%
-DE 0,95 § EFA 0,05 § 5%
GDFH 0,99 § EEA 0,01 § 1%
"   
Qual è la probabilità che un individuo, estratto a caso da una
popolazione con peso medio 72 kg e deviazione standard 25 kg,
pesi tra i 60 e 80 kg?
· ˜


 (
 
 
 
(      !!


  !  


 !!


 6 Ñù
 6 Ñù
    6

   · 
ù ù
· )
 ' 




  ! !  
*


  

!+,- .
 
 
 

!+./ 0,1(  
 
 
* 





ù 
 ù Ñ
   
 Ñ

6
 Ñ 
   Ñ
       
  6    6   = š