Sei sulla pagina 1di 21

|  

     

 | ||  
   
      |     !   "     

A.A. 2006/2007
#|$% % &$|' || (%
V Per ºº  o  "  si intende l¶insieme di tutti
gli elementi che hanno in comune il carattere che deve
essere esaminato.

V ëe      sono i singoli elementi, che


costituiscono la popolazione, deputati a fornire le
informazioni grezze.
V ëa scelta di una popolazione statistica oggetto di studio
viene definita dallo sperimentatore seguendo un criterio
oggettivo per assegnare o meno un elemento alla
popolazione di interesse (ºº  )  -.
K   

  

 



 

   

 
  

 






 


 

 


V olte ricerche indagano su un ridotto numero di


osservazione (  *º  - e successivamente
giungono a conclusioni generalizzabili.
#|$| |$|% % |$|$|%
V _na ºº  si definisce  se costituita da un
numero finito di unità, cioè si è in grado di identificare
tutte le unità.

V _n ºº  è definita  se è costituita da un


numero illimitato di unità, cioè non si è in grado di
identificare tutte le unità che costituiscono la
popolazione.

V —ifficilmente una popolazione statistica coincide con la


popolazione anagrafica: a causa di problemi
organizzativi, economici e di tempo diventa dispendioso
far riferimento alla totalità delle unità di una popolazione.
'|$%%$# || 
V '      è il procedimento induttivo, che
avvalendosi del calcolo delle probabilità, consente di
estendere all¶intera popolazione le informazioni fornite da
una campione

V ëe ricerche in campo biomedico vengono sviluppate


attraverso indagini campionarie. Per la scelta del
*º  devono essere rispettati i criteri di   e
ºº   " 

V uoncettualmente si definisce  *º    la


differenza esistente tra le caratteristiche del campione e
quelle vere della popolazione bersaglio

V Ksistono tecniche di campionamento in grado di prevedere


e controllare l¶errore migliorando la ³bontà´ del campione
 *         *º   

  
*º  
#|$% 
|$%

  "*  
)  

|  

%| %   
|
%
#|$% 
|$|%
 
  

 
 
  
 

|l processo inferenziale, nel caso più


semplice, è indirizzato a stimare i
parametri della popolazione attraverso
le stime campionarie della tendenza
centrale e della dispersione.
|
+,| %| *    *   

%| ºº  *º 

  - ÿ  *. 
 "   / ÿ  
 
$*   4

0| $%0| % ||+&#|$% #


#   *º       '  "
'  " 12 34 12 34 1     )  4
5 6789 : 89; 67< : <;
57=8 67=> : =>; 676> : >;
7>9 67== : ==; 6765 : 5;
% *º  5
ëa variabile altezza di una popolazione segue la
distribuzione normale, un individuo scelto a caso da
detta popolazione avrà, con il 95% di probabilità,
un¶altezza compresa tra l¶intervallo
ȝ ± 2ı e ȝ + 2ı
Se i parametri della variabile altezza sono noti:
ȝ = 174 cm ı = 11 cm
si può dire, con una probabilità circa del 95%, che un
individuo avrà un¶altezza localizzata tra 152 e 196 cm

     V  -
    -
Per conoscere l¶altezza dei giovani di una certa
età, si misura la statura solo di un campione di
individui e se ne calcola la media aritmetica 

Presumibilmente il valore rilevato si scosta dalla


media vera della popolazione; ed è intuitivo che
la media campionaria tenderà ad avvicinarsi
alla media vera con l¶aumentare della
numerosità del campione, fino a coincidere il
numero di unità rilevate al numero delle unità
che costituiscono la popolazione.
ëa differenza tra la media stimata ù e quella vera ȝ
rappresenta '  *º    (quanto più
numeroso sarà il campione tanto più piccolo è l¶errore
campionario che si commette-.

Se da una stessa popolazione vengono estratti infiniti


campioni e per ogni campione vengono calcolate le
stime della media, secondo il teorema del limite
centrale,  *  *º      )  
*   *  *       
?    ºº   "    
  *   uguale a



uon che indica la *     *º  .
|
 |$%0% | &$
%|
Sfruttando le proprietà della distribuzione normale
standardizzata Z, si può facilmente supporre che la
media ȝ della popolazione sia compresa con la
probabilità del 95% nell¶intervallo definito dai valori

 
    V 
4 4
e nel 99% dei casi nell¶intervallo

 
     V 
4 4
Purtroppo la deviazione standard ı della popolazione
è quasi sempre ignota, per cui occorre far riferimento
la stima campionaria s.

Ne consegue che la media della popolazione ȝ è


compresa nell¶intervallo:

 
    V 
 

 
    V 
 

a seconda della fiducia probabilistica prescelta.


|$%0 | $|%$#
Si parla di  "     | per definire
entro quali valori è localizzata la media vera in base
alle stime campionarie


     ˜ 



   ˜  


1 - Į = 95%
1 - Į = 99% livello di confidenza
´uando  @    "     /, si
stima il valore s del campione.

V $    *º  *   1$ A 56  4


per il calcolo degli intervalli di confidenza può essere
presa in considerazione la distribuzione normale
perché solo per N molto grande la media campionaria
si distribuisce come una normale.

V $    º  *º  1$ A <6  4


per il calcolo degli intervalli di confidenza si fa
riferimento ad una famiglia di distribuzioni definita:
  )       
||+&#|$%
%  
V ëe distribuzioni della t di student
differiscono tra loro per i  
 )  1$ B 54
V |    )  corrispondono
ad N (la numerosità del
campione- meno il numero dei
parametri stimati per campione.
V ëa distribuzione t è una
distribuzione di probabilità
teorica, della quale esistono
tabelle predisposte con i valori
critici.
% *º  

|n un campione di 14 misure a carattere quantitativo si


ottiene  = 41 e s = 7 con 13 gradi di libertà. ´ual è
la media della popolazione al livello di confidenza del
99%?



 
!
 "

#
  
!

 
"
" 

 $ 

%
  &

  ˜      ˜     ˜ 
4 




 

 

''(


$$ 
!
 
 

)#*
+
 +
,-.
|
 |$%0% | &$
%C&%$# % %$&%
Anche la  * *º        ?    "
(o º   - viene utilizzata a scopo inferenziale per
calcolare gli intervalli di confidenza della frequenza del
fenomeno nella popolazione
uon  che indica la frequenza relativa della popolazione
e ıP la deviazione standard

'  "      =>; è

 -
  ˜ 
4
'  "      ==; è
 -
  ˜ 
4
% *º  <
Nella revisione di una rivista a carattere biomedico si
riscontra che in un campione di 147 articoli, 64 presentano
conclusioni statistiche non compatibili con i dati presentati.
´uale percentuale di articoli pubblicati si presume abbia,
al 95% di probabilità, una statistica corretta?


"/ 
 

 
   
$ 
  

 
  

 
  o  


0

 

 


 " 



 

 "  

 

 
 
  -    -
  ˜      ˜     ˜ 
4 

 
 




 "  

'*(&



 

 

 

$ 
  

 

 


*1&,(


&(
%% |#|  5
V |

 

-#'
  


 


 $ 


"
  " 
!

-'

  

 
 
 

2
  

3
 

 "  

 


 

'*(

''(

V N = 139; X = 19 minuti; S = 7 minuti;


Z95% = 1,96; Z99% = 2,58;


   ˜   ˜     ß


 Ô  Ô  

  


   ˜    ˜    ß


  Ô Ô  
  
wK ||uA —KëëK |POTKS|
Si vogliono confrontare, ad esempio, i risultati
che si ottengono somministrando due diversi
farmaci a due gruppi di pazienti affetti da una
determinata malattia, nell¶ipotesi di omogeneità
dei pazienti per età, sesso, stato di salute ecc..
Possiamo accettare l¶ipotesi, detta nulla o di
base, che il farmaco A è migliore del farmaco B?
Secondo la statistica inferenziale si parte
dall¶ipotesi di base, tramite un test statistico,
fissato il livello di probabilità, si accetterà o si
rifiuterà l¶ipotesi di base
—ue sono le principali aree dell¶inferenza statistica:

V ëa stima dei parametri


K  




 


"" 

   


 
 

  

V ëa verifica delle ipotesi


K  

  



  
" 

!
4
""

  

 
 
""