Sei sulla pagina 1di 86

Università degli Studi

e Campus

Facoltà di Scienze Psicologiche


Corso Psicometria I

Relatori

Prof.ssa Simona Musacchio
Ing. Gianluca Pizzuti
Introduzione

 Cos' è la statistica?
 Definizione Trilussa (nota di colore)
 La  statistica  fornisce  gli  strumenti  per 
analizzare i fenomeni collettivi (caratteristiche 
fisiche di un gruppo di soggetti).

Statistica descrittiva Statistica inferenziale
 Popolazione globale/campione  Campione
Descrizione  Stima delle caratteristiche
 Sintesi numerica  Sintesi numerica
 Analisi dei risultati  Analisi dei risultati
Campione statistico/Popolazione
 Il  campione  statistico  è  un  sottoinsieme  dell'universo  di 
riferimento,  caratterizzato  da  attributi  comuni  alla 
popolazione. 
 La  popolazione  è  l'insieme  dei  soggetti  appartenenti  alla 
categoria oggetto di studio.
Fasi dell'analisi statistica

1
Definizione obiettivi Rilevazione

Analisi statistica

Elaborazione dati
Applicazione degli 
esiti dell'analisi
Interpretazione dati
Fasi dell'analisi
statistica:definizione obiettivi

 Individuazione obiettivi
2  Delimitazione  della  ricerca  nel  tempo  e  nello 
spazio
Fasi dell'analisi statistica:rilevazione

 L'osservazione  dei  fenomeni  mediante  opportuni 


tecniche e strumenti
 L'oggetto della  rilevazione  può  essere  l'intera 
popolazione o un campione di essa rappresentativo
3  Chi può fare la rilevazione?
 Enti pubblici (Istat) ed Istituti privati
 La  rilevazione  si  effettua  mediante  formulari 
strutturati ai fini dell'analisi
Fasi dell'analisi
statistica:elaborazione dati
 Sintesi  dei  dati  più  significativi  mediante  l'utilizzo 
di opportuni indici 

4
Fasi dell'analisi statistica:presentazione
ed interpretazione dei dati
 Rappresentazione dei dati mediante tabelle, grafici 
ed indici
 Spiegazione dei risultati

5
Fasi dell'analisi statistica:applicazione
degli esiti dell'analisi
 La statistica non è fine a se stessa

Economia
Demografia
Statistica

..
..
..
..
..
Medicina Output
6
Indagine statistica: definizione
Il carattere oggetto di studio
1
La scala di misurazione del carattere
2
L'universo delle unità statistiche (popolazione)
3
4 L'ampiezza della rilevazione (totale o parziale)
Unità statistica :definizione

 Unità  statistica  :  elemento  base  della  popolazione  sul 


quale viene rilevata la caratteristica oggetto di studio
●Unità semplici (persona, abitazione)
●Unità composta (famiglia, edificio)
●Unità  complesse,  insieme  di  unità  semplici 
differenti,considerati  nella  loro  globalità 
(rapporto coniugale, rapporto di lavoro)
      
Carattere :definizione

 Carattere  :  elemento  che  descrive  una 


popolazione od un campione
 Modalità  :  valori  assunti  da  un  carattere  su 
un'unità statistica
 Tipologia carattere 
●Qualitativo  o  Mutabile  (rappresentato 
mediante attributi)
●Quantitativo (rappresentato mediante numeri)
      
Variabile :definizione

 Variabile :  rappresentata mediante numeri
 Modalità  :  valori  assunti  da  un  carattere  su 
un'unità statistica
 Tipologia carattere 
●Qualitativo  o  Mutabile  (rappresentato 
mediante attributi)
●Quantitativo (rappresentato mediante numeri)
      
Variabili: tipologia

 Variabili Qualitative
● Modalità nominali (es. stato civile)
● Modalità ordinali (es. livello di istruzione)
 Variabili Quantitative
● Valori numerici (es. numero di figli)

 Variabili indipendenti (manipolata dallo sperimentatore)
 Variabili dipendenti (misurate dallo sperimentatore)
 Variabili di disturbo
Variabili: quantitative

 Variabili Quantitative
● Continue (numeri reali)
● Discrete (numeri interi)
Esempio di variabili dipendenti ed
indipendenti
 30 adolescenti vengono convocati per un test di memoria, a 15 di loro, 
prima  di  iniziare  la  prova  viene  detto  che  si  tratta  di  un  compito 
particolarmente difficile, agli altri 15 non viene data alcune indicazione. 
Indicare la variabile indipendente e quella dipendente.

 VARIABILE INDIPENDENTE?
 Informazione sulla difficoltà della prova 
 VARIABILE DIPENDENTE?
 Punteggio test di memoria
LA MISURAZIONE: definizione
 Misurazione
● Assegnare  valori  numerici  ad  eventi/oggetti  secondo  le 
proprietà del sistema numerico (S.I.)
 Scale di misurazione
● Scala  nominale  (variabili  o  mutabili;  i    numeri  hanno 
valore di etichetta). 
 Operazioni di misurazione
– Raggruppamento in classi
– Conteggio delle frequenze delle classi

● Scala  ordinale  (ordinamento  secondo  una  specifica 


caratteristica)
 Operazione di misurazione
– Confronti di ordine
– Relazione di minore o maggiore
LA MISURAZIONE: le scale ad
intervalli
 Scale ad intervalli
● Caratteristiche
 Fondo scala pari a 0
 Unità di misura convenzionali
 Misurano la differenza tra eventi/oggetti
 L’ampiezza dell’intervallo è costante
 Operazioni di misura: addizione e sottrazione, trasformazione 
dei numeri (normalizzazione)

 Esempi:
● Scala  Celsius,  Kelvin,  Q.I.,  Test  di  atteggiamento  e  di 
personalità
LA MISURAZIONE: le scale a rapporti
 Scale a rapporti 
● Caratteristiche
 Lo 0 equivale ad assenza di proprietà
 Non assumono valori negativi
 Operazioni di misura: addizione e sottrazione, trasformazione 
dei numeri (normalizzazione), moltiplicazione e divisione

 Esempi:
● Distanza, statura, peso
Output delle misurazioni: Dati

Variabili qualitative Frequenza
Misura

Variabili quantitative Punteggio Dati


Le Frequenze

 Definizione:
● è il numero delle volte secondo cui una modalità di una 
variabile si presenta nella popolazione osservata
 Frequenze classificazione:
● Cumulate  (somma  progressiva  delle  frequenze  della 
distribuzione)
● Relative  (frequenza  della  modalità/numero  totale  delle 
osservazioni)
● Percentuali: freq.relat*100 (%)
Esempio
MASCHI 28
FEMMINE 22

Maschi 28 Femmine 22
Fm = 28 F f = 22
Il totale delle osservazioni N=50
Le frequenze relative dei maschi 
sono F. rel=28/50=0,56
Le frequenze percentuali dei 
maschi sono F%0 28/50x100=  1
56%
Le Classi

 Definizione:
● è un raggruppamento di dati in definiti intervalli
● Ogni  intervallo  è  delimitato  da  un  estremo  inferiore  ed 
estremo superiore
● La differenza tra sup­inf= ampiezza di classe
 Regole di costruzione delle classi:
● Non meno di 5 e non più di 20
● Intervalli della medesima ampiezza
● Ampiezze preferite 3, 5, 10 o multipli
● Intervalli mutuamente esclusivi (es. 0­2, 3­5, 6­8….)
● Punto  medio  centrale  =(sup+inf)/2  ­>costruzione 
poligono di frequenza
Le Classi: rappresentazione
grafica
 Definizione:
● Spesso  per  avere  una  visione  d'insieme  di  una 
distribuzione  di  frequenza  si  usa  rappresentarla  su 
grafici. 
● istogramma:  in  cui  sull'ascissa  sono  riportate  le 
modalità della distribuzione e sulle ordinate le rispettive 
frequenze assolute o relative.

 Nel  caso  di  distribuzione    in  classi:  in  ascissa  vengono 


rappresentati  i  limiti  degli  intervalli  e  in  ordinata  le 
frequenze.
Le Classi: rappresentazione grafica-
Istogramma

90
80
70
60
50
Est
40
Ovest
30 Nord
20
10
0
1° 2° 3° 4°
Trim. Trim. Trim. Trim.
Le Classi: rappresentazione grafica-
Poligono di frequenza
 Definizione:
● Poligono  di  frequenza:  in  cui  sull'ascissa  sono  riportate  le 
modalità ( il valore medio di ciascuna classe )e sull'ordinata 
le  frequenze  relative  cumulate  e  i  punti  trovati  si  uniscono 
con una spezzata

● Il  poligono  di  frequenza  si  utilizza  quando  il  ricercatore  è 


interessato  a  rappresentare  nello  stesso  grafico  più 
distribuzioni di frequenze relative a gruppi diversi.
Le Classi: rappresentazione grafica-
Poligono di frequenza

Poligono di frequenza

100

80

60 maschi
fr

40 femmine

20

0
1° Trim. 2° Trim. 3° Trim. 4° Trim.
Statistica descrittiva

 Definizione:
● I  dati  ottenuti  durante  uno  studio  empirico  (dati  grezzi) 
possono  essere  sintetizzati  in  una  forma  analizzabile. 
L’ampio  numero  di  osservazioni  si  può  ridurre  in 
numero  più  piccolo  di  indici  statistici  (statistiche 
descrittive). 
● Le principali statistiche descrittive sono:

 Misure della tendenza centrale: moda, mediana, media
 Misure della variabilità:range, differenza interquartile, 
deviazione standard e varianza.
Statistica descrittiva-Moda

 Definizione:

 La moda è rappresentata dal valore più frequente della 
distribuzione osservata. Può essere espresso in ogni scala 
di misura (è l’unico indice di tendenza centrale per la scala 
nominale) Quando la moda è unica si parla di distribuzione 
unimodale, ma se ci sono due valori ugualmente frequenti 
la distribuzione è detta bimodale.
Statistica descrittiva-Moda

 Esempio
● 10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 15, 19.   N = 13

● Il  15  si  presenta  più  frequentemente,  quindi  è  il  valore 


modale   La distribuzione è UNIMODALE

 Esempio
● 10, 15, 13, 4, 9, 8, 15, 7, 13, 15, 2, 13, 19.   N = 13, 15

● Il  13  ed  il  15  si  presentano  più  frequentemente,  quindi 
sono i valori modali   La distribuzione è BIMODALE
Statistica descrittiva-Mediana
 Definizione:
 MEDIANA  −E’  rappresentata  dal  valore  che  occupa  la  posizione  centrale  della 
distribuzione (valore che divide in due parti uguali la distribuzione, al di sopra 
e al di sotto del quale si trovano il 50% dei casi)
 la determinazione della mediana è diversa a seconda che sia n dispari o pari.
 Se n è dispari, la mediana e l'intensità individuata dal posto centrale:
C = (n+1) / 2

 Ad esempio, la mediana dell'intensità 3, 15, 9, 2, 6,12, 5, si ottiene innanzitutto 
ordinando la serie: 2, 3, 5, 6, 9,12,15.
 Siccome le intensità sono sette, numero dispari, il posto centrale è unico ed è 
pari a:
 
C = (7+1) / 2 = 4 (posizione della mediana)

 La  mediana  è  quindi,  l'intensità  individuata  dal  quarto  posto,  vale  a  dire  che 
essa è uguale a 6.
Statistica descrittiva-Mediana
 Se  n  è  pari,  la  mediana  è  data  dalla  semisomma  delle  intensità 
corrispondenti ai due posti centrali:
 
C = n / 2                       C = (n / 2) + 1
 
 Ad esempio, la mediana delle intensità 7, 16, 2, 3, 9, 12, 15, 5, si ottiene 
innanzitutto ordinando la serie: 2, 3, 5, 7, 9, 12, 15, 16. (n=8)
 Visto che si tratta di 8 numeri, numeri pari, i posti centrali sono due e 
sono:
C = 4  (7 )      e          C = 5 (9) 
(posizioni della mediana)

 Pertanto, la mediana è dalla semisomma delle intensità individuate dal 
quarto e dal quinto posto, vale a dire che essa è uguale a:
 
Me = (7 + 9) / 2 = 8
Statistica descrittiva-Media
 MEDIA (è il centro di gravità della distribuzione)       
● La  media  aritmetica  è  data  dalla  somma  delle  misure  osservate 
diviso il  numero delle osservazioni fatte (N)
● Si indica con M per i campioni e con μ per le popolazioni
● Può  essere  calcolata  su  scale  di  misura  ad  intervalli  e  a  rapporti 
(scale METRICHE)

 La  media  aritmetica  è  uguale  alla  somma  dei  termini  divisa  per  il  loro 
numero. 
 Se  si  indicano  gli  n    termini  di  una  serie  con  x1,  x2,  x3…..  xn,  la  media 
aritmetica sarà pari a:M = (x1 +  x2 +  x3 + ….. + xn )  / n
 Se  ad  esempio  avessimo  i  valori  1,  2,  3,  7,  10,  13,  specificano  la 
formula sopra enunciata, si ottiene:
M = (1+2+3+7+10+13) / 6 = 36/6 = 6
 La formula può essere meglio come:M = Σ Xi/N
     Oppure  M = Σ fi Xi/N
 (in  questo  caso  si  moltiplica  la  frequenza  di  ogni  classe  per  il  valore 
medio di ogni classe) 
Statistica descrittiva-Media-
Esempio
 M = Σ fi Xi/N
 Valore=193/10
VOTI FREQ. VALORE*FREQ.

18 2 36
1

19 3 57

20 5 100

TOTALE 10 193
Statistica descrittiva-Indici di
posizione
 Definizione:
 Gli indici  DI POSIZIONE indicano la posizione che un valore occupa all’interno di una distribuzione.

● QUARTILI
● DECILI
● PERCENTILI

● I percentili o quantili sono le intensità che dividono una distribuzione in due parti, lasciandola da 
una parte x% dei casi e dall’altra parte il rimanente (100 – x%).
I quantili si dicono quartili se dividono la distribuzione in 4 parti uguali, tali che:
 il primo quartile lascia alla sinistra il 25% dei casi e alla sua destra il rimanente 75 % dei casi;
il secondo quartile, che coincide con la mediana lascia alla sua sinistra il 50% dei casi ed alla 
destra il rimanente 50%; il terzo quartile lascia alla sua sinistra il 75% dei casi ed alla sua destra 
il rimanente 25%.

       1° quartile    2° quartile     3° quartile
__________|__________|___________|__________
 
Per calcolarli occorre:
1.     Ordinare in senso crescente la distribuzione
2.     Calcolare le frequenze cumulate
3.     Calcolare la posizione del quartile con le seguenti formule:
1° quartile  pos Q1= ((n+1)/4) *1° quartile  pos Q2= ((n+1)/4) *2 3° quartile  pos Q3= 
((n+1)/4) *3 
Statistica descrittiva-Indici di
posizione-Quartili
 Esempio
● Pos Q1=n+1/4*1= 101+1/4*1=101+1/4*1=25.5
● Corrisponde alla seconda posizione

Freq. F.cum.
1 10 10
2 21 31
3 20 51
1
4 26 77
5 20 97
6 4 101
101
Statistica descrittiva-Indici di
posizione-Decili, centili o
percentili

 Esempio:
● Decili=  nove  punti  che  dividono  la  distrib.  In  10  parti.
(pos D1= n+1/10*1;pos D3=n+1/10*3)
● Percentili=  99  punti  che  dividono  la  distrib.  In  100  parti 
(pos.P1= n+1/100*1)
Statistica descrittiva-Indici di
dispersione o variabilità
 Definizione:
● Le medie facilitano la comprensione della frequenza dei 
fenomeni  collettivi.  Per  una  più  esatta  conoscenza  di 
essi occorre però anche studiare la loro variabilità, cioè 
la  capacità  di  assumere  differenti  valori  quantitativi  in 
un  certo  periodo  di  tempo,  o  in  seguito  all’influenza  di 
un altro o altri fenomeni.
Statistica descrittiva-Indici di dispersione o
variabilità-Campo variazione
 Campo di variazione
 E’ una misura della variabilità dei dati. Esso si ottiene dalla differenza 
tra il valore massimo e quello minimo delle intensità di un fenomeno.

CV = Xmax­Xmin

 Ad esempio se le intensità di un dato fenomeno sono le seguenti:
 
29 24 20 28 22 22 23

 Il campo di variazione sarà:
 29 – 20 = 9
Statistica descrittiva-Indici di dispersione o
variabilità-Differenza Interquartile

●Definizione

 Differenza  interquartile:  è  un  indice  più  robusto  ai  valori 


anomali rispetto al campo di variazione. 

 IQR=Q3­Q1
Statistica descrittiva-Indici di
dispersione o variabilità-Varianza
●Definizione
 Scostamento semplice medio (SSM)
è la differenza tra un singolo punteggio e il punteggio medio
 Devianza è la somma degli scarti elevati al quadrato di ciascun 
punteggio dalla media
 Varianza: è la media dei quadrati degli scostamenti dalla media 
di tutti i soggetti e indica la distanza media di ciascun soggetto 
dalla media del campione.
 Si indica con s2.
 Scostamento quadratico medio o deviazione standard:
è la radice quadrata positiva della varianza 
Statistica descrittiva-Indici di
dispersione o variabilità-Varianza
●Esempio DATI  MEDIA SCARTI 
DALLA 
SCARTI 
QUADRATI
GREZZI MEDIA

1 4 7 ­3 9
2 5 7 ­2 4
3 6 7 ­1 1
4 7 7 0 0
5 8 7 1 1
6 9 7 2 4
7 10 7 3 9
49 0 28
Statistica descrittiva-Indici di dispersione o
variabilità-Deviazione Standard Calcolo

●Calcolo
 MEDIA= SX/N= 49/7=7

 DEVIANZA= sommatoria degli scarti al quadrato= 28

 VARIANZA= sommatoria degli scarti al quadrato/media=28/7=4

 DEVIAZIONE STANDARD=la radice quadrata positiva della 
varianza= 2 
Statistica descrittiva-Standardizzazione
delle misure

●Definizione naif

Per  poter  confrontare  in  maniera  adeguata  i  punteggi  ottenuti 


da  soggetti  diversi  in  situazioni  diverse,  non  possiamo 
accontentarci  di  guardare  il  punteggio  grezzo,  ma  dobbiamo 
fare  un  confronto  con  dei  punteggi,  detti  standardizzati,  che 
possano essere un riferimento generale.
Statistica descrittiva-Standardizzazione
delle misure

Per effettuare il confronto, si usano delle trasformazioniche 
rendono confrontabili tra loro distribuzioni diverse.
 
2 tipi di trasformazioni:

● punti Z (in questo caso dobbiamo avere come riferimento la 
media e la deviazione standard)
● percentili, decili, quartili (riferimento posizione nel gruppo)
Statistica descrittiva-
Standardizzazione delle misure-Z

 Formula Z transform

Xi − X
Zi =
s
Statistica descrittiva-
Standardizzazione delle misure-Z

Esempio

 Un bambino di 5 anni ha un punteggio 20 in test di lettura.
Tuttavia, possiamo domandarci: la posizione nel test del  bambino di 
5 anni è migliore rispetto al gruppo di 5 anni. 
Confrontiamo il punteggio del bambino con la media del suo gruppo 
(media=10;d.s.=5)
Otteniamo che: il bambino è migliore rispetto alla media della classe.
Standardizziamo il punteggio del bimbo (standardizzare una misura 
significa riferire la misura stessa a una scala standard con media e 
varianza note. La scala più comune è quella  della standard o z che 
ha la media  0 e varianza 1.
Statistica descrittiva-
Standardizzazione delle misure-Z
Esempio
 Tale  trasformazione  si  ottiene  trasformando 
una  serie  di  punteggi  xi  in  punteggi  zi  con  la 
seguente  formula:
X i − X 20 − 10
Zi = = =2
s 5
 Il  bimbo  sta  2  deviazioni  standard  sopra  la 
media.
 Se la media del suo gruppo fosse stata di 25:
20 − 25
Zb = = −1
 La  prestazione  del  bimbo  è  inferiore  alla  5
media del gruppo.
Statistica descrittiva-Standardizzazione
delle misure-Percentili

 Il  percentile  è  il  valore  al  di  sotto  del  quale  si  trova  una  certa 
percentuale di casi di una distribuzione.

 Esempio:il 94 percentile è il valore al di sotto del quale si trova il 
94% dei casi di una distribuzione.

 Ad  esempio  si  considera  la  distrib.  delle  medie  dei  voti 
d’esame,  il  voto  29  corrisponde  al    94°  percentile  della 
distribuzione
Statistica descrittiva-Standardizzazione
delle misure-Percentili-Calcolo

 Il calcolo dei vari percentili è analogo a quello per il 
calcolo della mediana, dividendo la numerosità totale 
invece che per due, per il numero di classi che sono 
individuate (10 per i decili, 100 per i centili, ecc.).

 Per i decili il primo decile sarà dato dal valore 
corrispondente alla posizione n/10, il secondo dalla 
posizione 2*n/10,  il quinto da 5*n/10 (=nl2=Mediana),
…….
 il decimo da 10*n/10 (=n).
Statistica descrittiva-Standardizzazione
delle misure-Percentili-Calcolo
 Si esprime il punteggio di un soggetto in relazione alla posizione 
occupata dal soggetto(So) nella distribuzione (cioè nel gruppo di cui 
fa parte). In particolare, si calcola la sua posizione come se il 
gruppo fosse formato da 100 soggetti(Ss).
 Procedura (simile alla mediana):
– si ordinano i Ss (da quello che ha preso il punteggio più
basso a quello che ha preso il punteggio più alto)
– si vede che posizione occupa il So (per es., è il 30° in
un distribuzione di 50 Ss)
– si vede che posizione il So occuperebbe se ci fossero
non 50 Ss ma 100 Ss.
– è logico pensare che se il So è 30° su 50 Ss sarebbe
60° su 100 Ss.
– si dice perciò che il So è al 60° percentile.
Statistica descrittiva-Standardizzazione
delle misure-Percentili-Calcolo
 In altre parole, si fa una proporzione:
30° : 50 = x : 100
x = 30/50 ×  100 = 60°

 Il percentile indica perciò la percentuale di Ss che hanno avuto un 
punteggio minore del So (e, per differenza, la percentuale di Ss che 
hanno avuto un punteggio superiore).

 Un So è nel 25° percentile: significa che sotto di lui c’è il 25% dei 
Ss e sopra di lui il 75%.

 Un soggetto al 50% percentile sta a metà. 
Statistica Inferenziale

 La  statistica  inferenziale  ha  come  obiettivo,  invece,  quello  di 


fare  affermazioni,  con  una  possibilità  di  errore  controllata, 
riguardo la natura teorica (la legge probabilistica) del fenomeno 
che si osserva. 

 La  statistica  inferenziale  è  fortemente  legata  alla  teoria  della 


probabilità.
Probabilità

• La probabilità che si verifichi un certo evento è uguale alla 
frequenza (relativa) con cui l’evento si verifica in un numero di 
prove sufficientemente grande, ripetute nelle medesime 
condizioni.
fA
P( A) = lim
n →∞ n
• P(A) è la probabilità di verificarsi un evento A 
• Lim  limite per n che tende all’infinito ∞ e indica un numero 
molto grande
• fA  frequenza con cui si è verificato l’evento A in un numero di 
prove n  
Probabilità-Posteriori

Probabilità a posteriori: è data dal rapporto tra i risultati 
favorevoli e il totale delle prove effettuate, quando questo 
numero diventa infinitamente grande. Il concetto di 
probabilità a posteriori si riduce in definitiva a quello di 
frequenza relativa di un fenomeno, quando il numero di 
prove è finito (quella sopradetta).

Non è possibile definire la probabilità in base ad un’unica 
prova ma le prove devono essere molte e ripetute.
Es: lanciando un dado 10 volte avremo la seguente 
sequenza (4752928145) la probabilità di ottenere la faccia 
5; basata sulla frequenza relativa in 10 lanci, è di 2/10=0.20
Probabilità-Teorica

Definizione: probabilità a priori o teorica: è il rapporto tra 
numero di casi favorevoli al verificarsi di un evento ed il 
totale degli eventi possibili, supposti equiprobabili. 

Riprendendo il caso del lancio di un dado non truccato, la 
probabilità dell'evento ­   esce 6 è uguale a 1/6.
Probabilità-Concetti generali

 Evento: uno dei possibili risultati di una prova; se la 
prova consistesse nell’osservazione dell’esito del lancio 
del dado, l’evento sarebbe la faccia 5.

 La prob.di A si definisce con P(A), faccia 5.

 Tutte le altre facce esclusa la 5 hanno la prob.P(non A)

P(A) +P(non A)= 1

La somma delle probabilità di tutti gli eventi è uguale a 
1 (probabilità dell’evento certo)
Probabilità-Concetti generali-
Principio della somma
•  La probabilità di verificarsi di due eventi mutualmente 
escludentisi è uguale alla somma delle probabilità di 
verificarsi  dei singoli eventi:

P(A  U   B) = P (A)   +  P (B) 

•  La probabilità che lanciando un dado si 
ottenga l’evento numero dispari (faccia 1,3,5)  sarà 
uguale: P1+P3+P5= 1/6+1/6+1/6=3/6= ½
Probabilità-Concetti generali-
Principio del prodotto
 Definizione:
Quando  due  eventi  si  verificano  simultaneamente  o  in 
successione :
P (A e B)  = P (A)   *  P (B)
  la  probabilità  di  avere  2  con  due  dadi  è  data  dalla  prob.di 
avere 1 con dado e 1 con l’altro.
P (s=2)  = P (1)   *  P (1)= 1/6*1/6 = 1/36
La combinazione 1+ 1 è solo una dei 36 eventi possibili che 
corrispondono  ai  36  diversi  modi  possibili    in  cui  si 
possono  combinare  le  6  facce  del  primo  dado  con  le  6 
facce del secondo. 
Probabilità-Concetti generali-
Probabilità condizionata
 Definizione:
Abbiamo trattato di eventi indip., quando invece si tratta di 
eventi  non  indipen.  Ossia  quegli  eventi  che  il  verificarsi 
dell’uno modifica la prob. del verificarsi dell’altro. 
Ad  esempio  nel  lotto  l’aver  estratto  un  numero  (tra  i  90 
possibili)  modifica  la  prob.  di  estrazione  del  numero 
successivo (1/89)

P (A B)  = P (A)   *  P (B/A)= P(B) P(A/B)
Probabilità-Concetti generali-
Probabilità condizionata

 P (∅) = 0;
 P (Ā) = 1­ P(A), dove Ā è not A
 P (A U B)= P(A) +P(B) ­ P(A∩B)
Probabilità-Concetti generali-
Probabilità condizionata
Tra due eventi A e B può sussistere una relazione per la 
quale, sapendo che una prova ha generato un risultato 
che appartiene a B, si è indotti a modificare la 
valutazione del verificarsi di A. La probabilità dell'evento 
B, dato che si è verificato l'evento A, è il rapporto fra la 
probabilità del contemporaneo verificarsi di A e B e la 
probabilità di A, se questa è diversa da zero.

P ( A ∩B )
P( A B) = ; P ( B ) >0
P( B)

P ( B ∩A)
P ( B A) = ; P ( A) >0
P ( A)
Probabilità-Distribuzione normale
 La  Curva  normale  è  la  curva  continua  rappresentativa 
delle distribuzioni che più frequentemente si incontrano in 
statistica
 E’  simmetrica  e  unimodale.  Media,  moda  e  mediana 
coincidono.  I  valori  si  addensano  attorno  alla  media  (il 
94,5dei  valori  sono  posizionati  entro  i  due  scarti  quadrati 
medi  sopra  e  sotto  la  media.)  Per  descriverla  bastano  la 
media e la d.s.
 Un  solo  valore  appare  con  la  frequenza  massima,  quella 
centrale,  e  sono  tanto  meno  frequenti  quanto  più  si 
allontanano dal valore centrale.  
Probabilità-Distribuzione normale
Probabilità-Distribuzione normale
 Si  applica  a  variab.  Continue  ossia  che  la  funzione  viene 
definita  su  tutto  l’asse  dei  numeri  reali  da  ­∞  a  +∞  (sulle 
ascisse  si  trovano  tutti  i  valori  di  x  e  sulle  ordinate  le 
frequenze di ciascun valore)
 La somma di tutte le prob. È uguale a 1
 Espressa dall’integrale:
+∞

ƒ ƒ(x)dx=1
­∞

 Che esprime l’area racchiusa dalla distrib. a campana
Probabilità-Distribuzione normale
    ­1/2 .(Χ­μ)2/ σ2

 F(x)=1/σ√2π e 
 F(x)=frequenza di un dato valore di x
 X=qualsiasi valore nella distribuzione
 μ=media della distribuzione
 σ=deviazione standard della distrib.
 π=3,1416
 e=2,7183(base dei logaritmi neperiani)
σ 2 µ  sono media e varianza della popolazione
Probabilità-Distribuzione normale-
Esempio
 L’area sottesa nel punto x esprime qual’è la probababilità che 
si  presenti  un  valore  inferiore  o  superiore  a  x.  Per  esempio 
consideriamo  una  distribuzioni  di  voti  all’esame,  ci  sono  20 
possibilità che uno studente abbia una media superiore al 27,5
Probabilità-Distribuzione normale-
Esempio
 Vogliamo sapere qual è la prob. , in una distrib. di Q.I. µ = 100 σ = 10, di 
ottenere un punteggio compreso tra 90 e 100:
X2=100

ƒ    ƒ(x)dx=?
­x1=90

  Trasformiamo i punti grezzi in punti z:
 Z1= x­µ /σ = 90­100/10= ­1
 Z2= 100­100/10=0
 L’integrale diventa:   0
                                    ƒ f(z)dz=?
                                                   ­1

 L’area che ci interessa è l’area tra 0 e –1. Sulla tavola B troviamo l’area tra 
0 e 1. Riga = I cifra decimale colonna= II cifra decimale
Z1=1        riga=1.0   col.=0     = .3413 la risposta che cercavamo
Probabilità-Distribuzione
binomiale     

 Ad  ogni  evento  si  associa  una  prob.  che  assume  una 
distribuzione che si definisce in base all’evento. X= evento 
e f(x) la sua distribuzione . In caso x assume 2 valori (testa 
e  croce),  eventi  indip.Se  eseguiamo  n  prove  avremo  una 
distrib. teorica definita binomiale.

 Equazione: f(x)= n C x p x q n­x  
 p= prob. che si verifichi l’evento
 Q= prob che non si verifichi l’evento
 n  C  x  =  numero  dei  modi  in  cui  si  possono  combinare  x 
successi (n­x) insuccessi in n prove 
Probabilità-Distribuzione
binomiale     

 n  C x
 Si  definisce  comb.  di  n  oggetti  a  r  a  r  ,  tutte  le  possibili 
repliche  che  si  costituiscono  con  n  oggetti  senza  tener 
conto dell’ordine degli oggetti stessi.
 La combinazione formula:
 n C x  = { r}= n!/ r!  (n­r) != 
n

 Il punto ! Si legge fattoriale e indica tutta la serie di numeri 
naturali.
 Per es n=4    n!= 4= 4*3*2*1=24
 4C 2  = { 2}= 4!/ 2!(4­2)!= 4*3*2*1/ (2*1) (2*1)=6
4
Probabilità-Distribuzione
binomiale     

 La  distribuzione  Binomiale  si  applica  in  caso  di  variab. 


Discrete e dicotomiche.
 È simmetrica se la prob, di verificarsi l’evento è p=0.50
 p≠  0.50 non è asimmetrica
 Per  la  variabili  continue  si  utilizza  la  distribuzione 
normale.
Verifica delle ipotesi
 La  popolazione:  l’insieme  degli  elementi  a  cui  si  rivolge  il 
ricercatore per la sua indagine.
 Campione:  un  sottoinsieme  della  popolazione  che  ha  tutte  le 
caratteristiche  della  popolazione  da  cui  proviene  (campione 
rappresentativo)
 Quando si lavora con dati del campione si ricorre alla stima dei 
parametri  (che  non  sono  altro  che  media,  varianza,  etc.) 
perché  non  si  conosce  la  distribuzione  della  popolazione  da 
cui  i  soggetti provengono. Per ottenere  queste informazioni si 
utilizzano i parametri del campione.
Verifica delle ipotesi-
Campionamento
 Il  campionamento  casuale  corrisponde  ad  un'estrazione  da 
una popolazione di un determinato numero di individui/oggetti. 
Il campionamento casuale può essere:

● Con  reinserimento:  se  ogni  elemento  estratto  viene 


reinserito  all’interno  della  popolazione  nella  quale  può 
essere  di  nuovo  estratto  (in  questo  caso  la  popolazione 
rimane la stessa) ;

● Senza  reinserimento:  la  popolazione  cambia  ad  ogni 


estrazione  e con essa  la probabilità che ciascun  elemento 
ha di essere estratto.
Verifica delle ipotesi-Parametri
indicatori
 Il  Parametro  di  una  popolazione  è  la  caratteristica  oggetto  d’esame  nella 
popolazione.
 Indicatore  o  statistica  sintetizza  la  caratteristica  oggetto  d’esame  nel 
campione estratto casualmente dalla popolazione che ci interessa .
 Es Una volta determinata l’ampiezza   n   del campione, restano definite   n 
   variabili  casuali   X1, ognuna delle quali rappresenta l’i­esima estrazione, 
che, a sua volta, è suscettibile di assumere il valore x1. 
 Una volta effettuato il campionamento si avranno a disposizione   n   valori 
per le   n   variabili casuali e la media di quel determinato campione sarà 
data  dalla  media  dei  valori  assunti  dalla  variabile  casuale.(indicatore  più 
diffuso)
 Questa media non è altro che uno dei possibili valori che può assumere la 
variabile casuale, detta media del campione o media campionaria.
Verifica delle ipotesi-Parametri
indicatori-Distribuzione campionaria
della media
 Distribuzione  campionaria  della  media:  esempio  di  distribuzione 
campionaria  NOTA  (che  quindi  ha  media,  varianza  e deviazione  standard 
note) 

 Si  chiama       ERRORE  STANDARD     la  deviazione  standard  delle 


distribuzioni campionarie.

 Proprietà dei parametri della distribuzione campionaria delle medie 

 La  media  delle  medie  del  campione  coincide  con  la  media  della 
popolazione  dalla  quale  i  campioni  sono  estratti.Anche  se  la  media  della 
distribuzione  campionaria  è  uguale  alla  media  della  popolazione  non  è 
detto  che  la  forma  sia  identica;  ciò  riguarda  l’ampiezza  del  campione: 
aumentando l’ampiezza dei campioni aumenta la media di ciascuno di essi 
diventando una stima più precisa della popolazione
Verifica delle ipotesi-Parametri
indicatori-Distribuzione campionaria
della media

 Esiste  una  relazione  tra  la  variabilità  della  distribuzione 


campionaria delle medie, la variabilità della popolazione (σ 2) e 
l’ampiezza  del  campione  (n).  Tale  relazione  si  esprime  con:   
Var. (x) = σ2 /n ovvero σ 2 x = σ2 /n  
 All’aumentare di n la variabilità (o varianza) della distribuzione 
campionaria delle medie diminuisce fino a tendere a zero (per 
la legge dei grandi numeri)
Verifica delle ipotesi-Esempio

 Compito  del  ricercatore  è  quello  di  controllare  se  l’ipotesi 


formulata  è  da    considerare  verificata  o  meno.  Significa 
prendere una decisione.
 Dopo  aver  estratto  un  campione,dopo  aver  sintetizzato  i  dati 
con  un  adeguato  indicatore,si  può  considerare  verificata 
l’ipotesi?  O  il  valore  ottenuto  sul  campione  è  suff.  vicino  al 
valore atteso in funzione dell’ipotesi?
 Il  problema  diventa  un  problema  di  distanza  tra  il  valore 
ottenuto e il valore atteso:tale distanza può essere dovuta: 
 Al caso l’ipotesi nulla è vera
 Non al caso l’ipotesi nulla è falsa
Verifica delle ipotesi-Esempio

 In  quest’ultimo  caso  si  può  formulare  un  ipotesi  alternativa 


quando si può dubitare dell’ipotesi nulla
 Es: un ricercatore vuole sapere se topi affamati vanno sempre 
nel braccio sinistro di un labirinto a 2 vie, anche in assenza di 
cibo.
 Ipot. Nulla: i topi sceglieranno in egual misura il braccio sinistro 
e quello destra (H0: p=.50)
 Ip.  Alter.:i  topi  scelgono  il  braccio  sinistro  in  un  numero 
maggiore rispetto a quello destro che ci si potrebbe aspettare 
dal caso (H1>.50) 
Verifica delle ipotesi-Esempio

 Supponiamo  di  aver  estratto  un  campione  di  10  topi:  ci 
attendiamo che i topi scelgono il braccio sinistro:
 μ0 =np= 10*.05= 5
 Nel caso in cui l’ipot. Nulla sia vera.
 Effettuato  l’esperimento  i  topi  scelgono  6  volte  il  braccio 
sinistro.
 Sulle tavole della distribuzione binomiale 
 Leggiamo  la  prob.  di  un  risultato  di  6  con  n=10  p=.50 
otteniamo .20508 ossia una prob. del 20% di ottenere risultato 
6. Per convenzione si sceglie con probabilità critica (α ) quella 
pari al 5% (.05)
Verifica delle ipotesi-Esempio

 Tutti i risultati che hanno prob. Di verificarsi minori di tale livello 
sono considerati significativi ossia si accetta l’ipot. Alternativa.

 Il  risultato  6  che  corrisponde  a  una  prob.  20%  è  superiore  al 


5%. Accettiamo l’ipot. Nulla.
Verifica delle ipotesi-Esempio-
Regione Critica

I  livelli  di  probabilità  adottati  sono  0,05  0,01  e  0,001, 


generalmente  indicati  α  e  detti  livelli  di  significatività.  Essi 
determinano la regione di rifiuto per l'ipotesi nulla.
Verifica delle ipotesi-Errori

 Si individuano due tipi di errori
● rifiutare H0 quando è vera, errore di primo tipo
● accettare H0 quando è falsa, errore di secondo tipo

 I  livelli  di  di  probabilità  critica  α=  .050,.01,  .001  significa 


rischiare  di  sbagliare  rifiutando  l’ipot.  Nulla  5  volte  su  100,  1 
volta  su  100,  1  volta  su  1000.  Nell’ultimo  caso  l’errore  è 
minimo  anche  se  esiste  la  possibilità  di  accettare  l’ipot.nulla 
quando è vera l’ipot. Alternativa (errore di 2 tipo). 
Verifica delle ipotesi-Errori-Livelli
di probabilità

 si  Chiamiamo  β  la  prob.di  accettare  l’ipotesi  nulla  quando  è 


vera H1; 
● 1­β si accetta H1 quando è vera (decisione corretta)
● 1­α si accetta Ho quando è vera (decisione corretta)

 α si accetta Ho quando è falsa
 La quantità 1­β si chiama potenza del test ed esprime quindi la 
capacità di un test statistico riconoscere la falsità di H0  quando 
questa è effettivamente falsa. 
 TRYSTORMING…
Just do it !!!
Termine seminario

Studiare

Esercitarsi

Rilassarsi