Statistica

Corso di Statistica
Corso di Laurea in
Ingegneria Edile
ed
Ingegneria Tessile
Docente: Lorena Viviano
Orario del corso:
Mercoled`:
dalle 10.30 alle 12.30
Gioved`:
dalle 9.30 alle 11.30
Ricevimento:
Gioved`:
dalle 15.30 alle 17
Per giorni diversi da gioved` si richiede
appuntamento via e-mail
e-mail: lorena.viviano@unibg.it
- File delle lezioni il giorno prima della lezione
nella pagina del corso
- Modalità di esame, comunicazioni, ecc. nella
pagina del corso
Libri di Testo:
S.M. Iacus: Statistica: 15 lezioni facili, ed.
cusl Milano
Appunti della docente per le parti del pro-
gramma non comprese nel testo.
Altre letture:
Ross: Probabilità e Statistica per lingegne-
ria e le scienze. Ed. Apogeo.
Navidi: Probabilità e statistica per lingeg-
neria e le scienze, McGraw-Hill.
Ilia Negri: Esercizi per il corso di Calco-
lo delle Probabilità e Statistica, ed. Cusl
Milano.
PROGRAMMA DEL CORSO
1. Introduzione al Corso
2. Analisi esplorativa di insiemi di
dati reali
3. Calcolo della probabilità
4. Inferenza statistica
5. Modello di regressione lineare
Laboratorio Matlab
Statistica Lez.1
Cosa è la Statistica?
. . . quello che rende la Statistica unica è la ca-
pacità di quanticare lincertezza;. . . essa mette
gli statistici in grado di fare aermazioni cate-
goriche, cioè in completa sicurezza, circa il loro
grado di incertezza
Alcune denizioni
Fenomeno statistico: loggetto della nostra
indagine
Popolazione (statistica): linsieme degli indi-
vidui portatori della caratteristica di interesse
Campione: sottogruppo della popolazione ogget-
to dello studio
Modello: oggetto teorico che descrive le carat-
teristiche salienti del fenomeno
1
Statistica Lez.1
Ambiti della statistica e loro interazioni:
Statistica Descrittiva: descrive il fenomeno
sulla base dei risultati contenuti nel campione.
Non si vuole estendere i risultati a tutta una
popolazione. Strumenti: metodi graci, misure
di sintesi, indici.
Statistica Inferenziale: cerca di estendere i
risultati ottenuti sul campione allintera popo-
lazione. Per poter estendere i risultati occorre
che il campione sia scelto con criterio (casuale).
Strumenti: stimatori, intervalli di condenza,
veriche di ipotesi.
Probabilità: tecniche connesse al trattamen-
to della casualità e alla descrizione dei modelli
teorici.
Statistica Descrittiva Probabilità
Statistica inferenziale
2
Statistica Lez.1
Esempio 1
Dobbiamo vericare la resistenza del calcestruz-
zo da utilizzare per la costruzione di un edi-
cio. La normativa prevede che sopra una cer-
ta metratura siano eettuati n provini sui quali
valuteremo la resistenza.
Fenomeno statistico: resistenza del calces-
truzzo
Popolazione: tutti i possibili campioni di cal-
cestruzzo
Campione: gli n provini
3
Statistica Lez.1
Si calcolano alcune quantità sui provini (me-
dia, varianza, percentili)
Si sceglie un modello probabilistico in gra-
do di descrivere il fenomeno (modello gaus-
siano)
Si eettuano dei test per poter essere in gra-
do di inferire sulla qualità globale del calces-
truzzo
4
Statistica Lez.1
Esempio 2
Abbiamo due macchine che eettuano la tes-
situra di un tessuto pregiato. Alla ne della
giornata contiamo i difetti prodotti dalle due
macchine e sono in numero diverso. Dobbi-
amo provvedere al controllo della macchina che
produce più difetti?
Fenomeno statistico: numero dei difetti sulla
stoa prodotta in una giornata
Popolazione: le stoe prodotte alla ne della
giornata
Campione: per ogni macchina la rilevazione del
numero di difetti alla ne di n giornate lavorative
5
Statistica Lez.1
Si calcolano alcune quantità sulle stoe prodotte
dalle due macchine (media, varianza, per-
centili)
Si sceglie un modello probabilistico in gra-
do di descrivere il fenomeno (modello gaus-
siano)
Si eettuano dei test per poter essere in gra-
do di inferire sul funzionamento delle due
macchine
6
Statistica Lez.1
Classicazione e distribuzioni
di frequenza
Problema: studiare landamento del primo semestre
di un corso di laurea che prevede 3 esami per
semestre
Rileviamo:
numero di esami superati E (0, 1, 2 o 3)
voti in trentesimi V negli esami superati
valutazione del rendimento R nel singolo esame
(suciente, buono, ottimo)
condizione C di studente (lavoratore o non
lavoratore)
frequenza ai corsi F (s` o no oppure assidua,
saltuaria).
7
Tipologie di fenomeni
E è il risultato di unoperazione di conteggio
(numero di esami): è un fenomeno quanti-
tativo discreto
V è il risultato di una misura della perfor-
mance dello studente: è un fenomeno quan-
titativo continuo (qui è discretizzato)
R è una rilettura della variabile V . Può as-
sumere i valori S = suciente (18-22), B
= buono (23-26) e O = ottimo (27-
30): è un fenomeno qualitativo rilevato su
scala ordinale
C: è un fenomeno qualitativo rilevato su
scala nominale (s` o no)
F: è un fenomeno qualitativo. Su scala no-
minale se s` o no, su scala ordinale se invece
avessimo utilizzato la classicazione assidua
e saltuaria
8
Statistica Lez.1
A seconda della scala su cui vengono misurate,
le variabili vengono classicate come:
Quantitative
continue
discrete
Qualitative
ordinabili
sconnesse (o nominali)
Le operazioni che è possibile compiere per og-
nuna delle seguenti tipologie di variabili sono
(dalla più semplice alla più complessa)
Qualitative
nominali =, =
ordinale =, =,
Quantitative
discrete =, =, < (conteggio)

continue =, =, < (misurazione)
9
Statistica Lez.1
Scale di classicazione
Scala nominale
Scala Ordinale
Scala a intervalli: =, =, <, +,
Scala di rapporti: =, =, <, +, , ,
10
Grado Denominazione Eetti
1 Strumentale
`
E percepita solo dai sismogra.
2 Leggerissima
`
E avvertita solo dalle persone
ipersensibili in momenti di quiete
e ai piani più elevati.
3 Leggera
Viene avvertita da un numero
maggiore di persone, le quali
non si allarmano perche general-
mente non si rendono conto che
si tratta eettivamente di scosse
telluriche.
4 Mediocre
Le persone che sono in casa
lavvertono e qualcuna anche tra
quelle che si trovano allaperto.
I lampadari oscillano, i pavimenti
possono dare degli scricchiolii.
5 Forte
Sentita tanto dalle persone che
si trovano in casa quanto da
quelle fuori casa. Gli ogget-
ti sospesi oscillano ampiamente,
gli orologi a pendolo si fermano,
si hanno tremiti dei vetri e delle
stoviglie. Si ha risveglio brusco
dal sonno e può generare panico
senza danni alle persone.
6 Molto forte
Gli oggetti cadono e cos` i cal-
cinacci dei muri in cui si pos-
sono formare lievi lesioni. La
popolazione, presa dal panico,
abbandona le case.
7 Fortissima
Possono cadere comignoli e
tegole, mentre i muri presentano
lesioni non molto gravi. Suono
di campane.
8 Rovinosa
Lesioni gravi ai fabbricati, crol-
lo di qualche muro interno.
Qualche ferito, raramente vit-
time.
9 Disastrosa
Alcuni crolli di case, altri edi-
ci gravemente lesionati. Molti i
feriti, non numerose le vittime.
10 Distruttrice
Crolli di molti fabbricati. Parec-
chie le vittime, moltissimi i
feriti.
11 Catastrofe
Numerose vittime. Quasi tutti
gli edici crollati.
12 Grande catastrofe
Formazione di crepacci e frane.
Distruzione di qualsiasi opera
umana. 11
Statistica Lez.1
Che tipo di informazione vogliamo ricavare da
questi dati?
unità E V R F C
statistica
27 2 28 O si no
27 2 25 B si no
131 1 29 O si no
271 3 28 O no si
271 3 18 S no si
271 3 18 S no si
311 1 18 S no no
321 2 26 B si si
321 2 25 B si si
Qual e il rendimento medio?
Qual e il comportamento più frequentemente
riscontrato?
Quale il voto medio?
Esiste uneetto positivo dovuto alla frequen-
za dei corsi?
12
Statistica Lez.1
Distribuzioni di frequenza
n dati relativi a n individui
X fenomeno (o variabile statistica)
x
i
valore che può essere assunto da X
k : numero totale dei diversi valori assunti dal
fenomeno statistico
n
i
: frequenza con cui compare il valore x
i
del
fenomeno statistico
n
1
+n
2
+ n
k
= n, con n numero di osservazioni
o ampiezza del campione
Le distribuzioni di frequenza sono linsieme dei
valori x
i
e delle frequenze:
assolute: {x
i
, n
i
}
relative:
x
i
, f
i
=
n
i
n
percentuali: {x
i
, p
i
= f
i
100%}
13
Statistica Lez.1
Esempio
5 studenti
E numero di esami sostenuti
x
1
= 0, x
2
= 1, x
3
= 2, x
4
= 3,x
5
= 2
n
1
= 1, n
2
= 1, n
3
= 2, n
4
= 1
x
i
n
i
0 1
1 1
2 2
3 1
Totale 5
14
Statistica Lez.1
Esempio Numero di esami sostenuti da 350 stu-
denti
3, 1, 3, 1, 3, 1, 1, 3, 2, 2, 1, 3, 2, 1, 1, 2, 0, 2,
1, 1, 1, 3, 2, 1, 1, 1, 1, 0, 2, 0, 0, 1, 3, 1, 2, 2,
2, 2, 2, 3, 3, 2, 2, 1, 2, 0, 1, 2, 0, 0, 2, 3, 3, 0,
2, 2, 2, 2, 1, 2, 2, 0, 2, 0, 2, 2, 1, 1, 1, 3, 1, 1,
2, 1, 1, 1, 1, 1, 3, 2, 0, 2, 3, 1, 2, 2, 1, 1, 3, 0,
3, 3, 1, 0, 2, 1, 0, 2, 2, 2, 0, 2, 2, 2, 2, 0, 2, 2,
0, 1, 11, 2, 0, 2, 0, 1, 0, 1, 1, 3, 1, 2, 1, 0, 1,
2, 0, 2, 2, 2, 1, 1, 0, 1, 1, 1, 0, 1, 2, 2, 1, 2, 2,
3, 0, 2, 10, 3, 1, 1, 1, 1, 1, 2, 2, 1, 1, 1, 1, 1,
1, 1, 2, 2, 1, 2, 2, 1, 0, 2, 1, 2, 2, 1, 1, 2, 2, 2,
1, 3, 2, 1, 2 0, 1, 3, 1, 1, 1, 2, 2, 0, 2, 1, 2, 3,
1, 1, 1, 3, 2, 2, 2, 1, 1, 1, 0, 3, 1, 3, 0, 1, 2, 1,
0, 1, 3, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 1, 1, 2, 2, 2,
1, 2, 1, 2, 1, 0, 1, 1, 2, 2, 1, 2, 2, 2, 3, 0, 2, 1,
2, 1, 0, 1, 1, 1, 1 2, 2, 2, 2, 2, 0, 1, 1, 1, 2, 0,
1, 0, 1, 1, 2, 1, 1, 1, 2, 1, 2, 0, 1, 2, 2, 1, 2, 1,
3, 1, 2, 2, 0, 2, 2, 3, 2, 2, 1, 1, 1, 2, 3, 3, 1, 2,
1, 2, 1, 2, 2, 2, 1, 1, 1, 0, 1, 1, 2, 1, 2, 0, 2, 1,
0, 1, 1, 2, 3, 1, 2, 3, 1, 0, 2, 1, 3, 3, 1, 2, 2, 2,
2, 2, 2, 1, 2, 1, 1, 1
15
x
i
n
i
0 45
1 136
2 133
3 36
Totale 350
Statistica Lez.1
La frequenza relativa f
i
è il rapporto tra n
i
(la
frequenza assoluta) e il numero totale delle in-
formazioni disponibili n
x
i
n
i
f
i
= n
i
/n p
i
= f
i
100%
0 45 0.13 13%
1 136 0.39 39%
2 133 0.38 38%
3 36 0.10 10%
Totale n = 350 1.00 100%
16
Statistica Lez.1
Esempio Rendimento ( S = suciente, B =
buono e O = ottimo) rilevato su 350 studenti:
S, S, O, S, O, O, B, B, B, O, O, B, O, B, B, O, NA, B, O, O, B,
O, B, B, B, B, O, NA, S, NA, NA, O, B, O, O, B, O, O, B, S, O,
B, O, B, O, NA, B, O, NA, NA, O, O, O, NA, B, S, B, B, B, O, B,
NA, O, NA, B, O, O, O, O, B, O, B, O, B, B, B, O, O, B, S, NA,
O, O, O, S, S, B, S, O, NA, O, B, B, NA, B, O, NA, O, O, S, NA,
O, O, O, B, NA, O, O, NA, O, B, O, S, NA, B, NA, O, NA, B, B,
B, O, O, B, NA, S, O, NA, O, O, O, B, B, NA, B, B, B, NA, S, O,
O, B, B, O, S, NA, B, B, NA, O, B, S, O, B, B, B, B, O, S, O, O,
O, O, O, O, B, B, O, O, O, NA, B, B, O, O, O, B, O, B, B, O,
B, B, O, B, NA, O, O, O, B, O, O, O, NA, O, O, B, O, B, O, O,
O, B, S, O, O, B, O, NA, O, O, S, NA, O, B, O, NA, B, O, B, B,
O, O, O, NA, B, O, O, S, O, B, O, O, O, B, B, B, O, B, NA B, B,
B, O, B, B, O, O, O, NA, O, O, O, B, NA, O, O, B, O, B, O, O,
O, B, NA, B, B, B, O, NA, O, NA, B, B, O, O, O, B, O, S, O, NA,
O, O, O, B, B, B, B, B, B, B, NA, O, O, B, O, B, O, O, B, O, O,
O, B, B, O, B, O, O, B, O, S, B, B, NA, O, B, B, B, O, NA, B, B,
NA, B, O, O, B, O, S, O, O, NA, O, O, B, O, O, O, O, B, O, B,
B, O, O, B, O, B
x
i
n
i
f
i
p
i
S 23 0.07 7%
B 124 0.41 41%
O 158 0.52 52%
NA 45
Totale 350 1.00 100%
17
Statistica Lez.1
Dati raccolti in classi
Se abbiamo un numero elevato di possibili val-
ori x
i
per il fenomeno X si possono raccogliere
i dati in una tabella in cui nella prima colon-
na mettiamo le classi x
i
x
i+1
e nella seconda
le frequenze (assolute, relative o percentuali) di
classe, cioè il numero totale di osservazioni che
hanno valori del carattere X inclusi nella classe
x
i
x
i+1
.
Iscritti alla Società Avviati al lavoro
Maschi 53.4 59.0
Femmine 46.6 41.0
100.0 100.0
< 25 32.9 35.9
25-29 29.2 26.6
30-34 17.5 16.8
35-39 9.8 9.7
40-54 9.9 10.3
55 0.7 0.7
100.0 100.0
18
Statistica Lez.1
Frequenze cumulate
Rispondono a domande del tipo:
Quanti studenti hanno dato meno di 2 esa-
mi?
Quanti studenti risultano avere un rendimen-
to medio al più buono?
45 + 136 = 181, 181/350 100% = 51.7%,
quindi oltre la metà degli studenti non ha dato
più di un esame.
Frequenze cumulate
cumulate assolute: N
i
=
i
j=1
n
j
= n
1
+n
2
+ +n
i
cumulate relative: F
i
=
i
j=1
f
j
= f
1
+f
2
+ +f
i
cumulate percentuali : P
i
=
i
j=1
p
j
= p
1
+p
2
+ +p
i
19
Statistica Lez.1
Esempio Numero esami sostenuti
x
i
n
i
f
i
p
i
N
i
F
i
P
i
0 45 0.13 13% 45 0.13 13%
1 136 0.39 39% 181 0.52 52%
2 133 0.38 38% 314 0.90 90%
3 36 0.10 10% 350 1.00 100%
Totale n = 350 1.00 100%
Esempio Rendimento
x
i
n
i
f
i
p
i
N
i
P
i
S 23 0.07 7% 23 7%
B 124 0.41 41% 147 48%
O 158 0.52 52% 305 100%
NA 45
Totale 350 1.00 100% 305 100%
20
Statistica Lez.1
Si ricordi che valgono sempre le seguenti re-
lazioni tra frequenze cumulate e frequenze as-
solute:
Relazioni da ricordare
Se abbiamo k frequenze assolute, allora
N
1
= n
1
N
k
= n
N
i
N
i1
= n
i
Analogamente per le F
i
e le P
i
.
Attenzione : non ha alcun signicato calcolare
le frequenze cumulate se il fenomeno statistico
non è di tipo ordinabile come i fenomeni qualita-
tivi su scala nominale (fenomeno C nellesempio
degli studenti).
21
Statistica Lez. 2
Rappresentazioni grache
Su una popolazione di n = 20 unità sono stati ri-
levati i seguenti fenomeni:
stato civile (X)
livello di scolarità (Y )
numero di gli a carico (Z)
reddito in migliaia di C (W)
X =
N = Nubile
C = Coniugato
V = Vedovo
S = Separato, divorziato
Y =
A = Analfabeta, alfabeta
O = Scuola dellobbligo
S = Diploma di scuola superiore
L = Laurea e superiore
1
Statistica Lez. 2
u X Y Z W
unità stato grado di numero di reddito
stat. civile scolarità gli in C
1 N L 0 72.50
2 S O 1 54.28
3 V A 3 50.02
4 V O 4 88.88
5 C L 1 62.30
6 N S 1 45.21
7 C S 0 57.50
8 C O 2 78.40
9 V L 3 75.13
10 N O 0 58.00
11 N S 1 53.70
12 N A 0 91.29
13 S S 1 74.70
14 C S 4 41.22
15 N S 3 65.20
16 C L 0 63.58
17 V O 2 48.27
18 S O 2 52.52
19 C S 4 69.50
20 C S 4 85.98
2
Statistica Lez. 2
Problemi
1. Come possono essere classicati i fenomeni X,
Y , Z e W ?
2. Costruire le tabelle di frequenza: relative, per-
centuali e cumulate;
3. Rappresentare in modo opportuno i dati;
stato civile (X) qualitativo nominale
si presenta con k = 4 modalità
x
1
= N x
2
= C x
3
= V x
4
= S
La tabella delle frequenze è
x
i
n
i
f
i
= n
i
/n p
i
= f
i
100%
N 6 0.30 30
C 7 0.35 35
V 4 0.20 20
S 3 0.15 15
n = 20 1.00 100
3
Statistica Lez. 2
Un carattere qualitativo sconnesso può essere rap-
presentato gracamente in diversi modi:
tramite rettangoli
graci a torta
rappr. tramite gure
4
Statistica Lez. 2
Rappresentazione tramite rettangoli
Le modalità x
1
, x
2
, . . . , x
k
del carattere si sistema-
no su un segmento orizzontale in qualsiasi ordine e
in modo equispaziato.
In corrispondenza di ciascuna modalità si disegnano
rettangoli di stessa base e altezza proporzionale alle
frequenze n
i
, f
i
o p
i
.
5
Statistica Lez. 2
Graci o diagrammi a torta
Si costruisce un cerchio e si identicano dei set-
tori circolari la cui ampiezza (o la cui area) è
proporzionale alle frequenze n
i
, f
i
o f
i
100%.
Anche in questo caso i settori vengono disegnati in
un ordine qualsiasi.
x : 20 = : 360
% : 100 = : 360
6
Statistica Lez. 2
Rappresentazione tramite gure
Si sceglie una gura per rappresentare lunità di
misura:
= 1
Si rappresentano le modalità del carattere riportan-
do un numero di gure proporzionale alle frequenze
n
i
, f
i
o f
i
100%.
Anche in questo caso le modalità vengono
sistemate in un ordine qualsiasi.
N 30%
C 35%
S 15%
V 20%
= 5%
7
Statistica Lez. 2
livello di scolarità (Y ) qualitativo ordinale
Le modalità con cui si presenta il fenomeno sono
k = 4
x
1
= A x
2
= O x
3
= S x
4
= L
La tabella delle frequenze è:
x
i
n
i
f
i
p
i
N
i
F
i
A 2 0.1 10 2 0.1
O 6 0.3 30 8 0.4
S 8 0.4 40 16 0.8
L 4 0.2 20 20 1.0
20 1.0 100
8
Statistica Lez. 2
numero di gli a carico (Z) quantitativo discre-
to
(misurabile su scala di rapporto, lo zero naturale
esiste). Le intensità con cui si presenta il fenomeno
sono k = 5
x
1
= 0 x
2
= 1 x
3
= 2 x
4
= 3 x
5
= 4 (o più)
x
i
n
i
f
i
p
i
N
i
F
i
0 5 0.25 25 5 0.25
1 5 0.25 25 10 0.50
2 3 0.15 15 13 0.65
3 3 0.15 15 16 0.80
4 4 0.20 20 20 1.00
20 1.00 100
9
Statistica Lez. 2
Attenzione : per i fenomeni quantitativi, lasse su
cui rappresentano i dati è di tipo numerico, per cui
si deve prestare attenzione a come si rappresentano
i dati rispettando lunità di misura dellasse.
10
Statistica Lez. 2
reddito in C (W) quantitativo continuo
Le intensità con cui si presenta il fenomeno sono
tutte distinte (k = 20)
Ricorriamo allora ad un raggruppamento dei dati
in classi. Introduciamo:
a
i
: l ampiezza di ciascuna classe
l
i
= f
i
/a
i
: la densità di frequenza
x
i
n
i
f
i
N
i
a
i
l
i
40 50 3 0.15 3 10 0.0015
50 58 6 0.30 9 8 0.0375
58 70 4 0.20 13 12 0.016
7
70 95 7 0.35 20 25 0.014
20 1.00
11
Statistica Lez. 2
Rappresentazione tramite istogrammi
Quando abbiamo un fenomeno quantitativo conti-
nuo con dati raggruppati in classi si costruisce un
istogramma procedendo come segue:
1. Si dispongono i valori degli estremi degli
intervalli delle classi sullasse delle ascisse
rispettando lunità di misura dellasse
2. si tracciano dei rettangoli avendo come base gli
estremi dellintervallo e come altezza la den-
sità di frequenza l
i
. Attenzione : utilizzare
le frequenze n
i
, f
i
o p
i
può portare a graci
completamente sballati.
12
Indici di posizione
Vogliamo descrivere alcune caratteristiche delle di-
stribuzioni o farne confronti attraverso degli indici
di sintesi
esistono un valore o dei valori attorno ai quali
si aggregano i dati?
quando questo avviene, quanto i dati sono spar-
pagliati attorno a tali valori?
La moda
Può essere calcolata per qualunque fenomeno
Moda
valore x
i
di una distribuzione con frequenza n
i
(f
i
o p
i
) massima o, se il fenomeno è raggruppato in
classi, il punto medio dellintervallo con densità di
frequenza l
i
più elevata.
Se esistono più mode si parla di distribuzione
plurimodale
13
Statistica Lez. 2
Calcoliamo la moda per i caratteri X, Y , Z e W
Carattere X
La modalità x
i
= C ha frequenza più elevata e pari
a 7. Quindi la moda è C.
14
Statistica Lez. 2
Carattere Y
La modalità che si presenta più frequentemente è
x
i
= S, frequenza 8.
15
Statistica Lez. 2
Carattere Z
I valori x
i
= 0 e x
i
= 1 hanno entrambi frequenza
massima pari a 5. Z ha quindi una distribuzione
bimodale.
16
Statistica Lez. 2
Carattere W
La modalità cui corrisponde l
i
pi` u alta è la classe
50 58. Quindi il valore corretto per la moda è
(50+58)/ 2 = 54
17
Statistica Lez. 2
La Mediana
La mediana è quel valore x
i
che, una volta ordinati
i dati del campione, lascia alla sua sinistra e alla sua
destra la metà del campione
La mediana divide a metà la distribuzione dei dati
Può essere calcolata solo per fenomeni ordinabili
Mediana (per dati singoli)
Se n è lampiezza del campione, si procede cos`:
1) si ordinano i dati in ordine crescente
2) si calcola il valore (n +1)/2
3a) se esiste (n +1)/2 (caso n dispari) la mediana
è quel valore.
3b) se (n + 1)/2 non è un numero intero (caso n
pari)
fenomeno quantitativo: si fa la media tra
il valore precedente e quello successivo alla
posizione (n +1)/2
fenomeno qualitativo: si confrontano le mo-
dalità di posto precedente e successivo alla
posizione (n + 1)/2 e se coincidono quel-
la è la mediana, altrimenti la mediana è
indeterminata.
18
Statistica Lez. 2
Calcoliamo la mediana per il carattere Y
x
i
n
i
N
i
F
i
A 2 2 0.1
O 6 8 0.4
S 8 16 0.8
L 4 20 1.0
20
Ordiniamo i dati della distribuzione
AAOOOOOOS, |S| |S| SSSSSLLLL
n+1
2
= 10.5
n/2 = 10 n/2 +1 = 11 si trova la modalità S
Le frequenze cumulate ci aiutano a trovare il valore
della mediana
`
E suciente conoscere in corrispondenza di quale
valore si ha F
i
= 0.5, quel valore è la mediana
In questo caso F
i
= 0.5 casca nella modalità S
19
Statistica Lez. 2
Calcoliamo la mediana per la seguente distribuzio-
ne
x
i
n
i
N
i
F
i
A 4 4 0.2
O 6 10 0.5
S 8 18 0.9
L 2 20 1.0
20
Ordiniamo i dati della distribuzione
AAAAOOOOO|O| |S| SSSSSSLL
n/2 = 10 troviamo O ma n/2 +1 = 11 cè S
Poiche O = S concludiamo che la mediana è inde-
terminata
F
i
= 0.5 si verica al limite tra una modalità e la
successiva: la mediana risulta indeterminata
20
Statistica Lez. 2
Calcoliamo la mediana per il carattere Z
x
i
n
i
f
i
N
i
F
i
0 5 0.25 5 0.25
1 5 0.25 10 0.50
2 3 0.15 13 0.65
3 3 0.15 16 0.80
4 4 0.20 20 1.00
20 1.00 100
n/2 = 10 corrisponde a 1 n/2+1 = 11 corrisponde
a 2
In questo caso F
i
= 0.5 si verica al limite tra
una modalità e la successiva: la mediana risulta la
media aritmetica di questo due valori
La mediana è
Me =
1 +2
2
= 1.5
21
Statistica Lez. 2
Calcoliamo la mediana per la seguente distribuzio-
ne
x
i
n
i
f
i
N
i
F
i
0 5 0.25 5 0.25
1 6 0.30 11 0.55
2 2 0.10 13 0.65
3 3 0.15 16 0.80
4 4 0.20 20 1.00
20 1.00 100
n/2 = 10 corrisponde a 1 n/2+1 = 11 corrisponde
a 1
In questo caso F
i
= 0.5 casca nella modalità 1: la
mediana risulta 1
22
Statistica Lez. 2
La mediana per i dati raccolti in classi
Si cerca lintervallo con frequenza cumulata
N
i
= (n +1)/2 o F
i
= 0.5
Se questo valore cade a cavallo di due classi con-
tigue, si sceglie come mediana il valore che separa
le due classi
Se non accade la mediana è data da
Me = x
i
+
n
2
N
i1
l
i
x
i
è lestremo inferiore della classe in cui casca F
i
=
0.5
l
i
= n
i
/a
i
N
i1
è la frequenza cumulata della classe prece-
dente quella in cui casca F
i
= 0.5
23
Statistica Lez. 2
Calcoliamo la mediana per il carattere W
x
i
n
i
f
i
F
i
N
i
a
i
l
i
40 50 3 0.15 0.15 3 10 0.30
50 58 6 0.30 0.45 9 8 0.75
58 70 4 0.20 0.65 13 12 0.3
3
70 95 7 0.35 1.00 20 25 0.28
20 1.00
(n +1)/2 = 10.5
La classe che contiene la mediana è la numero 3,
58 70
Me = x
3
+
n
2
N
2
l
3
= 59 +
10 9
0.3
3
= 59 +3 = 62.
24
Statistica Lez. 2
Quartili
Q1 è il valore tale che a sinistra, cè il 25% dei
dati (e il rimanente 75% a destra)
Q2 = Me è il valore che divide a metà la distri-
buzione
Q3 è il valore tale che a sinistra, cè il 75% dei
Quindi tra Q1 e Q3 vi si trova il 50% dei dati: è il
50% centrale dellintera distribuzione dei dati.
Primo quartile Q1
Se n è lampiezza del campione, si procede come
segue:
1) Si calcola il valore
1
4
(n +1).
2) si procede come per la mediana tenendo come
riferimento sempre la posizione
1
4
(n +1).
Per i dati in classe la formula è
Q1 = x
i
+
n
4
N
i1
l
i
25
Statistica Lez. 2
Terzo quartile Q3
segue:
3
4
(n +1).
2) si procede come per la mediana tenendo come
3
4
(n +1).
Q3 = x
i
+
3
4
n N
i1
l
i
Esempio Calcoliamo Q
1
e Q
3
per il carattere Z
1
4
(n +1) = 5.25
Le posizione 5 cade in 0, la posizione 6 cade in 1
Q
1
=
0 +1
2
= 0.5
3
4
(n +1) = 15.75
Le posizione 15 e la posizione 16 cadono in 3
Q
3
= 3
26
Statistica Lez. 2
Percentili
Cp con p = 1, . . . , 100 è il valore tale che a
sinistra, cè il p% dei dati
(e il rimanente (1 p)% a destra)
C
5
è il valore tale che a sinistra, cè il 5% dei
Quindi tra C
5
e C
95
vi si trova il 90% dei dati: è il
90% centrale dellintera distribuzione dei dati.
p-percentile C
p
segue:
p
100
(n +1).
2) si procede come per i quartili tenendo come
p
100
(n +1).
C
p
= x
i
+
p
100
n N
i1
l
i
27
Statistica Lez. 2
La media aritmetica
La media aritmetica o semplicemente la media è
uno degli indici maggiormente impiegati dagli sta-
tistici.
x
n
=
1
n
(x
1
+x
2
+ +x
n
) =
1
n
n
i=1
x
i
Si calcola solo per dati numerici cioè per fenomeni
quantitativi
Media aritmetica
x
n
=
1
n
n
i=1
x
i
=
1
n
k
i=1
(x
i
n
i
) =
k
i=1
(x
i
f
i
)
dove k è il numero di valori diversi assunti dal
fenomeno statistico.
28
Statistica Lez. 2
Esempio Calcoliamo la media di Z
z
n
=
1
n
k
i=1
(z
i
n
i
)
z
n
=
0 5 +1 5 +2 3 +3 3 +4 4
20
=
5 +6 +9 +16
20
=
36
20
= 1.8
Esempio Calcoliamo la media di W
w
n
=
k
i=1
( w
i
f
i
), w
i
=
w
i
+w
i+1
2
w
n
=
40 +50
2
0.15 +
50 +58
2
0.30 +
58 +70
2
0.20 +
+
70 +95
2
0.35
= 45 0.15 +54 0.30 +64 0.20 +82.5 0.35
= 63.875
29
Statistica Lez. 2
Media o Mediana?
Supponiamo di avere 3 valori
10 20 30
la media è
(10+20+30)
3
= 20 la mediana è 20
Cambiamo ora un solo valore
10 20 300
la media diventa
10+20+300
3
= 110 la mediana resta
sempre 20
Lo stesso accade se cambiamo il valore di sinistra
0 20 30
la media diventa
0+20+30
3
= 16.6
6 la mediana re-
sta sempre 20
Morale: quando variamo i valori estremi di un di-
stribuzione, la media aritmetica ne risente mentre
la mediana no. Si dice allora che la mediana è un
indice del centro di una distribuzione più robusto
della media aritmetica.
30
Statistica Lez. 2
Esempio
Distribuzione del tempo di vita dei pazienti che hanno subito
un trapianto di organo vitale. In ordinata sono riportate le
densità di frequenza l
i
e in ascissa i tempi di vita t.
La media aritmetica dei tempi è 10 anni
La moda è 2 anni
La mediana è 2.3 anni (2 anni e poco più di 3 mesi)
Q1 = 1.21, Q3 = 4.12
31
Statistica Lez. 3
Siamo nella fase dellAnalisi dei dati che ci aiuta a
descrivere, sintetizzare, esplorare linsieme di dati
(Statistica Descrittiva).
Organizzazione sotto forma di tabella di fre-
quenze.
Impiego di graci.
Misura della tendenza centrale: sintetizza con
un unico valore la varietà dei valori presenti
nella popolazione.
Misura di dispersione o variabilità dei dati at-
torno alla misura di posizione prescelta (inter-
esse indiretto o diretto).
1
Statistica Lez. 3
2
Statistica Lez. 3
Indici di dispersione
Consideriamo i tre insiemi di dati:
x
(1)
x
(n)
X
1
30 40 50 60 70 80 90
X
2
30 40 50 60 70 80 300
X
3
0 40 50 60 70 80 90
Sono indici di dispersione:
Lo scarto interquartile SI = Q
3
Q
1
Il campo di variazione (Range) R = x
(n)
x
(1)
Osserviamo come cambiano i valori
Insieme Q
1
Me Q
3
Q
3
Q
1
M Range
1 40 60 80 40 60 60
2 40 60 80 40 90 270
3 40 60 80 40 55.7 90
3
Statistica Lez. 3
Il box-plot
La distribuzione di una variabile statistica viene
rappresentata come una scatola.
gli estremi della scatola sono Q
1
e Q
3
la scatola è tagliata dalla mediana
bao inferiore: Q1 1.5 (Q3 Q1)
bao superiore: Q3 +1.5 (Q3 Q1)
se non ci sono valori in corrispondenza dei ba
questi si approssimano al dato più vicino
tutti i valori fuori dai ba si segnano come
punti isolati
4
Statistica Lez. 3
Box-plot della distribuzione di X
1
2
3
5
Statistica Lez. 3
La varianza
Consideriamo le due distribuzioni
x
i
n
i
N
i
1 5 5
2 10 15
3 20 35
4 30 65
5 20 85
6 10 95
7 5 100
100
x
i
n
i
N
i
1 15 15
2 20 35
3 15 50
4
5 15 65
6 20 85
7 15 100
100
Calcoliamo media, moda e mediana delle due dis-
tribuzioni
6
Statistica Lez. 3
(a) La moda è 4
La media è
1
100
7
i=1
x
i
n
i
=
400
100
= 4
La mediana
(n +1)/2 = 50.5 n = 100
x
i
di posizione n/2 = 50 x
(50)
= 4
x
i
di posizione n/2 +1 = 51 x
(51)
= 4
La mediana è 4
(b) Le mode sono 2 e 6 (Bimodale)
La media è 4
La mediana
(n +1)/2 = 50.5 n = 100
x
i
di posizione n/2 = 50 x
(50)
= 3
x
i
di posizione n/2 +1 = 51 x
(51)
= 5
La mediana è
3+5
2
= 4
7
Statistica Lez. 3
Lindice che misura la dispersione basato sugli scar-
ti al quadrato dalla media:
La varianza
2
=
1
n
n
i=1
(x
i
x
n
)
2
La varianza campionaria
s
2
n
=
1
n 1
n
i=1
(x
i
x
n
)
2
Per il calcolo di tali indici si osservi che
n
i=1
(x
i
x
n
)
2
=
n
i=1
x
2
i
n( x
n
)
2
e quindi
2
=
1
n
n
i=1
x
2
i
( x
n
)
2
s
2
n
=
n
n 1
1
n
n
i=1
x
2
i
( x
n
)
2
8
Statistica Lez. 3
In presenza frequenze (assolute o relative)
2
=
1
n
k
i=1
(x
i
x
n
)
2
n
i
=
k
i=1
(x
i
x
n
)
2
f
i
2
=
1
n
k
i=1
x
2
i
n
i
( x
n
)
2
=
k
i=1
x
2
i
f
i
( x
n
)
2
Calcoliamo ora le varianze delle due distribuzioni
x
i
n
i
x
2
i
x
2
i
n
i
1 5 1 5
2 10 4 40
3 20 9 180
4 30 16 480
5 20 25 500
6 10 36 360
7 5 49 245
100 1810
x
i
n
i
x
2
i
x
2
i
n
i
1 15 1 15
2 20 4 80
3 15 9 135
4
5 15 25 375
6 20 36 720
7 15 49 735
100 2060
2
a
=
1810
100
4
2
= 2.1
mentre per quella (b)
2
b
=
2060
100
4
2
= 4.6
9
Statistica Lez. 3
Scarto quadratico medio
`
E espresso nella stessa unità di misura del fenomeno
=
2
Regola dei 3-sigma
La maggior parte dei dati (il 89%) deve trovarsi
nellintervallo
[ x
n
3 ; x
n
+3 ]
I dati esterni a tale intervallo sono detti outlier
Esercizio In uno studio per valutare la resisten-
za cubica a compressione di una particolare mis-
cela di calcestruzzo si hanno disposizione i dati
relativi a 115 campioni, i cui dati sono riportati
nella seguente tabella (la resistenza è misurata in
N/mm
2
)
resistenza 14 15 16 17 18 19 20 21 22 23 25
frequenze 2 1 6 7 11 24 24 17 14 8 1
Calcolare la mediana, i due quartili e il quinto e il
novantacinquesimo percentile, la varianza, la vari-
anza campionaria e lo s.q.m., lintervallo determi-
nato dalla regole dei 3 e il box-plot
10
Statistica Lez. 3
La Figura riporta il graco delle frequenze assolute.
x
i
n
i
N
i
F
i
14 2 2 0.017
15 1 3 0.026
16 6 9 0.078
17 7 16 0.139
18 11 27 0.235
19 24 51 0.443
20 24 75 0.652
21 17 92 0.800
22 14 106 0.922
23 8 114 0.991
25 1 115 1.000
Da questa tabella, in particolare dallultima colon-
na, possiamo dedurre Me = 20, Q
1
= 19, Q
3
=
21. inoltre il quinto percentile C
5
= 16 mentre il
novantacinquesimo C
95
= 23.
11
Statistica Lez. 3
Inoltre la media aritmetica risulta x = 19.7, la var-
ianza è
2
= 4.21, mentre s
2
= 4.25. Lo s.q.m.
risulta = 2.05 e lintervallo ottenuto con la regola
dei 3 sigma
( x 3, x 3) = (13.55, 25.86)
Nessun dato è fuori da questo intervallo.
Disegniamo il boxplot della distribuzione.
Calcoliamo i ba:
Q
1
1.5(Q
3
Q
1
) = 19 1.5(21 19) = 16
Il bao inferiore è 16
Q
3
+1.5(Q
3
Q
1
) = 21 +1.5(21 19) = 24
Il bao superiore è 23 poiche non cè il dato 24
12
Statistica Lez. 3
Coeciente di variazione
se si vuole eliminare linuenza dovuta allunità
di misura;
se si vuole confrontare la variabilità di due di-
versi fenomeni;
se si vuole eliminare linuenza dovuta allampiez-
za campionaria n.
Si calcola il Coeciente di variazione
CV =

| x
n
|
0
Si tratta di un indice di dispersione che è un numero
puro
Esercizio Calcolare la varianza, la varianza cam-
pionaria e lo s.q.m. per le distribuzioni Z e W.
(
2
Z
= 2.27,
2
W
= 216.9, s
2
Z
= 2.16, s
2
W
= 206.1,
Z
= 1.47,
W
= 14.36). Calcolare il coeciente
di variazione per le distribuzioni Z e W e stabilire
quale risulta più variabile.

Z = 1.8,

W = 60.4,
CV
Z
= 0.81, CV
W
= 0.22.
13
Statistica Lez. 3
Medie e varianze per gruppi
Vogliamo risalire alla media e alla varianza totale
delle retribuzioni in una particolare azienda conoscen-
do i dati relativi alle donne e agli uomini
n
U
n
D
x
U
x
D

2
U

2
D
42500 12000 50.72 44.02 275.78 163.23
La media generale x
n
si ottiene come la media delle
medie
x
n
=
x
d
n
d
+ x
u
n
u
n
d
+n
u
=
50.72 42500 +44.02 12000
54500
= 49.24
In generale se vi sono k gruppi, di media x
i
e
numerosità n
i
x
n
=
1
n
k
i=1
x
i
n
i
14
Statistica Lez. 3
La varianza generale
2
si ottiene come somma di
due indici
2
=
2
B
+
2
W
dove
2
B
è detta varianza between, cioè varianza tra
i gruppi e si calcola come la varianza delle medie
dei gruppi
2
B
=
( x
d
x
n
)
2
n
d
+( x
u
x
n
)
2
n
u
n
u
+n
d
2
W
è detta varianza within, cioè varianza nei gruppi
e si calcola come la media delle varianze dei gruppi
2
W
=

2
d
n
d
+
2
u
n
u
n
u
+n
d
In generale, indicata con
2
i
, la varianza del gruppi
i
2
B
=
1
n
k
i=1
( x
i
x
n
)
2
n
i
(varianza delle medie)
2
W
=
1
n
k
i=1
2
i
n
i
(media delle varianze)
15
Statistica Lez. 3
Calcoliamo la varianza totale delle retribuzioni:
2
B
=
( x
d
x
n
)
2
n
d
+( x
u
x
n
)
2
n
u
n
u
+n
d
=
(44.0249.24)
2
12000+(50.7249.24)
2
42500
54500
= 7.71
2
W
=

2
d
n
d
+
2
u
n
u
n
u
+n
d
=
(163.2312000)+(275.7842500)
54500
= 251.00
Quindi
2
=
2
B
+
2
W
= 7.71 +251.00 = 258.71
16
Statistica Lez. 3
Esercizio: La seguente tabella riporta i dati rel-
ativi alla produzione di bobine di un lato di alta
qualità prodotto da due macchine per la latura,
le lunghezze sono espresse in m. Per la macchina
denominata A si hanno a disposizione 7 campioni
prodotti, per la macchina denominata B si hanno
a disposizione 9 campioni.
Macchina A 87 79 81 86 90 87 82
Macchina B 82 79 78 84 88 91 89 90 86
Calcolare la varianza tra i gruppi e la varianza nei
gruppi. Dire in quale gruppo cè maggiore vari-
abilità
Disegnamo il boxblot delle due distribuzioni
17
Statistica Lez. 3
La media delle due distribuzioni è
x
A
= 84.57, x
B
= 85.22
La media TOTALE è
x =
1
16
(84.57 7 +85.22 9) = 84.94
La varianza delle due distribuzioni è
2
A
= 13.39,
2
B
= 20.17
La varianza TRA i gruppi è
2
B
=
1
16
( x
A
x)
2
n
A
+( x
B
x)
2
n
B
da cui
2
B
=
1
16
(0.13 7 +0.08 9) = 0.10
La varianza NEI gruppi è
2
W
=
1
16
2
A
n
A
+
2
B
n
B
da cui
2
W
=
1
16
(13.39 7 +20.17 9) = 17.20
La varianza TOTALE è
2
=
2
B
+
2
W
= 17.31
Inne
CV
A
=
13.39
84.57
= 0.04 CV
B
=
20.17
84.94
= 0.05
18
Statistica Lez. 3
I cuculi e Darwin
I cuculi depongono le proprie uova nei nidi di altri
uccelli.
In certi territori i cuculi sembrano preferire una
specie di uccello come ospite, in altri unaltra.
Darwin: ci si aspetta quindi una qualche forma di
adattamento delluovo del cuculo a quella delluc-
cello ospite.
Per vericare questa idea sono state misurate le
lunghezze (in mm) di alcune uova di cuculo trovate
in nidi di pettirossi e di scriccioli in due territori, uno
in cui i cuculi preferiscono i pettirossi, laltro in
cui preferiscono gli scriccioli.
Pettirossi
21.05 21.85 22.05 22.05 22.05 22.25 22.45 22.45 22.65 23.05 23.05
23.05 23.05 23.05 23.25 23.85
Scriccioli
19.85 20.05 20.25 20.85 20.85 20.85 21.05 21.05 21.05 21.25 21.45
22.05 22.05 22.05 22.25
19
Statistica Lez. 3
E evidente che le uova deposte nei nidi di scric-
ciolo sono tendenzialmente più piccole. Poichè
le uova degli scriccioli sono più piccole di quelle
dei pettirossi sembra che i cuculi diano ragione a
Darwin.
Alcune misure di sintesi per le lunghezze
ospite n x Me Q
1
Q
3
pettirosso 16 22.57 22.55 0.66 22.05 23.05
scricciolo 15 21.13 21.05 0.72 20.85 21.75
Il boxplot ci da unidea di come sono diverse le
distribuzioni
20
Statistica Lez. 3
Calcoliamo la media totale
x
n
=
22.57 16 +21.13 15
31
= 21.87
21
Statistica Lez. 3
2
B
=
(22.5721.87)
2
16+(21.1321.87)
2
15
31
= 0.52
2
W
=
0.66
2
16 +0.72
2
15
31
= 0.48
La varianza totale
2
=
2
B
+
2
W
= 0.52 +0.48 = 1.00
Vediamo quale delle due distribuzione è più vari-
abile
CV
S
=
0.72
21.13
= 0.03, CV
P
=
0.66
22.57
= 0.03
22
Statistica Lez. 3
Asimmetria
Confronto fra il numero e la dimensione degli scar-
ti negativi (cioè: dei valori più piccoli del valore
tipico) e degli scarti positivi (cioè: dei valori più
grandi del valore tipico). Lo studio di questo as-
petto prende il nome di analisi della asimmetria di
una distribuzione.
Massa (in Kg.) dei frammenti prodotti dallesplosione acci-
dentale di tre serbatoi.
Massa (in Kg.) Serbatoio A Serbatoio B Serbatoio C
x
j
N
j
N
j
N
j
0 0 0 1
1 0 1 2
2 5 4 3
3 10 8 5
4 14 14 14
5 5 8 10
6 3 4 5
7 2 1 0
8 1 0 0
23
Statistica Lez. 3
Serbatoio A: = 4.025 Me = 4 = 1.44
Serbatoio B: = 4 Me = 4 = 1.30
Serbatoio C: = 3.975 Me = 4 = 1.44
24
Statistica Lez. 3
Asimmetria positiva > Me
Simmetria = Me
Asimmetria negativa < Me
N.B. Osservazione del box-plot
25
Statistica Lez. 4
Analisi congiunta di più
fenomeni
Dati relativi al disastro del Titanic:
Morti Sopravvissuti
Classe Sesso Età
1
a
Uomini Bambini 0 5
Adulti 118 57
Donne Bambini 0 1
Adulti 4 140
2
a
Uomini Bambini 0 11
Adulti 154 14
Donne Bambini 0 13
Adulti 13 80
3
a
Uomini Bambini 35 13
Adulti 387 75
Donne Bambini 17 14
Adulti 89 76
Equipaggio Uomini Bambini 0 0
Adulti 670 192
Donne Bambini 0 0
Adulti 3 20
Totale 1490 711
1
Statistica Lez. 4
Si tratta di una tabella a 4 vie. Sono stati rilevati
4 caratteri:
la classe (1
a
, 2
a
, 3
a
, equipaggio)
il sesso (M, F)
letà (Bambini, Adulti)
lo status (Morto, Sopravvissuto)
Problema: Cè stata discriminazione per i passeg-
geri di terza classe?
Sono state salvate prima le donne e poi i bambini?
2
Statistica Lez. 4
La connessione
Su 15 individui è stato eettuato un test per rile-
vare la capacità di analisi (X) e quella a lavorare
in gruppo (Y )
modalità: suciente (S), buona (B) e ottima (O)
X O O S B S O B B S B O B B O S
Y O B B B S S O O B B O S B S B
Costruiamo la tabella delle frequenze
Dobbiamo contare quante volte si presenta ogni
coppia di valori
Y S B O
X
S 1 3 0 4
B 1 3 2 6
O 2 1 2 5
4 7 4 15
Si tratta di una tabella a doppia entrata, detta
anche tabella di contingenza
3
Statistica Lez. 4
Rileviamo su n individui i caratteri:
X con modalità x
1
, . . . , x
h
Y con modalità y
1
, . . . , y
k
In corrispondenza della riga i e della colonna j
andiamo a inserire il numero di volte n
ij
che si
presenta la coppia (x
i
, y
j
)
Y y
1
y
2
y
j
y
k
X
x
1
n
11
n
12
n
1j
n
1k
n
1.
x
2
n
21
n
22
n
2j
n
2k
n
2.
.
.
.
.
.
.
x
i
n
i1
n
i2
n
ij
n
ik
n
i.
.
.
.
.
.
.
x
h
n
h1
n
h2
n
hj
n
hk
n
h.
n
.1
n
.2
n
.j
n
.k
n
n
ij
è detta frequenza congiunta
Da questa tabella si ricavano altre distribuzioni utili
a comprendere i fenomeni studiati e le loro re-
lazioni.
4
Statistica Lez. 4
Le frequenze marginali
Quando sommiamo per riga:
n
i.
= n
i1
+n
i2
+ +n
ik
=
k
j=1
n
ij
è detta frequenza marginale di X
Quando sommiamo per colonna:
n
.j
= n
1j
+n
2j
+ +n
hj
=
h
i=1
n
ij
è detta frequenza marginale di Y
Abbiamo quindi due distribuzioni marginali:
La distribuzione di frequenza marginale di Y
y
1
y
2
. . . y
k
n
.1
n
.2
. . . n
.k
La distribuzione di frequenza marginale di X
x
1
x
2
. . . x
k
n
1.
n
2.
. . . n
k.
Per lesempio sono rispettivamente
Y S B O
4 7 4
X S B O
4 6 5
5
Statistica Lez. 4
Le distribuzioni condizionate assolute
Si ottengono dal corpo della tabella.
Se teniamo sso un valore della variabile X otte-
niamo la distribuzione condizionata di Y dato
X = x
i
. Sono le righe della tabella.
Y |X = O S B O
n
j|i=3
2 1 2 5
Se teniamo sso un valore della variabile Y otte-
niamo la distribuzione condizionata di X dato
Y = y
i
. Sono le colonne della tabella.
X|Y = S n
i|j=1
S 1
B 1
O 2
4
Ci si restringe a una sotto-popolazione. Negli es-
empi nel primo caso ai 5 individui che presentano
attitudine allanalisi Ottimo, nel secondo ai 4 in-
dividui che hanno capacità a lavorare in gruppo
Suciente
6
Statistica Lez. 4
Distribuzioni relative congiunte e marginali
Si ottengono dividendo per n ogni frequenza con-
giunta assoluta. Otteniamo:
le frequenze congiunte relative
f
ij
= n
ij
/n
frequenze relative marginali di Y
f
.j
= n
.j
/n
frequenze relative marginali di X
f
i.
= n
i.
/n
Calcoliamo la tabella delle frequenze relative per
lesempio
Y S B O
X
S
1
15
3
15
0
4
15
B
1
15
3
15
2
15
6
15
O
2
15
1
15
2
15
5
15
4
15
7
15
4
15
1
7
Statistica Lez. 4
Distribuzioni relative condizionate
Sono utili per confrontare le distribuzioni
Le frequenze condizionate relative si ottengono div-
idendo ogni frequenza condizionata per il totale di
riga o colonna.
Abbiamo le frequenze relative della variabile Y con-
dizionata a X
Y S B O
X = S 1/4 3/4 0 1
X = B 1/6 3/6 2/6 1
X = O 2/5 1/5 2/5 1
4/15 7/15 4/15 1
Nellultima riga abbiamo la distribuzione marginale
relativa di Y
Le frequenze relative della X condizionata a Y
X Y = S Y = B Y = O
S 1/4 3/7 0 4/15
B 1/4 3/7 2/4 6/15
O 2/4 1/7 2/4 5/15
1 1 1 1
Nellultima colonna abbiamo la distribuzione marginale
relativa di X
8
Statistica Lez. 4
Indipendenza
Se tutte le distribuzioni condizionate di X da Y
sono uguali allora sono necessariamente uguali alla
distribuzione marginale di X
n
ij
n
.j
=
n
i.
n
Se tutte le distribuzioni condizionate di Y da X
sono uguali allora sono necessariamente uguali alla
distribuzione marginale di Y
n
ij
n
i.
=
n
.j
n
Nei due casi deve essere
n
ij
=
n
i.
n
.j
n
e nel qual caso si dice che i fenomeni X e Y sono
indipendenti
In termini di frequenze relative possiamo riscrivere
cos`
n
ij
n
=
n
i.
n
n
.j
n
ovvero
f
ij
= f
i.
f
.j
Vale a dire
Freq(X = x
i
Y = y
j
) = Freq(X = x
i
)Freq(Y = y
j
)
9
Statistica Lez. 4
Le quantità
n
ij
=
n
i.
n
.j
n
per ogni i = 1, . . . , h j = 1, . . . , k
sono le frequenze teoriche di indipendenza
Per vericare se due fenomeno sono indipendenti
basta calcolare le frequenze teoriche di indipenden-
za e confrontarle con le frequenze osservate.
Esempio Consideriamo n
11
= 1 La frequenza teor-
ica di indipendenza è
n
11
=
n
1.
n
.1
15
=
4 4
15
=
16
15
= 1.07 = 1
Quindi i due fenomeni non sono indipendenti.
Attenzione: quando cè una frequenza pari a ze-
ro e le marginali non sono nulle siamo sempre in
presenza di caratteri non indipendenti.
Come misuriamo il grado di dipendenza per questo
tipo di fenomeni?
Costruiamo un indice basato sulle dierenze n
ij

n
ij
. Più queste dierenze sono piccole più i due
fenomeni sono vicini allindipendenza.
10
Statistica Lez. 4
Queste dierenze si chiamo contingenze
c
ij
= n
ij
n
ij
Sulle contingenze si basa lindice per misurare il
grado di connessione tra due fenomeni
2
(Chi-
quadrato)
2
=
h
i=1
k
j=1
n
ij
n
ij
2
n
ij
Che diventa (per i conti)
2
= n
i=1
k
j=1
n
2
ij
n
i.
n
.j
1
Per eettuare confronti è bene avere un indice

relativo (che vari tra 0 e 1)

2
=
h
i=1
k
j=1
n
2
ij
n
i.
n
.j
1
min(h 1, k 1)
Lindice relativo è ottenuto dividendo lindice
2
per
2
max
= max
2
= n min(h 1, k 1)
che è il massimo valore che può assumere tale
indice.
11
Statistica Lez. 4
Esempio: Calcoliamo lindice di connessione per
i dati dellesempio. Costruiamo la tabella con le
frequenze teoriche di indipendenza
X S B O
S 1.07 1.86 1.07 4
B 1.6 2.8 1.6 6
O 1.33 2.34 1.33 5
4 7 4 15
Costruiamo la tabella con le contingenze
X S B O
S 1-0.94 3-1.87 0-0.94
B 1-1.6 3-2.8 2-1.6
O 2-1.33 1-2.33 2-1.33
Costruiamo la tabella con
n
ij
n
ij
2
n
ij
X S B O
S 0.004 0.683 0.94
B 0.225 0.014 0.100
O 0.338 0.759 0.338
2
= 3.400
Lindice relativo lo otteniamo come

2
= 3.4/(15 2) = 0.11
12
Statistica Lez. 4
Esempio Verichiamo se lo status (morto o vivo)
è legato più allètà, al sesso o alla classe di imbarco
Età Morti Sopravvissuti Totale
Bambini 52 57 109
Adulti 1438 654 2092
1490 711 2201

2
=
52
2
1091490
+
57
2
109711
+
1438
2
20921490
+
654
2
2092711
1
1
= 0.009
Sesso Morti Sopravvissuti Totale
Uomini 1364 367 1731
Donne 126 344 470
1490 711 2201

2
=
1364
2
17311490
+
367
2
1731711
+
126
2
4701490
+
344
2
470711
1
1
= 0.208
13
Statistica Lez. 4
Classe Morti Sopravvissuti Totale
Prima 122 203 325
Seconda 167 118 285
Terza 528 178 706
Equipaggio 673 212 885
1490 711 2201

2
= 0.086
Come si vede la variabile Sopravvivenza (o morte)
sembra essere inuenzata più dal sesso (
2
= 0.21)
che non dalla classe (
2
= 0.09) o dalletà (
2
=
0.009)
14
Statistica Lez. 4
Massima connessione
Il concetto opposto allindipendenza è quello di
massima connessione. Si ha massima connessione
quando la conoscenza dellesito di una variabile
determina completamente lesito dellaltra.
La massima connessione può essere bilaterale (solo
con tabelle quadrate!!!)
Y y
1
y
2
y
3
X
x
1
0 0
x
2
0 0
x
3
0 0
Quando le tabelle sono rettangolari si ha massima
connessione unilaterale
Y y
1
y
2
y
3
X
x
1
0 0
x
2
0
Y y
1
y
2
X
x
1
0
x
2
0
x
3
0
(a) (b)
In (a) abbiamo massima dipendenza di X da Y in
(b) viceversa
15
Statistica Lez. 4
Esercizio. Molti anni fa venne condotto uno stu-
dio epidemiologico per studiare gli eetti positivi
delluso di aspirina sulla prevenzione degli attacchi
cardiaci. Da un insieme di 22071 medici volontari
vennero formati due gruppi: il gruppo di trattamen-
to e quello di controllo. Gli individui del gruppo di
trattamento ricevevano una dose quotidiana di as-
pirina mentre quelli di controllo un farmaco place-
bo, cioè identico allaspirina e non contenente alcun
principio attivo. Lo studio venne condotto per un
periodo di 5 anni osservando il numero di decessi
per infarto. Si ottennero i seguenti risultati
Esito Infartuati Non Totali
Farmaco Infartuati
Placebo 239 10795 11034
Aspirina 139 10898 11037
378 21693 22071
Vericare se lesito è indipendente dal trattamento
e in caso negativo calcolare lindice di connessione
assoluto e relativo.
16
Statistica Lez. 4
Relazioni statistiche
dipendenza o indipendenza in presenza di vari-
abili nominali
2
(minimo 0, massimo . . .)
dipendenza in media in presenza almeno di un
carattere quantitativo
regressione e correlazione dipendenza fun-
zionale unidirezionale o bidirezionale tra 2 carat-
teri
17
Statistica Lez. 5
Probabilità
Studio delle leggi del caso.
Esempio: lancio di un dado
Eventi : entità per i quali è possibile calcolare le
probabilità. Si indicano con le lettere E, A, . . .
E = {esce un numero pari}
Esperimento casuale: esperimento nel quale ven-
gono prodotti dei risultati che a priori non sono
prevedibili
Evento elementare: uno dei possibili esiti di un espe-
rimento casuale
Evento: collezione di possibili risultati di un espe-
rimento casuale
Linsieme di tutti i risultati dellesperimento:
detto evento certo o spazio campionario
= {1, 2, 3, 4, 5, 6}
Ad ogni evento A vogliamo assegnare una
probabilità P(A). Come?
1
Statistica Lez. 5
Sia A levento esce il numero 7
Sia A levento non esce nessun numero
Sia A levento esce un pari
Sia A levento esce un numero tra -1 e 8
Sia A levento esce almeno un numero
2
Statistica Lez. 5
Alcune regole fondamentali:
P(A) = 0 A evento quasi impossibile
P() = 0 evento impossibile
P(A) 0 per ogni A
P(A) 1 per ogni A
P(A) = 1 A evento quasi certo
P() = 1 evento certo
3
Statistica Lez. 5
Se due eventi A e B non possono vericarsi con-
temporaneamente diremo che sono incompatibili
A B =
eventi incompatibili
A B = P(A B) = 0
Se A e B sono incompatibili è lecito assumere che
P(A B) = P(A) +P(B)
Assiomi del calcolo delle probabilità (Kolmo-
gorov 1933)
Assiomi della probabilità
1. A , P(A) 0
2. P() = 1
3. Se A B = allora P(A B) = P(A) +P(B)
4
Statistica Lez. 5
Proprietà della probabilità

A è levento complementare di A
P(
A) = 1 P(A)
Se A B
P(A) P(B)
per ogni A
0 P(A) 1
Se A e B sono eventi compatibili
P(A B) = P(A) +P(B) P(A B)
Se A
1
, A
2
, . . . A
n
sono tali che A
i
A
j
= , i = j
P(A
1
. . . A
n
) = P(A
1
) +. . . P(A
n
)
ovvero
P
i=1
A
i
=
n
i=1
P(A
i
)
5
Statistica Lez. 5
Il caso degli eventi equiprobabili
In genere è descritto dagli eventi elementari
= {
1
,
2
, . . . ,
n
} n N
Se
P({
1
}) = P({
2
}) = . . . = P({
n
})
allora la probabilità di A, composto da più eventi
elementari, è data da
eventi elementari equiprobabili
P(A) =
|A|
||
=
# casi favorevoli (allevento)
# casi possibili (dellesperimento)
Esempio: lancio di due dadi
= {(i, j) : 1 i, j, 6} || = 36
A = {(i, j) : (i, j) = (6, 6)} |A| = 1
P(A) =
1
36
6
Statistica Lez. 5
Eventi indipendenti
Due eventi sono indipendenti se il vericarsi dellu-
no non inuenza il vericarsi dellaltro e viceversa
Se la probabilità A varia sapendo che si è vericato
B vuol dire che A dipende da B
La probabilità di A in questo caso diventa P(A|B)
Probabilità condizionata
P(A|B) =
P(A B)
P(B)
con P(B) > 0
Abbiamo quindi
Indipendenza tra eventi
A e B sono indipendenti se e solo se
P(A|B) = P(A) e P(B|A) = P(B)
A={2,3}, B= esce numero pari
P(A) =
1
3
, P(A|B) =
1
3
, P(B) =
1
2
, P(A B) =
1
6
7
Statistica Lez. 5
Poiche si ha che, se A e B sono indipendenti
P(A|B) =
P(A B)
P(B)
= P(A) P(AB) = P(A)P(B)
allora unaltra denizione di indipendenza è la se-
guente:
Indipendenza tra eventi (denizione
alternativa)
A e B sono indipendenti se e solo se
P(A B) = P(A) P(B)
Dalla denizione di probabilità condizionata segue
P(A B) = P(A|B) P(B)
P(A B) = P(B|A) P(A)
8
Statistica Lez. 5
In sintesi,
9
Statistica Lez. 5
Soluzione del problema di Chevalier De Mere
Siano
E = un 6 su 4 lanci di un dado
F = un doppio 6 su 24 lanci di due dadi
A = un 6 in un lancio
B = un doppio 6 in un lancio di due dadi
Abbiamo P(A) = 1/6 e P(B) = 1/36
Calcoliamo P(
E) e P(
F) al posto di P(E) e P(F).

P(
E) = P(
A)P(
A) P(
A) (per 4 volte) =
5
6
4
P(E) = 1 P(
E) = 1
5
6
4
= 0.518
P(
F) = P(
B)P(
B) P(
B) (per 24 volte) =
35
36
24
P(F) = 1 P(
F) = 1
35
36
24
= 0.491
Quindi P(F) < P(E)
10
Statistica Lez. 5
Ancora sullindipendenza
Se A e B sono indipendenti allora lo sono anche
A e

B

A e B

A e

B
Sfruttiamo le leggi di De Morgan
Leggi di De Morgan
A B =

A

B
A B =

A

B
P(
A

B) = P(A B) = 1 P(A B)
= 1 (P(A) +P(B) P(A B))
= 1 (P(A) +P(B) P(A)P(B))
= 1 P(A) P(B)(1 P(A))
= (1 P(A))(1 P(B)) = P(
A)P(
B)
11
Statistica Lez. 5
Indipendenza per più eventi
Indipendenza nel caso di 3 eventi
tre eventi A, B e C si dicono indipendenti se e
solo se
P(A B C) = P(A) P(B) P(C)
P(A B) = P(A) P(B)
P(A C) = P(A) P(C)
P(B C) = P(B) P(C)
Esercizio
Sia lo spazio degli eventi formato dalle 3! per-
mutazioni dei tre elementi a, b e c pi` u le triplette
aaa, bbb, ccc. Sia A
i
levento li-esima posizione è
occupata dalla lettera a, i = 1, 2, 3. Gli eventi A
i
,
i = 1, 2, 3 sono indipendenti?
12
Statistica Lez. 5
Soluzione
Lo spazio campionario è il seguente
= {abc, acb, bac, bca, cab, cba, aaa, bbb, ccc}
Gli eventi A
i
sono
A
1
= {abc acb aaa}, P(A
1
) =
3
9
=
1
3
A
2
= {bac cab aaa}, P(A
2
) =
3
9
=
1
3
A
3
= {bca cba aaa}, P(A
3
) =
3
9
=
1
3
Si verica che
P(A
1
A
2
) = P(aaa) =
1
9
= P(A
1
) P(A
2
)
P(A
1
A
3
) = P(aaa) =
1
9
= P(A
1
) P(A
3
)
P(A
2
A
3
) = P(aaa) =
1
9
= P(A
2
) P(A
3
)
ma
P(A
1
A
2
A
3
) = P(aaa) =
1
9
=
1
27
= P(A
1
) P(A
2
) P(A
3
)
quindi i tre eventi sono indipendenti a coppie ma
non nel loro insieme.
13
Statistica Lez. 5
Esercizio
Un esperimento casuale consiste nellestrarre una
pallina da unurna contenente cinque palline nu-
merate da 1 a 5. Se si estrae una pallina contras-
segnata con un numero dispari si lancia una mo-
neta, mentre se si ottiene un numero pari si lancia
un dado.Descrivere lo spazio campionario di ta-
le esperimento.Calcolare la probabilità dellevento
esce testa.
Lo spazio campionario è
= { 1T, 1C, 3T, 3C, 5T, 5C, 21, 22, 23, 24,
25, 26, 41, 42, 43, 44, 45, 46}
P(T) = P(1T 3T 5T)
= P(T|1)P(1) +P(T|3)P(3) +P(T|5)P(5)
=
1
2

1
5
+
1
2

1
5
+
1
2

1
5
=
3
10
14
Statistica Lez. 5
15
Statistica Lez. 6
Principio delle probabilità totali
e formula di Bayes
Esempio
Siano rispettivamente
P(D) = 0.001, P(S|D) = 0.99, P(S|
D) = 0.02
la probabilità che un pezzo sia difettoso, la proba-
bilità che sia segnalato difettoso dato che lo sia e la
probabilità che sia segnalato difettoso dato che non
lo sia. La probabilità che sia segnalato un pezzo
difettoso è : P(S) = 0.02097
Infatti:
P(S) = P(S D) +P(S D) =
= P(S|D) P(D) +P(S|D) P(D) =
= 0.99 0.001 +0.02 [1 0.001] =
= 0.00099 +0.01998
Mentre la probabilità che un pezzo segnalato difet-
toso lo sia realmente è
P(D|S) =
P(D S)
P(S)
= 0.0472
Se noi scartiamo tutti i pezzi segnalati difettosi, di
quelli scartati solo il 5% lo sono realmente!!!!!
1
Statistica Lez. 6
Principio delle probabilità totali e formula di Bayes
Partizione di
k eventi A
1
, A
2
, . . . A
k
sono una partizione se e
solo se
k
i=1
A
i
= e
scelti due qualsiasi A
i
e A
j
allora A
i
A
j
=
Principio delle probabilità totali
se A
i
sono un partizione di e E è un qualsiasi
altro evento
P(E) =
k
i=1
P(E|A
i
) P(A
i
)
Formula di Bayes
se A
i
sono un partizione di e E è un qualsiasi
altro evento
P(A
j
|E) =
P(E|A
j
) P(A
j
)
k
i=1
P(E|A
i
) P(A
i
)
, j = 1, . . . , k
2
Statistica Lez. 6
Esercizio
Tre addetti di unindustria sono incaricati di eet-
tuare riparazioni ad una linea di produzione autom-
atizzata ogni volta che si vericano delle rotture.
Laddetto A, che ripara il 25% delle rotture, ef-
fettua una riparazione errata con una probabilità
pari a 0.20; laddetto B, che ripara il 60% delle
rotture, eettua una riparazione errata con prob-
abilità pari a 0.10; laddetto C, che ripara il 15%
delle rotture, eettua una riparazione errata con
probabilità pari a 0.10. In occasione di un con-
trollo alla fase produttiva un ispettore osserva una
riparazione, estratta in modo casuale.
1. Determinare la probabilità che lispettore os-
servi una riparazione errata.
2. Sapendo che lispettore ha osservato una ri-
parazione errata, dire quale addetto presenta
la probabilità maggiore di aver eettuato tale
riparazione e determinare tale probabilità.
Si tratta dellapplicazione del Teorema di Bayes
per ognuno dei 3 addetti. Indicando con R
3
levento riparazione e con E levento riparazione
errata, si ha:
P(R) P(E|R)
A 0.25 0.2
B 0.60 0.1
C 0.15 0.1
P(R) =
P(R
i
) P(E|R
i
) = (0.250.2)+(0.600.1)+(0.150.1) = 0.125
P(R
A
|E) =
P(R
A
) P(E|R
A
)
P(R
i
) P(E|R
i
)
=
0.250.2
(0.250.2)+(0.600.1)+(0.150.1)
= 0.4
P(R
B
|E) =
P(R
B
) P(E|R
B
)
P(R
i
) P(E|R
i
)
= 0.48
P(R
C
|E) =
P(R
C
) P(E|R
C
)
P(R
i
) P(E|R
i
)
= 0.12
Quindi, a seguito dellispezione, è maggiore la
probabilità che la riparazione errata sia stata
eettuata dalladdetto B.
Statistica Lez. 6
Campionamento
Popolazione Censimento
Perchè non si ricorre sempre a un censimento?
(Costi, tempi, popolazioni virtuali, vincoli tec-
nici, vincoli etici, ecc.)
Campionamento come rilevazione di un sot-
toinsieme rappresentativo della popolazione
Campionamento probabilistico (es., casuale sem-
plice, straticato, a grappoli)
Campionamento non probabilistico (es.,scelta
ragionata)
4
Statistica Lez. 6
Campionamento casuale semplice
Ogni unità ha la stessa probabilità di essere scelta
Tavola dei numeri casuali
Unità indipendenti e identicamente distribuite (i.i.d.)
5
Statistica Lez. 6
Tipologie di campionamento
Identichiamo la popolazione con unurna conte-
nente palline numerate da 1 a M e la pallina es-
tratta con lindividuo scelto
Distinguiamo vari tipi di campionamento e sec-
onda che la pallina dopo lestrazione sia rimessa
nellurna (estrazione con reimmissione) oppure no
(estrazione senza reimmissione)
Inoltre distinguiamo tra campioni estratti ordinati
o non ordinati
Abbiamo quindi 4 schemi di campionamento
ORDINATI NON
ORDINATI
CON RIPOSIZIONE M
n
M +n 1
n
SENZA RIPOSIZIONE
M!
(Mn)!
M
n
6
Statistica Lez. 6
Un campione di lunghezza n estratto dallurna può
essere indicato come (x
1
, x
2
, . . . , x
n
), dove ciascun
x
i
rappresenta il valore della i-esima estrazione e
ogni x
i
può assumere valori nellinsieme {1, 2, . . . , M}
Dierenza fra X e x
Primo caso: Disposizioni con ripetizione
Estrazione con riposizione e si dà importanza allordine.
Quanti gruppi di dimensione n si possono formare
da M elementi (associando ogni elemento con tutti
gli altri compreso sè stesso)
I casi possibili sono
M M . . . M = M
n
Esempio
Le combinazioni possibili al gioco del totocalcio
sono
3
13
= 1594323
7
Statistica Lez. 6
Secondo caso: Disposizioni semplici
Estrazione senza riposizione e si dà importanza
allordine.
da M elementi (i gruppi formati dieriscono per al-
meno un elemento o per lordine in cui compaiono)
I casi possibili sono
M (M 1) . . . (M n +1)
Esempio
Quanti numeri di sei cifre tutte diverse si possono
formare?
10 9 . . . 5 = 151200
Esempio
In quanti modi possibili si possono ordinare 12 per-
sone diverse?
12 11 10 . . . 2 1 = 479001600
8
Statistica Lez. 6
n fattoriale
Si indica con n! ed è il numero di permutazioni
di n oggetti, cioè in quanti modi posso ordinare n
oggetti
n fattoriale
n! = n (n 1) (n 2) 2 1
Le disposizioni semplici possono quindi essere riscritte
come
M!
(M n)!
.
9
Statistica Lez. 6
Terzo caso: Combinazioni semplici
Estrazione senza riposizione e non ha importanza
lordine.
da M elementi (i gruppi formati dieriscono per
almeno un elemento)
I casi possibili sono dunque
M (M 1) . . . (M n +1)
n!
.
Esempio Quante cinquine si possono formare nel
gioco del Lotto?
Sono i modi in cui si possono estrarre 5 palline da
unurna che ne contiene 90
90 89 . . . (90 5 +1)
5!
= 43949268
10
Statistica Lez. 6
Coeciente binomiale
Coeciente Binomiale
n
k
=
n!
(nk)!k!
numero di modi di estrarre k oggetti da un
gruppo di n
Le combinazioni semplici si possono riscrivere dunque
M
n
=
M (M 1) . . . (M n +1)
n!
=
M!
(M n)!n!
.
Proprietà di n! e
n
k
0! = 1
n
0
= 1
n
1
n
n 1
= n,
n
k
n
n k
11
Statistica Lez. 6
Esercizio Si supponga di estrarre, senza reinserirle
nel mazzo, 3 carte da un mazzo da 52 carte Francesi.
Si calcoli la probabilità di ottenere: a) esattamente
2 gure; b) gura alla seconda estrazione.
Le carte Francesi solo le usuali carte da Poker dove
per ogni segno (, , , ) vi sono 13 carte: quelle
con i numeri da 1 a 10 e poi le tre gure J, Q e K.
a) Si devono formare gruppi di 3 carte composti
da 2 gure e una non gura. I casi possibili sono i
modi in cui si estraggono 3 carte da un mazzo di 52,
senza dare importanza allordine, cioè
52
3
. I casi
favorevoli, consistono nello scegliere le 2 gure tra
le 12 disponibili e questo può essere fatto in
12
2
modi e una non gura tra le quaranta a disposizione

in
40
1
modi. Quindi
P(A) =
12
2
40
1
52
3
=
121110!
10!2!

4039!
39!1!
52515049!
49!32!
= 3
40 12 11
52 51 50
12
Statistica Lez. 6
b) In questo caso dobbiamo contare i casi possi-
bili in cui si possono estrarre tre carte in cui si dà
importanza allordine, essi sono 52 51 50 I casi
favorevoli sono invece 40 12 50 e 12 11 50, dati
da rispettivamente: non gura alla prima, gura
alla seconda e una cara qualunque alla terza, op-
pure gura alla prima, gura alla seconda e una
cara qualunque alla terza. La probabilità richiesta
è quindi
40 12 50
52 51 50
+
12 11 50
52 51 50
=
12 51
52 51
=
12
52
13
Statistica Lez. 6
Quarto caso: Combinazioni con ripetizione
da M elementi (i gruppi formati dieriscono per al-
meno un elemento, stavolta gli elementi si possono
ripetere)
M +n 1
n
Esempio Numero di casi che si possono presentare

lanciando due dadi e osservando il punteggio ot-
tenuto
7 6
2 1
= 21
14
Statistica Lez. 6
Esercizio
Unurna contiene 5 palline bianche, 6 nere, 4rosse.
Se ne estraggono 2. Calcolare la probabilità che
siano dello stesso colore distinguendo i casi (a) le
palline vengano estratte singolarmente rimettendo
la prima pallina estratta e (b) le palline vengano
estratte in coppia dallurna
Caso (a) P(due palline di stesso colore)
P((R, R) (B, B) (N, N))
= P(R, R) +P(B, B) +P(N, N)
=
4
15
2
+
5
15
2
+
6
15
2
= 0.342
Caso (b) P(due palline di stesso colore)
P((R, R) (B, B) (N, N))
= P(R, R) +P(B, B) +P(N, N)
=
4
15
3
14
+
5
15
4
14
+
6
15
4
14
= 0.295
15
Statistica Lez. 7
Modelli probabilistici variabili casuali
Le variabili casuali costituiscono il legame tra il cal-
colo della probabilità e gli strumenti di statistica
descrittiva visti no ad ora.
Idea: pensiamo al ripetersi di un esperimento ca-
suale in cui viene rilevata la distribuzione di un
fenomeno statistico
Possiamo considerare le frequenze relative osserva-
te sui dierenti valori come la probabilità con cui
questi valori possono presentarsi
Linsieme dei valori assumibili dal fenomeno sta-
tistico e le probabilità associate costituiscono un
modello del fenomeno
Le variabili casuali sono proprio tali modelli: studie-
remo le variabili casuali discrete (descrivono princi-
palmente fenomeni di conteggio) e le variabili ca-
suali continue (descrivono fenomeni che possiamo
misurare)
1
Statistica Lez. 7
Variabili casuali discrete
Dato un esperimento casuale i cui possibili esiti
sono in numero nito (o al più numerabile), una
variabile casuale è un risultato numerico attribuito
a ogni possibile esito di tale esperimento
Def: La variabile casuale è una funzione che asso-
cia ad ogni evento elementare un valore numerico
X : R
k
Esempio: abbiamo il seguente esperimento. Lan-
ciamo due volte una moneta regolare. Le proba-
bilità associate agli eventi elementari in un lancio
sono P(T) = P(C) =
1
2
.
Gli eventi elementari in due lanci sono
= {TT, TC, CT, CC}
Sia X il numero di teste ottenuto nei due lanci, la
variabile casuale assume i valori riportati in tabella
TT TC CT CC
P() 1/4 1/4 1/4 1/4
X() = x 2 1 1 0
2
Statistica Lez. 7
X rappresenta il risultato numerico dellesperimen-
to
Possiamo sintetizzare la tabella raccogliendo i va-
lori distinti assunti da X e le probabilità con cui
assume ogni valore
Abbiamo la tabella della distribuzione di proba-
bilità di X
X = x 0 1 2
P(X = x) 1/4 1/2 1/4 1
La rappresentazione graca della distribuzione di
probabilità è analoga a quella della distribuzione di
frequenza relativa per i caratteri discreti
3
Statistica Lez. 7
Riassumendo:
Una variabile casuale discreta è un modello ma-
tematico X
Assume i valori x
1
, x
2
, . . . , x
k
Con rispettive probabilità P(X = x
i
), i = 1, . . . , k.
Linsieme delle P(X = x
i
), i = 1, . . . , k si chiama
distribuzione di probabilità ed è tale per cui
k
i=1
P(X = x
i
) = 1
Possiamo scrivere X = {x
i
, P(X = x
i
), i = 1, . . . , k}
Quando si denisce una v.c. occorre sempre dare
i valori che assume e la distribuzione di probabilià
X = x x
1
x
2
. . . x
k
P(X = x) p
1
p
2
. . . p
k
1
4
Statistica Lez. 7
Esempio: consideriamo il lancio di due dadi e la
v.c. X somma dei punteggi realizzati con i due
dadi
= { 11, 12, 13, 14, 15, 16,
21, 22, 23, 24, 25, 26,
31, 32, 33, 34, 35, 36,
41, 42, 43, 44, 45, 46,
51, 52, 53, 54, 55, 56,
61, 62, 63, 64, 65, 66}
La variabile X può assumere uno dei valori tra 2 e
12 e la distribuzione di probabilità è
X = x 2 3 4 5 6 7 8 9 10 11 12
P(X = x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
1
La rappresentazione graca della distribuzione
5
Statistica Lez. 7
Esempio: Popolazione di 5 individui (5 aziende) di
cui vogliamo studiare un certa caratteristica (nu-
mero di dipendenti). Eettuiamo un campiona-
mento rilevando il dato solo su 3 aziende. Sia-
mo interessati al numero mediano di dipendenti.
Trovare la distribuzione di tale numero.
Supponiamo che le aziende abbiano {1, 3, 5, 7, 9}
dipendenti (a noi non è noto). I possibili campioni
che si possono estrarre sono
5
3
=
5 4 3!
3! 2!
= 10
= {(1, 3, 5), (1, 3, 7), (1, 3, 9), (1, 5, 7), (1, 5, 9),
(1, 7, 9), (3, 5, 7), (3, 5, 9), (3, 7, 9), (5, 7, 9)}
Ciascun evento ha probabilità 1/10 di comparire
(P() = 1/10)
Costruiamo la variabile casuale X = mediana cam-
pionaria
La mediana vera della popolazione è 5
La v.c. X assumerà valori diversi a seconda del
campione estratto.
Vogliamo calcolare la sua distribuzione
6
Statistica Lez. 7
Associamo ad ogni elemento dello spazio cam-
pionario il valore della Media campionaria X()
X()
(1,3,5) 3
(1,3,7) 3
(1,3,9) 3
(1,5,7) 5
(1,5,9) 5
(1,7,9) 7
(3,5,7) 5
(3,5,9) 5
(3,7,9) 7
(5,7,9) 7
Per cui la variabile casuale X risulta avere la se-
guente distribuzione
x P(X = x)
3 3/10
5 4/10
7 3/10
La frequenza con cui ci aspettiamo che un certo va-
lore x
i
della mediana si realizzi è pari alla probabilità
dellevento P(X = x
i
).
7
Statistica Lez. 7
Variabili Casuali, fenomeni e osservazioni
I fenomeni statistici sono descritti teoricamente dal-
le variabili casuali
Noi abbiamo visto che un fenomeno statistico os-
servato ha una distribuzione
Anche la variabile casuale che descrive quel fenome-
no ha una distribuzione (di probabilità)
La distinzione fondamentale è che la distribuzione
di probabilità ci dice con quali probabilità osserve-
remo certi valori del fenomeno, mentre la distri-
buzione di frequenza fotografa quanto è accadu-
to allinterno di un particolare campione di dati di
ampiezza n
Nota la distribuzione di probabilità di una v.c. pos-
siamo calcolare probabilità del tipo P(X x). Nel-
lesempio precedente:
P(X 5) = P(X = 3) +P(X = 5)
=
3
10
+
4
10
=
7
10
= 0.7
In termini più generali si può usare la formula
P(X x) =
x
i
x
P(X = x
i
)
8
9
10
Statistica Lez. 7
Le variabili casuali continue sono denite a partire
dallinsieme dei valori assumibili e dalle probabilità
del tipo P(X x)
Queste probabilità sono espresse attraverso la fun-
zione f(), detta densità di probabilità, come
P(X x) =
x
f(u)du
Questa è unestensione della formula
P(X x) =
x
i
x
P(X = x
i
)
Calcolare lintegrale corrisponde a calcolare larea
sotto la curva f() stessa. In generale non dovre-
mo mai calcolare questi integrali perche esistono
le tavole che contengono i valori di quegli integrali
per i vari valori di x
Esempio: Sia X la variabile casuale che assume i
valori (0, 360) con funzione di densità f(x) =
1
360
.
Abbiamo
P(X x) =
x
1
360
du =
1
360
x
11
Statistica Lez. 7
Ad esempio se X ha densità f() abbiamo
P(X 1) =
1
f(u)du = AREA 1
Il tratteggio rappresenta lAREA 1
Esempio: continua esempio
P(X 90) =
x
0
1
360
du =
1
360
90 =
1
4
12
Statistica Lez. 7
Possiamo anche calcolare:
P(2 < X 1) =
1
2
f(u)du = AREA 2
P(X > 1) =
+
1
f(u)du = AREA 3
13
Statistica Lez. 7
Riassumendo:
Una variabile casuale continua è un modello
matematico X
`
E dotata di una densità f(x) tale che
f(x) 0 e
f(u)du = 1
Per calcolare le probabilità con cui la v.c. con-
tinua assume valori in un intervallo si utilizza la
funzione di distribuzione o ripartizione
F(x) = P(X x) =
x
f(u)du
Le probabilità sono calcolate come
P(a < X b) = F(b) F(a)
Attenzione: per le variabili casuali continue si ha
sempre P(X = x) = 0
14
Statistica Lez. 8
Quali argomenti abbiamo trattato
Statistica descrittiva: quali informazioni trarre
da un insieme di unità (popolazione o campi-
one)
Calcolo delle probabilità: come quanticare lin-
certezza riguardo al vericarsi di certi eventi
Quali argomenti tratteremo
Variabili casuali (discrete e continue): legame
tra stat. descrittiva e probabilità
Distribuzioni discrete e continue
Inferenza Statistica: stimatori, intervalli di con-
denza e veriche di ipotesi
Modello di regressione lineare semplice: relazione
tra X e Y analizzata da un punto di vista de-
scrittivo e inferenziale
1
Statistica Lez. 8
Valore atteso e varianza
La media di una variabile casuale viene anche chia-
mata valore atteso
Per le v.c. discrete è denito come
= E(X) =
k
i=1
x
i
P(X = x
i
)
Si noti lanalogia con la media aritmetica
x =
k
i=1
x
i
f
i
Per le v.c. continue
= E(X) =
xf(x)dx
La varianza per le v.c. discrete è denita
2
= Var(X) =
k
i=1
(x
i
)
2
P(X = x
i
)
analogamente al caso della statistica descrittiva
2
=
k
i=1
(x
i
x)
2
f
i
2
Statistica Lez. 8
Mentre per le v.c. continue
2
= Var(X) =
(x )
2
f(x)dx
Esempio: calcoliamo il valore atteso e la varianza
della variabile casuale Mediana campionaria.
La distribuzione è
x P(X = x)
3 3/10
5 4/10
7 3/10
= E(X) =
3
i=1
x
i
P(X = x
i
)
= 3
3
10
+5
4
10
+7
3
10
=
9 +20 +21
10
= 5
Var(X) =
3
i=1
(x
i
)
2
P(X = x
i
)
= (3 5)
2
3
10
+(5 5)
2
4
10
+(7 5)
2
3
10
=
12 +12
10
= 2.4
3
Statistica Lez. 8
Esempio: calcoliamo il valore atteso e la vari-
anza della variabile casuale somma dei punteggi
realizzati con due dadi
La distribuzione è
X = x 2 3 4 5 6 7 8 9 10 11 12
P(X = x)
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
1
= E(X) =
11
i=1
x
i
P(X = x
i
) = 7
La varianza possiamo riscriverla come
Var(X) =
k
i=1
(x
i
)
2
P(X = x
i
)
=
k
i=1
x
2
i
P(X = x
i
)
2
In analogia al caso della statistica descrittiva
2
=
k
i=1
x
2
i
f
i
( x)
2
Abbiamo quindi per X
Var(X)
11
i=1
x
2
i
P(X = x
i
)(7)
2
= 54.8349 = 5.83
4
Statistica Lez. 8
Esempio: calcoliamo il valore atteso e la varianza
della variabile casuale continua X che indica i gradi
di una freccia fatta girare su una ruota. Abbiamo
visto che i valori possibili sono = [0, 360], mentre
la densità è f(x) =
1
360
. Il valore atteso è
= E(X) =
360
0
x
1
360
du =
1
2
x
2
1
360
360
0
= 180
Anche per le v.c. continue possiamo calcolare la
varianza in un modo più semplice
2
=Var(X)=
(x)
2
f(x)dx =
x
2
f(x)dx
2
Quindi per il calcolo della varianza calcoliamo prima
360
0
x
2
1
360
du =
1
3
x
3
1
360
360
0
=
360
2
3
La varianza è data da
2
X
=
360
2
3
(180)
2
= 10800
5
Statistica Lez. 8
Proprietà di Media e Varianza
Sia X una v.c. tale che = E(X) e
2
X
= Var(X)
Sia Y una v.c denita come Y = a +b X, allora
E(Y ) = E(a +b X) = a +b E(X)
e
2
Y
= Var(Y ) = Var(a +b X) = b
2
Var(X) = b
2
2
X
Se X ed Y sono due v.c. allora
E(X +Y ) = E(X) +E(Y )
Variabili Casuali Indipendenti
Due variabili casuali discrete
X = {x
i
, P(X = x
i
), i = 1, . . . , h}
Y = {y
j
, P(Y = y
j
), j = 1, . . . , h}
si dicono indipendenti se e solo se i, j
P(X = x
i
, Y = y
j
) = P(X = x
i
) P(Y = y
j
)
Se X ed Y sono anche indipendenti si ha che
Var(X +Y ) = Var(X) +Var(Y )
6
Statistica Lez. 8
Distribuzioni discrete
D. Bernoulli
D. Binomiale
D. Uniforme discreta
D. Poisson
D. Binomiale Negativa
. . .
7
Statistica Lez. 8
Distribuzioni continue
D. Normale
D.
2
D. t di Student
D. F di Snedecor
D. Uniforme
. . .
8
Statistica Lez. 8
La variabile casuale Binomiale
Si costruisce a partire dalla nozione di esperimento
casuale Bernoulliano che consiste in un insieme di
prove ripetute con le seguenti caratteristiche:
i) ad ogni singola prova si hanno solo 2 esiti pos-
sibili, chiamati successo ed insuccesso
ii) la probabilità dellevento che dà origine al suc-
cesso è costante
iii) i risultati delle prove sono indipendenti
La v.c. che descrive ogni singola prova, è la v.c. di
Bernoulli
X =
1 P(X = 1) = p
0 P(X = 0) = 1 p
0 < p < 1
Si scrive anche X Ber(p)
Abbiamo che
E(X) = p e Var(X) = p(1 p)
9
Statistica Lez. 8
In genere si è interessati a sapere quante volte si
ottiene un successo su n prove, cioè si è interessati
a conoscere la probabilità con cui si ottengono un
certo numero k di successi su n
Ad esempio con quale probabilità possiamo ottenere
2 successi (T) nel lancio di una moneta 6 volte?
Sia X
i
la variabile di Bernoulli che vale 1, con
probabilità p, se alla prova numero i otteniamo un
successo (p =
1
2
)
La due sequenze di lanci
110000 100100
hanno la stessa probabilità di vericarsi
P(110000)
= P(X
1
=1, X
2
=1, X
3
=0, X
4
=0, X
5
=0, X
6
=0)
= P(X
1
= 1)P(X
2
= 1)P(X
3
= 0)P(X
4
= 0)P(X
5
= 0)P(X
6
=
= pp(1 p)(1 p)(1 p)(1 p)
= p
2
(1 p)
4
10
Statistica Lez. 8
Per la seconda
P(100100)
= P(X
1
=1, X
2
=0, X
3
=0, X
4
=1, X
5
=0, X
6
=0)
= P(X
1
= 1)P(X
2
= 0)P(X
3
= 0)P(X
4
= 1)P(X
5
= 0) P(X
6
=
= p(1 p)(1 p)p(1 p)(1 p)
= p
2
(1 p)
4
Le sestine possibili sono
110000 101000 100100 100010 100001
011000 010100 010010 010001 001100
001010 001001 000110 000101 000011
Vale a dire
6
2
=
6 5 4!
4! 2!
= 15
i modi in cui possiamo scegliere 2 posizioni tre le 6
In denitiva
P(2 succ. su 6) = P(110000) + +P(000011)
= p
2
(1 p)
4
+ +p
2
(1 p)
4
= 15p
2
(1 p)
4
=
6
2
p
2
(1 p)
62
11
Statistica Lez. 8
In generale la v.c. che conta il numero di successi
in n prove bernoulliane si chiama v.c. Binomiale
La v.c. Binomiale è ottenuta come la somma di n
variabili casuali Y
i
di tipo Bernoulli, indipendenti e
di parametro p, cioè se
Y
1
Ber(p), . . . , Y
n
Ber(p)
allora
X =
n
i=1
Y
i
si dice variabile casuale Binomiale e si indica con
X Bin(n, p) n e p sono i parametri della v.c. e
rappresentano il numero di prove e la probabilità di
successo in una prova
La v.c. Binomiale assume tutti i valori interi da 0
ad n ad ha distribuzione di probabilità
P(X = k) =
n
k
p
k
(1 p)
nk
, k = 0, 1, . . . , n
E(X) = np
Var(X) = np(1 p)
12
Statistica Lez. 8
Esempio: Tra gli anni 60 e 80 le giurie popolari
negli stati del sud degli USA contenevano non più
di 4 giurati afro-americani. Si può ritenere che i
giurati siano eletti in modo casuale sapendo che la
popolazione in quegli stati e in quel periodo era per
circa il 50% composta da persone afro-americane?
Sia X la variabile casuale che conta il numero di
afro-americani in una giuria di 80 persone, X è una
variabile casuale Binomiale di parametri n = 80 e
p = 0.5
Si fanno 80 estrazioni e il successo è rappresentato
dallevento persona afro-americana estratta.
Calcoliamo la probabilità che in una giuria vi siano
meno di 4 persone afro-americane
P(X 4) = P(X = 0) +P(X = 1) +P(X = 2) +
+P(X = 3) +P(X = 4)
=

4
k=0
80
k
0.5
k
0.5
80k
0.0000000000000000014
13
Statistica Lez. 8
Esempio Un processo produttivo produce compo-
nenti che possono presentare due tipi di difetti A,
B. La probabilità che venga prodotto un pezzo con
tutti e due i difetti è P(A B) = 0.1. Le proba-
bilità di ottenere pezzi con uno dei due difetti sono
P(A) = P(B) = 0.4. Calcolare
a) la probabilità di ottenere un pezzo con almeno
un difetto;
b) la probabilità di ottenere un pezzo senza difetti;
c) la probabilità che su 10 pezzi tre siano esenti
da difetti nellipotesi che i pezzi siano prodotti in-
dipendentemente luno dallaltro
a) Dobbiamo calcolare
P(A B) = P(A) +P(B) P(A B)
0.4 +0.4 0.1 = 0.7
b) Dobbiamo calcolare
P(A
c
B
c
) = 1 P(A B) = 0.3.
c) Consideriamo la v.c X che conta il numero di
pezzi senza difetti su unestrazione di 10 pezzi. Si
tratta di una v.c Binomiale con parametri p = 0.3
e n = 10. La probabilità richiesta è data da
P(X = 3) =
10
3
0.3
3
0.7
7
= 0.266.
14
Statistica Lez. 9
La variabile casuale Normale o Gaussiana
Una variabile casuale continua è ben denita quan-
do:
i) si specica lintervallo di valori che può assumere
ii) viene indicata la sua funzione di densità
La variabile casuale Normale standard ha densità
f(x) =
1
2
e
x
2
2
, x R
Da dove viene questa forma?
Gauss è il padre di tale distribuzione e ne forn`
una derivazione partendo dallosservazione di mis-
ure siche
Se m è la vera misura delloggetto, eseguiamo n
misurazioni x
i
, gli errori di misura sono deniti
come
e
i
= x
i
m
Raccogliamo per n grande i valori di e
i
in una
tabella di frequenza
1
Statistica Lez. 9
La distribuzione di frequenza degli errori (allisciata)
è proprio il graco della densità Gaussiana
La variabile casuale Normale standard si indica con
Z ovvero con N(0, 1) ed ha le seguenti proprietà
i) E(Z)=0
ii) Var(Z) = 1
Scriveremo Z N( = 0,
2
= 1) o
Z N( = 0, = 1)
2
Statistica Lez. 9
Come calcoliamo probabilità del tipo P(a < Z < b)?
Ricordiamo che come per tutte le variabili aleatorie
continue si ha sempre P(Z = z) = 0
Utilizziamo le tavole della Normale
Si tratta di una tabella dove per ogni valore di z è
riportato il valore di
(z) = P(Z < z)
Possiamo calcolare tutte le probabilità
P(a < Z < b) = P(Z < b) P(Z a)
= (b) (a)
Ci aiutiamo con le gure
=
(b) (a) = (b) (a)
3
Statistica Lez. 9
Inoltre
P(Z > z) = 1 P(Z z) = 1 (z)
Se abbiamo le tavole solo per i valori positivi di Z
sfruttiamo la simmetria della curva
se z < 0 P(Z < z) = 1 P(Z z) (z > 0!!!)
se z < 0 P(Z > z) = P(Z < z) (z > 0!!!)
4
Statistica Lez. 9
Esempio: calcolare le seguenti probabilità
P(Z < 2.03)
P(1 < Z < 2.5)
P(Z > 1.53)
P(Z < 2.57)
P(1 < Z < 1)
P(Z > 3)
P(Z < 5)
5
Statistica Lez. 9
In generale esistono v.c. Normali per ogni valore
dei parametri e Tali v.c. si indicano con X
N(,
2
) o X N(, ) e hanno densità
f(x) =
1
2
2
e
(x)
2
2
2
x R
6
Statistica Lez. 9
Per una v.c. X N(, ) abbiamo che E(X) =
e Var(X) =
2
Se X è una Gaussiana di media 1 e varianza 4,
X N(1, 2), come calcoliamo P(X < 3)?
Se X ha media , allora X avrà media nulla,
infatti
E(X ) = E(X) = = 0
Se X ha varianza pari a
2
allora X/ ha varianza
1, infatti
Var(X/) =
1
2
Var(X) =

2
2
= 1
Se mettiamo assieme le due operazioni abbiamo
che
Z =
X
è tale che E(Z) = 0 e Var(Z) = 1

E quindi:
P(X < 3) = P
<
3
= P
Z <
31
2
= P(Z < 1) = (1) = 0.84134

7
Statistica Lez. 9
Sia X N(,
2
)
Calcolare le probabilità P( k<X< +k)
k = 1 P(|X | < ) = P( <X< +)
k = 2 P(|X | < 2) = P( 2<X< +2)
k = 3 P(|X | < 3) = P( 3<X< +3)
P(|X | < ) = P
<
X
<
+
= P(1 < Z < 1) = (1) (1)

= 0.84134 0.15866 0.68
P(|X | < 2) = P
<
X
<
+2
= P(2 < Z < 2) = (2) (2)

= 0.97725 0.02275 0.95
P(|X | < 3) = P
<
X
<
+3
= P(3 < Z < 3) = (3) (3)

= 0.99865 0.00135 0.997
8
Statistica Lez. 9
Proprietà della variabile casuale Gaussiana
Sia X N(,
2
) allora anche una trasformazione
lineare di X è ancora Gaussiana. Vale a dire:
se a e b sono due numeri non aleatori si ha che
Y = a +bX N(a +b , b
2
2
)
Somma di v.c. Gaussiane indipendenti sono ancora
v.c. Gaussiane. Vale a dire:
se X N(
1
,
2
1
) e Y N(
2
,
2
2
) sono indipendenti
allora
W = X +Y N(
1
+
2
,
2
1
+
2
2
)
9
Statistica Lez. 9
Esempio: la distribuzione delle altezze della popo-
lazione dei coscritti alla leva del 1960 si può as-
sumere che segua una legge normale di media =
172.7 cm e scarto quadratico medio = 6.7 cm.
Estratto a caso un individuo da questa popolazione,
calcolare la probabilità che
a) questo individuo ha unaltezza pari allaltezza
media della popolazione;
b) la sua altezza è inferiore allaltezza media della
popolazione;
c) la sua altezza è superiore a 152 cm;
d) supponendo che tutti gli individui della popo-
lazione portino scarpe con un tacco di 10 cm,
con che probabilità laltezza (con scarpe ai pie-
di) dellindividuo estratto è superiore a 162 cm.
10
Statistica Lez. 9
Indichiamo con X la variabile altezza dellindividuo.
Abbiamo che
X N(172.7, 6.7)
a) Poiche X è una variabile casuale continua
P(X = ) = 0
b) Dobbiamo calcolare P(X < ), per la simmetria
della v.c.
P(X < ) =
1
2
c) Dobbiamo calcolare P(X > 152)
P(X > 152) = 1 P(X > 152) = 1 P(X 152)
= 1P(X < 152) = 1P
<
152
= 1 P
Z <
152
= 1
152
= 1
152172.7
6.7
= 1 (3.1)
= 1 0.00097 = 0.99903 1,
d) Sia Y = X +10, Y N(182.7, 6.7)
P(Y > 162) = P(X +10 > 162)
= P(X > 152) = 0.99903 1,
11
Statistica Lez. 9
Approssimazione della Binomiale con la
Gaussiana
Ricordiamo che la v.c. binomiale conta il numero
di successi in n prove Bernoulliane e la sua dis-
tribuzione è
P(X = k) =
n
k
p
k
(1 p)
nk
, k = 0, 1, . . . , n
La media è E(X) = np mentre la varianza vale
Var(X) = np(1 p)
Quando il numero di prove n è troppo elevato
il calcolo dei coecienti binomiali genera numeri
intrattabili
Si può dimostrare che la variabile X per n grande
tende ad assumere la forma di una gaussiana. Pre-
cisamente
X E(X)
Var(X)
=
X np
np(1 p)
N(0, 1)
Allora possiamo calcolare la probabilità di eventi
che riguardano la X ricorrendo allapprossimazione
con una v.c. Gaussiana. Lapprossimazione vale
per p = 0.5 se n > 30, se p = 0.5 per np 5 e
n(1 p) 5
12
Statistica Lez. 9
Esempio: un venditore contatta dei clienti e me-
diamente conclude una vendita 1 volta su 8. Cal-
colare in modo approssimato la probabilità che su
100 clienti si concludano tra 6 e 10 vendite.
Il numero di vendite è una v.c. X Bin(n =
100, p =
1
8
). Dobbiamo calcolare P(6 X 10).
Poiche np = 100
1
8
= 12.5 5 e n(1p) = 100
7
8
=
87.5 5, utilizziamo lapprossimazione di X alla
Gaussiana
P(6X10) = P
612.5
3.307
X np
np(1p)
1012.5
3.307
P(1.97 < Z < 0.76)

= (0.76) (1.97)
= (1 (0.76)) (1 (1.97))
= (1 0.77637) (1 0.97558)
= 0.19921
13
Statistica Lez. 9
Teorema del Limite Centrale
Quanto visto per la variabile casuale Binomiale è in
realtà un caso particolare di un risultato assai più
generale
Consideriamo n v.c. X
i
i.i.d. (indipendenti ed
identicamente distribuite), con stessa media e
varianza
2
nite.
Allora abbiamo che, posto Y =
n
i=1
X
i
E(Y ) = nE(X
i
) = n
Var(Y ) = nVar(X
i
) = n
2
Il teorema del limite centrale aerma che
Z =
Y E(Y )
Var(Y )
=
n
i=1
X
i
n
n
2
N(0, 1)
14
Statistica Lez. 9
La variabile t di Student
f(x; k) =
k+1
2
k
2
k
1
1 +
x
2
k
k+1
con < x <
E(X) = 0
var(X) =
k
k2
(con k > 2)
Se indichiamo con T
n1
la v.c t di Student con
n 1 gradi di libertà abbiamo che
P
T
n1
< t
(n1);1
= 1
Quel valore di t si deve cercare nella tavola della
tabella che riporta i valori della t di Student.
1
Statistica Lez. 9
La distribuzione t di Student è molto simile ad
una Gaussiana per forma ma è leggermente più
appiattita
La variabile t di Student e la N(0, 1)
2
Statistica Lez. 9
Per trovare il quantile della distribuzione t di Stu-
dent si procede come per i quantili della distribuzione
gaussiana. Larea tratteggiata corrisponde a
p = P (T
g
< t
g;p
)
dove g sono i gradi di libertà e p la probabilità
3
Statistica Lez. 9
La variabile Chi quadro
f(x; g) =
1
2
g/2
(g/2)
x
(g/2)1
e
(1/2)x
con 0 < x <
Si indica con
2
g
dove g sono i gradi di libertà.
E(
2
) = g
Var(
2
) = 2g
g determina la forma; per g grande si ottiene la
distribuzione Normale
4
Statistica Lez. 9
I graci per g = 1, g = 4 e g = 10 sono riportati di
seguito
10
5
Statistica Lez. 10
Inferenza Statistica
Insieme delle procedure in cui si utilizzano metodi
statistici per trarre conclusioni (inferenze) su una
popolazione a partire da un campione da questa
estratto con metodi probabilistici.
LInferenza s. impiega i concetti e gli strumen-
ti probabilistici, con una logica opposta a quella
impiegata dal Calcolo delle Probabilità.
Mentre la teoria della probabilità stabilisce i risul-
tati che ci si può attendere da un esperimento,
linferenza statistica si serve dei risultati dellesper-
imento per cercare di costruire o interpretare la
legge che sta dietro ai risultati sperimentali ottenuti
(inferire).
1
Statistica Lez. 10
Spesso linformazione a disposizione deriva da unosser-
vazione parziale del fenomeno studiato.
In questo caso lo studio di un fenomeno mira solita-
mente a trarre, sulla base di ciò che si è osservato,
considerazioni di carattere generale.
Per sua natura il processo di inferenza è soggetto
ad errore, che può essere tenuto sotto controllo, o
almeno quanticato.
Fasi del processo di inferenza (in generale)
denizione del problema
individuazione di un opportuno modello teorico
estrazione del campione
raccolta e analisi dei dati
generalizzazione
2
Statistica Lez. 10
POPOLAZIONE: collettivo di unità con riferimen-
to alle quali si è interessati a studiare un certo
fenomeno (un carattere, la relazione tra due o più
caratteri, ecc.)
PARAMETRO: caratteristica numerica di sintesi
della popolazione oggetto di studio, non nota è
la quantità sulla quale si desiderano acquisire infor-
mazioni
Esempio 1: previsioni elettorali ad un referendum
abrogativo
popolazione = linsieme di tutti i potenziali elettori
parametro di interesse = percentuale di elettori che
voteranno SI
Come eettuare questa previsione? considerare so-
lo una parte della popolazione e intervistarla sul vo-
to sulla base di questo STIMARE il valore riferito
allintera popolazione
3
Statistica Lez. 10
Esempio 2 Auditel garantisce una stima statistica
dellascolto della televisione in Italia.
Perche Auditel? Perchè la misurazione degli ascolti
è fondamentale per la pianicazione degli spazi pub-
blicitari
Si basa su un panel rappresentativo della popo-
lazione italiana (per caratteristiche geograche, de-
mograche e socioculturali). La dispersione ter-
ritoriale del panel consente di coprire circa 2.090
degli 8.100 comuni italiani.
Il meter, rileva automaticamente ogni giorno, min-
uto per minuto, lascolto di tutti i canali di qualunque
televisore che sia in funzione nellabitazione delle
famiglie campione.
Il dato sullo share, contatti ecc. diuso giornal-
mente si basa su procedure inferenziali e si riferisce
allintera popolazione italiana.
4
Statistica Lez. 10
Fasi del processo di inferenza (più formalmente)
1. estrazione di un campione della popolazione
2. calcolo delle statistiche campionarie, cioè dei
valori corrispondenti ai dati contenuti nel campione
3. stima dei parametri nella popolazione in base ai
risultati forniti dal campione (stima puntuale, stima
intervallare).
4. si vericano delle ipotesi sui parametri
5. si valuta il grado di accuratezza delle inferenze
5
Statistica Lez. 10
Terminologia:
Campione casuale x
1
, x
2
, . . . , x
n
: collezione di n
osservazioni (o determinazioni) i.i.d. estratte in
modo casuale da una variabile casuale X con fun-
zione di densità di probabilità: f(x;
1
, . . . ,
k
), dove
1
,
2
, . . . ,
k
sono i parametri della distribuzione di
probabilità, cioè delle quantità che, in numero limi-
tato, identicano la distribuzione stessa. Sulla base
di n osservazioni x
1
, x
2
, . . . , x
n
vogliamo risalire al
modello, cioè alla conoscenza di X.
Ipotesi fondamentale: i.i.d.
Spazio campionario X: insieme cui appartengono
le determinazioni campionarie.
Famiglia di distribuzioni di probabilità su X
F
(X): famiglia, nota nella forma, di distribuzioni

di probabilità sullo spazio campionario, dipendenti
dai parametri
1
,
2
, . . . ,
k
.
Spazio parametrico : insieme in cui variano i
parametri
1
,
2
, . . . ,
k
che individuano la distribu-
zione di probabilità allinterno di F
(X).
6
Statistica Lez. 10
Esempio 3: Campione di persone che fanno ac-
quisti in un supermercato e analisi di tale insieme
per stabilire quale sia la proporzione di individui
che pagano con carte di credito sulla totalità degli
individui che acquistano con regolarità nel super-
mercato
Sol. probabilistica: calcolo della percentuale di per-
sone che pagano con carte di credito e/o ricorso al
modello binomiale
X =
_
1 P(X = 1) = p Acquisto con carta
0 P(X = 0) = 1 p Non acquisto con carta
Sol. inferenziale: linferenza statistica, invece, uti-
lizza i risultati del campione per valutare la frazione
incognita di persone che pagano con carte di cre-
dito nellintera popolazione di individui che acqui-
stano con regolarità nel supermercato p
N.B. In genere p = p
7
Statistica Lez. 10
Esempio 4: supponiamo che la resistenza alla
compressione di tipo di calcestruzzo sia una v.c. X
gaussiana con media incognita e varianza
2
= 4.
Scriveremo X N(,
2
). Supponiamo di osser-
vare la resistenza alla compressione su n campi-
oni di quel tipo di calcestruzzo. Indichiamo con
x
1
, x
2
, . . . , x
n
i valori osservati. Sulla base di questi
valori vogliamo risalire al valore incognito di .
8
Statistica Lez. 10
Stima Puntuale
Statistiche campionarie t(x
1
, . . . , x
n
) : sono le
funzioni dei dati campionari x
1
, x
2
, . . . , x
n
che non
dipendono dai parametri
1
,
2
, . . . ,
k
.
Uno stimatore

è una statistica (ed una v.c.), ma
non è vero il viceversa.
Stimatore: viene impiegato per stimare il o i parametri
incogniti.
Stima: il valore che assume dopo lestrazione di un
campione casuale.
In generale, la stima cambia valore al variare del
campione estratto dalla popolazione
9
Statistica Lez. 10
Proprietà
1) Errore quadratico medio:
MSE(
)=E[(
)
2
] = E[( E(
))
2
] +E[(
E(
))
2
] =
E[(
) ]
2
+var(
)
2) Non distorsione o correttezza: E(
) =
3) Ecienza: var(
) var(
)
Supponiamo di avere estratto un campione casuale
e sulle determinazioni calcoliamo la MEDIA CAM-
PIONARIA e la VARIANZA CAMPIONARIA
Su queste due quantità calcoliamo di loro valori di
sintesi principali: la media e la varianza.
10
Statistica Lez. 10
Variabile casuale media campionaria
Abbiamo un modello X di cui non conosciamo la
media E(X) = . è lincognita da stimare. Siano
x
1
, x
2
, . . . , x
n
le osservazioni di X.
Denotiamo con X
1
, X
2
, . . . , X
n
un campione i.i.d.
di cui x
1
, x
2
, . . . , x
n
sono la realizzazione. La media
campionaria è denita come
X
n
=
1
n
n
i=1
X
i
Stimeremo quindi il valore incognito con
=
1
n
n
i=1
x
i
Proprietà della media campionaria
Se E(X
i
) = e Var(X
i
) =
2
allora
E(

X
n
) = e Var(

X
n
) =

2
n
Infatti
E(

X
n
) =
1
n
E
_
_
n
i=1
X
i
_
_
=
1
n
n
i=1
E(X
i
) =
1
n
n =
Var(

X
n
)=
1
n
2
Var
_
_
n
i=1
X
i
_
_
=
1
n
2
n
i=1
Var(X
i
)=
n
2
n
2
=
2
n
11
Statistica Lez. 10
Esempio: consideriamo la variabile casuale X avente
distribuzione
x
i
1 2 3
p
i
1/3 1/3 1/3
Abbiamo: E(X) = = 2 e Var(X) =
2
= 2/3.
Estraiamo un campione di numerosità 2 con ripo-
sizione. I campioni possibili sono
(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); (3, 3)
Consideriamo la v.c.

X
n
. La sua distribuzione è
x
i
1 1.5 2 2.5 3
p
i
1/9 2/9 3/9 2/9 1/9
E(

X
n
) = 2 = , e Var(

X
n
) = 1/3 =
2
/2
12
Statistica Lez. 10
Esempio: un laboratorio produce molle per orologi
con due macchine diverse denotate con A e B. La
seguente tabella riporta i dati delle resistenze delle
molle prodotte dalle due macchine.
A 22 25 24 25 25 27 26 26 22 26 23 25
B 23 24 23 26 24 22 25 24 24
Stimare la media incognita delle resistenza delle
molle prodotte dalle due macchine
Denotiamo con X
A
e X
B
rispettivamente i model-
li per la resistenza delle molle prodotte rispettiva-
mente dalla macchina A e dalla macchina B.
La media E(X
A
) =
A
e E(X
B
) =
B
sono incog-
nite. Le stimiamo rispettivamente con la media
campionaria calcolata per i due gruppi:

A
=
1
n
12
i=1
x
A
i
= 24.67

B
=
1
n
9
i=1
x
B
i
= 23.89
Queste sono le stime puntuali per la media incog-
nita delle popolazioni considerate.
13
Statistica Lez. 10
N.B. Si faccia attenzione tra:
1. la media incognita
2. la media campionaria stimatore
1
n
X
i
3. la media stimata
1
n
x
i
4. la media ( o v.a.) dello stimatore E
_
1
n
X
i
_
14
Statistica Lez. 10
Variabile casuale varianza campionaria
Supponiamo ora che del modello X sia incognita
la varianza
2
. Se, come prima, X
1
, X
2
, . . . , X
n
è
un campione i.i.d. allora la varianza campionaria è
denita come
S
2
n
=
1
n 1
n
i=1
(X
i

X
n
)
2
Stimeremo il valore incognito
2
con
2
= s
2
n
=
1
n 1
n
i=1
(x
i
x
n
)
2
Si verica che
E(S
2
n
) =
2
, Var(S
2
n
) =
1
n
_
n 3
n 1
4
_
15
Statistica Lez. 10
Gradi di libertà
Lo scopo dellinferenza statistica è quello di uti-
lizzare linformazione racchiusa in un campione di
dati per stimare il valore di alcuni parametri riferiti
allintera popolazione.
Per questo motivo quando viene considerato il cam-
pione, non si fa riferimento al numero dei casi, ma
ai gradi di libertà.
Lidea è quella di calcolare le statistiche utilizzando
soltanto il numero di osservazioni indipendenti con-
sentendo in questo modo di ottenere dei risultati
più attendibili.
I gradi di libertà esprimono il numero di dati eet-
tivamente disponibili per valutare la quantità din-
formazione contenuta nella statistica, che possono
anche essere ottenuti dalla dierenza fra il numero
di casi e le statistiche presenti nel calcolo.
16
Statistica Lez. 10
Riprendiamo lesempio e calcoliamo la distribuzione
di S
2
campione (x
i
) x
i
s
2
i
1 1 1 0
1 2 1.5 0.5
1 3 2 2
2 1 1.5 0.5
2 2 2 0
2 3 2.5 0.5
3 1 2 2
3 2 2.5 0.5
3 3 3 0
La distribuzione è
s
2
i
0 0.5 2
p
i
3/9 4/9 2/9
Da cui E(S
2
n
) = 2/3 =
2
17
Statistica Lez. 10
Esempio: (continua) stimare la varianza incogni-
ta per la varianza della resistenza delle molle prodotte
dalle due macchine A e B.
2
A
=
1
n 1
(
x
2
Ai
n( x
A
)
2
)
=
1
11
(7330 12(24.67)
2
) = 2.61
2
B
=
1
n 1
(
x
2
Bi
n( x
B
)
2
)
=
1
8
(5147 9(23.89)
2
) = 1.36
Si noti che le due stime ottenute sono diverse dalla
varianza che era stata calcolata precedentemente
2
A
=
1
n
x
2
i
n
i
( x
A
)
2
=
1
12
7330(24.67)
2
= 2.39
Facendo i conti analoghi per il gruppo B si trova
2
B
= 1.21.
Le stime ottenute si chiamano non distorte in
quanto il valore atteso degli stimatori è uguale al
parametro da stimare.
18
Statistica Lez. 10
Casi particolari importanti
Fino ad ora non abbiamo fatto nessuna ipotesi sulla
distribuzione del modello X. Abbiamo solo suppos-
to che la media e la varianza fossero incognite.
Supponiamo ora che X abbia distribuzione Normale
Se X N(,
2
) si ha che anche la media campio-
naria è Normale
X
n
N
_
,

2
n
_
Supponiamo ora che X sia un modello bernoulliano
Se X Ber(p) si ha che
E(

X
n
) = E( p
n
) = p e Var( p
n
) =
p(1 p)
n
La distribuzione di p
n
è la seguente
P
_
p
n
=
k
n
_
=
_
n
k
_
p
k
(1 p)
nk
, k = 0, 1, . . . , n
Lo stimatore p
n
è detto proporzione campionaria
ed è ottenuto come media di variabili che possono
solo assumere valore 0 o 1.
19
Statistica Lez. 10
Osservazione
Quando diciamo che la media stimata è un cer-
to valore è meglio dare anche lerrore standard, in
modo da avere unidea della variabilità di tale stima
Esempio: sulla base di un campione, la percentuale
di preferenze al partito A è p
n
= 50.5%. Possiamo
concludere che A ha vinto le elezioni?
Quello che ci manca è la precisione del dato 50.5%.
Sappiamo che Var( p
n
) = p(1 p)/n. Possiamo ot-
tenere una stima della varianza di p
n
sostituendo al
valore incognito p il valore p
n
.
Vediamo cosa accade per n pari a 100 o a 1000.
p
n
(1 p
n
)
n
=
0.505 0.495
100
= 0.05 = 5%
p
n
(1 p
n
)
n
=
0.505 0.495
1000
= 0.0158 = 1.6%
Consideriamo lintervallo p
n
_
p
n
(1 p
n
)
n
(50.5%5%, 50.5%+5%) = (45.5%, 55.5%)
e
(50.5%+1.6%, 50.5%1.6%) = (48.9%, 52.1%)
20
Statistica Lez. 10
Avevamo visto che se E(X
i
) = e Var(X
i
) =
2
allora
E(

X
n
) = e Var(

X
n
) =

2
n
Inoltre se è nota la distribuzione, ovvero se X
N(,
2
) si ha che anche la media campionaria è
Normale
X
n
N
_
,

2
n
_
Rispetto alla varianza campionaria, si può dimostrare
che:
S
2

2
n 1
2
n1
Metodi di stima
Metodo dei momenti
Metodo di massima verosimiglianza
. . .
21
Statistica Lez. 11
Gli intervalli di condenza
Gli intervalli di condenza danno uninformazio-
ne numerica sui possibili valori che uno stimatore
può assumere e quanticano lattendibilità di tale
informazione.
Gli intervalli di condenza per la media fornisco-
no un campo di variazione (centrato sulla media
campionaria) allinterno del quale ci si aspetta di
trovare il parametro incognito
Ad ogni intervallo di condenza viene associato un
livello di condenza (1) che rappresenta il grado
di attendibilità del nostro intervallo
Il nostro scopo è quello di determinare un intervallo
di valori (a, b) che contenga il valore incognito .
Vorremmo poter scrivere
P (a < < b) = 1
Ma questa scrittura è priva di senso!!!!!
Infatti è un numero.
Cerchiamo di capire il meccanismo con un esempio
fondamentale
1
Statistica Lez. 11
Se X
1
, X
2
, . . . , X
n
è un campione i.i.d. di variabi-
li casuali Normali di media incognita e varianza
2
, sappiamo che la media campionaria

X
n
è una
variabile aleatoria Normale di media e varianza
2
/n.
Possiamo quindi scrivere la relazione sopra come
P
_
_
a <
X
n
n
< b
_
_
= 1
che corrisponde a scrivere
P(a < Z < b) = 1
con Z N(0, 1)
Possiamo scegliere a e b come
P
_
_
z
2
<
X
n
n
< z
1
2
_
_
= 1 .
Basta infatti osservare il disegno
2
Statistica Lez. 11
Ricordando che z
2
= z
1
2
, possiamo riscrivere
lespressione
P
_
_
z
1
2
<
X
n
n
< z
1
2
_
_
= 1 .
3
Statistica Lez. 11
P
_
_
z
1
2
<
X
n
n
< z
1
2
_
_
=
= P
_

X
n
z
1
n
< <

X
n
+z
1
n
_
Osservazione: la probabilità non è riferita a , che
è una costante, ma a

X
n
che è una v.c.
In sostanza potremmo scrivere che

_

X
n
z
1
n
_
e siamo duciosi che questo accada nell(1 )%
dei casi, cioè nell(1 )% dei campioni estratti
Lintervallo di condenza è un intervallo i cui estre-
mi sono aleatori
4
5
Statistica Lez. 11
Esempio: consideriamo un campione di ampiezza
n = 27 proveniente da una popolazione Normale
con media incognita e varianza nota
2
= 44.
Determinare lintervallo di condenza a livello 1
= 0.95.
Sappiamo che
Z =
X
n
2
n
=
X
n
_
44/27
= N(0, 1)
Inoltre dalle tavole della Z ricaviamo
P(Z < z
1
2
) = P(Z > z
1
2
) = 0.975
Quindi z
1
2
= 1.96
Abbiamo
P
_
z
1
2
<

X
n
n
< z
1
2
_
= P
_
_
1.96 <

X
n
_
44
27
< 1.96
_
_
= P
_

X
n
1.96
_
44
27
< <

X
n
+1.96
_
44
27
_
= P(

X
n
2.5 < <

X
n
+2.5) = 0.95
6
Statistica Lez. 11
Possiamo dire che con un grado di ducia pari a
0.95 (95%) riteniamo che lintervallo (
X
n
2.5,

X
n
+
2.5) contenga al suo interno il valore incognito
A questo punto entrano in gioco le osservazio-
ni!! Se abbiamo rilevato x
n
= 174.5, lintervallo
di condenza risulta (172, 177)
`
E ragionevole pensare che la media incognita sia
compresa nellintervallo (172, 177) nel 95% dei casi
`
E sbagliato aermare che la probabilità che sia
nellintervallo (172, 177) è 0.95, perche non è una
variabile casuale
Riassumendo: Intervallo di condenza per la me-
dia (
2
nota) nel caso di popolazione Gaussiana
Sia X una v.c Gaussiana di media e varianza
2
.
Se X
1
, X
2
, . . . , X
n
è un campione i.i.d. estratto da
X allora lintervallo di condenza per di livello
1 si scrive nella seguente forma

_

X
n
z
1
n
_
Lo stesso risultato vale se X è qualunque pur-
che lampiezza del campione sia sucientemente
elevata
7
Statistica Lez. 11
Intervallo di condenza per la media (
2
incogni-
ta) nel caso di popolazione Gaussiana
Se il valore della varianza
2
non è noto calcoliamo
una sua stima attraverso lo stimatore S
2
n
.
Se X
1
, X
2
, . . . , X
n
è un campione i.i.d. estratto da
X allora lintervallo di condenza per di livello
1 può essere scritto nella seguente forma

_
_

X
n
t
(n1);
S
2
n
n
_
_
8
Statistica Lez. 11
Esempio: il peso, in grammi, di alcuni granelli di
polvere identicati su una piastra di silicio si suppo-
ne distribuito come una variabile casuale Normale
di parametri e
2
. I dati sono riportati di seguito:
0.39 0.68 0.82 1.35 1.38 1.62
1.70 1.71 1.85 2.14 2.89 3.69
Dopo aver determinato una stima per si costrui-
scano gli intervalli di condenza per la media al
livello 95% e 99% supponendo
2
ignota
Calcoliamo la media campionaria x
n
x =
1
n
n
i=1
x
i
=
0.39 +0.68 + +3.69
12
= 1.685
Poiche
2
è incognita la stimiamo utilizzando la
statistica s
2
s
2
=
1
n 1
n
i=1
(x
i
x)
2
= 0.85
Lintervallo di condenza (stimato) si ottiene at-
traverso la formula

_
_
x
n
s
2
n
t
2
;(n1)
_
_
9
Statistica Lez. 11
Nei due casi i valori della t di Student sono
t
0.05
2
;(11)
= t
0.025;(11)
= 2.201
e
t
0.01
2
;(11)
= t
0.005;(11)
= 3.106
Sostituendo i valori si ottiene
(1.10, 2.27) di livello 95%
(0.86, 2.51) di livello 99%
Osservazione 1: a parità di n lampiezza dellin-
tervallo cresce al crescere del livello di ducia
Osservazione 2: a parità di n e di livello di ducia
1 si hanno intervalli più ampi nel caso in cui la
varianza non è nota
Osservazione 3: lampiezza di un intervallo di
condenza dipende solo da due quantità: lam-
piezza campionaria n e il livello di condenza 1
10
Statistica Lez. 11
La giusta scelta dellampiezza campionaria
La lunghezza dellintervallo di condenza per la
media nel caso in cui
2
è noto
L(n, ) =
_

X +z
1
_

X z
1
n
__
= 2z
1
n
Mentre la lunghezza dellintervallo di condenza
per la media nel caso in cui
2
non è noto
L(n, ) =
_
X +t
(n1;
2
)
_
S
2
n
X t
(n1;
2
)
_
S
2
n
__
= 2t
(n1;
2
)
_
S
2
n
L(n, ) non dipende dal valore assunto da

X
n
. Lin-
tervallo avrà sempre la stessa ampiezza a parità di
ampiezza campionaria n e livello di condenza 1
Se siamo disposti a tollerare un errore al massimo
pari a nel calcolo di un intervallo di condenza,
si vuole trovare n tale per cui L(n, ) <
L(n, ) = 2z
1
n
< 2z
1
<
n
e quindi
n >
_
2z
1
_
2
11
Statistica Lez. 11
Intervallo di condenza per la varianza nel caso
di popolazione Gaussiana
Sia X una v.c Gaussiana di media e varianza
2
entrambe incognite. Se X
1
, X
2
, . . . , X
n
è un cam-
pione i.i.d. estratto da X allora lintervallo di con-
denza per
2
di livello 1 si scrive nella seguente
forma
_
_
(n 1)S
2
n
/2;n1
,
(n 1)S
2
n
1/2;n1
_
_
dove il valore
/2;n1
è tale che
P
_
n1
<
/2;n1
_
= 1
2
e
n1
indica una v.c. Chi quadro con n 1 gradi
di libertà
12
Statistica Lez. 11
Esempio: abbiamo registrato il peso di 25 confe-
zioni di utensili registrando

x
2
i
= 482 e

x
i
= 81.
Calcolare lintervallo di condenza per la varianza
con un livello di ducia e 1 = 0.90.
Calcoliamo la statistica S
2
. Dai dati ricaviamo
S
2
=
n
n1
_
_
1
n
n
i=1
x
2
i
x
n
_
_
=
25
24
_
482
25
_
81
25
_
2
_
=9.14
Per 1 = 0.90 abbiamo
0.05;24
= 36.415 e
0.95;24
= 13.848 da cui lintervallo (6.02, 15.84)
13
Statistica Lez. 11
Intervallo di condenza per la proporzione inco-
gnita nel caso di prove Bernoulliane
Sia X una variabile casuale di Bernoulli di media p
incognita. Se X
1
, X
2
, . . . , X
n
è un campione i.i.d.
estratto da X, allora

n
i=1
X
i
Bin(n, p). Lo sti-
matore di p, p
n
è una Binomiale moltiplicata per il
fattore 1/n. Il teorema del limite centrale applicato
a p
n
ci da
Z =
p
n
p
_
p(1p)
n
N(0, 1)
Ma i calcoli per ottenere lintervallo di condenza
per p a livello 1 ci danno
p
_
_
p
n
z
1
p(1 p)
n
_
_
che non è possibile calcolare in alcun caso essendo
p incognito
Se sostituiamo p con la sua stima p
n
si può mostra-
re che vale ancora lapprossimazione alla variabile
Gaussiana e lintervallo di condenza per p di livello
1 è
p
_
_
p
n
z
1
p
n
(1 p
n
)
n
_
_
14
Statistica Lez. 11
Esempio: su 150 pezzi prodotti da una macchina
ve ne sono 18 non conformi. Costruire un intervallo
di ducia a livello 1 = 0.90 per la percentuale
di pezzi prodotti non in conformità
La stima della proporzione di pezzi non coformi è
p =
18
150
= 0.12
Lintervallo di condenza ha la forma
p
_
_
p
n
z
1
p
n
(1 p
n
)
n
_
_
dove
z
1
2
= z
0.95
= 1.64
p
_
_
p
n
1.64
0.12(1 0.12)
150
_
_
p
_
_
0.12 1.64
0.12(1 0.12)
150
_
_
p (0.076, 0.164)
è lintervallo di condenza per p con un grado di
ducia pari a 0.90
15
Statistica Lez. 11
In presenza di due campioni ind. di unità i.i.d.?
Intervallo di condenza per la dierenza di medie
(varianze incognite)
Si estrae un primo campione di n
1
unità i.i.d. da
una popolazione Normale di valore atteso
1
e va-
rianza incognita. Si estrae un secondo campione
di n
2
unità i.i.d. da una popolazione Normale di
valore atteso
2
e varianza incognita.
La stima congiunta della varianza incognita delle
due popolazioni è data da:
S
2
=
(n
1
1)S
2
1
+(n
2
1)S
2
2
(n
1
+n
2
2)
Lintervallo di condenza per la dierenza delle
medie (
1
2
) di livello 1 ha per estremi:
_
(

X
1

X
2
) t
(n
1
+n
2
2);1
2
S
_
_
1
n
1
+
1
n
2
_
; (

X
1

X
2
) +t
(n
1
+n
2
2);1
2
S
_
_
1
n
1
+
1
n
2
_
_
Intervallo di condenza per la dierenza di pro-
porzioni
Analogamente, volendo costruire un intervallo di
condenza per la dierenza di proporzioni (p
1
p
2
),
dopo avere estratto campioni di elevata numerosità
si ottiene (a livello 1 ):
_
( p
1
p
2
) z
1
2
_
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
; ( p
1
p
2
) +z
1
2
_
p
1
(1 p
1
)
n
1
+
p
2
(1 p
2
)
n
2
_
16
Statistica Lez. 12
La verica delle ipotesi
Se abbiamo unidea di quale possa essere il valore di
un parametro incognito possiamo sottoporlo ad una
verica, che sulla base di un risultato campionario, ci
permetta di decidere se accettare o riutare lipotesi
fatta
Test dipotesi per la media
Supponiamo di avere un modello Gaussiano X di me-
dia incognita e varianza nota
2
. Ci proponiamo di
sottoporre a verica lipotesi (statistica) che il vero
valore incognito della media sia
0
Questa ipotesi si indica
H
0
: =
0
e viene detta ipotesi nulla
Un test conduce sempre a due sole alternative: o riu-
tiamo lipotesi nulla H
0
, oppure la accettiamo (ovvero
non la riutiamo)
Tale decisione avviene sulla base dellosservazione di
un campione di v.c. i.i.d come X
1
Statistica Lez. 12
Poiche la decisione si basa su un campione cè la pos-
sibilità di commettere errori che possono essere di due
tipi riassunti nella tabella
Riuto H
0
Non Rifuto H
0
è vera H
0
errore I tipo nessun errore
1
è falsa H
0
nessun errore errore di II tipo
1
Abbiamo quindi
= P(riutare H
0
|H
0
è vera)
= P(non riutare H
0
|H
0
è falsa)
Osserveremo dei valori x che sono diversi da
0
. Una
procedura di test si occuperà di valutare se la distan-
za tra x e
0
è poco o molto elevata. Passando al-
le variabili aleatorie, il test si occuperà di vericare
che la distanza tra

X e
0
non sia troppo elevata (in
probabilità).
Per decidere quando riutare H
0
dobbiamo specica-
re lipotesi alternativa H
1
che può essere di tipo dif-
ferente. Un primo caso riguarda lipotesi alternativa
bilaterale
2
Statistica Lez. 12
Questa ipotesi si indica
H
1
: =
0
La regola che possiamo introdurre è del tipo:
se |
X
n

0
| è maggiore di un certo valore k riutia-
mo lipotesi nulla H
0
: =
0
in favore dellipotesi
alternativa H
1
: =
0
Come trovare il valore k?
Fissiamo il valore di in modo da garantirci che con
quella scelta di k al massimo commetteremo un errore
di primo tipo pari ad
Allora il valore di k è tale da soddisfare
P(|
X
n
0
| > k|H
0
vera) =
Il valore k = k
viene detto soglia del test

Come si calcola?
3
Statistica Lez. 12
Quando è vera H
0
allora
X
n
N(
0
,
2
/n)
e
X
n
n
N(0, 1)
Da cui
= P(|
X
n
0
| > k|H
0
) = P
_
X
n
>
k
H
0
_
= P
_
|Z| >
k
n
_
= P
_
Z <
k
n
e Z >
k
n
_
Per la simmetria di Z il valore k è tale
k
n
= z
1
2
cioè k =

n
z
1
2
Ricapitoliamo: Indichiamo con Z la statistica test
Z =
X
n
n
Supponiamo che per un dato campione otteniamo
come valore z di Z
z =
x
n
n
4
Statistica Lez. 12
Il test ci dice di riutare lipotesi nulla
H
0
: =
0
in favore di
H
1
: =
0
se z cade allesterno (zona di riuto) dellintervallo
(z
1
2
, z
1
2
)
chiamato zona di accettazione del test.
5
Statistica Lez. 12
Vi possono essere altri due tipi di ipotesi alternativa.
Vediamo cosa accade ad un test con ipotesi nulla
H
0
: =
0
contro lalternativa (unilaterale)
H
1
: >
0
= P(

X
n
0
> k|H
0
) = P
_
Z >
k
n
_
6
Statistica Lez. 12
Il test riuterà lipotesi nulla se
z =
x
n
n
> z
1
Analogamente, se lipotesi alternativa è
H
1
: <
0
il test riuterà per valori di z troppo piccoli e in par-
ticolare quando z < z
1
7
Statistica Lez. 12
Riassumiamo ora quanto segue in un unico schema
Test sulla media (
2
nota)
Sia X una variabile casuale Normale di media inco-
gnita e varianza
2
nota. Se X
1
, X
2
, . . . , X
n
è un
campione i.i.d. estratto da X allora il test di livello
, per la verica di ipotesi del tipo H
0
: =
0
, ha la
seguente forma a seconda delle alternative:
quando H
1
: =
0
, Riutare H
0
se |z| > z
1
2
quando H
1
: >
0
, Riutare H
0
se z > z
1
quando H
1
: <
0
, Riutare H
0
se z < z
1
dove
z =
x
n
n
8
Statistica Lez. 12
Esempio: un ingegnere deve studiare la resistenza
alla compressione del cemento. Dallestrazione di un
campione casuale di 12 esemplari è risultata una resi-
stenza media pari a x = 3255.42. Ipotizzando che la
resistenza alla compressione sia una variabile casuale
distribuita come una Normale con media ignota e
varianza
2
= 1000 psi
2
,
a) vericare lipotesi nulla H
0
: = 3300, contro
lalternativa H
1
: < 3300, utilizzando = 0.2
b) vericare lipotesi nulla H
0
: = 3250, contro
lalternativa H
1
: = 3250, utilizzando = 0.01
a) Abbiamo
z =
3255.42 3300
_
1000/12
= 4.883
Mentre
z
1
= z
0.98
= 2.053
Quindi riutiamo lipotesi nulla (4.883 < 2.053)
9
Statistica Lez. 12
b) Abbiamo
z =
3255.42 3250
_
1000/12
= 0.594
Mentre
z
1
2
= z
0.005
= 2.58
La regione di rigetto è data da:
R = {(x
1
, x
2
, . . . , x
n
) : z < 2.57 o z > 2.57}
Quindi accettiamo lipotesi nulla
10
Statistica Lez. 12
Test sulla media (
2
incognita)
Supponiamo di avere un modello Gaussiano X di me-
dia e varianza
2
incognite. Ci proponiamo di sotto-
porre a verica lipotesi (statistica) che il vero valore
incognito della media sia
0
H
0
: =
0
contro lalternativa
H
1
: =
0
Come nel caso in cui è nota riutiamo lipotesi nulla
H
0
: =
0
in favore dellipotesi alternativa H
1
: =
0
se |
X
n
0
| è maggiore di un certo valore k
Fissiamo il valore di in modo da garantirci che con
quella scelta di k al massimo commetteremo un errore
di primo tipo pari ad
Allora il valore di k è tale da soddisfare
P(|
X
n
0
| > k|H
0
vera) =
11
Statistica Lez. 12
Quando è vera H
0
allora
X
n
N(
0
,
2
/n)
ma
X
n
0
_
S
2
n
T
n1
Da cui
= P(|
X
n
0
| > k|H
0
) = P
_
_
X
n
0
_
S
2
n
>
k
_
S
2
n
H
0
_
_
= P
_
_
T
n1
<
k
_
S
2
n
e T
n1
>
k
_
S
2
n
_
_
Il test ci dice di riutare lipotesi nulla H
0
in favore di
H
1
se
t =
x
n
0
_
s
2
n
cade allesterno (zona di riuto) dellintervallo
(t
n1;
2
, t
n1;
2
)
chiamato zona di accettazione del test
12
Statistica Lez. 12
Ricapitolando:
Se la varianza non è nota, si procede sostituendo al
valore
2
la sua stima s
2
n
e utilizzando le tavole della
t di Student.
Se i dati non sono distribuiti in modo gaussiano e lam-
piezza campionaria è elevata si usa la tecnica appena
vista basata sulla statistica t ma per i valori soglia si
ricorre alle tavole della Normale.
Test sulla media (
2
incognita)
Sia X una variabile casuale Normale di media incogni-
ta e varianza
2
non nota. Se X
1
, X
2
, . . . , X
n
è un
campione i.i.d. estratto da X allora il test di livello
, per la verica di ipotesi del tipo H
0
: =
0
, ha la
seguente forma a seconda delle alternative:
quando H
1
: =
0
, Riutare H
0
se |t| > t
n1;
2
quando H
1
: >
0
, Riutare H
0
se t > t
n1;
quando H
1
: <
0
, Riutare H
0
se t < t
n1;
dove
t =
x
n
0
s
n
n
e s
n
=
_
s
2
n
13
Statistica Lez. 12
Verica di ipotesi sulle proporzioni
Sia X una variabile casuale di Bernoulli di parametro p
incognito. Vogliamo sottoporre ad ipotesi H
0
: p = p
0
contro unalternativa H
1
: p = p
0
. Misureremo la
distanza sempre con | p
n
p
0
| e per trovare il valore
soglia scriveremo quanto segue
= P(| p
n
p
0
| > k|H
0
)
da cui
= P(| p
n
p
0
| > k|H
0
)
= P
_
_
p
n
p
0
_
p
0
(1p
0
)
n
>
k
_
p
0
(1p
0
)
n
_
_
P
_
_
|Z| >
k
_
p
0
(1p
0
)
n
_
_
Lunica dierenza, rispetto anche agli intervalli di con-
denza, è che se risulta vera H
0
allora p = p
0
e non
abbiamo bisogno di utilizzare p
n
per standardizzare la
dierenza p
n
p
0
14
Statistica Lez. 12
Ricapitolando:
Test sulla proporzione
Sia X una variabile casuale di Bernoulli di parametro
p incognito. Se X
1
, X
2
, . . . , X
n
è un campione i.i.d.
estratto da X allora il test di livello , per la verica
di ipotesi del tipo H
0
: p = p
0
, ha la seguente forma a
seconda delle alternative:
quando H
1
: p = p
0
, Riutare H
0
se |z| > z
1
2
quando H
1
: p > p
0
, Riutare H
0
se z > z
1
quando H
1
: p < p
0
, Riutare H
0
se z < z
1
dove
z =
p
n
p
0
_
p
0
(1p
0
)
n
Attenzione! : il test si può eseguire solo se n > 30.
Inoltre, nel denominatore di z si utilizza p
0
e non p
n
per la standardizzazione.
15
Statistica Lez. 12
Verica di ipotesi per due campioni
Quando abbiamo due insiemi di dati possiamo chie-
derci, a seconda della loro natura, se i campioni sono
simili oppure no. I problemi che arontiamo in questo
contesto sono due.
Test per il confronto tra proporzioni
Abbiamo due campioni di ampiezza n
1
e n
2
su cui ab-
biamo rilevato una proporzione di successi p
1
= k
1
/n
1
e p
2
= k
2
/n
2
. Ci chiediamo se leventuale dierenza
riscontrare tra p
1
e p
2
sia dovuta al caso oppure no.
Lipotesi nulla da sottoporre a test è
H
0
: p
1
= p
2
contro unalternativa che può essere
H
1
: p
1
= p
2
per un test a due code, oppure
H
1
: p
1
> p
2
o
H
1
: p
1
< p
2
per un test ad una coda
16
Statistica Lez. 12
La statistica test viene costruita come segue: si pone
p =
k
1
+k
2
n
1
+n
2
z =
p
1
p
2
_
p(1 p)
_
1
n
1
+
1
n
2
_
N(0, 1)
Le regole per decidere se accettare lipotesi nulla sono
riassunte nella tabella
Test per il confronto tra proporzioni
Se p
1
= k
1
/n
1
e p
2
= k
2
/n
2
sono le proporzioni di
successo su due campioni di ampiezza n
1
ed n
2
ri-
spettivamente, si può costruire un test z per testare
lipotesi nulla H
0
: p
1
= p
2
contro le usuali alternative
come segue:
z =
p
1
p
2
_
p(1 p)
_
1
n
1
+
1
n
2
_
con p = (k
1
+ k
2
)/(n
1
+ n
2
). Il test di livello
corrisponde alle seguenti regole di decisione
quando H
1
: p
1
= p
2
, Riutare H
0
se |z| > z
1
2
quando H
1
: p
1
> p
2
, Riutare H
0
se z > z
1
quando H
1
: p
1
< p
2
, Riutare H
0
se z < z
1
17
Statistica Lez. 12
Test per il confronto tra medie
Vogliamo valutare la dierenza tra le medie in due
campioni. Siano x
1
e x
2
le medie di due gruppi di
ampiezza n
1
ed n
2
. Si costruisce la statistica t per
vericare luguaglianza delle medie come segue
t =
x
1
x
2
s
_
1
n
1
+
1
n
2
dove
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
con s
2
1
e s
2
2
le varianze campionarie dei due campioni.
Questa statistica test t si distribuisce come una t di
Student con n
1
+n
2
2 gradi di libertà. Si procederà
ad eettuare un test come nel caso di un qualsiasi test
t dove però si deve tener conto dei dierenti gradi di
libertà.
18
Statistica Lez. 12
Le regole per accettare lipotesi nulla a seconda del-
lipotesi alternativa sono riassunte nella seguente ta-
bella:
Test per il confronto tra medie
Se x
1
, x
2
, s
2
1
e s
2
2
sono le medie e le varianze cam-
pionarie di due campioni di ampiezza n
1
ed n
2
, si
può costruire un test t per vericare lipotesi nulla
H
0
:
1
=
2
contro le usuali alternative come segue:
t =
x
1
x
2
s
_
1
n
1
+
1
n
2
dove
s =
_
(n
1
1)s
2
1
+(n
2
1)s
2
2
n
1
+n
2
2
Il test di livello corrisponde alle seguenti regole di
decisione
quando H
1
:
1
=
2
, Riutare H
0
se |t| > t
n1;
2
quando H
1
:
1
>
2
, Riutare H
0
se t > t
n1;
quando H
1
:
1
<
2
, Riutare H
0
se t < t
n1;
con g = n
1
+n
2
2.
19
Statistica Lez. 12
Test sulla varianza incognita di una popolazione
Normale
La verica di ipotesi sulla varianza di una popolazione
Normale può essere condotta per una singola varianza
o per due varianze. Se lipotesi nulla è H
0
:
2
=
2
0
si utilizza la statistica test:
X
2
=
(n 1)S
2
2
0
Il test di livello corrisponde alle seguenti regole di
decisione
quando H
1
:
2
=
2
0
, Riutare H
0
se S
2

2
0
(n1)
2
/2;n1
o se S
2

2
0
(n1)
2
1/2;n1
quando H
1
:
2
>
2
0
, Riutare H
0
se S
2

2
0
(n1)
2
;n1
quando H
1
:
2
<
2
0
, Riutare H
0
se S
2

2
0
(n1)
2
1;n1
20
Introduzione
Perchè si studia lindipendenza o linterdipenden-
za tra 2 o più variabili o mutabili
Studio della realtà e delle relazioni tra fenomeni
Matrice dei dati - Distribuzione di frequenza
doppia
Unità statistiche Variabile (X) Variabile (Y )
1 x
1
y
1
2 x
2
y
2
.
.
.
.
.
.
.
.
.
i x
i
y
i
.
.
.
.
.
.
.
.
.
n x
n
y
n
*Esempio* - Si studi la relazione che lega le età
(anni) e le stature (cm) di 20 scolari della scuola
elementare
Unità Età X Stature Y
1 6 114
2 7 126
3 8 126
4 7 121
5 10 133
6 9 130
7 8 130
8 7 120
9 6 111
10 9 129
11 10 137
12 9 128
13 8 123
14 7 117
15 6 115
16 10 134
17 10 132
18 8 125
19 6 118
20 9 133
Rappresentazione graca
Scatterplot o diagramma di dispersione: permette
di osservare landamento crescente o decrescente
della nuvola di punti
*Esempio* (continua)
6 7 8 9 10
Eta.
110
115
120
125
130
135
A
l
t
e
z
z
a
Regressione lineare semplice
Analisi della dipendenza
RELAZIONE ASIMMETRICA (X Y )
Obbiettivo: studiare la dipendenza di Y da X
per dati accoppiati entrambi di tipo quantita-
tivo
X: variabile indipendente (causa, v.esplicativa,
regressore)
Y : variabile dipendente (eetto, v.risposta)
Scelta del ruolo delle due variabili
`
E molto importante stabilire in una distribuzione
di frequenza quale variabile rappresenta la causa e
quale leetto
Cosa è una funzione?
Corrispondenza che associa ad ogni numero x ap-
partenente a un certo insieme uno e un solo numero
y = f(x)
Cosa è una funzione lineare?
Funzione caratterizzata da punti (x, y = f(x)) allineati
y = a +b x
- (a, b): numeri reali
- Equazione di una retta
Dipendenza in media lineare:
permette di studiare come varia la media della vari-
abile dipendente per valori ssati della variabile es-
plicativa
Modello di regressione lineare semplice
y = a +b x
Retta di regressione Modello teorico
Osservazioni reali:
y
i
= a +b x
i

(componente sistematica)
+ e
i
(componente accidentale)
n coppie di osservazioni (x
i
, y
i
) (per i = 1, 2, 3, . . . , n)
Signicato di:
regressione termine introdotto da Galton in uno
studio sulla relazione tra le altezze dei padri e quelle
dei gli;
lineare si interpolano i dati attraverso una retta;
semplice una sola x e una sola y
Ipotesi sulla componente accidentale e
i
(Insieme
debole delle ipotesi)
M(e
i
) = 0
2
e
è costante
e
i
indipendente da e
j
Scelta della retta interpolatrice:
- Passante per i punti?
- Passante fra i punti (o in mezzo ad essi)?
La scelta della miglior retta interpolatrice è cen-
trata sul ruolo della componente residuale
Obbiettivo: rendere minimi i residui
Criterio dei minimi quadrati
min
a,b
n
i=1
(e
i
)
2
= min
a,b
n
i=1
(y
i
a bx
i
)
2
Soluzione:
b =
n
i=1
(x
i
x)(y
i
y)
n
i=1
(x
i
x)
2
=
n
n
i=1
x
i
y
i
n
i=1
x
i
n
i=1
y
i
n
n
i=1
x
2
i
(
n
i=1
x
i
)
2
a = y
b x
Retta di regressione ai minimi quadrati
y
i
= a +
bx
i
a Intercetta ai minimi quadrati

b Coeciente di regressione di Y da X ai min.
quadrati
y
i
Valori teorici ai min. quadrati (ottenuti sos-
tituendo nella retta di regressione i valori x
i
, dopo
avere calcolato a e

b)
e
i
= y
i
y
i
Residui di regressione ai min. quadrati
N.B. Passaggio per il punto ( x, y) baricentro
Lettura dei coecienti:
1) per x = 0 y = a
- Ordinata del punto di incontro tra la retta di
regressione e lasse delle y
- Generalmente non ha signicato in relazione ai
dati e può non essere interpretata
- a ha la stessa unità di misura della Y perchè si
ottiene per annullamento della X
2) per (x
i
x
j
) = 1
y
i
y
j
= a +
bx
i
a
bx
i
=
b(x
i
x
j
) =
b
- Misura di quanto varia in media y per in-
crementi unitari di x (coeciente angolare della
retta)
-

b ha lunità di misura data dal rapporto tra lunità
di misura di Y e lunità di misura di X
- Il segno di

b dipende dal numeratore (covarianza)
- Se

b > 0 lassociazione tra X e Y è positiva, vale
a dire che al crescere di X anche Y cresce
- Se

b < 0 lassociazione tra X e Y è negativa, vale
a dire che al crescere di X, Y decresce
- Se

b = 0 non cè associazione lineare tra X e Y
y = y
*Esempio*(continua)
La retta di regressione nello studio della dipendenza
delle altezze di 20 bambini dalletà è:
y = 86.7 +4.8 x
Nella fascia di età della scuola elementare la statura
degli alunni cresce in media di 4.8 cm allanno.
Previsione/Estrapolazione:
Calcolo di y per valori di x non osservati
*Esempio*(continua)
Supponiamo di volere estrapolare dalla retta un
valore non osservato di un bambino di 5 anni
y = 86.7 +4.8 5 = 110.7
Laltezza di un ipotetico bambino di 5 anni è circa
111 cm.
Misura della bontà di adattamento:
Vogliamo sapere se la retta trovata si adatta bene
ai dati iniziali, vale a dire quanto capace è x di
predire linearmente landamento di y
Ancora una volta ci basiamo sui residui:
e
i
= y
i
y
i
i = 1, . . . , n
- Più piccoli sono i residui migliore sarà ladatta-
mento della retta
- Non devono presentare un andamento particolare,
ma si devono muovere intorno al valore nullo
Equazione fondamentale della regressione:
ovvero scomposizione della devianza
n
i=1
(y
i
y)
2
=
n
i=1
(y
i
y
i
)
2
+
n
i=1
( y
i
y)
2
n
i=1
(y
i
y)
2
Devianza totale di y
n
i=1
(y
i
y
i
)
2
Devianza residua
n
i=1
( y
i
y)
2
Devianza spiegata dalla regressione
Coeciente di determinazione R
2
n
i=1
( y
i
y)
2
n
i=1
(y
i
y)
2
=
Dev. spiegata
Dev. totale
= 1
Dev. residua
Dev. totale
Misura quanta parte della devianza totale è
spiegata dalla regressione, ovvero dalla relazione
lineare fra y e x
0 R
2
1
Se R
2
= 0 la retta di regressione coincide con la
retta y = y
Se R
2
= 1 i valori osservati coincidono con la ret-
ta di regressione ottimo adattamento. In questo
caso non cè devianza residua

n
i=1
(y
i
y
i
)
2
= 0
Quindi più prossimo a 1 è R
2
migliore è ladatta-
mento, perchè più elevata è la frazione di devianza
totale spiegata dalla regressione
*Esempio*(continua)
Nellesempio sulla statura il coeciente di deter-
minazione ottenuto è:
R
2
= 0.875
Il dato, in percentuale, ci dice che l87.5% della
variabilità della statura è spigata dalla dipendenza
lineare della statura dalletà (ottimo adattamento)
Covarianza
Analisi della interdipendenza
RELAZIONE SIMMETRICA (X Y )
Si calcola la media del prodotto degli scarti delle
due variabili
cov(X, Y ) =
n
i=1
(x
i
x)(y
i
y)
n
=
n
i=1
x
i
y
i
n
x y
Lo studio riguarda il modo in cui le due vari-
abili (quantitative) variano simultaneamente (vari-
abili sullo stesso piano)
La covarianza misura linterdipendenza tra le due
variabili, ovvero la forza della relazione lineare tra
esse:
se X e Y sono indipendenti linearmente
cov(X, Y ) = 0;
se X e Y sono in relazione diretta
cov(X, Y ) > 0 (associazione positiva)
se X e Y sono in relazione inversa
cov(X, Y ) < 0 (associazione negativa)

x

y
cov(X, Y ) +
x

y
Se cov(X, Y ) =
x

y
vi è perfetta dipendenza
lineare positiva
Se cov(X, Y ) =
x

y
vi è perfetta dipendenza
lineare negativa
Lassociazione (positiva o negativa) è tanto più
forte quanto più la covarianza è prossima a uno dei
due estremi
cov(X, Y ) = cov(Y, X) in quanto misura simmet-
rica
Relazione tra la covarianza e il coeciente
di regressione lineare
b =
n
i=1
(x
i
x)(y
i
y)
n
i=1
(x
i
x)
2
=
n
i=1
(x
i
x)(y
i
y)
n
n
i=1
(x
i
x)
2
n
=
cov(X, Y )
2
x
`
E importante notare che il segno del coeciente di
regressione è uguale al segno della covarianza
Coeciente di correlazione lineare
r =
cov(X, Y )
x

y
=
n
i=1
(x
i
x)(y
i
y)
n
i=1
(x
i
x)
2
n
i=1
(y
i
y)
2
`
E una misura standardizzata della covarianza, utile
per fare confronti
r(X, Y ) = r(Y, X)
1 r +1
Misura normalizzata priva di unità di misura
Se r = 1 perfetta associazione lineare negativa
Se r = 1 perfetta associazione lineare positiva
Se r = 0 indipendenza o incorrelazione
Se 1 < r < 0 associazione negativa
Se 0 < r < 1 associazione positiva
Relazione tra il coeciente di determinazione
e il coeciente di correlazione
r =
R
2
Lassenza di relazione lineare non implica che non
siano presenti altri tipi di relazione
x
i
-2 -1 0 1 2 0
y
i
4 1 0 1 4 0
x
i
y
i
-8 -1 0 1 8 0
xy
=
1
5
5
i=1
x
i
y
i
x
n
y
n
=
0
5
0 0 = 0
ovvero cè assenza di relazione lineare tra X ed Y
Costruiamo la tabella di contingenza
Y 0 1 4
X
2 0 0 1 1
1 0 1 0 1
0 1 0 0 1
1 0 1 0 1
2 0 0 1 1
1 2 2 5
Calcoliamo lindice
2

2
=
5
i=1
3
j=1
n
2
ij
n
i.
n
.j
1
min(3 1, 5 1)
=
1
2
+
1
2
+1 +
1
2
+
1
2
1
2
= 1
Siamo in presenza di massima connessione!
Statistica Descrittiva Statistica Inferenziale
Utilizzo di campioni estratti da una popolazione
che permetta di inferire, ovvero generalizzare le
conclusioni allintero collettivo
Lo studio della relazione asimmetrica tra coppie di
variabili può essere rappresentato da una funzione,
che in generale dipende da uno o più parametri
(vettore di parametri) che dobbiamo stimare:
f(y|x; )
A tale scopo di introducono due ipotesi semplica-
trici:
1) Lo studio è centrato sul valore atteso (dipen-
denza in media)
E(Y |X)
2) Si suppone che il valore atteso sia una certa
funzione di x
E(Y |X) = g(x)
Y è una variabile casuale e per essa vale la re-
lazione:
y = E(Y |X) +e = g(x) +e
e: componente accidentale,oscillazione stocastica,
variabilità
g(x): funzione di regressione
Modello di regressione lineare semplice
E(Y |X) = a +b x y = a +b x +e
e è una v. c. avente E(e) = 0 e var(e) =
2
E(Y |X) = a +b x var(Y |X) =
2
e
Si osservano quindi n coppie di variabili (x, y), di cui
la X è una variabile deterministica e non casuale
(x
1
, x
2
, . . . , x
n
) =
y
1
= a +b x
1
+e
1
y
2
= a +b x
2
+e
2
.
.
.
.
.
.
y
n
= a +b x
n
+e
n
Insieme forte delle ipotesi
Sulle n variabili casuali e
1
, e
2
, . . . , e
n
(o analoga-
mente su y
1
, y
2
, . . . , y
n
) si eettuano delle assun-
zioni:
1) E(e
i
) = 0 i = 1, 2, . . . , n ( E(y
i
) = a + b x
i
i);
2) Omoschedasticità (uguale varianza) delle e
i
i:
var(e
i
) =
2
e
( var(y
i
) =
2
e
i);
3) Indipendenza delle e
i
: e
i
e
j
i, j ( y
i
y
j
i, j);
4) Distribuzione Normale delle e
i
: e
i
N(0,
2
e
) i
(y
i
N(a +b x,
2
e
) i)
Importante
Su un insieme di dati reali tali ipotesi sono sot-
toposte a verica attraverso lutilizzo di opportuni
test statistici.
Il modello di regressione lineare è solo uno dei mod-
elli statistici che possono venire impiegati in Statis-
tica. Sicuramente il più semplice e manegevole (per
le ipotesi che lo caratterizzano) ma non sempre il
più realistico.
Stima puntuale di a e b
1) Impiegando linsieme debole delle ipotesi si ri-
corre al metodo dei minimi quadrati per stimare
puntualmente a e b.
Valore atteso e Varianza delle stime
a : E(a) = a var(
b) =
2
e
_
1
n
+
x
2
n
i=1
(x
i
x)
2
_
b : E(
b) = b var(
b) =

2
e
n
i=1
(x
i
x)
2
*Esempio* - Studio della relazione che intercorre
tra reddito e consumo: quanta parte del reddito
mensile (migliaia di euro) viene destinato ai consu-
mi
Unità Reddito X Consumo Y
1 1.2 0.8
2 1.4 0.9
3 1.5 1.2
4 1.6 0.7
5 1.8 1.3
6 2.1 1.7
7 2.3 1.6
8 2.4 1.9
9 2.6 2
10 2.8 2.1
11 2.9 2
12 3 2.4
delle consumo di 12 famiglie dal reddito è:
y = 0.2779 +0.8568 x
R
2
= 0.9111
Con riferimento al campione in esame, allaumentare
di una unità di reddito il consumo aumenta di cir-
ca 0.86 unità. Il coeciente di determinazione
dimostra il buon adattamento della retta ai dati.
Se volessimo calcolare la varianza delle stime dei
parametri otterremmo:
var(a) = 0.035
var(
b) = 0.007
Stima di
2
e
Stimatore basato sui minimi quadrati:
S
2
=
n
i=1
e
2
i
n2
=
n
i=1
(y
i
ab x
i
)
2
n2
con E(S
2
) =
2
e
Ovvero S
2
è uno stimatore corretto di
2
e
.
Impiegando linsieme forte delle ipotesi siamo in
grado di conoscerne la forma distribuzionale di a,

b
e S
2
:
a N
_
a,
2
e
_
1
n
+
x
2
n
i=1
(x
i
x)
2
__
b N
_
b,

2
e
n
i=1
(x
i
x)
2
_
S
2

2
e
n2

2
n2
Stima Intervallare di a e b (separatamente)
Lintervallo di condenza per b con grado di ducia
(1 ) è:
_
b t
n2;1
2
_
S
2
n
i=1
(x
i
x)
2
,
b +t
n2;1
2
_
S
2
n
i=1
(x
i
x)
2
_
Analogamente, lintervallo di condenza per a con
grado di ducia (1 ) è:
_
a t
n2;1
S
2
_
1
n
+
x
2
n
i=1
(x
i
x)
2
_
, a t
n2;1
S
2
_
1
n
+
x
2
n
i=1
(x
i
x)
2
_
*Esempio*(continua)
delle consumo di 12 famiglie dal reddito è:
y = 0.2779 +0.8568 x
Lintervallo di condenza per lintercetta al 95% è:
[-0.6956,0.1398]
Infatti: a = 0.2779,
_
var(a) = 0.1875, quindi:
[0.27792.2280.1875, 0.2779+2.2280.1875]
t
10;0.025
= 2.228
Lintervallo di condenza per il coeciente di re-
gressione al 95% è:
[0.6683, 1.0453]
Infatti:

b = 0.8568,
_
var(
b) = 0.0846, quindi:
[0.8568 2.228 0.0846, 0.8568 +2.228 0.0846]
Relativamente al sistema di ipotesi
_
H
0
: b = 0
H
1
: b = 0
Si considera la Statistica test
T =
b
S
_
n
i=1
(x
i
x)
2
La zona di rigetto è data da:
R{(x
1
, y
1
), . . . , (x
n
, y
n
) : |T| > t
(n2);1
2
}
Oppure si poteva calcolare lintervallo di condenza
per b con grado di ducia (1 )
Se lintervallo di condenza stimato non include lo
0, si rigetta lipotesi nulla.
IN CONCLUSIONE:
I passo stabilire il problema
II passo scegliere un opportuno modello
III passo osservare la rappresentazione gra-
ca dei dati rilevati
IV passo stima dei parametri
V passo stima della varianza dei parametri
VI passo bontà delladattamento
VII passo intervallo di condenza per i
parametri
VIII passo verica di ipotesi per i parametri
Esercizio: Una azienda farmaceutica osserva un
campione di 10 fumatori, allo scopo di vericare
in che modo e con quale intensità il numero di
sigarette fumate (X) possa inuenzare landamen-
to spirometrico (capacità polmonare espressa in
volume daria che esce ad ogni atto respiratorio),
Y .
Analisi spirometrica sigarette fumate al d`
600
420
480
500
320
380
620
280
380
400
1
3
4
2
10
9
4
20
12
8
a) Determinare i parametri della retta di regres-
sione che spieghi la capacità spirometrica in
funzione del numero di sigarette fumate.
b) Vericare a livello = 0.05 se il coeciente
angolare della retta stimato può ritenersi signi-
cativo, cioè diverso da zero.
c) Costruire lintervallo di ducia a livello 1 =
0.99 per lintercetta della retta.
La stima coi minimi quadrati dei coecienti della
retta y = a +bx dà:
a = 552.393,

b = 15.670.
Dobbiamo vericare lipotesi H
0
: b = 0 contro lal-
ternativa H
1
: b = 0. Sappiamo che riutiamo
lipotesi H
0
a livello se
b
S
_
(x
i
x)
2
> t
n2;1
2
.
Poichè S = 69.08, mentre

(x
i
x)
2
= 302.1 e
quindi
S
_
(x
i
x)
2
= 3.974. Da cui
b
S
_
(x
i
x)
2
= | 3.94| = 3.94
Poiche t
n2;1
2
= t
8;0.975
= 2.3060 riutiamo lipote-
si nulla, il modello è signicativo.
Gli estremi inferiore e superiore dellintervallo di
ducia per il parametro a sono rispettivamente
at
n2;1
2
S
x
2
i
n
(x
i
x)
2
.
Abbiamo
x
2
i
n
(x
i
x)
2
= 0.2763, mentre
S
x
2
i
n
(x
i
x)
2
= 36.318
Inoltre t
n2;1
2
= t
8;0.995
= 3.355 per cui lestremo
inferiore risulta 430.5321 mentre lestremo superi-
ore 674.2543.

Statistica

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Statistica

Caricato da

Copyright:

Formati disponibili

Corso di Statistica

discrete =, =, < (conteggio)

Per eettuare confronti `e bene avere un indice

F) al posto di P(E) e P(F).

modi e una non gura tra le quaranta a disposizione

Esempio Numero di casi che si possono presentare

`e tale che E(Z) = 0 e Var(Z) = 1

= P(Z < 1) = (1) = 0.84134

= P(1 < Z < 1) = (1) (1)

= P(2 < Z < 2) = (2) (2)

= P(3 < Z < 3) = (3) (3)

P(1.97 < Z < 0.76)

(X): famiglia, nota nella forma, di distribuzioni

viene detto soglia del test

Potrebbero piacerti anche