Capitolo 3
Cap. 3-1
Obiettivi del Capitolo
Dopo aver completato il capitolo, sarete in grado di:
Calcolare ed interpretare la media, la mediana e la moda di
un sett di d
datiti
Trovare il campo di variazione, varianza, scarto quadratico
medio e coefficiente di variazione e conoscere il loro
medio,
significato
Applicare
pp la regola
g empirica
p per descrivere la variazione
p
dei valori della popolazione attorno alla media
Spiegare la media pesata e quando usarla
Spiegare come una retta di regressione ottenuta con il
metodo dei minimi quadrati stima la relazione lineare fra
due variabili
Cap. 3-2
Argomenti Trattati nel Capitolo
Misure di tendenza centrale, variabilità, e forma
Media, mediana, moda, media geometrica
g
Quartili
Campop di variazione,, differenza interquartile,
q ,
varianza e scarto quadratico medio, coefficiente di
variazione
Distribuzioni simmetriche e asimmetriche
Misure di sintesi p
per la p
popolazione
p
Media, varianza, e scarto quadratico medio
La regola empirica e la disuguaglianza di Chebyshev
Cap. 3-3
Argomenti Trattati nel Capitolo
(continuazione)
Cap. 3-4
Descrizione Numerica dei Dati
Descrizione numerica dei dati
Moda Varianza
Coefficiente di Variazione
Cap. 3-5
Misure di Tendenza Centrale
Panoramica
a o a ca
Tendenza Centrale
M di
Media M di
Mediana M d
Moda
x i
x i 1
n
Media Valore centrale delle Valore più
Aritmetica osservazioni ordinate frequente
Cap. 3-6
Media Aritmetica
La media
L di aritmetica
it ti ((media)
di ) è la
l misura
i di
tendenza centrale più comune
Per una popolazione di N valori:
N
xx1 x 2 x N
i Valori della
μ
i1
popolazione
N N
Dimensione della
popolazione
Per un campione
p di dimensione n:
n
x i
x1 x 2 x n Valori osservati
x i1
n n
Dimensione del campione
Cap. 3-7
Media Aritmetica
(continuazione)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media
ed a = 3 Media
ed a = 4
1 2 3 4 5 15 1 2 3 4 10 20
3 4
5 5 5 5
Cap. 3-8
Mediana
In una lista ordinata, la mediana è il valore
“centrale” (50% prima, 50% dopo)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3 Mediana = 3
Cap. 3-9
Trovare la Mediana
n 1
Posizione Mediana posizione nella sequenza ordinata
2
Se il numero di valori è dispari, la mediana è il valore centrale
Se il numero di valori è p
pari,, la mediana è la media dei due
valori centrali
n 1
Nota che non è il valore della mediana, ma la
2
posizione della mediana nella sequenza ordinata
Cap. 3-10
Moda
Una misura
U i di ttendenza
d centrale
t l
Valore che ricorre più frequentemente
Non influenzata da valori estremi
Usata sia per dati numerici che categorici
Può non esserci una moda
Ci p
può
ò essere più di una
na moda
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
No Moda
Moda = 9
Cap. 3-11
Esempio Riepilogativo
Cinque case su una collina presso una spiaggia
$2 000 K
$2,000
Prezzi delle case:
$2,000,000
500,000 $500 K
300,000
, $300 K
100,000
100,000
$100 K
$100 K
Cap. 3-12
Esempio Riepilogativo:
Mi
Misure di Si
Sintesi
t i
Cap. 3-13
Quale misura di tendenza
centrale
t l è la
l ““migliore”?
i li ”?
Cap. 3-14
Forma della Distribuzione
Cap. 3-15
Misure di Variabilità
Variabilità
Le misure
L i di variabilità
i bilità
forniscono informazioni
sulla dispersione o
variabilità dei valori.
Stesso centro,
diversa variabilità
Cap. 3-16
Campo di Variazione
Esempio:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Campo di Variazione = 14 - 1 = 13
Cap. 3-17
Svantaggi del Campo di Variazione
I
Ignora il modo
d iin cuii i d
dati
ti sono di
distribuiti
t ib iti
7 8 9 10 11 12 7 8 9 10 11 12
Campo di Var. = 12 - 7 = 5 Campo di Var. = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
C
Campo di Var
V = 120 - 1 = 119
Cap. 3-18
Differenza Interquartile
IQR = Q3 – Q1
Cap. 3-19
Differenza Interquartile
Esempio:
X Mediana X
minimo Q1 (Q2) Q3 massimo
12 30 45 57 70
Differenza Interquartile
= 57 – 30 = 27
Cap. 3-20
Quartili
I Quartili dividono la sequenza ordinata dei dati in 4
segmenti contenenti lo stesso numero di valori
Q1 Q2 Q3
Cap. 3-21
Formule per i Quartili
(n = 9)
Q1 = è nella 0.25(9+1)=2.5 posizione nella sequenza
ordinata
di t dei
d i dati,
d ti usiamo
i quindi
i di la
l media
di fra
f il 2do
d e il 3zo
valore,
per cui Q1 = 12.5
Cap. 3-23
Varianza della Popolazione
σ 2 i 1
N
dove μ = media della popolazione
N = dimensione della popolazione
xi = iimo valore della variabile X
Cap. 3-24
Varianza Campionaria
s
2 i 1
n -1
dove X = media aritmetica
n = dimensione del campione
Xi = imo valore della variabile X
Cap. 3-25
S t Quadratico
Scarto Q d ti Medio
M di d
della
ll PPopolazione
l i
((x i μ) 2
σ i 1
N
Cap. 3-26
Scarto Quadratico Medio Campionario
(x x)
i
2
S i1
n -1
Cap. 3-27
Esempio di Calcolo:
Scarto Quadratico Medio Campionario
Dati
Campionari (xi) : 10 12 14 15 17 18 18 24
n=8 Media = x = 16
(10 X ) 2 (12 x ) 2 (14 x ) 2 (24 x ) 2
s
n 1
Cap. 3-29
Confrontando lo Scarto Quadratico
Medio
Dati A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338
Dati B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.926
0 926
Dati
at C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.570
Cap. 3-30
Vantaggi della Varianza e
d ll S
dello Scarto
t QQuadratico
d ti M Medio
di
Cap. 3-31
Teorema di Chebyshev
Cap. 3-32
Teorema di Chebyshev
(continuazione)
Cap. 3-33
La Regola Empirica
68%
μ
μ 1σ Cap. 3-34
La Regola Empirica
μ 2σ contiene
ti circa
i 95% dei
d i valori
l id della
ll
popolazione o del campione
μ 3σ contiene circa 99.7% dei valori della
popolazione
p p o del campione
p
95% 99.7%
μ 2σ μ 3σ
Cap. 3-35
Coefficiente di Variazione
s
CV 100% CV 100%
| | | x |
Cap. 3-36
Confronto fra
C ffi i ti di V
Coefficienti Variazione
i i
Azione A:
Prezzo medio scorso anno = $50
s $5
CVA 100% 100% 10% Entrambe le
| x| $50 azioni hanno lo
stesso scarto
Azione B: quadratico
medio, ma
Prezzo medio scorso anno = $100
l’azione B è
Scarto quadratico medio = $5 meno variabile
rispetto al suo
s $5
CVB 100% 100% 5% prezzo medio
| x| $100
Cap. 3-37
Usando Microsoft Excel
Cap. 3-38
Usando Excel
Seleziona il menu:
strumenti / analisi dati /
statistica descrittiva
Cap. 3-39
Using Excel
(continuazione)
Inserire
se e dedettagli
ag
nella finestra di
dialogo
Seleziona l’opzione
Riepilogo statistiche
Cliccare su OK
Cap. 3-40
Output di Excel
Output di Microsoft Excel
di statistica descrittiva
usando i dati sul prezzo
delle case:
$2,000,000
$2 000 000
500,000
300,000
100 000
100,000
100,000
Cap. 3-41
Media Pesata
w x i i
w 1x1 w 2 x 2 w n x n
x i 1
n
w1 w 2 w n
w
i 1
i
i
Cap. 3-42
Approssimazioni per Dati
Raggruppati
Supponiamo un set di dati contiene i valori m1, m2, . . ., mk,
che occorrono con frequenze f1, f2, . . . fK
fimi K
dove N f i
μ i1 i 1
N
Per un campione
p di n osservazioni,, la media è
K
fm i i
K
dove n f i
x i 1
i
i 1
n
Cap. 3-43
Approssimazioni per Dati
Raggruppati
Supponiamo un set di dati contenga i valori m1, m2, . . ., k,
che occorrono con frequenze f1, f2, . . . fK
i i
f (m μ) 2
σ2 i1
N
Per un campione di n osservazioni, la varianza è
K
i i
f (m x) 2
s2 i1
n 1
Cap. 3-44
La Covarianza Campionaria
La covarianza misura la forza della relazione lineare tra due
variabili
(x i x )(y i y )
Cov (x , y) xy i1
N
La covarianza campionaria:
n
(x x)(y y)
i i
Cov (x , y) s xy i1
n 1
Riguarda solo la forza della relazione
Non implica un effetto casuale
Cap. 3-45
Interpretazione della Covarianza
Cap. 3-46
Coefficiente di Correlazione
Misura la forza relativa della relazione lineare tra due
variabili
Cap. 3-47
Caratteristiche del Coefficiente
di C
Correlazione,
l i r
Senza unità di misura
Campo di variazione fra –1
1e1
Quanto più è vicino a –1, tanto più è forte la relazione
lineare negati
negativa
a
Quanto più è vicino a 1, tanto più è forte la relazione
lineare positiva
Quanto più è vicino a 0, tanto più è debole la relazione
lineare
Cap. 3-48
Diagrammi di Dispersione con
V iC
Vari Coefficienti
ffi i ti di C
Correlazione
l i
Y Y Y
X X X
r = -1 r = -.6 r=0
Y
Y Y
X X X
r = +1 r = +.3 r=0
Cap. 3-49
Usando Excel per Calcolare
il C
Coefficiente
ffi i t di C
Correlazione
l i
Selezionare
Strumenti/Analisi Dati
Scegliere Correlazione
dal menu a scorrimento
Cliccare su OK . . .
Cap. 3-50
Usando Excel per Calcolare
il C
Coefficiente
ffi i di C
Correlazione
l i
(continuazione)
r = .733 100
95
Voto esame #2
lineare positiva 85
relativamente forte 80
70
e i voti in esame #2 70 75 80 85 90 95 100
Voto esame #1
Cap. 3-52
Ottenere Relazioni Lineari
Y = β 0 + β 1X
Cap. 3-53
Regressione con il
Metodo dei Minimi Quadrati
yˆ b0 b1 x
Dove b1 è la pendenza della retta e b0 è l’ordinata
all origine:
all’origine:
Cov(x, y) sy
b1 2
r b0 y b1x
sx sx
Cap. 3-54
Riepilogo del Capitolo
Si sono descritte le misure di tendenza centrale
Media, mediana, moda
Illustrate la forma della distribuzione
Simmetrica, asimmetrica
Descritte le misure di variabilità
Campo di variazione, differenza interquartile, varianza e scarto
quadratico
d ti medio,
di coefficiente
ffi i t di variazione
i i
Discusse le misure per dati raggruppati
Calcolate le misure delle relazioni tra variabili
Covarianza e coefficiente di correlazione
Cap. 3-55