Sei sulla pagina 1di 36

17.

Forma
Statistica di Base :: Canale 2 (E-PA)

Stefania Gubbiotti

Dipartimento di Scienze Statistiche - Sapienza

18 novembre 2021
Distribuzioni semplici

Tre aspetti fondamentali


I POSIZIONE
I VARIABILITA’
I FORMA
To do list

Forma di una distribuzione


I Simmetria: concetto intuitivo e definizione
I Asimmetria a destra e a sinistra
I Indici di asimmetria
I (Curtosi)
0 5 10 15 20 25 30 0 10 20 30 40 50 60

20
20

40
40

60
60

80
80

100
100
Frequency Frequency
Ripartiamo da qui:

0 5 10 15 20 25 30 0 10 20 30 40

20
20

40
40

60
60

80
80

100
100

Frequency Frequency

0 10 20 30 40 50 0 10 20 30 40

20
20

40
40

60
60

80
80

100
100

Frequency Frequency

0 20 40 60 80 0 5 10 15 20
20
20

40
40

60
60

80
80

100
100
Simmetria

Definizione (a parole)
Si definisce SIMMETRICA una distribuzione di frequenze
x1∗ x2∗ ... xi∗ ... ∗
xk−i+1 ... ∗
xk−1 xk∗
n1 n2 ... ni ... nk−i+1 ... nk−1 nk
se ciascuna coppia di modalità equidistanti da m
(cioè la prima e l’ultima, la seconda e la penultima, la i−esima e la
(k − i + 1)−esima)
hanno la stessa frequenza.
Simmetria
Definizione (in simboli)
Si definisce SIMMETRICA una distribuzione di frequenze
x1∗ x2∗ ... xi∗ ... ∗
xk−i+1 ... ∗
xk−1 xk∗
n1 n2 ... ni ... nk−i+1 ... nk−1 nk
se per ogni i = 1, 2, ..., k−δ
2 si ha

(xi∗ − m) = −(xk−i+1

− m)

ni = nk−i+1
(
0 k pari
dove m è la mediana e δ =
1 k dispari
Graficamente

k = 6 pari, δ = 0, m = 3.5

6
5
nj

4
3
2

1 2 3 m 4 5 6

xj

(xi∗ − m) = −(xk+1−i

− m)
ni = nk−i+1
k
per ogni i = 1, 2, ..., 2
Graficamente

k = 6 pari, δ = 0, m = 3.5

6
5
nj

4
3
2

1 2 3 m 4 5 6

xj

(xi∗ − m) = −(xk−i+1

− m)
ni = nk−i+1
k
per ogni i = 1, 2, ..., 2
Graficamente

k = 5 dispari, δ = 1, m = 3

6
5
nj

4
3
2

1 2 m 4 5

xj

(xi∗ − m) = −(xk−i+1

− m)
ni = nk−i+1
k−1
per ogni i = 1, 2, ..., 2
Graficamente

k = 5 dispari, δ = 1, m = 3

6
5
nj

4
3
2

1 2 m 4 5

xj

(xi∗ − m) = −(xk+1−i

− m)
ni = nk−i+1
k−1
per ogni i = 1, 2, ..., 2
Simmetria

Definizione (a parole)
Si definisce SIMMETRICA una distribuzione di frequenze
x1∗ x2∗ ... xi∗ ... ∗
xk−i+1 ... ∗
xk−1 xk∗
n1 n2 ... ni ... nk−i+1 ... nk−1 nk
se ciascuna coppia di modalità equidistanti da m
(cioè la prima e l’ultima, la seconda e la penultima, la i−esima e la
(k − 1 + 1)−esima)
hanno la stessa frequenza.
Simmetria

Definizione (a parole)
Si definisce SIMMETRICA una distribuzione di frequenze in classi
se ciascuna coppia di classi equidistanti da m
(cioè la prima e l’ultima, la seconda e la penultima, la i−esima e la
(k − i + 1)−esima)
hanno la stessa densità di frequenza.
Graficamente

k = 8 pari, δ = 0, m = 60

0.020
Density

0.010
0.000

20 40 60 80 100

b
Graficamente

k = 8 pari, δ = 0, m = 60

0.020
Density

0.010
0.000

20 40 60 80 100

f
Graficamente

k = 7 dispari, δ = 1, m = 60

0.04
Density

0.02
0.00

20 40 60 80 100

b
Graficamente

k = 7 dispari, δ = 1, m = 60

Density

0.010
0.000

20 40 60 80 100

f
Caratteristiche di una distribuzione simmetrica

1. media e mediana coincidono µ = m


Pk ∗
2. j=1 (xj − µ)3 nj = 0
3. Q1 e Q3 sono equidistanti dalla mediana
Caratteristiche di una distribuzione simmetrica
1. media e mediana coincidono µ = m
Dimostrazione

I Dalla definizione di distribuzione simmetrica segue che:

(x1∗ − m) · n1 = −(xk∗ − m) · nk
(x2∗ − m) · n2 = −(xk−1

− m) · nk−1
... = ...
∗ ∗
(x(k−δ)/2 − m) · n(k−δ)/2 = −(x(k−δ)/2+1 − m) · n(k−δ)/2+1

I N.B.: se k è dispari
∗ ∗
⇒ δ = 1 ⇒ m = x(k+1)/2 ⇒ (x(k+1)/2 − m) · n(k+1)/2 = 0
I Sommando ambo i membri delle uguaglianze si ha
(k−δ)/2 k k
X X X
(xj∗ − m) · nj = − (xj∗ − m) · nj ⇔ (xj∗ − m) · nj = 0
j=1 j=(k−δ)/2+1 j=1

I la somma degli scarti dalla mediana è 0 ⇔ m = µ


Caratteristiche di una distribuzione simmetrica

1. media e mediana coincidono µ = m


60

40

40

20
50

30

30

15
40

Frequency

Frequency

Frequency
30

20

20

10
20

10

10

5
10
0

0
20 40 60 80 100 20 40 60 80 100 20 40 60 80 100 20 40 60 80 100

a b c d
30

30

50

80
25

25

40

60
20

20
Frequency

Frequency

Frequency
30
15

15

40
20
10

10

20
10
5

5
0

0
20 40 60 80 100 20 40 60 80 100 20 40 60 80 100 20 40 60 80 100
Caratteristiche di una distribuzione simmetrica
Pk ∗
2. j=1 (xj − µ)3 nj = 0 e, più in generale,
Pk ∗
j=1 (xj − µ)r nj = 0 per r dispari
Dimostrazione

I Ripartendo dalla dimostrazione precedente, per r dispari:

(x1∗ − m)r · n1 = −(xk∗ − m)r · nk


(x2∗ − m)r · n2 = −(xk−1

− m)r · nk−1
... = ...
∗ r ∗
(x(k−δ)/2 − m) · n(k−δ)/2 = −(x(k−δ)/2+1 − m)r · n(k−δ)/2+1

I Sommando ambo i membri delle uguaglianze si ha


(k−δ)/2 k k
X X X
(xj∗ − m)r · nj = − (xk∗ − m)r · nk ⇔ (xj∗ − m)r · nj = 0
j=1 j=(k−δ)/2+1 j=1
Caratteristiche di una distribuzione simmetrica

3. Q1 e Q3 sono equidistanti dalla mediana


Piccolo break & Quiz di autovalutazione

https://tinyurl.com/yxn8lgum
Piccolo break & Quiz di autovalutazione
Asimmetria

Se non viene rispettata la condizione di SIMMETRIA si ha una


distribuzione
I Asimmetrica a destra (positiva)
I Asimmetrica a sinistra (negativa)
Asimmetria positiva

1. µ > m
Pk ∗
2. j=1 (xj − µ)3 nj > 0
3. Q3 − m > m − Q1
Asimmetria negativa

1. µ < m
Pk ∗
2. j=1 (xj − µ)3 nj < 0
3. Q3 − m < m − Q1
Indici di Asimmetria

1. α1
2. α2
3. α3
Indici di Asimmetria

1. α1 si basa sul confronto tra media e mediana



µ−m  >0
 asimmetria positiva
α1 = = =0 simmetria
σ 
 < 0 asimmetria negativa

I −1 ≤ α1 ≤ +1 perché |µ − m| ≤ σ
Indici di Asimmetria

2. α2 si basa sugli scarti dalla media al cubo


 >0 asimmetria positiva
 
k 
1 1
(xj∗ − µ)3 nj  =
X
α2 = =0 simmetria
σ3 N j=1

 < 0 asimmetria negativa

I è un numero puro (perché basato sugli scarti standardizzati)


I ma il suo campo di variazione è indeterminato
I è molto sensibile alla presenza di valori anomali
Indici di Asimmetria
3. α3 si basa sui quartili

(Q3 − m) − (m − Q1 ) Q3 + Q1 − 2m
α3 = =
(Q3 − m) + (m − Q1 ) (Q3 − m) + (m − Q1 )

 >0
 asimmetria positiva
= =0 simmetria

 < 0 asimmetria negativa

I −1 ≤ α3 ≤ +1 è normalizzato
I α3 = −1 quando m = Q3
I α3 = +1 quando m = Q1
I è robusto perché basato sui quartili
I è un numero puro
Piccolo break & Quiz di autovalutazione

https://tinyurl.com/yym52cc2
Piccolo break & Quiz di autovalutazione
Piccolo break & Quiz di autovalutazione
Soluzione quiz di autovalutazione
Ancora Teorema di Chebyshev

1500
2000

500
1500

400

1000
Frequency

Frequency

Frequency
300
1000

200

500
500

100
0

0
−2 0 2 4 0.0 0.5 1.0 1.5 2.0 0.0 0.2 0.4 0.6 0.8 1.0

deviazione standard = 1 deviazione standard = 0.58 deviazione standard = 0.35


fr.rel = 0.13 <= 0.44 fr.rel = 0.13 <= 0.44 fr.rel = 0 <= 0.44
3500

2500
2500
2500
Frequency

Frequency

Frequency

1500
1500
1500

500

500
500
0

0
−6 −4 −2 0 2 4 6 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

deviazione standard = 2.23 deviazione standard = 0.21 deviazione standard = 0.21


fr.rel = 0.09 <= 0.44 fr.rel = 0.1 <= 0.44 fr.rel = 0.11 <= 0.44
(Curtosi)

Non la trattiamo perché ha senso solo se in riferimento al modello


teorico della Distribuzione Normale
iponormale o platicurtico ipernormale o leptocurtica
2.0

0.30
0.25
1.5

0.20
Density

Density
1.0

0.15
0.10
0.5

0.05
0.00
0.0

−0.5 0.0 0.5 1.0 1.5 −6 −4 −2 0 2 4 6

es.1 es.2
indice di curtosi = 2.17 indice di curtosi = 5.1

Potrebbero piacerti anche

  • Slides
    Slides
    Documento32 pagine
    Slides
    Lorenzo Masperoni
    Nessuna valutazione finora
  • 22 Slides
    22 Slides
    Documento38 pagine
    22 Slides
    Lorenzo Masperoni
    Nessuna valutazione finora
  • 23 Slides
    23 Slides
    Documento28 pagine
    23 Slides
    Lorenzo Masperoni
    Nessuna valutazione finora
  • 24 Slides
    24 Slides
    Documento31 pagine
    24 Slides
    Lorenzo Masperoni
    Nessuna valutazione finora
  • Cedolino 202106
    Cedolino 202106
    Documento2 pagine
    Cedolino 202106
    Lorenzo Masperoni
    Nessuna valutazione finora