Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Medidas de assimetria e
curtose
2012
6.1. Medidas de assimetria
0.20
1.1
0.15
1.0
0.10
f(x)
f(x)
0.9
Distribuições
0.05
simétricas:
0.8
0.00
0.20
Obs. M = x0.
1.2
0.15
Moda e média
não
1.1
0.10
f(x)
f(x)
necessariamente
são iguais a x0.
1.0
0.05
0.9
0.00
12
14
1
16
x
2
x
18
3
20
22
4
f(x)
f(x)
0.0 0.1 0.2 0.3 0.4 0.5
0.00 0.05 0.10 0.15 0.20
0
1
5
2
x
3
x
10
4
5
15
6
Relação entre moda, mediana e média
Distribuição
assimétrica à direita ou
assimétrica positiva
(right skewed ou
positive skewed):
média > mediana >
moda.
Distribuição
assimétrica à
esquerda ou
assimétrica negativa
(left skewed ou
negative skewed):
média < mediana <
moda.
Desta forma,
n
∑ ( x − x ) = 0.
i =1
i 0 Logo, x0 = x.
Exemplo. (24, 26, 26, 32, 40, 60, 68, 74, 74, 76) é simétrico em relação a
x0 = 50.
Medidas de assimetria. Quantificação da falta de simetria de x1, x2, ..., xn.
Redução (drástica) de n observações a um só valor.
Assume valores reais. Medida = 0: indicativo de simetria.
Obs. Dados obtidos de uma variável aleatória X simétrica não
necessariamente são simétricos.
Assimetria em conjuntos de dados
0.7
0.6
0.3
0.5
Densidade
Densidade
0.4
0.2
0.3
0.2
0.1
0.1
0.0
0.0
2 3 4 5 6 7 8 10 11 12 13 14
x x
Assimetria negativa
0.8
0.3
0.6
Densidade
Densidade
0.2
0.4
0.1
0.2
0.0
0.0
14 15 16 17 18 19 20 0 1 2 3 4 5
x x
6.1.1. Medida de assimetria de Pearson
1 n
mk = ∑(xi −x)k , k = 0,1,2,...., sendo que m0 = 1 e m1 = 0.
n i=1
Obs. m2 = (n – 1) s2 / n.
3 * 3
* *
m3 = m − 3m x + 2 x
3 2 e m = m3 + 3m2 x + x
3 e
2 4 * 2 4
* * *
m4 = m − 4m x + 6m x − 3x .
4 3 2
m = m4 + 4m3 x + 6m2 x + x .
4
1 n
m3 n
∑ i =1 i
( x − x ) 3
g1 = = 3/ 2
.
m 23 / 2 1 n 2
n ∑ i =1 i
( x − x )
0.4
0.3
f(x)
0.2
0.1
0.0
16 18 20 22 24
x
Diferenças quanto ao afastamento em relação à média, mas que não
são captadas pela variância.
Este fato sugere utilizarmos o 4o momento central para quantificar estas
diferenças.
Distribuições platicúrticas, mesocúrticas e leptocúrticas
Platicúrtica (platykurtic):
caudas curtas ou leves (short
ou light ou thin).
Leptocúrtica (leptokurtic):
caudas longas ou pesadas
(long ou heavy ou thick ou fat).
1 n
m4 n
∑ i =1
( x i − x ) 4
g2 = 2 = 2
.
m2 1 n 2
n ∑ i =1 ( xi − x )
Propriedades. (1) g2 é adimensional e (2) g2 > 0.
Obs. Se X ~ N(µ, σ2), então E[(X – µ)4] / {E[(X – µ)2]}2 = E[(X – µ)4] / σ4 = 3.
Muitas vezes a curtose é expressa como g2e = g2 – 3 (excess).
Mesocúrtica: g2e = 0.
0.4
Platicúrtica (< 0)
Mesocúrtica (0)
Leptocúrtica (> 0)
0.3
f(x)
0.2
0.1
0.0
16 18 20 22 24
x
Momentos em R
Pacote moments
> library(moments)
40 observações
x = c(21.88, 22.61, 23.28, 25.19, 19.73, 22.50, 26.35, 22.09, 24.63,
19.79, 23.61, 29.91, 29.12, 23.17, 23.38, 21.75, 18.77, 20.38,
20.45, 28.23, 18.17, 30.15, 20.60, 19.99, 24.56, 25.59, 20.66,
23.76, 23.35, 22.77, 21.52, 20.54, 20.30, 23.45, 27.69, 24.82,
24.30, 21.97, 20.82, 22.78)
Pacote moments
> skewness(x)
[1] 0.7409046
Qual o resultado de mom4[4] / mom4[3]^1.5?
> kurtosis(x)
[1] 3.03822
Qual o resultado de mom4[5] / mom4[3]^2?
0.15
> kurtosis(x) - 3
[1] 0.03822
0.10
> hist(x, main = "", xlab =
Densidade
"x", freq = FALSE, ylab =
"Densidade") 0.05
> rug(x)
> lines(density(x), col =
0.00
"blue") 18 20 22 24 26 28 30 32
x
Dados faltantes (missing data) em R