Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTATÍSTICA
DESCRITIVA
Exemplo 1.1 - Faturamento bruto no mês
passado, em milhões de R$, das 30 filiais
de uma determinada empresa de varejo:
Frequências
10
8
6
4
2
0
Classes
2-|5 5-|8 8-|11 11-|14 14-|17 17-|20
no de i-ésima
observações observação
No exemplo 1.1, usando os dados brutos,
o faturamento médio é
= 307,7/30 = 10,3 milhões.
Note que o valor 10,3 não ocorre.
Nenhum problema!
A média de um conjunto de dados não
precisa ser um dos valores observados.
Exemplo 1.3:
Md = 3,0.
5 ganham R$ 2.500,00;
2 ganham R$ 3.000,00;
3 ganham R$ 4.000,00;
2 ganham R$ 4.500,00.
x 1 x 1 2 x 2 ... n x n
i i
p i 1
.
1 2 ... n
n
i i 1
n ( x )
i
( x i ) ou i 1
.
i 1 n
Solução:
Problema: trabalhar com os
quadrados dos
n desvios!
(x ) 0, sempre!
i 1
i
Variância 2
( )
(x i ) 2
2 i 1
.
n
x 2
i
2 i 1
.
2
Interpretação?
A variância apresenta um sério problema: ela
é expressa no quadrado da unidade original,
em geral uma unidade que sequer faz sentido.
. 2
99,72%
• Variância Amostral (s2)
média amostral.
n n
(x i x) 2
x 2
i nx 2
s
2 i 1
i 1
.
n 1 n 1
k k
(x
j1
j j ) 2
x
j1
j
2
j
2
.
2
n n
Exercício 1.4 - Calcule a variância dos pesos
na população do exercício 1.2, com base
apenas na distribuição de frequências:
Classe Frequência
40 | 50 Kg 2
50 | 60 Kg 5
60 | 70 Kg 7
70 | 80 Kg 8
80 | 90 Kg 3
(a média é 67 Kg)
R: 128.
Coeficiente de Variação (CV)
0 | 50 KWh 8%
50 | 100 KWh 20%
100 | 150 KWh 52%
150 | 300 KWh 92%
300 | 500 KWh 100%
A figura a seguir posiciona Q1 (= 100+h)
na distribuição de frequências acumuladas:
h é calculado por meio da seguinte regra de três:
150 100 52 20 h=250/32 8
h 25 20
Assim, o primeiro quartil é: Q1 108 KWh.
A figura a seguir posiciona Q3 (= 150+h)
na distribuição de frequências acumuladas:
h é calculado por meio da seguinte regra de três:
300 150 92 52 h=3450/40 86
.
h 75 52
Assim, o terceiro quartil é: Q3 236 KWh.
Amplitude Interquartílica
Q = Q3 – Q1
Box-Plot
Box-Plot (diagrama de extremos e quartis) é um
diagrama que representa:
- a mediana,
- os quartis Q1 e Q3,
- uma linha vai de Q3 até a maior observação que não
exceda o limite superior, LS=Q3+1,5Q,
- uma linha vai de Q1 até a menor observação que não
seja menor do que o limite inferior, LI= Q1-1,5Q.
Exemplo 1.9 - Seja o seguinte rol: 5, 10,
12, ... , 37, 42, 45. Sabendo-se que os quartis
são 20, 25 (mediana) e 28, obtenha o box-
plot associado a este conjunto de dados.
Aplicações do Box-Plot
Um diagrama de dispersão é um
gráfico de pontos {(xi,yi); i = 1,2,...,n}
que indica se parece ou não existir
alguma relação entre 2 variáveis X e Y,
e identificar qual o tipo desta relação.
Fórmula:
n
(x i X )( yi Y )
XY i 1
.
n
Interpretação da Covariância:
É aí que entra o
coeficiente de correlação.
Coeficiente de Correlação
O coeficiente de correlação é um
número entre -1 e 1, que mede a força
da associação linear entre X e Y.
Fórmula:
XY
XY .
XY
Interpretação do
Coeficiente de Correlação:
1. Varia entre -1 e 1
2. É adimensional (não possui unidade)
3. Representa apenas a relação linear
n n
x y n
i i X Y x y i i
XY i 1
i 1
X Y .
n n
• Covariância e Correlação Amostrais
n n
( x i x )( yi y) x i yi nxy
s XY i 1
i 1
.
n 1 n 1
s XY
rXY ,
s Xs Y
onde sX e sY são os desvios padrão amostrais.
(perceba que, numericamente, rXY = XY)