Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 Introdução a Estatística.
1.1 Campos de Aplicação.
1º Período ou de Preparação dos fatos. (vai do regime feudal até meados do século XVII);
2º Período ou de Preparação das teorias. (meados do século XVII até inicio do século XIX);
3º Período ou do Aperfeiçoamento. (iniciou em 1853 com a Reunião do Primeiro Congresso de
Estatística).
Raciocínio Estatístico – Pode ser definido como os processos voltados para o entendimento, o
gerenciamento e a redução de variações.
2 DISTRIBUIÇÃO DE FREQUÊNCIA.
É o tipo de tabela mais importante para a Estatística Descritiva.
2.1 Dados
Podem ser entendidos como a informação numérica necessária para nos ajudar a tomar
decisões mais bem fundamentadas em determinada situação.
Categorias ordenadas
Variável categorizada
(Mais baixo---------Mais alto)
Temperatura Intervalo
Calendário Intervalo
Altura Proporcionalidade
Peso Proporcionalidade
Idade Proporcionalidade
(1 + 3,22 log n)
K= + ln n
2
OBS: ln é o logarítimo natural e o log é o logarítimo decimal
At
h =
K
2.3.8 LIMITES DE CLASSES.
São números extremos de cada classe. Há um limite inferior ou mínimo e um limite
superior.
Limite superior da 1ª
classe
Limite inferior
da 1ª classe Classes
39.00 |— 45.89
45.89 |— 52.78
52.78 |— 59.67
Este símbolo significa que o intervalo é
59.67 |— 66.56 fechado no limite inferior e aberto no
limite superior. Ou seja, neste intervalo
temos todos os elementos que iniciam
66.56 |— 73.44 com o nº 39 e terminam em 45,89
Nesta tabela excluindo o mesmo.
temos 5 classes
li + ls
xi =
2
2.4 TIPOS DE FREQUÊNCIA.
∑i =1
fi = n
fi fi
Fr i = k
Fr i =
∑ fi
i =1
Ou
n
∑ Fr
i =1
i = 1,00
∑ xi
x = i =1
n
Em que, n é o número de elementos do conjunto.
∑ i =1
xi fi
x =
n
Classes fi xi xi.fi
39 |— 45 7 42 294
45 |— 51 8 48 384
51 |— 57 6 54 324
57 |— 63 4 60 240
63 |— 69 5 66 330
TOTAL 30 1572
1572
X = X = 52,4
30
G = n x1.x2. x3 ...xn
OBS: Um método mais rápido para cálculo da média geométrica é se usarmos a logaritmação.
∑ lo g x i
G = a n t lo g i=1
∑ f .log x
i i
G = ant log i =1
n
Exemplo 4:Calcule a média geométrica da tabela a seguir:
∑ 78 60,1757
Fonte: Secretaria Geral
60,1757
G = ant log
78
3.3.1 MEDIANA. ( Md ) ou x%
A mediana é considerada uma separatriz, pois divide a distribuição ou conjunto de
dados em duas partes iguais. O número que indica a ordem em que se encontra o valor
correspondente a mediana é denominado elemento mediano, cujo símbolo é E Md .
Se n for um número ímpar, a mediana coincide com o termo central da série, ou
n + 1
seja, com o termo de ordem . Se n for par, a mediana será a média entre os
2
n n
elementos centrais de e +1 .
2 2
0 50% 100%
x%
a) Para dados não agrupados:
Exemplo 9: Seja X = (2;4;6;8;10) calcular a mediana:
Resposta: n é nº ímpar então coincide com o termo central da série no caso é 6. Para isso é
preciso que os dados estejam em ordem.
~
9 + 10
X= = 9,5
2
a) Mediana Para uma distribuição de freqüência por valores. (variável discreta).
Em uma distribuição de freqüências por valores a mediana é localizada utilizando-se o
posicionamento da mediana dentro da distribuição, através da freqüência acumulada de
ordem crescente.
Exemplo:
Notas obtidas dos alunos da UEMA
Nº de alunos
Notas ( xi ) f ac
( fi )
0 5 5
2 8 13
4 12 25
6 10 35
8 18 53
10 25 78
∑ 78
Fonte: Secretaria Geral
78
EMd = = 39º elemento logo a mediana é 8, pois o trigésimo nono elemento
2
está na 5ª classe
n
−∑ f .h
+
2
x% = lMd
f Md
Em que:
MODA ( M0 ) ou X .
∧
3.3.2
^
X =8
Exemplo: Dada a distribuição de freqüência abaixo qual o valor da moda:
Notas obtidas dos alunos da UEMA
Notas ( xi ) Nº de alunos ( fi )
0 5
2 8
4 12
6 10
8 18
10 25
∑ 78
Fonte: Secretaria Geral
∆1 f post
M o = lmo + .h Mo = lmo + .h
∆1 + ∆ 2 fant + f post
Onde:
∆1 = f mo − f ant
∆2 = fmo − f post
OBS: outra maneira de calcular a moda quando a distribuição apresentar boa simetria em
relação à média é:
Fórmula de PEARSON
M o = 3 x% − 2 x
Q1 Q2 Q3
Q1 = 1º quartil, deixa 25% dos elementos;
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos;
Q3 = 3º quartil, deixa 75% dos elementos.
a) Cálculo do quartis para uma distribuição de dados brutos ou freqüência por valores
(dados não agrupados).
i.n
PQi =
Fórmula do Posicionamento do Quartil de ordem i
4
Exemplo: Na tabela Abaixo calcule o 3º Quartil:
Notas dos alunos da UEMA
Nº de alunos
Notas ( xi ) f ac
( fi )
0 5 5
2 8 13
4 12 25
6 10 35
8 18 53
10 25 78
∑ 78
Fonte: Secretaria Geral
3 X 78
PQ3 = = 58,5 ≅ 59º elemento está na ultima classe logo Q3 = 10 ou seja 75% das
4
notas dos alunos estão variando de 0 a 10.
Determinação de Q1 , Q2 eQ3
i.n
1º passo: Calcular PQi =
4
3º passo cálculo:
i.n
( −∑ f)
Qi = lmd + 4 .h
f Md
4.2 DECIS.
Dividem um conjunto de dados em 10 partes iguais.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
a) Para distribuição de dados brutos ou de freqüência por valores (dados não
agrupados).
i .n
P Di =
10
i.n
− ∑ f .h
Di = lDi +
10
fDi
4.3 PERCENTIS.
Dividem um conjunto de dados em 100 partes iguais.
0% 1% 2% ... ...
3% 50% 97% 98% 99% 100%
a) Percentis para uma distribuição de dados ou freqüência por valores (dados não
agrupados).
i.n
PPi = Fórmula de posicionamento do percentil de ordem i
100
−
X = 6,0250
i .n
P Pi =
100
i.n
−∑ f .h
Pi = lPi +
100
f Pi
5 MEDIDAS DE DISPERSÃO
5.1 VARIÂNCIA.
É a mais usada entre as medidas absolutas de dispersão ou variabilidade. Sendo que
σ 2
a variância populacional e
2
S
a variância amostral.
∑( x − X ) ∑( x − X )
n 2 n 2
e
i i
σ2 = i =1
S2 = i =1
N n −1
b) Para uma tabela distribuição de freqüência
∑(x − X ) ∑( x − X )
n 2 n 2
e
i . fi i . fi
σ2 = i =1
S2 = i =1
N
EXEMPLO: Dada a tabela a seguir calcule a variância populacional. n −1
∑ 78,00 795,9487
Fonte: Secretaria Geral
795,9487
S2 = = 10,3369 pontos2
78 − 1
5.2 DESVIO-PADRÃO OU QUADRADO MÉDIO.
É a medida de dispersão mais usada, tendo em comum com o desvio médio o fato de
ambos serem considerados os desvios com relação a média. Para se calcular o desvio-padrão
deve-se primeiramente determinar o valor da variância e em seguida, extrair a raiz quadrada
desse resultado, assim:
σ = σ2 Desvio-padrão populacional
S = S2 Desvio-padrão amostral
σ S
CV = ×100 E
CV = × 100
X x
EXEMPLO 1: Suponhamos que uma firma que ofereça serviços de consultoria para alunos de
segundo grau em todo o território do Brasil tenha contratado uma analista para comparar as
taxas escolares cobradas por faculdades e universidades em diferentes regiões do País. Os
dados abaixo apresentam as taxas escolares de 60 Faculdades e Universidades em dólares.
Montar os dados numa tabela de distribuição de freqüência e calcular as medidas de
tendência central, separatrizes, dispersão e fazer o histograma.
2 4
3 869694995956
4 9876878599994999918
5 48089
6 4046
7 27049
8 33058600
10 743
11 06
12 0
2 4
3 455666899999
4 1456778888999999999
5 04889
6 0446
7 02479
8 00033568
10 347
11 06
12 0
2,4 – 3,4 – 3,5 – 3,5 – 3,6 – 3,6 – 3,6 – 3,8 – 3,9 – 3,9 – 3,9 – 3,9 – 3,9 – 4,1 - 4,4 - 4,5 – 4,6 – 4,7
– 4,7 – 4,8 – 4,8 – 4,8 – 4,8 – 4,9 – 4,9 – 4,9 – 4,9 – 4,9 4,9 – 4,9 – 4,9 - 4,9 – 5,0 – 5,4 – 5,8 – 5,8
– 5,9 – 6,0 – 6,4 – 6,4 – 6,6 – 7,0 - 7,2 – 7,4 – 7,7 – 7,9 – 8,0 –8,0 – 8,0 – 8,3 – 8,3 – 8,5 - 8,6 - 8,8
- 10,3 - 10,4 10,7 - 11,0 - 11,6 - 12,0
Montagem da tabela
Calcular:
a) A amplitude total
At = 12 − 2,4 = 9,6dolares
b) O nº de classes
K = 1 + 3,22 log 60 = 6,7256 ≅ 7classes
c) A amplitude de classes
9,6
h= = 1,3714 = 1,5
7
d) O Limite das classes: Para montagem da tabela Inicia-se com o menor nº da distribuição e
adiciona-se o valor da amplitude de classes.
Classes
2.40 |— 3.90
3.90 |— 5.40
5.40 |— 6.90
6.90 |— 8.40
8.40 |— 9.90
9.90 |— 11.40
11.40 |— 12.90
f
e) Freqüência Simples ( i ): Utiliza-se a disposição ordenada para realização da contagem,
ou seja, verificam-se quantos elementos têm entre 2,4 até 3,9. No caso são oito faculdades
que praticam taxas neste intervalo.
Classes fi
2.40 |— 3.90 8
3.90 |— 5.40 25
5.40 |— 6.90 8
6.90 |— 8.40 10
8.40 |— 9.90 3
9.90 |— 11.40 4
11.40 |— 12.90 2
TOTAL 60
f) Ponto médio (xi): Soma o limite inferior e superior de cada classe dividido por dois. O
ponto médio representa cada intervalo de classe.
Classes fi xi
2.40 |— 3.90 8 3.15
3.90 |— 5.40 25 4.65
5.40 |— 6.90 8 6.15
6.90 |— 8.40 10 7.65
8.40 |— 9.90 3 9.15
9.90 |— 11.40 4 10.65 Significa que temos 33
faculdades que praticam
11.40 |— 12.90 2 12.15 taxas a partir de 2,4 até
5,4 dólares
TOTAL 60
Classes fi xi fac
2.40 |— 3.90 8 3.15 8
3.90 |— 5.40 25 4.65 33
5.40 |— 6.90 8 6.15 41
6.90 |— 8.40 10 7.65 51
8.40 |— 9.90 3 9.15 4
9.90 |— 11.40 4 10.65 58
11.40 |— 12.90 2 12.15 60
TOTAL 60
j) Média aritmética X
Classes fi xi xi.fi
2.40 |— 3.90 8 3.15 25.2
3.90 |— 5.40 25 4.65 116.25
5.40 |— 6.90 8 6.15 49.2
6.90 |— 8.40 10 7.65 76.5
8.40 |— 9.90 3 9.15 27.45
9.90 |— 11.40 4 10.65 42.6
11.40 |— 12.90 2 12.15 24.3
TOTAL 60 361.5
361,5
X= = 6,0250dolares
60
l) Média Geométrica (G)
44,9832
G = ant log = ant log 0,7497 = 100, 7497 = 5,6198
60
~
m) Mediana X
Classes fi fac
2.40 |— 3.90 8 8
3.90 |— 5.40 25 33
5.40 |— 6.90 8 41
6.90 |— 8.40 10 51
8.40 |— 9.90 3 4
9.90 |— 11.40 4 58
11.40 |— 12.90 2 60
TOTAL 60
60
EMd = = 30º elemento a mediana está na 2ª classe.
2
~ (30 − 8)
X = 3,9 + .1,5 = 5,22 dolares . Este valor corta a distribuição em 50%
25
0 50%% 100%
x% =5,22
2,4 12,9
^
n) Moda X
Classes fi
2.40 |— 3.90 8
3.90 |— 5.40 25
5.40 |— 6.90 8
6.90 |— 8.40 10
8.40 |— 9.90 3
9.90 |— 11.40 4
11.40 |— 12.90 2
TOTAL 60
A maior freqüência é a da 2ª classe. Utilizando a fórmula de KING temos que:
^ 8
X = 3,9 + .1,5 = 4,65dolares
(8 + 8)
o) Quartis
Classes fi fac
2.40 |— 3.90 8 8
3.90 |— 5.40 25 33
5.40 |— 6.90 8 41
6.90 |— 8.40 10 51
8.40 |— 9.90 3 4
9.90 |— 11.40 4 58
11.40 |— 12.90 2 60
TOTAL 60
Cálculo de Q1
1.60
PQ1 = = 15º elemento Está na 2ª classe
4
(15 − 8)
Q1 = 3,9 + .1,5 = 4,32 Significa que 25% das faculdades amostradas praticam taxas
25
entre 2,4 e 4,32 dólares.
p) Variância S2
Deve-se 1º calcular o valor da média aritmética (neste caso foi 6,0250). Depois subtrair cada
valor de xi da mesma e elevar ao quadrado. Em seguida multiplicar pela freqüência simples
da classe. Exemplo:
329 ,8125
S2 = = 5 ,59 dolares 2
60 − 1
q) Desvio Padrão S