Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=
=
1
Exemplo:
Temos uma amostra de 10 crianas de 5 anos de idade, com dados referentes a seus
pesos (em kg): 23,0 20,0 22,0 19,0 25,0 28,2 24,0 21,0 27,0 21,0 n = 10
kg 23
10
21 27 21 24 28 25 19 22 20 23
X =
+ + + + + + + + +
=
b) Dados tabelados
b.1) Tabela com Valores Ponderados
Mdia Aritmtica Ponderada (Xi), (onde fi o peso)
=
=
i
f
n
i
i
f .
i
X
X
1
Exemplo:
Nota do aluno "X" 1
0
semestre de 2007 FESURV
Notas (Xi) Pesos (fi) Xi.fi
7,8 2 15,6
8,3 3 24,9
9,2 2 18,4
5,8 3 17,4
10 76,3
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
14
Fonte: Dados Hipotticos
=
=
n
i
i
f
n
i
i
f .
i
X
X
1
1
6 7
10
3 76
,
,
X =
b.2) Distribuio de freqncias
Mdia Aritmtica (X)
=
=
i
f
n
i
i
f .
i
X
X
1
Exemplo:
Altura em centmetros de 160 alunos do Curso de Medicina Veterinria da FESURV -
2007
Altura (cm) Xi fi Xi . fi
150 |--- 158 153,5 18 2763
158 |--- 166 161,5 25 4037,5
166 |--- 174 169,5 20 3390
174 |--- 182 177,5 52 9230
182 |--- 190 185,5 30 5565
190 |--- 198 194,5 15 2917,5
160 27903
Fonte: Departamento de Estatstica (2007)
=
=
i
f
n
i
i
f .
i
X
X
1
= 4 174
160
27903
, X = cm
3.1.2 Moda (Mo)
A moda outra medida de tendncia central, sendo, no entanto a menos importante.
Sua vantagem que pode ser usada para variveis qualitativas. Genericamente,
pode-se definir a moda como o valor mais freqente da distribuio.
a) Dados No Tabelados
Ex.: 3 4 4 4 5 5 6 6 7 8 9 Mo = 4 (unimodal)
5 6 7 8 9 10 11 12 13 Mo = (amodal)
1 1 2 2 3 3 3 4 5 5 5 Mo1 = 3 Mo2 = 5 (bimodal)
5 5 6 6 7 7 8 8 Mo = (amodal)
5 5 6 6 7 7 8 Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
b) Determinao da Moda para Valores Tabulados.
No caso de dados tabelados no agrupados em classe, a determinao da moda
imediata, bastando para isso, consultar a tabela, localizando o valor que apresenta a
maior frequncia.
Distribuio de freqncias intervalar
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
15
3.1.2.1 - Moda de Czuber (Moc)
O processo para determinar a moda usada por Czuber leva em considerao as
freqncias anteriores e posteriores classe modal.
=
=
+
+ =
Pos
f Mo
f
Ant
f
Mo
f
h .
i
l
o
M
2
1
2 1
1
onde:
li limite inferior da classe modal;
fMo freqncia absoluta da classe modal;
h amplitude do intervalo de classe;
fant freqncia absoluta da classe anterior a classe modal;
fpos freqncia absoluta da classe posterior a classe modal;
3.1.3 Mediana (Md)
definido como o valor que divide uma srie ordenada de tal forma que pelo menos a
metade dos itens sejam iguais ou maiores do que ela, e que a outra metada dos itens
sejam menores do que ela. Colocados em ordem crescente, a mediana o elemento
que ocupa a posio central.
Como a mediana divide os dados ordenados ao meio, ela no sensvel a valores
discrepantes. A depender de como estejam os dados, deve-se diferenciar a forma
como encontra-se a mediana.
1. Determinao da Mediana de Valores no-tabulados.
Processa-se a partir de um rol ou lista ordenada dos dados. Podem ocorrer duas
hipteses com relao ao nmero de observaes n: que ele seja mpar ou par.
Veremos os dois casos:
a) Nmero mpar de observaes:
Requer, em primeiro lugar, que se determine a ordem em que se encontra a mediana
na srie. Para isto encontramos:
Posio =
2
1 + ++ + n
termos impares
O passo seguinte ser localizar a mediana na lista de valores, de acordo com o
resultado obtido no clculo do elemento mediano (Emd).
b) Nmero par de observaes:
Neste caso, o elemento mediano ser determinado atravs da expresso:
Posio = 1
2
+ ++ +
n
termos pares
A mediana ser determinada pela mdia aritmtica entre os valores que ocupam a
posio definida pelo elemento mediano e a posio sucessora.
2. Determinao da Mediana de Valores Tabulados no-Agrupados em Classes.
Da mesma forma como foi calculado anteriormente, definiremos o elemento mediano.
Em seguida, acrescentaremos tabela de freqncia uma coluna de freqncias
acumuladas abaixo de absoluta. Com o uso destas freqncias encontraremos a
posio definida pelo elemento mediano, na qual estar a mediana.
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
16
Exemplo: Clculo da mediana para os dados da tabela 4 da seco de mdia.
Tabela 6: Nmero de cries em crianas de 7 anos de idade. Candeias. 1990.
N
0
de dentes careados (xi) N
0
de crianas (fi) Fi
0
1
2
3
4
5
3
2
4
2
1
1
3
5
9
11
12
13
TOTAL 13
Fonte: (dados hipotticos)
Soluo: n = 13 ==> 7
2
1 13
P =
+
=
Como n mpar > a mediana definida pelo valor que ocupa a 7
a
posio. Com
base nas informaes da coluna que contm as freqncias acumuladas abaixo de
absoluta, a mediana igual a 2.
Interpretao: 50% das crianas de 7 anos apresentaram 2 ou menos cries numa
comunidade de Candeias em 1990.
3. Determinao da Mediana de Valores Tabulados Agrupados em Classes.
Neste caso, encontramos o elemento mediano atravs da frmula
2
n
P = , no se
fazendo distino entre nmero par ou mpar de observaes. A partir da,
determinaremos a classe mediana, aps a qual a mediana ser calculada atravs da
seguinte expresso:
Md
f
h .
ANT
F
i
f
li
d
M
|
\
|
+ =
2
onde:
li limite inferior da classe que contm a mediana;
2
n
posio da mediana;
Fant freqncia acumulada da classe anterior a que contm a mediana;
h amplitude do intervalo de classe;
f Md freqncia absoluta da classe que contm a mediana;
Exemplo: Clculo da mediana para os dados da Tabela 5
Casos de Aids segundo faixa etria. Bahia. 1993
Faixa Etria fi(1000) F
i
15 |----- 25
25 |----- 35
35 |----- 45
45 |----- 55
25
30
15
10
25
55
70
80
Total 80
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
17
Fonte: (Dados hipotticos)
Soluo
n=80 40
2
80
2
n
P = = =
O elemento que ocupa a 40
a
posio encontra-se na 2
a
classe. Logo,
30 Md
30
25 40 10
25 Md =
+ =
) (
Interpretao: 50% dos pacientes de Aids na Bahia, em 1993, tinham idade igual ou
inferior a 30 anos.
Figura 3.2 - Relaes entre a mdia (), a mediana (Md) e a moda (Mo)
As relaes entre a mdia (), a mediana (Md) e a moda (Mo) para uma
distribuio com uma s moda pode ser examinada na Figura 3.2. Para uma
distribuio simtrica os valores da mdia, mediana e moda coincidem. Se a
distribuio enviesada para a esquerda, < Md < Mo. Se a distribuio
enviesada para a direita, Mo < Md < . Em distribuies enviesadas, a mediana
est sempre entre a mdia e a moda.
3.2 Medidas de disperso
Visam descrever os dados no sentido de informar o grau de disperso ou afastamento
dos valores observados em torno de um valor central (representativo) chamado mdia.
Informa se um conjunto de dados homogneo (pouca variabilidade) ou heterogneo
(muita variabilidade).
3.2.1 TIPOS DE MEDIDAS DE DISPERSO
3.2.1.1 Amplitude Total ou Intervalo Total (H) => a diferena entre os valores
extremos da srie.
H = Xmx Xmn
Para estudarmos as medidas de variabilidade para dados no tabelados usaremos um
exemplo prtico.
Supomos que uma empresa esteja querendo contratar um funcionrio, e no final da
concorrncia sobraram dois candidatos para uma nica vaga.
Ento foi dado 4 tarefas para cada um, onde as mesmas tiveram como registro o
tempo (em minutos) de execuo.
TAREFAS 1 2 3 4
OPERRIO 1 (TEMPO) 55 45 52 48
OPERRIO 2 (TEMPO 30 70 40 60
Operrio 1: H = X
mx
X
mn
=> H = 55 45 = 10
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
18
Operrio 2: H = X
mx
X
mn
=> H = 70 30 = 40
Logo, a maior disperso ocorreu com o operrio 2
3.2.1.2 - Anlise Grfica
0
10
20
30
40
50
60
0 1 2 3 4 5
0
10
20
30
40
50
60
70
80
0 1 2 3 4 5
Operrio a Operrio b
A amplitude nos d a idia do campo de variao dos valores da srie. No entanto,
devemos frisar que a amplitude no uma boa medida de disperso porque seu
clculo se baseia apenas nos valores extremos da amostra e no em todos os dados.
2. Varincia (S
2
ou
2
)
As medidas de tendncia central so insuficientes para descrever adequadamente
uma amostra. necessrio tambm descrever em que medida os dados de
observao esto agrupados ao redor da mdia. A varincia mede a disperso dos
dados de observaes de uma amostra em relao a respectiva mdia.
A varincia amostral simbolizada por S
2
, calculada pela frmula:
( )
=
n
1 i
1 n
2
x
i
x
2
S ou
( )
=
=
n
1 i
N
2
x
i
x
2
Em que x
i
so as observaes da amostra e n o nmero total de observaes. Em
termos, a varincia a soma dos quadrados dos desvios em relao mdia, dividido
pelo nmero de observaes menos uma.
Exemplo
A determinao de glicose plasmtica em 9 indivduos forneceu os seguintes
resultados (mg/dL): 90 86 78 90 98 90 82 76 e 84
x
i ) ( x
i
x d = 2
x
i
x
2
d ) ( =
90
86
78
90
98
90
82
76
84
90-86=4
86-86=0
78-86=-8
90-86=4
98-86=12
90-86=4
82-86=-4
76-86=-10
84-86=-2
(4)
2
=16
(0)
2
=0
(-8)
2
=64
(4)
2
=16
(12)
2=
144
(4)
2
=16
(-4)
2
=16
(-10)
2
=100
(-2)
2
=4
0 376
Soluo:
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
19
( )
=
n
1 i
1 n
2
x
i
x
2
S 47
1 9
376
2
S =
=
A varincia S
2
, como estatstica calculada da amostra uma estimativa no viciada da
varincia populacional.
O denominador n-1 chamado de graus de liberdade (GL). O uso de n em lugar de n-
1 como denominador no clculo da varincia amostral obter-se-ia um valor menor que
o verdadeiro valor do parmetro populacional (
2
) .A situao corrigida reduzindo o
denominador pela subtrao de uma unidade.
A varincia amostral tambm pode ser calculada por particularmente bem adaptada
para o emprego de calculadoras.
( )
1 n
n
2
i
x
2
i
x
2
S
=
Seja o exemplo
x
i 2
i
x
90
86
78
90
98
90
82
76
84
8100
7396
6084
8100
9604
8100
6724
5776
7056
774 66940
( )
1 n
n
2
i
x
2
i
x
2
S
= = 47
8
66564 66940
1 9
9
2
774
66940
2
S =
=
) (
3.3 Desvio-Padro (S ou )
a medida de disperso mais usada e mais importante. Mede a concentrao dos
dados em torno da mdia. dado pela soma dos quadrados dos desvios dividido pelo
nmero total de observaes.
calculado pelas frmulas:
a) Desvio-padro de dados brutos:
( )
=
n
1 i
1 n
2
x
i
x
S ou
( )
1 n
n
2
i
x
2
i
x
S
=
O desvio padro, portanto a raiz quadrada da varincia.
Para o exemplo da seo anterior
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
20
dL mg 85 6 47
1 9
376
S / , = =
=
O desvio padro da amostra uma estimativa do valor paramtrico (sigma), o desvio
padro verdadeiro da populao.
Para os dados de medio, especialmente em grandes amostras, o desvio padro
indica os limites provveis dentro dos quais se situam certas propores das
observaes. Assim verifica-se que 68% das observaes da amostra estar entre os
limites s x ; 95% das observaes entre s 2 x ; e 99% das observaes entre
s 3 x .
b) Desvio-padro para dados tabulados
Neste caso emprega-se o ponto mdio para apresentao das medidas includas
naquela classe. Deve-se levar em considerao tambm, a freqncia de cada classe
aplicando a frmula:
2
n
i
f
i
x
n
i
f
2
i
x
s |
\
|
=
Exemplo
Considere a tabela de distribuio de freqncias sem intervalos de classe do exemplo
dos exames solicitados por requisio mdica.
x
i
fi x
i
f
i
i
f
2
i
x
2
3
4
5
6
7
8
13
9
6
3
1
16
39
36
30
18
7
32
117
144
150
108
49
40 146 600
Logo:
2
n
i
f
i
x
n
i
f
2
i
x
s |
\
|
= = 29 1 68 1 32 13 15
1600
21316
15
2
40
146
40
600
, , , = = = = |
\
|
3.3.1 Desvio padro nas sries agrupadas com intervalos de classe
Para os dados grupados com intervalo de classe emprega-se a mesma frmula
apresentada anteriormente, ou seja:
2
n
i
f
i
x
n
i
f
2
i
x
s |
\
|
=
Exemplo
Concentrao de colesterol em uma amostra controle
i Concentrao f
i
x
i
x
i
f
i
i
f
2
i
x
1
2
3
4
5
6
154 |--- 158
158 |--- 162
162 |--- 166
166 |--- 170
170 |--- 174
174 |--- 178
4
12
14
10
7
3
156
160
164
168
172
176
624
1920
2296
1680
1204
528
97344
307200
376544
282240
207088
92928
50 8252 1363344
Mtodos quantitativos e estatsticos para a tomada de deciso
Prof. Nagib Yassin nagiyassin@yahoo.com.br
21
Soluo
2
n
i
f
i
x
n
i
f
2
i
x
s |
\
|
= = 36 5 68 28 2 27238 9 27266
2
50
8252
50
1363344
, , , , = = = |
\
|
3.3.2 - Coeficiente de Variao
O coeficiente de variao (CV) a magnitude relativa do desvio padro expresso em
percentagem da mdia. uma estatstica usada quando se deseja comparar a
variabilidade relativa em diferentes tipos de dados, inclusive em diferentes dados
medidos em diferentes unidades de medio.
O coeficiente de variao independe da unidade de medio empregado. Isto permite
a comparao de vrios tipos de dados, tais como, presso arterial com temperatura.
C.V. = 100 .
ou 100 .
X
S
Exemplo
A determinao de glicose plasmtica em 9 indivduos forneceu os seguintes
resultados (mg/dL): 90 86 78 90 98 90 82 76 e 84
86
9
84 76 82 90 98 90 78 86 90
X =
+ + + + + + + +
=
dL mg 85 6 47
1 9
376
S / , = =
=
% , .
,
96 7 100
86
85 6
CV = =
Obs.: 0% C.V 100%
C.V 50% a mdia representativa
C.V. 0 a maior representatividade da mdia (S = 0)