Sei sulla pagina 1di 46

Anlise Exploratria de Dados

Aula 06
MEDIDAS DE POSIO
Prof. Hemlio Fernandes Campos Colho

5 de Maio de 2014

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Medidas de Posio

Vimos anteriormente a sintetizao dos dados sob a forma de


tabelas, grcos e distribuies de frequncias. Aqui, vamos
aprender o clculo de medidas que possibilitem representar um
conjunto de dados (valores de uma varivel quantitativa, isto ,
informaes numricas), relativos observao de determinado
fenmeno de forma reduzida.

Medidas de Posio que


medidas de tendncia central e

Estes ndices estatsticos so as


tambm chamadas de

so

estabelecem valores em torno dos quais os dados se distribuem.


Dizemos ainda que esse nome dado pelo fato dos dados
observados tenderem, em geral, a se concentrar em torno de valores
centrais.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mdia Aritmtica

Utilizaremos o smbolo

para denotar a mdia populacional, isto ,

a mdia da varivel de interesse observada para todos os indivduos


da populao, e, utilizaremos o smbolo X para denotar a mdia da
varivel de interesse na amostra.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mdia Aritmtica Simples

Se dispomos de um conjunto de valores (ordenados ou no) podemos


calcular sua mdia aritmtica simples por

PN
=

i =1 Xi
N

X1

+ . . . + XN
N

no caso populacional, em que N representa o nmero de indivduos da


populao. Ou, por

Pn
X

i =1 Xi
n

X1

+ . . . + Xn
n

no caso amostral, em que n representa o nmero de indivduos da


amostra.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Abaixo, temos uma amostra de 10 crianas de 5 anos de

idade, com dados referentes a seus pesos (em Kg).

Temos que n

=
=

= 10

23, 0

20, 2

22, 0

19, 0

25, 0

28, 8

24, 0

21, 0

27, 0

21, 0

e obtemos X atravs de

23, 0 + 20, 2 + 22, 0 + 19, 0 + 25, 0 + 28, 8 + 24, 0 + 21, 0 + 27, 0 + 21, 0
10
230, 0
= 23, 0.
10

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mdia Aritmtica Ponderada

Caso sejam atribudos pesos ou ponderaes s observaes, podemos


calcular sua mdia aritmtica simples por

PN

i i
i =1 wi

= Pi =N1

w X

w1 X1
w1

+ . . . + wN XN
,
+ . . . + wN

no caso populacional, em que N representa o nmero de indivduos da


populao e w1 , . . . , w

so os pesos das observaes. Ou, por

Pn
wi Xi
= Pi =n1
=

i =1 wi

+ . . . + wn Xn
,
w1 + . . . + wn

w1 X1

no caso amostral, em que n representa o nmero de indivduos da


amostra e w1 , . . . , w

n so os pesos das observaes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Sejam as notas de 5 provas de um aluno de estatstica e

os pesos atribudos a cada prova:


Notas

7, 0

3, 7

4, 9

6, 6

7, 2

Pesos

A mdia aritmtica ponderada das notas pode ser obtida por

=
=

7, 0

1 + 3, 7 1 + 4, 9 2 + 6, 6 3 + 7, 2 3
1+1+2+3+3

7, 0

+ 3, 7 + 9, 8 + 18, 8 + 21, 6
10

Prof. Hemlio Fernandes Campos Colho

61, 9
10

= 6, 19.

Anlise Exploratria de Dados Aula 06

Mdia Aritmtica de Dados Tabulados


No-agrupados em Classes
Quando os dados esto dispostos em uma tabela de freqncias por
valores, a mdia aritmtica pode ser obtida atravs de

Pk
fi Xi
=
= Pi =k1
fi
i =1

+ . . . + fk Xk
=
f1 + . . . + fk

f1 X1

f1 X1

+ . . . + fk Xk
N

no caso populacional, em que N representa o nmero de indivduos


da populao (Note que

Pk
i =1 fi = N )

e f1 , . . . , fk so as

freqncias simples absolutas dos k valores. Ou, por

Pk
fi Xi
= Pi =k1
=
i =1 fi

+ . . . + fk Xk
=
f1 + . . . + fk

f1 X1

f1 X1

+ . . . + fk Xk
n

no caso amostral, em que n representa o nmero de indivduos da


amostra (Note que

Pk
i =1 fi = n)

e f1 , . . . , fk so as freqncias

simples absolutas dos k valores.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Tabela: Nmero de dentes com crie em amostra de crianas de 7 anos


de idade da segunda srie do colgio XYZ. Setembro de 2007
N de dentes com crie

f X

13

25

i i

Fonte: Dados Hipotticos


Obtemos o nmero mdio de dentes com crie por
X

=
=

0+21+42+23+14+15
3+2+4+2+1+1

25/13

= 1, 923.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mdia Aritmtica de Dados Tabulados Agrupados


em Classes
Quando os dados esto dispostos em uma tabela de freqncias por
classes, a mdia aritmtica pode ser obtida atravs de

Pk
fi xi
=
= Pi =k 1
i =1 fi

f1 x1
f1

+ . . . + fk xk
=
+ . . . + fk

f1 x1

+ . . . + fk xk
N

no caso populacional, em que os xi 's so os pontos mdios das


classes, N representa o nmero de indivduos da populao (Note
que

Pk
i =1 fi = N )

e f1 , . . . , fk so as freqncias simples absolutas

das k classes. Ou, por

Pk
fi xi
= Pi =k 1
=
i =1 fi

+ . . . + fk xk
=
f1 + . . . + fk

f1 x1

f1 x1

+ . . . + fk xk
n

no caso amostral, em que os xi 's so os pontos mdios das classes,


n representa o nmero de indivduos da amostra (Note que
P
k f = n) e f , . . . , f so as freqncias simples absolutas
1
k
i =1 i

classes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

das k

continuao
Exemplo:

Tabela: Casos de AIDS (1000) segundo faixa etria. Recife, 1993

Faixa Etria

f x

` 25
25 ` 35
35 ` 45
45 ` 55

25

20

500

30

30

900

15

40

600

10

50

15

i i

500

80

2500

Fonte: Dados Hipotticos


Neste exemplo, podemos obter a mdia aritmtica fazendo
X

=
=

25

20 + 30 30 + 15 40 + 10 50
25 + 30 + 15 + 10

500

+ 900 + 600 + 500


80

Prof. Hemlio Fernandes Campos Colho

2500
80

= 31, 25.

Anlise Exploratria de Dados Aula 06

Propriedades da Mdia Aritmtica


P1)

A soma dos desvios com relao mdia nula, isto ,

n
X
( Xi X ) = 0 .
i =1
Prova: Seja X1 , . . . , Xn um conjunto de n valores. APmdia
n

aritmtica desse conjunto pode ser obtida por X


Podemos escrever

Pn
i =1 (Xi X )

como

=1

n
n
n
n
X
X
X
X
(Xi X ) =
Xi
X =
Xi nX
i =1
i =1
i =1
i =1
Pn
n
n
n
X
X
X
i
=1 Xi
=
=
Xi n
Xi
Xi = 0 .
n
i =1
i =1
i =1

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
P2)

Somando-se ou subtraindo-se uma constante (a) a todos os

valores do conjunto, a mdia ca aumentada ou diminuida dessa


constante.
Prova: Seja X1 , . . . , Xn um conjunto de n valores. A mdia
X +...+Xn . Seja
aritmtica desse conjunto pode ser obtida por X = 1
agora, um conjunto Y1 , . . . , Yn onde cada Yi , i
denido por Yi
Y1

= Xi + a ,

= X1 + a ;

n
= 1, . . . , n

ou seja,

= X2 + a

Y2

; . . . ; Yn = Xn + a.

A mdia do conjunto Y1 , . . . , Yn pode ser obtida por

=
=

Y1

+ Y2 + . . . + Yn
n

X1

+ . . . + Xn
n

Observao:

a
n

n termos
}|
{
X1 + X2 + . . . + Xn + a + a + . . . + a

= X + a.

A prova para a subtrao anloga.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
P3)

Multiplicando-se ou dividindo-se uma constante (b ) a todos os

valores do conjunto, a mdia ca multiplicada ou dividida por essa


constante.
Prova: Seja X1 , . . . , Xn um conjunto de n valores. A mdia
= X1 +...+Xn . Seja

aritmtica desse conjunto pode ser obtida por X

n
= 1, . . . , n

agora, um conjunto Y1 , . . . , Yn onde cada Yi , i


denido por Yi
Y1

= b Xi ,

= b X1 ;

ou seja,
Y2

= b X2 ;

...;

n = b Xn .

A mdia do conjunto Y1 , . . . , Yn pode ser obtida por


Y

=
=

Y1

+ Y2 + . . . + Yn

n
b

Observao:

(X1 + . . . + Xn )
n

X1 + b X2 + . . . + b Xn
n

=b

X1

+ . . . + Xn
n

= b X.

A prova para a diviso anloga.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Vantagens e desvantagens da mdia

a medida mais conhecida e de maior uso;


facilmente calculvel;
Pode ser tratada algebricamente;
Serve para compararmos conjuntos semelhantes;
particularmente indicada para dados que possuem os valores
simtricos em relao a um valor mdio e de frequncia mxima
(um histograma pode ajudar nessa identicao);

uma medida de tendncia central que por uniformizar os valores


de um conjunto de dados, no representa bem os conjuntos que
revelam tendncias extremas. Ou seja, grandemente inuenciada
pelos valores extremos (grandes) do conjunto;

No pode ser calculada para distribuies de freqncias com limites


indeterminados (indenidos);

S deve ser utilizada quando a distribuio dos dados for simtrica


(normal ou Gaussiana).
Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mediana
A mediana de um conjunto de dados, que denotaremos por Md ,
pode ser denida como o valor que divide a srie ordenada em duas
partes iguais, em relao quantidade de elementos. Em outras
palavras, o valor que ocupa o centro da distribuio, ou seja, 50%
dos elementos da srie so menores do que ela e 50% dos
elementos da srie so maiores do que ela.
Exemplo:

No Rol, temos:

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao

Podemos encontrar o elemento mediano de um conjunto de dados


da seguinte forma:

1)

Se n mpar: a mediana ser o elemento que ocupar a posio

n +1
2

no rol, ou seja, EMd

elemento mediano.

1
= n+
2 ,

em que EMd representa o

= 2, X3 = 6, X4 = 1 e X5 = 3.
2, 1, 2, 3, 6. O elemento mediano
n
+1
5+1
6
por EMd =
2 = 2 = 2 = 3. Ou seja, a mediana ser o
que ocupar a posio 3 do rol. Da, concluimos que Md = 2.

Exemplo:

Sejam X1

= 2,

X2

Ordenando os valores temos,


dado
valor

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
2)

Se n par: a mediana ser a mdia aritmtica simples dos

elementos que ocuparem as posies

n + 1.

2 e 2

Ou seja, teremos

dois elementos centrais ou dois elementos medianos, dados por

1 EMd

= n2

e 2 EMd

= n2 + 1.

X6

= 5.

Sejam X1

= 2,

= 2,

= 6, X4 = 1, X5 = 3 e
2, 1, 2, 3, 5, 6. Os
n = 6 =3e
o
elementos centrais so dados por 1 EMd =
2
2
n
6
o
2 EMd =
2 + 1 = 2 + 1 = 3 + 1 = 4. A mediana ser a mdia
Exemplo:

X2

X3

Ordenando os valores temos,

aritmtica simples entre os valores que ocuparem as posies 3 e 4,


ou seja, Md

2+3
2

5
2

= 2, 5.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mediana de Dados Tabulados No-agrupados em


Classes

Em tabelas de freqncias com valores no agrupados em classes


podemos obter a mediana dos valores observando as freqncias
acumuladas abaixo de (absolutas ou relativas).
Primeiramente, vericamos se o nmero de observaes par ou mpar e
obtemos o elemento mediano (ou os elementos medianos, dependendo se
n mpar ou par), utilizando para isso, os mtodos apresentados para o

caso em que temos dados no tabulados. Em seguida, acrescentamos a


coluna das freqncias acumuladas abaixo de (absolutas ou relativas) e,
observando essas freqncias, determinamos a mediana.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

que n

Obter a mediana dos valores da tabela a seguir.


+1
13+1

= 13

Md

mpar, logo, E

= 7.

Temos

Assim, a mediana

ser o elemento que ocupar a posio 7 do conjunto de valores.


Observando a coluna das freqncias acumuladas abaixo de, vericamos

i = 1) existem 5 observaes, ou seja, a

que at o segundo valor (X

mediana no pode ser 1, pois a mediana o valor que ocupa a posio 7.

i = 2) existem 9 observaes e concluimos que

At o terceiro valor (X
Md

= 2.

iab

11

12

13

13

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Mediana de Dados Tabulados Agrupados em


Classes
Obtemos o elemento mediano atravs de EMd

= n2 ,

no fazendo

distino entre n par ou mpar. A partir da, determinamos a classe


mediana, isto , a classe que contm a mediana. Assim, a mediana
obtida por interpolao, de acordo com a seguinte frmula


Md

= LIMd +

ab 
md Fant
h,
fMd

onde:

Md o limite inferior da classe mediana;


ab
Fant a freqncia absoluta acumulada abaixo

LI

de da classe

anterior classe mediana;

Md

a freqncia absoluta simples da classe mediana;

a amplitude dos intervalos de classe.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Determinar a mediana dos dados apresentados na tabela

abaixo.

Tabela: Casos de AIDS (1000) segundo faixa etria. Recife, 1997

ab
i

Faixa Etria

15

` 25
` 35
35 ` 45
45 ` 55

25

25

25

30

55

15

70

10

80

Prof. Hemlio Fernandes Campos Colho

80

Anlise Exploratria de Dados Aula 06

continuao
Temos que n

= 80

(par), logo, EMd

= n2 =

80
2

= 40.

Da, podemos

vericar que a mediana est contida na segunda classe, 25

` 35,

pois at a primeira classe existem 25 observaes enquanto que at


a segunda classe existem 55 observaes. Desse modo, obtemos a
mediana por

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Vantagens e desvantagens da Mediana

A mediana no inuenciada por valores extremos (grandes)


de uma srie ou conjunto de dados;
A mediana utilizada especialmente para distribuies
assimtricas, mas pode ser utilizada para dados com

distribuio simtrica tambm.


A mediana de uma srie de dados agrupados de classes
extremas indenidas pode ser calculada.

Suas propriedades no so bem compreendidas por muitas


pessoas;

No levada em considerao na maior parte dos testes


estatsticos.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda
A moda de um conjunto de dados, que denotaremos por Mo , o
valor que ocorre com maior freqncia.
Exemplo:

1, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 8. Temos que

o valor mais freqente 6, logo, Mo

= 6.

Observao:
1

A moda pode no existir. Neste caso, dizemos que o conjunto


de dados amodal.
Exemplo:

1, 1, 2, 2, 3, 3, 4, 4, 5, 5

A moda pode no ser nica.


Exemplo:

2, 2, 3, 3, 3, 4, 4, 5, 5, 5. Temos dois valores mais

freqentes: 3 e 5.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda de Dados Tabulados No-agrupados em


Classes
Neste caso, obtemos a moda simplesmente identicando o valor
mais freqente na tabela.
Exemplo:

Tabela: Tipo sangneo em uma amostra de 820 doadores do HEMOPE.


Recife, 2007.

Tipo Sangneo

Nmero de Doadores

417

292

94

AB

17

Total

820

Fonte: Dados Hipotticos

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda de Dados Tabulados Agrupados em Classes

Nesta situao, pode-se determinar a moda atravs de 4 processos:


1

Moda Bruta

Moda de King

Moda de Czuber

Moda de Pearson

Para os trs primeiros processos, o primeiro passo identicar a


classe modal, isto , a classe que apresenta a maior freqncia.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda Bruta

Corresponde simplesmente ao ponto mdio da classe modal, ou


seja,
Mo

LI

Mo + LSMo
2

onde LSMo e LSMo representam, respectivamente, o limite inferior


da classe modal e o limite superior da classe modal.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda de King

obtida atravs da expresso


Mo

= LIMo +

post
fant + fpost
f


h,

onde:

Mo o limite inferior da classe modal;


fant a freqncia simples absoluta da classe
LI

anterior classe

modal;

post

a freqncia simples absoluta da classe posterior classe

modal;
h

a amplitude do intervalo de classe.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda de Czuber
obtida atravs da expresso


Mo

= LIMo +

d1
d1

+ d2

h,

onde:

Mo o limite inferior da classe modal;


= fMo fant ;
d2 = fMo fpost ;
fMo a freqncia simples absoluta da classe
fant a freqncia simples absoluta da classe
LI

d1

modal;
anterior classe

modal;

post

a freqncia simples absoluta da classe posterior classe

modal;
h

a amplitude do intervalo de classe.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Moda de Pearson
determinada atravs da frmula
Mo

= 3Md 2X ,

onde:
Md
X

a mediana dos dados;

a mdia aritmtica dos dados.

A moda de Pearson bastante til quando queremos avaliar


conjuntos de dados quanto sua distribuio. Em uma primeira
situao temos Mo

< Md < X ,

ou seja, os dados esto

concentrados esquerda. Quando temos X

< Md < Mo ,

dizemos

que os dados esto concentrados direita.


E por m, quando temos X

= Md = Mo ,

dizemos que os dados

concentram-se no centro da distribuio.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Considere a distribuio de freqncias abaixo. Obter a

moda atravs dos quatro processos.

Classes

`2
2 ` 4
4 ` 6
6 ` 8
8 ` 10

5
7
6
1
22

A classe de maior freqncia a 3 , 4

Prof. Hemlio Fernandes Campos Colho

` 6.

Anlise Exploratria de Dados Aula 06

1. Moda Bruta
Fazemos
Mo

+6
2

= 5.

2. Moda de King
Fazemos


Mo

=4+

6
5

+6

2
= 5, 09.

3. Moda de Czuber
Fazemos d1

= 7 5 = 2,
Mo

= 7 6 = 1 e, dessa


2
=4+
2
= 5, 33.
2+1
d2

forma,

4. Moda de Pearson
Temos que X

= 4, 73
Mo

e Md

= 4, 86,

da,

= 3 4, 86 2 4, 73
= 5, 12.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Vantagens e desvantagens da moda

No inuenciada por valores extremos (grandes) do conjunto


de dados;
Pode ser calculada para distribuies com limites
indeterminados (indenidos) na maioria dos casos.

No depende de todos os valores do conjunto de dados,


podendo mesmo no se alterar com a modicao de alguns
deles;

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Quantis ou Separatrizes

So medidas que dividem o rol ou a distribuio de freqncias em


partes iguais.
Exemplo:

A mediana um quantil, pois divide os dados em duas

partes iguais.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Quartis (Qi )

Dividem os dados em quatro partes iguais.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao

A ordem ou posio do quartil a ser calculado dada por

Q =

in

onde:
i
n

o nmero do quartil (1, 2 ou 3);


o nmero de observaes.

O procedimento para encontrar o quartil desejado quando temos


dados no tabulados ou dados em distribuies de freqncias por
valores idntico quele apresentado para a obteno da mediana.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Quando temos dados em distribuies de freqncias por classes
utilizamos

i = LIQ +

ab )
(EQ Fant
i

h,

onde:

Q o limite inferior da classe que contm o quartil desejado;


EQ o elemento quartlico;
ab
Fant a freqncia acumulada abaixo de da classe anterior
LI

classe que contm o quartil desejado;

a freqncia simples absoluta da classe que contm o quartil

desejado;
h

a amplitude dos intervalos de classes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Decis (Di )
Dividem os dados em dez partes iguais.

A ordem ou posio do decil a ser calculado dada por

D =

in

10

onde:
i
n

o nmero do decil (1, 2, . . . , 9);


o nmero de observaes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
O procedimento para encontrar o decil desejado quando temos
dados no tabulados ou dados em distribuies de freqncias por
valores idntico quele apresentado para a obteno da mediana.
Quando temos dados em distribuies de freqncias por classes
utilizamos

i = LID +

ab )
(ED Fant

h,

onde:

D o limite inferior da classe que contm o decil desejado;


D o elemento declico;
ab
Fant a freqncia acumulada abaixo de da classe anterior
LI

classe que contm o decil desejado;

a freqncia simples absoluta da classe que contm o decil

desejado;
h

a amplitude dos intervalos de classes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

Percentis (Ci )
Dividem os dados em cem partes iguais.

A ordem ou posio do percentil a ser calculado dada por

C =

in

100

onde:
i
n

o nmero do percentil (1, 2, . . . , 99);


o nmero de observaes.

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

O procedimento para encontrar o percentil desejado quando temos


dados no tabulados ou dados em distribuies de freqncias por
valores idntico quele apresentado para a obteno da mediana.
Quando temos dados em distribuies de freqncias por classes
utilizamos

i = LIC +

ab )
(EC Fant
h,
fC
i

onde:

C o limite inferior da classe que contm o percentil desejado;


C o elemento percentlico;
ab
Fant a freqncia acumulada abaixo de da classe anterior
LI

classe que contm o percentil desejado;

a freqncia simples absoluta da classe que contm o percentil

desejado;
h

a amplitude dos intervalos de classes.

Observao:

Note que Md

= Q2 = D5 = C50 .

Prof. Hemlio Fernandes Campos Colho

Anlise Exploratria de Dados Aula 06

continuao
Exemplo:

Na tabela abaixo esto apresentados dados referentes ao

consumo mdio mensal de eletricidade (em kw /h ) de uma amostra


de 80 residncias de Parnaba. Encontrar o primeiro quartil, o nono
decil e o septuagsimo quinto percentil.

ab
i

Consumo

` 25
` 45
45 ` 65
65 ` 85
85 ` 105
105 ` 125
125 ` 145
145 ` 165

25

10

14

24

26

50

14

64

72

78

80

Prof. Hemlio Fernandes Campos Colho

80

Anlise Exploratria de Dados Aula 06

continuao

Queremos obter Q1 , D9 e C75 . Para Q1 temos


E

Q1 =

80
4

= 20,

ou seja, primeiro quartil o elemento que ocupa a posio 20.


Observando as freqncias acumuladas vericamos que este
pertence terceira classe. Da,

Q1

= 45 +

20

10
14

Prof. Hemlio Fernandes Campos Colho

20
= 59, 29.

Anlise Exploratria de Dados Aula 06

continuao

Para D9 , temos
E

D9 =

80
10

= 72,

o que nos diz que o decil desejado pertence sexta classe. Da,

D9

= 105 +

72

Prof. Hemlio Fernandes Campos Colho

64
8

20 = 125.

Anlise Exploratria de Dados Aula 06

continuao

Para C75 , temos

E 75

75

80

100

= 60,

o que nos diz que o percentil desejado pertence quinta classe.


Da,
C75

= 85 +

50

60

14

Prof. Hemlio Fernandes Campos Colho

20
= 99, 29.

Anlise Exploratria de Dados Aula 06

Potrebbero piacerti anche