Sei sulla pagina 1di 50

Estatística Prof.R.

Dyodi

Sumário
Introdução .................................................................................................................................... 2
Capítulo 1 - Estatística Descritiva ............................................................................................ 4
1.1. Frequências ..................................................................................................................... 4
1.2. A “chave do sucesso”: saber diferenciar o tipo de exercício ................................... 5
1.3. Medidas de Posição ou Medidas de Tendência Central para dados em rol ......... 7
1.4. Medidas de Dispersão ................................................................................................. 17
1.5. Propriedades das medidas de posição e de dispersão .......................................... 23
1.6. Medidas de Posição ou Medidas de Tendência Central para dados agrupados 28
1.7. Ramo e folhas ............................................................................................................... 39
1.7. Quantis e Box-Plot ........................................................................................................ 41
1.8. Variância Conjunta ....................................................................................................... 46
1.9. Média Conjunta ............................................................................................................. 49

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 1
Estatística Prof.R.Dyodi

Introdução

Olá caros colegas concurseiros,

Meu nome é Robson Dyodi e terei o prazer de auxiliá-los neste estudo de estatística.
Para quem não me conhece, sou bacharel em Ciências Econômicas formado pela Escola de
Economia de São Paulo (EESP – FGV). Anteriormente, cheguei a cursar 3 anos de engenharia
na Escola Politécnica (POLI – USP), mas decidi abandonar o barco por não me identificar com
a área. A minha trajetória com concursos iniciou-se em meados de 2009, quando decidi largar
o emprego no mercado financeiro para buscar o meu ingresso no setor público. Fui aprovado
neste mesmo ano no concurso para o cargo de Oficial de Justiça (OJ – TJSP) e continuei
estudando para o meu objetivo maior: área fiscal. Graças a Deus, consegui ser aprovado para
os 2 últimos concursos de auditor que ocorreram no Estado de São Paulo: ISS-SP 2012 e
ICMS-SP 2013. Agora, tenho o desejo de ajudar todos aqueles que querem ingressar em
algum fisco do país. Atualmente, estou lecionando no curso Uniequipe em São Paulo.

Como vocês podem perceber, eu não sou formado em estatística! Apesar disso,
sempre tive facilidade com números e, como fui professor particular durante muitos anos,
aprendi a observar as principais dificuldades dos alunos nas matérias de exatas. Quero ser
sincero com vocês: não conheço toda a matéria de estatística e se o seu objetivo exigir
conhecimentos mais profundos da matéria, não sou a pessoa indicada. No entanto, se o seu
objetivo for a área fiscal, pode ter certeza de que estou apto a auxiliá-lo nesta jornada!

Feita a minha apresentação, gostaria de bater um pequeno papo com vocês...Eu sei
que estatística não é a matéria preferida da maioria dos candidatos. Na verdade, diria que é a
matéria mais odiada de todas. Para começar a nossa conversa, vamos aos fatos:

 ICMS-SP 2006: massacre na P1


 ICMS-SP 2009: massacre na P1
 ISS-SP 2012: massacre na P1 (o estrago só não foi maior porque tinham 30 questões
de Direito Tributário para pontuar facilmente)
 ICMS-SP 2013: massacre na P1

Com a Internet a favor dos candidatos, não é difícil de obter estes dados. Também não
é difícil perceber que as provas de português para a área fiscal são de outro nível. Sabendo
disso, creio que deixar 10-15 pontos de lado é algo muito arriscado a se fazer. Ao invés de
considerar a estatística como uma inimiga, por que não transformá-la em aliada? Assim, se a
prova se mostrar de um jeito diferente do esperado, é bom ter um plano B na manga. Algumas
questões de estatística podem contribuir para que você atinja o mínimo na P1 ou pontue mais
do que a maioria dos concorrentes. Tentarei mostrar que a matéria em questão não é nenhum
bicho de sete cabeças e que, diferentemente do que muitos comentam, as questões são
relativamente rápidas de serem respondidas.

As provas estão cada vez mais difíceis, mas as notas de corte permanecem em nível
elevado. Em outras palavras, os candidatos estão se preparando melhor! Atualmente, temos
vários cursos em .pdf e em vídeo circulando na internet. Material de qualidade é o que não
falta. Assim, cabe a você acompanhar essa evolução. Todos querem passar, mas como dizem
por aí: “passar é exceção”. Além do desejo, devemos ter a atitude de buscar o nosso
merecimento, de modo que a aprovação será uma consequência disso. Creio que o
merecimento engloba estudar todas as matérias, mesmo aquelas das quais não gostamos!

Dito isto, vamos iniciar nossos estudos.

A estatística pode ser dividida em 3 grupos:

 Estatística descritiva
 Probabilidade
 Inferência Estatística

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 2
Estatística Prof.R.Dyodi

Saber diferenciar estes 3 grupos é de extrema importância para o sucesso na


questão. Na maioria das vezes, o candidato não consegue resolver a questão porque não
sabe por onde começar. Segregando os ramos da estatística, conseguimos buscar a
solução do problema mais rapidamente.

A estatística descritiva consiste basicamente no resumo de dados. Não importa se os


dados se originem de uma amostra ou de uma população (temas estudados na inferência
estatística), o objetivo é apenas resumi-los.

A probabilidade consiste em quantificar a chance de ocorrer determinado evento, ou


seja, definir um valor para a chance de o evento ocorrer.

A inferência estatística consiste em tirar uma conclusão sobre uma população através
dos dados de uma amostra. Muitas vezes é difícil analisar a população inteira, então é colhida
uma amostra e a partir dela conclui-se algo sobre a população.

Iniciaremos agora nossos estudos sobre estatística descritiva.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 3
Estatística Prof.R.Dyodi

Capítulo 1 - Estatística Descritiva

Suponha que seu chefe lhe entregue as seguintes informações num pedaço de papel e
peça para você analisá-las:

“6 9 10 11 5 7”

Difícil, não? O que ele quer que eu faça?!


Agora suponha que no pedaço de papel estava escrito o seguinte:

“número de processos analisados nos últimos seis meses: 6 9 10 11 5 7”

Agora a tarefa ficou mais simples. Basta ir até a sala do chefe e dizer: “Chefinho, nos
últimos seis meses, a média de processos analisados foi de 8 processos por mês”.

O estudo da estatística descritiva é muito parecido com o exemplo acima. Dado uma
variável (idade, altura, salário,...) e um conjunto de dados relativos a esta variável, devemos
buscar um meio de resumir todos estes dados, como por exemplo, a média.

Mas este resumo não se limita ao cálculo da média, existem várias outras medidas-
resumo que são cobradas em provas de concurso público. Estudaremos cada uma delas.

Mas, antes de iniciar os estudos sobre medidas-resumo, devemos entender o que é


frequência.

1.1. Frequências

Saber o que é frequência e quais são os seus tipos é fundamental para o estudo de
qualquer dos ramos da estatística, pois elas sempre são utilizadas. Dificilmente elas serão
cobradas de forma direta, mas o conhecimento deste assunto é pré-requisito para a resolução
das provas.

Mas o que é frequência na estatística?


Na estatística, frequência possui o mesmo significado que utilizamos no dia a dia. Com
que frequência você vai ao cinema por mês? Com que frequência você estuda contabilidade
por semana? Com que frequência você come junk food por semana? Frequência está
relacionada a “quantas vezes”. Simples assim.

Observe o seguinte conjunto de dados:

1111223

Podemos dizer que o número 1 possui frequência igual a 4, ou seja, aparece quatro
vezes neste conjunto de dados. Do mesmo modo, podemos dizer que o número 2 possui
frequência igual a 2 e o número 3 possui frequência igual a 1.

Começaremos com um exemplo. Imagine que um questionário sobre remuneração seja


feito para todos os 50 funcionários de uma empresa e que o resultado tenha sido o seguinte:

Salários Nº de funcionários

R$2000 10

R$3000 25

R$4000 15

Total = 50 funcionários

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 4
Estatística Prof.R.Dyodi

De acordo com a tabela acima, é correto dizer que 10 funcionários recebem o valor de
dois mil reais, 25 funcionários recebem o valor de três mil reais e 15 funcionários recebem o
valor de quatro mil reais.

As frequências são úteis para mostrar a proporção de elementos em cada classe, qual
a classe com mais elementos, etc. As frequências simples são designadas pela letra f e as
frequências acumuladas pela letra F. Observe a seguinte tabela:

Frequência Frequência Frequência Frequência


Nº de
simples simples acumulada acumulada
funcionários
absoluta (f) relativa (f) absoluta (F) relativa (F)

R$2000 10 10 10/50 = 20% 10 10/50 = 20%

R$3000 25 25 25/50 = 50% 35 35/50 = 70%

R$4000 50/50 =
15 15 15/50 = 30% 50
100% = 1

Total = 50 Total = 50 Total = 100%


funcionários funcionários =1

A frequência simples absoluta indica quantos elementos do conjunto existem em cada


classe.

A frequência simples relativa indica, em cada classe, a proporção de elementos em


relação ao total.

A frequência acumulada absoluta indica quantos elementos existem até aquela classe.
Assim, no exemplo acima, existem 35 indivíduos que recebem até três mil reais.

A frequência acumulada relativa indica a proporção de elementos em relação ao total


que estão dentro da classe ou abaixo dela. Assim, 70% dos indivíduos recebem no máximo até
três mil reais.

Dica1: Sempre que aparecer a palavra relativa, estamos tratando de uma proporção, ou seja,
devemos dividir pelo total. Sempre que aparecer a palavra acumulada, estamos tratando dos
elementos que estão na classe ou abaixo dela, ou seja, devemos somar todos os elementos
até aquela classe.

Dica2: Observe que a soma das frequências relativas sempre será igual a 1. Esta informação
será necessária em alguns tipos de exercício.

Observação 1: note que para utilizarmos as frequências acumuladas (absoluta ou relativa), as


classes devem estar ordenadas em ordem crescente.

1.2. A “chave do sucesso”: saber diferenciar o tipo de exercício

Assim como em todas as disciplinas do seu concurso, em estatística é de extrema


importância que você saiba o que fazer para resolver o exercício assim que “bater o olho” na
questão. Muitos candidatos perdem um tempo precioso lendo e relendo o enunciado várias
vezes para descobrir como solucionar o problema.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 5
Estatística Prof.R.Dyodi

Sendo assim, sempre que possível, tentarei mostrar como identificar cada tipo de
exercício. Em questões que cobram estatística descritiva, a chave do sucesso é saber
identificar e diferenciar os dois tipos de dados abaixo:

Qual é a diferença entre as duas tabelas acima?

Na tabela localizada à esquerda, sabemos exatamente quantos processos foram


analisados por dia. Dos 250 dias em análise, em 20 dias somente um processo por dia foi
analisado. Em 30 dias, foram analisados dois processos por dia, e assim por diante.

Na tabela localizada à direita, sabemos que 10 funcionários recebem um salário maior


ou igual a R$1500 e menor que R$2500, mas não sabemos dizer quanto exatamente cada um
deles recebe.

Note que, se quisermos realizar algum cálculo com os dados da tabela à direita,
devemos fazer algum tipo de suposição, pois não temos os dados exatos. Por outro lado, na
tabela à esquerda, não será necessário fazer suposições. Os dados à esquerda são chamados
de “dados em rol” e os dados à direita são chamados de “dados agrupados”. Para lembrar isso,
note que os dados à direita estão agrupados em intervalos de valores.

É importante saber que os mesmo dados utilizados acima podem ser representados de
maneira gráfica. Observe o caso dos dados em rol, de modo que a tabela e o gráfico significam
a mesma coisa:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 6
Estatística Prof.R.Dyodi

Agora, observe o caso dos dados agrupados, de modo que a tabela e o gráfico
representam a mesma coisa:

Perceberam a diferença nos gráficos? Eles são muito parecidos, mas note que, quando
trabalhamos com dados em rol, as colunas possuem um espaçamento entre elas. Por outro
lado, quando trabalhamos com dados agrupados, as colunas não possuem espaçamento.

Assimiladas estas informações, podemos avançar na matéria.

1.3. Medidas de Posição ou Medidas de Tendência Central para dados em rol

Tratam-se das medidas que buscam resumir, simplificar, todo o conjunto de dados. As
principais medidas são: média aritmética, moda e mediana.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 7
Estatística Prof.R.Dyodi

Imagine que 5 lutadores foram pesados para uma competição e os dados obtidos
foram os seguintes:

Lutador 1: 70 kg
Lutador 2: 80 kg
Lutador 3: 90 kg
Lutador 4: 90 kg
Lutador 5: 100 kg

A média aritmética é a soma de todos os dados dividida pelo número de observações.


Em termos algébricos:

No nosso exemplo, a média é igual a

Repetindo: para calcular a média aritmética, devemos sempre somar todos os valores
do conjunto de dados e dividir pelo tamanho do conjunto de dados.

A moda representa o valor que aparece com mais frequência no conjunto de dados. No
nosso exemplo, temos que o valor da moda é igual a 90 kg (aparece duas vezes).

Observação 1: no exemplo acima, temos apenas um valor da moda. Dizemos então que o
conjunto de dados é unimodal. Se houvessem 2 valores da moda, nosso conjunto de dados
seria bimodal, e assim por diante.
Ex: “1 2 2 3 3 3 4 4 4 5 6”. A moda é representada pelos números 3 e 4 (aparecem três vezes).

A mediana representa o valor que ocupa a posição central do conjunto de dados, ou


seja, divide o conjunto de dados em partes iguais. No nosso exemplo, o valor da mediana é
igual a 90 kg (3ª posição). Cabe ressaltar que, para obtermos a mediana, os valores devem
estar ordenados.

Uma observação deve ser feita: no exemplo acima, temos 5 observações, logo a
mediana é representada pelo valor que ocupa a 3ª posição (temos 2 valores à direita e 2
valores à esquerda). No entanto, o que acontece se o número de observações for par? Vamos
analisar o seguinte conjunto de dados:

123456

A mediana não pode ser igual a 3, pois neste caso teríamos dois valores à esquerda e
três valores à direita. Da mesma forma, a mediana não pode ser igual a 4, pois teríamos três
valores à esquerda e dois valores à direita. E agora, o que fazer?

Quando estivermos trabalhando com dados em rol e o número de observações for um


número par, devemos pegar os dois elementos centrais e fazer a média entre eles. Assim, no
nosso exemplo, a mediana será igual à média entre 3 e 4, ou seja, será igual a 3,5.

Resumindo:

A média é obtida somando-se todos os valores e dividindo o resultado pelo tamanho do banco
de dados.
Moda é o valor com maior frequência (aquele que mais se repete).
Mediana é o elemento central do banco de dados, quando eles estiverem ordenados.

Exercício Resolvido sobre medidas de posição:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 8
Estatística Prof.R.Dyodi

(ESAF - 2009 - Sefaz SP – APOF)


Determine a mediana das seguintes observações:

17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9.

a) 13,5
b) 14
c) 17
d) 15,5
e) 14,5

Letra C

Resolução:

Como dissemos na explicação teórica, para obtermos a mediana os dados devem estar
ordenados. Assim, teremos o seguinte:

3, 5, 6, 7, 8, 9, 9, 12, 12, 13, 14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42.

11 elementos 11 elementos

Como temos 23 observações, a mediana é o valor que ocupa a 12ª posição, de modo
que existem 11 elementos à sua esquerda e 11 elementos à sua direita. Portanto, a mediana é
igual a 17.

O exercício não cobra a moda, mas, aproveitando a questão, podemos dizer que o
conjunto de observações é tetramodal, pois apresenta 4 valores para a moda: 9, 12, 17 e 18.

Exercício resolvido sobre medidas de posição:

(ESAF - 2009 - Receita Federal – Auditor)


Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um
curso preparatório. Com relação a essa amostra, marque a única opção correta:

29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28,
27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28.

a) A média e a mediana das idades são iguais a 27.


b) A moda e a média das idades são iguais a 27.
c) A mediana das idades é 27 e a média é 26,08.
d) A média das idades é 27 e o desvio-padrão é 1,074.
e) A moda e a mediana das idades são iguais a 27.

Letra E

Resolução:

Como o cálculo da mediana faz parte da questão, a 1ª coisa a ser feita é ordenar os dados.
Assim:

23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 29,
29, 29, 30, 31, 32, 32, 33, 34, 35, 36, 39, 41.

Temos 37 observações e a mediana será igual ao valor da 19ª observação (existem 18


elementos à esquerda e 18 elementos à direita). Portanto, a mediana é igual a 27.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 9
Estatística Prof.R.Dyodi

O valor que aparece com mais frequência é igual a 27 (aparece 6 vezes no conjunto de dados).
Então, a moda também é igual a 27.

Sem precisar fazer mais contas, sabemos que a letra E está correta.
Isso fica como dica para a hora da prova: calcule sempre a moda e a mediana em 1º lugar. A
média só deve ser calculada se não for possível resolver a questão só com as informações da
moda e da mediana.

Exercício resolvido sobre medidas de posição:

(FCC - 2010 - Dnocs – Administrador)


Determinada carreira profissional, em um órgão público, apresenta 5 níveis de salários com
uma distribuição demonstrada no quadro abaixo.

Se, com relação aos salários desta carreira profissional, Me é a média aritmética, Md a
mediana e Mo a moda correspondentes, tem-se que:

(A) Me = Mo = Md
(B) Me > Md e Mo > Md
(C) Me > Mo e Mo = Md
(D) Me < Md e Mo > Md
(E) Me < Mo e Md = Mo

Letra E

Resolução:

Observando a tabela, percebemos que estamos diante de dados em rol.

Além disso, vemos que as alternativas tratam de média, moda e mediana. Em outras palavras,
estamos diante de uma questão de estatística descritiva.

Devemos sempre encontrar o valor da moda e mediana em 1º lugar, pois é mais rápido que o
cálculo da média.

Moda: é o valor que mais se repete. Assim sendo, percebemos que a moda é igual a 2500,
pois é o valor com a maior frequência.

Mediana: é o elemento central do conjunto de dados. Como o número total de elementos é


igual a 75, basta encontrarmos o elemento central, ou seja, o elemento na 38ª posição. Então,
a mediana é igual a 2500 também.

“Dyodi, como eu faço pra saber rapidamente qual é o elemento central?”

Se o número total de elementos é ímpar, você faz o seguinte: pegue o total de elementos (75)
e some 1. Depois, divida por 2. É sempre assim quando trabalhamos com dados em rol e o
total de elementos é impar.

Conhecendo os valores da moda e mediana, conseguimos eliminar as alternativas B e D. Mas,


para chegar na resposta, infelizmente teremos que calcular a média.

Média: o valor será obtido somando todos os dados e dividindo o resultado pelo total de
elementos, que é igual a 75. Agora, observe o seguinte: ao invés de somar 1500 dez vezes,

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 10
Estatística Prof.R.Dyodi

não é mais fácil multiplicar 10 por 1500? Ao invés de somar 2000 quinze vezes, não é mais
fácil multiplicar 2000 por 15? Utilizaremos esse método a partir de agora

A moda e a mediana possuem valores iguais a 2500 e a média é menor do que 2500.
Assim, a única alternativa possível é a letra E.

Exercício resolvido sobre medidas de posição:

(FCC - 2010 - Sefaz SP – APOF)


Em um setor de um órgão público é realizado um levantamento com relação aos salários de
seus funcionários administrativos. O resultado pode ser visualizado na tabela abaixo.

Com relação a este levantamento e às medidas de posição, tem-se que

(A) a média aritmética, a mediana e a moda possuem o mesmo valor.


(B) o valor da média aritmética e o valor da mediana superam, cada um, o valor da moda em
R$ 250,00.
(C) o valor da moda é superior ao valor da média aritmética e também ao valor da mediana.
(D) o valor da moda é igual ao valor da mediana, porém supera o valor da média aritmética.
(E) a soma dos valores da média aritmética, da mediana e da moda é igual a R$ 7.250,00.

Letra C

Resolução:

Observando as alternativas e a tabela, percebemos que temos uma questão de estatística


descritiva com dados em rol.

Moda: é igual a 2500, pois é o valor com a frequência mais alta.

Mediana: como o total de elementos é igual a 50 (número par) temos que encontrar os dois
elementos centrais e fazer a média entre eles. Neste caso, basta dividir 50 por 2 para achar o
1º elemento central, ou seja, o elemento na 25ª posição. O 2º elemento central será o próximo,
ou seja, o elemento na 26ª posição.

O elemento na 25ª posição é igual a 2000 e o elemento na 26ª posição é igual a 2500. Assim
sendo, a mediana é igual a 2250.

Sabendo que a moda é maior do que a mediana, podemos eliminar as alternativas A, B e D.

Média: devemos somar todos os elementos e dividir por 50, que é o número total de elementos.

Assim, a única alternativa possível é a letra C.

Vamos ver uma questão que cobra o conhecimento de gráficos? Lembre-se de que não
muda nada, é só uma maneira diferente de organizar os dados.

Exercício resolvido sobre medidas de posição:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 11
Estatística Prof.R.Dyodi

(FCC - 2010 - Sefin RO – Auditor)


Em uma cidade é realizado um levantamento referente aos valores recolhidos de determinado
tributo estadual no período de um mês. Analisando os documentos de arrecadação, detectou-
se 6 níveis de valores conforme consta no eixo horizontal do gráfico abaixo, em que as colunas
representam as quantidades de recolhimentos correspondentes.

Com relação às medidas de posição deste levantamento tem-se que o valor da

(A) média aritmética é igual a metade da soma da mediana e a moda.


(B) média aritmética é igual ao valor da mediana.
(C) média aritmética supera o valor da moda em R$ 125,00.
(D) moda supera o valor da mediana em R$ 500,00.
(E) mediana supera o valor da média aritmética em R$ 25,00.

Letra E

Resolução:

Observando as alternativas e o gráfico, vemos que se trata de uma questão de estatística


descritiva com dados em rol.

“Dyodi, só para relembrar, de onde você tirou essa conclusão?”

As alternativas falam sobre média, moda e mediana, então sabemos que se trata de estatística
descritiva.

Sabemos também que estamos trabalhando com dados em rol, porque as colunas estão
espaçadas, ou seja, sabemos exatamente quantos recolhimentos de R$500 foram feitos, assim
como quantos recolhimentos de R$1000, etc.

Moda: é igual a 1500, pois é o valor com a frequência mais elevada. Basta observar qual é
coluna com a maior altura.

Mediana: o total de elementos é igual a 200 (número par). Devemos fazer a média entre o
elemento na 100ª e na 101ª posição.
Ambos os elementos são iguais a 1500, então a mediana será igual a 1500.

Sabendo que a moda e a mediana são iguais a 1500, podemos eliminar somente a alternativa
D.

Média: devemos somar todos os elementos e dividir por 200.

Conhecendo os três valores, a única alternativa possível é a letra E.

Exercício resolvido sobre medidas de posição:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 12
Estatística Prof.R.Dyodi

(FCC - 2010 - TRF 4a - Analista – Administrativo)


Um levantamento realizado em um setor de um órgão público, durante 250 dias úteis, forneceu
a distribuição dos números de processos analisados apresentada no gráfico abaixo. No eixo
horizontal constam as quantidades detectadas de processos e as colunas representam as
respectivas quantidades de dias.

Com relação a este levantamento, a média aritmética (número de processos por dia), a
mediana e a moda são iguais, respectivamente, a

(A) 3,48; 3,50 e 4,00.


(B) 3,48; 4,00 e 4,00.
(C) 4,35; 3,50 e 3,50.
(D) 4,35; 3,50 e 4,00.
(E) 4,00; 4,00 e 4,00.

Letra B

Resolução:

Moda é o valor que mais se repete. Basta observar que este valor é aquele representado pela
maior coluna, ou seja, a moda é igual a 4. Assim, ficamos apenas com as alternativas B e E.

Mediana é o elemento central do conjunto de dados. Como estamos trabalhando com dados
em rol, é importante saber se o total de elementos é um número par ou ímpar. O total de
elemento é igual a 250, número par, portanto a mediana será igual à média aritmética entre o
125º e o 126º elemento. Como ambos são iguais a 4, a mediana também será igual a 4.

Para calcularmos a média, devemos somar todos os valores e dividir pelo tamanho do banco
de dados, ou seja, dividir por 250.

A nossa resposta é a letra B.

Antes de dar prosseguimento na matéria, gostaria de mostrar uma novidade que a FCC
apresentou nas últimas provas. O conteúdo é o mesmo, mas mudaram um pouco a forma de
cobrar a questão.

Exercício resolvido sobre medidas de posição:

(FCC - 2012 - TRF 2a - Analista – Estatística)

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 13
Estatística Prof.R.Dyodi

Em um período de 140 dias foi analisado o número de reclamações registradas por dia em um
guichê de uma repartição pública. Verificou-se que o número de dias ( ) em que ocorreram i
reclamações (0 i 6) pode ser obtido pela fórmula: . A soma dos valores da
média aritmética, da mediana e da moda (número de reclamações por dia), é igual a

(A) 10,4.
(B) 10,9.
(C) 11,4.
(D) 12,0.
(E) 12,6.

Letra B

Resolução:

Como resolver este tipo de questão?


É a mesma coisa, a diferença é que a banca não nos forneceu diretamente a frequência de
cada um dos valores, de modo que teremos de construir a nossa tabela.

2
Valor (i) Frequência = +8 +9
0 -0+0+9=9
1 - 1 + 8 + 9 = 16
2 - 4 + 16 + 9 = 21
3 - 9 + 24 + 9 = 24
4 - 16 + 32 + 9 = 25
5 - 25 + 40 + 9 = 24
6 - 36 + 48 + 9 = 21

Moda: é igual a 4, pois é o valor com a frequência mais alta.

Mediana: como o número total de elementos é igual a 140 (número par), devemos fazer a
média entre os elementos na 70ª e na 71ª posição.
O elemento na 70ª posição é igual a 3 e o elemento na 71ª posição é igual a 4. Assim, a
mediana é igual a 3,5.

Média: devemos somar todos os elementos e dividir por 140.

A soma dos 3 valores é aproximadamente igual a 10,97 e a alternativa que melhor se encaixa é
a letra B.

Além da média aritmética, existem outros tipos de média, tais como a harmônica e a
geométrica. Nas provas da FCC, não é comum a cobrança de média harmônica ou de média
geométrica. No entanto, a ESAF costuma cobrar questões teóricas sobre isso em provas. Por
conta disso, devemos ter em mente a seguinte relação:

A relação acima será sempre verdadeira para qualquer conjunto de dados. A única
ocasião em que as 3 médias são iguais ocorre quando os valores de todos os dados são iguais
(por exemplo: 5 5 5 5 5).

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 14
Estatística Prof.R.Dyodi

Dica: para decorar a relação acima, observe a ordem alfabética (Aritmética, Geométrica e
Harmônica). Note que a relação segue uma ordem alfabética, de modo que a média aritmética
é a maior.

Exercício resolvido sobre médias aritmética, geométrica e harmônica:

(ESAF - 2005 - Receita Federal – Auditor)


Assinale a opção que expresse a relação entre as médias aritmética ( ̅ ), geométrica (G) e
harmônica (H), para um conjunto de n valores positivos (X1, X2, ..., Xn):

a) G ≤ H ≤ ̅ , com G = H = ̅ somente se os n valores forem todos iguais.


b) G ≤ ̅ ≤ H, com G = ̅ = H somente se os n valores forem todos iguais.
c) ̅ ≤ G ≤ H, com ̅ = G = H somente se os n valores forem todos iguais.
d) H ≤ G ≤ ̅ , com H = G = ̅ somente se os n valores forem todos iguais.
e) ̅ ≤ H ≤ G, com ̅ = H = G somente se os n valores forem todos iguais.

Letra D

Resolução:

Simples decoreba da relação acima.

Para provas que não são específicas para o cargo de estatístico, garanto que o cálculo
da média harmônica não será objeto de questão. No entanto, a FGV cobrou o cálculo da média
geométrica em seu concurso para o ICMS/RJ em 2011. Como é algo simples de aprender,
creio que vale a pena conhecer a fórmula:

Vamos ver a questão mencionada?

(FGV - 2011 - Sefaz RJ – Auditor)


Em uma repartição, foi tomada uma amostra do número de filhos de 4 funcionários. O resultado
foi {2, 1, 4, 2}. A média geométrica simples dessa amostra é

(A) 2,25.
(B) 1,75.
(C) 2.
(D) 2,4.
(E) 2,5.

Letra C

Resolução:

Como temos 4 elementos, o valor de n é igual a 4. Então,

Média geométrica = √ √ √

Ainda sobre medidas de posição, devemos conhecer a noção de simetria. Simetria,


segundo o dicionário Aurélio, é a “correspondência, em grandeza, forma e posição relativa, de
partes situadas em lados opostos de uma linha ou plano médio, ou, ainda, que se acham
distribuídas em volta de um centro ou eixo”. Em outras palavras, há simetria quando os dois
lados opostos a um centro, ou eixo, são iguais.

Observe as posições da moda (Mo), média (Me) e mediana (Md) das distribuições de
frequência abaixo:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 15
Estatística Prof.R.Dyodi

Mo = Me = Md Mo Md Me Me Md Mo
Mo < Md < Me Me < Md < Mo

A distribuição simétrica é fácil de lembrar. O problema é recordar das diferenças entre


as distribuições assimétricas. Para decorar as informações das distribuições assimétricas,
basta saber o seguinte:

 A moda sempre fica “no topo da montanha”;


 A mediana sempre fica no meio;
 A distribuição será assimétrica positiva (ou à direita) quando a cauda mais longa estiver
na direita;
 A distribuição será assimétrica negativa (ou à esquerda) quando a cauda mais longa
estiver na esquerda.

Vamos ver como isso pode ser cobrado em provas?

Exercício resolvido sobre simetria:

(FCC - 2009 - TJ AP - Analista – Estatística)


Considere um conjunto de dados determinando uma curva de frequência de uma distribuição
estatística unimodal. Verificando que se trata de uma curva assimétrica à esquerda pode-se
afirmar que:

(A) O valor da média é negativo.


(B) Moda < Mediana < Média
(C) Média < Mediana < Moda
(D) Moda < Média < Mediana
(E) Mediana < Moda < Média

Letra C

Resolução:

Se a curva é assimétrica negativa, a moda deve ter o maior valor e a média o menor valor.

Exercício resolvido sobre simetria:

(FCC - 2010 - TRT 8a - Analista – Estatístico)


A distribuição dos valores de um determinado atributo determina uma curva de freqüência
unimodal. Com relação a uma distribuição com esta característica, considere as seguintes
informações:
I. A distribuição é assimétrica à direita caso se verifique moda < mediana < média.
II. A distribuição é assimétrica à esquerda caso se verifique mediana < moda < média.
III. Pelo coeficiente de assimetria de Pearson (A), definido como , se a média
for superior a moda, então a curva possui o ramo mais alongado à direita.

Está correto o que se afirma APENAS em

(A) I.
(B) II.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 16
Estatística Prof.R.Dyodi

(C) I e II.
(D) I e III.
(E) II e III.

Letra D

Resolução:

Item I: Perfeito, basta lembrar que a distribuição simétrica positiva tem a cauda mais alongada
para a direita.

Item II: Item falso. Nas distribuição simétrica negativa, média < mediana < moda

Item III: Não precisava nem esquentar com a fórmula. Se a média é maior que a moda, temos
uma distribuição simétrica positiva. Item correto.

1.4. Medidas de Dispersão

Trata-se de medidas que buscam resumir, simplificar, a variabilidade do conjunto de


dados. As medidas de dispersão indicam se os valores estão próximos ou separados, uns dos
outros. Observe:

“1º conjunto de dados: 5 5 5 5 5”


“2º conjunto de dados: -10 0 25”
“3º conjunto de dados: 3 5 5 7”

A média aritmética dos três conjuntos é igual a 5, mas existe uma grande diferença
entre eles. Notamos então que apenas a média, ou qualquer outra medida de posição, não é
suficiente para descrever um conjunto de dados. Devemos também analisar a variabilidade das
informações.

As principais medidas de dispersão são: desvio médio, variância, desvio padrão e


coeficiente de variação. Em provas de concurso público, apenas as três últimas são cobradas,
mas prefiro pecar pelo excesso e falaremos também sobre o desvio médio.

O desvio médio, como o próprio nome diz, calcula a média dos desvios em relação à
média. Tome por exemplo o 3º conjunto de dados. A média aritmética do conjunto é igual a 5 e,
portanto, devemos somar todos os desvios em relação a este valor e dividir pelo número de
elementos. O cálculo do desvio médio fica assim:

( ) ( ) ( ) ( )

∑ ( )

Note que o desvio médio é igual a zero, como acontece no 1º conjunto de dados. Mas
note também que os 2 conjuntos diferem entre si significativamente. Por não ser uma boa
medida de dispersão, pois pode não refletir com transparência as informações, o desvio médio
não é muito cobrado em provas de concurso.

A variância é uma das medidas de dispersão mais utilizadas e seu cálculo se parece
com o cálculo do desvio médio. A diferença é que somamos os quadrados dos desvios ao
invés de somarmos apenas os desvios. Isso faz com que não ocorra o problema acima. Vamos
utilizar novamente o 3º conjunto de dados como exemplo. A variância é calculada da seguinte
maneira:

( ) ( ) ( ) ( )

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 17
Estatística Prof.R.Dyodi

∑ ( )

Observação 1: Existe uma outra forma de calcular a variância que deve ser decorada! Repito:
deve ser decorada! Muitos exercícios só podem ser resolvidos desta maneira. Esta 2ª
forma é a seguinte:
( )
( )

(∑ )

Dica: Para não perder tempo na hora da prova, é importante que o candidato saiba o que
utilizar na resolução do exercício, assim que “bater o olho no enunciado”. Uma dica que
funciona na grande maioria das vezes é o seguinte: em relação ao cálculo da variância, sempre
que o enunciado informar sobre valores de somatórios, devemos utilizar a 2ª fórmula.

O desvio padrão deriva da variância e é obtido através da raiz quadrada da variância.


Assim, no nosso exemplo, o desvio padrão é igual a √ .


Notamos então que, quanto mais próximo de zero for o valor da variância ou do desvio
padrão, mais homogêneo será o conjunto de dados.

Vamos ver uma questão que só pode ser resolvida através da 2ª fórmula?

Exercício resolvido sobre medidas de dispersão:

(FCC - 2012 - TRF 2a - Analista – Estatística)


A soma dos quadrados dos valores dos elementos de uma população de tamanho 20 é igual a
65,6 e o respectivo desvio padrão igual a 0,2. A média aritmética dos elementos desta
população é igual a

(A) 0,8.
(B) 1,2.
(C) 1,8.
(D) 2,4.
(E) 3,0.

Letra C

Resolução:

Através do enunciado, encontramos as seguintes informações:

;∑ ·;

O 1º passo é encontrar a variância. Como o desvio padrão é igual a raiz quadrada da variância,
temos o seguinte:

√ ( )

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 18
Estatística Prof.R.Dyodi

A média é obtida através da fórmula:


Como sabemos que n = 20, basta descobrir o valor de ∑

Para fazer isso, temos que aplicar a 2ª fórmula da variância:

(∑ )

Então,
(∑ )
(∑ )

(∑ ) (∑ ) ∑ √

Assim, temos que a média é igual a 36/20 = 1,8.

Outra medida de dispersão muito cobrada em provas é o coeficiente de variação. O


coeficiente de variação serve para comparar a dispersão de diferentes distribuições. Imagine
que você tenha em mãos um relatório sobre 2 conjuntos de dados: peso de 100 barras de aço
e peso de 100 melancias. As barras de aço podem variar 10 kg, 50 kg, etc. Por outro lado, as
melancias irão variar 1kg, 2kg, etc. Então, provavelmente a variância das barras de aço será
maior que a variância das melancias, mas isso não quer dizer que necessariamente as barras
de aço possuem uma variabilidade maior que a das melancias. “Dyodi, ficou confuso. Como
assim?”. Vamos visualizar o seguinte exemplo:

Peso de três bebês: 1kg; 2kg; 3kg


Peso de três homens adultos: 90kg; 100kg; 110kg

Calcule a variância dos dois conjuntos de dados acima. Você vai perceber que a
variância dos pesos dos homens adultos é maior do que a variância dos pesos dos bebês.
Mas, vamos parar e raciocinar um pouco. Pegue o elemento central de cada um dos dados e
observe a variação para baixo e para cima. No caso dos bebês, variar 1kg em relação ao
elemento central equivale a 50%. No caso dos homens adultos, variar 10kg em relação ao
elemento central equivale a 10%.

Pela lógica, a variabilidade dos bebês é maior do que a variabilidade dos homens
adultos! No entanto, o cálculo da variância diz o contrário. E agora, qual o critério para dizer
qual conjunto de dados possui maior variabilidade?

Pessoal, a lógica está certa. A variabilidade dos bebês é maior do que a dos homens
adultos. “Pô Dyodi, então pra que serve a variância?!”. A variância serve para muitas coisas,
mas no caso de comparação entre diferentes conjuntos de dados, a melhor medida é o
coeficiente de variação.

Voltando ao exemplo dos bebês e dos homens adultos, teremos os seguintes dados:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 19
Estatística Prof.R.Dyodi


Bebês:

Homens adultos:

Realizando o cálculo do coeficiente de variação:


Bebês:

Homens adultos:

Percebam que ao utilizarmos o critério do coeficiente de variação, chegamos na


mesma conclusão que a lógica. Para ficar claro: ao comparar conjuntos de dados, devemos
utilizar o coeficiente de variação, e não a variância ou desvio padrão!

Observação 2: o coeficiente de variação é uma medida de dispersão relativa, pois depende


do valor de outras duas medidas (desvio padrão e média aritmética). Além disso, o coeficiente
de variação é uma medida adimensional. Estas informações podem ser cobradas em questões
teóricas.

Exercício resolvido sobre medidas de dispersão:

(FCC - 2012 – ISS SP - Auditor)


Considere as seguintes afirmações:
I. (suprimido)
II. O coeficiente de variação é uma medida de dispersão relativa que depende da unidade de
medida da variável que está sendo analisada.
III. (suprimido)
IV. (suprimido)
Está correto o que se afirma APENAS em

(A) I e II.
(B) I e III.
(C) II e IV.
(D) I.
(E) II e III.

Letra D

Resolução:

A 1ª parte de enunciado está correta, pois o coeficiente de variação é uma medida de


dispersão relativa. No entanto, a 2ª parte não está correta, pois o coeficiente de variação é uma
medida adimensional, isto é, não tem dimensão, grandeza nenhuma. Ao dizer que o coeficiente
de variação depende da unidade de medida da variável que esta sendo analisada, o enunciado
se torna incorreto. Portanto, o item II está errado e podemos eliminar 3 alternativas.

Exercício resolvido sobre medidas de dispersão:

(FGV - 2008 - Sefaz RJ – Auditor)


Uma companhia utiliza um sistema de avaliação de desempenho de seus funcionários por meio
de dois indicadores de performance: Qualidade das tarefas e a Tempestividade com que as
tarefas são realizadas. Os funcionários receberam, na última avaliação, as medidas indicadas
na tabela a seguir:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 20
Estatística Prof.R.Dyodi

Com base na tabela, é correto afirmar que:

(A) a média aritmética não é uma boa medida para representar a performance dos funcionários
em face do elevado nível de dispersão das avaliações.
(B) as avaliações da Qualidade foram mais dispersas do que as avaliações da Tempestividade.
(C) as avaliações da Qualidade foram mais homogêneas do que as da Tempestividade.
(D) os funcionários demoram mais para realizar as tarefas, mas a qualidade das tarefas é
melhor.
(E) nada se pode afirmar

Letra C

Resolução:

Aprendemos que para comparar a variabilidade, a homogeneidade, de 2 conjuntos diferentes


de dados, não podemos olhar para a variância ou desvio padrão, mas devemos olhar para o
coeficiente de variação.

Como o coeficiente de variação da tempestividade é maior do que o da qualidade, podemos


concluir que os dados da tempestividade são mais dispersos que os da qualidade.

Exercício resolvido sobre medidas de dispersão:

(FCC - 2012 - TRE SP - Analista – Estatística)


Considere duas variáveis X e Y representando o peso (em kg) e a altura (em cm),
respectivamente, dos 100 sócios de um clube. Em um censo realizado neste clube, foram
apurados os seguintes resultados:

e são o peso e a altura, respectivamente, do i-ésimo sócio (i = 1, 2, 3, . . . ,100).


Está correto afirmar que o coeficiente de variação de

(A) X é maior que o coeficiente de variação de Y.


(B) X é igual a 9%.
(C) Y é igual a 10%.
(D) X é igual à metade do coeficiente de variação de Y.
(E) Y terá seu valor modificado caso seja alterada em seu cálculo a unidade de medida de
centímetro para metro.

Letra D

Resolução:
Como o enunciado cobra o valor do coeficiente de variação, devemos ter mente o que
devemos buscar para encontrar a solução: o valor do desvio padrão e o valor da média.

O valor da média é obtida facilmente através da fórmula:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 21
Estatística Prof.R.Dyodi

∑ ∑

Agora, para achar o valor do desvio padrão devemos primeiro encontrar o valor da variância.
Como o exercício fornece o valor de somatórios, devemos aplicar a 2ª fórmula da variância.

(∑ ) ( )

(∑ ) ( )

Assim,

Exercício resolvido sobre medidas de dispersão:

(FCC - 2011 - Infraero - Analista Superior – Administrador)


Seja X a variável que representa o valor dos salários, em número de salários mínimos, de
todos os 100 funcionários de uma empresa.
Sabe-se que ∑ e que ∑ ( )

O coeficiente de variação de X é

(A) 0,30
(B) 0,325
(C) 0,35
(D) 0,375
(E) 0,39

Letra D

Resolução:

Sabemos que para calcular o coeficiente de variação, precisamos apenas dos valores da
média e do desvio padrão.

A média é facilmente calculada pela divisão do somatório de todos os valores pelo número total
de elementos:

O desvio padrão é calculado através da raiz quadrada da variância. Assim, resta-nos calcular o
valor da variância. Utilizando a 2ª fórmula da variância:

Então:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 22
Estatística Prof.R.Dyodi

Exercício resolvido sobre medidas de dispersão:

(FCC – 2013 – Sefaz SP – Auditor)


Considere:

I. O coeficiente de variação de uma variável é uma medida de dispersão absoluta que é o


resultado da divisão entre a média e o desvio padrão da variável em questão.
II. (suprimido)
III. O desvio padrão é mais apropriado do que o coeficiente de variação quando se deseja
comparar a variabilidade de duas variáveis.
IV. (suprimido)

Está correto o que se afirma APENAS em

(A) I.
(B) II.
(C) III.
(D) I e IV.
(E) IV.

Letra E

Resolução:

Por enquanto, vamos analisar somente os itens que tratam de estatística descritiva. Os outros
itens serão trabalhados no decorrer do curso.

Item I: percebemos dois erros na afirmativa. Em 1º lugar, o coeficiente de variação é uma


medida de dispersão relativa, e não absoluta. Em 2º lugar, ele é o resultado da divisão entre o
desvio padrão e a média, e não o inverso.

Item III: para comparar a variabilidade entre conjuntos de dados, vimos que o coeficiente de
variação é uma melhor medida.

Assim, já poderíamos eliminar rapidamente as alternativas A, C e D.

1.5. Propriedades das medidas de posição e de dispersão

Observe o seguinte conjunto de dados:

{3,5,5,7}

Fazendo os cálculos, encontramos as seguintes medidas de posição e de variabilidade:

 Média = 5; Moda = 5; Mediana = 5;



 Variância = 2; Desvio padrão = √ ; Coef. Variação =

O que acontece com essas medidas se adicionarmos o número 3 para todos os


elementos?

{6,8,8,10}

Fazendo o cálculo, encontramos as novas medidas:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 23
Estatística Prof.R.Dyodi

 Média = 8; Moda = 8; Mediana = 8;



 Variância = 2; Desvio Padrão = √ ; Coef. Variação =

Através deste exemplo, podemos observar a seguinte propriedade:

Ao somarmos um número a todos os elementos de um conjunto de dados, as novas


medidas de posição ficam acrescidas de .

Ao somarmos um número a todos os elementos de um conjunto de dados, a variância e o


desvio padrão ficam inalterados.

E o que acontece se multiplicarmos todos os números por 3?

{9,15,15,21}

Fazendo o cálculo, encontramos as novas medidas:

 Média = 15; Moda = 15; Mediana = 15;


√ √ √
 Variância = 18; Desvio Padrão = √ √ ; Coef. Variação =

Através deste exemplo, podemos observar a seguinte propriedade:

Ao multiplicarmos um número a todos os elementos de um conjunto de dados, as novas


medidas de posição ficam multiplicadas por .

Ao multiplicarmos um número a todos os elementos de um conjunto de dados, a


variância fica multiplicada por e o desvio padrão fica multiplicado por .

Ao multiplicarmos um número a todos os elementos de um conjunto de dados, o


coeficiente de variação não se altera.

E o que acontece com as medidas de posição (não iremos analisar as medidas de


variabilidade neste caso) se incluirmos no conjunto de dados um elemento de valor muito
discrepante?

{3,5,5,7,1000}

Fazendo o cálculo, encontramos as novas medidas:

 Média = 204; Moda = 5, Mediana 5;

Através deste exemplo, podemos observar a seguinte propriedade:

Quando um valor muito discrepante é incluído num conjunto de dados, a moda e a


mediana não são muito afetadas, por este motivo são consideradas medidas robustas. Por
outro lado, a média será muito afetada pelo valor discrepante.

Vamos ver como essas propriedades são cobradas em provas?

Exercício resolvido sobre propriedades das medidas-resumo:

(FCC - 2012 – ISS SP - Auditor)


Considere as seguintes afirmações:
I. (suprimido)
II. (suprimido)
III. Dentre as medidas de posição central, a média é considerada uma medida robusta pelo fato
de não ser afetada por valores aberrantes.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 24
Estatística Prof.R.Dyodi

IV. (suprimido)
Está correto o que se afirma APENAS em

(A) I e II.
(B) I e III.
(C) II e IV.
(D) I.
(E) II e III.

Letra D

Resolução:

A média é muito afetada por valores discrepantes, ao contrário do que diz a afirmativa. A
mediana e a moda podem ser consideradas medidas robustas, mas não a média. O item III
está errado.

Exercício resolvido sobre propriedades das medidas-resumo:

(FCC - 2007 - MPU - Analista – Estatistica)


Dados os conjuntos de números P = {0, 1, 2, 3, 4, 5} e Q = {220, 225, 230, 235, 240, 245},
pode-se afirmar, de acordo com as propriedades da média, que a média dos elementos de Q é
igual a

(A) constante 220 somada ao produto da média dos elementos de P por 5.


(B) média dos elementos de P mais a constante 220.
(C) média dos elementos de P multiplicada por uma constante arbitrária.
(D) média dos elementos de P mais a constante 220 e esse último resultado multiplicado por 5.
(E) média dos elementos de P mais a constante 200.

Letra A

Resolução:

Devemos calcular a média dos 2 conjuntos e comparar com as alternativas.


A média do conjunto P é igual a

Do modo como está escrito no enunciado, o cálculo da média de Q envolveria números muito
grandes. Então, podemos utilizar as propriedades da média para calcular a média do conjunto
Q:

Subtraindo 220 de todos os elementos do conjunto, temos o seguinte:

Q’ = {0,5,10,15,20,25}

A média de Q’ é igual a

Como Q é igual ao conjunto Q’ adicionado de 220, para todos os elementos, a média de Q é


igual a

Logo, a única alternativa verdadeira é a letra A.

Exercício resolvido sobre propriedades das medidas-resumo:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 25
Estatística Prof.R.Dyodi

(FCC - 2010 - Dnocs – Administrador)


A média aritmética e a variância dos salários dos empregados em uma fábrica são iguais a
R$1.500,00 e 22.500 ( ) , respectivamente. Para todos os empregados foi concedido um
reajuste de 8% e posteriormente um adicional fixo de R$ 180,00. O coeficiente de variação,
após o reajuste e o adicional concedidos, é igual a

(A) 5%.
(B) 6%.
(C) 8%.
(D) 9%.
(E) 10%.

Letra D

Resolução:

Em 1º lugar, devemos colocar no papel quais foram as alterações:

1º evento: Todos os elementos do conjunto de dados foram multiplicados por 1,08 (cuidado! O
salário aumentou, então não podemos multiplicar por 0,08).
2º evento: A todos os elementos do conjunto de dados, adicionou-se o valor 180.

De acordo com as propriedades estudadas, teremos o seguinte após o reajuste:

Por fim, após o adicional:

Então, o coeficiente de variação após os 2 eventos será igual a:

Exercício resolvido sobre propriedades das medidas resumo:

(FCC - 2006 - Sefaz SP – Auditor)


Considerando as respectivas definições e propriedades relacionadas às medidas de posição e
de variabilidade, é correto afirmar:

(A) Concedendo um reajuste de 10% em todos os salários dos empregados de uma empresa,
tem-se também que a respectiva variância fica multiplicada por 1,10.
(B) Definindo coeficiente de variação (CV) como sendo o quociente da divisão do desvio
padrão pela respectiva média aritmética (diferente de zero) de uma seqüência de valores, tem-
se então que CV também poderá ser obtido dividindo a correspondente variância pelo
quadrado da média aritmética.
(C) Subtraindo um valor fixo de cada salário dos funcionários de uma empresa, tem-se que o
respectivo desvio padrão dos novos valores é igual ao valor do desvio padrão dos valores
anteriores.
(D) Dividindo todos os valores de uma seqüência de números estritamente positivos por 4, tem-
se que o respectivo desvio padrão fica dividido por 2.
(E) Em qualquer distribuição de valores em estudo, a diferença entre a mediana e a moda é
sempre diferente de zero.

Letra C

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 26
Estatística Prof.R.Dyodi

Resolução:

Alternativa A: um reajuste de 10% em todos os salários significa que estamos multiplicando


todos os valores do conjunto de dados por 1,1. Cuidado! Um reajuste quer dizer que o salário
está aumentando, então este número tem que ser maior do que 1.
Lembrando das propriedades, sabemos então que a variância será multiplicada por 1,21, ou
seja, 1,1 ao quadrado.Item incorreto.

Alternativa B: se dividirmos a variância pelo quadrado da média, teremos o seguinte:

( )

Coeficiente de variação não é a mesma coisa que o quadrado do coeficiente de variação.


Portanto, item incorreto.

Alternativa C: perfeito! A soma ou a subtração não interfere no valor da variância ou desvio


padrão. Este é o gabarito.

Alternativa D: se dividirmos todos os elementos por 4, o desvio padrão também será dividido
por 4. Item incorreto.

Alternativa E: em outras palavras, o enunciado está dizendo que a moda e a mediana nunca
podem ter valores iguais. Alternativa absurda.

Percebam que mesmo se você ficar em dúvida em algumas alternativas, quem estudou sabe
que a alternativa C está correta. Esta questão poderia ser facilmente resolvida em questão de
segundos! Numa P1 de área fiscal, isso pode fazer toda a diferença...

Exercício resolvido sobre propriedades:

(FCC - 2010 - TRF 4a - Analista – Administrativo)


A média dos salários dos funcionários em uma repartição pública é igual a R$ 1.800,00, com
um coeficiente de variação igual a 10%. Um reajuste de 20% em todos os salários implica que,
após o reajuste, o valor

(A) do novo desvio padrão fica igual a R$ 198,00.


(B) da nova variância fica igual a 39.204 ( ) .
(C) da nova variância fica igual a 32.400 ( ) .
(D) do novo desvio padrão fica igual a R$ 324,00.
(E) da nova variância fica igual a 46.656 ( ) .

Letra E

Resolução:

Inicialmente, temos as seguintes informações:

Um reajuste de 20% significa que o salário aumentou em 20%, ou seja, multiplicaremos todos
os salários por 1,2.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 27
Estatística Prof.R.Dyodi

Assim, o novo desvio padrão e a nova variância são iguais a:

A alternativa correta é a letra E.

Agora, vamos resumir algumas informações importantes num quadro comparativo


sobre as medidas:

Quadro - Resumo

É afetada Multiplicar
Somar a Subtrair de Dividir por
por por
Tipo todos os todos os todos os
valores todos os
elementos elementos elementos
extremos? elementos

Multiplicar Dividir por


Média Posição Sim Somar Subtrair
por

Multiplicar Dividir por


Moda Posição Não Somar Subtrair
por

Multiplicar Dividir por


Mediana Posição Não Somar Subtrair
por

Dispersão Multiplicar Dividir por


Variância - Nada fazer Nada fazer
Absoluta por

Desvio Dispersão Multiplicar Dividir por


- Nada fazer Nada fazer
Padrão Absoluta por

O O
Coeficiente
Dispersão denominador denominador Nada Nada
de -
Relativa é acrescido é subtraído fazer fazer
Variação
de de

1.6. Medidas de Posição ou Medidas de Tendência Central para dados agrupados

Agora que aprendemos sobre frequência e medidas de posição, podemos entender


como a FCC costuma cobrar suas questões sobre estatística descritiva. A maioria das
questões utiliza a técnica chamada interpolação linear, que será estudada neste tópico.

Quando temos um grande número de observações, pode ser difícil ou, até mesmo,
desnecessário lidar com os números individuais. Nestes casos, o agrupamento dos dados em
classes é uma ferramenta muito útil para se analisar o conjunto de dados. Por exemplo,
suponha que uma cidade possua 1.000 habitantes e que desejamos descobrir a composição
etária desta cidade. Após uma pesquisa com todos os cidadãos, uma parte do resultado foi
divulgada da seguinte forma:

 10 pessoas com menos de 1 ano de vida


 5 pessoas com 1 ano de vida
 4 pessoas com 2 anos de vida
 4 pessoas com 3 anos de vida

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 28
Estatística Prof.R.Dyodi

 10 pessoas com 4 anos de vida

Supondo que existem pessoas com mais de 100 anos de vida, nossa pesquisa teria
mais de 100 classes de dados a serem analisados. Uma forma de facilitar a análise das
informações é agrupar várias classes em uma. Desta maneira, podemos dizer que existem 33
pessoas na cidade que possuem menos de 5 anos de idade. Uma outra classe poderia ser
aquela na qual os indivíduos possuem idade entre 5 e 9 anos, e assim por diante. Observe que
podemos obter a mesma conclusão sobre a composição etária com menos trabalho do que se
tivéssemos trabalhado com todas as 100 classes individualmente, pois assim só trabalhamos
com 12 classes. Observe um possível resultado da pesquisa:

Nº de pessoas

0 5 anos 33

5 10 anos 167

10 15 anos 40

15 20 anos 60

20 30 anos 100

30 40 anos 150

40 50 anos 50

50 60 anos 80

60 70 anos 20

70 80 anos 90

80 90 anos 110

90 100 anos 100

Total = 1000

Quando trabalhamos com dados agrupados, devemos ter o seguinte cuidado. Um


pessoa que possui exatamente 5 anos de vida, nem um dia a mais e nem um dia a menos,
está em qual classe acima: na 1ª, na 2ª ou em ambas?

Pessoal, cada um dos valores do conjunto de dados pertence a somente uma classe!
Um mesmo valor nunca estará presente em duas classes ao mesmo tempo! Então, resta-nos
saber se a pessoa com exatamente 5 anos de vida está na 1ª ou na 2ª classe.

O sinal indica que o valor a sua esquerda pertence a esta classe, ou seja, a pessoa
com exatamente 5 anos de vida pertence à 2ª classe de dados. Da mesma forma, a pessoa
com 10 anos de vida pertence à 3ª classe de dados. A pessoa com 4 anos e 364 dias de vida
pertence à 1ª classe, e assim por diante. Dizemos que os intervalos são fechados à esquerda e
abertos à direita.

Com os dados agrupados, isto é, em intervalos, como podemos proceder para o


cálculo da moda, média e mediana? O problema reside no fato de haver perda de informações
sobre a distribuição dos valores dentro de cada classe. Por exemplo, sabemos que existem

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 29
Estatística Prof.R.Dyodi

100 pessoas com idade entre 20 anos e 30 anos, mas não sabemos quantas possuem 20,
quantas possuem 21, e assim por diante.

Desta forma, saiba que quando os dados estão agrupados, ocorre perda de
informações. Este tipo de conhecimento pode ser cobrado em questões teóricas. Agora,
vamos aos cálculos das medidas de posição!

Em relação à média, não há maiores dificuldades. A solução é considerar, para cada


classe, o valor correto como sendo o ponto médio de cada intervalo. Então, no cálculo da
média, existem 33 pessoas com 2,5 anos, 127 pessoas com 7,5 anos, 50 pessoas com 12,5
anos, e assim por diante. A média deve ser calculada da seguinte maneira:

Do mesmo modo que fizemos para os dados em rol, este método é utilizado quando
trabalhamos com tabelas de frequências por questões de praticidade. Se fôssemos somar um
a uma todos os elementos, teríamos o seguinte:

33x 167x 40x 60x 100x 150x 50x 80x 20x 90x 110x 100x

Ao invés de somarmos um a um todos os 1000 números, podemos utilizar o método


acima para o cálculo. Isso sempre será possível, desde que saibamos quais são as frequências
de cada valor.

O método vale tanto para frequências simples absolutas como para frequências
simples relativas.

Em relação à moda, descobrir a classe modal é tarefa simples: basta analisar qual a
classe com maior frequência. No nosso exemplo, a classe modal é aquela na qual os
indivíduos possuem entre 30 e 40 anos. Neste ponto da matéria o aluno deve se perguntar:
mas e se a questão cobrar um valor exato da moda, é possível encontrar este valor? A
resposta é afirmativa. No entanto, este tipo de questão somente costuma ser cobrada em
provas com especialidade em estatística e, mesmo assim, a própria questão fornece a fórmula
necessária para o cálculo (fórmula de Czuber, fórmula de King ou fórmula de Pearson). Desta
maneira, não estudaremos questões sobre o valor exato da moda para dados agrupados.

Em relação à mediana, a ideia é utilizar o método da interpolação linear. Este tipo de


questão é a preferida pelos examinadores da FCC. Relembrando os conceitos, a mediana é o
valor que ocupa a posição central entre os dados, dividindo o conjunto de dados em partes
iguais.

Então, no nosso exemplo, temos 1000 habitantes e deveríamos encontrar os valores


que ocupam a 500ª e a 501ª posição e fazer a média aritmética entre eles. Isso seria o correto
se estivéssemos trabalhando com dados em rol. Como estamos trabalhando com dados
agrupados, basta apenas encontrar o valor que ocupa a 500ª posição!

“Dyodi, não entendi. Qual a diferença? Por que não precisamos encontrar o valor na
501ª posição e fazer a média entre os dois valores?”. Você concorda comigo que, como os
dados estão agrupados, ocorreu perda de informações e estamos trabalhando com um monte
de suposições? Pois então, se não temos os dados exatos e estamos supondo várias coisas,
não faz sentido tentar buscar uma exatidão para o cálculo da mediana. Basta encontrarmos o
valor na 500ª posição e pronto. E como vamos proceder?

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 30
Estatística Prof.R.Dyodi

Nº de pessoas

0 5 anos 33

5 10 anos 167

10 15 anos 40 400 pessoas


15 20 anos 60

20 30 anos 100

30 40 anos 150

40 50 anos 50

50 60 anos 80

60 70 anos 20

70 80 anos 90

80 90 anos 110

90 100 anos 100

Total = 1000

O primeiro passo é encontrar a classe onde a mediana está situada. Como a mediana
ocupa a 500ª posição, percebemos que ela está na classe em que os indivíduos possuem entre
30 e 40 anos de idade. Agora, basta utilizar uma simples regra de três para encontrar o valor
da mediana:

 150 pessoas representam um intervalo de 10 anos (40 – 30 = 10)


 Queremos encontrar a idade da 100ª pessoa desta classe (pois já temos 400 pessoas
nas classes anteriores)

Então: 150 pessoas --------------------- 10 anos


100 pessoas --------------------- x anos

A mediana é igual a 30 + 6,7 = 36,7 anos.

O método utilizado é chamado de interpolação linear.

Vamos ver um exemplo que utiliza frequências relativas ao invés de absolutas:

Exercício resolvido sobre interpolação linear:

(FCC - 2011 - Infraero - Analista Superior – Administrador)


O departamento de pessoal de certa empresa fez um levantamento dos salários de seus 200
funcionários, em número de salários mínimos, obtendo os resultados da tabela abaixo:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 31
Estatística Prof.R.Dyodi

Sejam:
x = média dos salários obtida através da tabela acima, utilizando os pontos médios das
classes como representantes dos valores de sua respectiva classe.
Md = mediana dos salários obtida pela tabela acima pelo método da interpolação linear.

O valor de x + Md, em número de salários mínimos, é dado por

(A) 9,0
(B) 9,15
(C) 9,25
(D) 9,5
(E) 9,75

Letra B

Resolução:

Para o cálculo da média, vamos considerar o valor de cada intervalo como sendo igual ao
ponto médio da classe.

Então, o valor da 1ª classe será igual a 2, o valor da 2ª classe será igual a 4, o valor da 3ª
classe será igual a 6 e o valor da 4ª classe será igual a 8,5.

Como estamos trabalhando com frequências relativas, a soma das frequências será sempre
igual a 1 (=100%). O cálculo da média fica assim:

A mediana deve se obtida pelo método da interpolação linear.

O 1º passo é descobrir em qual classe está o valor da mediana: como a mediana é o valor que
ocupa a posição central dos dados, 50% das observações devem estar acima e 50% devem
estar abaixo da mediana. Na 1ª classe, já temos 20% das observações. Na 2ª classe, temos
mais 40% das observações. Então, a mediana está na 2ª classe.

Como precisamos de apenas 30% das observações (pois já temos 20% das observações na
classe anterior), devemos utilizar o método da interpolação linear:

- 40% das observações representam um intervalo de 2 salários mínimos


- Queremos apenas 30% das observações

40% ----------------------------- 2 salários mínimos


30% ----------------------------- a

Então,

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 32
Estatística Prof.R.Dyodi

Exercício resolvido sobre interpolação linear:

Para resolver às questões, considere a tabela de frequências relativas abaixo, que mostra a
distribuição dos valores arrecadados, em 2008, sobre determinado tributo, referente a um ramo
de atividade escolhido para análise. Sabe-se que:

I. As frequências absolutas correspondem às quantidades de recolhimentos, sendo as


frequências relativas do segundo e terceiro intervalos de classe iguais a x e y, respectivamente.

II. A média aritmética da distribuição, valor arrecadado por recolhimento, é igual a R$ 3.350,00
(valor encontrado considerando que todos os valores incluídos num certo intervalo de classe
são coincidentes com o ponto médio deste intervalo).

(FCC - 2009 - Sefaz SP – Auditor)


A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é

(A) 70%
(B) 65%
(C) 55%
(D) 45%
(E) 40%

Letra C

(FCC - 2009 - Sefaz SP – Auditor)


Utilizando o método da interpolação linear, tem-se que o valor da respectiva mediana é

(A) R$ 3.120,00
(B) R$ 3.200,00
(C) R$ 3.400,00
(D) R$ 3.600,00
(E) R$ 3.800,00

Letra B

Resolução:

Vamos resolver duas questões do concurso do ICMS-SP 2009 na sequência.

Como estamos trabalhando com frequências relativas, sabemos que o total das frequências
deve ser igual a 1. Assim, a soma de x e y deve ser igual a 0,6.

O enunciado forneceu outra informação: a média é igual a 3350.

Resolvendo a equação acima:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 33
Estatística Prof.R.Dyodi

Agora, podemos resolver o sistema e encontrar os valores de x e y.

O valor de x é igual a 0,35 e o valor de y é igual a 0,25.

A 1ª questão pede a porcentagem de valores maiores ou iguais a três mil reais. Devemos então
somar as frequências das três últimas classes, que será igual a 0,55, ou 55%.

A 2ª questão pede o valor da mediana. Como estamos diante de dados agrupados, basta
encontramos o valor que está na posição 0,5.

Considerando as duas primeiras classes, temos 45% do total dos dados. Percebemos então
que a mediana está na 3ª classe de dados. Utilizando o método da interpolação linear:

25% dos dados representam um intervalo de 1000 reais


5% dos dados representam um intervalo de x reais

0,25 ---------- 1000


0,05 ---------- x

x = 200

Assim, a mediana será igual a:

Assim como os dados em rol, os dados agrupados também podem ser cobrados em
forma de gráfico. Vimos no início do capítulo que isso ocorre quando as colunas estão coladas,
sem nenhum espaçamento entre elas. Este tipo de gráfico é conhecido como histograma.
Mostrarei agora as duas maneiras de se cobrar histograma em provas. Observe que a única
diferença fica por conta dos valores no eixo Y.

O gráfico do lado esquerdo apresenta no eixo Y as frequências simples absolutas.


Neste caso, a fórmula de resolução é igual ao que estava sendo feito até agora.

Exercício resolvido sobre histograma:

(FCC - 2010 - Dnocs – Administrador)


Uma pesquisa realizada no mercado forneceu o histograma de frequências absolutas abaixo,
representando a distribuição dos preços unitários de venda de determinada peça.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 34
Estatística Prof.R.Dyodi

Considerando os intervalos de classe fechados à esquerda e abertos à direita, é correto afirmar


que

(A) 20% dos preços da peça são superiores a R$ 5,00.


(B) 50% dos preços da peça são maiores ou iguais a R$ 2,00 e inferiores a R$ 4,00.
(C) 90% dos preços da peça são superiores a R$ 2,00.
(D) 35% dos preços da peça são maiores ou iguais a R$ 1,00 e inferiores a R$ 3,00.
(E) 80% dos preços da peça são maiores ou iguais a R$ 2,00 e inferiores a R$ 5,00.

Letra B

Resolução:

A 1ª coisa a ser feita é contar o total de observações. Temos 10 observações com preços entre
R$1 e R$2, 15 observações com preços entre R$2 e R$3, e assim por diante.

Letra A  existem 10 observações com preços maiores do que R$5, ou seja, 12,5% das
observações. Item incorreto.

Letra B  existem 40 observações com preços entre R$2 e R$4, ou seja 50% das
observações. Item correto.

Letra C  existem 70 observações com preços superiores a R$2, ou seja 87,5% das
observações. Item incorreto.

Letra D  existem 25 observações com preços entre R$1 e R$3, ou seja, 31,25% das
observações. Item incorreto.

Letra E  existem 60 observações com preços entre R$2 e R$5, ou seja, 75% das
observações. Item incorreto.

Exercício resolvido sobre histograma:

(FCC - 2006 - Sefaz SP – Auditor)


O histograma de freqüências absolutas, abaixo, demonstra o comportamento dos valores
arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 35
Estatística Prof.R.Dyodi

Observação: Considere que todos os intervalos de classe do histograma são fechados à


esquerda e abertos à direita. Utilizando as informações contidas neste histograma, calculou-se
a média aritmética destes valores arrecadados, considerando que todos os valores incluídos
num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também
calculou-se a mediana de tais valores pelo método da interpolação linear. Então, o módulo da
diferença entre a média aritmética e a mediana é igual a

(A) R$ 100,00
(B) R$ 400,00
(C) R$ 800,00
(D) R$ 900,00
(E) R$ 1.000,00

Letra A

Resolução:

Para calcular a mediana, precisamos saber qual é o total de elementos, que é 2000. Então,
precisamos descobrir qual o valor do elemento que está na 1000ª posição.

É possível perceber que este elemento está na 3ª classe de dados, pois já temos 600 nas duas
primeiras classe. Utilizando a técnica da interpolação linear:

500 elementos representam um intervalo de 1000 reais


400 elementos representam um intervalo de x reais

500 ---------- 1000


400 ---------- x

x = 800

mediana = 3000+800 = 3800

Resta-nos calcular a média:

Assim, a diferença entre média e mediana é igual a 100. Alternativa A.

Por sua vez, o gráfico no lado direito apresenta no eixo Y as densidades de frequência.
Não se preocupe com a definição de densidade de frequência, apenas saiba o seguinte: a
frequência relativa do intervalo é igual à amplitude do intervalo multiplicado pela
densidade. Conhecendo as frequências relativas, a questão pode ser resolvida de acordo com
o conteúdo estudado até agora.

Exercício resolvido sobre histograma:

(FCC - 2011 - Infraero - Analista Superior – Estatístico)


Os preços unitários de venda de um determinado equipamento no mercado estão distribuídos
conforme representação do histograma abaixo. No eixo das ordenadas constam as respectivas
densidades de frequências em ( ) . Define-se densidade de frequência de um
intervalo de classe como sendo o quociente da divisão da respectiva frequência relativa pela
correspondente amplitude do intervalo.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 36
Estatística Prof.R.Dyodi

Considerando os intervalos de classe fechados à esquerda e abertos à direita, obtém-se que a


porcentagem dos preços unitários, que são iguais ou superiores a R$ 3.000,00 e inferiores a
R$ 8.000,00, corresponde a

(A) 70%.
(B) 60%.
(C) 55%.
(D) 40%.
(E) 30%.

Letra A

Resolução:

A maneira mais simples de resolver exercícios de histograma com densidades de frequência é


escrever a frequência relativa de cada intervalo no próprio gráfico. Para isso, devemos lembrar
que a frequência relativa do intervalo é igual à multiplicação entre a amplitude e a densidade do
intervalo.

1º intervalo  frequência relativa = (3-1).0,075 = 15%


2º intervalo  frequência relativa = (6-3).0,100 = 30%
3º intervalo  frequência relativa = (8-6).0,200 = 40%
4º intervalo  frequência relativa = (9-8).0,100 = 10%
5º intervalo  frequência relativa = (10-9).0,050 = 5%

Assim,

Como o exercício pede a frequência relativa quando os preços são superiores a R$3000 e
inferiores a R$8000, temos que somar 30% e 40%. A resposta é igual a 70%.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 37
Estatística Prof.R.Dyodi

Exercício resolvido sobre histograma:

(FCC - 2012 - TRF 2a - Analista – Estatística)


Considere que a distribuição dos salários dos funcionários em um setor público está
representada por um histograma conforme abaixo, em que no eixo vertical constam as
densidades de frequências, em ( ) . Densidade de frequência de um intervalo de classe é o
resultado da divisão da respectiva frequência relativa pela correspondente amplitude do
intervalo.

Considerando que todos os intervalos classe são fechados à esquerda e abertos à direita, a
porcentagem P dos funcionários que ganham no mínimo R$ 2.000,00 e menos que R$
6.000,00 é tal que

(A) P 65%.
(B) 65% < P 70%.
(C) 70% < P 75%.
(D) 75% < P 80%.
(E) P > 80%.

Letra C

Resolução:

Vamos resolver da mesma forma que fizemos para o exercício anterior:

1º intervalo  frequência relativa = (2000-1000).0,00010 = 10%


2º intervalo  frequência relativa = (4000-2000).0,00020 = 40%
3º intervalo  frequência relativa = (5000-4000).0,00025 = 25%
4º intervalo  frequência relativa = (6000-5000).0,00010 = 10%
5º intervalo  frequência relativa = (9000-6000).0,00005 = 15%

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 38
Estatística Prof.R.Dyodi

A questão pede a porcentagem de funcionários que ganham entre dois mil reais e seis mil
reais, que é igual a 75%. Assim, a única alternativa correta é a letra C.

1.7. Ramo e folhas

Trata-se de uma outra maneira de representar os dados em rol. Dificilmente cairá na


sua provas, mas, se cair, não podemos perder uma questão como essa.

Observe o exemplo abaixo para entender o que é este gráfico de ramo e folhas:

Peso em Kg

5 112368

6 1289

7 12233345

8 469

9 08

Ramos Folhas

A ideia deste gráfico é apenas organizar os dados de uma outra maneira. Segundo ele,
existem 2 pessoas com 51 kg, 1 pessoa com 52 kg, 1 pessoa com 53 kg, e assim por diante.
Deste modo, podemos observar que existem 23 elementos do conjunto, que a mediana é igual
a 72 kg e que a moda é igual a 73 kg.

Exercício resolvido sobre gráfico de ramo e folhas:

(FCC - 2009 - TJ AP - Analista – Estatística)


O diagrama de ramo e folhas a seguir corresponde às idades dos 40 funcionários de um setor
de um órgão público em uma determinada data.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 39
Estatística Prof.R.Dyodi

A soma da mediana e da moda destas idades é igual a

(A) 67,0
(B) 66,5
(C) 66,0
(D) 65,5
(E) 65,0

Letra A

Resolução:

Contando o número de folhas, observamos que existem 40 observações.

Como o número de observações é par, a mediana representa a média aritmética entre o 20º e
o 21º elementos.

A moda, o elemento que aparece com mais frequência, é igual a 33.

A soma da mediana e da moda é igual a 67.

Exercício resolvido sobre ramo e folhas:

(FCC - 2009 - TRE PI - Analista – Estatística)


O diagrama de ramo e folhas abaixo corresponde às observações das idades de 50 eleitores
escolhidos aleatoriamente em uma determinada zona eleitoral:

O valor do módulo da diferença entre a mediana e a moda destas idades observadas é

(A) 0
(B) 3
(C) 10
(D) 14
(E) 16

Letra D

Resolução:

Contando o número de folhas, notamos que temos 50 observações.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 40
Estatística Prof.R.Dyodi

A moda, o valor que mais se repete, é igual a 46 (aparece quatro vezes).


Por sua vez, como o total de observações é um número par, a mediana representa a média
aritmética entre os elementos na 25ª e 26ª posições:

Assim, a diferença entre moda e mediana é igual a 14. Alternativa correta letra D.

1.7. Quantis e Box-Plot

O quantil é uma palavra estranha para algo simples. Vamos voltar um pouco no tempo
e nos lembrar da professora da 1ª série ensinando os alunos a fazer operações de divisão. Se
eu dividir o todo em quatro partes iguais, qual é a parte que cabe a cada integrante de um
grupo de quatro amigos? A resposta seria 1/4, certo? Perfeito. E, para dividir este todo em
quatro partes iguais, quantas linhas divisórias eu tive que fazer? A resposta correta é 3, e
essas linhas divisórias são os chamados quartis.

No caso acima, a 1ª linha divisória, q(0,25), é chamada de 1º quartil. Isso quer dizer
que 25% dos dados estão abaixo deste valor. A 2ª linha divisória, q(0,5), é chamada de 2º
quartil e quer dizer que 50% dos dados estão abaixo deste valor. Por fim, a 3ª linha divisória,
q(0,75), é chamada de 3º quartil e 75% dos dados estão abaixo deste valor.

Perceberam a lógica da coisa? A noção de quantis é exatamente essa. Vamos em


frente! Além dos quartis, as provas às vezes perguntam sobre decis (decil no plural). É quase a
mesma coisa, mas agora estamos dividindo o todo em dez partes. Assim, q(0,1) é chamado de
1º decil e representa a linha divisória que coloca 10% dos dados abaixo de tal valor. Do mesmo
modo, q(0,2) é o 2º decil, q(0,3) o 3º decil e assim por diante.

 q(0,25) = 1º quartil =
 q(0,5) = 2º quartil = mediana =
 q(0,75) = 3º quartil =
 q(0,1) = 1º decil
 q(0,2) = 2º decil
 q(0,3) = 3º decil, etc

Uma das formas que as questões podem cobrar este tema é através da interpolação
linear. Suponha que queiramos analisar o Q.I. de 1100 pessoas de certa cidade e encontramos
o seguinte resultado (normalmente, o valor do Q.I. de uma pessoa considerada normal varia
entre 90 e 110 pontos):

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 41
Estatística Prof.R.Dyodi

Nº de pessoas

68 70 pontos 5

70 80 pontos 50

80 90 pontos 150

90 100 pontos 350

100 110 pontos 300

110 120 pontos 150

120 130 pontos 50

130 140 pontos 30

140 150 pontos 10

150 160 pontos 5

Total = 1100

Suponha que a questão peça para você encontrar o valor de q(0,25). Como resolvê-la?
Primeiramente, devemos saber que estamos atrás do valor no qual 25% dos dados fiquem
abaixo deste valor. Como temos 1100 dados, queremos encontrar o valor da 275ª posição.
Então, o 1º passo é encontrar a classe na qual está tal valor. No nosso exemplo, esta classe
seria de 90 a 100 pontos. Através da interpolação linear, temos o seguinte:

 350 pessoas representam um intervalo de 10 pontos


 Queremos encontrar a pontuação da 70ª pessoa desta classe

Então: 350 pessoas ------------- 10 pontos


70 pessoas ------------- x pontos

O valor de q(0,25) é igual a 90 + 2 = 92 pontos. Percebam que não estamos vendo


nada de novo, isto é exatamente igual à metodologia usada para os dados agrupados.

Outra forma de cobrar os quantis é através de um gráfico chamado Box-Plot. Para


construir este gráfico devemos obter 3 valores: q(0,25), q(0,5) e q(0,75). O Box-Plot nos dá
uma noção da simetria ou assimetria dos dados, a posição central e se existem dados
discrepantes (também chamados de outliers). O Box-Plot não diz nada sobre a média.

Utilizando a interpolação linear, descobrimos que o valor de q(0,5) do nosso exemplo é


igual a 99,86 pontos e que o valor de q(0,75) é igual a 109 pontos.

O 1º passo é determinar os valores dos 3 quantis acima num eixo (pode ser horizontal
ou vertical, pois as bancas não dão importância para isso). Estes 3 valores formarão uma caixa
com um risco no meio (não necessariamente na metade da caixa; a posição do risco irá
depender da simetria dos dados). Note que o risco está levemente mais afastado para à
esquerda da caixa, pois q(0,50) está mais próximo de q(0,25) do que de q(0,75):

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 42
Estatística Prof.R.Dyodi

O 2º passo é encontrar 2 valores que indicarão o limite superior e o limite inferior do


Box-Plot. Para isso devemos ter em mente que:

 Limite inferior = ( )–

 Limite superior = ( )

Ok, mas o que é distância interquartil? Essa distância apenas representa a


subtração entre q(0,75) e q(0,25), ou seja, é a largura da caixa. Assim teríamos o seguinte:

O 3º passo é verificar se existem dados que estão fora da caixa, mas que não
ultrapassam os limites encontrados. Se existirem, devemos ligar os extremos da caixa até o
último valor dentro dos limites (isso deve ser feito tanto para os dados inferiores a q(0,25) como
para os dados superiores a q(0,75)).

No nosso exemplo, a linha da esquerda irá até o valor 68, que é o último valor inferior à
q(0,25) e que não ultrapasse o limite. A linha da direita, por sua vez, chegará até o limite
superior e os dados que ultrapassarem o limite não serão ligados (são os chamados outliers,
ou pontos fora da curva).

Vamos ver alguns exercícios sobre box-plot.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 43
Estatística Prof.R.Dyodi

Exercício resolvido sobre Box-Plot:

(FGV - 2009 - Sefaz RJ – Auditor)


Para comparar as rendas de dois grupos de pessoas, A e B, foram preparados diagramas de
caixas (box-plots) com os valores observados dos salários, representados na figura a seguir:

A respeito desses diagramas, considere as seguintes afirmativas:


I. O salário médio dos dois grupos é o mesmo.
II. A distribuição dos salários no grupo A é assimétrica à direita.
III. Há mais pessoas no grupo A do que no grupo B.
Assinale:

(A) se somente a afirmativa I for verdadeira.


(B) se somente a afirmativa II for verdadeira.
(C) se somente a afirmativa III for verdadeira.
(D) se somente as afirmativas I e II forem verdadeiras.
(E) se somente as afirmativas II e III forem verdadeiras.

Letra B

Resolução:

Item I  O Box-Plot é um diagrama que fornece dados sobre mediana, variabilidade, mas não
a média. Não é possível obter o valor da média através de um Box-Plot.

Item II  Item correto. Numa distribuição simétrica, a mediana ocuparia a posição central da
caixa. Como a mediana está situada na parte esquerda da caixa, isso quer dizer que os valores
acima da mediana estão mais dispersos do que os valores abaixo da mediana. Isso quer dizer
que o grupo A possui uma distribuição assimétrica positiva (à direita).

Item III  O Box-Plot é um diagrama que não fornece nenhuma informação sobre o número de
dados observados. Não podemos dizer que a afirmativa é verdadeira.

Exercício resolvido sobre Box-Plot:

(FCC - 2012 - TRE SP - Analista – Estatística)


Para analisar a distribuição da renda familiar mensal de dois grupos 1 e 2, considere o desenho
esquemático abaixo que apresenta a distribuição das respectivas rendas em cada grupo.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 44
Estatística Prof.R.Dyodi

Com relação aos diagramas dos dois grupos, verifica-se que:

(A) a distância interquartil do Grupo 1 é igual à distância interquartil do Grupo 2.


(B) o menor valor apresentado pelo Grupo 1 coincide com o menor valor apresentado pelo
Grupo 2.
(C) ambas as distribuições são simétricas.
(D) a amplitude total correspondente aos salários do Grupo 1 supera a amplitude total
correspondente aos salários do Grupo 2.
(E) o módulo da diferença entre as medianas dos 2 grupos corresponde a um valor inferior a
25% do valor da mediana do Grupo 2.

Letra E

Resolução:
Letra A  A distância interquartil é igual à largura da caixa, ou seja, q(0,75) – q(0,25). A
distância interquartil do grupo 1 é aproximadamente igual a (5500 – 3000) = 2500. Por sua vez,
a distância interquartil do grupo 2 é igual a (5000 – 3000) = 2000. Afirmativa falsa.

Letra B  Quando o item diz “menor valor”, devemos considerar toda a extensão do Box-Plot,
ou seja, os limites superior e inferior devem estar incluídos na análise. Assim, como o limite
inferior do grupo 2 é menor que o do grupo 1, a afirmativa é falsa.

Letra C  O grupo 1 possui uma distribuição assimétrica negativa (à esquerda), uma vez que
os valores abaixo da mediana estão mais dispersos que os valores acima da mediana. A
afirmativa é falsa.

Letra D  Como devemos levar em conta os limites inferior e superior, conclui-se facilmente
que a amplitude do grupo 1 é menor que a do grupo 2. Afirmativa falsa.

Letra E  A mediana do grupo 1 é aproximadamente igual a 4500 e a do grupo 2 é igual a


4000. A diferença é igual a 500. Como a mediana do grupo 2 é igual a 4000, 25% deste valor é
igual a 1000. Afirmativa verdadeira.

Exercício resolvido sobre box-plot:

(FCC - 2010 - TRT 9a - Analista – Estatístico)

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 45
Estatística Prof.R.Dyodi

Para comparar os lucros de dois grupos de empresas, I e II, foram preparados desenhos
esquemáticos com os valores observados dos lucros, em milhões de reais, representados
abaixo.

Analisando estes diagramas, observa-se que

(A) o menor lucro apresentado pelas empresas do grupo I é 1,0 milhão de reais.
(B) a distribuição dos lucros dos dois grupos de empresas são simétricas.
(C) a distância interquartil do grupo I é superior à distância interquartil do grupo II.
(D) o número de empresas do grupo II é menor que o número de empresas do grupo I.
(E) o valor da mediana do grupo I é superior ao valor da mediana do grupo II.

Letra C

Resolução:

Mais uma vez a banca tentando fazer uma pegadinha sobre box-plot.
Já sabemos que devemos analisar não só a caixa, mas também as retas ligadas na caixa.

Alternativa A: percebe-se claramente que o menor lucro apresentado é menor do que 1 milhão,
pois a reta ligada à caixa do grupo I está abaixo deste nível.

Alternativa B: a distribuição de ambos os grupos não é simétrica. No grupo I, as retas ligadas à


caixa possuem tamanhos diferentes. No grupo II, a reta no meio da caixa não está exatamente
no meio da caixa.

Alternativa C: perfeito. a distância interquartil é a distância entre . Em exercícios de box-


plot, basta sabermos que esta distância representa a largura da caixa.

Alternativa D: um gráfico de box-plot não nos diz nada sobre média e nem sobre número de
elementos.

Alternativa E: a mediana é representada pela reta no meio da caixa. Percebe-se que ela é igual
nos dois grupos.

1.8. Variância Conjunta

A FCC, de vez em quando, cobra questões sobre variância conjunta (concurso de 2010
para o cargo de APOF, por exemplo). Vamos entender o que é este “troço”, pois é um tipo de
questão que, se cair, você deve matar em 1 minuto no máximo!

Suponha que você tenha em mãos a análise da média e variância de 2 grupos A e B:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 46
Estatística Prof.R.Dyodi

Média Variância nº de elementos

Grupo A

Grupo B

Agora, suponha que se deseja unir estes 2 grupos, isto é, todos farão parte do mesmo
grupo, não existindo mais grupos A e B. Qual será a nova variância do grupo? Este é o cálculo
da variância conjunta!

Quando as médias dos 2 grupos forem iguais, basta fazermos um cálculo da média
ponderada das respectivas variâncias:

Se as médias dos 2 grupos não forem iguais, pule o exercício, pois as contas tomarão
um pouco do seu precioso tempo. Além disso, só vi este tipo de questão numa prova do
BACEN em 2006 e que eu nem coloquei no material. Se você estiver muito curioso, mande-me
um email ou me procure pessoalmente que eu explico a resolução. Digo isto porque como a
variância conjunta já não é muito cobrada, então imagine variância conjunta com médias
diferentes?! Vamos ver a questão de APOF mencionada?

Exercício resolvido sobre variância conjunta:

(FCC - 2010 - Sefaz SP – APOF)


Em dezembro de 2009, o salário médio dos 100 trabalhadores da empresa Alpha é igual ao
salário médio dos 400 trabalhadores da empresa Beta, ou seja, igual a R$ 2.000,00. Porém, os
coeficientes de variação apresentados para os trabalhadores de Alpha e Beta são iguais a 20%
e 15%, respectivamente. Considerando as duas empresas reunidas, obtém-se que a
correspondente variância é, em ( ) , igual a

(A) 101.840
(B) 102.400
(C) 104.000
(D) 122.500
(E) 125.000

Letra C

Resolução:

Em 1º lugar devemos achar a variância dos 2 grupos separadamente. Como o enunciado


fornece os valores dos coeficientes de variação e das médias, podemos encontrar as
respectivas variâncias facilmente:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 47
Estatística Prof.R.Dyodi

Logo, a variância da empresa Alpha é igual a 160.000.

Logo, a variância da empresa Alpha é igual a 90.000.

Então, utilizando a fórmula da variância conjunta, que nada mais é do que uma média
ponderada das respectivas variâncias, temos que:

Exercício resolvido sobre variância conjunta:

(FCC - 2006 - ARCE - Analista de Regulação – Economia)


Uma administradora de imóveis realizou um estudo sobre todos os imóveis alugados em duas
regiões, A e B, levantando o seguinte quadro:

Observação: Dada uma seqüência de números, o coeficiente de variação é definido como


sendo o quociente da divisão do desvio padrão desta seqüência pela respectiva média
aritmética (diferente de zero).
A variância conjunta de A e B, isto é, a variância dos valores dos aluguéis das regiões A e B
reunidas é, em ( ) , igual a

(A) 20.000,00
(B) 25.000,00
(C) 32.500,00
(D) 40.000,00
(E) 62.500,00

Letra A

Resolução:

Em 1º lugar, devemos calcular a variância das duas regiões:

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 48
Estatística Prof.R.Dyodi

A variância conjunta é calculada fazendo-se a média ponderada entre as duas variâncias.


Assim:

1.9. Média Conjunta

Em 1º lugar, vamos visualizar o problema:

Média nº de elementos

Grupo A

Grupo B

Suponha que queremos unir os dois grupos A e B, de forma que eles se tornem um
único grupo. A média conjunta será a média deste novo grupo.

∑ ∑

Nota-se que a média conjunta é simplesmente a média ponderada entre a média do


grupo A e a do grupo B.

Exercício resolvido sobre média conjunta:

(FCC - 2010 - Sefin RO – Auditor)


A média aritmética de todos os salários dos funcionários em uma repartição pública é igual a
R$1.600,00. Os salários dos funcionários do sexo masculino apresentam um desvio padrão de
R$ 90,00 com um coeficiente de variação igual a 5%. Os salários dos funcionários do sexo
feminino apresentam um desvio padrão de R$ 60,00 com um coeficiente de variação igual a
4%. Escolhendo aleatoriamente um funcionário desta repartição, a probabilidade dele ser do
sexo feminino é igual a

(A)1/2
(B)1/3
(C)3/4
(D)3/5
(E)2/3

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 49
Estatística Prof.R.Dyodi

Letra E

Resolução:

Sabemos que o exercício é de média conjunta porque o enunciado fornece a média dos
salários de toda a repartição e depois fornece informações sobre dois grupos segregados
dessa repartição.

Os dados do enunciado foram:

Grupo dos homens:

e  

Grupo das mulheres:

e  

Vamos chamar a média dos homens de e a média das mulheres de , a partir de agora.

Para resolver a questão, precisamos descobrir qual a proporção de homens e mulheres na


repartição. Então, utilizaremos a fórmula da média conjunta, que nada mais é do que uma
média ponderada desses salários:

Assim:

Como devemos interpretar o resultado acima?

É simples: primeiro some o numerador com o denominador, que é igual a 3; depois observe
linha a linha. No caso acima, de cada 3 pessoas, duas são mulheres e uma pessoa é homem.

Portanto, o nosso gabarito é a letra E.

Rua Basílio da Gama, 98 (próximo ao metrô República)


Tel. (11) 3159-0404 - www.uniequipeconcursos.com.br Página 50

Potrebbero piacerti anche