UCA001 Estatistica FICHA Web

ESTATÍSTICA
Edina Domingues
José Tadeu de Almeida
José André Mota de Queiroz
Rafael Botelho Barbosa
ESTATÍSTICA
Reitor Prof. Celso Niskier
Pro-Reitor Acadêmico Maximiliano Pinto Damas
Pro-Reitor Administrativo e de Operações Antonio Alberto Bittencourt
Coordenação do Núcleo de Educação a Distância Viviana Gondim de Carvalho
Redação Dtcom
Análise educacional Dtcom
Autoria da Disciplina Edina Domingues, José Tadeu de Almeida, José André Mota de Queiroz,
Validação da Disciplina Manuel Martins
Designer instrucional Milena Rettondini Noboa
Banco de Imagens Shutterstock.com

Produção do Material Didático-Pedagógico Dtcom
Dados Internacionais de Catalogação na Publicação (CIP)

(Ficha catalográfica elaborada pela Dtcom. Bibliotecária – Andrea Aguiar Rita)
D671e
Domingues, Edina
Estatística/ Edina Domingues, José Tadeu de Almeida, José André Mota de

Queiroz, Rafael Botelho Barbosa. – Curitiba: Dtcom, 2017.
158 p.
ISBN: 978-85-93685-07-1
1. Análise. 2. Estatística. 3. Censo
CDD 653.314
© Copyright 2017 da Dtcom. É permitida a reprodução total ou parcial, desde que sejam respeitados os
direitos do Autor, conforme determinam a Lei n.º 9.610/98 (Lei do Direito Autoral) e a Constituição Federal,
art. 5º, inc. XXVII e XXVIII, “a” e “b”.
Sumário
01 Estatística descritiva e indutiva e conceitos básicos......................................................... 7

02 Método estatístico e técnicas de amostragem ................................................................14
03 Apresentação de dados estatísticos...................................................................................22
04 Distribuição de frequências por intervalo e pontos..........................................................29
05 Histogramas e polígonos.......................................................................................................36
06 Medidas de tendência central: média, moda e mediana.................................................44
07 Medidas de posição: separatrizes........................................................................................51
08 Medidas de dispersão: desvio médio e desvio padrão....................................................59
09 Coeficiente de variação e propriedades..............................................................................67
10 Assimetria.................................................................................................................................74
11 Experimentos aleatórios, espaço amostral e evento.......................................................83
12 Probabilidade: eventos complementares, eventos independentes, eventos
mutuamente exclusivos.........................................................................................................90
13 Probabilidade condicional e regra do produto, regra da adição.....................................97

14 Variáveis aleatórias e distribuições de probabilidade................................................... 105
15 Distribuição normal da probabilidade.............................................................................. 113
16 Correlação linear simples e coeficiente de correlação e covariância........................ 122
17 Regressão linear................................................................................................................... 130
18 Amostragem.......................................................................................................................... 139
19 O uso das tecnologias como ferramenta da estatística............................................... 146
20 Aplicação da estatística em diferentes setores............................................................. 153
TEMA 1
Estatística descritiva e
indutiva e conceitos básicos
Édina Domingues e José Tadeu de Almeida
Introdução
Você sabia que a Estatística vai muito além das representações de tabelas e gráficos? Nesta
aula, você ampliará seus conhecimentos sobre o tema. Para isso, estudaremos a definição de
Estatística, seus aspectos históricos e conceitos fundamentais.
Objetivos de aprendizagem
Ao final desta aula, você será capaz de:
•• conhecer os conceitos básicos de Estatística;

•• diferenciar a Estatística Descritiva da Indutiva.
1 Introdução à Estatística
A Estatística é uma ciência que se utiliza de metodologias para explicar fenômenos. Por meio
dela, dados pesquisados e coletados permitem a comparação, analise e interpretação de diferen-
tes situações, que contribuem para a compreensão de um determinado evento.
Segundo Crespo (2011, p. 03), “a Estatística é uma parte da Matemática Aplicada que fornece
métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização
dos mesmos para tomada de decisões”.
Figura 1 – Estatística
Fonte: TaLaNoVa/Shutterstock.com
– 7 –
ESTATÍSTICA
EXEMPLO
Ao pesquisar preços, condições de pagamento e taxas de juros para a compra de
um bem, você coleta dados, analisa, compara e, assim, toma sua decisão, certo?
Estas ações fazem parte das técnicas da Estatística.
2 Aspectos históricos
A história da Estatística acompanha a evolução do homem. No Império Romano, por exemplo,
eram realizados levantamentos sobre a população. Porém, apenas no século XVIII a Estatística passou
a ser considerada como ciência, quando o matemático Godofredo Achenwall (1710-1772) sistematizou
processos para organizar os bens e cidadãos de um Estado, e organizou-os para criar um novo ramo
científico, com o nome Staatenkunde, que mais tarde passou a ser conhecida por Statistic (em portu-
guês, Estatística), determinando seus objetivos e suas relações com as ciências (MEMÓRIA, 2004).
FIQUE ATENTO!
Note que o termo Estatística tem uma raiz no latim status, ou seja, Estado. Neste
sentido, temos que sua vocação inicial em termos de uma disciplina analítica pos-
sui raízes na coleta e sistematização de dados para a organização do Estado e seu
controle, por meio dos sistemas de governo.
Figura 2 – Censos Demográficos
Fonte: Festa/Shutterstock.com
FIQUE ATENTO!
Em países e locais onde o registro dos habitantes não era feito por meio civil, como
nos cartórios, o número era calculado a partir do registro de batismos das igrejas
(FERREIRA & OLIVEIRA, 2013).
– 8 –
ESTATÍSTICA
Atualmente, a Estatística desempenha um papel fundamental para tomada de decisões e

estudo de fenômenos, tanto no âmbito empresarial quanto político, social, entre outros, sobretudo
na administração pública. No Brasil, a contagem da população, por meio do Censo, é feita desde o
Século XIX (BOTELHO, 2005).
SAIBA MAIS!
Para aprofundar seus conhecimentos sobre o Censo no Brasil, com informações
históricas e dados sobre o último Censo, de 2010, acesse: <http://7a12.ibge.gov.br/
sobre-o-ibge/o-que-e-censo.html>.
3 Conceitos
A Estatística faz parte do nosso cotidiano. Assim, os estatísticos utilizam conceitos e
termos específicos, apresentados no quadro a seguir, com importantes temas discutidos pela
Estatística moderna.
Tabela 1 – Conceitos fundamentais de Estatística
Termo Conceito Exemplo
Ao realizarmos uma pesquisa em

Universo ou Conjunto formado por todos os elementos que uma escola, o universo será todos os
população possuem uma determinada caraterística a ser alunos que estudam na escola, pois
estatística catalogada e analisada. possuem a caraterística ou condi-
ção de serem alunos da escola.
Em uma pesquisa envolvendo alu-

É um subconjunto do conjunto universo, ou seja, nos do Ensino Médio brasileiro,
é uma fração da população estatística, que ser- como trata-se de um número muito
Amostra
ve como parâmetro para deduzir o comporta- vasto de alunos, opta-se por pesqui-
mento de toda a população. sar grupos representativos de estu-
dantes, ou seja, por uma amostra.
É qualquer evento que se pretenda analisar, cujo O número total de presidiários e o

Fenômeno
estudo seja passível da aplicação de uma técnica número de presidiários por grupo
estatístico
estatística, como médias gerais e por população. de cem mil habitantes no Brasil.
Para o exemplo anterior, calcula-se

Dados São as informações coletadas durante a realiza-
o número total de presidiários e o
estatísticos ção de uma pesquisa.
número total de habitantes do Brasil.
– 9 –
ESTATÍSTICA
Termo Conceito Exemplo
Dados coletados que podem ser classificados de

Qualitativas: gênero; cor de cabelo;
acordo com seus atributos, isto é, podem ser clas-
religião etc.
sificados em variáveis qualitativas (que não são
Variável Quantitativas: quantidade de filhos;
expressas numericamente, baseando-se em ca-
quantidade de geladeiras que pos-
racterísticas da amostra) e quantitativas (que po-
sui cada família; idade; peso etc.
dem ser descritas numericamente pela amostra).
É o levantamento e análise de dados estatísti- Censo demográfico;

Censo cos relacionados a uma determinada popula- Censo escolar;
ção (não necessariamente humana). Censo Agropecuário.
Fonte: adaptado de BUSSAB & MORETTIN (2010).
Como podemos observar, há diferentes categorias e elementos que compõem uma análise
estatística. No quadro, vimos apenas alguns conceitos e técnicas aplicadas pela Estatística para
observação, análise e avaliação de um fenômeno estatístico e da evolução das populações.
4 Estatística Descritiva
A Estatística pode ser classificada em dois blocos de pesquisa, no que diz respeito à obser-
vação dos fenômenos estatísticos, da avaliação das amostras e deduções gerais: a Estatística
Descritiva e a Estatística Indutiva. Esta divisão nos permite realizar análises de diferentes tipos de
populações e amostras, visando obter referências sobre o fenômeno estatístico a ser discutido.
A Estatística Descritiva permite a realização da descrição dos fenômenos de forma resumida. Ela é
considerada como a etapa inicial de uma pesquisa, tendo como meta observar e descrever fenômenos
da mesma natureza, coletando, organizando e classificando dados numéricos, apresentado gráficos
e tabelas dos dados observáveis e realizando cálculos de coeficientes (BUSSAB & MORETTIN, 2010).
Segundo Crespo (2011), a Estatística Descritiva é composta das seguintes fases:
•• definição do problema: o pesquisador definirá o problema a ser estudado e analisará

outros estudos realizados sobre o tema. Caso não existam, o pesquisador deverá for-
mular o problema com base em seu conhecimento;
EXEMPLO
Uma empresa que produz cerâmicas percebe que a cada 10 mil peças produzidas,
10% apresentam falhas. Assim, para analisar todas as etapas da produção e en-
contrar as possíveis causas dos erros, a empresa contratou um pesquisador. Neste
caso, o erro na produção das cerâmicas é o problema a ser identificado.
– 10 –
ESTATÍSTICA
•• planejamento: nesta fase, determina-se o procedimento necessário para resolver o pro-

blema, obtendo-se informações sobre o objeto de estudo e verificando quais os cami-
nhos a seguir para obter informações sobre o objeto de estudo. Aqui, organiza-se o
cronograma de atividades, estipulando prazos e selecionando as fontes bibliográficas;
•• coleta de dados: este passo é considerado como operacional, pois envolve a coleta das
informações e o registro sistemático dos dados primários (informações obtidas pelo próprio
pesquisador) ou secundários (dados provenientes de outras fontes ou pesquisadores). A
coleta de dados pode ocorrer de duas maneiras diferentes: direta ou indireta. A coleta direta
é gerada a partir de uma fonte direta de pesquisa, como no caso do Censo (entrevistas rea-
lizadas junto aos indivíduos). Já a coleta indireta é realizada por dados de outras pesquisas;
•• apuração de dados: nesta etapa, o pesquisador realiza a tabulação dos dados brutos,
ou seja, conta e organiza os dados coletados;
•• apresentação de dados: os dados deverão ser organizados em tabelas e gráficos:
•• apresentação tabular: os dados são organizados em linhas e colunas, de forma orde-

nada, de acordo com normas fixadas pelo Conselho Federal de Estatísticas (CONFE);
FIQUE ATENTO!
O Conselho Nacional de Estatística (CONFE) regulamenta a profissão de estatístico.
•• Apresentação gráfica: os dados são sistematizados de forma a gerarem diferentes cate-

gorias de análise (para o caso da população, por exemplo, categorias como habitantes
de zero a cinco anos, de cinco a dez anos etc.), possibilitando, assim, serem descritos de
maneira ilustrativa, por meio de diferentes tipos de gráficos (barras, colunas, linhas etc.);
Figura 3 – Gráficos
Fonte: Scanrail1/Shutterstock.com
– 11 –
ESTATÍSTICA
SAIBA MAIS!
As técnicas da Estatística são aplicadas em outras áreas do conhecimento. Confira
o trabalho de Carlos Augusto de Medeiros, do Ministério da Educação (MEC),
acesse: <http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>.
Portanto, a Estatística Descritiva representa a etapa inicial da análise, objetivando a descrição

dos dados coletados e utilizando tabelas e gráficos para apresentar os resultados analisados.
5 Estatística Indutiva
A Estatística Indutiva refere-se ao processo de generalização das conclusões que o pesquisa-
dor faz a partir dos resultados obtidos, ou seja, ele infere as propriedades da parte para o todo, da
amostra à população (BUSSAB & MORETTIN, 2010).
O processo da indução não é exato, pois o pesquisador pode cometer erros ao selecionar uma
amostra. Para a Estatística Indutiva, recomenda-se que o pesquisador use técnicas de amostragem,
para que as amostras garantam a representatividade da população estudada. Estas técnicas são:
•• amostragem não probabilística: a seleção de amostra baseia-se nas decisões do

pesquisador;
•• amostragem probabilística: a seleção de amostra não depende do pesquisador e é aleató-

ria. Por exemplo, quando um pesquisador decide investigar quantas vezes o valor “quatro”
é obtido em uma série de lançamentos de dados, cujos resultados serão catalogados.
6 Diferenças entre a Estatística Descritiva e a Indutiva

A Estatística Descritiva opera com dados e observações bem determinadas, visando estabe-
lecer relações e aplicações de técnicas de pesquisa sobre estes dados, como médias, distribuição
por classes, entre outros. Para a Estatística Indutiva, o foco reside sobre o tipo e a qualidade da
amostra, para que se possa fazer um esforço de análise desta amostra para a população geral, que
não pode ser visualizada naquele momento.
Por exemplo, o IBGE (Instituto Brasileiro de Geografia e Estatística) realiza Censos de toda a
população a cada dez anos. Porém, este órgão acompanha, anualmente, a evolução da população e
outras características (emprego, renda, padrões de consumo), por meio da PNAD (Pesquisa Nacio-
nal por Amostra de Domicílios), que coleta informações sobre uma fração da população geral.
– 12 –
ESTATÍSTICA
Fechamento
Nesta aula, você teve a oportunidade de:
•• conhecer o termo Estatística;

•• conhecer os principais conceitos utilizados na Estatística;
•• compreender o que é a Estatística Descritiva e Indutiva.
Referências
BOTELHO, Tarcísio. Censos e construção nacional no Brasil Imperial. Tempo Social, v. 17, n. 1, p. 321-
341, 2005. Disponível em: <http://www.scielo.br/pdf/ts/v17n1/v17n1a13.pdf>. Acesso em: 10 jan 2017.
BRASIL. Instituto Brasileiro de Geografia e Estatística (IBGE). O que é Censo. Disponível em

<http://7a12.ibge.gov.br/sobre-o-ibge/o-que-e-censo.html>. Acesso em: 10 jan 2017.
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
CHAER, Galdino; DINIZ, Rafael Rosa Pereira; RIBEIRO, Elisa Antônia. A técnica do questionário na
pesquisa Educacional. Evidência. v. 7, n. 7, Araxá, 2011. p.251-266. Disponível em:<http://www.
uniaraxa.edu.br/ojs/index.php/evidencia/article/view/201/187>. Acesso em 10 jan 2017.
COSTA NETO, Pedro Luiz. Estatística. 3.ed. São Paulo: Blucher, 2002.
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. Saraiva: 2011.
LARSON, Ron. Estatística aplicada. 2. ed. São Paulo: Prentice Hall, 2007.
MEDEIROS, Carlos Augusto de. Estatística Aplicada à Educação. Brasília: Universidade de Bra-
sília, 2007. Disponível em <http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>.
Acesso em 10 jan 2017.
MEMÓRIA, José Maria Pompeu. Breve História da Estatística (Texto para Discussão 21). Brasília:
Embrapa Informação Tecnológica, 2004. Disponível em: <https://www.ime.usp.br/~rvicente/JMP-
Memoria_Historia_Estatistica.pdf>. Acesso em: 10 jan 2017.
FERREIRA FILHO, Aurelino José; OLIVEIRA FILHO, Pedro Affonso. Registros eclesiásticos e car-
toriais, fontes e documentação: possibilidades, perspectivas e desafios para as pesquisas em
escravidão no Brasil – Triângulo Mineiro – MG. Anais do XXVII Simpósio Nacional de História
da ANPUH (Associação Nacional de Pós-Graduação em História), Natal, 2013. Disponível em:
<http://www.snh2013.anpuh.org/resources/anais/27/1370111961_ARQUIVO_REGISTROSECLE-
SIASTICOSECARTORIAIS.pdf>. Acesso em: 10 jan 2017.
TOLEDO, Geraldo; OVALLE, Ivo Izidro. Estatística Básica. São Paulo: Atlas, 2014.
– 13 –
TEMA 2
Método estatístico e
técnicas de amostragem
Édina Domingues e José Tadeu de Almeidaa
Introdução
A observação e a coleta de informações a partir de fenômenos são ações inerentes à Esta-
tística. Elas são utilizadas para resolver problemas e para compreender fenômenos, portanto, a
Estatística exerce um papel fundamental para todas as áreas do conhecimento.
Nesta aula, estudaremos técnicas que permitem a manipulação dos dados relacionados a
um fenômeno estatístico e como estes dados permitem a dedução, por meio da análise estatís-
tica, dos resultados de uma pesquisa.
•• conhecer os métodos estatísticos e suas fases;

•• identificar as técnicas de amostragem e de arredondamento.
1 Método estatístico
No âmbito dos métodos científicos, entendidos como um conjunto de meios para se obter
um resultado (CRESPO, 2011), podemos enfatizar dois tipos: o método experimental e o método
estatístico. O método experimental consiste na aplicação de uma série de procedimentos, que
ocorrem geralmente em laboratórios, cujo objetivo é realizar o controle dos referenciais de pes-
quisa envolvidos e suas variações.
SAIBA MAIS!
O método experimental é muito utilizado na área da saúde, em que se elege uma
referência de pesquisa (comportamento de cobaias mediante o uso de uma
determinada medicação).
Já no método estatístico os procedimentos estão pautados nas Teorias das Probabilidades,

que estabelecem relações de causa e efeito de diferentes situações da sociedade, ou de uma
população qualquer, registrando possíveis variações e probabilidades de ocorrência de certos
eventos. Assim, coletam-se dados que representam uma população, e, a partir desta amostra, são
obtidos resultados e possíveis variações de resultados que passam por análises.
– 14 –
ESTATÍSTICA
Figura 1 – Pesquisador
Fonte: Pressmaster/Shutterstock.com
EXEMPLO
Quando o seu médico lhe pede um hemograma, o técnico de laboratório retira uma
pequena fração do seu sangue e envia para análise. Assim, os resultados obtidos
são analisados pelo médico.
1.1 Fases do método estatístico

De acordo com Crespo (2011), as fases do método estatístico são compostas por:
•• definição do problema: ocorre ao se estabelecer um problema, uma hipótese de pesquisa;

•• planejamento: dado pela escolha das técnicas de pesquisa e ferramentas apropriadas
para a obtenção dos indicadores pretendidos (como médias, por exemplo);
•• coleta de dados: envolve o levantamento de informações que serão posteriormente
catalogadas e serão a base para uma pesquisa.
•• apuração dos dados: separação e catalogação em variáveis específicas, como faixas
etárias de uma população, por exemplo;
•• apresentação dos dados: dá-se por meio da catalogação dos dados apurados em
tabelas e gráficos;
•• análise e interpretação dos dados: ocorre mediante o cálculo de coeficientes e indica-
dores necessários ao esforço de pesquisa.
– 15 –
ESTATÍSTICA
Figura 2 – Base de dados
Fonte: kuruneko/Shutterstock.com
O método estatístico pressupõe a coleta de dados, cuja finalidade é de estabelecer uma base
para estudo e descrição das variáveis que compõem uma análise.
2 Coleta de dados
A coleta de dados consiste na pesquisa de informações necessárias para análise e estudo
de um determinado problema. Para efetivar uma coleta de dados adequada, deve-se definir o tipo
de variável a ser estudada. Uma variável é o referencial que representa uma característica proemi-
nente da base de dados de uma pesquisa.
FIQUE ATENTO!
A variável de pesquisa é definida pelo agente observador, o próprio pesquisador, a

partir de um problema, uma pergunta que ele deseja responder.
Os tipos de coleta de dados são:

•• coleta direta: obtida diretamente a partir da fonte da pesquisa, dividindo-se em:
•• coleta direta contínua: quando a coleta de dados se dá de forma continua, sem
interrupções, em um determinado período (durante um ano, por exemplo, para o
cálculo da pluviosidade mensal de uma região);
•• coleta direta periódica: quando a coleta de dados ocorre em épocas determinadas
(como o Censo, no Brasil, que ocorre a cada 10 anos);
•• coleta direta ocasional: quando a coleta de dados ocorre de forma casual, aten-
dendo a um estudo de uma situação (como o levantamento dos casos de epidemia
do vírus Ebola, na África);
– 16 –
ESTATÍSTICA
•• Coleta de dados indireta: obtida por meio de fontes e bases de dados já registradas em
revistas, jornais, livros, documentos, entre outros. Divide-se em:
•• por analogia: ocorre a partir de outros estudos já realizados, nos quais o pesquisador
identifica e relaciona aspectos de causalidade entre a sua pesquisa;
•• por proporcionalização: quando a coleta ocorre por meio de uma amostra de uma
população, permitindo posteriores generalizações;
•• por indícios: ocorre a partir de situações não factuais, ou seja, pela via de indícios que
levam ao estudo pretendido;
•• por avaliação: ocorre por meio de informações autênticas ou de estimativas cadas-
trais. Assim, a partir destas informações, estima-se a relação quantitativa de um fenô-
meno (CRESPO, 2011).
A coleta de dados é uma das primeiras fases da análise estatística. Com ela, podemos
obter as bases de dados necessárias para um estudo, por meio de amostras ou pelo exame de
toda uma população.
FIQUE ATENTO!
A chamada Estatística Indutiva estuda as características de uma população a partir
de uma amostra, ou seja, permite a generalização por meio de fenômenos observa-
dos na amostra escolhida.
3 Apuração
A apuração de dados associada a uma variável, sobretudo para as variáveis quantitativas,
que podem ser numericamente ordenadas, é o processo por meio do qual o pesquisador irá contar,
manualmente ou por softwares, o número de vezes que a variável pesquisada assumiu um deter-
minado valor, inserindo este determinado número dentro de uma série de dados.
EXEMPLO
Em uma pesquisa para verificar o tamanho da População Economicamente Ativa
(PEA) de um país, ou seja, o número de indivíduos em potencial condição de traba-
lhar, após os dados serem coletados, há a apuração e separação por faixas etárias,
conforme o conceito da PEA deste país: idade - 0 a 18 anos; 18 a 65 anos (PEA); 65
anos em diante (LAMEIRAS, 2013).
A apuração permite que calculemos as porcentagens, as participações de cada variável, em

termos do número de dados observados, em relação à população total. Por exemplo, nas eleições,
os votos são apurados, ou seja, contados e distribuídos entre cada um dos candidatos a um cargo
eletivo (CRESPO, 2011).
– 17 –
ESTATÍSTICA
FIQUE ATENTO!
A porcentagem de observações em relação ao total da amostra analisada também

é denominada por frequência (relativa).
4 Técnicas de amostragem
A amostragem é o processo pela qual é determinada a amostra de uma população, uma
vez que quando uma população é composta por um número elevado de elementos, é impossível
a coleta de dados envolvendo todos os seus indivíduos. Esta amostra deve possuir as caracte-
rísticas exigidas na pesquisa para que o estudo torne-se viável (por exemplo, “homens acima de
quarenta anos e de pele clara”, para verificar a incidência de câncer de próstata nesta população),
ou seja, uma amostra deve ser uma parte representativa da população que a originou e a respeito
da qual desejamos realizar inferências.
Há dois métodos para composição de uma amostragem: probabilísticos e não probabilísticos.
Figura 3 – Coleta de dados
Fonte: violetkaipa/Shutterstock.com
•• Métodos probabilísticos: são técnicas de amostragem nas quais os dados são selecio-
nados de maneira totalmente aleatória, de modo que cada unidade da população anali-
sada tenha igual probabilidade de ser escolhida. Por exemplo, um sorteio de 1% da popu-
lação do Brasil pelos dois algarismos finais do seu Cadastro de Pessoas Físicas (CPF).
•• Métodos não probabilísticos: cada elemento do conjunto universo não possui a mesma
oportunidade de escolha, pois dependem do critério e seleção do pesquisador e do perfil
– 18 –
ESTATÍSTICA
da pesquisa (como no caso da seleção de homens de pele clara acima de 40 anos, para
verificar a porcentagem de portadores de câncer de próstata nesta população específica)
(CRESPO, 2011).
SAIBA MAIS!
O IBGE (Instituto Brasileiro de Geografia e Estatística) realiza a PNAD (Pesquisa
Nacional por Amostras de Domicílios), que, pela seleção de uma amostra da
população brasileira, permite avaliar a evolução de seu padrão de vida (ocupação,
renda, consumo etc.) a cada trimestre. Para aprofundar seu conhecimento sobre
a PNAD, acesse: <http://www.ibge.gov.br/home/estatistica/pesquisas/pesquisa_
resultados.php?id_pesquisa=40>.
A compreensão das técnicas de amostragem é importante para a análise estatística, a fim

de que se componham bases de dados confiáveis para a elaboração dos estudos e pesquisas
desejados. Entender estas técnicas permite que os métodos sejam aplicados com precisão,
gerando análises eficientes.
5 Técnicas de arredondamento
Ao realizarmos cálculos estatísticos, é comum encontrarmos valores com diversas casas
decimais, até mesmo milhares ou infinitas; ou as chamadas dízimas periódicas, que são valores
1
que apresentam uma série infinita de algarismos na mesma disposição (como a fração = 0,333... ).
3
Figura 4 – O número “pi” contém trilhões de casas decimais
Fonte: tschitscherin/Shutterstock.com
O conceito de casas decimais, embora usual, não é costumeiramente aplicado em Estatís-

tica. Usa-se o termo algarismo significativo, que consiste no algarismo (ou uma série deles) que
se segue após a vírgula e é diferente de zero, ou seja, o número 3,008, por exemplo, possui um
algarismo significativo após a vírgula.
– 19 –
ESTATÍSTICA
O arredondamento de dados pode acontecer quando:

•• o número tem mais de dois algarismos significativos, se o algarismo do lado posterior
for maior que 5, o arredondamento será feito somando mais uma unidade ao número
da esquerda. Por exemplo, se a dízima periódica (D) for 0,678678..., temos que seu
arredondamento (A) = 0,68;
•• o número for menor que 5, o arredondamento será desprezando os números posterio-
res. Por exemplo, D = 0,12345345..., temos que A = 0,12.
Porém, se o algarismo de referência for 5, as regras mudam:

•• caso qualquer algarismo que venha após o algarismo 5 for diferente de zero, acrescen-
ta-se uma unidade ao algarismo à esquerda. Por exemplo: 0,8250002, torna-se 0,83.
•• se ao algarismo 5 não seguirem outros algarismos, ou eles forem zero, só se aumenta
uma unidade ao algarismo à esquerda do algarismo 5 se ele for ímpar.
•• Exemplos:
•• 25,650000 passa a 25,6;
•• 78,750000 passa a 78,8.
As técnicas de arredondamento permitem uma descrição de dados mais resumida e efi-

ciente, tornando menos exaustiva a sua apresentação final, e permitem que os cálculos matemá-
ticos sejam, quando possível, simplificados, disponibilizando apenas as informações necessárias
à pesquisa em seu estágio final (CRESPO, 2011).
Fechamento
•• verificar que o método estatístico propõe o planejamento e a coleta de dados visando
sua apuração, análise e interpretação;
•• compreender como são realizadas as técnicas de obtenção de amostras de uma população;
•• conhecer os métodos para arredondamento de valores com muitos algarismos.
Referências
BRASIL. Instituto brasileiro de geografia e estatística (IBGE). Pesquisa Nacional por Amostras
de Domicílios (PNAD). Disponível em: <http://www.ibge.gov.br/home/estatistica/pesquisas/
pesquisa_resultados.php?id_pesquisa=40.>. Acesso em: 11 jan. 2017.
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. Saraiva: 2011.
LAMEIRAS, Maria Andréia Parente. Efeitos da população economicamente ativa sobre a taxa de
desemprego. Carta de Conjuntura – Instituto de Pesquisa Econômica Aplicada (ipea). dez. 2013.
Disponível em: <http://repositorio.ipea.gov.br/bitstream/11058/4309/1/Carta_Conjuntura_n21_
efeitos.pdf.>. Acesso em: 17 jan. 2017.
– 20 –
ESTATÍSTICA
– 21 –
TEMA 3
Apresentação de dados estatísticos
José André Mota de Queiroz
Introdução
Nesta aula, estudaremos as formas de apresentação dos dados estatísticos mais usuais.
Para isso, conheceremos como organizar os dados na forma de tabelas, seja na forma bruta, em
porcentagem ou na forma de intervalos com frequências, ou em gráficos, que podem ser de linhas,
colunas, barras, setores, entre outros.
Objetivo de aprendizagem
•• conhecer quais são as diferentes maneiras de apresentar os dados estatísticos.
Bons estudos!
1 Apresentação de dados estatísticos

A apresentação de dados estatísticos é uma ferramenta aplicada para o resumo das informa-
ções contidas nestes dados, evidenciando seus aspectos mais importantes (MARTINEZ, 2015).
Para isso, é indispensável que o pesquisador faça a descrição completa das características mais
marcantes dos dados, para, depois, tomar a decisão de qual ferramenta utilizará no tratamento
estatístico.
Assim, cabe ao pesquisador identificar se os dados são variáveis quantitativas, variáveis
“numéricas”, ou seja, que expressam grandezas matemáticas (que podem ser contínuas ou discre-
tas) ou variáveis qualitativas, que descrevem classificações, atributos ou qualidades (divididas em
ordinal ou nominal) (MARTINEZ, 2015).
FIQUE ATENTO!
Os dados estatísticos podem ser classificados em variáveis quantitativas contínuas

ou discretas e em variáveis qualitativas ordinal ou nominal.
Para classificar as variáveis quantitativas em discretas ou contínuas, basta identificar se o valor

que pode ser contado (variável quantitativa discreta) ou medido (variável quantitativa contínua). Por
exemplo, a quantidade de livros em uma estante é uma variável quantitativa discreta; já a medição
dos níveis de colesterol em dado grupo de pessoas será uma variável quantitativa contínua.
– 22 –
ESTATÍSTICA
Já para diferenciar as variáveis qualitativas em nominal ou ordinal, é necessário identificar

se a ordem dos dados faz diferença. Por exemplo, ao classificar um grupo em fumantes ou não
fumantes, ou se são do sexo masculino ou feminino, ou, ainda, no caso de peças de uma fábrica,
em defeituosas ou não defeituosas chamamos de variável qualitativa nominal; porém, quando
classificamos as pessoas de determinada cidade em classe A, B ou C, ou quanto ao salário que
ganham podemos chamar de variável qualitativa ordinal.
Depois de identificar a natureza dos dados, cabe ao pesquisador organizar os dados brutos.
1.1 Dados brutos

Os dados brutos são aqueles que acabaram de ser coletados, porém, ainda não passaram
por nenhum tratamento estatístico, nem foram organizados para serem apresentados de uma
maneira mais didática, ou seja, de uma forma que facilite a interpretação do leitor das caracterís-
ticas mais marcantes dos dados.
Por exemplo, a quantidade de pessoas que moram nas casas de uma determinada rua foram
assim coletadas:
Quadro 1 – Dados brutos
4 3 2 4 6 2 1 0 4 5
2 3 6 4 3 6 2 1 0 3
1 2 3 4 0 5 0 2 1 0
Fonte: elaborado pelo autor, 2017.
Assim, poderíamos representar os dados brutos em forma de rol (dados apresentados

seguindo uma ordem do menor para o maior – crescente - ou do maior para o menor - decres-
cente). O rol facilita que o menor e maior valor e a amplitude do intervalo dos dados (amplitude é a
diferença do maior para o menor valor do intervalo de dados) seja visualizado na tabela.
Quadro 2 – Dados na forma de rol

0 0 0 0 0 1 1 1 1 2
2 2 2 2 2 3 3 3 3 3
4 4 4 4 4 5 5 6 6 6
Depois de identificar a natureza e computar os dados brutos, cabe ao pesquisador organi-

zá-los em uma tabela.
– 23 –
ESTATÍSTICA
1.2 Organização em tabelas

Na tabela, os dados podem ser inseridos em ordem crescente ou decrescente, o que for
mais conveniente para o pesquisador. Quando se trata de uma série de dados em que sua ordem
é definida pelo tempo, como a quantidade de chuva mensal em uma cidade ao longo do ano, a
organização deve seguir uma ordem cronológica. Além disso, os dados podem ser trabalhados
por porcentagens.
Algumas vezes, é útil conhecer a proporção dos valores situados em um determinado inter-
valo de uma distribuição de frequências em vez do número absoluto. A frequência relativa para um
intervalo é a proporção do número total de observações que nele aparece. Ela é calculada ao divi-
dir-se o número de valores dentro de um intervalo pelo número total de valores na tabela (PAGANO;
GAUVREAU, 2012). Assim, em uma tabela, os dados podem ser apresentados com a frequência
absoluta e a frequência relativa. No exemplo da pesquisa da quantidade de pessoas que moram
em casas de uma determinada rua, os dados seriam apresentados conforme tabela a seguir.
Tabela 1 – Quantidade de moradores nas casas da rua x
Número de Frequências Frequências

pessoas absolutas relativas
0 5 16,7%
1 4 13,3%
2 6 20%
3 5 16,7%
4 5 16,7%
5 2 6,6%
6 3 10%
Total 30 100%
FIQUE ATENTO!
Dados na forma relativa são as variáveis apresentadas na forma de porcentagem,

muito utilizada em tabelas e gráficos.
Além disso, podemos ter uma tabela de dupla entrada, com duas variáveis sendo apresenta-
das. Com a organização dos dados em uma tabela, podemos ter a dimensão de como representar
em um gráfico.
– 24 –
ESTATÍSTICA
EXEMPLO
Na autoavaliação do estado de saúde de pessoas que praticam atividade física (es-
portistas) e de pessoas que não praticam nenhum esporte (sedentários), temos
uma variável qualitativa nominal (esportista, sedentário) e uma variável qualitativa
ordinal (bom, regular e ruim). Assim, os dados seriam apresentados conforme ta-
bela a seguir.
Tabela 2 – Autoavalição do estado de saúde
Bom Regular Ruim Total

Condição número % número % número % número %
Esportista 20 80% 9 90% 0 0% 29 71%
Sedentário 5 20% 1 10% 6 100% 12 29%
Total 25 100% 10 100% 6 100% 41 100%
1.3 Gráficos estatísticos

Os gráficos estatísticos são ferramentas poderosas para descrição de dados, uma vez que
possuem a capacidade de transmitir várias informações ao leitor, em apenas uma figura. Além
disso, quando o gráfico é bem construído, o leitor entenderá as principais características dos
dados com rapidez.
Os gráficos mais utilizados são:
•• Linhas e curvas
São indicados para representar variáveis ao longo do tempo. Para exemplificar, observe
a figura a seguir, que apresenta a quantidade da venda de um carro em cada mês do ano.
Figura 1 - Vendas do carro X em 2016
– 25 –
ESTATÍSTICA
Com os gráficos de linhas, o pesquisador observa os períodos de crescimento e decresci-

mento da série de dados ao longo do tempo, fato que pode ser importante para sua pesquisa.
•• Barras, colunas e de setores

Os gráficos de barras são usados para exibir uma distribuição de frequências para os
dados nominais e ordinais. Neles, as várias “categorias”, nas quais as observações
são classificadas, estão apresentadas ao longo de um eixo horizontal. Além disso, a
barra vertical represente a frequência, ou a frequência relativa, das observações dentro
daquela classe. As barras devem ser de igual largura e separadas uma da outra de
modo a não implicar continuidade (PAGANO; GAUVREAU, 2012).
Figura 2 – Gráfico de colunas
Fonte: elaborada pelo autor, 2017.
Há, ainda, uma variação do gráfico de barras, no qual o eixo é das categorias aparece na ver-
tical, conforme figura a seguir.
Figura 3 – Gráfico de barras
– 26 –
ESTATÍSTICA
O gráfico de setores descreve uma variável qualitativa, de preferência nominal. Ele tem a
forma de um círculo dividido em setores, sendo que cada área representa uma classe da variável
de interesse. A área de cada setor é proporcional à frequência relativa da classe que ele representa
(MARTINEZ, 2015).
Figura 4 – Gráfico de setor
FIQUE ATENTO!
Para um mesmo conjunto de dados, podemos construir gráficos de colunas, barras
ou setores. Porém, para uma variável qualitativa ordinal, o mais indicado é o gráfico
de barras, pois possibilita observar a ordem das categorias.
Nos gráficos há, ainda, a possibilidade do pesquisador trabalhar com os valores relativos, ou
seja, em porcentagem. Para a transformação dos dados reais em valores relativos, basta fazer
uma regra de três simples.
EXEMPLO
Nos valores reais representados nos gráficos da classificação do peso (subpeso,
peso normal, sobrepeso e obesidade) de 960 alunos de uma escola, vimos: subpe-
so (130); peso normal (430); sobrepeso (330); obesidade (70); e total (960). Assim,
para encontrar a porcentagem dos dados, como “subpeso (130)” do total (960), bas-
ta dividir. Veja:
130 430
subpeso = = 14% peso normal = = 45%
960 960
330 70
sobrepeso = = 34% obesidade = = 7%
960 960
– 27 –
ESTATÍSTICA
SAIBA MAIS!
No link a seguir, você encontrará uma ferramenta que permite a visualização de

gráficos de barras e de setores: <http://m3.ime.unicamp.br/recursos/1222>
Os gráficos podem, ainda, serem feitos em 3D. Há vários programas, gratuitos e pagos, que
constroem os gráficos a partir da inserção de dados. Uma das opções é o Excel, da Microsoft Office
(que também funciona como uma planilha de cálculo). Como opções gratuitas, há o Calc da Open
Office, que funciona em plataforma Linux e Windows, e o R, modelo mais complexo que os outros,
porém mais completo.
SAIBA MAIS!
Para saber mais sobre o programa R, como instalar e tutoriais visite:

<https://www.r-project.org/>.
Fechamento
•• conhecer a classificação de variáveis estatísticas: qualitativa e quantitativa;

•• conhecer a diferença de dados brutos e rol;
•• conhecer várias formas de representação gráfica de um conjunto de dados.
Referências
CRESPO, Antônio. Estatística fácil. 18. ed. São Paulo: Editora Saraiva, 2005.
LAPPONI, Juan Carlos. Estadística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2008.
LEVINE, David et al. Estatística. Teoria e Aplicações. 6. ed. São Paulo: LTC, 2008.
MARTINEZ, Edson Zangiacomi. Bioestatística para cursos de graduação da área da Saúde. São
Paulo: Blucher, 2015.
PAGANO, Marcello; GAUVREAU, Kimberlee. Princípios de Bioestatística. 2. ed. São Paulo: Cen-
gage Learning, 2012.
SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Makron Books, 2004.
STEVENSON, William J. Estatística Aplicada à Administração. São Paulo: Editora Harbra, 2007.
TOLEDO, Geraldo; OVELLE, Ivo. Estatística Básica. 2. Ed. São Paulo: Editora Atlas, 2011.
– 28 –
TEMA 4
Distribuição de frequências por
intervalo e pontos
Introdução
Nesta aula, estudaremos conceitos relacionados à manipulação e distribuição de dados de
uma pesquisa. Para isso veremos, por meio das noções de frequência e classe, como os dados
podem ser organizados de modo a viabilizar análises e gerar maior precisão na apresentação e
possíveis deduções decorrentes de uma análise estatística.
•• entender como é realizada a distribuição de dados por intervalos e pontos.
1 Distribuição de Frequência
A coleta de dados para pesquisa gera informações que precisam ser adequadamente trata-
das, a fim de que seja possível realizar uma análise estatística adequada. Um destes mecanismos
é a separação dos dados coletados por intervalos, agrupando dados com as mesmas característi-
cas dentro de um determinado grupo.
FIQUE ATENTO!
Uma pesquisa estabelece uma hipótese, uma pergunta, que gera uma variável,
que consiste em um conjunto de possíveis resultados de um fenômeno estatís-
tico (CRESPO, 2005). A partir desta variável, coletam-se os dados pertinentes à
análise pretendida.
Para esta aula, adotaremos um exemplo de aplicação. Suponha que foram coletados dados
relacionados ao peso (nossa variável de estudo) de quarenta funcionários de uma empresa, de
maneira aleatória. Os dados foram computados sem organização inicial, gerando a chamada
tabela primitiva.
– 29 –
ESTATÍSTICA
Tabela 1 – Peso dos funcionários

Peso dos funcionários
72 60 89 80 87
61 90 74 80 76
63 82 98 65 56
86 82 89 64 59
83 67 72 85 77
74 73 76 68 75
79 68 74 73 96
71 68 78 89 60
Organizando os dados de maneira simples, ou seja, em função de algum critério específico,

teremos o rol. Neste caso, os pesos dos funcionários foram organizados em ordem crescente.
Acompanhe!
Tabela 2 – Rol de peso dos funcionários
Rol de peso dos funcionários
56 67 73 78 86
59 68 74 79 87
60 68 74 80 89
60 68 74 80 89
61 71 75 82 89
63 72 76 82 90
64 72 76 83 96
65 73 77 85 98
FIQUE ATENTO!
Em um rol, os dados estão organizados para facilitar sua visualização e permitir
algumas considerações iniciais. Esta organização pode ser por ordem crescente
ou decrescente, por exemplo.
Assim, é possível estabelecer alguns referenciais a respeito dos dados coletados. Por exem-
plo, podemos observar que o funcionário de menor peso tem 50 kg e o de maior peso, 98 kg.
A diferença, em quilos, do funcionário de maior peso para o de menor é 98-50 = 48kg. Percebemos,
ainda, que há oito funcionários pesando entre 50 e 59kg, outros oito pesando entre 60 e 69 kg, oito
pesando entre 70 e 79kg, oito com 80 a 89 kg e mais oito com 90 a 99 kg.
– 30 –
ESTATÍSTICA
A nossa variável de pesquisa, no exemplo, é o peso dos funcionários. Neste sentido, podemos
estabelecer as frequências associadas aos dados, ou seja, o número de vezes que um dado (ou
uma série deles) é observada em função de uma variável. Por exemplo, a frequência de funcioná-
rios com o peso de 50 kg tem valor 2, enquanto que o peso de 85 kg tem valor 1. Vejamos, na tabela
a seguir, a distribuição de frequências do peso dos funcionários.
Tabela 3 – Distribuição de frequências de peso

Distribuição de frequências de peso
Peso Freq. Peso Freq. Peso Freq. Peso Freq.
56 1 67 1 76 2 85 1
59 1 68 3 77 1 86 1
60 2 71 1 78 1 87 1
61 1 72 2 79 1 89 3
63 1 73 2 80 2 90 1
64 1 74 3 82 2 96 1
65 1 75 1 83 1 98 1
Há distribuições em que as frequências se associam aos valores observados na variável de

estudo. A tabela anterior demonstra o conceito de distribuição de frequências por pontos. Neste
caso, cada frequência, um número inteiro, está ligada a uma das observações da variável de
estudo (por exemplo, há frequência 3 para o peso de 68 kg, e 2 para o peso de 80 kg).
Na figura a seguir, podemos verificar a distribuição de frequência por pontos dos dados da
tabela anterior.
Figura 1 – Distribuição de frequências por pontos dos dados
0
56 59 60 61 63 64 65 67 68 71 72 73 74 75 76 77 78 79 80 82 83 85 86 87 89 90 96 98
– 31 –
ESTATÍSTICA
Pode-se também agrupar os dados por intervalos, sobretudo em situações nas quais as
amostras são grandes. No exemplo, podemos agrupar os funcionários por faixas de peso, como
entre 50 e 59 kg, 60 e 69 kg e assim por diante, até o maior valor visualizado em nossa amostra.
Tabela 4 – Frequência por intervalos
Frequência por intervalos
Peso Frequência
50 a 59 2
60 a 69 10
70 a 79 14
80 a 89 11
90 a 99 3
Em algumas situações, torna-se conveniente estabelecer intervalos relacionados às frequ-

ências para a melhor visualização do comportamento dos dados relacionados a uma variável.
Por exemplo, identificar que há um funcionário com 51 kg e um com 54 kg é importante, mas, para
o pesquisador, pode ser mais útil saber que oito funcionários pesam de 50 a 59 kg. Este julga-
mento é feito pelo pesquisador na análise estatística.
A tabela anterior, portanto, mostra uma distribuição de frequências por intervalos, associada
a uma variável contínua: o peso dos funcionários. No intervalo “60 a 69 kg”, há infinitas possibi-
lidades de resultados que podem ser incluídos. Assim, as frequências podem ser divididas em
absolutas e relativas. As frequências absolutas dizem respeito aos dados brutos relacionados à
variável de estudo, como na tabela anterior, que apresenta o número de observações associadas
a cada intervalo de classe: a frequência de funcionários com peso entre “70 a 79 kg” é igual a 14,
por exemplo
Já as frequências relativas consistem na divisão percentual dos dados de cada classe em
relação ao total de observações/frequências. Na tabela anterior, podemos verificar as frequências
relativas, uma vez que, na primeira classe, há uma frequência no valor 2 em relação ao total de 40.
Logo, a frequência relativa da primeira classe é de 2/40 = 5%. A segunda classe, por sua vez, tem
frequência relativa de 25%, e a terceira, quarta e quinta classes, respectivamente, têm frequências
relativas de 35%, 27,5% e 7,5%, totalizando 100% das observações.
2 Classe
Quando separamos os dados coletados para uma pesquisa, definimos a variável (como no
exemplo dos pesos dos funcionários) por intervalos e verificamos as frequências, assim, encon-
tramos as classes de frequência (ou classes), que são os intervalos de variação da variável ana-
– 32 –
ESTATÍSTICA
lisada. No caso do exemplo estudado, observamos que o intervalo ‘50 a 59 kg’ é uma classe, e
assim por diante.
A notação para a classe é a letra i, sendo que i = 1,2,3...k (com k representando a última classe
de uma variável) (CRESPO, 2005). No exemplo, temos 5 classes, logo, a última classe é dada
por i = 5.
EXEMPLO
Uma pesquisa salarial da população de uma cidade do interior teve os dados se-
parados, pelo pesquisador, por classes, da seguinte forma: trabalhadores que ga-
nham ‘de um a dois salários mínimos (SM)’; ‘de dois a três SM’, ‘de três a cinco SM’;
‘de cinco a dez SM’; ‘de dez a 50 SM’; e uma classe ‘de 50a 200SM’; Neste caso,
temos seis classes, sendo a última classe representada por i = 6
2.1 Limites de classe

Os limites de classe podem ser entendidos como os pontos extremos de cada classe de uma
variável (CRESPO, 2005). Assim, são definidos pelos pontos mínimo e máximo, respectivamente,
li e Li, para uma classe i. No exemplo que estamos trabalhando no decorrer da aula, que analisa o
peso de um grupo de pessoas (tabelas 1 a 4), a terceira classe da distribuição de frequências tem
o valor l3 = 70 e L3 = 79.
SAIBA MAIS!
Dependendo da variável, o limite superior pode tender ao infinito. Se a última classe
do exemplo mencionado nas tabelas 1 a 4, fosse ‘mais de 90 kg’, o limite superior
da classe tenderia ao infinito, pois não haveria um limite superior da classe. Assim,
caberiam funcionários que pesassem 100 kg, 130 kg, 180kg, 454 kg, ou até o limite
da resistência humana.
2.2 Determinando a amplitude de um intervalo de classe

A amplitude de um intervalo de classe pode ser compreendida pela diferença entre os pontos
máximo e mínimo de um intervalo de classe. Assim, hi = Li – li; em que hi representa a amplitude de
intervalo da classe i.
Recorrendo ao exemplo da tabela de frequências por intervalos, vemos que a segunda classe
tem amplitude igual a 9(69 – 60 = 9). O mesmo ocorre, neste exemplo, para as demais classes,
pois como elas foram divididas de maneira igual, todas com a mesma distribuição de faixas de
peso (50 a 59kg, 60 a 69 kg...), terão amplitude igual a 9.
– 33 –
ESTATÍSTICA
FIQUE ATENTO!
Nem sempre as classes de dados possuem a mesma amplitude. É comum que
pesquisas tragam classes com amplitudes diferenciadas, de acordo com o com-
portamento da amostra. Por exemplo, se analisarmos a renda per capita dos bra-
sileiros, algumas classes terão amplitude maior que outras, para que se observe
melhor a dinâmica dos dados. Convém, por exemplo, usar classes como ‘de zero a
meio salário mínimo (SM)’, ‘de meio a um SM’, ‘de um a dois SM’, ‘de dois a cinco
SM’, ‘de cinco a 10 SM’ e assim por diante. Como boa parte da população estará na
categoria ‘entre zero e dois SM’, os dados serão melhor visualizados, ainda que as
classes não possuam igual amplitude. A PNAD de 2015 mostra que 76,57% da po-
pulação em condições de trabalhar, a chamada População Economicamente Ativa,
recebe de zero a dois salários mínimos, ou não possui rendimentos, incluindo-se
nesta base aqueles que recebem algum tipo de auxílio do governo, como o Progra-
ma Bolsa Família (IBGE, 2016).
3 Calculando a amplitude total da

frequência de dados
Podemos verificar a amplitude total de uma distribuição de frequência observando o ponto
mínimo da primeira classe e o ponto máximo da última classe. Neste caso, a amplitude total (AT)
obedece à seguinte equação:
AT = Lmáx k – lmin1
Assim, a amplitude total é obtida quando subtraímos do limite máximo da última classe, k, o
limite mínimo da primeira classe. Para o nosso exemplo, temos: AT = 99 – 50 = 49.
EXEMPLO
Com base em uma situação hipotética, na qual o pesquisador coletou dados rela-
cionados à renda dos habitantes de uma cidade do interior, e verificou que poderia
estabelecer uma distribuição de frequências baseadas em seis classes: ‘de um a
dois salários mínimos (SM)’; ‘de dois a três SM’, ‘de três a cinco SM’; ‘de cinco a
dez SM’; ‘de dez a 50 SM’; e uma classe, com frequência igual a 1, ‘de 50 a 200SM’,
observaremos que a Amplitude Total da frequência de dados é dada por:
AT = Lmáx 6 – lmin1 = 200 – 1 – 199
Agora, passaremos ao cálculo do ponto médio do intervalo de classe.
– 34 –
ESTATÍSTICA
4 Ponto médio do intervalo de classe

É possível definir o ponto médio (xi) de um intervalo de classe no ponto onde a classe é divi-
dida em duas partes iguais, como se segue:
Li + li
xi =
2
Retomando o exemplo da pesquisa sobre o peso dos funcionários de uma empresa, vamos
calcular o ponto médio da quarta classe, que contém as frequências dos trabalhadores que pos-
suem entre 80 e 89 kg. Assim, temos que: (80 + 89) 169
x4 = = = 84,5.
2 2
SAIBA MAIS!
Um exemplo de aplicação dos conceitos desta aula, no campo de estudos das
Ciências da Saúde, pode ser encontrado no segundo capítulo (em especial, o tópico
2.1) do trabalho de Luís Guillermo Coca Velarde (UFF), acesse: <http://www.uff.br/
poscienciasmedicas/images/arquivos/apostila_estatistica.pdf.>.
Fechamento
Nesta aula, você teve oportunidade de:
•• verificar como os dados coletados em uma pesquisa podem ser separados em

frequências;
•• compreender que frequências podem ser organizadas em classes;
•• conhecer alguns índices de cálculo sobre frequências, como amplitude de classe,
limites de classe, amplitude total e ponto médio de um intervalo de classe.
Referências
BRASIL. Instituto Brasileiro De Geografia e Estatística (IBGE). Síntese de Indicadores da Pesquisa
Nacional por Amostra de Domicílios (PNAD). 2015. Disponível em: <http://www.ibge.gov.br/home/
estatistica/populacao/trabalhoerendimento/pnad2015/sintese_defaultxls.shtm>. Acesso em: 17
jan. 2017.
CRESPO, Antônio. Estatística fácil. 18. ed. São Paulo: Editora Saraiva, 2005.
VELARDE, Luís Guillermo Coca. Noções de Bioestatística. Universidade Federal Fluminense (UFF),
s.d. Disponível em: <http://www.uff.br/poscienciasmedicas/images/arquivos/apostila_estatistica.
pdf>. Acesso em: 15 jan. 2017.
– 35 –
TEMA 5
Histogramas e polígonos
Introdução
Nesta aula, descreveremos algumas formas de apresentação gráfica de dados. A Estatística
Descritiva, por meio de suas metodologias de análise, tem por objetivo realizar deduções e con-
clusões a respeito de determinados fenômenos e sua ocorrência. Assim, a forma correta de sua
expressão torna viável a compreensão precisa de eventos estatísticos. Estudaremos, dentre estas
apresentações, os histogramas e polígonos de frequências.
•• entender o que são histogramas e polígonos de frequências.
1 Histograma
Nesta aula, utilizaremos um referencial de aplicação para os estudos que desenvolveremos.
Para isso, suponha que estamos verificando a altura de um grupo de cinquenta alunos de uma
escola. A partir destes dados, elaboramos uma tabela de distribuição de frequências, que nos
mostra o número de vezes que cada dado é observado dentro de uma classe, sendo a classe
definida pelo intervalo de variação de uma variável (CRESPO, 2005):
Tabela 1 - Frequência por intervalos
Altura Frequência
110 ˫ 114 6
115 ˫ 119 11
120 ˫ 124 6
125 ˫ 129 5
130 ˫ 134 3
135 ˫ 139 5
140 ˫ 144 7
145 ˫ 149 7
– 36 –
ESTATÍSTICA
O histograma pode ser definido como uma forma de apresentação gráfica de dados, organi-
zadas em um conjunto de retângulos dispostos em um gráfico de colunas, de modo que a altura
destes retângulos corresponda à frequência, e os pontos médios coincidam com os pontos médios
dos intervalos de classe.
2 Representação de um histograma
O histograma associado à tabela de frequências por intervalos (ilustrada na figura anterior)
pode ser visualizado a seguir.
Figura 1 – Histograma
14
12 11
10
Frequência
8 7 7
6 6
6 5 5
4 3
2
0
110 ˫ 114 115 ˫ 119 120 ˫ 124 125 ˫ 129 130 ˫ 134 135 ˫ 139 140 ˫ 144 145 ˫ 149
Classes
Você pode perceber que, no histograma, normalmente as classes possuem a mesma ampli-
tude (na figura 1, todas são iguais a 4: 110 a 114, 115 a 119...), de modo que a altura de cada retân-
gulo é proporcional à sua frequência em relação àquela classe. Um histograma permite verificar
com precisão a distribuição de frequências associadas a uma variável, identificando tendências
sobre os dados coletados. No histograma ilustrado, vemos que a amplitude total da frequência
de dados, calculada pela diferença entre o limite superior da última classe e o limite inferior da
primeira classe, tem valor 149 – 110 = 39.
SAIBA MAIS!
Para aprofundar seus conhecimentos, leia o artigo “Utilizando o histograma como
uma ferramenta estatística de análise da produção de água tratada de Goiânia”, dis-
ponível em: <http://estprob.pbworks.com/w/file/fetch/53332540/artigo-histograma-
-capacidade-proc.pdf>.
Por consequência, o ponto que divide as classes em duas partes iguais, com a mesma amplitude,
é dado por ( 2 ) = 129,5. Observamos que mais da metade dos dados está localizada no “lado
149 - 110
esquerdo” do histograma, demonstrando que, dentro da amplitude total da distribuição de frequências,

há mais alunos com menos da metade da altura máxima, definida pelo limite superior da última classe,
uma vez que há 28 alunos com menos de 129,5 cm, e apenas 22 com mais de 129,5 cm.
– 37 –
ESTATÍSTICA
3 Polígono de frequência
O polígono de frequência é uma forma de apresentação gráfica de dados que permite ao
pesquisador observar a frequência de dados de uma variável, por meio de um gráfico em linha.
Ele é obtido na ligação dos pontos formados pelo ponto médio dos intervalos de classe, no eixo
horizontal e as frequências observadas (no eixo vertical) (CRESPO, 2005).
A partir desta avaliação, pode-se também visualizar o comportamento dos dados associados à
variável; se eles tendem mais para a esquerda, para as classes inferiores, ou para a direita nas classes
superiores, ou se são distribuídos proporcionalmente à média das classes, por exemplo. Um polígono
de frequência, ainda, permite a observação da amplitude total da distribuição de frequências.
É importante enfatizar que, para que o polígono (que é uma figura fechada) seja visualizado, é
feito um ‘arremate’ nos seus limites inferior e superior, por meio da ligação dos pontos extremos das
linhas obtidas aos pontos médios das classes anterior à primeira e posterior à última, ou seja, são clas-
ses que não existem em sua tabela, mas são usadas para viabilizar a análise, criando-se o polígono.
FIQUE ATENTO!
Não traz impacto à análise atribuir, nos pontos extremos dos limites das classes,
duas classes que possuam frequência zero, uma vez que uma classe que não exis-
te não tem nenhuma frequência.
4 Representação de um polígono de frequência

Um polígono de frequência associado à tabela de frequências por intervalo (citada no início
da aula) pode ser visualizado na figura a seguir, na qual os pontos médios são representados no
eixo horizontal e as frequências no eixo vertical.
Figura 2 – Polígono de frequência
12
10
0
107 112 117 122 127 132 137 142 147 152
– 38 –
ESTATÍSTICA
Um polígono de frequência permite analisar as tendências de distribuição dos dados e

frequências associados a uma variável de estudo; podemos verificar que os dados coletados
concentram-se na metade inferior (ou esquerda) do plano de frequências, indicando que há uma
concentração de dados abaixo da média relacionada à variável de pesquisa.
5 Polígono de frequência acumulada

Um polígono de frequência acumulada mede as chamadas frequências acumuladas de
dados associados a uma variável, que são a soma das frequências associadas a uma variável de
maneira acumulada, ou seja, trata-se de somas que vão sendo realizadas à medida que são adicio-
nadas classes a este somatório.
EXEMPLO
Utilizando o exemplo que estamos estudando, a frequência associada à primeira
classe (consulte a tabela 1) tem o valor seis. Assim, a frequência acumulada das
classes 1 e 2 é dada por 6 + 11 = 17. Para a terceira classe, o valor da frequência
acumulada é de 17 + 6 = 23, e assim por diante, até que a frequência acumulada da
última classe atinja 100% dos dados, ou seja, 50. Observe a tabela:
Tabela 2 - Frequências acumuladas
Altura Frequência acumulada
109 0
114 6
119 17
124 23
129 28
134 31
139 36
144 43
149 50
O polígono de frequências acumuladas tenderá ao valor máximo no ponto relacionado à

última classe, pois a frequência acumulada será correspondente ao total das frequências, ou 100%
de frequência acumulada. Observe a figura a seguir, relativo ao nosso exemplo.
– 39 –
ESTATÍSTICA
Figura 3 – Gráfico de frequências acumuladas

60
50
40
30
20
10
0
109 114 119 124 129 134 139 144 149
Frequência acumulada
SAIBA MAIS!
Quando há um certo número de classes à direita, com uma frequência baixa,
veremos que o polígono de frequências exibirá uma tendência de tornar-se uma reta.
Isto é comum, por exemplo, quando analisamos os salários da população: como a
parcela de pessoas que ganham altos salários é muito pequena, estas classes têm
uma frequência bastante pequena em relação às classes de salários menores.
A apresentação do polígono de frequências acumuladas é útil para verificarmos as

concentrações das frequências em torno de determinadas classes.
6 Curvas de frequências
Quando analisamos um polígono de frequências, observamos que ele nos traz os dados
brutos associados às frequências. Para amostras e classes pequenas, como as que estamos
utilizando, a tendência é que este polígono apresente arestas bem definidas. Porém, à medida
que a amostra se amplia, estes ‘lados’ do polígono vão tendendo a tornarem-se mais oblíquos,
formando curvas – as chamadas curvas de frequências. A curva de frequências mostra uma
imagem tendencial da série de dados, enquanto o polígono de frequências mostra a imagem real
dos mesmos (CRESPO, 2005).
Esta operação de ‘polimento’ dos dados, ou seja, de remoção das ‘arestas’, é dada adicio-
nando-se frequências àquelas observadas na tabela de distribuição de frequências, conhecidas
como frequências calculadas, que se localizam nos pontos médios das frequências observadas,
de acordo com a equação:
fi-1 + 2fi + fi+1

fci =
4
Em que: fci corresponde à frequência calculada da classe i; fi–1 é a frequência da classe imediata-
mente anterior à classe i, dada por fi; e fi +1 é a frequência da classe imediatamente posterior à classe i.
– 40 –
ESTATÍSTICA
Assim, estamos dividindo quatro frequências por 4, identificando o ponto médio, que corres-
ponde à frequência acumulada.
EXEMPLO
Vamos calcular a frequência calculada da primeira classe (fc1) do exemplo estuda-
do nesta aula (da altura dos cinquenta alunos de uma escola), dada por:
f0 + 2f1 + f2 0 + ( 6 × 2 ) + 11 23
fc1 = = = = 5, 75
4 4 4
Transpondo-se estes cálculos para todas as classes do nosso exemplo, temos a tabela a
seguir.
Tabela 2 - Frequências calculadas (fc) e reais (f)
fc1 5,75 f1 6
fc2 8,50 f2 11
fc3 7,00 f3 6
fc4 4,75 f4 5
fc5 4.00 f5 3
fc6 5,00 f6 5
fc7 6,50 f7 7
fc8 5,25 f8 7
A partir desta tabela, podemos verificar a curva de frequência associada à série de classes.
Figura 4 – Curva de frequência
12
11
10
9
8
7
6
5
4
3
2
100 110 120 130 140 150 160
Freq. reais Freq. calculadas
– 41 –
ESTATÍSTICA
Como o nosso exemplo apresenta uma distribuição de frequências com valores menores nas
classes centrais e maiores nas classes menores e maiores, observa-se que a curva de frequência
apresenta um comportamento em onda, com dois pontos ‘de pico’, um modelo conhecido como
bimodal. Caso os valores mais altos associados às frequências estivessem nas classes centrais, o
gráfico tenderia a ser semelhante a um ‘sino’, com um ponto máximo, apenas. Observe:
Figura 5 – Modelos de curvas de frequência
1 2 3 4 5 6 7
Para simplificar nossa análise, colocamos os diferentes modelos de curvas de frequência em

um mesmo plano. O modelo 1 é chamado de curva simétrica, ou seja, todas as frequências estão
distribuídas de forma equidistante em relação ao ponto máximo.
As curvas 2 e 3 são chamadas de curvas assimétricas, pois as frequências estão distribuídas
de forma diferente ao longo da curva em relação ao ponto de máximo. Neste caso, o sentido do
alongamento da curva determina o viés que ela assume. Dizemos que acurva 2 é enviesada à
direita, e a 3 à esquerda.
As curvas 4 e 5 são chamadas ‘em formato de J’, e resumem distribuições de frequências
muito assimétricas.
FIQUE ATENTO!
Curvas em formato de J são muito usadas na Economia para associar relações
como preços e demanda por mercadorias, por exemplo. No caso, a curva5 ilustra
esta situação, pois quanto maior o preço, no eixo vertical, menor será o consumo,
no eixo horizontal.
A curva 6 configura a chamada ‘curva em U’, que ocorre quando a distribuição de frequências
tem pontos de máximo nas extremidades da curva.
FIQUE ATENTO!
Curvas em U são costumeiramente associadas a equações do 2º grau. Além disso,
elas são utilizadas em Economia, sobretudo para a determinação de certos custos
de produção de bens.
– 42 –
ESTATÍSTICA
Por fim, a curva 7 configura a chamada distribuição retangular, que ocorre quando todas as
frequências são absolutamente iguais. Nesse caso, a razão que demonstra a frequência observada
será sempre uma constante.
Fechamento
•• conhecer alguns métodos de organização de dados por frequências, como histogramas

e polígonos de frequência;
•• entender que a frequência acumulada é dada pela soma das frequências de diferentes
classes, e conhecer as frequências calculadas, como forma de obter uma curva de
frequência.
Referências
CRESPO, Antônio. Estatística fácil. 18. ed. São Paulo: Saraiva, 2005.
KUROKAWA, Edson; BORNIA, Antonio Cesar. Utilizando o histograma como uma ferramenta esta-
tística de análise da produção de água tratada de Goiânia. In: Anais do XXVIII Congresso Interame-
ricano de Engenharia Sanitária e Ambiental, Cancún (México), out. 2002. Disponível em: <http://
estprob.pbworks.com/w/file/fetch/53332540/artigo-histograma-capacidade-proc.pdf>. Acesso em:
24 jan. 2017.
– 43 –
ESTATÍSTICA
TEMA 6
Medidas de tendência central:
média, moda e mediana
Introdução
As medidas de posição são utilizadas para representar e descrever um conjunto de dados. Elas
são divididas em duas categorias: medidas de tendência central e separatrizes. Nesta aula, estuda-
remos as principais medidas de tendência central: média (simples ou ponderada); moda; e mediana.
•• identificar as principais medidas de tendência central;

•• entender como calcular as principais medidas de tendência.
1 Medidas de tendência central

De acordo com Medri (2011), as medidas de tendência central produzem um valor, e, em
torno deste valor, as observações distribuem-se. Assim, os valores das medidas de tendência cen-
tral são utilizados para sintetizar um conjunto de dados.
As principais medidas de tendência central são: média (simples e ponderada); moda; e
mediana. A seguir, estudaremos sobre cada uma das medidas. Acompanhe!
1.1 Média
A média é a soma dos valores de um conjunto de dados dividido pelo número de dados
somados. Ela pode ser dividida em média simples e ponderada.
•• Média simples
De acordo com Duquia e Bastos (2006), a média simples – também chamada de média
aritmética – é a medida de tendência central mais utilizada e melhor compreendida por
todos, devido sua facilidade de cálculo e à utilização em inúmeras situações do coti-
diano. Para calcular a média aritmética, basta somar todos os valores de um conjunto
de dados e dividir pelo número de valores somados.
– 44 –
ESTATÍSTICA
A expressão geral para o cálculo da média simples é:
∑X i
X= i=1
n
Em que:
X é a média simples ou aritmética;

n
∑X
i=1
i é o somatório dos valores X, com X variando de 1 a n, ou seja, estamos somando todos
os valores de X;
n é o número de dados em análise.
EXEMPLO
No conjunto de dados (2, 2, 2, 4, 5), a média simples será calculada somando todos
os valores (2 + 2 + 2 + 4 + 5 = 15) e dividindo pelo número de valores somados (5).
Logo 15/3 = 5. Assim, podemos dizer que a média simples ou aritmética desse
conjunto de dados é 3.
•• Média ponderada
A média ponderada deve ser utilizada quando os dados não possuem a mesma proba-
bilidade de ocorrência, ou seja, é quando há diferenças de pesos (ou frequências) entre
os valores que queremos analisar.
FIQUE ATENTO!
Imagine duas frequências: F1 > F2. Neste caso, a probabilidade de ocorrência do
dado referente a F1 é maior que a probabilidade de ocorrência do dado referente a
F2. Assim, caso tenhamos uma observação que se repita 5 vezes e outra se repita
10 vezes, temos que a probabilidade de ocorrência da segunda observação é maior
que a da primeira.
A expressão geral para o cálculo da média ponderada é:

n
∑ X .f i i
XP = i=1
n
∑f
i=1
i
Em que:
XP é a média ponderada;
– 45 –
ESTATÍSTICA
∑X f
i=1
i i é o somatório dos produtos de cada valor pela respectiva frequência, com i variando de 1 a n.
n é o número de dados em análise;

n
∑f
i=1
i é o somatório das frequências, variando de 1 a n.
EXEMPLO
No conjunto de dados (2, 2, 2, 4, 5), para calcular a média ponderada deve-se mul-
tiplicar cada valor pela sua repetição, e dividir pela soma das frequências. Assim,
tem-se (2 x 3) + (4 x 1) + (5 x 1) = 15. A soma das frequências é dada por 3 + 1 + 1 =
5. Logo, a média ponderada é 15/5 = 3.
Duquia e Bastos (2006) afirmam que a média apresenta algumas vantagens e desvantagens.
Entre as vantagens estão: o fato de que ela considera todos os valores estudados; que é utilizada,
na maioria dos casos, para entender as diferenças entre dois conjuntos de dados; e que é uma
medida de tendência central de fácil entendimento. A desvantagem é que a média é influenciada
por valores extremos (valores muito acima ou muito abaixo da média dos dados). Assim, quando
há valores muito discrepantes, ela não é a medida adequada para representar o conjunto de dados.
Por exemplo, no conjunto (1, 10, 100), a média dos dados é 37. Note que este não é um bom valor
para representar os dados, pois existem dois valores muito distantes (1 e 100).
Além disso, a média é recomendada, preferencialmente, quando a distribuição dos
dados é simétrica.
1.2 Mediana
A mediana é o valor em que metade (50%) dos dados está abaixo dela e metade (50%) está
acima. Assim, para descobrir a mediana, deve-se colocar os dados em ordem crescente, o ele-
mento que ocupar a posição central é a mediana.
Quando o número total de dados é par, a mediana é dada pela média aritmética dos dois
elementos centrais Por exemplo, no conjunto de dados (1, 2, 3, 4), como o número de dados é par,
a mediana é dada pela média dos elementos centrais. Logo, (2+3)/2 = 2,5. Assim, a mediana é 2,5.
Porém, quando o número total de dados é ímpar, a mediana é o elemento central do conjunto de
dados organizados de maneira crescente. Caso uma amostra contenha muitos dados, basta esco-
lhermos o elemento que ocupa a posição ((n+1)/2). Por exemplo, no conjunto de dados (1, 2, 3, 4, 5),
como o número de dados é ímpar, a mediana é o valor 3, pois é o valor central do conjunto de dados.
A figura a seguir mostra como é o comportamento das medidas de tendência central (média,
mediana e moda) quando a distribuição é simétrica ou assimétrica. A distribuição é simétrica quando
existe uma divisão de um conjunto de dados em duas partes iguais, em relação a um ponto central;
e é assimétrica quando estas duas partes não possuem a mesma quantidade de dados.
– 46 –
ESTATÍSTICA
Figura 1 – Distribuição simétrica e assimétrica
Frequência Frequência
Mediana
Média Moda Dados Média = Mediana = Moda Dados
A vantagem da mediana é que não é influenciada por valores extremos (valores muito distan-
tes da média) e pode ser utilizada tanto para distribuições simétricas quanto assimétricas. Entre
as desvantagens, está o fato de ela ser de difícil compreensão e não ser considerada em grande
parte dos testes estatísticos (DUQUIA E BASTOS, 2006).
FIQUE ATENTO!
Lembre-se de que, para calcular a mediana, devemos sempre utilizar os dados em

ordem crescente.
A mediana sempre tenderá a ocupar uma posição central de um conjunto de dados, diferente
da média. Observe a figura a seguir, que apresenta um histograma para uma distribuição simétrica.
Figura 2 – Histograma para distribuição simétrica

001
Density
8.0e -04
6.0e -04
4.0e -04
2.0e -04
0
1000 2000 3000 4000 5000
Peso dos sacos de arroz
Média e mediana
Fonte: Duquia e Bastos, 2006, p. 191.
– 47 –
ESTATÍSTICA
Na figura, percebemos que há uma distribuição simétrica. Neste caso, a média, mediana
e moda apresentam os mesmos valores. Agora, observe a figura 3, em que a distribuição
é assimétrica.
8.0e -04
Figura 3 – Histograma para distribuição assimétrica
Densi
6.0e -04
4.0e -04
2.0e -04
Mediana
0
0 2000 4000 6000 8000 10000
Peso dos sacos de arroz

Média
Fonte: Duquia e Bastos, 2006, p. 191.
No caso da figura 3, temos uma distribuição assimétrica positiva, assim a média é maior do
que a mediana.
SAIBA MAIS!
Para aprofundar seus conhecimentos sobre a assimetria, leia o tópico 6.4 do tex-
to “Análise Exploratória de Dados”, do Professor Dr. Waldir Medri (UEL). Acesse:
<http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_es-
tatistica.pdf>.
1.3 Moda
A moda é o elemento que mais se repete, ou seja, que possui a maior frequência no conjunto
de dados. É possível que um conjunto de dados tenha uma moda (unimodal), duas modas (bimo-
dal), três ou mais modas (multimodal), ou nenhuma moda (amodal).
Para compreender melhor o que é a moda, atende aos exemplos:
•• no conjunto de dados (2, 2, 2, 4, 5), a moda é o elemento que mais se repete. Observe
que o elemento 2 se repetiu 3 vezes, logo ele é a moda. Aqui, então, temos uma única
moda; ou seja, o conjunto de dados é unimodal;
– 48 –
ESTATÍSTICA
•• no conjunto de dados (1, 1, 2, 2, 5), há duas modas, ou seja, dois elementos repetidos.
Logo, é um conjunto bimodal;
•• no conjunto de dados (1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 5), temos três modas (1, 2 e 3), uma vez
que os números foram repetidos três vezes. Logo, trata-se de um caso multimodal (ou
polimodal);
•• no conjunto de dados (2, 4, 5), não há moda, pois nenhum elemento se repetiu mais que
os demais. Trata-se de um conjunto de dados amodal;
FIQUE ATENTO!
A moda considera apenas a frequência de ocorrência das observações. Sendo as-

sim, em geral, não é uma boa medida para se representar um conjunto de dados.
A figura a seguir traz um histograma que mostra a distribuição de um conjunto de dados em

função da frequência. Assim, na figura, o elemento que possui a maior frequência será conside-
rado a moda.
Figura 4 – Histograma de dados
3,0
2,5
2,0
Frequência
1,5
1,0
0,5
0,0
8 9 10 11 12
Dados
Neste caso, identificamos que a moda do conjunto de dados é 10, pois é o elemento que
possui a maior frequência na figura.
– 49 –
ESTATÍSTICA
2 Comparações entre medidas de tendência central

Para decidir qual medida de posição tendência central é mais adequada para um conjunto
de dados, é bastante importante fazer a representação gráfica deste conjunto. Esta representação
pode ser por meio de um histograma, no qual consegue-se verificar se a distribuição é simétrica
ou assimétrica.
Caso a distribuição seja simétrica, tanto a média quanto a mediana quanto a moda apre-
sentarão o mesmo valor. Dessa forma, podemos usar qualquer uma das medidas de posição de
tendência central para representar um conjunto de dados.
No entanto, é muito comum que a distribuição não seja simétrica, e sim assimétrica. Nestes
casos, a média é um valor que sofre grandes influências de valores extremos, assim, não é capaz
de representar de maneira satisfatória um conjunto de dados. Uma alternativa para este caso é
utilizar a mediana, que sempre tende a assumir um valor central de um conjunto de dados (como
observamos na figura 2).
SAIBA MAIS!
Das páginas 82 a 96 do link a seguir, você pode aprofundar seus conhecimentos so-
bre a média, mediana e moda para distribuições simétricas e assimétricas. Acesse:
<http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>.
Fechamento
•• conhecer as principais medidas de tendência central;

•• observar como é o comportamento destas medidas para distribuições simétricas e
assimétricas.
•• aprender a calcular cada uma das medidas de tendência central.
Referências
BRASIL. Ministério da Educação. Estatística aplicada à educação. Brasília, 2007. Disponível em:
<http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>. Acesso em: 07 dez. 2016.
MEDRI, Waldir. Análise exploratória de dados. Universidade Federal de Londrina, Londrina, 2011.
Disponível em: <http://www.uel.br/pos/estatisticaeducacao/textos_didaticos/especializacao_
estatistica.pdf>. Acesso em: 07 dez. 2016.
DUQUIA, Rodrigo Pereira; BASTOS, João Luiz Dornelles. Medidas de tendência central: onde a
maior parte dos indivíduos se encontra? Scientia Medica, 2006.
– 50 –
TEMA 7
Medidas de posição: separatrizes
Introdução
As medidas de posição têm por finalidade representar um conjunto de dados por meio de um
valor. Nesta aula, conheceremos as medidas de posição chamadas separatrizes, bem como suas
principais classificações.
•• identificar as medidas separatrizes.
Bons estudos!
1 Medidas de posição
Por meio da análise das medidas de posição, conseguimos verificar como é a distribuição de
um determinado conjunto de dados. Estas medidas são divididas em medidas de tendência e sepa-
ratrizes. Nesta aula, aprofundaremos nosso conhecimento sobre as separatrizes. Acompanhe!
2 Separatrizes
As separatrizes são medidas de posição que separam um conjunto de dados em “n” partes.
Cada uma destas partes deve conter a mesma quantidade de dados. Assim, caso façamos uma
divisão de um conjunto de 40 dados em 4 partes, cada parte terá 10 dados.
FIQUE ATENTO!
A mediana é uma das separatrizes, visto que separa um conjunto de dados em duas
partes com exatamente a mesma quantidade de dados.
A classificação e nomenclatura das separatrizes dão-se com base no número de divisões fei-
tas. As separatrizes mais conhecidas são: quartil (divisão de um conjunto de dados em 4 partes),
decil (divisão em 10 partes) e percentil (divisão em 100 partes).
– 51 –
ESTATÍSTICA
SAIBA MAIS!
Na seção 4 (p. 109) do texto “Estatística aplicada à educação”, do Ministério da
Educação, você pode aprofundar seus conhecimentos sobre o tema desta aula.
Acesse: <http://portal.mec.gov.br/seb/arquivos/pdf/profunc/estatistica.pdf>.
2.1 Quartil
No quartil, a série de dados será dividida em quatro partes iguais (cada parte contém a
mesma quantidade de dados). Temos, então, 3 quartis denominados Q1,Q2 ,Q3 . Assim, podemos
dizer que 25% dos dados estão presentes dentro de cada quartil; e que 50% dos dados situam-se
até o valor do quartil Q2 (note que o quartil Q2 é a mediana); 75% dos dados situam-se até o valor
do quartil Q3 . Stevenson (2001, p. 22) afirma que
os quartis dividem conjuntos ordenados em 4 partes iguais: 25% dos valores serão inferio-
res ao primeiro quartil ( Q1 ), 50% serão inferiores ao segundo quartil ( Q2 = mediana ), 75%
serão inferiores ao terceiro quartil ( Q3 ) e 25% serão superiores ao terceiro quartil.
De acordo com Crespo (2005), os quartis são valores (o valor de um quartil pode não coincidir
com um valor observado) que dividem o conjunto de dados em quatro partes iguais, conforme
figura a seguir.
Figura 1 – Representação das divisões dos quartis
0% 25% 50% 75% 100%
Q1 Q2 Q3
Os quartis podem ser calculados como:
•• dados não agrupados: quando os dados não estão agrupados em classes (interva-
los de valores). Nestes casos, devemos utilizar a expressão Qi = i ∑ i para calcular
k f
4
os quartis;
EXEMPLO
1 (10)
Considerando os dados (2, 2, 3, 4, 5, 6, 6, 6, 8, 9), temos que Q1= =2,5 ; Q2 , que é a me-
4
3 (10)
diana, é dado pela média dos elementos centrais, logo vale 5,5; =
e Q3 = 7,5 ; assim,
4
podemos dizer que: o quartil 1 ocupa a posição 2,5, ou seja, ele é o valor 2,5 (média de 2
e 3); o quartil 2 é 5,5; o quartil 3 ocupa a posição 7,5, é o valor 6 (média de 6 e 6).
– 52 –
ESTATÍSTICA
•• dados agrupados com intervalos de classes: quando os dados estão agrupados em

classes, devemos utilizar a expressão
 k ∑ fi 
 − F ( ant )  h*
4
Q=i LIi +  
f*
Em que:
Qi - quartil i;
LIi - limite inferior da classe que contém o quartil em análise;
k - número do quartil (quartil 1, 2, ou 3);
∑ fi - somatório das frequências dividido por 4;
4
F ( ant ) - frequência acumulada da classe anterior àquela que estamos analisando;

h *
- intervalo ou amplitude da classe que estamos analisando;
f* - frequência da classe que estamos analisando.
EXEMPLO
Considere as classes apresentadas na tabela a seguir.
Tabela 1 – Classes
Classe Frequência simples Frequência acumulada
[150,154) 4 4
[154,158) 9 13
[158,162) 11 24
[162,166) 8 32
[166,170) 5 37
[170,174) 3 40
Assim, calculamos os quartis.
1x40
Quartil 1: 4
= 10 . Então, 10 dados são inferiores ou iguais ao quartil 1.
  1x40   4
Logo, ele está na classe [154, 158). Assim, Q1 =154 +   − 4  =156,66 ;
 4   9
– 53 –
ESTATÍSTICA
EXEMPLO
2x40
Quartil 2: = 20 . Então, 20 dados são inferiores ou iguais ao quartil 2.
4
  2x40  4
Logo, ele está na classe [158, 162). Assim, Q2 =
158 +   − 13 = 160,54 ;
 4   11
3x40
Quartil 3 = 30 . Então, os dados são inferiores ou iguais ao quartil 3.
4
 3x40  4
Logo, ele está na classe [162, 166). Assim, Q3 =162 +   − 24  =165 ;
 4  8
Assim encontramos todos os quartis para o caso em questão.
Atente para as expressões utilizadas para calcular os quartis para dados agrupados em clas-
ses e para dados não agrupados. Você irá notar que nos tópicos a seguir, faremos apenas algumas
reformulações destas expressões.
2.2 Decil
Os decis dividem um conjunto de dados em 10 partes iguais. Deste modo, podemos dizer
que 10% dos dados são inferiores ou iguais ao primeiro decil D1 , 20% dos dados são inferiores ou
iguais ao segundo decil D2 e assim por diante, até chegar ao último decil.
Figura 2 – Representação das divisões dos decis
0% 10% 20% ... 90% 100%
D1 D2 ... D9
FIQUE ATENTO!
O decil 5 equivale à mediana, visto que 50% dos dados são menores ou iguais a ele.
Agora, vejamos os cálculos para dados não agrupados ou agrupados em classes.
– 54 –
ESTATÍSTICA
•• Dados não agrupados: quando os dados não estão agrupados em classes, usamos
a expressão
ki ∑ fi
Di =
10
•• Dados agrupados com intervalos de classes: quando os dados estão agrupados em

classes, devemos utilizar
 k ∑ fi 
 − F ( ant )  h*
10
D=i LIi +  *

f
Em que:
Di - decil i;
LIi - limite inferior da classe que contém o decil em análise;
k - número do decil (1, 2, 3, ...9);
∑ fi - somatório das frequências dividido por 10;
10
F ( ant ) -
frequência acumulada da classe anterior àquela que estamos analisando;
h - intervalo ou amplitude da classe que estamos analisando;
*
f * - frequência da classe que estamos analisando.
Para exemplificar o cálculo, considere o seguinte conjunto de dados: 2, 3, 4, 5, 6, 6, 6, 7, 8,

8, 9, 9, 9, 10, 11, 12,12, 13, 14, 15. Quais seriam, então, os três primeiros decis? Note que temos
1 x 20
20 dados, logo, o primeiro decil é o valor que ocupa a posição = 2ª posição , que é o 3. O
2x20 10
segundo decil é o valor que ocupa a posição = 4ºposição , que é 5. O terceiro decil é o valor
10
20
que ocupa a posição 3x20 = 6ºposição 3x = 6ºposição , que é 6.
10 2
Os cálculos dos decis seguem a mesma linha de raciocínio dos quartis, sendo necessário
apenas fazer as devidas adaptações.
2.3 Percentil
O percentil divide um conjunto de dados em 100 partes iguais. Desta forma, o percen-
til P1 indica que 1% dos dados são inferiores ou iguais a ele. O percentil P2 ilustra que 2% dos
dados são inferiores ou iguais a ele; o P3 indica que 3% dos dados são inferiores ou iguais a ele; e
assim sucessivamente.
– 55 –
ESTATÍSTICA
Figura 3 – Representação das divisões dos percentis
0% 1% 2% ... 98% 99% 100%
P1 P2 ... P98 P99
Os percentis também são calculados a partir de dados não agrupados e agrupados

em classes.
•• Dados não agrupados: quando os dados não estão agrupados em classes, usamos
a expressão
ki ∑ fi
Pi =
100
•• Dados agrupados com intervalos de classes: quando os dados estão agrupados em

classes, usamos
 k ∑ fi 
 − F ( ant )  h*
100
P=i LIi +  
f*
Em que:
Pi - percentil i;
LIi - limite inferior da classe que contém o percentil em análise;
k - número do percentil (1, 2, 3, ...99);
∑f i - somatório das frequências dividido por 100;

100
F ( ant ) -
frequência acumulada da classe anterior àquela que estamos analisando;
h - intervalo ou amplitude da classe que estamos analisando;
*
f * - frequência da classe que estamos analisando.
Para compreender o cálculo, imagine que, em uma prova, os estudantes tenham tirado as
seguintes notas: 0 (10 estudantes); 1 (5 estudantes); 2 (5 estudantes); 3 (1 estudante); 4 (5 estu-
dantes); 5 (10 estudantes); 6 (30 estudantes); 7 (10 estudantes); 8 (15 estudantes); 9 (6 estudan-
tes); 10 (3 estudantes). A tabela abaixo ilustra as notas e frequências.
– 56 –
ESTATÍSTICA
Tabela 2 – Notas e frequências
Nota Frequência simples Frequência acumulada
0 10 10
1 5 15
2 5 20
3 1 21
4 5 26
5 10 36
6 30 66
7 10 76
8 15 91
9 6 97
10 3 100
Assim, quais seriam o 11º percentil, o 23º percentil e o 89º percentil? Primeiro, observamos se
os dados estão organizados em ordem crescente. Como eles estão, podemos continuar o cálculo.
100
Note que temos 100 dados, logo, o 11º percentil é o valor que ocupa a posição 11 x = 11º posição ,
100
100
que é 1. O 23º percentil é o valor que ocupa a posição 23x = 23º posição , que é 4. O 89º percentil
100 100
é o valor que ocupa a posição 89x = 89ºposição , que é 8.
100
O percentil é bastante conhecido e utilizado na Estatística. Uma aplicação prática destas
separatrizes seria analisar a altura da população de uma determinada cidade. Colocando os dados
em ordem crescente, o percentil 90% indicará que 90% das pessoas possuem altura igual ou infe-
rior àquele valor.
Agora vamos imaginar que um determinado vendedor de sapatos queira saber qual tamanho
máximo de sapato ele deveria vender. Ele pode obter a devida proporção entre altura e tamanho
dos pés e chegar à conclusão de um valor que atenda a 90% da população.
3 Interpretando as separatrizes
Para efetuarmos a interpretação de outros tipos de separatrizes, basta recorrermos aos nos-
sos conhecimentos de quartis, decis e percentis. Todo o processo de cálculo das referidas divisões
deve ser feito de maneira análoga àqueles que foram descritos em tópicos anteriores.
– 57 –
ESTATÍSTICA
SAIBA MAIS!
Lembre-se sempre que a mediana é um valor que separa os 50% menores valores
dos 50% maiores. Vamos supor que uma determinada divisão de um conjunto de
dados seja em 50 partes iguais. Note que 25 partes são menores ou iguais a mediana
e 25 são maiores. Assim, o valor que ocupa a 25º divisão é a respectiva mediana.
As separatrizes são medidas que dividem um conjunto de dados em “n” partes iguais. O
valor de “n” pode assumir qualquer valor inteiro, por isso, é impossível citarmos todos os tipos de
separatrizes.
Além disso, naquelas em que as divisões não são exatas, é mais difícil de se encontrar os
valores que ocupam cada divisão. No entanto, nada nos impede de fazermos a divisão de um con-
junto de dados em quantas partes quisermos, com os devidos cálculos.
Fechamento
•• entender o conceito de separatrizes;

•• aprender sobre os principais tipos de separatrizes;
•• saber os cálculos das classificações de separatrizes.
Referências
CRESPO, Antônio. Estatística Fácil. 18. ed. São Paulo: Editora: Saraiva, 2005.
DUQUIA, Rodrigo Pereira; BASTOS, João Luiz Dornelles. Medidas de tendência central: onde a
maior parte dos indivíduos se encontra? Scientia Medica, Porto Alegre, v.16, n. 4, out/dez. 2006.
– 58 –
TEMA 8
Medidas de dispersão:
desvio médio e desvio padrão
Introdução
Na análise de uma série de dados, é importante saber como eles variam. Para isso, nesta
aula, conheceremos as medidas de dispersão, que dividem-se em absolutas e relativas. Concen-
traremos nossos esforços nas medidas absolutas, que são a amplitude total, a variância e os
desvios médio e padrão.
•• conceituar e calcular as medidas de dispersão absolutas.
1 Medidas de dispersão
Às vezes, é importante verificar se um determinado conjunto de dados é mais ou menos
disperso. Observe!
Figura 1 – Dispersão de dois conjuntos de dados

30
25
20
15
10
0
0 5 10 15 20 25 30
Perceba que os dados do conjunto 1 (quadrados) são menos dispersos em relação aos do
conjunto 2 (losangos). Segundo Crespo (2005, p. 109), dispersão ou variabilidade seria “a maior
ou menor diversificação dos valores de uma variável em torno de um valor de tendência central
tomado como referência”. Na maioria dos casos, o valor de referência utilizado é a média aritmética.
– 59 –
ESTATÍSTICA
FIQUE ATENTO!
A média é dada pela soma das observações dividida pelo número de observações.
2 Amplitude total
Ainda conforme Crespo (2005, p. 109), amplitude total corresponde à “diferença entre o maior
e o menor valor observado”, o que nos permite calcular a dimensão da variação das observações.
O cálculo da amplitude total é dado por:
AT = Nº maior – Nº menor
Quando um conjunto de dados é muito disperso, a amplitude total é grande, uma vez que as
observações possuem valores distantes entre si. Tenha em mente que o cálculo da amplitude
pode ser realizado para dados agrupados (em classes ou por frequências), ou não agrupados.
3 Dados agrupados
Os dados podem ser agrupados com ou sem intervalos de classes. Os dados agrupados sem
intervalos de classes são expressos em função de algo, ou de um valor. Nesses casos podemos
fazer o agrupamento de acordo com o número de observações de cada elemento (frequência). Já
os dados agrupados em classes são aqueles contidos em uma faixa de valores.
EXEMPLO
Considere que as notas de Matemática dos estudantes do oitavo ano de uma esco-
la X estejam agrupadas por frequência.
Tabela 1 – Notas de alunos

Notas Frequência
0 1
3 4
5 8
6 5
9 2
A amplitude desse conjunto de dados é dada por AT = 9 – 0 = 9.
– 60 –
ESTATÍSTICA
Entenda que quando os dados estão agrupados em classes, cada classe possui a sua amplitude.
EXEMPLO
Considere que as notas de vinte alunos em uma prova estão na tabela a seguir:
Tabela 2 – Frequência por intervalos de notas
Notas Frequência
0,0 ˫ 5,0 7
5,0 ˫ 6,5 8
6,5 ˫ 9,0 3
9,0 ˫ 10,0 2
O operador ˫ indica que o intervalo é fechado à esquerda, ou seja, em cada classe

composta por valores entre zero e 5,0, por exemplo, estão incluídos todos os núme-
ros reais maiores ou iguais a zero e menores que 5,0. As amplitudes das classes
(C1, C2...) são dadas pelas diferenças entre os valores extremos de cada classe.
Assim, temos: AC1 = 5,0 – 0 = 5,0, AC2 = 6,5 - 5,0 = 1,5.
4 Dados não agrupados

Quando os dados não estão agrupados, devemos subtrair o menor valor da série de dados
do maior. Haverá apenas uma amplitude. Por exemplo, no conjunto de dados (1, 2, 3, 4, 5), qual é a
amplitude total? AT = 5 – 1 = 4.
A amplitude total é uma medida de dispersão pouco precisa, pois é fortemente influenciada
por valores extremos (outliers). Estes valores podem surgir por vários motivos, prejudicando a
análise da dispersão dos dados (CRESPO, 2005).
5 Desvio médio
Um desvio é a diferença entre um valor observado e um valor tomado como referência. O des-
vio médio é, portanto, a diferença entre um valor observado e a média aritmética dos dados. Assim,
temos uma expressão para os desvios (Di) de um conjunto, no qual cada elemento Xi representa
um valor observado, sendo X é a sua média:
– 61 –
ESTATÍSTICA
Di = Xi – X
Observe os valores dos desvios para o conjunto de dados abaixo, em que a média X é igual a 7.
Tabela 3 – Desvios médios
Xi Xi – X
4 –3
8 1
7 0
9 2
Conforme Stevenson (2007), é necessário considerar o fato de que a soma dos desvios (posi-
tivos e negativos), em relação à média, é por definição igual a zero.
(
∑ Di = ∑ Xi – X = 0 )
Para a última tabela, temos:
∑ di = –3 +1+ 0 + 2 = 0
No entanto, para obtermos o desvio médio, precisamos considerar os valores absolutos

(módulos) dos desvios. Assim:
∑ Xi – X
DM =
n
1+ 2 + 3 + 4 + 5
Por exemplo, no conjunto de dados F = {1,2,3,4,5}, a média é dada por X = = 3.
5
O desvio médio é dado por:
∑ Xi – X 1– 3 + 2 – 3 + 3– 3 + 4 – 3 + 5– 3 2 +1+ 0 +1+ 2
DM = = = = 1,2
n 5 5
SAIBA MAIS!
O tópico IV do “Levantamento do perfil antropométrico da população brasileira usuária
do transporte aéreo nacional – Projeto Conhecer”, da Agência Nacional de Aviação Civil
(ANAC), aborda a aplicação dos conceitos de medidas de dispersão. Acesse:<http://
www2.anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf.>.
– 62 –
ESTATÍSTICA
6 Variância
Como você pôde ver, a amplitude total não é uma medida precisa da variabilidade de um
conjunto de dados, pois ela é sensível a valores extremos. Assim, precisamos de indicadores que
avaliem de forma mais eficaz a totalidade da dispersão de um conjunto de dados.
Um desses indicadores é a variância, medida de dispersão utilizada para avaliar a “distância”
dos dados de um conjunto em relação à sua média, dada por X. Pela fórmula do desvio médio,
observamos que a soma dos desvios será sempre igual a zero. Se elevarmos o valor dos desvios
ao quadrado, podemos estimar a totalidade dos desvios de um conjunto. A fórmula da variância,
que representa a média dos quadrados dos desvios, é:
∑ (x – X)
n 2
i
Var ( X ) = i=1
Assim, a variância Var(X), de notação σ² consiste em uma somatória dos quadrados dos des-
vios xi – X , do primeiro ao último dado (i = 1, 2, 3...n), dividido pelo número de dados.
Imagine que, enquanto em treinamento, um regimento de infantaria consome alguns quilos
de alimento por dia. Em sete dias, foram 105 quilos, conforme tabela a seguir.
Tabela 4 – Alimentação por dia (em kg)
Domingo 10
Segunda 12
Terça 18
Quarta 25
Quinta 19
Sexta 11
Sábado 10
Sabemos que a média do peso diário de é dada pela razão X = 105/7 = 15. Já a variância
desse conjunto é dada por:
∑ ( x –15 )
n 2
i
σ = Var ( X )
2 i=1
=
7
(10–15 ) + (12 –15 ) + (18–15 ) + ( 25–15 ) + (19–15 ) + (11–15 ) + (10–15 )

2 2 2 2 2 2 2
=
7
25 + 9 + 9 +100 +16 +16 + 25 200

= = = 28,57.
7 7
– 63 –
ESTATÍSTICA
Desenvolvendo a fórmula da variância, obtemos:
n
∑ (X )
2
= Var ( X ) =
2 i
σ i=1
– X2
n
Em alguns casos, a utilização dessa fórmula facilita o cálculo. Destacamos algumas proprie-
dades da variância abaixo. Acompanhe!
•• Ela sempre terá valores positivos ou, nulos, pois consiste em uma operação que verifica
a média dos quadrados dos desvios.
•• A variância de uma série X, multiplicada por uma constante c, tem o mesmo valor dessa
constante ao quadrado multiplicando a variância de X:
n
 n ( x )2
∑ ( cx ) – ( cX ) ∑ i – X2  = c2 Var ( X )
2
2
Var ( cX ) = = c  i=1
i=1 i 2
n  n 
 
Imagine o conjunto O = {1,3,5}. Sua variância é igual a 4. Se multiplicamos esses dados por 3,
obteremos o conjunto P ={3,9,15}, cuja variância será igual a 36, ou seja, 3² x 4.
•• Se uma série de dados tem valor constante, a variância será igual a zero. No caso do
conjunto V= {1,1,1}, a média é igual a 1 e a variância é dada por (0+0+0)/3=0.
•• Seja a variável Z = X + k, em que k é um valor constante. Quando adicionamos ou sub-
traímos um valor constante (k) a todos os valores de uma variável X, a variância per-
manece a mesma, pois a variância de um valor constante é igual a zero, de modo que:
Var ( Z ) = Var ( X ) + Var (k ) = Var ( X ) + 0 = Var ( X )
Imagine o conjunto M = {3,5,7}. Sua variância é igual a 4. Adicionemos então a constante k = 2

aos dados do conjunto, obtendo assim o conjunto I = {5,7,9}. A variância desse conjunto é dada por:
Var(I) = Var(M) + Var (k) = 4 + 0 = 4.
Entenda que a eficácia da variância como estimador da variabilidade de um conjunto de

dados é influenciada diretamente pelo número de elementos que compõem esse conjunto. Se ele
representar uma amostra, ou seja, um subconjunto finito de uma população com um número de
elementos menor que a população, há um risco de que a variância não apresente um valor preciso.
Assim, para que se obtenha uma medida mais exata da variância para uma amostra, deve-
mos empregar um operador que corrija o valor da variância (BUSSAB; MORETTIN, 2010). Estamos
falando do fator de correção de Bessel, dado pela razão n/n-1:
∑ (x – X) ( )
n 2 n 2
σ 2
= i=1 i
x
n ∑ xi – X
= i=1
n-1
n n–1 n–1
– 64 –
ESTATÍSTICA
SAIBA MAIS!
O fator de correção deve ser utilizado quando um conjunto de dados contém um
número razoavelmente pequeno de elementos, ou quando se tratar de uma amostra
de população. Assim, poderemos estimar a dispersão de um conjunto de dados de
maneira mais precisa e correta.
Imagine o conjunto A = {4,5}. A variância é dada por Var(A) = 0,25. Mas empregando-se o fator
de correção, temos que Var(A’) = 0,5. Por outro lado, quando o conjunto contém um grande número
de elementos (em geral, n>30), não há grande diferença entre σ2 e σ2n-1, de modo que o fator de
correção tem pouca relevância. Porém, ele deve ser utilizado para o cálculo da variância quando o
conjunto é formado por uma amostra de dados.
7 Desvio padrão
O desvio padrão é um importante indicador, pois permite verificar se os dados são mais ou
menos dispersos em relação à média. Sua notação é dada por:
σ = 2 Var ( X )
Como a variância é um valor elevado ao quadrado, sua interpretação pode ser dúbia, depen-
dendo da variável em uso. Logo, o desvio padrão corrige essa imprecisão fazendo os dados da
variável “retornarem” à unidade original.
FIQUE ATENTO!
Se medirmos a altura de um grupo de pessoas, a variância seria dada em centíme-

tros quadrados, que seriam condizentes com a área dos indivíduos, não sua altura.
As propriedades do desvio padrão são bastante semelhantes às da variância. Se multiplicar-

mos os valores de uma variável por uma constante c, por exemplo, seu desvio padrão fica multipli-
cado por essa constante:
n
 n ( x )2
∑ ( cx ) – ( cX ) ∑ i – X2  = c2 Var ( X )
2
2
Var ( cX ) = = c  i=1
i=1 i 2
n  n 
 
O desvio padrão será σ = 2 Var ( X ) , logo, σ = 2 c2 Var ( X ) = c x 2 Var ( X ) = c xσ .
– 65 –
ESTATÍSTICA
Uma segunda propriedade reside no fato de que, se acrescentarmos um valor constante aos
dados de uma variável X, o desvio padrão se manterá constante (uma vez que o desvio padrão de
uma constante é igual a zero). Como desdobramento, quanto mais o desvio tender a zero, menor
será a dispersão dos dados em torno da média.
Para o exemplo anterior, em que mencionamos a alimentação dos soldados, o desvio padrão
é dado por σ = 2 28,57 = 5,35 .
FIQUE ATENTO!
Em uma distribuição de dados conhecida por uma distribuição normal, a maioria dos
dados encontra-se dentro dos limites de um desvio padrão. Por exemplo, citando a ali-
mentação dos soldados novamente, observamos que a maioria dos dados se encontra
em torno da média, com mais ou menos um desvio padrão, ou seja, 15 ± 5,35 kg ao dia.
Fechamento
•• entender o que são medidas de dispersão;

•• conhecer os conceitos de algumas medidas de dispersão;
•• saber como são feitos os cálculos dessas medidas.
Referências
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro Alberto. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
BRASIL. Agência Nacional de Aviação Civil (ANAC). Levantamento do perfil antropométrico da popu-
lação brasileira usuária do transporte aéreo nacional – Projeto Conhecer. Disponível em: <www2.
anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf>. Acesso em: 21 mar. 2017.
CRESPO, Antônio. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2005.
STEVENSON, William. Estatística Aplicada à Administração. São Paulo: Harbra, 2007.
– 66 –
TEMA 9
Coeficiente de variação e propriedades
Introdução
Na Estatística Descritiva, temos medidas de dispersão destinadas a analisar a variabilidade
de um conjunto de dados. Dentre estes indicadores, podemos destacar a variância, o desvio padrão
e o coeficiente de variação. Enquanto os dois primeiros índices são absolutos, o coeficiente de
variação é uma medida relativa, isto é, possui uma natureza dependente de outras variáveis.
Saiba que o coeficiente de variação é um importante instrumento de cálculo para compreen-
dermos a dispersão de um conjunto de dados em torno de sua média, percebendo se ela é mais
ou menos intensa. Esse indicador é útil, ainda, para realizarmos exercícios de análise comparativa
entre diferentes conjuntos de dados com diferentes medidas de dispersão, permitindo assim uma
padronização de informações.
A final desta aula, você será capaz de:
•• identificar os coeficientes de variação e entender suas propriedades.
1 Coeficiente de variação
Lembre-se dos conceitos de desvio padrão e média, pois o coeficiente de variação possui
relação direta com eles. A média X é uma medida de tendência central, ou seja, é um valor que
indica a posição em torno da qual uma série de dados se distribui. Ela é dada por:
X=
∑ (x )
i =1 i
Essa média é formada pela soma dos valores dos n elementos que compõem um con-
junto (do primeiro dado, i=1, até o último, n), divididos pelo número total de elementos (BUSSAB;
MORETTIN, 2010).
– 67 –
ESTATÍSTICA
Figura 1 – Variação de um conjunto de dados
Fonte: VAlex / Shutterstock.com
FIQUE ATENTO!
Sendo a média um indicador de tendência central, ela demonstra o valor em tor-
no do qual se distribuem os dados. Para o caso proposto, a divisão entre a soma
dos valores dos elementos e o número total de elementos, estamos utilizando a
média aritmética.
O desviopadrão, por sua vez, é uma medida de dispersão que analisa o grau de variação
de uma série de dados em torno da média, sendo calculado a partir da raiz quadrada da variân-
cia. A variância é a média aritmética dos quadrados dos desvios (CRESPO, 2005), que são dados
pela fórmula:
∑ (x − X)
n 2
i
s2 = i=1
Em outras palavras, a variância demonstra a dispersão total de um conjunto de dados a partir

de cada desvio ( xi − X ) em relação à média, elevado ao quadrado. Caso somássemos apenas a
distância entre cada dado xi e a média, obteríamos zero.
FIQUE ATENTO!
Devemos analisar a dispersão de dados ao elevarmos os desvios ao quadrado.
Caso isso não seja feito, estaremos medindo apenas as distâncias entre os dados
da variável e a média!
– 68 –
ESTATÍSTICA
Para visualizarmos melhor a magnitude da dispersão dos dados, recorremos à fórmula do

desviopadrão, que é calculado a partir da seguinte equação:
∑ (x − X)
n 2
i
=s s2
2
= 2 i =1
Grave bem: o desvio padrão permite ao pesquisador analisar se uma determinada distribui-
ção de dados possui maior ou menor variabilidade (CRESPO, 2005). De acordo com a média, distri-
buições podem ser mais ou menos dispersas. Entretanto, ainda que seja uma importante medida
de dispersão, o desviopadrão possui algumas limitações:
•• esta medida é afetada significativamente por valores extremos, muito afastados da

média e isolados, conhecidos como outliers;
•• o desviopadrão e a média não permitem, isoladamente, verificar se a distribuição dos
dados é mais ou menos uniforme;
•• também não permitem a análise comparativa, pois são dados em função de cada vari-
ável separada (um conjunto de dados em metros tem um desvio padrão com notação
diferente de um conjunto de dados em quilômetros, por exemplo).
SAIBA MAIS!
Outliers são pontos que se afastam muito dos valores médios de uma distribuição
de dados, comprometendo o cálculo da média e do desvio padrão. Imagine uma
distribuição N = {5, 6, 7, 8, 9, 175}. Se usarmos os cinco primeiros dados, a média
será igual a 7. Com os seis dados, a média será igual a 35. Logo, o dado “175” é visto
como um outlier.
Assim, notamos que o desviopadrão não é uma ferramenta precisa para uma comparação
de dispersões de dados com diferentes grandezas (CRESPO, 2005). Se uma distribuição tem um
desvio padrão igual a 5, para uma média de 300, percebemos que os dados são pouco dispersos.
Mas o mesmo desvio para uma média igual a 6 demonstra uma dispersão significativa.
FIQUE ATENTO!
Ainda que não expressemos o desviopadrão em relação a uma ordem de grandeza
(como em: “o desvio padrão é igual a 6 m/s”), não se esqueça de que ele está ex-
presso em relação à notação proposta pelo problema analisado. Logo, se as gran-
dezas ou variáveis forem diferentes, não poderemos comparar os desvios-padrões
com precisão.
Da mesma forma, você deve ter em conta que determinadas dispersões são mais ou menos
homogêneas em relação à média. Observe!
– 69 –
ESTATÍSTICA
Figura 2 – Dispersão de um conjunto de dados A
3,5
2,5
2
Y
1,5
0,5
0
0 0,5 1 1,5 2 2,5 3 3,5
No caso da imagem, você pode perceber que os dados estão razoavelmente dispersos em
relação à média, no par ordenado (X.Y) = (2,2). Agora, compare com outra distribuição:
Figura 3 – Dispersão de um conjunto de dados B

2,6
2,4
2,2
Y 1,8
1,6
1,4
1,2
1
1 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6
x
Aqui, você pode perceber que a dispersão dos dados é bem menor, situando-se entre 1,5 e
2,4, para ambas as variáveis (X,Y). Nesse caso, como não há notações em relação aos dados da
variável, podemos comparar os desviospadrões.
E quando os dados são expressos em grandezas diferentes? Imagine que a primeira distri-
buição é dada em centímetros, ao passo que a segunda está em quilômetros. Para superar essas
limitações, podemos padronizar o desviopadrão, de modo a criar uma medida de dispersão que
possa aplicar-se a conjuntos de dados com diferentes médias e desvios. Essa medida é o coefi-
ciente de variação, também conhecido como coeficiente de variação de Pearson, calculado por
meio da fórmula:
∑ (x − X)
n 2
2 i =1 i
n s
=CV = n
∑ i =1( xi ) X
n
– 70 –
ESTATÍSTICA
EXEMPLO
Imagine a distribuição A = {10, 12, 14, 20}. A média dessa distribuição é dada por
=X
∑
=
(x )
i =1 i 10 + 12 + 14 + 20
= 14
n 4
Já o desviopadrão é dado por:
∑ ( x − X=
)
n 2
(10 − 14 ) + (12 − 14 ) + (14 − 14 ) + ( 20 − 14=
)
2 2 2 2
2 i
=s s
2
= 2 i =1 2
3,74
n 4
Assim, o coeficiente de variação é dado por:
s 3,74
CV= = = 0,267
X 14
Podemos verificar que a distribuição A é 26,7% dispersa em relação à média.
Entenda que o coeficiente de variação permite a comparação de duas ou mais séries de valo-
res, tratando-se de uma medida universal. Expresso em porcentagem, ou como um valor real maior
que zero, é possível, com esse índice, avaliar a dispersão ou a variabilidade de um conjunto de dado
mesmo que as variáveis estejam expressas em unidades diferentes. (MILONE; ANGELINI, 1993).
EXEMPLO
Vamos considerar os seguintes conjuntos: A1= (1, 2, 3, 3); e A2 = (1, 5, 10, 13).
Para encontrarmos o coeficiente de variação para ambos, devemos, antes, obter o
desvio padrão e a média. Utilizando as expressões estudadas, temos: s1 = 0,83 e
X1 = 2,25 . Para o segundo conjunto, temos s2 = 4,60 e X2 = 7,25 . Assim, calculamos
s
o coeficiente de variação por meio da fórmula CV= × (100) .
X
Então,
S 0,83
CV1 = 1 × (100) =CV1 = × (100) =CV1 =36,8% ;
x1 2,25
S 4,60
CV2 =2 × (100) =
CV2 = × (100) =
63,5% .
x2 7,25
Como o conjunto 2 apresenta um maior coeficiente de variação, os dados prove-

nientes dele são mais dispersos em torno da média.
Nas próximas páginas, discutiremos as propriedades do coeficiente de variação!
– 71 –
ESTATÍSTICA
2 Propriedades do coeficiente de variação

Em relação à média, citamos duas propriedades. A primeira é que, quando dividimos ou mul-
tiplicamos os valores de uma variável N por uma constante k, a média dessa variável será multipli-
cada pela constante, conforme a fórmula Z = kX . Imagine a distribuição X = {4, 5, 9}. Sua média é
igual a 6. Se multiplicarmos esses valores por 4, obteremos a distribuição Z = {16, 20, 36}, de média
igual a 24, ou 4 x 6.
A segunda propriedade da média é que, quando adicionamos ou subtraímos os dados de
uma variável a um valor constante, a média também será acrescida ou subtraída dessa cons-
tante. Para a mesma distribuição X mencionada anteriormente, se acrescentarmos a constante
k = 4, obteremos a distribuição Z = {8, 9, 13}, com média igual a 10, ou seja, Z= k + X (MILONE;
ANGELINI, 1993).
Quanto ao desvio padrão, citamos duas propriedades. Quando multiplicamos ou dividimos o
desvio padrão de uma variável X por uma constante k, ele também é multiplicado ou dividido por
essa constante. Por exemplo, temos a distribuição X= {5, 7, 12}, com desvio padrão igual a 3,605
(aqui você deverá utilizar a equação do desvio padrão). Se multiplicarmos os valores da distribui-
ção por 2, teremos a distribuição Z = {10, 14, 24}, cujo desvio padrão é igual a 7,21, ou seja, o dobro
da anterior.
A segunda propriedade do desvio padrão é que quando acrescentamos ou subtraímos um
valor constante de uma variável, ele permanecerá o mesmo, pois é nulo o desvio padrão de um
valor constante. Como a média é o próprio valor constante xi , a equação ( xi − X ) será igual a zero
2
(CRESPO, 2005).
Passemos agora à análise do coeficiente de variação!A primeira interpretação que podemos
efetuar é que, uma vez que o coeficiente de variação é uma medida de análise da variabilidade dos
dados em relação à média, quanto maior for o coeficiente de variação, mais heterogênea será a
dispersão dos dados. Se o valor de CV = 1, a dispersão equivale a 100% da média, indicando uma
alta variabilidade (PIMENTEL-GOMES, 2009).
SAIBA MAIS!
No texto de Edimar Almeida da Cruz et al, encontramos um exemplo de aplicação
dos conceitos relacionados ao coeficiente de variação. Confira: <http://www.
conhecer.org.br/enciclop/2012a/agrarias/coeficiente.pdf>.
A segunda propriedade é que o coeficiente de variação é adimensional e esta é uma carac-

terística importante. Uma vez que o desvio padrão é sensível à unidade de medida do conjunto de
dados, impedindo análises comparativas, o coeficiente de variação é uma medida adimensional.
Se temos o mesmo coeficiente de variação para dois conjuntos, um com desvio padrão s1 = 100
e outro com s2 = 18 , podemos comparar a dispersão dos dados independente da grandeza que
caracteriza o conjunto de dados (MILONE; ANGELINI, 1993).
Destacamos, ainda, que ao convertermos o coeficiente de variação em uma porcentagem,
veremos o percentual que o desvio padrão é maior ou menor que a própria média. Podemos, como
– 72 –
ESTATÍSTICA
decorrência, estabelecer algumas identidades a respeito do coeficiente de variação e do grau de

dispersão de um conjunto de dados, de acordo com a tabela a seguir.
Tabela 1 – Classificação do coeficiente de variação em função da dispersão dos dados
Classificação do coeficiente quanto à

Coeficiente de variação
dispersão da variável
Entre 0% e 10% Baixo
Entre 10 e 20% Médio
Entre 20 e 30% Alto
Acima de 30% Muito alto
Fonte: adaptada de PIMENTEL-GOMES, 2009.
Desse modo, podemos, com auxílio do coeficiente de variação, analisar se uma distribuição
de dados é mais ou menos homogênea em relação à sua média.
Fechamento
Chegamos ao final deste conteúdo!
•• conhecer o coeficiente de variação e sua expressão algébrica;

•• calcular o coeficiente de variação associado a diferentes distribuições de dados;
•• realizar análises comparativas, a partir de propriedades determinadas.
Referências
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro. Estatística Básica. 6. ed. São Paulo: Saraiva, 2010.
CRESPO, Antonio. Estatística Fácil. São Paulo: Saraiva, 2005.
CRUZ, Edimar Almeida et al. Coeficiente de variação como medida de precisão em experimentos
com tomate em ambiente protegido. Enciclopédia Biosfera. Goiânia, v. 8, n. 14, 2012. Disponível
em: <http://www.conhecer.org.br/enciclop/2012a/agrarias/coeficiente.pdf>. Acesso em: 14 mar.
2017.
MILONE, Giuseppe; ANGELINI, Flávio. Estatística geral. São Paulo: Atlas, 1993.
PIMENTEL-GOMES, Frederico. Curso de Estatística Experimental. 15. ed. Piracicaba: FEALQ, 2009.
– 73 –
TEMA 10
Assimetria
Introdução
Nesta aula, aprofundaremos nosso conhecimento sobre a assimetria. Para isso, verificare-
mos quais as situações em que, utilizando-nos de uma distribuição de dados, é possível identificar
se há uma tendência de distribuição de dados ao longo da média, ou se o conjunto possui alguma
desigualdade. Assim, entenderemos o conceito e as características das distribuições simétricas
e assimétricas.
•• identificar os tipos de assimetria baseados na posição relativa entre a média e a

mediana.
1 Conceito de assimetria
Quando pensamos em assimetria, normalmente, estamos considerando uma desigualdade,
uma discrepância, uma tendência. Já a simetria, por sua vez, pressupõe uma organização de ele-
mentos que segue uma ordem, uma coincidência de informações (CRESPO, 2005). Além disso,
na Estatística, quando analisamos uma distribuição de dados associada a uma amostra ou a
uma população, é comum efetuarmos alguns cálculos denominados medidas de posição, como
a média (que denota o ponto equidistante entre os dois extremos de uma distribuição), a mediana
(que divide os dados do conjunto em duas partes iguais) e a moda (o elemento que se repete com
maior frequência).
Deste modo, quando analisamos graficamente esta distribuição, verificamos se ela é simé-
trica, ou seja, igualmente distribuída em relação à média, ou assimétrica, quando há uma diferença
em relação à distribuição de dados em torno da média. Assim, quanto maior for esta diferença,
pode-se dizer que a distribuição é mais assimétrica (CRESPO, 2005).
Para entender melhor o conceito de assimetria, tomemos um exemplo. Um aluno, ao anali-
sar um conjunto de dados, constrói um histograma - uma representação gráfica em colunas, em
que o eixo horizontal apresenta as classes (intervalos de valores) e o eixo vertical apresenta as
frequências (o número de vezes em que se visualizou um certo dado) - verificando como se dá a
distribuição dos valores para uma característica de interesse.
– 74 –
ESTATÍSTICA
Histograma
4
Frequência
0
1 2 3 4 5
Classe
No exemplo, vimos que a distribuição dos dados é simétrica, pois, em cinco classes, há o
mesmo número de dados distribuídos em torno da média. Mas, como verificar a simetria de uma
distribuição de dados de um conjunto, ou de uma amostra de várias classes? Nestes casos, utili-
zamos o primeiro Coeficiente de Assimetria de Pearson (Ap), um valor adimensional que permite a
verificação da assimetria, conforme a equação:
X - Mo
Ap =
s
Em que:
Ap = coeficiente de assimetria;
∑ (x − X)
n 2
2 i
S = desvio padrão, que é dado pela equação
i =1
n cujo quadrado corresponde

à variância;
n
O somatório ∑ ( x − X ) mostra os quadrados dos desvios, ou seja, as diferenças de cada dado

2
i
i=1
xi, sendo i =1, 2, 3... até o último dado, n, em relação à média;
x = média das observações, dada pela fórmula X = ∑ i=1 x i / n ;

n
Mo = Moda, ou seja, o elemento que apresenta maior frequência;

= n – número de observações.
– 75 –
ESTATÍSTICA
Caso um conjunto de dados não possua moda, utilizamos o segundo coeficiente de assime-
tria de Pearson dado por:
Ap =
(
3× X − Md )
s
Em que Md representa a mediana, o valor que separa os 50% menores dos 50% maiores
valores.
2 Tipos de assimetria
Uma distribuição de frequências pode ser classificada como simétrica, assimétrica posi-
tiva ou assimétrica negativa, em função de como os dados e frequências são distribuídos
(CRESPO, 2005).
FIQUE ATENTO!
A distribuição simétrica não é preferível à distribuição assimétrica, ou seja, não há
um critério de qualidade em relação à simetria de um conjunto de dados, uma vez
que as características de interesse devem ser fixadas pelo pesquisador.
Quando o Coeficiente de Assimetria de Pearson é igual a zero, observamos que a média é

igual a moda, logo, o ponto que contém a maior frequência corresponde à média, e a distribuição
é perfeitamente simétrica. Na figura anterior, temos um exemplo de distribuição simétrica, uma
vez que a moda, a mediana e a média são iguais e estão na terceira classe. Assim, há o mesmo
número de dados à esquerda e à direita desta classe.
Caso haja uma tendência de acumulação das frequências à esquerda ou à direita da moda,
observaremos que esta distribuição possui uma assimetria. Trata-se do chamado “encauda-
mento” (CRESPO, 2005).
3 Distribuições simétricas - características

A distribuição simétrica ocorre quando uma amostra possui uma característica de interesse
que tenha valores igualmente dispostos em torno da moda e da média. Para Stevenson (2001,
p. 48) a distribuição é simétrica quando “a metade esquerda é a imagem reflexa da metade direita”.
A figura a seguir representa uma distribuição simétrica.
– 76 –
ESTATÍSTICA
Figura 2 – Distribuição simétrica
-3 -25 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3
FIQUE ATENTO!
Em uma distribuição de frequências, a chamada ‘curva normal’ possui uma distri-
buição simétrica, sendo que cerca de 95% dos dados encontra-se em uma distân-
cia inferior a dois desviospadrões em relação à média.
A distribuição simétrica possui as seguintes características:
x Md
•• = = Mo , ou seja, a média, mediana e moda se equivalem;
•• Ap = 0, o coeficiente de assimetria é nulo;
•• metade do gráfico é a imagem-espelho da outra.
Portanto, há uma pequena probabilidade de visualização de frequências baixas ou altas nas

primeiras e últimas classes destas distribuições, fazendo com que este tipo de distribuição tenha
a forma de um “sino”.
EXEMPLO
Calculemos o coeficiente de assimetria do conjunto de dados A = {1,2,2,3,3,3,4,4,5}.
Primeiro, precisamos obter a média, que é dada por:
(1+ 2 + 2 + 3 + 3 + 3 +=
4 + 4 + 5)
=X ∑=
n
i=1
x /ni
9
3
– 77 –
ESTATÍSTICA
A moda é o elemento com a maior repetição: Mo = 3
A variância desta amostra é dada por:
(1− 3) + ( 2 − 3) + ( 2 − 3) + ( 3 − 3) + ( 3 − 3) + ( 3 − 3)
2 2 2 2 2 2
∑ (x − X=
)
k 2
+ ( 4 − 3) + ( 4 − 3) + (5 − 3 )
2 2 2
2 i 12
s= i =1
= = 1,500
n −1 9 −1 8
Deste modo, temos que o desvio padrão amostral é dado=

pors 1,500 1,225
=
2
X − Mo 3 − 3
Assim, o coeficiente de assimetria é=
Ap = = . 0Logo, a distribuição de fre-
s 1,225
quências associado ao conjunto A é simétrica.
SAIBA MAIS!
Na Estatística, as distribuições simétricas associadas a uma curva normal são
muito utilizadas para a formulação de Testes de Hipóteses. Esses testes procuram
validar o comportamento de características de uma população a partir de uma
amostra representativa da mesma.
4 Distribuições assimétricas positivas

A distribuição assimétrica positiva é conhecida pelo nome de distribuição assimétrica à
direita, devido ao fato de a assimetria ser visualizada na parte direita do gráfico. Na figura a seguir,
a distribuição possui um encaudamento (distorção) à direita, indicando que há pequenas probabi-
lidades de ocorrência de valores mais altos em uma distribuição de dados associada a esta curva.
Figura 3 – Distribuição assimétrica positiva
-1.5 -1 -0.5 0 0.5 1 1.5
– 78 –
ESTATÍSTICA
A distribuição assimétrica positiva possui as seguintes características:
•• Mo < Md < x , ou seja, a moda é menor que a mediana, que é menor que a média;
•• Ap > 0, ou seja, o coeficiente de assimetria é maior do que zero;
•• o gráfico não cria imagem-espelho entre as metades.
EXEMPLO
Vamos calcular o coeficiente de assimetria do conjunto de dados de uma amostra
dado por:
B = {1,1,1,2,2,5,16}.
A média é dada por

(1+ 1+ 1+ 2 + 2=
+ 5 + 16 )
∑=
n
=X x /n i 4
i=1 7
A moda é o elemento que apresenta a maior repetição, logo Mo = 1
A variância amostral é dada por
(1− 4 ) + (1− 4 ) + (1− 4 ) + ( 2 − 4 ) + ( 2 − 4 ) + (5 − 4 )

2 2 2 2 2 2
∑ ( x − X=
)
k 2
+ (16 − 4 )
2
i 180
s2
= i =1
= = 30
n −1 7 −1 6
Como a variância é igual a 30, o desviopadrão associado a esta amostra é

=s 2
30 5,477
=
Assim, o coeficiente de assimetria é
X − Mo 4 − 1
Ap
= = = 0,548
s 5,477
Como o valor é maior que zero, temos que a distribuição é assimétrica positiva.
Para descobrir o sinal da assimetria (negativa ou positiva), apenas, não é necessário o cálculo
do Coeficiente de Assimetria, basta observar o sinal da diferença entre a Moda e a Média, uma vez
que o Desvio Padrão é sempre maior ou igual a zero.
Na Demografia, área que estuda o comportamento da população sob uma perspectiva esta-
tística, podemos encontrar exemplos de distribuições assimétricas. Em muitos países em desen-
volvimento, de menor nível de renda, costuma-se observar um predomínio de habitantes de menor
idade, uma vez que a baixa expectativa de vida e o crescimento populacional recente fazem com
que a porcentagem de idosos nestes grupos seja pequena (CARVALHO, 2004). Assim, quando dis-
tribuímos os dados por faixas etárias, percebemos uma participação muito grande de indivíduos
com idade inferior à média.
– 79 –
ESTATÍSTICA
FIQUE ATENTO!
Valores extremamente desassociados a uma distribuição de frequências, ou seja,
atípicos, são denominados outliers. Eles prejudicam a análise estatística, pois inter-
ferem no cálculo da média e dos coeficientes de dispersão e assimetria.
5 Distribuições assimétricas negativas

A distribuição assimétrica negativa recebe a denominação de distribuição assimétrica à
esquerda, pois o “encaudamento” (distorção) está presente na parte esquerda do gráfico. Uma
distribuição assimétrica negativa pode ser evidenciada quando há dados que estejam mais asso-
ciados a um limite inferior, relacionado a classes ou intervalos de classes mais baixos (classes 1,
2, 3...) para uma característica de interesse, de maneira que poucos valores sejam pertencentes a
estas classes.
Figura 4 – Distribuição assimétrica negativa
-1.5 -1 -0.5 0 0.5 1 1.5
Fonte: elaboradapelo autor, 2016.
A distribuição assimétrica negativa caracteriza-se por:
•• x < Md < Mo , ou seja, a média é menor que a mediana, que é menor que a moda;
•• Ap < 0, o coeficiente de assimetria é menor que zero;
•• o gráfico não cria imagem-espelho entre as metades.
Por exemplo, no conjunto de dados: C = {1,1,2,3,4,4,4}, a média é dada por
n (1+ 1+ 2 + 3 +=
4 + 4 + 4)
=X ∑=
i=1
x /n
i
7
2,714
A moda é Mo = 4
– 80 –
ESTATÍSTICA
A variância da amostra é
∑ (x − X)
k 2
2 i
s = i =1
n −1
(1− 2,714 ) + (1− 2,714 ) + ( 2 − 2,714 ) + ( 3 − 2,714 ) + ( 4 − 2,714 ) + ( 4 − 2,714 )

2 2 2 2 2 2
+ ( 4 − 2,714 )
2
=
7 −1
11,429
=
6
∑ (x=
− X)
k 2
i 11,429
=s2 i =1
= 1,904
n −1 6
=
Logo, o desvio padrão amostral é s 1,904 1,38 . Assim, temos que o coeficiente de assi-
=
2
X − Mo 2,714 − 4
metria é Ap = = = −0,932 . Como Ap é menor que zero, a distribuição é assimé-
s 1,38
trica negativa. Aqui, da mesma forma que no exemplo anterior, não é necessário o cálculo do
Coeficiente de Assimetria para saber o sinal da assimetria, pois como a Média (2,714) é menor que
a Moda (4), a assimetria é negativa.
Para sabermos se uma distribuição é pouco ou muito assimétrica, com base na análise do
coeficiente de assimetria de Pearson, temos de tomar o módulo, que representa os valores abso-
lutos, de tal coeficiente. Assim, temos que, caso o valor, em módulo, para o coeficiente seja inferior
a 1, a distribuição é pouco assimétrica. No entanto, quando o valor é superior a 1, a distribuição é
muito assimétrica.
SAIBA MAIS!
Conheça exemplos de distribuições simétricas e assimétricas no estudo do Instituto
Brasileiro de Geografia e Estatística (IBGE) sobre a população brasileira. Acesse:
http://www.ibge.gov.br/home/presidencia/noticias/imprensa/ppts/00000014425
608112013563329137649.pdf .
Fechamento
•• entender o que são distribuições simétricas e assimétricas;

•• conhecer o Coeficiente de Assimetria de Pearson;
•• conhecer a classificação das distribuições assimétricas.
– 81 –
ESTATÍSTICA
Referências
CARVALHO, José Alberto Magno. Crescimento populacional e estrutura demográfica no Brasil.
Texto para Discussão. n. 227, Cedeplar/UFMG, 2004. Disponível em: <http://cedeplar.face.ufmg.
br/pesquisas/td/TD%20227.pdf>. Acesso em: 17 fev 2017.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE). Projeção da população por sexo

e idade: Brasil 2000-2060. Disponível em: <http://www.ibge.gov.br/home/presidencia/noticias/
imprensa/ppts/00000014425608112013563329137649.pdf.>. Acesso em: 13 fev. 2017.
– 82 –
TEMA 11
Experimentos aleatórios,
espaço amostral e evento
Introdução
Nesta aula, discutiremos elementos relacionados à Teoria das Probabilidades, queobje-
tiva estimar as possibilidades de ocorrência de um fenômeno em um determinado conjunto de
dados. Para isso estudaremos, por meiodos conceitos de experimento aleatório, espaço amostral
e evento, os mecanismos que permitem ao pesquisador selecionar uma base de dados de seu
interesse e realizar experimentos que permitam a validação de suas hipóteses.
•• identificar o espaço amostral de um evento e um evento simples.
1 Experimentos aleatórios
Quando um pesquisador usa um método de experimentação para a verificação de algum
fenômeno, torna-se necessário realizar uma distinção a respeito do tipo de experimento, a partir
dos resultados esperados. Podemos dividir os experimentos em aleatórios (não determinísticos)
e determinísticos.
Os experimentos aleatórios são aqueles que apresentam resultados que não podem ser previs-
tos, mesmo que repetidos por infinitas vezes, sob as mesmas condições. (CRESPO, 2005).A expressão
“aleatório” demonstra que os resultados destes experimentos são imprevisíveis, antes que ocorram.
FIQUE ATENTO!
Um experimento aleatório tem seus resultados determinados pelo acaso.
– 83 –
ESTATÍSTICA
Figura 1 – Experimento aleatório no lançamento de dados
Fonte: Route 55/Shutterstock.com
O lançamento de um jogo de dado de 6 faces, por exemplo, é um experimento aleatório. Ao

lançar o dado, o experimento trará como resultado algum dos valores do conjunto E = {1; 2; 3; 4; 5; 6},
certo? Mas, não podemos prever qual número será sorteado antes do dado ser lançado, pois este
resultado será obtido ao acaso.
2 Experimentos determinísticos
No experimento determinístico, os resultados previstos são conhecidos antes mesmo que
aconteçam, de modo que não há outras alternativas. Assim, sob condições semelhantes, os expe-
rimentos determinísticos podem ser repetidos diversas vezes, com resultados estáveis. Nestes
casos, é possível realizar uma previsão dos resultados esperados, descartando-se quaisquer
outras variáveis que possam afetar a condução do experimento.
FIQUE ATENTO!
Na Física e na Química, a igualdade de condições para os experimentos é uma variável

fundamental, visto que sem ela não seria possível fixar um padrão para os mesmos.
Nesta aula, porém, focaremos nos experimentos não determinísticos, pois a condição para
definirmos os conceitos que estudaremos, como espaço amostral e eventos, é de que os experi-
mentos sejam aleatórios.
– 84 –
ESTATÍSTICA
3 Espaço amostral
Quando o pesquisador define as variáveis que irão conduzir o seu experimento (por exemplo,
ao decidir-se por lançar um dado por n vezes), o primeiro passo reside em determinar o espaço
amostral deste experimento. O espaço amostral é um conjunto que contém todos os possíveis
resultados gerados por um experimento (BUSSAB & MORETTIN, 2010). O espaço amostral de um
experimento aleatório é usualmente denotado por S.
FIQUE ATENTO!
Os resultados possíveis que compõem um espaço amostral podem possuir carac-

terísticas quantitativas ou qualitativas, de acordo com a opção do pesquisador.
Continuando com o exemplo do jogo de dados de 6 faces, suponhamos que o experimento

definido pelo pesquisador consista no ato de lançá-los, logo, o espaço amostral é dado pelo conjunto
S = {1; 2; 3; 4; 5; 6}.
Pode-se definir, ainda, um critério qualitativo na definição de um espaço amostral: um
inspetor de qualidade, ao analisar peças de uma linha de produção, verificará se elas aten-
dem às normas previstas de controle de qualidade, definindo o espaço amostral pelo conjunto
S = {adequada, inadequada}.
Figura 2 – Aplicação de um espaço amostral
Fonte: Arthimedes/Shutterstock.com
– 85 –
ESTATÍSTICA
SAIBA MAIS!
As aplicações práticas dos conceitos de espaço amostral estendem-se a várias outras

áreas do conhecimento humano, como a Metalurgia e a Economia, por exemplo.
Há situações, porém, em que o espaço amostral pode incluir toda uma população. Por exem-
plo, se o pesquisador deseja verificar a incidência de hipertensão arterial em uma cidade de 5.000
habitantes, seu espaço amostral é dado pelo conjunto S = {morador 1, 2, 3 (...) morador 5.000}.
Podemos classificar os espaços amostrais em contínuos e discretos. Os espaços discretos
são aqueles em que há um número previsto de resultados, como no caso do lançamento de um
dado, que possui seis resultados possíveis. Já os espaços amostrais contínuos preveem infinitas
possibilidades de resultados (BUSSAB & MORETTIN, 2010).
EXEMPLO
Se o pesquisador deseja conhecer o tempo de vida de um televisor, sabendo que ele
é inferior a cinco anos, uma previsão exata está incluída dentro do espaço amostral
T = {0, ..., 5 anos}, com divisões de tempo em anos, meses, dias, até milésimos de
segundo, ou seja, temos infinitos resultados possíveis.
4 Evento
Definido o método de experimentação (determinístico/aleatório) e o espaço amostral, o pes-
quisador irá definir quais as situações associadas a este espaço amostral, ou quais as perguntas
que serão realizadas (por exemplo, quais os resultados esperados de um lançamento de um dado?).
Estas hipóteses ou situações são conhecidas como eventos (BUSSAB & MORETTIN, 2010).
No caso do jogo de dados de 6 faces, o espaço amostral é definido por S = {1; 2; 3; 4; 5; 6}. Caso
o pesquisador deseje efetuar múltiplos lançamentos, esperando obter números pares (Evento
X = ‘números pares’), os resultados são dados pelo subconjunto P = {2; 4; 6}.
Além disso, um evento pode ter uma natureza qualitativa. Como na análise de adequação de uma
linha de produção, visando o controle de qualidade, definindo-se, assim, o Evento Y = {peça inadequada}.
Podemos classificar os eventos sob dois parâmetros. O primeiro diz respeito à simultanei-
dade de sua ocorrência: quando consideramos a possibilidade de dois ou mais eventos dentro
de um único espaço amostral, os eventos são considerados mutuamente exclusivos quando não
podem ocorrer sob uma mesma situação. Por exemplo, no lançamento de um dado de 6 faces, o
Evento X = {número par} não poderá ocorrer simultaneamente ao evento Y = {número ímpar}.
Já os eventos não mutuamente exclusivos são percebidos quando um evento não exclui
a ocorrência de outro. Considerando o caso do lançamento do dado de seis faces, os eventos
L = {número par} e M = {número menor ou igual a 4} podem ocorrer de maneira simultânea.
– 86 –
ESTATÍSTICA
O segundo parâmetro diz respeito à independência dos eventos. Eventos independentes são
percebidos quando a ocorrência de um não afeta a ocorrência de outro. Por exemplo, quando lan-
çamos dois dados, e para o primeiro estipula-se o Evento G = {número par} e no segundo o Evento
I = {número 5}: O fato de ocorrer ou não um número par no primeiro lançamento (Evento G) não
altera a probabilidade de ocorrência de um número ímpar no segundo lançamento (Evento I)
SAIBA MAIS!
Conheçaum diálogo entre a Estatística e a Pedagogia, a partir dos conceitos desta
aula, no capítulo 2 da dissertação de mestrado ‘O Acaso, o Provável, o Determinístico:
concepções e conhecimentos probabilísticos de professores do Ensino Fundamen-
tal’, disponível em: <http://repositorio.ufpe.br/bitstream/handle/123456789/3949/
arquivo6773_1.pdf?sequence=1>
Eventos dependentes são aqueles em que a ocorrência de um evento está ligada à ocorrência
de outro. Por exemplo, em um jogo de bingo, no qual o espaço amostral é formado por 75 núme-
ros, o sorteio de um número (Evento A) retira este número sorteado do espaço amostral do Evento
B (sorteio de outro número). O espaço amostral do Evento B tem, portanto, apenas 74 números
possíveis, pois o primeiro já foi sorteado no Evento A. Assim, os resultados esperados pelo Evento
B dependem do sorteio do primeiro número no Evento A (BUSSAB & MORETTIN, 2010).
5 Simples, certo, impossível

Os eventos podem ser classificados de acordo com os possíveis resultados que são gerados a
partir do espaço amostral. Eventos simples ocorrem quando há apenas um resultado previsto dentre
os possíveis resultados do espaço amostral. Por exemplo, quando se estipula o Evento A = {número
2} ao se lançar um dado, o conjunto de resultados possíveis é de um único elemento entre os seis
possíveis, ou seja, B = {2} (CRESPO, 2005). Quando, porém, há mais de um resultado possível, o evento
é composto, como quando esperamos obter resultados do evento B = {obter os números 2; 4; 6}.
Um evento certo acontece quando sua chance de ocorrer é de 100%; não há qualquer outro
resultado possível senão os dispostos no espaço amostral. Assim, os resultados de um evento
certo compõem o próprio espaço amostral.
EXEMPLO
Se ao lançar um dado nos orientamos pelo Evento F = {número natural de 1 a 6},
a chance de obter um dos seis resultados é de 100%. O evento F, assim definido, é
um evento certo.
– 87 –
ESTATÍSTICA
Quando não há nenhum elemento no espaço amostral que satisfaça o critério determinado
por um evento, dizemos que o mesmo é impossível. Por exemplo, ao lançar um dado de seis faces,
não há como obter um valor igual a 100. O conjunto que mostra os possíveis resultados deste
evento é vazio: S = Ø (CRESPO, 2005).
6 União e interseção
Em alguns momentos, dados podem repetir-se ou excluírem-se. É necessário, portanto, verificar
em uma distribuição quais são os resultados possíveis e os que se excluem mutuamente. Acompanhe
a tabela abaixo, que demonstra o número de alunos pertencentes a quatro diferentes cursos superiores.
Tabela 1 – Distribuição de alunos por curso e gênero
Masculino Feminino Total
Medicina 45 55 100
Economia 49 21 70
História 38 62 100
Ciências da Religião 18 12 30
Total 150 150 300
Um pesquisador poderia, por exemplo, determinar dois eventos relacionados aos dados que
compõem seu espaço amostral: A = {verificar quantos alunos, em relação ao geral, são estudantes
de Economia}, e B = {quantos estudantes, em relação ao todo, são do sexo masculino}. Neste caso,
o subconjunto que demonstrará os resultados é dado por C = {estudantes de Economia + estudantes
do sexo masculino}. Poderíamos pensar em apenas somar o total dos dois grupos menciona-
dos, com resultado igual a 150 + 70 = 220. Porém, esta informação não é correta, pois estamos
incluindo em duplicidade os alunos que são do sexo masculino e que fazem Economia. Assim, é
necessário subtrair o número de estudantes que satisfazem as duas condições dos eventos, ou
seja, a interseção, evitando-se, assim, uma duplicidade de contagem. Teremos, então, um conjunto
com resultado igual a 150 + 70 – 49 = 171, em que 49 é o número de elementos da interseção, ou
seja, Estudantes de Economia do sexo masculino.
Deste modo, quando somamos os conjuntos com os resultados de dois eventos diferentes,
unindo os conjuntos A e B, sob a fórmula A ∪ B, caso eles não sejam mutuamente exclusivos,
temos que retirar os elementos que estão sob dupla contagem, ou seja, pertencem aos conjuntos
relacionados aos dois eventos. Estes elementos estão realizando uma interseção entre os conjun-
tos (com notação A ∩ B). Deste modo, a união de conjuntos deve obedecer a fórmula:
A ∪ B = A + B – (A ∩ B)
– 88 –
ESTATÍSTICA
Podemos observar a ilustração desta situação na figura a seguir.
Figura 3 – Diagramas de união e interseção
21 49 101
Estudantes de Economia Estudantes do sexo masculino
Quando dois eventos são mutuamente independentes, não havendo elementos de interse-
ção, temos que A ∩ B = 0. Logo, A ∪ B = A + B (BUSSAB & MORETTIN, 2010).
Fechamento
•• conhecer as características de formação de um espaço amostral;

•• entender quais os tipos de evento que podem ser criados a partir da definição de um
problema de pesquisa.
Bibliografia
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro. Estatística Básica. 6.ed. São Paulo: Saraiva, 2010.
SANTANA, Michaelle Renata Moraes. O Acaso, o Provável, o Determinístico: concepções e conheci-

mentos probabilísticos de professores do Ensino Fundamental. Universidade Federal de Pernam-
buco, Recife, 2011. Disponível em: <http://repositorio.ufpe.br/bitstream/handle/123456789/3949/
arquivo6773_1.pdf?sequence=1>. Acesso em: 14 fev. 2017.
– 89 –
TEMA 12
Probabilidade: eventos complementares,
eventos independentes, eventos
mutuamente exclusivos
Introdução
Nesta aula, descreveremos importantes elementos relacionados à Teoria da Probabilidade
e seus desdobramentos, a partir do conceito de evento e da própria probabilidade, enquanto
mecanismo de verificação de possibilidades de ocorrência de um determinado fenômeno esta-
tístico. Assim, entenderemos como a Estatística Indutiva analisa os fenômenos estatísticos e
infere probabilidades para estas situações.
•• diferenciar os eventos complementares dos independentes e mutuamente exclusivos.
1 Probabilidade
Para viabilizar nosso entendimento sobre a definição da probabilidade, é importante recu-
perarmos alguns elementos. O primeiro deles é o de experimento aleatório, que é o resultado de
um processo no qual o pesquisador efetua inúmeras repetições de certa experiência, sem saber
previamente qual será o resultado, uma vez que eles são esperados, mas não podem ser previstos
(são atribuídos ao acaso). Em um jogo de dados de seis faces, por exemplo, o pesquisador que
lance um dado mil vezes saberá que nestas mil vezes encontrará valores entre 1 e 6, mas sem
saber qual deles aparecerá no próximo lançamento.
FIQUE ATENTO!
Não se confunda! Os resultados de um experimento aleatório são previstos, porém
não são previsíveis, ou seja, sabemos quais os possíveis resultados decorrentes do
experimento, mas não qual destes resultados iremos observar.
O segundo conceito é o de espaço amostral (também conhecido por conjunto universo), con-
junto que compreende todos os possíveis resultados decorrentes do experimento, especialmente
o aleatório. Por exemplo, ao lançarmos uma moeda no jogo de ‘cara ou coroa’, o espaço amostral
é dado por S = {cara; coroa}. No caso do jogo de dados de seis faces, os resultados formam o
conjunto universo U = {1; 2; 3; 4; 5; 6}.
– 90 –
ESTATÍSTICA
Figura 1 – Dados e experimentos aleatórios
Fonte: serpeblu/Shutterstock.com
FIQUE ATENTO!
O conjunto universo pode conter de um a infinitos elementos. Por exemplo, se um pes-
quisador deseja investigar a ocorrência de casos de uma doença infecto-contagiosa
na população brasileira, seu espaço amostral será toda a população do país.
O terceiro conceito é o de evento, que pode ser entendido como a sentença que orienta o
experimento do pesquisador. Por exemplo, considere um experimento aleatório, como o lança-
mento de um dado de 6 faces. Nele, o evento é A = {obter um número no lançamento de um dado}
e o espaço amostral correspondente é S = {1; 2; 3; 4; 5; 6}.
Nesta situação, o experimento de lançamento do dado torna possível a visualização de qualquer
resultado do espaço amostral, considerando que não há nenhum elemento que afete ou desvie o resul-
tado do experimento. Logo, temos que o espaço amostral “S” é um conjunto equiprovável, ou seja, há a
mesma possibilidade de visualização dos diferentes resultados em qualquer repetição do experimento.
Deste modo, os seis números do dado têm igual chance de serem sorteados no lançamento do mesmo.
Assim, a probabilidade de um determinado número ser sorteado no evento “A” é dada por:
n(A)
P (A) =
n(S)
Ou seja, a probabilidade é dada pela razão entre o número de elementos que compõem os
possíveis resultados de um evento, e o número de elementos que compõem o espaço amostral.
No exemplo do jogo de dados de 6 faces, a probabilidade do número “2” ser sorteado no dado é de
1/6, ou seja, P (X = 2) = 1/6, em que X representa o número sorteado.
– 91 –
ESTATÍSTICA
FIQUE ATENTO!
O cálculo das probabilidades é viável e lógico em situações nas quais o espaço
amostral é um conjunto equiprovável. Caso haja alguma variável que afete a estabili-
dade e o caráter aleatório do experimento, como um baralho marcado, por exemplo,
o cálculo das probabilidades associadas a um experimento perderá sua eficácia.
Figura 2 – Probabilidades em uma roleta
Fonte: Fer Gregory/Shutterstock.com
Há duas notações possíveis para a probabilidade, o uso de porcentagens ou a expressão

algébrica da razão mencionada na equação acima. Deste modo, podemos verificar que a proba-
bilidade de um evento aleatório qualquer, situa-se em qualquer ponto compreendido entre 0 e 1
(ou seja, de 0% a 100%).
SAIBA MAIS!
Aprofunde seu conhecimento sobre a Teoria da Probabilidade no segundo
capítulo da dissertação de mestrado de Rodrigo Rodrigues Fraga (UnB). Acesse:
<http://www.impa.br/opencms/pt/ensino/downloads/PROFMAT/trabalho_
conclusao_curso/2013/rodrigues_fraga.pdf>.
2 Probabilidade de ocorrência de um evento

Agora, entenderemos os diferentes tipos de eventos que fazem parte da Teoria das Probabi-
lidades. Acompanhe!
O evento certo é aquele cuja probabilidade de ocorrer é de 100%, de forma que todos os
elementos do espaço amostral são possíveis resultados deste evento. Suponhamos que um pes-
quisador selecione o evento B = {sortear um valor entre 1 a 6 em um dado}. Neste caso, há 100%
de chance deste evento ser bem-sucedido. Logo, sua probabilidade, dada por P(B), é igual a 1.
– 92 –
ESTATÍSTICA
Figura 3 – Apostas, probabilidades e corridas de cavalos
Fonte: Stefan Holm/Shutterstock.com
Eventos impossíveis são vistos quando nenhum dado do conjunto universo gera os resul-
tados necessários para o evento. Suponhamos que um pesquisador deseje o evento J = {obter
valores entre 10 e 15 em um dado de seis faces}. Não há elementos no espaço amostral para este
evento, logo, o conjunto de possíveis resultados é vazio, de notação Ø. Portanto, P (Ø) = 0. Neste
contexto, dizemos que o Φ (vazio) representa o evento impossível.
O evento simples ou elementar ocorre quando há apenas um resultado no espaço amostral
que satisfaz as condições de um evento. Por exemplo, o evento A = {obter número 6 em um dado}.
Neste caso, como n(A) = 1, temos que
n(A) 1
P (A) = =
n(S) n
Deste modo, o evento A mencionado acima tem probabilidade de 1/6: n(S) = 6.
3 Eventos complementares
Eventos estipulados pelo pesquisador, e experimentados, podem ocorrer ou simplesmente
não ocorrer. Por exemplo, ao adquirir um bilhete de loteria, o apostador pode ganhar ou perder.
Assim, dependendo da probabilidade envolvida no experimento, é muito mais provável que um
dado evento não ocorra que ocorra. Por exemplo, a chance de se ganhar o prêmio máximo em
certas loterias é de um para dezenas de milhões, muito inferior a 0,01%.
Assim, podemos pensar que um evento possui uma probabilidade de sucesso, dada por p,
e uma probabilidade de fracasso, dada por q. Este valor q está associado a um evento comple-
mentar, ou seja, o evento que resume a possibilidade contrária ao objetivo do pesquisador que
realiza o experimento.
– 93 –
ESTATÍSTICA
SAIBA MAIS!
Podemos verificar que as probabilidades relacionadas a um evento são números
reais entre zero e 1. Assim, há situações e experimentos cujas chances de sucesso
são extremamente remotas ou limitadas, ou seja, próximas de zero. Como ganhar
na loteria com uma aposta mínima, por exemplo.
Figura 4 – Sucesso e fracasso em máquinas caça-níqueis
Fonte: Cyclonphoto/Shutterstock.com
No exemplo do dado de 6 faces, sabemos que a chance do evento A = {obter número 6} é de

1/6. Mas, qual a chance do evento “A” não acontecer? O espaço amostral do evento, que é o número
de faces do dado, mostra que há ainda outros 5 resultados possíveis no experimento, de modo que
a probabilidade do evento complementar B = {obter número diferente de 6} é igual a P(B) = 5/6.
Assim, podemos verificar que a soma das probabilidades de eventos complementares é
igual a 1:
p+q=1
Assim, no exemplo do dado de 6 faces, há 1/6 de chances de um dado mostrar o número 6,

e 5/6 deste experimento fracassar, ou seja, de não se visualizar o número esperado. A soma de
probabilidades de eventos complementares, então, é igual a 1.
4 Eventos independentes
Eventos independentes são aqueles que podem ocorrer simultaneamente, de modo que a
ocorrência do primeiro evento não afeta a ocorrência do segundo evento. Assim, suponhamos, den-
tro do experimento aleatório de lançamento de um dado, dois eventos: B = {obter um número ímpar};
e C = {obter o número 4}. Você pode perceber que os resultados possíveis do evento B não afetam
– 94 –
ESTATÍSTICA
a ocorrência do evento C, pois o evento B tem como resultados possíveis os números do conjunto
F = {1; 3; 5}, e o evento C tem por resultados possíveis os números do conjunto A = {1; 2; 3; 4; 5; 6}.
Temos, então, uma combinação de eventos independentes. Neste caso, a probabilidade de
realização simultânea destes eventos é igual ao produto da probabilidade de realização de cada
evento em separado.
EXEMPLO
Se, ao lançarmos um dado, e considerarmos o evento A= {obter número 2} e o evento
B = {obter número 4}, qual a chance de obter sucesso no evento “A” e no evento “B”
simultaneamente? A probabilidade de sucesso no evento “A” é dada por P(A) = 1/6. O
evento “B” tem probabilidade de sucesso dada por P(B) = 1/6. Assim, a probabilidade
de sucesso no evento “A” e no evento “B” é dada por (1⁄6) × (1⁄6) = 1⁄36.
Deste modo, verificamos que quando dois ou mais eventos são independentes, a ocorrência
de um evento não depende, necessariamente, da ocorrência de outro evento.
5 Eventos mutuamente exclusivos

Dois ou mais eventos são considerados mutuamente exclusivos quando não podem, dentro
de um mesmo espaço amostral, ocorrer simultaneamente. Por exemplo, quando lançamos uma
moeda, os eventos A = {obter ‘cara’}, com probabilidade dada por p1, e B = {obter ‘coroa’}, com pro-
babilidade igual a p2, não podem ocorrer ao mesmo tempo. Se um evento se realiza, o outro não
poderá se realizar.
Neste caso, a probabilidade p, relacionada a eventos mutuamente exclusivos é dada pela
soma da probabilidade de realização de cada evento em separado, de modo que:
p1 + p2 = p
EXEMPLO
Suponhamos os eventos mutuamente exclusivos A = {obter número 4 no lança-
mento de um dado} e B = {obter número 6}. A probabilidade de obtermos sucesso
1 1 2 1
no evento A ou no evento B é dada por P ( A ) + P (B ) = + = =
6 6 6 3
– 95 –
ESTATÍSTICA
Fechamento
•• conhecer o conceito de probabilidade e entendê-lo a partir da ocorrência de um evento;

•• diferenciar as probabilidades associadas a eventos complementares, independentes e
mutuamente exclusivos.
Referências
FRAGA, Rodrigo Rodrigues. O estudo das loterias: uma abordagem motivadora e facilitadora para
aprendizagem da probabilidade no Ensino Médio. Instituto Nacional de Matemática Pura e Apli-
cada, Rio de Janeiro, 2013. Disponível em: <http://www.impa.br/opencms/pt/ensino/downloads/
PROFMAT/trabalho_conclusao_curso/2013/rodrigues_fraga.pdf.>. Acesso em: 18 fev. 2017.
– 96 –
TEMA 13
Probabilidade condicional e
regra do produto, regra da adição
Introdução
Nesta aula, estudaremos alguns desdobramentos relacionados à Teoria das Probabilidades.
Com base no conceito de probabilidade condicional, entenderemos as chances de ocorrência de
eventos cujos resultados pertencem a mais de uma variável de estudo. Assim, poderemos avaliar
as probabilidades da diferentes eventos ligados entre si.
•• entender a probabilidade condicional e aplicar as regras do produto e da adição.
1 Probabilidade condicional
Tenha em mente que um pesquisador pode utilizar bases de dados formadas por mais de
uma variável de estudo. Podemos pensar, por exemplo, em uma tabela que apresente dados
cruzados, como a seguinte:
Tabela 1 – Distribuição de alunos por curso e gênero
Masculino Feminino Total
Veterinária 48 52 100
Administração 51 19 70
Sociologia 35 65 100
Ciências Contábeis 16 14 30
Total 150 150 300
Você pode verificar que os dados pertencem a mais de uma variável. Caso tivéssemos os alu-
nos distribuídos apenas por curso, poderíamos efetuar experimentos, como selecionar um grupo
ao acaso e verificar a probabilidade de escolhermos um aluno de cada curso.
– 97 –
ESTATÍSTICA
Mas como poderemos verificar essa probabilidade se tivermos mais de uma variável de
análise, ou quando temos mais de uma situação a ser analisada de forma simultânea? Nessas
situações, utilizamos a probabilidade condicional. A probabilidade é a razão que avalia as chan-
ces de ocorrência de um denominado evento, cujos possíveis resultados estão submetidos a um
espaço amostral (BUSSAB; MORETTIN, 2010).
Um evento é uma sentença, uma hipótese assumida no momento de realizar um experi-
mento. Imagine o evento A =obter uma carta de naipe “ouros” em um baralho francês. O espaço
amostral é o conjunto de elementos que podem gerar os possíveis resultados desse experimento,
como o conjunto S = {52 cartas de um baralho francês}.
Desse modo, a probabilidade de realização do evento A é dada pela razão entre seus possíveis
resultados e o número de elementos do conjunto S:
n(A)
P (A) =
n(S)
FIQUE ATENTO!
A probabilidade de sucesso do Evento A é dada por P(A) = 13/52 = ¼, posto que o

baralho francês contém 13 cartas de cada um dos quatro naipes.
Retomando o raciocínio sobre a tabela apresentada anteriormente, podemos nos deparar

com situações em que é necessário analisar mais de uma varável dentro de um mesmo evento.
Por exemplo, se um estudante, escolhido ao acaso, for do curso de Veterinária, a probabilidade de
que ele seja homem é de 0,48, ou 48%, pois dos cem alunos deste curso, 48 são homens.
Assim, descrevemos estas duas situações da seguinte forma:
P (homem | Veterinária) = 0,48
Saiba que o sinal ‘|’ demonstra a chamada probabilidade condicional, que são situações nas
quais um evento estatístico está condicionado à ocorrência de outro, e ambos devem ser calculados
conjuntamente, de acordo com a equação:
P ( A ∩ B )
P ( A | B) =
P (B)
Reforçando: A expressão P(A | B) resume, sinteticamente, a probabilidade de o evento B

ocorrer após o evento A. Por sua vez, a expressão P (A ∩ B) é a probabilidade de os eventos A e B
ocorrerem simultaneamente. E P(B) resume a probabilidade de ocorrência do evento B (BUSSAB;
MORETTIN, 2010).
Em um conjunto de dados formado por mais de uma variável, há elementos que se cruzam,
ou seja, estão em interseção.
– 98 –
ESTATÍSTICA
FIQUE ATENTO!
Há 48 alunos homens dentro do curso de Veterinária frente a uma população geral de

300 alunos. Esses são os dados em intersecção, estando descritos em dois conjuntos.
Figura 1 – Intersecção de sub-conjuntos
52 48 102
Estudantes de Veterinária Estudantes do sexo masculino
Pelo mesmo raciocínio, imagine o evento A = {aluno é homem} e B = {aluno é matriculado em

veterinária}. Assim, se nós escolhermos ao acaso um aluno e ele for estudante de Veterinária, a
probabilidade de que ele seja homem é dada por:
P ( A ∩ B ) 48 / 300 48
P ( A | B) = = = = 0, 48
P (B ) 100 / 300 100
2 Regra do produto
Observe a equação da probabilidade condicional. Podemos transpor a razão P(B) para a
esquerda, obtendo assim a seguinte equação:
P(A ∩ B) = P (A│B) × P(B)
Assim, a probabilidade de ocorrência simultânea entre dois eventos é dada pelo produto entre
a probabilidade de ocorrência do segundo evento após o primeiro evento, e a probabilidade do
segundo evento (BUSSAB; MORETTIN, 2010).
Imagineque temos uma urna com cinco fichas, sendo duas brancas (B) e três pretas (P).
São retiradas duas fichas, uma de cada vez, sem reposição. Ou seja, após retirarmos uma ficha,
– 99 –
ESTATÍSTICA
haverá somente mais quatro na urna. Por meiode um diagrama, podemos verificar o conjunto de
possibilidades desse sorteio.
Figura 2 – Diagrama de sorteio de fichas sem reposição
B
1/4
B
2/5
3/4
P
2/4
3/5
P
2/4
P
Podemos calcular, ainda, a probabilidade de ocorrência de cada conjunto de extrações!
Tabela 2 – Resultados e probabilidades
Resultado Probabilidade
BB 2/5 × 1/4 = 2/20
BP 2/5 × 3/4 = 6/20
PB 3/5 × 2/4 = 6/20
PP 3/5 × 2/4 = 6/20
Se temos o evento A = {ficha branca no segundo sorteio}, as cores sorteadas que correspon-
dem aos possíveis resultados desse experimento podem ser dados pelo conjunto A = {BB, PB},
cujas probabilidades de ocorrência são de, respectivamente, 2/20 e 6/20. Assim, P(A) = P(BB) +
P(PB) = 2/20 + 6/20 = 8/20(BUSSAB; MORETTIN, 2010).
– 100 –
ESTATÍSTICA
3 Regra da adição
Imagine que um apostador possa, em uma roleta com vinte números pretos e vinte vermelhos,
apostar no número 3 e em qualquer número vermelho. Assim, temos dois eventos, A = {sorteio do
número 3} e B = {sorteio de um número vermelho}.
SAIBA MAIS!
Esses eventos não são mutuamente exclusivos, ou seja, a realização de um evento
não impede a realização de outro. Pode-se obter o número 3 no primeiro evento
sem que isso inviabilize a possibilidade do sorteio de um número vermelho.
Podemos verificar que há 21 possíveis resultados para esses eventos em um conjunto A ∪ B =

{20 vermelhos + o valor ‘3 preto’}. Há um elemento que pertence aos dois sub-conjuntos, o número
3 vermelho. Neste caso, a probabilidade de realização de um ou outro evento, conforme a regra da
adição, é dada pela seguinte equação (BUSSAB; MORETTIN, 2010):
P(A ∪ B) = P(A) + P(B) – P(A ∩ B )
2 20 1 21
Assim, teremos: P (A ∪ B ) = + – = = 0,525 .
40 40 40 40
4 Princípio da contagem
Como estamos analisando diferentes arranjos, podemos nos deparar com situações as
quais as etapas de um experimento gerem uma série de diferentes resultados.
EXEMPLO
Se em uma urna há uma bola branca (B) e uma preta (P), e retiramos uma por vez,
repondo-as depois, quantas combinações possíveis há se esse processo é repetido
três vezes?
Bem, os possíveis resultados são dados pelo conjunto A = {(BBB), (BBP), (BPB),
(PBB), (BPP), (PBP), (PPB), (PPP)}. Se houvesse apenas uma etapa nesse expe-
rimento, veríamos apenas uma bola branca ou uma preta, em dois resultados (a
probabilidade de ocorrência de cada um é igual a ½). Com duas etapas, há quatro
resultados (as chances de ocorrência de cada um são iguais a ½ × ½ = ¼), mas com
três etapas, poderemos ter oito resultados.
Esse exemplo nos mostra o conceito do princípio da contagem: se um experimento pode ser
realizado em “n” etapas, o total de resultados possíveis será dado pelo produto entre os resultados
possíveis (m) e o número de etapas (n), na fórmula (m x n) (BUSSAB; MORETTIN, 2010).
– 101 –
ESTATÍSTICA
FIQUE ATENTO!
O princípio da contagem nos permite analisar as diferentes combinações que po-
dem ser geradas em um experimento com um dado número de etapas. Estas eta-
pas podem tender ao infinito, com infinitos resultados possíveis.
A organização dessas informações obedece a alguns princípios relacionados à análise com-

binatória. Continue acompanhando!
5 Revisão de análise combinatória

Há situações em que a contagem direta e individual pode ser um processo muito trabalhoso.
Assim, utilizamos a análise combinatória para obter o número de resultados prováveis de um
evento dividido em múltiplas etapas. Buscamos as combinações que podem ser visualizadas
como consequência de um evento(MILONE; ANGELINI, 1993).
SAIBA MAIS!
Conheça mais referências históricas sobre a análise combinatória lendo o artigo
de Cristiane Roque Vazquez e Fabiane Höpner Noguti, disponível em: <http://www.
sbem.com.br/files/viii/pdf/05/1MC17572744800.pdf>.
Há três fórmulas para conhecermos o número de possíveis resultados de um evento e sua

probabilidade de ocorrência: a permutação; os arranjos; e as combinações. A permutação é o
processo de ordenar e reordenar os dados do conjunto dos possíveis resultados de um evento em
uma sequência definida pelo pesquisador (MILONE; ANGELINI, 1993). Há dois tipos de operações
de permutação: com repetição e sem repetição.
Permutações sem repetição ocorrem quando os possíveis resultados de um evento não se
repetem. Assim, o número de resultados possíveis é dado pela fórmula:
Pn = n!
Aqui “n!”, o chamado fatorial do número n, é o produto de todos os números naturais que
começam em n e terminam no número 1, de modo que n! = n × (n –1) × (n – 2) × (...) × 3 × 2 × 1.
EXEMPLO
Em um jogo de bingo, faltam apenas seis bolas para serem sorteadas, numeradas
de 1 a 6. Quantos possíveis resultados, sem repetição, podem ser vistos? Podemos
iniciar uma contagem manual pelo conjunto A = {123456; 123465; 123645...}, ou,
sabendo que não há repetição, verificar que os resultados são dados por:
– 102 –
ESTATÍSTICA
P6 = 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720
Em outras palavras, há 720 possíveis resultados.
As permutações com repetição ocorrem quando há elementos iguais dentro de uma mesmo
espaço amostral (como n elementos do tipo 1, n do tipo 2 etc.). O número dos possíveis resultados
é dado pela fórmula:
n!
n Pn1, …, nk =
n1!…nk!
Consideremos a palavra “ASSIM”. Quantos anagramas (disposições diferentes das letras de

uma palavra) podemos fazer com o vocábulo? Ora, sabemos que essa palavra possui 1 letra A, 2 S,
1 I e 1 M. De modo que, pelas regras da permutação com repetição, obteremos:
5! 120
5 P1,2,1,1 = = = 60
1!2!1!1! 1x 2 x1x1x1
Logo, a palavra ASSIM possui 60 anagramas.

Um outro tipo de dispositivo de combinação é o arranjo, que é o número total de resultados
viáveis nos subconjuntos de “x” elementos de um espaço amostral de “n” elementos (MILONE;
ANGELINI, 1993). Observe a fórmula:
n!
A n, x =
( x)!
n–
Considere, como exemplo, uma corrida de cães com oito competidores, nomeados entre A
e H. Quantos resultados são possíveis de serem visualizados na classificação de 1º, 2º e 3º luga-
res?Como operamos um subconjunto de dados (1º, 2º e 3º), utilizamos a fórmula do arranjo:
7! 7! 7 * 6 * 5 * 4 !
A 7,3 = = = = 7 * 6 * 5 = 210
( 7 – 3) ! 4! 4!
Sabendo portanto, que há 210 resultados possíveis para o primeiro ao terceiro lugares, a
probabilidade de acerto de um apostador nos três primeiros lugares é dada por P(A) = 1/210 =
0,00476 = 4,76%.
Um terceiro tipo de análise é o das combinações, no qual a ordem dos elementos dispostos
como resultado de um evento em etapas não é importante. Nesse caso, o resultado ABC, por
exemplo, não é diferente de CBA no sorteio de fichas contendo cada uma destas letras. Perceba
que a fórmula para combinações é dada por:
– 103 –
ESTATÍSTICA
n!
Cn,r =
r! ( n–r ) !
Reflita, por exemplo, sobre quantos grupos diferentes, de quatro pessoas cada um, podemos
fazer com oito pessoas. O resultado é dado por:
8! 8! 8 x 7 x 6 x 5 x 4 ! 1680
C8,4 = = = = = 70
4 ! ( 8– 4 ) ! 4 !4 ! 4 !4 ! 4!
Nesse caso, podemos formar setenta grupos diferentes (MILONE; ANGELINI, 1993).
Fechamento
•• conhecer as regras da probabilidade adicional, do produto e da adição;

•• entender o princípio da contagem a partir das diferentes etapas de um evento.
Referências
BUSSAB, Wilton de Oliveira; MORETTIN, Pedro. Estatística Básica.6.ed. São Paulo: Saraiva, 2010.
VASQUEZ, Cristiane Roque; NOGUTI, Fabiane Höpner. Análise Combinatória: Alguns aspectos
e uma abordagem pedagógica. In:Anais do VIII Encontro Nacional de Educação Matemática,
Recife, 2004. Disponível em:<http://www.sbem.com.br/files/viii/pdf/05/1MC17572744800.pdf>.
Acesso em:03 mar. 2017.
– 104 –
TEMA 14
Variáveis aleatórias e distribuições de
probabilidade
Introdução
Nesta aula, você estudará as variáveis aleatórias e as distribuições de probabilidade. Por meio
delas, você compreenderá como são realizadas operações que envolvem conjuntos de resultados
finitos e infinitos, e como a Estatística trata essas diferentes possibilidades.
•• conceituar variáveis aleatórias, distribuições de probabilidade e valor esperado.
1 Variáveis aleatórias discretas

O estudo das probabilidades tem por objetivo verificar as chances de ocorrência de um evento
em torno de uma série de resultados esperados. Assim, temos a possibilidade de associar as
informações decorrentes de cada evento a uma lista de valores ou a uma função. Denominamos
essas duas variáveis como variáveis aleatórias. Elas descrevem e representam pontos do espaço
amostral, que é o conjunto de possíveis resultados de um experimento (MILONE; ANGELINI, 1993).
Uma variável aleatória é uma função que associa um número real a cada resultado do espaço
amostral. As variáveis aleatórias se dividem em discretas e contínuas. Quando o conjunto de valo-
res de um espaço amostral é finito (como no caso de efetuarmos uma contagem de uma popula-
ção), dizemos que a variável aleatória é discreta.
Imagine que você retirou ao acaso uma carta de um baralho francês que conta com 52 car-
tas e quatro naipes. Aqui, sabemos que o espaço amostral é finito (52 cartas). Assim, a variável
aleatória X= {ouros}, por exemplo, tem treze resultados possíveis. Nesse caso, a probabilidade
13
de sucesso de retirarmos uma carta desse naipe é dada por p (= X {ouros=}) = 1/ 4 (MILONE;
52
ANGELINI, 1993). Essa variável, portanto, é discreta!
2 Variáveis aleatórias contínuas

Há distribuições em que o espaço amostral é infinito, e não pode ser mensurado antecipa-
damente. Nesse caso, o resultado de um experimento pode assumir qualquer valor dentro de um
intervalo de resultados, e a associação de uma função ao conjunto de resultados gera as variáveis
aleatórias contínuas (MILONE; ANGELINI, 1993).
– 105 –
ESTATÍSTICA
Por exemplo, sabemos que até o mês de fevereiro de 2017, segundo a Federação Internacio-
nal de Atletismo, o recorde mundial de tempo na corrida de cem metros rasos foi de 9,58 segundos
(IAAF, 2017). Um pesquisador que pretenda verificar o desempenho de um grupo de velocistas
no prazo de até 60 segundos deve considerar que os resultados possíveis se dão a partir de 9,58
segundos, de modo que o intervalo de resultados é dado por 9,58 ≤ X ≤ 60.
FIQUE ATENTO!
Na situação citada, consideramos que não há outros elementos que possam afetar
a condução do experimento do teste de corrida. Descartamos a possibilidade de
algum desses velocistas correrem os cem metros em um tempo inferior a 9,58
segundos, por exemplo. As medições de tempo são variáveis contínuas, já que, em
um minuto, há infinitas combinações de resultados (segundos, milionésimos de
segundo etc.).
Figura 1 – Velocidade e tempo geram variáveis aleatórias contínuas
Fonte: Kaliva / Shutterstock.com
SAIBA MAIS!
Conheça mais sobre as variáveis aleatórias lendo o segundo capítulo da monografia
de Rafael Pedro Mariotto (UFSC), disponível em: <https://repositorio.ufsc.br/
bitstream/handle/123456789/96591/Rafael.pdf?sequence=2>.
– 106 –
ESTATÍSTICA
Sabendo, portanto, que os resultados possíveis do experimento da corrida são dados entre
9,58 e 60 segundos, a probabilidade P (9,58 ≤ X ≤ 60) indica a chance de um valor da variável aleató-
ria X estar em algum ponto entre os valores 9,58 e 60.
3 Distribuições de probabilidade
Cada valor de uma variável aleatória X com n elementos está associada a um resultado
amostral de um experimento, de modo que essa variável possa assumir os valores x1, x2 , x3 , … x n .
A probabilidade associada a cada valor xi , ou seja, de visualizarmos um certo valor xi , é dada por
pi . Em outras palavras, a chance de obtermos o valor xi é igual a pi .
Cada valor xi corresponde a uma probabilidade pi , de modo que a soma das probabilidades
de obtermos valores de uma variável aleatória é igual a 1:
∑ i=1 p = 1
n
i
Esse conjunto de probabilidades associado a uma variável aleatória é denominado distri-

buição de probabilidade (CRESPO, 2005). Por exemplo, se temos a variável aleatória X = {obter o
naipe ‘ouros’} ao retirar uma carta de um baralho, podemos obter os resultados ouros, espadas,
copas, paus. Cada um desses valores está associado a apenas uma probabilidade de realização,
de modo que a soma dessas probabilidades é igual a 1. A distribuição de probabilidade é dada pela
tabela a seguir:
Tabela 1 – Distribuição de probabilidades
X P(X)
Ouros 13/52
Espadas 13/52
Copas 13/52
Paus 13/52
TOTAL 52/52 = 1
FIQUE ATENTO!
Espaços amostrais podem conter apenas parte de uma população, ou seu todo, em
infinitos resultados possíveis.
– 107 –
ESTATÍSTICA
Distribuições de probabilidade, assim como as variáveis aleatórias a elas associadas, tam-

bém podem ser discretas ou contínuas.
4 Distribuições discretas de probabilidade

A distribuição discreta de probabilidade está associada a variáveis aleatórias discretas
(quando os resultados do conjunto amostral são finitos). Um exemplo de distribuição discreta de
probabilidade é a distribuição binomial. Nela, os elementos do espaço amostral podem ser agru-
pados em duas classes diferentes, mutuamente exclusivas.
Imagine uma linha de produção em que as peças podem ser “defeituosas” ou “não defeituosas”,
em um critério qualitativo (MILONE; ANGELINI, 1993). A distribuição binominal é aplicável quando o
experimento segue o chamado processo de amostragem de Bernoulli, cujas condições são:
•• existência de “n” repetições do experimento em igualdade de condições;

•• eventos independentes, ou seja, que não se relacionam (como no caso de peças defei-
tuosas ou perfeitas);
•• apenas dois resultados possíveis que se excluem mutuamente.
Dada a independência dos eventos e a igualdade de condições nas repetições, a probabi-

lidade de ocorrência dos resultados esperados é constante em todas as tentativas (MILONE;
ANGELINI, 1993).
FIQUE ATENTO!
Em eventos mutuamente exclusivos, a ocorrência de um evento necessariamente

exclui a ocorrência de outro.
As probabilidades associadas a uma distribuição binominal seguem o padrão “sucesso” ou

“fracasso” de um experimento, de modo que o cálculo da probabilidade é dado por:
P ( x ) = Cn, x × p x × qn− x
Em que:
n é o número de repetições do experimento;
x é o número desejado de sucessos, ou sua proporção;
(n - x) é a proporção ou o número de fracassos;
p é a probabilidade de sucessos;
q é a probabilidade de fracassos, de modo que q = 1− p ;
– 108 –
ESTATÍSTICA
Cn, xé o número total de combinações de “n” elementos entre si, em que a ordem não é rele-
vante (como quando um triângulo ABC é o mesmo que um triângulo BAC). Esse valor é dado pela
seguinte equação:
n!
Cn, x =
x !( n − x )!
Em que:
n! = n × (n - 1) × (n - 2) × … × 3 × 2 × 1 (MILONE; ANGELINI, 1993).
Por exemplo, 4! = 4 × 3 × 2 × 1 = 24.
EXEMPLO
Uma firma produz 10% de peças defeituosas. Qual é a probabilidade de uma
amostra de 4 peças possuir 3 perfeitas e uma defeituosa? A probabilidade de su-
cesso no evento A = {peça em bom estado} é igual a 90%, já que 10% são defeituo-
sas. Assim, temos n = 4 e x = 3. Logo, aplicando a fórmula:
P ( x ) = Cn, x × p x × qn− x , obtemos p ( x =

3) =
C4,3 × p ( sucesso ) × q ( fracasso )
3 4 −3
=
C4,3 × 0,903 × 0,1 =
4! 4 × 3× 2 ×1
C4,3× 0,07 = × 0,07 = × 0,07 =
4 × 0,07 =
0,28 =
28%
3! ( 4 − 3) ! 3 × 2 × 1× 1
5 Distribuições contínuas de probabilidade

Quando a variável aleatória pode assumir qualquer valor em um intervalo, a distribuição de
probabilidade é contínua. Dentro desse intervalo, há infinitos possíveis resultados que satisfazem
um evento. Assim a probabilidade de uma variável aleatória X, definida pela função f(x), ser locali-
b
zada no intervalo a < × < b é dada por P ( a < X < b ) =
∫ a f ( x ) dx (MILONE; ANGELINI, 1993). Na próxima
figura, você perceberá que há uma relação entre a área sob a curva (dada pela integral ∫ba f ( x ) dx ) e
a probabilidade associada à variável aleatória X.
Como há infinitos resultados possíveis para esses experimentos, a probabilidade de encon-
trarmos um valor particular “a” é igual a zero, ou seja, P ( X= a )= 1/ ∞= 0 . Geometricamente, esse
resultado seria calculado como uma integral entre a e a, ou seja, ∫ aa f ( x ) dx = 0
Um exemplo de distribuição contínua de probabilidades é a distribuição normal. Ela se aplica
à análise de grandes amostras e possui algumas propriedades, entre as quais destacamos a repre-
sentação gráfica ser perfeitamente simétrica, tendo sua curva um formato de sino.
– 109 –
ESTATÍSTICA
SAIBA MAIS!
A distribuição normal possui uma série de aplicações, como na Ciência Política, por
exemplo, para a verificação das preferências de voto dos eleitores.
Em consequência, 50% dos valores são inferiores à média, e 50% são superiores, de modo
que o ponto médio da distribuição é o ponto máximo da função f(x) (MILONE; ANGELINI, 1993).
Figura 2 – Distribuição normal, uma distribuição contínua

99,9%
99,7%
95,2%
34,1% 34,1%
13,6% 13,6%
2,15% 2,15%
0,1% 0,1%
0
-4 -3 -2 -1 0 1 2 3 4
Perceba a relação entre a área da curva e a distribuição de probabilidades. Considerando que

a média da variável aleatória é igual a zero, observamos que entre a média zero e o valor 3 (corres-
pondente a três vezes o desvio padrão, ou seja, o afastamento dos dados da variável em relação à
média) há 99,7% dos elementos da variável aleatória. A área à direita da média (calculada através
da integral ∫ a f ( x ) dx ) corresponde a 50% dos elementos da variável.
b
6 Valor esperado
O valor esperado, ou esperança matemática, é a medida de tendência central das variáveis
aleatórias. Trata-se, portanto, da média ponderada dos valores que a variável aleatória X poderá
– 110 –
ESTATÍSTICA
assumir (MILONE; ANGELINI, 1993). Em variáveis aleatórias discretas, o cálculo do valor esperado
é dado por:
E ( X ) =( X1 × f1 ) + ( X2 × f2 ) + (…) + ( X n × fn ) =∑ fi × Xi
Aqui, fi representa a frequência relativa, ou seja, probabilidade de ocorrência de um evento.

A frequência relativa é dada pela razão entre a frequência absoluta (o número de vezes que um
valor Xi é observado em uma população com n elementos) e o número total de observações (n),
conforme a fórmula:
∑ Xi
fi =
n
EXEMPLO
Qual é o valor esperado de “coroas” (use C para cara e K para coroa) no experimento
discreto do lançamento de quatro moedas? Se lançarmos três moedas, há pos-
sibilidade de obtermos oito (23) resultados diferentes. Logo, o espaço amostral é
formado pelo conjunto S = {(CCC), (CCK), (CKC), (KCC), (KKC), (KCK), (CKK), (KKK)}.
Há apenas uma chance em oito de as três moedas exibirem “coroa”, logo, a frequ-
ência relativa na obtenção de três coroas é f3= 1= 0,125 . Confira as probabilidades
8
relativas às observações.
Figura 3 – Distribuição de frequências no lançamento de seis moedas
Coroas fi fi x Xi
0 0,125 0
1 0,375 0,38
2 0,375 0,75
3 0,125 0,38
SOMA 1,00 1,50
Logo, o valor esperado da variável aleatória discreta X = {número de “coroas” no

lançamento de seis moedas} é igual a 1,5, ou seja, no lançamento, espera-se obter
1,5 coroas.
Para variáveis contínuas e definidas por X = f ( x ) , o valor esperado será dado pela integral da
função E ( x ) = ∫ f ( x ) dx .
– 111 –
ESTATÍSTICA
Fechamento
•• conhecer os conceitos de variável aleatória e suas distinções (discreta e contínua) a

partir do conceito de distribuição de probabilidade;
•• entender o conceito de esperança matemática, ou valor esperado, e sua expressão
algébrica.
Referências
INTERNATIONAL ASSOCIATION OF ATHLETICS FEDERATIONS (IAAF). Toplists – Senior Outdoor

– 100 meters men. Disponível em: <https://www.iaaf.org/records/toplists/sprints/100-metres/
outdoor/men/senior>. Acesso em: 06 mar. 2017.
MARIOTTO, Rafael Pedro. Introdução às Variáveis Aleatórias e Cadeias de Markov. Monografia.

(Licenciatura em Matemática) - Universidade Federal de Santa Catarina, 2009. Disponível em:
<https://repositorio.ufsc.br/bitstream/handle/123456789/96591/Rafael.pdf?sequence=2>.
Acesso em: 28 fev. 2017.
– 112 –
TEMA 15
Distribuição normal da probabilidade
Introdução
Nesta aula, você conhecerá a distribuição normal de probabilidade e sua representação grá-
fica. Por meio desses conceitos, é possível estimar a probabilidade de ocorrência de eventos esta-
tísticos dentro de margens de variação em torno da média dos valores observados em um experi-
mento. Abordaremos, ainda, as possibilidades de manipulação de amostras e suas probabilidades
com o Teorema do Limite Central.
•• identificar a curva normal da probabilidade.
1 Distribuição normal
Você já percebeu que nas pesquisas de intenção de voto anunciadas pelos noticiários sem-
pre há uma “margem de erro de n pontos percentuais para mais ou para menos”? Esta expressão
diz respeito à probabilidade de erro na porcentagem real das preferências de voto dos eleitores,
obtidas a partir de um experimento de pesquisa com amostras de tamanho grande.
Nesses casos, é possível verificar que o comportamento da amostra segue uma distribuição
razoavelmente uniforme, com a maior parte dos resultados situando-se dentro de uma margem
de confiança.
FIQUE ATENTO!
No caso das eleições, as pesquisas indicam qual é a porcentagem de votos espera-
da para um determinado candidato, com a possibilidade de uma oscilação (margem
de erro), a qual define o grau de exatidão de uma pesquisa com grandes amostras.
Esse modelo de distribuição de probabilidades é conhecido como distribuição normal.

Nela, as probabilidades associadas a cada valor da amostra estão distribuídas de maneira uni-
forme em torno da média. Seu aspecto gráfico é dado pela imagem a seguir.
– 113 –
ESTATÍSTICA
Figura 1 – Distribuição normal
0
μ-σ μ μ+σ
Esta ilustração corresponde à chamada curva normal. Perceba que os múltiplos resultados
que compõem a amostra distribuem-se igualmente em torno da média, dada por μ. Assim, pode-
mos verificar que a distribuição é simétrica, pois há 50% de elementos abaixo da média e 50%
acima (MILONE; ANGELINI, 1993).
As margens definidas pelo desvio padrão (σ), dadas pelo intervalo (μ – σ, μ + σ), demonstram
o grau de homogeneidade da distribuição de elementos, ou seja, a dispersão do conjunto de dados,
sendo que quanto menor for o desvio padrão, menos dispersos estarão os dados em torno da
média (BUSSAB; MORETTIN, 2010).
FIQUE ATENTO!
No exemplo mencionado e a partir do conceito do desvio padrão, quanto menor for

esse desvio, menor será a “margem de erro” da pesquisa.
Podemos efetuar algumas considerações sobre a distribuição normal. Confira!
•• Sua representação gráfica é semelhante a um sino, dada sua simetria em torno da

média.
•• Como consequência, 50% dos valores são inferiores à média e 50% superiores a ela.
•• Os pontos de inflexão, no quais há mudança do sinal de crescimento da variável
analisada (positivo/negativo), são determinados pelo desvio padrão, de modo que
a função de distribuição normal N possui média igual a μ e desvio padrão igual a σ,
podendo ser resumida por N(μ,σ).
•• Os pontos de inflexão estão a um desvio padrão de distância da média.
O ponto médio da distribuição é o ponto máximo da função de distribuição, situado sobre a

média (MILONE; ANGELINI, 1993).
– 114 –
ESTATÍSTICA
SAIBA MAIS!
A simetria em torno da média faz com que cada metade do gráfico de distribuição
normal seja um “espelho” da outra metade, de modo que a área dessas duas figuras
é igual.
Conhecendo as distribuições normais, podemos verificar as probabilidades de ocorrência de

determinados eventos dentro de uma certa margem de variação (CRESPO, 2005). Por exemplo, se
sabemos que uma firma produz canetas com peso médio de 60 gramas, com 5% de variação para
mais ou menos (ou seja, com desvio padrão de 3 gramas), qual é a probabilidade de uma caneta
pesar entre 60 e 62 gramas? Descobriremos a resposta nas próximas seções.
2 Distribuição normal padrão

Como demonstramos anteriormente, a distribuição normal se caracteriza pela simetria da
organização de valores em torno da média. Desse modo, verificamos que existem infinitas possi-
bilidades de distribuições simétricas, cada uma com uma média. Sabendo, no entanto, que essa
situação é constante nas distribuições normais, é possível realizar uma padronização, isto é, tornar
constante a média μ = 0 e o desvio padrão σ =1 por meio de transformações algébricas.
Trata-se da distribuição normal padronizada, ou padrão, de notação N(0,1), ou seja, com
média zero e desvio padrão igual a 1. A partir dela, podemos estabelecer mais facilmente as pro-
babilidades de ocorrência de eventos em torno da média e do desvio padrão das diferentes distri-
buições normais (MILONE; ANGELINI, 1993).
FIQUE ATENTO!
As probabilidades associadas às distribuições padronizadas estão dispostas na

Tabela de Probabilidades.
– 115 –
ESTATÍSTICA
Figura 2 – Distribuição normal e probabilidades
Fonte: Lamnee / Shutterstock.com
Quando realizamos a padronização, temos por resultado a criação de uma variável Z, que
mede o afastamento das variáveis em relação à média, em número de desvios padrões, a partir
da expressão:
X −µ
Z=
σ
Entenda que o Z é o número de desvios padrões, a partir da média, ao passo que X representa
os infinitos valores relacionados à variável de estudo. O indicador μ, por sua vez, é a média da dis-
tribuição, e σ corresponde ao desvio padrão (CRESPO, 2005). A seguir, verificaremos a aplicação
prática desse conceito.
3 Determinando probabilidades
Agora que você já sabe que, à medida que padronizamos a distribuição normal, conseguimos
obter com maior facilidade as probabilidades de ocorrência de variações em relação à média, ao
valor esperado de um experimento. O que se realiza, na verdade, é uma relativização, uma opera-
ção de padronização de dados em torno de uma média pré-definida (CRESPO, 2005).
Com efeito, uma vez que padronizamos as distribuições normais e as reduzimos a uma dis-
tribuição N(0,1), podemos previamente calcular as probabilidades associadas a esta distribuição,
por meio da Tabela de Distribuição de Probabilidades.
– 116 –
ESTATÍSTICA
Tabela 1 – Tabela de Distribuição de Probabilidades associada a uma distribuição normal N(0,1)

Parte
Parte Segunda decimal de Zc inteira e
inteira e
primeira
primeira
decimal
de Zc 0 1 2 3 4 5 6 7 8 9
de Zc
P =0
0,0 00000 00399 00798 01197 01595 01994 02392 02790 03188 03586 0.0
0,1 03983 04380 04776 05172 05567 05962 06356 06749 07142 07535 0,1
0,2 07926 08317 08706 09095 09483 09871 10257 10642 11026 11409 0,2
0,3 11791 12172 12552 12930 13307 13683 14058 14431 14803 15173 0,3
0,4 15542 15910 16276 16640 17003 17364 17724 18082 18439 18793 0,4
0,5 19146 19497 19847 20194 20540 20884 21226 21566 21904 22240 0,5
0,6 22575 22907 23237 23565 23891 24215 24537 24857 25175 25490 0,6
0,7 25804 26115 26424 26730 27035 27337 27637 27935 28230 28524 0,7
0,8 28814 29103 29389 29673 29955 30234 30511 30785 31057 31327 0,8
0,9 31594 31859 32121 32381 32639 32894 33147 33398 33646 33891 0,9
1,0 34134 34375 34614 34850 35083 35314 35543 35769 35993 36214 1,0
1,1 36433 36650 36864 37076 37286 37493 37698 37900 38100 38298 1,1
1,2 38493 38686 38877 39065 39251 39435 39617 39796 39973 40147 1,2
1,3 40320 40490 40658 40824 40988 41149 41309 41466 41621 41774 1,3
1,4 41924 42073 42220 42364 42507 42647 42786 42922 43056 43189 1.4
1,5 43319 43448 43574 43699 43822 43943 44062 44179 44295 44408 1,5
1,6 44520 44630 44738 44845 44950 45053 45154 45254 45352 45449 1,6
1,7 45543 45637 45728 45818 45907 45994 46080 46164 46246 46327 1,7
1,8 46407 46485 46562 46638 46712 46784 46856 46926 46995 47062 1,8
1,9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47670 1,9
2,0 47725 47778 47831 47882 47932 47982 48030 48077 48124 48169 2,0
2,1 48214 48257 48300 48341 48382 48422 48461 48500 48537 48574 2,1
2,2 48610 48645 48679 48713 48745 48778 48809 48840 48870 48899 2,2
2,3 48928 48956 48983 49010 49036 49061 49086 49111 49134 49158 2,3
2,4 49180 49202 49224 49245 49266 49286 49305 49324 49343 49361 2,4
2,5 49379 49396 49413 49430 49446 49461 49477 49492 49506 49520 2,5
2,6 49534 49547 49560 49573 49585 49598 49609 49621 49632 49643 2,6
2,7 49653 49664 49674 49683 49693 49702 49711 49720 49728 49736 2,7
2,8 49744 49752 49760 49767 49774 49781 49788 49795 49801 49807 2,8
2,9 49813 49819 49825 49831 49836 49841 49845 49851 49856 49861 2,9
3,0 49865 49869 49874 49878 49882 49886 49889 49893 49897 49900 3,0
3,1 49903 49906 49910 49913 49916 49918 49921 49924 49926 49929 3,1
– 117 –
ESTATÍSTICA
Parte
Parte Segunda decimal de Zc inteira e
inteira e
primeira
primeira
decimal
de Zc 0 1 2 3 4 5 6 7 8 9
de Zc
3,2 49931 49934 49936 49938 49940 49942 49944 49946 49948 49950 3,2
3,3 49952 49953 49955 49957 49958 49960 49961 49962 49964 49965 3,3
3,4 49966 49968 49969 49970 49971 49972 49973 49974 49975 49976 3.4
3,5 49977 49978 49978 49979 49980 49981 49981 49982 49983 49983 3,5
3,6 49984 49985 49985 49986 49986 49987 49987 49988 49988 49989 3.6
3,7 49989 49990 49990 49990 49991 49991 49992 49992 49992 49992 3,7
3,8 49993 49993 49993 49994 49994 49994 49994 49995 49995 49995 3,8
3,9 49995 49995 49996 49996 49996 49996 49996 49996 49997 49997 3,9
4,0 49997 49997 49997 49997 49997 49997 49998 49998 49998 49998 4.0
4,5 49999 50000 50000 50000 50000 50000 50000 50000 50000 50000 4,5
Fonte: BUSSAB; MORETTIN, 2010, p. 511.
EXEMPLO
Se o peso médio de uma caneta é de 60 gramas, então μ = 60. Se a variação espe-
rada é de 3 gramas, o desvio padrão é dado por σ = 3. Para saber a probabilidade de
uma caneta, selecionada ao acaso, pesar entre 60 e 62 gramas, vamos transformar
o peso efetivo em relativo, por meio da distribuição normal padronizada:
X − µ 62 − 60 2
Z= = = = 0,66
σ 3 3
Ao obter a variável Z, você pode verificar que estamos analisando a probabilidade

de uma caneta apresentar uma variação de até 0,66 desvios padrões em relação à
média. Nesse caso, saberemos a porcentagem recorrendo à Tabela de Probabili-
dades. Para encontrar o valor exato, devemos entrar com o valor Z = 0,66 na tabela
normal e achar o valor correspondente à probabilidade.
Na coluna Z, você encontrará o decimal 0,6 formando uma linha com diversos
valores (parte inteira e primeira decimal). Siga essa linha até a coluna 6 (ou 0,06).
Na intersecção da linha 0,6 com a coluna 6 (ou 0,06), você encontrará a probabilidade
associada a distribuições normais com até 0,66 desvios padrões, ou seja, 0,2454.
Assim, verificamos que, se uma caneta pode pesar entre 57 e 63 gramas, a pro-
babilidade de selecionar uma ao acaso que pese entre 60 e 62 gramas é dada por
P (0 < Z < 0,66) = 24,54%.
Com a tabela apresentada, podemos obter as probabilidades associadas a todas as distribui-

ções normais (CRESPO, 2005).
– 118 –
ESTATÍSTICA
4 Teorema do Limite Central

O Teorema do Limite Central demonstra que, à medida que aumenta o número de elementos
em um conjunto de dados, a distribuição das frequências (o número de vezes em que são observa-
dos os diferentes valores da variável) e suas probabilidades de ocorrência aproxima-se progressiva-
mente de uma distribuição normal, com média μ e variância σ2/n. A variância demonstra a dispersão
total dos dados, sendo calculada pelo quadrado do desvio padrão (BUSSAB; MORETTIN, 2010).
Imagine que você queira checar a probabilidade de obtermos “coroa” no lançamento de qua-
tro moedas. A probabilidade associada a cada um dos possíveis resultados (de zero a quatro, ou
seja, o número de resultados possíveis é n = 5) é descrita pela figura a seguir.
Figura 3 – Distribuição de probabilidades com n=5
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0 1 2 3 4
Por outro lado, se você lançar trinta moedas, a probabilidade de obter entre zero e trinta
coroas é dado pelo seguinte gráfico:
Figura 4 – Aproximação de uma distribuição de probabilidades a uma distribuição normal com n=30
0,16
0,14
0,12
0,10
0,08
0,06
0,04
0,02
-
0 1 2 3 4 5 6 7 8 9 10 1112 13 14 15 1617 18 19 20 21 22 23 24 25 2627 28 29 30
– 119 –
ESTATÍSTICA
Você pode perceber que, à medida que o número de elementos de uma amostra (n) aumenta,
a distribuição de probabilidades torna-se semelhante a uma distribuição normal, com média igual
a 15 e variância igual a 2,75.
SAIBA MAIS!
Conheça mais a respeito do Teorema do Limite Central no tópico 3.2 da tese de
doutorado de Chang Kuo Rodrigues (PUC-SP), disponível em: <http://www.pucrs.br/
famat/viali/tic_literatura/teses/chang_kuo_rodrigues.pdf>.
Por meio da imagem anterior, que ilustra um histograma com n = 30 observações, há uma tendên-
cia de aglutinação dos dados em torno da média. Essa distribuição, portanto, é simétrica e pode
ser padronizada em uma distribuição normal. Por transformação algébrica, distribuições normais
com amostras de tamanho n podem ser padronizadas à distribuição normal N(0,1) por meio da
seguinte fórmula:
X −µ
Z
= n×
σ
Pelo Teorema do Limite Central, podemos checar as probabilidades de uma amostra enqua-
drar-se dentro de determinados intervalos em torno da média dos valores observados pelo pesqui-
sador (BUSSAB; MORETTIN, 2010).
EXEMPLO
Imagine que a estatura de um grupo de alunos do Ensino Fundamental segue uma
distribuição normal, com média igual a 100 centímetros e desvio padrão igual a 10
centímetros. Se retirarmos uma amostra de 16 alunos dessa população, e X for a
média dessa amostra, qual será a probabilidade P (90 < X < 110)?
Para responder à questão, devemos recorrer ao Teorema do Limite Central, que nos
permite obter probabilidades associadas a intervalos por meiode amostras. Tendo
em mente que n = 16, μ = 100 e σ = 10, faremos a padronização da variável Z em
duas partes. Primeiramente, para P (90 < X):
X −µ 90 − 100
Z1 =
n× 16 ×
= −4,00
=
σ 10
Já para P(X < 110), temos:
X −µ 110 − 100
Z2 =n × =16 × 4,00
=
σ 10
Recorrendo à tabela de distribuição normal, vemos que o valor associado a Z = 4,00

é de aproximadamente 49,997%. Logo, se há 49,997% de chance dos alunos terem
entre 90 e 100 centímetros (em Z1), e 49,997% de chance de terem entre 100 e 110
centímetros (em Z2), temos que P (90 < X < 110) = 99,994%.
– 120 –
ESTATÍSTICA
O Teorema do Limite Central é importante para verificarmos a aderência de uma amostra a

uma distribuição normal. Por meio dele, podemos verificar as margens de erro de uma pesquisa
associada a um conjunto de observações (BUSSAB; MORETTIN, 2010).
Fechamento
Nesta aula, você teve possibilidade de:
•• conhecer a distribuição normal e suas aplicações;

•• entender o conceito de Teorema do Limite Central e seus efeitos sobre uma pesquisa a
partir de um conjunto de amostras.
Bibliografia
RODRIGUES, Chang Kuo. O Teorema Central do Limite: Um estudo ecológico do saber e do

didático. Tese (Doutorado em Educação Matemática) - São Paulo: PUC-SP, 2009. Disponível em:
<http://www.pucrs.br/famat/viali/tic_literatura/teses/chang_kuo_rodrigues.pdf>. Acesso em: 07
mar. 2017.
– 121 –
TEMA 16
Correlação linear simples e coeficiente
de correlação e covariância
Introdução
Nesta aula, estudaremos indicadores que permitem avaliar o grau de associação entre diferen-
tes variáveis. Por meio dos conceitos de correlação e covariância, veremos em quais situações a tra-
jetória de uma variável afeta uma segunda variável, e em qual medida tal situação pode se verificar.
•• compreender os conceitos de correlação linear e covariância.
1 Correlação Linear
Um levantamento estatístico pode trazer, como resultado, dados que se entrecruzam e se
relacionam. Tal situação ocorre, por exemplo, quando o pesquisador efetua análises conhecidas
como bidimensionais. Imagine um caso em que se associa o tempo de estudo às notas conse-
guidas na prova por um grupo de pessoas: são tomadas observações de cada aluno em relação a
essas duas variáveis.
Com base nos resultados obtidos, será possível verificar a relação entre o tempo de estudo e
a nota. Pode-se esperar que haja notas melhores entre os alunos que mais estudaram? Se a res-
posta for positiva, teremos uma relação entre variáveis.
FIQUE ATENTO!
Análises também podem ser multidimensionais. Podemos, por exemplo, estudar a
altura, o peso e a idade de uma população, e efetuar deduções sobre o comporta-
mento dessas variáveis em conjunto.
Nesse sentido, para podermos saber se a relação é mais ou menos intensa, sobretudo
para amostras com um número grande de elementos, utilizamos o coeficiente de correlação.
Este índice nos mostra, por meio de um único número, o grau de associação de uma variável em
relação a outra (BUSSAB; MORETTIN, 2010).
– 122 –
ESTATÍSTICA
SAIBA MAIS!
Esse índice também é conhecido como coeficiente de correlação de Pearson, em

referência a Karl Pearson (1857-1936).
Quando essas variáveis são quantitativas, ou seja, envolvem valores que podem ser separa-
dos por frequências (que são o número de vezes que um determinado valor é observado), verifi-
camos o grau de associação entre variáveis por meio da análise da correlação existente entre as
elas, e também por análise gráfica.
FIQUE ATENTO!
Pode-se também usar variáveis qualitativas em análises bidimensionais, como a

análise do peso e do gênero de uma população, por exemplo.
Pela análise gráfica, podemos verificar – embora não de forma conclusiva – a relação entre
diferentes variáveis de pesquisa. Tomemos, como exemplo, um estudo que procurou avaliar a
relação entre altura e idade de um grupo de crianças entre oito e nove anos. Confira a disposição
dos dados coletados.
Figura 1 – Amostras de altura e idade de um grupo
135
130
Altura (cm)
125
120
115
110
95 100 105 110
Idade (meses)
Fonte: elaborada pelo autor, 2017
Você pode observar, pelo gráfico apresentado, que parece não haver uma relação intensa
entre o aumento da idade e o aumento da estatura das crianças, uma vez que há algumas com
menor idade e altura maior, e outras com menor altura e maior idade.
– 123 –
ESTATÍSTICA
Agora, considere o segundo exemplo: um indivíduo deseja efetuar um teste ergométrico em

esteira para verificar sua saúde cardíaca. Para isso, foi medida sua frequência cardíaca (em bati-
mentos por minuto) ao longo de vinte minutos. Os dados colhidos estão dados a seguir.
Figura 2 – Frequência cardíaca em um intervalo de tempo
210
190
170
150
FC (Bpm)
130
110
90
70
50
0 5 10 15 20
Tempo (minutos)
Aqui, podemos concluir que há uma relação entre variáveis bastante significativa: à medida
que o exame prossegue, a frequência cardíaca segue aumentando.
Figura 3 – Correlação de frequência cardíaca e tempo
Fonte: Ververidis Vasilis / Shutterstock.com
Nesse caso, portanto, visualizamos, pela análise gráfica, uma correlação linear entre variá-
veis: o tempo e a frequência cardíaca (BUSSAB; MORETTIN, 2010).
– 124 –
ESTATÍSTICA
2 Correlação Simples
Tenha em mente que a análise gráfica é bastante útil para verificarmos as correlações, porém
nem sempre é eficiente. Podemos, com ela, saber se há uma relação entre as variáveis e o modo
como ela ocorre (se é direta ou inversamente proporcional), mas não sua intensidade.
Assim, precisamos abordar novos conceitos. Com a correlação linear simples, podemos veri-
ficar em que medida uma variável dita independente (ou seja, que não é gerada por nenhuma outra)
afeta uma variável dependente, cujas observações dependem de outra variável para serem geradas
(BUSSAB; MORETTIN, 2010). Se voltarmos ao exemplo anterior, a frequência cardíaca é a variável
dependente, pois seus resultados estão associados ao tempo de desenvolvimento do exame.
Por outro lado, quando tratamos de correlação, não estamos atribuindo relações de causa
e efeito. Não se trata de definir que Y ocorre apenas porque X ocorre! A correlação demonstra a
tendência da variação de uma variável Y perante a variação de X.
Há diversos tipos de associação entre variáveis, mas, aqui, trataremos do exemplo mais sim-
ples para estudo: a correlação linear simples. Neste caso, por meio do exame do comportamento
de duas variáveis, podemos obter o grau de correlação entre elas. Observe!
Figura 4 – Perfis de correlação entre variáveis
Você pode perceber que no conjunto de dados mais à esquerda, há um perfil de crescimento
das observações da variável dependente Y em relação à variável independente X: os valores de
Y crescem à medida que crescem os valores de X. Assim, podemos afirmar que a correlação é
positiva. No conjunto à direita, verificamos uma situação de correlação negativa, ou inversa, pois
as observações de Y diminuem à medida que X cresce. Por fim, o conjunto de dados ao meio
não aparenta nenhuma inclinação, podendo-se assim afirmar que a correlação é nula (BUSSAB;
MORETTIN, 2010).
Para obtermos com precisão a correlação entre diferentes variáveis, lançamos mão do coefi-
ciente de correlação de Pearson, sobre o qual trataremos na próxima seção.
– 125 –
ESTATÍSTICA
3 Coeficiente de correlação
O coeficiente de correlação é um indicador que permite ao pesquisador avaliar o grau de
associação entre variáveis em uma pesquisa. Por meio dele, podemos detectar precisamente em
que proporção a variável independente afeta a variável dependente (BUSSAB; MORETTIN, 2010).
O coeficiente de correlação entre duas variáveis (X,Y), é dado pela seguinte fórmula:
1 n  xi − X   y i − Y 
Corr ( X , Y )
= ∑ × 
n i =1  dp ( X )   dp (Y ) 
Estamos, portanto, efetuando um cálculo da média da somatória dos desvios médios

padronizados.
Perceba que as identidades ( xi − X ) e ( y i − Y ) representam os desvios médios de cada valor
das variáveis, ou seja, demonstram a distância entre cada valor i (sendo i = 1, 2, 3...n) e a média da
variável. Se temos, por exemplo, que a média Y é 3, e o valor y1 é igual a 5, o desvio médio de y1
é igual a 2.
Os desvios padrões dp ( X ) de uma amostra são dados pela raiz quadrada da soma dos des-
vios médios divididos por (n-1) graus de liberdade, por meio da fórmula:
∑ (x − X)
n 2
dp ( X ) = 2 i =1 i
n −1
O desvio padrão, enquanto raiz quadrada da variância, que é uma medida da dispersão geral
dos dados em torno da média, demonstra se a distribuição dos dados de uma variável é ou não sig-
nificativa. Valores baixos de desvio padrão demonstram uma baixa dispersão, e vice-versa (BUS-
SAB; MORETTIN, 2010).
Com base nesses conceitos, percebemos que o coeficiente de correlação
1 n  xi − X   y i − Y 
corr ( X , Y )
=
n
∑ i=1  dp ( X )  ×  dp (Y )  consiste em uma padronização dos dados da distribuição. Ao
   
dividir a soma dos desvios médios pelo desvio padrão, e depois novamente pelo total de dados,
podemos confinar os valores de qualquer distribuição em torno de um conjunto de valores com-
preendido por A = {-1, 1}, de modo que:
−1 ≤ corr ( X , Y ) ≤ 1
Assim, se o coeficiente de correlação linear entre duas variáveis X e Y é 1 dizemos que existe
uma forte correlação linear positiva entre as mesmas. O mesmo pode ser dito se o coeficiente de
correlação entre X e Y for -1, nesse caso, há uma forte correlação linear negativa entre X e Y.
– 126 –
ESTATÍSTICA
SAIBA MAIS!
Conheça mais sobre a correlação com a leitura do artigo de Maria Eugénia Martins,
no link: <https://www.fc.up.pt/pessoas/jfgomes/pdf/vol_2_num_2_69_art_coeficien-
teCorrelacaoAmostral.pdf>.
Continuemos a análise da fórmula do coeficiente de correlação. Transformando essa

fórmula algebricamente a partir de um conjunto finito de dados de associação entre variáveis
{( x1, y1 ) , ( x2 , y2 ) ,…, ( xn , y n )} , temos a seguinte expressão:
1 n  xi − X   y i − Y  ( ∑ xi yi ) − nXY
Corr ( X ,=
Y) ∑ × = 
n i =1  dp ( X )   dp (Y ) 
( ∑ x 2
i
 − nX 2 )( ∑ y 2
i
 − nY 2 )
Quanto mais o coeficiente estiver próximo de -1, a correlação entre duas variáveis será inversa
(observe o conjunto de dados à direita última figura); estando próximo de 1, a correlação é positiva,
sendo nula quando for igual a zero.
EXEMPLO
Qual o coeficiente de correlação entre os pares ordenados (X,Y) = {(1,3), (2,2), (3,1)}?
Para responder a essa questão, trace o gráfico correspondente. Você verá que a
correlação é inversa. Porém, para o cálculo preciso, iniciemos pelas médias:
X=
∑ i =1
xi 1+ 2 + 3 6
= = = 2
n 3 3
n
Y=
∑ i =1 i
y
=
3+ 2 +1 6
= = 2
n 3 3
Calculamos, por fim, o coeficiente de correlação:
1 n  xi − X   y i − Y  ( ∑ xi yi ) − nXY
Corr ( X ,=
Y) ∑ × = 
n i =1  dp ( X )   dp (Y )  ( ) (
∑ xi2 − nX 2 × ∑ y i2 − nY 2 )
=
(1× 3) + ( 2 × 2 ) + ( 3 × 1) − 3 × 2 × 2 = −2
= −1
( ) (
2 1+ 4 + 9 − 12 × 9 + 4 + 1− 12
) 2
Desse modo, obtemos uma estimação precisa das relações entre variáveis e seu grau
de associação.
– 127 –
ESTATÍSTICA
FIQUE ATENTO!
Apenas como referência, o coeficiente de correlação associado à distribuição de
dados da figura 2 é de 0,99. Há, portanto, uma associação muito forte entre a dura-
ção do teste ergométrico e a aceleração dos batimentos cardíacos de um paciente.
Por sua vez, o coeficiente associado aos dados da primeira figura é de 0,06. Há,
portanto, uma relação muito fraca entre a idade e a altura da amostra selecionada.
A partir do desvio padrão, porém, podemos transformar a fórmula do coeficiente de correla-

ção e incluir um novo conceito: o de covariância. Acompanhe!
4 Covariância
Podemos separar o numerador da fórmula do coeficiente de correlação e isolá-lo, obtendo o
indicador conhecido como covariância. A covariância é a média dos produtos dos valores centra-
dos das variáveis, como segue:
∑ (( x − X ) × ( y ))
n
i i −Y
Cov ( X , Y )
i =1
=
n
Mas não confunda: a expressão ( xi − X ) diz respeito aos desvios médios, ou seja, ao afas-
tamento dos valores observados em relação à média. Se você somar todos os desvios médios,
a soma final será zero, logo, será que a fórmula da covariância dará sempre zero? De modo
algum. O que estamos calculando primeiramente é um produto entre pares ordenados de valo-
res ( x1 − X ) × ( y1 − Y ) , por exemplo. Nesse caso, teremos como resultado um valor que demons-
tra o grau de afastamento de cada par ordenado ( x n , y n ) em relação à média ( X , Y ) (BUSSAB;
MORETTIN, 2010).
EXEMPLO
Considere os pares ordenados (X,Y) = {(2,3), (3,5), (4,7)}. Observamos que n=3 e
as médias ( X , Y ) têm, respectivamente, valor 3 e 5. Assim, a covariância entre as
variáveis X e Y é dada por:
∑ (( x − X ) × ( y ))
n
i i −Y
Cov ( X , Y ) =
i =1
=
( 2 − 3 ) × ( 3 − 5 ) + ( 3 − 3 ) × (5 − 5 ) + ( 4 − 3 ) × ( 7=
− 5) 2+2
= 1,33
3 3
Embora seja um importante indicador, entenda que a covariância não é um parâmetro con-
sistente para calcularmos a associação entre variáveis. Ela não é um indicador padronizado, sendo
então sensível à notação de cada conjunto de dados. Por exemplo, se uma covariância de duas
– 128 –
ESTATÍSTICA
amostras que estão expressas em reais é dada por Cov ( X , Y ) = n , a mesma covariância, expressa
em centavos, seria Cov ( X , Y ) = 100n . Portanto, para eliminarmos imprecisões de cálculo, utilizamos
o coeficiente de correlação.
Em resumo, recuperando a fórmula da covariância e aplicando-a sobre a fórmula do coefi-
ciente de correlação, temos a seguinte expressão (BUSSAB; MORETTIN, 2010):
1 n  xi − X   y i − Y  Cov ( X , Y )
Corr ( X ,=
Y) ∑ × = 
n i =1  dp ( X )   dp (Y )  dp ( X ) * dp (Y )

Fechamento
•• entender e aplicar os conceitos de correlação linear e correlação simples;

•• conhecer o conceito de covariância e sua função para a avaliação da associação entre
variáveis de pesquisa.
Referências
MARTINS, Maria Eugénia Graça. Coeficiente de Correlação amostral. Revista de Ciência elementar,
v.2, n.2, Lisboa, 2014. Disponível em: <https://www.fc.up.pt/pessoas/jfgomes/pdf/vol_2_
num_2_69_art_coeficienteCorrelacaoAmostral.pdf>. Acesso em: 16 mar. 2017.
– 129 –
TEMA 17
Regressão linear
Introdução
Nesta aula, você conhecerá algumas referências básicas sobre os processos de regressão
linear. É por meio desses processos que podemos conhecer e demonstrar a tendência de variação
de séries de dados com uma ou mais variáveis, o que nos permite estimar suas possíveis mudan-
ças ao longo do tempo.
•• compreender os conceitos sobre regressão linear.
1 Regressão Linear
Quando um pesquisador se dedica a analisar um conjunto de dados relacionados a n vari-
áveis, sendo uma delas dependente e as demais, independentes, é importante verificar em que
medida cada uma dessas variáveis independentes afeta a variável dependente.
FIQUE ATENTO!
Tenha em mente que uma variável dependente, como o próprio nome demons-
tra, é verificada em função dos dados de outra variável. Não há, porém, uma rela-
ção de “causa e efeito” entre elas, como se a variável dependente fosse um efeito
das independentes.
Desse modo, representamos a relação entre uma variável dependente Y e n variáveis indepen-
dentes X da seguinte forma:
Y = f (X1, X2, X3,…Xn)
Podemos exemplificar tais funções quando investigamos, por exemplo, as relações entre
o crescimento econômico de um país por meiode seu Produto Interno Bruto (PIB), da taxa de
inflação e do volume de desemprego. Também quando analisamos um fluxo de vendas de um
shopping center e comparamos essa variável com o movimento, em número de visitantes, que o
estabelecimento teve, bem como com o aumento do salário mínimo.
– 130 –
ESTATÍSTICA
Consideremos, para facilitar o cálculo, duas variáveis, uma dependente Y e uma independente
X, por meio da equação Y = 3X. Para diferentes valores de X = {0,1,2,3...} haverá diferentes valores
no conjunto Y = {0,3,6,9...}. Nesse caso, os valores podem ser descritos em uma reta.Você pode ter
também ter um conjunto de dados à sua disposição, de modo que será necessário verificar qual a
função entre variáveis que melhor o descreve.
Há situações em que a variável dependente é afetada por outros elementos que são externos
à variável independente (ou seja, exógenos). Quando isso acontecer, haverá um resíduo, ou um erro,
que afetará os resultados do modelo estatístico. Ele deverá, portanto, ser exposto da seguinte forma:
Yi = f (X1,X2,X3,… Xn ) + ui
Entenda que cada elemento Yi é expresso em função de n variáveis independentes Xi, acres-
centando-se um resíduo ui. Em muitas situações do cotidiano, cálculos de regressão geram erros
de mensuração, sem contar a possibilidade de um valor Y ser afetado por outras variáveis que não
estão inclusas na equação (HOFFMANN, 2016).
Nessas circunstâncias, torna-se difícil obter com precisão os dados da variável dependente
que serão visualizados em função da variável independente. Podemos, porém, estimar a tendência
em relação a um conjunto de dados, conforme a imagema seguir.
Figura 1 – Tendência de variação entre variáveis
18
16
14
12
10
0
0 2 4 6 8 10 12 14 16
Assim, a regressão linear consiste em uma série de mecanismos que têm por objetivo esti-
mar o valor esperado de uma variável dependente Y, em função de outras variáveis independen-
tes e de eventuais erros residuais (BUSSAB; MORETTIN, 2010). Saiba que quando analisamos a
variação de uma variável dependente em função de uma variável independente, efetuamos uma
operação de regressão linear simples.
– 131 –
ESTATÍSTICA
FIQUE ATENTO!
Quando há mais variáveis dependentes e independentes envolvidas, dizemos que

a regressão é múltipla.
Desse modo, supondo n pares ordenados de valores de duas variáveis (X,Y), se Y for uma
função linear de X, o modelo da regressão simples é dado pela fórmula:
Yi = α + βXi + ui
Nesse caso, Y é a variável dependente e X é a variável independente, a qual explica a variação de Y.
Figura 2 – Associações entre variáveis
Fonte: Team Oktopus / Shutterstock.com
Os parâmetros α e β determinam a declividade da reta de regressão. O coeficiente α é conhe-

cido como o coeficiente linear de intercepto do eixo Y, isso significa que ele demonstra o valor da
variável dependente Y quando a variável independente X é igual a zero.
Por sua vez, o coeficiente β, que é coeficiente angular da reta de regressão, nos mostra que
quanto maior for o seu valor, mais inclinada será a reta de regressão em relação ao eixo X da vari-
ável independente (HOFFMANN, 2016).
– 132 –
ESTATÍSTICA
SAIBA MAIS!
Uma variável dependente pode depender de mais de uma variável independente.
Nesse caso, para obter a estimação do comportamento das variáveis, utiliza-
mos a regressão linear múltipla. Você pode conhecê-la lendo o quarto capítulo
do livro do prof. Rodolfo Hoffmann, da Unicamp, que está disponível em: <http://
www.producao.usp.br/bitstream/handle/BDPI/48616/REGRESS.pdf?sequen-
ce=5&isAllowed=y>.
Há alguns pressupostos que definem o modelo de regressão linear simples:
•• a relação entre as variáveis X e Y é linear;

•• os valores de X são fixos;
•• a média do erro é nula, ou seja, seu valor esperado é igual a zero;
•• para cada valor de X, a variância do erro (a distância ao quadrado entre um elemento e
sua média) é sempre igual a σ2;
•• os erros de cada observação não se correlacionam entre si;
•• A distribuição dos erros é normal, ou seja, há valores regularmente dispersos em rela-
ção à sua média (HOFFMANN, 2016).
Para efetuarmos uma regressão, perceba que o primeiro passo é obter as estimativas dos
parâmetros α e β, dados, respectivamente, por a e b, a partir de uma amostra de n pares ordenados
das variáveis (X,Y), de modo que:
Yi= a + bXi
Em que Yi representa um valor estimado de Yi. Aqui, resgatamos o conceito de resíduo, enten-
dendo-o como a diferença (desvio) entre o valor real de Y e seu valor estimado, de modo que para
cada erro de um valor i ( ei ), temos:
e=i Yi − Yî
Por consequência, a soma dos desvios ei é igual a zero ( ∑ ei = 0 )
FIQUE ATENTO!
Estamos simplificando nossa notação em relação ao símbolo de soma ( ∑ ). Quan-
do utilizamos esse operador, estamos somando todos os n elementos de uma dis-
tribuição de dados, do primeiro ( i=1 ) ao último elemento n.
– 133 –
ESTATÍSTICA
Os parâmetros a e b são calculados da seguinte forma:
a= Y − bX
∑ Xy
b=
∑ x2
Em que:
X representa cada valor Xi da variável independente;

x e y representam a diferença cada valor Xi e Yi e suas respectivas médias, dados por X e
Y (HOFFMANN, 2016).
EXEMPLO
Imagine o seguinte conjunto de dados formado pelos seguintes pares ordenados:
Tabela 1 - Associação entre variáveis

X Y
1 3
2 2
2 4
3 4
4 5
4 6
5 5
6 7
6 8
7 6
Fonte: elaborada pelo autor , 2017.
Vamos estimar os coeficientes a e b para esta distribuição.Para obtê-los, precisare-

mos dos elementos de cálculo:
a= Y − bX
∑ Xy
b=
∑ x2
– 134 –
ESTATÍSTICA
EXEMPLO
Em que: x= X − X e y= Y − Y
Assim, temos:
b
= =
(
∑ Xy ∑ X Y − Y 28
= = 0,78
)
( )
∑ x 2 ∑ X − X 2 36
=a 5=
- 0,78 x 4 1,88
Desse modo, nossa reta de regressão para uma distribuição de valores esperados
da variável dependente Yi é igual a:
Yi =+
a bXi =
1,88 + 0,78 Xi
Assim, conforme a reta de regressão para os valores Yi estimados de Y (na tabela
a seguir - Yest) a partir dos valores de X, temos a seguinte distribuição:
Tabela 1 – Valores estimados e erros

X Y Yest Erro
1 3 2,66 0,34
2 2 3,44 -1,44
2 4 3,44 0,56
3 4 4,22 -0,22
4 5 5 0
4 6 5 1
5 5 5,78 -0,78
6 7 6,56 0,44
6 8 6,56 1,44
7 6 7,34 -1,34
A soma dos erros é igual a zero.
– 135 –
ESTATÍSTICA
2 Medidas de regressão
Quando efetuamos cálculos envolvendo a estimativa de uma variável, verificamos que há
uma associação importante entre uma variável dependente e as variáveis que a determinam (ou
apenas uma). Desse modo, grave bem: é importante definirmos não apenas se uma variável deter-
mina outra, mas também o sentido em que ela o faz, e em que proporção tal associação acontece.
Para esse objetivo, utilizamos alguns indicadores que são úteis para verificarmos as relações
de influência entre variáveis em um modelo de regressão linear. A seguir, estudaremos o indicador
R², conhecido como coeficiente de determinação.
SAIBA MAIS!
Há outras medidas de regressão igualmente utilizadas no estudo de uma regres-
são, como o coeficiente ETA (que é a raiz quadrada do coeficiente R², e mede a
associação entre variáveis quantitativas e qualitativas).
O coeficiente de determinação demonstra a proporção em que uma (ou mais) variável inde-
pendente determina a variação de uma variável dependente. Para isso, analisamos a soma dos
quadrados da regressão e dos resíduos.Recuperando o conceito de desvio em relação a uma vari-
ável, temos:
e=i Yi − Yî
De modo que:
Y=i ei + Yî
Se elevarmos ao quadrado essa sentença e somarmos todos os valores possíveis das duas
variáveis, obteremos:
∑ y i2 = ∑ ei2 + ∑ Yî 2 + 2 ∑ y i ei
Sabendo que a soma dos resíduos elevada à primeira potência é igual a zero, como mencio-
namos no tópico anterior, temos:
∑ y i2 = ∑ ei2 + ∑ Yî 2
Essa equação nos mostra que existe uma associação entre valores reais, previstos e seus
resíduos. A variação dos valores de Y em torno de sua média ( ∑y2i ) é explicada por dois elementos:
a própria regressão, que fornece os valores estimados de Y, dados por Yî ; e uma segunda parte,
dada por ei , cuja origem é alheia ao modelo. Em outras palavras, se há diferença entre um valor real
e um valor estimado, ela é dada por fatores externos ao modelo, que não são “explicados” por ele.
– 136 –
ESTATÍSTICA
Desse modo, podemos calcular o coeficiente de determinação, que mostra a proporção da

variação de Y, a qual é explicada – ou determinada – pela regressão em si, por meio da seguinte
equação (HOFFMANN, 2016):
S.Q.Reg. ∑ yî2
=r2 =
S.QTotal
. ∑ y i2
∑ (Yˆ − Y ) e ∑ y i2 = ( )
2 2
Em que: ∑ yî =
2
∑ Y −Y .
O coeficiente de determinação R2 indica a participação da variação de Y que é explicada

diretamente pela regressão, de modo que 0 ≤ R2 ≤ 1. Quanto mais o coeficiente estiver próximo
de 1, mais os valores reais estão próximos dos estimados, de modo que a regressão (e a variável
independente) explicam adequadamente a variável dependente.
EXEMPLO
Vamos utilizar a mesma distribuição de dados do exemplo anterior, com a mé-
dia de X igual a 4 e a média de Y igual a 5.A reta de regressão é calculada por
Yi =+
a bXi =1,88 + 0,78 Xi Calculamos yest² ( yî2 )
X Y Y estimado Erro Yest² Erro²
1,0 3,0 2,7 0,3 7,1 0,1
2,0 2,0 3,4 -1,4 11,8 2,1
2,0 4,0 3,4 0,6 11,8 0,3
3,0 4,0 4,2 -0,2 17,8 0,0
4,0 5,0 5,0 0,0 25,0 0,0
4,0 6,0 5,0 1,0 25,0 1,0
5,0 5,0 5,8 -0,8 33,4 0,6
6,0 7,0 6,6 0,4 43,0 0,2
6,0 8,0 6,6 1,4 43,0 2,1
7,0 6,0 7,3 -1,3 53,9 1,8
S.Q.Reg. ∑ yî2 21,9

R2
= = = = 0,73
S.QTotal
. ∑ y i2 30
Assim, sabemos que a variação da variável X explica em 73% a variação da variável

dependente Y.
– 137 –
ESTATÍSTICA
Fechamento
Chegamos ao fim de nosso conteúdo!
•• conhecer as propriedades da regressão linear;

•• aprender a efetuar operações de medição de tendências a partir da regressão linear
simples.
Referências
HOFFMANN, Rodolfo. Análise de Regressão: uma introdução à Econometria. Piracicaba: Edição

do autor, 2016. Disponível em: <http://www.producao.usp.br/bitstream/handle/BDPI/48616/
REGRESS.pdf?sequence=5&isAllowed=y>. Acesso em:07abr. 2017.
– 138 –
TEMA 18
Amostragem
Introdução
Uma importante ferramenta de inferência estatística, ou seja, de dedução do comportamento
de uma série de dados, é dada pelas técnicas de amostragem. Por meio delas, um pesquisador
pode verificar hipóteses sobre uma determinada variável de pesquisa, obtendo um subconjunto de
dados que possuam características em comum.
Nesse sentido, para que esse subconjunto (também denominado amostra) possua as mes-
mas características da população analisada, é necessário estabelecer critérios de seleção que
garantam precisão para o experimento estatístico. Nesta aula, você irá conhecer algumas dessas
técnicas de amostragem.
•• conhecer a teoria elementar de amostragem.
1 Amostragem - conceitos básicos

Uma pesquisa que utilize um conjunto de dados obtidos por meio de coleta e levantamento
deve zelar para que eles não tenham sido obtidos sob condições desiguais. Eles devem ser, tanto
quanto possível, obtidos por meio do acaso, como quando lançamos um dado de seis faces não
viciado. Assim, o resultado que obteremos é impossível de ser previsto, pois é ordenado pelo acaso.
FIQUE ATENTO!
É comum que experimentos envolvam dados coletados causalmente, de forma que
é impossível conhecer os resultados que serão obtidos. Por exemplo, ao lançarmos
um dado, sabemos que os resultados possíveis compreendem de 1 a 6, mas não
temos como saber qual será o número obtido.
Desse modo, cada elemento da população possui chances iguais de ser contemplado como
resultado do experimento, de forma que a amostra coletada passa a ser representativa. Tal carac-
terística é importante, pois as deduções que faremos a respeito de uma população levam em
conta os resultados obtidos pela amostra de dados. Se esta amostra estiver viesada (viciada) ou
comprometida de alguma forma, as deduções (ou inferências), de acordo com o método da Esta-
tística indutiva, não estarão corretas.
– 139 –
ESTATÍSTICA
SAIBA MAIS!
Tenha em mente que dados viesados comprometem a validade de um experimento
estatístico. Se, por exemplo, um pesquisador sabe que um baralho possui sinais
muito pequenos, mas que permitem a identificação de uma carta antes de sua
escolha ao acaso, as probabilidades de escolha de uma carta serão inválidas.
Torna-se necessária, portanto, a aplicação de técnicas de amostragem e pesquisa para garan-

tir a representatividade das amostras, bem como sua escolha a partir de experimentos aleatórios.
Entenda amostragem como uma técnica que tem por objetivo gerar um conjunto de dados para
uma pesquisa, de maneira aleatória (ou seja, regida pelo acaso) e isenta (sem a possibilidade de
escolhas induzidas). Trata-se, portanto,de um procedimento científico para a obtenção de dados
amostrais que façam referência a uma população (BUSSAB; MORETTIN, 2010).
Com base na definição de amostragem, podemos desdobrar algumas explicações. Uma
amostra é um subconjunto finito de uma população estatística, que é um conjunto maior de ele-
mentos portadores de uma característica em comum: o critério para a coleta de dados pelo pes-
quisador (CRESPO, 2005).
Figura 1 – Amostra de sangue para um hemograma
Fonte: angellodeco / Shutterstock.com
A partir de uma amostra, as ferramentas de inferência estatística permitem a análise de uma

população. Tal análise, como vimos, será correta se a amostra for obtida sob condições de aleato-
riedade, ou seja, determinada pelo acaso, e se for representativa, ou seja, possua as características
desejadas em relação à população.
– 140 –
ESTATÍSTICA
FIQUE ATENTO!
A ausência de uma característica também pode gerar elementos em uma amostra.
Se imaginarmos que uma linha de produção de bancos para carro gera amostras
para verificação do controle de qualidade, temos que a amostra será formada por
bancos com problemas e bancos sem problemas.
Assim, tendo definido o conceito de amostragem e seus desdobramentos a partir da popu-

lação e da amostra, podemos discutir as técnicas de amostragem mais utilizadas em um levanta-
mento estatístico. Continue conosco!
2 Principais tipos de amostragem

Perceba que as técnicas de amostragem são importantes para a Estatística, pois permitem
o exame de características de uma população a partir de um subconjunto de dados. Podemos,
então, frisar três das principais técnicas de coleta de dados e obtenção de amostras:
•• a amostragem casual (ou aleatória) simples, baseada diretamente no acaso;

•• a amostragem estratificada, que leva em conta a proporção de certo número de ele-
mentos da população em relação a seu total (estrato);
•• a amostragem sistemática, na qual o critério de ordenação é definido pelo pesquisador
a partir de dados já disponibilizados (CRESPO, 2005).
SAIBA MAIS!
Conheça mais informações sobre a aplicação de técnicas de amostragem no Censo
da População Brasileira por meio do artigo de Odair Sass, disponível em:<seer.ufrgs.
br/estatisticaesociedade/article/download/34902/23645>.
Estudaremos agora com detalhe cada uma dessas técnicas mencionadas. Acompanhe!
3 Amostra aleatória simples

A amostragem casual (ou aleatória) simples, como o termo já explicita, é a forma mais básica
de obtermos uma amostra para um experimento estatístico, uma vez que se baseia inteiramente
no acaso. Nela, o pesquisador, observando uma população finita de tamanho n, colhe, por meio de
um dispositivo aleatório (como um sorteio, por exemplo), um subconjunto de elementos da popu-
lação de tamanho k, que corresponderá à amostra desejada.
– 141 –
ESTATÍSTICA
FIQUE ATENTO!
Uma amostra pode ser formada por todos os k elementos possíveis até o total da
população, dado por n.
Caso a população seja muito grande (como a população brasileira, por exemplo), a obtenção
manual de dados pode ser bastante trabalhosa. Nesse caso, é possível utilizar dispositivos como
uma tabela de números aleatórios, como a apresentada a seguir.
Tabela 1 – Números aleatórios
61 09 26 29 85 11 95 77 79 04 57 00 91 29 59 83 53 87 02 02
94 47 40 99 93 82 13 22 40 33 19 72 55 69 82 16 94 21 66 39
50 40 50 55 79 00 58 17 26 30 38 11 54 89 04 13 69 17 35 48
51 01 75 76 54 43 11 28 32 75 33 09 04 78 74 91 56 79 43 39
25 45 79 30 63 56 44 70 05 04 31 81 46 02 92 32 06 71 12 48
63 94 61 14 24 60 27 00 00 95 54 31 59 00 79 94 46 32 61 90
12 95 04 73 06 72 76 88 55 62 38 79 18 68 10 31 93 58 66 92
38 06 78 00 85 42 57 29 28 34 79 91 93 58 82 97 37 07 64 67
22 69 28 18 25 08 90 93 53 17 54 12 21 03 56 30 88 53 46 82
07 95 63 14 76 53 62 10 21 57 55 74 57 68 22 38 84 55 57 49
61 41 81 16 97 55 19 65 08 62 26 38 74 32 30 44 64 64 91 80
97 15 71 92 40 28 33 35 23 32 75 36 18 98 41 10 50 93 75 95
39 81 34 84 33 83 42 77 35 00 51 42 82 63 30 47 01 98 96 73
58 35 04 52 06 81 24 32 74 53 28 82 43 35 01 73 34 47 05 76
52 85 30 59 37 00 49 88 07 43 08 04 00 48 36 23 31 88 80 88
41 92 93 01 94 13 33 63 32 35 38 91 18 89 71 67 46 73 42 47
88 51 22 59 99 51 20 74 13 55 30 41 25 99 10 26 01 33 24 13
11 12 32 28 25 67 22 97 11 73 55 24 09 23 47 12 93 44 80 47
33 02 06 80 29 39 78 49 81 21 42 00 99 80 44 56 33 83 46 16
03 67 08 29 16 04 92 31 62 03 94 53 02 60 55 72 46 68 25 93
41 54 93 90 86 52 14 58 90 34 83 00 73 38 14 50 77 58 08 94
18 84 83 61 42 96 82 86 02 30 40 16 65 55 63 20 40 24 79 80
06 15 93 11 72 17 32 31 84 89 53 66 01 99 53 75 79 92 20 61
12 74 92 15 60 93 84 37 29 62 24 96 78 93 28 34 41 69 04 51
79 13 36 81 55 51 46 66 68 85 07 73 35 42 52 61 29 21 02 34
01 78 33 32 06 16 45 94 09 18 40 14 73 03 61 80 69 79 52 95
90 73 28 21 38 57 39 36 24 33 31 99 64 86 19 61 55 50 65 14
44 10 20 96 70 32 41 46 22 97 08 22 02 47 43 57 15 87 76 59
52 47 00 27 41 43 70 17 52 44 51 26 94 73 17 72 16 51 81 77
23 03 84 44 29 43 57 05 46 59 89 00 65 01 20 27 32 66 34 56
Fonte: BUSSAB; MORETTIN, 2010, p.516.
– 142 –
ESTATÍSTICA
Assim, sorteia-se qualquer elemento de população de tamanho n, sendo que a probabilidade

de um elemento x qualquer ser escolhido é a mesma de todos os outros elementos:
1
P (X=x) =
n
EXEMPLO
Suponha que um professor de educação física deseja obter uma amostra das ida-
des, em meses, de um grupo de cem alunos, numerados de 01 a 100. Para fazer
com que a amostra seja totalmente determinada pelo acaso, ele recorre à tabela de
números aleatórios e recolhe os cinco números em diagonal do último bloco, sen-
do assim escolhidos os alunos com os números 80, 55, 87, 81, 56. Como há cem
alunos, a probabilidade do aluno 38 ser escolhido é dada por P(X=38) = 1⁄100 = 1%.
Figura 2 - Estudante colhendo uma amostra de água
Fonte: goodluz/Shutterstock.com
Devemos enfatizar que o procedimento de amostragem aleatória pode ser dado de duas for-
mas: com reposição e sem reposição. Amostragens com reposição ocorrem quando é permitido
que um elemento seja sorteado mais de uma vez. Já no caso de uma amostragem sem reposição,
os elementos que compõem a amostra são retirados da população e não podem ser contempla-
dos novamente.
– 143 –
ESTATÍSTICA
4 Amostra aleatória sistemática

Tenha em mente que existem algumas situações nas quais os elementos da população, além
de terem seu número conhecido, também se encontram de alguma forma ordenados, tal como
ocorre em relação a uma linha de produção, ou a uma série de edifícios em uma avenida, por
exemplo. Nesses casos, a determinação da amostra pode ser feita por meio de um modelo, um
sistema proposto pelo pesquisador, denominando-se, assim, essa técnica de amostragem como
sistemática (CRESPO, 2005).
Podemos, por exemplo, retirar um item da linha de produção a cada cem, para verificar sua
qualidade, fixando assim o tamanho da amostra em 1% da população; ou, ainda, podemos, em
outro exemplo, fixar uma amostra de edifícios com 2% do total. Se houver mil edifícios em uma
rua, escolhemos ao acaso um número entre 01 e 50 (ou seja, 2% do total). Esse número indicaria o
primeiro edifício escolhido e depois os próximos, a cada cinquenta prédios (se o número sorteado
fosse 32, por exemplo, os edifícios selecionados seriam o conjunto A = {32, 82, 132, 182...932, 982}).
5 Amostra estratificada
No caso de uma amostragem simples, geralmente observamos se a população possui uma
dada característica de interesse do pesquisador, tal como ocorre quando desejamos verificar qual
é o peso médio de um grupo de animais. Porém, há populações com determinadas características
que precisam ser levadas em conta pelo pesquisador. Por exemplo, uma população de pessoas
pode ter um predomínio maior de mulheres. Nesse caso, se selecionarmos uma amostra ao acaso
e obtivermos um número maior de homens, as deduções sobre a população não serão exatas
(CRESPO, 2005).
Figura 3 - Subconjuntos de uma população com características em comum
Fonte: Arthimedes / Shutterstock.com
– 144 –
ESTATÍSTICA
Tendo em vista essas disparidades, a seleção de uma amostra deve considerar a existência
de subpopulações – conhecidas como estratos – cujo tamanho deve ser proporcional aos dados
levantados para a amostra (CRESPO, 2005).
EXEMPLO
Imagineque em uma escola de Ensino Médio, há 80 alunos no primeiro ano, 50 no
segundo e 70 no terceiro ano. Uma amostra de dados para uma pesquisa sobre
avaliação escolar, que contemple 10% do total de alunos, deve ser obtida da seguin-
te forma:
Primeiro ano: 80x10% = 8

Segundo ano: 50x10% = 5
Terceiro ano: 70x10% = 7
Só assim os estratos estão proporcionalmente representados. Se selecionarmos

ao acaso vinte alunos do grupo de duzentos, corremos o risco de representar mais
ou menos um determinado ano.
Desse modo, a amostragem proporcional estratificada considera a existência de estratos

em meio à população geral, permitindo assim a coleta de amostras proporcionais ao número de
elementos de cada estrato.
Fechamento
•• conhecer e definir as noções de população, amostra e amostragem;
•• operar algumas técnicas de amostragem utilizadas em pesquisas e experimentos
estatísticos.
Referências
SASS, Odair. Sobre os conceitos de censo e amostragem em educação, no Brasil. Estatística e

Sociedade, Porto Alegre, n.2, p.128-141, nov. 2012. Disponível em:<seer.ufrgs.br/estatisticaesocie-
dade/article/download/34902/23645>. Acesso em: 16 mar. 2017.
– 145 –
TEMA 19
O uso das tecnologias como
ferramenta da estatística
Introdução
Nesta aula, você aprenderá como utilizar softwares de análise estatística para o cálculo de indi-
cadores e suas representações gráficas. Dentre esses programas, daremos ênfase ao Microsoft Excel
(versão 2007). Por meio dele, você irá aprender a efetuar cálculos e demonstrá-los por análise gráfica.
•• utilizar os programas e aplicativos para calcular estatísticas e construir tabelas e gráficos.
1 Planilhas digitais: como calcular média, variância,

desvio padrão, separatrizes etc.
Você já deve ter percebido que, em Estatística, o aluno aprende a conceituar diferentes indicado-
res e medidas que definem o comportamento de uma população, bem como a calculá-los. A resolução
de exemplos é viável quando o conjunto de dados a se manipular é razoavelmente pequeno. Mas como
calcular manualmente a média de idade da população brasileira, com 200 milhões de habitantes?
Saiba que para realizar essas operações, contamos com softwares de análise de dados, os
quais auxiliam o pesquisador na obtenção das informações desejadas.
FIQUE ATENTO!
Desde a década de 1980, com a difusão dos chamados computadores pessoais
(PCs), surgiram softwares de cálculo como o MatLab, o gretl, o EVIEWS, o STATA, e,
em destaque, o SAS (Statistical Analysis System) e o SPSS (Statistical Package for
Social Sciences). O SPSS é bastante utilizado nas disciplinas de Economia, como
Metodologia de Análise Econômica.
Tenha em mente que o Microsoft Excel (ou apenas “Excel”) é um programa de análise de
dados bastante comum e utilizado por empresas e pesquisadores (RIBEIRO JÚNIOR, 2005).
Quando um pesquisador coleta uma série de dados, torna-se necessário obter informações a res-
peito deles. Para isso, algumas medidas são muito utilizadas, tais como as de posição e de dispersão.
O Excel separa os dados coletados em células, sendo que cada célula comporta um dado ou
uma operação de análise estatística. Para efetuar esses cálculos, primeiramente você irá inserir
– 146 –
ESTATÍSTICA
o operador matemático de igual (‘=’), o nome da função estatística e, fechado entre parênteses, o
⨱
intervalo de dados necessários à sua análise (RIBEIRO JÚNIOR, 2005).
A média (com notação ) é uma medida de posição que indica uma tendência central, ou
seja, o valor em torno do qual está distribuída uma série de dados com n elementos de uma variá-
vel x, cujas observações vão de x1 a xn. Ela é dada por:
X=
∑ (x )i=1 i
No Excel, você obterá a média por meio do comando “=MÉDIA(conjunto de dados; clique e
arraste para selecionar todos os que deseja)”.
FIQUE ATENTO!
Sempre que você tiver alguma dúvida em relação às funções do Excel, aperte a
tecla F1 e abra o menu de ajuda. Insira uma palavra-chave relacionada à sua dúvida
para encontrar referências que ajudarão na resolução de seu problema.
Lembre-se de que a mediana é uma medida de posição que determina o valor que divide
uma distribuição de dados em duas partes iguais. Caso a distribuição tenha n valores, e n seja um
número ímpar, o valor central será a mediana (em 7 elementos, o elemento 4 é a mediana). Se n
for par, a mediana será a média aritmética entre os dois elementos centrais (em oito elementos,
a média entre os números 4 e 5). No Excel, você obterá a mediana por meio da operação “=MED
(limite inferior; limite superior)”.
Já a moda é o elemento que mais se repete em uma distribuição. Você poderá obtê-lo rapi-
damente com a operação “=MODO(limite inferior; limite superior)”. Separatrizes também são medi-
das de posição. Elas são (n – 1) valores que dividem um conjunto de dados em n partes iguais.
Por exemplo, se desejamos dividir um conjunto em quatro partes iguais, utilizaremos os quartis,
denominados Q1, Q2 (a própria mediana) e Q3 (RIBEIRO JÚNIOR, 2005).
SAIBA MAIS!
Outras separatrizes muito utilizadas são os tercis (dois valores que dividem um
conjunto de dados em três partes iguais), os quintis (quatro valores para cinco
partes), decis (dez partes iguais) e percentis (cem partes iguais).
– 147 –
ESTATÍSTICA
A operação para obtenção de um quartil é dada por “= QUARTIL (limite inferior: limite supe-
rior; quarto)”, sendo que o indicador ‘quarto’ representa o quartil (primeiro, segundo ou terceiro)
que se deseja obter.
EXEMPLO
Considere o conjunto A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22). A média é dada por
“=MÉDIA(conjunto de dados)” = 12. O primeiro quartil divide a primeira metade dos
dados em duas partes iguais. No caso, será a média entre o terceiro e o quarto ele-
mento. Use “=QUARTIL(conjunto de dados;1)” e você terá Q1 = 7. O segundo quartil
é a mediana, igual a 12. O terceiro quartil é igual a 17.
Podemos ainda analisar a variabilidade dos dados, a fim de que seja possível saber se uma
distribuição é homogênea em relação à média. Saiba que os indicadores de dispersão mais utiliza-
dos são a variância e o desvio padrão (RIBEIRO JÚNIOR, 2005). A variância demonstra a dispersão
total de um conjunto de dados. Ela é calculada a partir da soma dos quadrados dos desvios. A
distância entre os dados de uma distribuição e sua média, de acordo com a fórmula:
∑ (x – X)
n 2
2 i=1 i
s =
n
O desvio padrão, por sua vez, é a raiz quadrada da variância:
∑ (x – X)
n 2
2 2 2 i=1 i
s= s =
n
Como regra geral, para que a amostra seja homogênea é importante que o desvio padrão
tenha um valor baixo. Este valor, entretanto, depende da variável de estudo e de outros indicadores,
como a média. Se a média de um conjunto é 1.250 e o desvio padrão é igual a 8, a dispersão é
pequena. Porém se o desvio padrão for igual a 8 em uma distribuição de média igual a 10, os dados
estão muito dispersos.
Para resolver esse problema, utilizamos o coeficiente de variação, que demonstra o grau de
homogeneidade de uma distribuição de dados, de acordo com a fórmula:
∑ (x – X)
n 2
2 i=1 i
n s
CV = n
=
∑ (x )i=1 i
X
n
Entenda que quando o coeficiente está próximo de zero, a amostra é homogênea, perdendo
esta característica à medida que o coeficiente aumenta.
– 148 –
ESTATÍSTICA
Calculamos a variância de uma população por meio do comando “=VAR(série de dados)”,

enquanto o desvio padrão de uma população é dado por “DESVPADP(série de dados)”. Você pode
confirmar a validade de seu indicador calculando a variância e depois retirando sua raiz quadrada,
com o comando “=(valor da variância)^0,5”. Por fim, o coeficiente de variação é dado pelo comando
“=(valor do desvio padrão)/(Valor da média)” (RIBEIRO JÚNIOR, 2005).
EXEMPLO
Utilizando o mesmo conjunto do exemplo anterior, a variância é calculada pelo
comando “=VAR(conjunto de dados)”, sendo igual a 44. O desvio-padrão é dado
por “=DESVPAD(conjunto)”, sendo igual a 6,63. O coeficiente de variação é igual a
0,5525, demonstrando que a dispersão é alta em relação à média.
A seguir, estudaremos a construção de tabelas e gráficos!
2 Como formatar tabelas

Dados com uma ou mais variáveis (como por exemplo, os dados de um grupo de soldados
separados por peso, altura e nota em teste de tiro) podem ser organizados em tabelas, para sua
melhor visualização. Podemos formatar tabelas pelo método manual ou por comandos.
O método manual consiste em agrupar os dados de interesse ou exibi-los individualmente,
conforme o tamanho do conjunto sob análise. Você pode tornar a tabela esteticamente mais agra-
dável aplicando bordas (com o comando “Borda superior ou inferior”), e centralizando os dados.
Centralize também o título e a legenda relativa à fonte (com os comandos “quebrar texto automa-
ticamente” e “mesclar e centralizar”). Observe:
Tabela 1 – Distribuição de soldados por altura, peso e nota em teste de tiro
Soldado Altura (cm) Peso (kg) Nota
A 180 83 78
B 172 72 95
C 187 71 75
D 178 76 81
E 180 63 91
F 169 79 93
G 188 80 95
H 177 75 95
I 184 69 100
J 181 64 77
– 149 –
ESTATÍSTICA
Você pode, ainda, utilizar o comando “Formatar como Tabela”. Com ele, serão abertos vários
layouts de tabelas para facilitar a sua visualização. Além disso, ele permite que você possa mani-
pular os dados dentro da tabela, reordenando-os rapidamente. Imagine que você deseja obter uma
ordem crescente dos soldados por nota no exame de tiro.
Tabela 2 – Distribuição dos soldados
Nesse caso, você irá clicar na opção “Nota” e selecionar “classificar do maior para o menor”
(RIBEIRO JÚNIOR, 2005).
3 Como formatar gráficos

Gráficos são úteis para demonstrar o comportamento de um conjunto de dados. Podemos,
com eles, visualizar tendências de uma ou mais variáveis.
FIQUE ATENTO!
Nas Ciências Econômicas e na Administração, gráficos são muito utilizados para verifi-
car o comportamento dos custos de produção, a taxa de crescimento da economia etc.
Gráficos dinamizam a compreensão de um conjunto de dados. Na maior parte das vezes,

os gráficos do Excel são moldados a partir de dados inseridos pelo pesquisador e dispostos em
tabelas (RIBEIRO JÚNIOR, 2005).
SAIBA MAIS!
Você pode realizar gráficos de maior nível de dificuldade, como distribuições de
probabilidade e distribuições normais, por meio do software Geogebra, disponível
em: <https://www.geogebra.org/?lang=pt_BR>.
O processo de criação de gráficos envolve duas etapas. Vamos selecionar uma variável de
estudo, como a nota do exame de tiro vista no tópico anterior. Você irá criar um gráfico selecio-
– 150 –
ESTATÍSTICA
nando o conjunto de dados que pretende analisar (com os títulos) e clicando na aba “Inserir”, na
barra de menus, e depois em “Gráfico”.
A primeira etapa é selecionar o tipo de gráfico desejado. Há gráficos para cada tipo de dados:
para uma variável, você pode utilizar um gráfico em que as notas ficam dispostas em colunas.
Assim, será exibido um modelo básico do gráfico.
A segunda etapa é a formatação do gráfico. Você irá ajustá-lo para tornar a apresentação
mais didática. Altere o título clicando nele, e depois aloque a caixa de legenda abaixo do gráfico, ou
a exclua. Por fim, insira informações a respeito de cada um dos eixos, clicando na aba “ferramen-
tas de gráfico”, e depois em layout e “títulos dos eixos”.
4 Construindo histogramas e diagramas

Histogramas são apresentações gráficas em um conjunto de retângulos dispostos em um
gráfico de colunas, de modo que a altura de cada retângulo corresponde à frequência de um
intervalo de dados, ou seja, ao número de vezes em que são observados elementos que pertençam
a um determinado intervalo (RIBEIRO JÚNIOR, 2005).
Vamos utilizar o modelo dos soldados, porém adicionando mais dados para visualizarmos melhor
o histograma. Primeiramente, separemos as notas obtidas por intervalos, a saber, ‘60 ⊢ 65’ (o operador
⊢ demonstra o intervalo entre 75 até 80, excluído o número natural 80), ‘65 ⊢ 70’, ‘70 ⊢ 75’, 75 ⊢ 80’,
‘80 ⊢ 85’, ‘85 ⊢ 90’, ‘90 ⊢ 95’, ‘95 ⊢ 100’. Acompanhe:
12
10
10
8
8
7
6
6 5
4
3
2
2
0
60 65 65 70 70 75 75 80 80 85 85 90 90 95 95 100
Adicionamos rótulos, que são os valores associados a cada coluna (clique sobre o gráfico
com o botão direito e selecione a opção “adicionar rótulos de dados”). Para unir as colunas, clique
com o botão direito sobre a coluna, selecione “formatar série de dados”, “opções de série”, e em
“largura do espaçamento”, coloque o cursor em zero, “sem intervalo”.
Diagramas são apresentações que demonstram fluxos de decisão que se relacionam entre
si. Você pode criar diagramas a partir dos comandos “Inserir” SmartArt e selecionar o modelo mais
conveniente. Observe!
– 151 –
ESTATÍSTICA
Figura 2 – Fluxos de decisão em uma empresa
Presidência
Diretoria de Diretoria de
Planejamento Logística
Contabilidade Operações
Assim, você pode utilizar apresentações gráficas para demonstrar dados e ações!
Fechamento
•• conhecer os principais mecanismos de cálculo no software Excel;

•• efetuar cálculos, tabelas e apresentações gráficas.
Referências
RIBEIRO JÚNIOR, José Ivo. Análises Estatísticas no Excel - Guia prático. Viçosa: Editora UFV, 2005.
GEOGEBRA. Disponível em: <https://www.geogebra.org/?lang=pt_BR>. Acesso em: 17 mar. 2017.
– 152 –
TEMA 20
Aplicação da estatística
em diferentes setores
Introdução
Nesta aula, você poderá verificar a relação entre a Estatística e as demais áreas do conheci-
mento, de modo a entender como as ferramentas de cálculo estatístico estão presentes no cotidiano
de instituições e pessoas. Da mesma forma, você verificará como os mecanismos estatísticos são
úteis para avaliarmos tendências e efetuarmos diagnósticos.
•• conhecer as diferentes aplicações da Estatística em diferentes setores.
1 A Estatística como pesquisa quantitativa

As ferramentas da Estatística são utilizadas no cotidiano de milhões de pessoas. Empresas,
estudantes, pesquisadores, governos, organizações não-governamentais e outras instituições se
utilizam de fórmulas de cálculo como a média e as porcentagens de diferentes indicadores, em
situações como o crescimento de vendas de uma firma, de doações de uma instituição e a redu-
ção ou aumento da dívida pública.
Para a realização de uma pesquisa, coleta de dados e seu tratamento, o agente deverá utilizar
cálculos estatísticos que derivam de duas fontes principais: as qualitativas e as quantitativas. Na
Estatística quantitativa, as variáveis de estudo destacam-se por estarem associadas a conjuntos
de dados expressas por valores. Estes valores demonstram resultados obtidos a partir de experi-
mentos, ou são resultado da coleta efetuada pelo pesquisador (BUSSAB; MORETTIN, 2010).
SAIBA MAIS!
Um dos eixos de estudo na graduação em Ciências Econômicas é o estudo dos
Métodos Quantitativos Aplicados à Economia, no qual são enfatizadas técnicas de
pesquisa e análise estatística de conjuntos de dados e séries temporais.
Sabemos que há dois tipos de variáveis quantitativas: as contínuas e as discretas. Variá-

veis contínuas são valores que expressam resultados de medições obtidas por algum mecanismo
matemático (de uma simples régua a um cronômetro, por exemplo), podendo ser expressas por
qualquer número real. Como consequência, há infinitos resultados possíveis para essa variável.
– 153 –
ESTATÍSTICA
Podemos exemplificar variáveis contínuas como a massa de um corpo (que pode assumir qual-
quer valor em termos de peso) e sua altura.
Já as variáveis discretas são obtidas e avaliadas por meio de contagens, de forma que um
conjunto de resultados associado a essas variáveis é enumerável e, portanto, finito. Exemplos de
variáveis discretas são o número de famílias com irmãos gêmeos em uma cidade, o consumo de
folhas de papel em uma escola, a quantidade de refeições servida em uma cozinha industrial etc.
(BUSSAB; MORETTIN, 2010).
Figura 1 – Contagens de população e análises estatísticas
Fonte: PORTRAIT IMAGES ASIA BY NONWARIT/Shutterstock.com
Embora tenhamos enfatizado a Estatística quantitativa, saiba que na modalidade qualitativa

as variáveis de estudo não possuem um valor, ou seja, não estão definidas em função de um
número específico. Ao contrário, elas são definidas com base em categorias de classificação de
objetos, bens ou outros elementos semelhantes.
EXEMPLO
Variáveis qualitativas são bastante utilizadas na indústria de transformação: ao
analisar uma série de itens manufaturados em uma linha de produção, um inspetor
de qualidade classifica-as como “adequadas” ou “inadequadas”. Perceba que se tra-
ta de uma qualificação não numérica.
Há basicamente dois tipos de variáveis qualitativas: as nominais e as ordinais. Variáveis ordi-

nais são aquelas em que há categorias de ordenação dentro da própria variável, ou seja, os dados
são organizados em função de alguma ordem específica. Podemos, como exemplo, mencionar
os meses de nascimento de um grupo de indivíduos, ou sua escolaridade (pelo ano em que cada
elemento está matriculado).
Por sua vez, as variáveis nominais não geram ordenação entre os elementos que as
compõem. Entenda, portanto, que esses elementos são contados, organizados, mas não estão
– 154 –
ESTATÍSTICA
subordinados a uma ordem específica. Podemos, por exemplo, mencionar as cores do cabelo de
um grupo de pessoas (BUSSAB; MORETTIN, 2010).
Desse modo, pudemos exemplificar algumas situações nas quais a Estatística é uma impor-
tante ferramenta de análise quantitativa. A seguir, você conhecerá mais sobre a inferência estatística.
2 A Estatística como instrumento diagnóstico

Conforme mencionamos anteriormente, a Estatística faz parte do cotidiano das pessoas,
de maneira quase inconsciente. Quando analisamos um indicador básico, como nosso índice de
glicemia, por exemplo, que é importante para a verificação do diabetes, estaremos utilizando ferra-
mentas e métodos de análise dessa disciplina.
FIQUE ATENTO!
O conceito de “diagnóstico” geralmente nos remete ao universo da medicina e dos
testes laboratoriais, como hemogramas, exames de urina e eletrocardiogramas,
não é verdade? Porém, há muitas outras situações em que esses indicadores esta-
tísticos são empregados para comprovar ou verificar uma tendência de interesse.
Imagine a seguinte situação: você percebe que sua velocidade de internet está baixa. O que fará?
Provavelmente, irá efetuar um teste de conectividade, que irá lhe mostrar uma média da sua veloci-
dade de download, ou seja, a quantidade, em bytes, de dados que você consegue copiar de um outro
computador ou servidor ao longo de um determinado período de tempo (geralmente, um segundo).
Da mesma forma, um pesquisador tem a necessidade de analisar e compreender dados que
se relacionam a seu objeto de estudo. Desse modo, será preciso moldar o conjunto de dados a fim
de que ele se torne uma informação, que pode ser comparada a outros elementos ou confirmar
uma hipótese (BUSSAB; MORETTIN, 2010).
Figura 2 – Coleta de uma amostra
Fonte: Romanets / Shutterstock.com
– 155 –
ESTATÍSTICA
Saiba que esse processo de coleta e análise de dados faz parte da inferência estatística: a
partir de uma amostra de elementos coletados e trabalhados, efetuam-se deduções e conclusões a
respeito de toda uma população. Assim, além de verificarmos a situação de uma população a partir
da amostra, também torna-se possível verificar possíveis tendências futuras (CRESPO, 2005).
EXEMPLO
Quando seu hemograma acusa que você está com uma discreta anemia, com cer-
ca de 3,5 milhões de hemácias por milímetro cúbico de sangue, sabemos que esse
resultado foi obtido a partir de uma amostra colhida para exame laboratorial. Há um
grau de confiança que permite afirmar que a amostra colhida possui as mesmas
características de toda a população, neste caso, o sangue que corre pelo corpo.
Por meio da inferência, a Estatística é um importante instrumento de análise e diagnóstico a

respeito de conjuntos de dados e informações.
3 Aplicação de Estatística em Marketing

A promoção e a divulgação de bens e serviços, a identificação e o atendimento às necessida-
des do cliente são as principais características do Marketing moderno, com o objetivo de ampliar
as vendas e aumentar os lucros das empresas. Dessa forma, para compreender as demandas
dos clientes, os agentes que trabalham com marketing necessitam obter informações a respeito
de seu público-alvo, da concorrência e de outras variáveis que podem influenciar as decisões de
compra dos consumidores (KOTLER; KELLER, 2012).
Figura 3 – Estatística e publicidade
Fonte: Rawpixel.com/ Shutterstock.com
Desse modo, o Marketing também se utiliza de ferramentas estatísticas. Por meio de pes-
quisas de mercado com grupos de indivíduos, são obtidas amostras a respeito das tendências
– 156 –
ESTATÍSTICA
de compra e de escolhas de determinados produtos em seus respectivos mercados, viabilizando,

assim, medidas de promoção para incentivar as vendas.
SAIBA MAIS!
Conheça mais a respeito das técnicas de análise de dados para a área de Marketing
por meio da leitura do artigo de Fernando dos Santos e Maria Manuela Neves,
disponível em: <http://www.ipv.pt/millenium/Millenium29/24.pdf>.
O Marketing se utiliza de todas as fases do método estatístico em relação a uma análise de

um conjunto de observações. Esses dados são coletados por meio de pesquisas, questionários ou
técnicas indiretas (pesquisa de indicadores previamente coletados, como a taxa de desemprego
da população), apurados (processados conforme critérios de classificação estabelecidos pelo
pesquisador), organizados em apresentações gráficas e analisados (CRESPO, 2005).
FIQUE ATENTO!
A pesquisa de marketing fornece aos gestores de uma organização as informações
relevantes a respeito das tendências de mercado de um produto, recomendando
ações para promovê-lo. Essas informações são obtidas a partir de amostras que
permitem deduzir o comportamento de uma população.
4 Aplicação de Estatística em Administração

Quando tratamos de ferramentas da Estatística e seu emprego na Administração, devemos
nos lembrar que esses conceitos são válidos para a administração de empresas e para a administra-
ção pública. Por meio da coleta de dados, torna-se possível conhecer os elementos que compõem o
cenário socioeconômico de grupos de clientes e dos habitantes de uma sociedade, estabelecendo,
assim, metas de produção. Da mesma forma, as empresas recorrem a ferramentas estatísticas
para avaliar potenciais receitas, lucros e prejuízos.
Nas organizações, os dados são organizados em gráficos e tabelas, que permitem a com-
preensão das fórmulas e técnicas estatísticas adotadas. Assim, modelando-se um conjunto de
dados, decisões no tempo presente tornam-se possíveis com base em previsões a respeito da
evolução de uma ou mais variáveis de interesse.
FIQUE ATENTO!
A Estatística não prevê o futuro com precisão absoluta! Ela permite, por meio de
análises comparativas e de tendência de uma ou mais variáveis, estimar seus pro-
váveis comportamentos futuros, embora tais comportamento não necessariamen-
te sejam observados a curto e a longo prazos.
– 157 –
ESTATÍSTICA
Figura 4 – Estatística e administração
Fonte: everything possible/ Shutterstock.com
Nas empresas, tanto privadas quanto estatais, os gestores têm a necessidade de efetuar
decisões a respeito de uma série de variáveis, como aumento de preços, redução de custos, pro-
moção e venda de produtos, realização de compras de outras empresas. Desse modo, o conheci-
mento e a utilização da Estatística torna possível, aos gestores, a organização, direção e controle
de empresas (CRESPO, 2005).
Fechamento
•• conhecer a aplicação da Estatística em outros ramos do conhecimento;

•• entender os métodos de análise que permitem a observação de tendências e realização
de decisões.
Referências
KOTLER, Philip; KELLER, Kevin Lane. Administração de Marketing. 14. ed. São Paulo: Pearson, 2012.
SANTOS, Fernando Augusto de Sá Neves; NEVES, Maria Manuela Caria Figueira de Sá. O Marketing
e a análise de dados para a tomada de Decisões. Spectrum, s.d. Disponível em: <http://www.ipv.pt/
millenium/Millenium29/24.pdf>. Acesso em: 23 mar. 2017.
– 158 –

UCA001 Estatistica FICHA Web

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

UCA001 Estatistica FICHA Web

Caricato da

Copyright:

Formati disponibili

ESTATÍSTICA

Banco de Imagens Shutterstock.com

Dados Internacionais de Catalogação na Publicação (CIP)

Estatística/ Edina Domingues, José Tadeu de Almeida, José André Mota de

1. Análise. 2. Estatística. 3. Censo

01 Estatística descritiva e indutiva e conceitos básicos......................................................... 7

13 Probabilidade condicional e regra do produto, regra da adição.....................................97

•• conhecer os conceitos básicos de Estatística;

Figura 2 – Censos Demográficos

Atualmente, a Estatística desempenha um papel fundamental para tomada de decisões e

Tabela 1 – Conceitos fundamentais de Estatística

Termo Conceito Exemplo

Ao realizarmos uma pesquisa em

Em uma pesquisa envolvendo alu-

É qualquer evento que se pretenda analisar, cujo O número total de presidiários e o

Para o exemplo anterior, calcula-se

Termo Conceito Exemplo

Dados coletados que podem ser classificados de

É o levantamento e análise de dados estatísti- Censo demográfico;

Fonte: adaptado de BUSSAB & MORETTIN (2010).

Segundo Crespo (2011), a Estatística Descritiva é composta das seguintes fases:

•• definição do problema: o pesquisador definirá o problema a ser estudado e analisará

•• planejamento: nesta fase, determina-se o procedimento necessário para resolver o pro-

•• apresentação de dados: os dados deverão ser organizados em tabelas e gráficos:

•• apresentação tabular: os dados são organizados em linhas e colunas, de forma orde-

O Conselho Nacional de Estatística (CONFE) regulamenta a profissão de estatístico.

•• Apresentação gráfica: os dados são sistematizados de forma a gerarem diferentes cate-

Portanto, a Estatística Descritiva representa a etapa inicial da análise, objetivando a descrição

•• amostragem não probabilística: a seleção de amostra baseia-se nas decisões do

•• amostragem probabilística: a seleção de amostra não depende do pesquisador e é aleató-

6 Diferenças entre a Estatística Descritiva e a Indutiva

•• conhecer o termo Estatística;

BRASIL. Instituto Brasileiro de Geografia e Estatística (IBGE). O que é Censo. Disponível em

CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. Saraiva: 2011.

•• conhecer os métodos estatísticos e suas fases;

Já no método estatístico os procedimentos estão pautados nas Teorias das Probabilidades,

1.1 Fases do método estatístico

•• definição do problema: ocorre ao se estabelecer um problema, uma hipótese de pesquisa;

Figura 2 – Base de dados

A variável de pesquisa é definida pelo agente observador, o próprio pesquisador, a

Os tipos de coleta de dados são:

A apuração permite que calculemos as porcentagens, as participações de cada variável, em

A porcentagem de observações em relação ao total da amostra analisada também

Figura 3 – Coleta de dados

A compreensão das técnicas de amostragem é importante para a análise estatística, a fim

Figura 4 – O número “pi” contém trilhões de casas decimais

O conceito de casas decimais, embora usual, não é costumeiramente aplicado em Estatís-

O arredondamento de dados pode acontecer quando:

Porém, se o algarismo de referência for 5, as regras mudam:

As técnicas de arredondamento permitem uma descrição de dados mais resumida e efi-

CRESPO, Antônio Arnot. Estatística Fácil. São Paulo. Saraiva: 2011.

1 Apresentação de dados estatísticos

Os dados estatísticos podem ser classificados em variáveis quantitativas contínuas

Para classificar as variáveis quantitativas em discretas ou contínuas, basta identificar se o valor

Já para diferenciar as variáveis qualitativas em nominal ou ordinal, é necessário identificar

1.1 Dados brutos

Fonte: elaborado pelo autor, 2017.

Assim, poderíamos representar os dados brutos em forma de rol (dados apresentados

Quadro 2 – Dados na forma de rol

Fonte: elaborado pelo autor, 2017.

Depois de identificar a natureza e computar os dados brutos, cabe ao pesquisador organi-

1.2 Organização em tabelas

Tabela 1 – Quantidade de moradores nas casas da rua x

Número de Frequências Frequências