Sei sulla pagina 1di 193

PROBABILIDADE E

ESTATÍSTICA APLICADA À
ENGENHARIA

autora do original
PAULA MARINHO

1ª edição
SESES
rio de janeiro  2016
Conselho editorial  regiane burger, luiz gil guimarães, roberto paes, gladis linhares

Autora do original  paula marinho

Projeto editorial  roberto paes

Coordenação de produção  gladis linhares

Projeto gráfico  paulo vitor bastos

Diagramação  bfs media

Revisão linguística  bfs media

Revisão de conteúdo  modesto guedes ferreira junior

Imagem de capa  gopixa | shutterstock.com

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrônico ou mecânico, incluindo fotocópia e gravação) ou arquivada em
qualquer sistema ou banco de dados sem permissão escrita da Editora. Copyright seses, 2016.

Dados Internacionais de Catalogação na Publicação (cip)

M338p Marinho, Paula


Probabilidade e estatística aplicada à engenharia / Paula Marinho.
Rio de Janeiro: SESES, 2016.
192 p: il.

isbn: 978-85-5548-269-4

1. Estatística descritiva. 2. Estatística inferencial. 3. Modelos


probabilísticos. I. SESES. II. Estácio.
cdd 519.5

Diretoria de Ensino — Fábrica de Conhecimento


Rua do Bispo, 83, bloco F, Campus João Uchôa
Rio Comprido — Rio de Janeiro — rj — cep 20261-063
Sumário

Prefácio 9

1. Introdução à Estatística 11
1.1 Estatística 13
1.2  Conceitos básicos 15
1.2.1  Unidade experimental 15
1.2.2  – População ou universo estatístico 16
1.2.3 Amostra 17
1.2.3.1  Técnicas de amostragem 17
1.2.3.2  Técnicas de amostragem probabilística (aleatória) 18
1.2.3.2.1  Amostragem aleatória simples 18
1.2.3.2.2  Amostragem sistemática 18
1.2.3.2.3  Amostragem por conglomerados (clusters) 19
1.2.3.2.4  Amostragem estratificada 19
1.2.3.3  Técnicas de amostragem não probabilística (não aleatória) 20
1.2.3.3.1  Amostragem a esmo ou sem norma 20
1.2.3.3.2  Amostragem intencional 20
1.2.4  Variáveis quantitativas e qualitativas 20
1.2.5  Estatística descritiva 21
1.2.6  Estatística indutiva 21
1.3  Fases do método estatístico descritivo 22
1.3.1  Definição do problema 22
1.3.2 Planejamento 22
1.3.3  Coleta de dados 22
1.3.4  Apuração dos dados 23
1.3.5  Apresentação dos dados 23
1.4  Arredondamento de dados 25
2. Distribuição de Frequências
Representação Tabular e
Representação Gráfica 31

2.1  Representação Tabular de Dados 33


2.1.1  Dados brutos 33
2.1.2 Rol 34
2.1.3  Distribuição de frequências 34
2.1.3.1  Distribuição de frequências de dados tabulados
não agrupados em classes 35
2.1.3.2  Distribuição de frequências de dados tabulados
agrupados em classes 39
2.1.4  Principais tipos de gráficos que representam
frequências em tabelas sem classes 45
2.1.4.1  Gráfico de colunas (verticais) 45
2.1.4.2  Gráfico de colunas compostas 46
2.1.4.3  Gráfico de colunas agrupadas 47
2.1.4.4  Gráfico de colunas bidirecionais 47
2.1.4.5  Gráfico de barras (horizontais) 48
2.1.4.6  Gráfico de barras compostas 48
2.1.4.7  Gráfico de barras agrupadas 49
2.1.4.8  Gráfico de barras bidirecionais 49
2.1.4.9  Gráfico em setores ou de porcentagens 50
2.1.4.10  Gráfico de linha 50
2.1.5  Principais tipos de gráficos que representam
frequências em tabelas com classes 51
2.1.5.1 Histograma 51
2.1.5.2  Polígono de frequências 52
2.1.5.3  Gráfico em setores 52
2.1.5.4  Polígono de frequência acumulada – Ogiva de Galton 53
2.1.6  Gráficos Especiais 54
2.1.6.1  Gráfico de Pareto 54
2.1.6.2  Carta de controle 54
2.1.6.3  Gráficos de dispersão 55
3. Medidas de Posição Medidas de
Tendência Central e Medidas Separatrizes 65

3.1  Medidas de tendência central 67


3.1.1  Média aritmética 67
3.1.1.1  Média aritmética simples 67
3.1.1.2  Média aritmética ponderada 68
3.1.1.3  Propriedades da média 70
3.1.2 Moda 71
3.1.2.1  Moda para dados brutos não tabelados 71
3.1.2.2  Moda para dados tabelados não agrupados em classes 72
3.1.2.3  Moda para dados tabelados agrupados em classes 73
3.1.2.3.1  Moda bruta 73
3.1.2.3.2  Moda de Czuber 73
3.1.3 Mediana 74
3.1.3.1  Mediana para dados brutos, não tabulados 75
3.1.3.2  Mediana para dados tabulados não agrupados em classes 76
3.1.3.3  Mediana para dados tabulados agrupados em classes 78
3.1.4  Comparações entre média, moda e mediana 81
3.2  Medias separatrizes 82
3.2.1  Quartis para dados não agrupados em classes 82
3.2.2  Percentis para dados não agrupados em classes 83
3.2.3  Decis para dados não agrupados em classes 84

4. Medidas de Dispersão 95

4.1  Medidas de dispersão 97


4.1.1  Desvio Padrão 99
4.1.1.1  Características do desvio padrão 100
4.1.1.2  Propriedades do desvio padrão 101
4.2 Variância 101
4.2.1  Propriedades da variância 102
4.3  Cálculo da variância e do desvio padrão 102
4.3.1  Cálculo do desvio padrão para dados brutos
de uma amostra 103
4.3.2  Cálculo do desvio padrão para dados brutos
de uma população 104
4.3.3  Cálculo do desvio padrão para dados tabelados
sem classes de uma amostra 105
4.3.4  Cálculo do desvio padrão para dados tabelados
sem classes de uma população 106
4.3.5  Cálculo do desvio padrão para dados tabelados
com classes de uma amostra 106
4.3.6  Cálculo do desvio padrão para dados tabelados
com classes de uma população 107
4.4  Coeficiente de variação de Pearson 107
4.5  Interpretação do desvio padrão 108

5. Introdução à Probabilidade 121

5.1  Experimentos aleatórios 123


5.1.1  Conceitos básicos 123
5.1.2 Experimento 124
5.1.3  Experimento aleatório 124
5.1.4  Espaço amostral 124
5.1.5 Evento 124
5.1.6  Evento elementar 124
5.1.7  Evento composto 125
5.1.8  Complemento de um evento 125
5.1.9  Operações com eventos 125
5.1.10  Eventos mutuamente excludentes 125
5.1.11  Eventos coletivamente exaustivos 126
5.1.12  Visualização de um espaço amostral 126
5.1.13 Probabilidade 127
5.2  Técnicas de contagem 128
5.2.1  Princípio fundamental da contagem 129
5.2.2  Permutação simples 129
5.2.3  Arranjo simples 130
5.2.4 Combinações 133
5.3  Obtenção de probabilidades de eventos 134
5.3.1  Frequência relativa 135
5.3.2  Probabilidade teórica de eventos 136
5.4  Regras da soma, probabilidade condicional e multiplicação 138
5.4.1  Regra da soma 138
5.4.2  Probabilidade condicional 141
5.4.3  Regra da multiplicação 142
5.5  Teormea de Bayes 144

6. Distribuições de Probabilidade 151

6.1  Variável Aleatória Discreta 154


6.1.1  Função de Probabilidade 155
6.2  Esperança Matemática e a Variância de Variáveis Aleatórias 156
6.2.1  Valor Esperado de uma Variável Aleatória 156
6.2.2  Variância de uma Variável Aleatória 157
6.2.3  Propriedades do Valor Esperado 158
6.2.4  Propriedades da Variância 159
6.2.5  Soma de Variáveis Aleatórias 159
6.3  Modelos Discretos de Probabilidade. 165
6.3.1  Distribuição de Bernoulli 165
6.3.2  Distribuição Binomial 167
6.3.3  Distribuição de Poisson 175
6.4  Modelo Contínuo de Probabilidade 181
6.4.1  Distribuição Normal 181
6.4.2  Probabilidade de uma Variável Aleatória Contínua 181
6.4.2.1  Função Densidade 181
6.4.2.2  Cálculo da Probabilidade 182
6.4.2.3  Curva Normal 182
Prefácio
Prezados(as) alunos(as),

Estatística é uma palavra de origem latina, que significou por muito tem-
po ciência dos negócios do Estado. Ela pode ser vista como uma Matemática
Aplicada, uma disciplina da área das ciências exatas que tem aplicação em pra-
ticamente todas as áreas de estudo.
A disciplina Probabilidade e Estatística está hoje presente na grande maio-
ria dos cursos. Qualquer profissional do ramo, para tomar uma decisão, pre-
cisará apoiar-se em indicadores que representem o atual estado do fenômeno
objeto de seu estudo. Isto só é possível com o suporte dado pelas metodologias
propostas pela Estatística.
Uma empresa pública ou privada que pretende inovar precisará investir em
pesquisa e desenvolvimento de novos projetos e produtos. Se esta mesma em-
presa planeja competir globalmente, será preciso aumentar e garantir a quali-
dade dos seus produtos e serviços. Todas estas situações necessitarão de supor-
te estatístico para viabilizar suas propostas e concretizar suas ações.
O avanço tecnológico, o crescente volume de dados e a complexidade das re-
lações impõem a necessidade do conhecimento de ferramentas estatísticas por
parte dos profissionais das mais diversas áreas de atuação. Esta disciplina tem
seu foco no profissional da engenharia, aquele a quem por definição compete a
identificação, a formulação e a resolução de problemas técnicos.
Procuramos aqui apresentar a disciplina de forma prática e clara, não com o
intuito de formar especialistas nesta área, mas sim de proporcionar-lhe, futuro
engenheiro, a compreensão dos elementos que compõem essa ciência, visando
à aplicação desses instrumentos na sua área de atuação. Nossa intensão não é
esgotar o assunto, mas sim apresentar os elementos necessários para que você
faça uma leitura satisfatória da realidade que o cerca e das informações que
têm à sua volta.
Estudaremos a Estatística Descritiva e parte da Indutiva ou Inferencial.
Vamos nos apoiar fortemente no uso do software EXCEL para resolver cál-
culos e fazer simulações. Esta é uma ferramenta indispensável para o futu-
ro engenheiro.

Bons estudos!

9
1
Introdução à
Estatística
O interesse por levantamento de dados não surgiu recentemente; há indícios
de que por volta de 3000 a.C. já se faziam censos na Babilônia, China e Egito.
Informações sobre as populações e suas riquezas tinham particular importân-
cia para os governantes das grandes civilizações antigas, que as utilizavam para
a taxação de impostos e para o alistamento militar. A palavra estatística surgiu,
pela primeira vez, no século XVIII. Na sua origem, a estatística es­tava ligada ao
Estado, já, na atualidade, a estatística não se limita apenas ao estudo de dados
demográficos e econômicos, sendo empregada em praticamente todas as áreas
do conhe­cimento onde estão envol­vidas coleta e análise de dados.
Abra um jornal ou uma revista como Exame ou Veja. Assista a um jornal ou
documentário na TV. Verifique as avaliações dos funcionários da empresa onde
você trabalha, o relatório de peças fabricadas com defeitos no último mês ou
os registros de acidentes com afastamento. Pesquise na Internet informações
sobre os índices pluviométricos dos últimos 12 meses ou os valores da tarifa e
do consumo de energia do último ano. Ao coletar e analisar esses dados, você
perceberá que convivemos diariamente com um mar de números, de tabelas e
gráficos. Eles constituem-se em dados estatísticos que, após organizados, de
alguma forma influenciarão pessoas nas decisões que irão tomar.
O que iremos aprender aqui será usado por você ao longo de todo seu curso
e, com certeza, será muito útil na sua trajetória profissional. Sempre que você
se deparar com a necessidade de fazer uma pesquisa e de tratar seus dados,
você usará a metodologia e os conceitos estatísticos estudados nessa disciplina.

OBJETIVOS
Você deverá ser capaz de enunciar as etapas da estatística descritiva e da estatística indutiva,
compreendendo a que se destina cada uma dessas áreas, identificar situações nas quais se
deve trabalhar com uma população ou uma amostra para coleta de dados, diferenciar os tipos
de variáveis presentes em cada pesquisa e calcular arredondamentos.

12 • capítulo 1
1.1  Estatística
Inicialmente vamos analisar três definições de estatística:

É o conjunto de processos, métodos e técnicas utilizados para descrever uma deter-


minada situação, representada por uma coleção de dados numéricos cuja organização
permite um melhor conhecimento de seu significado e do fenômeno mostrado.

Indica uma atividade humana especializada ou um corpo de técnicas ou, ainda, uma
metodologia desenvolvida para a coleta, a classificação, a apresentação, a análise e a
interpretação de dados quantitativos e sua utilização para a tomada de decisões.

No plural (estatísticas) indica qualquer coleção consistente de dados numéricos,


reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer.
Assim, por exemplo, as estatísticas demográficas referem-se a dados numéricos
sobre nascimentos, falecimentos, matrimônios etc. As estatísticas econômicas consis-
tem em dados numéricos relacionados com emprego, produção, preços, vendas e com
outras atividades ligadas aos vários setores da vida econômica.

Como podemos ver, o objeto dos estudos estatísticos reside em fenômenos


que se referem principalmente a um conjunto numeroso de indivíduos, que
são semelhantes em pelo menos uma característica específica. A estatística tor-
na possível analisar padrões de comportamento da característica em estudo,
conseguindo superar a indeterminação que se manifesta em casos particula-
res. É o ramo da matemática aplicada à análise de dados.
Basicamente, podemos dizer que estatística é uma ciência que trata de mé-
todos científicos para a coleta, organização, descrição, análise e interpretação
(conclusão) de um conjunto de dados, visando à tomada de decisões. Podemos
dividir a aplicação da estatística em três eta­pas:
1. Coleta de dados, na qual se deve utilizar técnicas que garantirão uma
amostra representativa da po­pulação, como será visto no próximo item des-
se capítulo.

capítulo 1 • 13
2. Resumo e organização dos dados coletados em tabelas de frequências e/
ou gráficos para, posteriormente, encontrar as medidas de posição e variabi-
lidade, que serão vistos no capítulo 2. Esta etapa também é conhecida como
estatística descritiva ou dedutiva.
3. Escolha de um modelo que ex­plique o comportamento dos dados para que
seja possível fazer a inferência dos dados para a população de interesse. Esta eta-
pa também é chamada de estatística inferencial ou indutiva. Nesta etapa, faz-
-se necessário o conhecimento de técnicas de probabilidades, que serão apre-
sentadas no capítulo 5. A probabilidade fornece métodos para quanti­ficar a in-
certeza existente em determinada situação, usando ora um número ora uma
função matemática.

Alguns aspectos importantes do método estatístico são evidenciados:


•  O tratamento quantitativo aplicado aos fenômenos de massa ou coletivos
•  A observação de fenômenos individuais ou particulares
•  A mensuração
•  A análise dos dados, em que um padrão de regularidade nos resultados
mostra que deve existir uma característica comum a uma classe de experiências.

Tratamento
Quantitativo
Observação
Mensuração
Análise

Nesse processo, conseguimos extrair informações dos dados coletados e,


por meio de resultados individuais, realiza-se o processo de generalização.

Resultados
Generalização
individuais

Essas técnicas são adequadas às ciências experimentais e às atividades de


pesquisa envolvendo física, biologia, economia, administração, psicologia,
gestão da qualidade, metrologia, controle estatístico de processos, análise de

14 • capítulo 1
riscos em investimentos e projetos, estudo de tempos e movimentos, entre ou-
tros, e aplicadas às ciências humanas e tecnológicas. É a base para a realização
de qualquer pesquisa.
Podemos citar inúmeros exemplos de aplicação da estatística em várias
áreas do conhecimento. Vamos observar alguns deles:
Uma grande rede de supermercados tem interesse em abrir uma nova uni-
dade. Fatores sobre a população que frequenta o local onde essa unidade será
inaugurada, como sexo, grau de escolaridade, idade, estado civil, renda fami-
liar, entre outros, interferem nos tipos de produtos que devem ser disponibi-
lizados nesse estabelecimento, além de definir as estratégias de marketing
mais eficientes.
Antes de se lançar um novo medicamento no mercado farmacêuti­co, é ne-
cessária a realização de várias experiências. O medica­mento deve ser testado
quanto à sua eficiência no tratamento a que se destina e quanto aos efeitos co-
laterais que pode causar.
Quando uma empresa está interessada em lançar um novo produto no mer-
cado, é necessário saber as preferências dos con­sumidores, por isso é muito
importante fazer previsões de demanda do consumo. Para isso, é necessário
realizar uma pesquisa de mercado
Controles estatísticos de qualidade (ou controles estatísticos do processo)
também são indispensáveis em todos os tipos de empre­sa. Eles são realizados
por meio de um conjunto de técnicas estatísticas, geralmente aplicadas por en-
genheiros de produção e administradores, para garantir o nível de qualidade
exigido para a produção (ou serviço) dentro de uma indústria.
São inúmeras e diversificadas as aplicações de técnicas estatísticas que um
profissional pode utilizar. Apresentaremos os conceitos básicos e principais
técnicas que, quando utiliza­dos, podem auxiliar na tomada de decisões.

1.2  Conceitos básicos


1.2.1  Unidade experimental

Unidade experimental ou de observação é um objeto pelo qual coleta-


mos os dados. Esse objeto pode ser uma pes­soa, um objeto, uma transa-
ção ou um evento. Va­mos citar alguns exemplos para ilustrar os possí-

capítulo 1 • 15
veis tipos de objeto: eleitores da cidade de São Paulo são pessoas; carros
produzidos em determinado ano por uma montadora são objetos; ven-
das realizadas durante um mês numa loja de departa­mento são transa-
ções; acidentes ocorridos em determinada extensão de uma rodo­via durante
um feriado são eventos.

1.2.2  – População ou universo estatístico

É o conjunto da totalidade dos indivíduos sobre o qual se faz uma inferência


(inferir significa chegar a uma conclusão, a uma dedução por raciocínio), ou
seja, é o conjunto constituído por todos os indivíduos que apresentam pelo me-
nos uma característica comum, cujo comportamento interessa analisar (Essas
características da população, comumente chamadas de parâmetros, são sim-
bolizadas por caracteres gregos. Nos próximos capítulos, veremos como calcu-
lar esses parâmetros e, então, você irá perceber que, por exemplo, µ (mi) será
usado para representar a média dos dados e σ (sigma) será usado para o desvio
padrão da distribuição).
A definição da população deve ser feita antes de se iniciar a coleta dos da-
dos, atendendo aos interesses da pesquisa em questão. Pode-se, por exemplo
fazer uma pesquisa para verificar o consumo de energia nos últimos três me-
ses por toda a população do Brasil, ou apenas pela região Sudeste, ou só pelos
consumidores residenciais, ou só pelos estabelecimentos comerciais e assim
por diante. O censo demográfico do Brasil, realizado pelo IBGE, é um exemplo
de pesquisa de uma população completa. Esta pesquisa é feita a cada 10 anos,
dado o trabalho envolvido com a coleta e o tratamento de um volume tão gran-
de de dados.
Uma população pode ser finita ou infinita. Populações finitas permitem
que seus elementos sejam contados por exemplo: todas as lojas existentes em
determinado shopping, todos os alunos matriculados em determinada uni-
versidade, todos os veículos licenciados pelo departamento de trânsito em um
ano. Indicamos o tama­nho de uma população finita por N.
Na prática, uma população que está sendo estudada é usualmente conside-
rada infinita quando ela envolve um processo contínuo que torna impos­sível a
listagem ou contagem de cada elemento da população. por exemplo, quantida-
des de porções que se pode extrair da água do mar para análise.

16 • capítulo 1
1.2.3  Amostra

É um subconjunto, uma parte selecionada da totalidade da população. Por


meio da amostra, faz-se um juízo ou inferência sobre as características da po-
pulação (estas características são simbolizadas por caracteres latinos, assim ve-
remos adiante a utilização de X X para a média e s para o desvio padrão). A ob-
tenção de informações de uma amostra da população, em muitos casos, é mais
adequada, por ser mais rápida de ser aplicada e concluída, além de implicar um
custo menor da pesquisa como um todo. Este é o motivo pelo qual geralmente
as pesquisas são feitas por amostragem e não baseada em toda a população.
Deseja-se, por exemplo, conhecer o conteúdo do ferro exportado em um navio.
A população é todo o minério contido no navio. Uma amostra, parte do miné-
rio, é selecionada para se fazer a análise do seu teor de ferro. Com base nesta
parte selecionada (amostra), chegar-se-á a uma conclusão a respeito de todo o
minério de ferro exportado no navio (população).
Trabalhar com uma amostra implica um trade-off (situação que se caracte-
riza por um conflito de interesses, em que uma escolha deverá ser feita, portan-
to abrir-se-á mão de alguma coisa em prol de outra): ganham-se tempo e custo,
mas perde-se a precisão dos resultados. Para tratar esta incerteza, usaremos as
ferramentas da estatística indutiva.
Se a amostra não for obtida no estudo, devemos retirá-la da população por
meio de técnicas de amostragem adequadas, para que os resultados fornecidos
sejam confiáveis. A escolha desta amostra deve ser feita de modo a refletir as
mesmas características da população de origem. Quanto mais representativa
for a amostra, mais próximo se está de um resultado real. Veremos a seguir al-
gumas técnicas utilizadas para selecionar amostras em estudos ou pesquisas.

1.2.3.1  Técnicas de amostragem

Quando selecionamos uma amostra, devemos garantir que esta seja represen-
tativa da população. Isso quer dizer que, no processo de amos­tragem, a amos-
tra selecionada deverá possuir as mesmas características básicas da população.
Temos dois tipos de amostragem: a probabilística (ou aleatória) e a não pro-
babilística (ou não aleatória). A amostragem será probabilística se todos os ele-
mentos da popula­ção tiverem probabilidade de pertencer à amostra conhecida
e diferente de zero. Caso contrário, a amostragem será não probabilística.

capítulo 1 • 17
Independentemente do tipo de amostragem, podemos trabalhar com
amostragem com reposição ou sem reposição. Na amostragem com re­posição,
é permitido que uma unidade experimental seja sorteada mais de uma vez e,
na amostragem sem reposição, a unidade experimental sorteada é removida da
população. Devemos ter em mente os seguintes itens:
•  Os cálculos estatísticos são os mesmos para as duas formas de amostragem.
•  Em geral, as amostragens são realizadas sem reposição.
•  Se o tamanho da população for suficientemente maior que o tamanho da
amostra (mais de vinte vezes), os resultados estatísticos das amostras com e
sem reposição não serão muito diferentes. Deve-se tomar cuidado com popula-
ções pequenas quando comparadas com o tamanho da amostra a ser extraída.

1.2.3.2  Técnicas de amostragem probabilística (aleatória)

Sempre que possível, devemos trabalhar com amostragem probabilística.


Este tipo de amostragem garante, com alto grau de confiança, a representati-
vidade da amostra com relação à população que se tem interesse em estudar.
Usaremos N para denotar o tamanho da população e n para indicar o tamanho
da amostra.

1.2.3.2.1  Amostragem aleatória simples


É utilizada quando todos os elementos da população têm a mesma chance (ou
probabilidade igual) de pertencer à amostra. Para trabalhar com a amostragem
casual simples, devemos con­seguir listar a população de 1 a N. Os elementos
da população que irão pertencer à amostra serão sorteados de forma aleatória.
Sortearemos n nú­meros dessa sequência, os quais corresponderão aos elemen-
tos sorteados para a amostra.
Se, por exemplo, desejamos selecionar 50 elementos de uma população de
500 elementos, então “numeramos” a população de 1 a 500 e sorteamos, dessa
forma, os 50 integrantes que irão compor a amostra.

1.2.3.2.2  Amostragem sistemática


Utilizamos amostragem sistemática quando os elementos da popu­lação se
apresentam ordenados (ou em filas) e a retirada dos elementos da amostra é
feita periodicamente.

18 • capítulo 1
Usando o exemplo do item anterior, em que a população é composta de 500
elementos ordenados, poderemos utilizar a amostra­gem sistemática primeira-
mente determinando o “salto” que deverá ser dado. Para isto, fazemos a divisão
do tamanho da população pelo tamanho da amostra desejada: N/n = 500/50 = 10.
Em seguida, podemos iniciar a amostragem com qualquer indi­víduo esco-
lhido de forma aleatória entre os 10 primeiros. Após essa escolha, seleciona-
mos os demais sempre “saltando” de 10 em 10.

1.2.3.2.3  Amostragem por conglomerados (clusters)


Algumas vezes, a população se apresenta numa subdivisão em pequenos gru-
pos, chamados conglomerados. Neste caso, é possível, e até conveniente, fazer
uma amostragem por meio desses conglomera­dos. Este tipo de amostragem
consiste em sortear um número suficiente de conglomerados, cujos elemen-
tos constituirão a amostra. Quando um conglomerado é sorteado, todos os ele-
mentos dentro dele são seleciona­dos para a amostra. Este tipo de amostragem
é muitas vezes utilizado por motivos de ordem prática e econômica.
Suponha que desejemos estudar alguma caracte­rística dos indivíduos que
moram num determinado bairro da cidade. A população de interesse é consti-
tuída por todos os indivíduos que moram nesse bairro em que cada residência
constitui um conglomerado. Podemos sortear alguns conglomerados (residên-
cias) e cada morador da unidade sorteada fará parte da nossa amostra.

1.2.3.2.4  Amostragem estratificada


Esta técnica é muito utilizada quando a população é heterogênea ou quando se
consegue dividi-la em subpopulações ou estratos. A amostra­gem estratificada
consiste em especificar quantos elementos da amostra serão retirados em cada
estrato. O número de elementos sorteados em cada estrato deve ser proporcio-
nal ao número de elementos existentes no estrato.
Vamos supor que uma pesquisa tenha como objetivo estudar uma deter-
minada característica do povo brasileiro por exemplo a renda familiar. Nesse
caso, a população de interesse é cons­tituída por todos cidadãos que moram
no Brasil. Podemos considerar cada estrato como sendo cada um dos estados
brasileiros. Em cada um deles, será selecionado um número x de elementos,
proporcional à população de cada estado.

capítulo 1 • 19
1.2.3.3  Técnicas de amostragem não probabilística (não aleatória)

Somente é recomendado o uso de métodos de amostragem não proba-


bilística nos casos em que é impossível ou inviável a utilização de méto-
dos probabilísticos.

1.2.3.3.1  Amostragem a esmo ou sem norma


É a amostragem em que o pesquisador, para simplificar o processo, procura ser
aleatório sem, no entanto, usar algum dispositivo aleatório confiável.
Suponha que se deseje retirar uma amostra de 50 parafusos de uma caixa
que contém 5 000 deles. Nesse caso, ao in­vés de sortear os parafusos, podería-
mos escolher a esmo aqueles que fariam parte da amostra. Não é um procedi-
mento totalmente aleatório porque, mesmo sem perceber, poderíamos estar
privilegiando alguma parte da caixa, não dando, dessa forma, a mesma chance
de participação a todos os parafusos.

1.2.3.3.2  Amostragem intencional


Neste caso, o amostrador escolhe deliberadamente os elementos que irão com-
por a amostra, por julgá-los bem repre­sentativos da população.
Por exemplo, um diretor de uma instituição de ensino deseja ava­liar o quan-
to determinada disciplina está sendo bem ministrada por seu professor. Para
isso, seleciona, para uma entrevista, alguns dos alunos com melhor desempe-
nho nessa disciplina.

1.2.4  Variáveis quantitativas e qualitativas

Variável é uma característica da unidade experimental. Vamos estu­dar dois ti-


pos de variáveis: quantitativas e qualitativas.
Variáveis quantitativas são aquelas cujas respostas da variável são expressas
por números (quantidades). Podemos distinguir dois tipos de variáveis quan-
titativas: quantitativa contínua e quantitativa discreta. Variáveis quantitativas
contínuas são aquelas que podem assumir, teoricamente, infinitos valores en-
tre dois limites (num intervalo), ou seja, podem assumir valores não inteiros
como, por exemplo, altura de alunos de uma determinada faixa etária, peso,
comprimento, espessura, velocidade, temperatura, salário etc. Já as variáveis
quantitativas discretas são aquelas que só podem assumir valores inteiros

20 • capítulo 1
como, por exemplo, número de filhos por casal, número de li­vros em uma bi-
blioteca, número de carros vendidos, número de acidentes, número de defei-
tos etc.
Variáveis qualitativas são as variáveis cujas respostas são expressas por um
atributo. Podemos distinguir dois tipos de variáveis qualitativas: nominal e
ordinal. Variáveis qualitativas nominais definem-se como aquelas em que as
respostas são expressas por um atributo (nome) e esse atributo não pode ser or-
denado, por exemplo: tipo sanguíneo, religião, estado civil, cor dos olhos, raça
etc. As variáveis qualitativas ordinais têm suas respostas expressas por um atri-
buto (nome) e esse atributo pode ser ordenado, por exemplo: grau de instrução,
classe social, nível de satisfação etc.

1.2.5  Estatística descritiva

A estatística compreende dois campos: a descritiva e a indutiva. Estatística des-


critiva é a parte que trata da organi­zação e do resumo do conjunto de dados por
meio de gráficos, tabelas e medidas descritivas (quantidades).
Cada informação deve ser reduzida e resumida, até o ponto em que se possa
interpretá-la mais claramente usando medidas-sínteses, que geram um núme-
ro que sozinho descreve a característica de um conjunto de dados.
Seu objetivo é a observação de fenômenos de mesma natureza, a coleta de
dados numéricos referentes a esses fenômenos, a organização e classificação
dos dados observados, sua apresentação em gráficos e tabelas e o cálculo de coe-
ficientes estatísticos que permitam descrever resumidamente esse fenômeno.

1.2.6  Estatística indutiva

Estatística indutiva é a parte que se destina a encontrar métodos para tirar con-
clusões (ou tomar decisões) sobre a população de interesse, geralmente basea-
dos em informações retiradas de uma amostra dessa po­pulação. Refere-se a
um processo de generalização calcado em resultados particulares. Consiste em
inferir (induzir, concluir, deduzir) propriedades para o todo com base na parte.
A generalização está associada a uma margem de incerteza que é tratada com
técnicas e métodos da teoria da probabilidade.

capítulo 1 • 21
1.3  Fases do método estatístico descritivo
A seguir, listaremos etapas do método estatístico descritivo. São ações geral-
mente executadas quando se decide coletar dados com a finalidade de extrair
informações relevantes que influenciarão os processos decisórios.

1.3.1  Definição do problema

Consiste em saber exatamente o que se pretende estudar, ou seja, definir e for-


mular corretamente o problema a ser estudado e o objeto do estudo. Antes de-
verá ser feita uma pesquisa para verificar se não existem outros estudos na área,
que forneçam algumas ou todas as informações necessárias. Por isso, é impor-
tante verificar a relevância do estudo e seus objetivos, checando se é realmente
um estudo inédito (para não se perder tempo “reinventando a roda”).

1.3.2  Planejamento

Nessa fase, definem-se quais dados deverão ser obtidos, a forma de levantar
informações sobre o objeto do estudo e o procedimento necessário para resol-
ver o problema. A escolha das perguntas que serão feitas e sua formulação são
foco de preocupação nessa etapa. É na fase de planejamento que ainda se esco-
lhe o tipo de levantamento: censitário (contagem completa, englobando todo o
universo ou população) ou por amostragem (contagem parcial), ou seja, como
serão escolhidos os dados. Define-se, ainda, o cronograma para prazos, fases
e custos.

1.3.3  Coleta de dados

É uma fase operacional. Compreende a coleta das informações propriamen-


te ditas, abrangendo a obtenção, reunião e o registro sistemático de dados. A
coleta de dados é feita geralmente por meio de questionários que podem ser
preenchidos pelo próprio informante ou por um pesquisador de campo. Pode-
mos também nos apropriar de dados já coletados e existentes em um banco
de dados.
Caso a opção seja pelo uso de um questionário, devemos ter os seguin-
tes cuidados:

22 • capítulo 1
•  Especificar os objetivos gerais.
•  Conhecer o uso das respostas obtidas para melhor elaboração
das perguntas.
•  Planejar, se possível, os tipos de tabela.
•  Certificar-se de que todas as informações podem ser obtidas (cuidado
com idade/renda/datas/gastos passados – garanta o sigilo dos dados).
•  Elaborar perguntas claras e precisas.
•  Não sugerir respostas.
•  Evitar redações longas.
•  Seguir alguma ordem lógica (mais simples → mais complexa).
•  Incluir as instruções, se necessárias, no corpo do questionário.
•  Ter cuidado com a aparência gráfica e com o material utilizado
para preenchimento.

1.3.4  Apuração dos dados

Apuração ou sumarização: resumir dados por meio de sua contagem e agrupa-


mento. É um trabalho de condensação e de tabulação dos dados, que pode ser
manual, eletrônica ou digital.

1.3.5  Apresentação dos dados

A exposição dos dados pode ser feita de duas formas que não se excluem: tabu-
lar ou gráfica. A tabular é uma apresentação numérica dos dados em linhas e
colunas. As tabelas expõem sinteticamente os resultados, permitindo uma vi-
são global do fenômeno. A gráfica permite uma visão rápida, fácil e clara do fe-
nômeno e de sua variação. O gráfico torna compreensível a tabela. Não há uma
única maneira de representar graficamente uma série estatística. A escolha do
gráfico mais apropriado ficará a critério do analista.
Vamos ver a seguir alguns exemplos de tabelas e gráficos:

ESTADO CIVIL NÚMERO DE FUNCIONÁRIOS PERCENTUAL


Casado 5 25%
Solteiro 12 60%
Divorciado 3 15%
Viúvo 0 0%
Total 20 100%

Tabela 1.1  –  Estado civil de uma amostra de 20 funcionários da empresa XXX.

capítulo 1 • 23
Gráficos extraídos da tabela 1.1:

Estado civil x Funcionários - Empresa XXX -


Frequência simples
14 12
12
Nº de funcionários

10
8
6 5
4 3
2 0
0
Casado Solteiro Divorciado Viúvo
Estado civil

Estado civil x Funcionários - Empresa XXX -


Frequência relativa

0%

15%
25% Casado
Solteiro

Divorciado
Viúvo
60%

NÚMERO DE
RENDA MENSAL $
FUNCIONÁRIOS
0 -| 1 000 8

1 000 -| 2 000 5

2 000 -| 3 000 4

3 000 -| 4 000 3

TOTAL 20
Tabela 1.2  –  Renda mensal de 20 funcionários da empresa XXX.

24 • capítulo 1
Gráfico extraído da tabela 1.2:

Renda mensal $ x Nº de funcionários


Empresa XXX - Frequência simples
9
8
8
7
Nº de funcionários

6 5
5 4
4 3
3
2
1
0
1000 2000 3000 4000

–I –I –I –I
0 1000 2000 3000
Renda mensal $

No próximo capítulo, aprenderemos a montar tabelas como as dos exem-


plos mostrados e a extrair gráficos.

1.4  Arredondamento de dados


Quando houver necessidade de arredondamento de dados numéricos, esta
ação deverá ser indicada na tabela. Usaremos duas regras:
Se o primeiro algarismo a ser abandonado for menor ou igual a 4, o algaris-
mo que permanecer não deverá ser alterado. Vamos arredondar os seguintes
valores para duas casas decimais:
•  8,074 será arredondado para 8,07.
•  239,532 será arredondado para 239,53

Se o primeiro algarismo a ser abandonado for maior ou igual a 5, o primeiro


algarismo que permanecer deverá ser acrescido de 1. Vamos arredondar os se-
guintes valores para duas casas decimais:
•  8,076 será arredondado para 8,08.
•  239,537 será arredondado para 239,54.

capítulo 1 • 25
ATIVIDADES
01. Classifique cada item a seguir como dado qualitativo (nominal ou ordinal) ou dado quan-
titativo (discreto ou contínuo):

VARIÁVEL TIPO DE DADO

O número de peças fabricadas por dia no setor de solda da empresa x


na última semana

O estado civil dos funcionários do setor de solda da empresa x

A temperatura em °C da sala de soldagem às 11 horas da manhã em dia


de trabalho da empresa x durante o último mês

A idade em anos dos funcionários do setor de solda da empresa x

O peso em kg desses mesmos funcionários

O horário de entrada dos funcionários do turno da manhã na última


semana

O número de filhos de cada funcionário do setor de solda

02. Defina uma variável quantitativa discreta.

03. Defina uma variável quantitativa contínua.

04. Cite quais as fases do método estatístico descritivo.

05. Faça o arredondamento para duas casas decimais dos valores a seguir:

567,999
1 000,001
26,234
26,236

06. Explique quando deveremos usar, em uma pesquisa, a amostra ou a população.

26 • capítulo 1
07. As seguintes informações foram coletadas de alunos que saíam da livraria do seu cam-
pus universitário ao longo da primeira semana de aula. Classifique cada uma dessas variáveis
como qualitativa nominal, qualitativa ordinal, quantitativa discreta ou quantitativa contínua:
a) Tempo gasto para fazer a compra
b) Número de livros didáticos comprados
c) Área de especialização do aluno
d) Sexo do aluno

08. Suponha que o diretor de pesquisa de mercado de uma loja de departamentos de uma
região metropolitana deseje conhecer o perfil de compras de mulheres que trabalham fora,
determinando a quantidade de tempo que elas gastam por mês comprando roupas em um
mês típico.
a) Descreva a população e a amostra de interesse para este caso, indicando quais variáveis
ou tipos de dados seriam necessários coletar para atingir o objetivo da pesquisa.
b) Desenvolva 3 perguntas que retornem respostas qualitativas e 3 preguntas que retor-
nem respostas quantitativas para atingir o objetivo desta pesquisa.

09. A guerra das ´Colas´ é o termo popular para a intensa competição entre Coca-Cola
e Pepsi mostrada em suas campanhas de marketing. As campanhas têm estrelas de ci-
nema e televisão, vídeos de rock, apoio de atletas e afirmações das preferências dos
consumidores com base em testes de sabor. Como parte de uma campanha de mar-
keting da Pepsi, supo­
nha que 1.000 consumidores de refrigerante cola submetam-
-se a um teste cego de sabor (isto é, as marcas estão encobertas). Cada consumidor é ques-
tionado quanto à sua preferência em relação à marca A ou à marca B.
a) Descreva a população.
b) Descreva a variável de interesse.
c) Descreva a amostra.
d) Descreva a inferência.

10. Os institutos de pesquisa de opinião regularmente fazem pesquisas para determinar o


índice de popularidade do presidente em exercício. Su­ponha uma pesquisa feita com 2.500
indivíduos, que serão questionados se o presidente está fazendo um bom ou um mau go-
verno. Os 2.500 indivíduos serão selecionados por números de telefone aleatórios e serão
entrevistados por telefone.
a) Qual a população relevante?
b) Qual a variável de interesse? É qualitativa ou quantitativa?

capítulo 1 • 27
c) Qual é a amostra?
d) Qual é o interesse da inferência para o pesquisador?
e) Qual método de coleta de dados foi empregado?
f) A amostra em estudo é representativa?

11. Uma população se encontra dividida em quatro estratos. O tamanho de cada estrato é:
N1 = 80, N2 = 120, N3 = 60 e N4 = 60 Sabe-se que uma amostragem proporcional foi
realizada e dezoito elementos da amostra fo­ram retirados do segundo estrato. Qual o número
total de elementos da amostra?

12. Uma pesquisa precisa ser realizada em uma determinada cidade. A amostragem propos-
ta para este problema é a seguinte: dividir a cidade em bairros (pelo próprio mapa da cidade);
em cada bairro, sorteia-se certo número de quarteirões proporcional à área do bairro; em
cada quarteirão, serão sorteadas quatro residências e, nestas quatro residências, todos os
mora­dores serão entrevistados.
a) Essa amostra será representativa da população ou poderá apresentar algum vício
(não confiável)?
b) Quais tipos de amostragem foram utilizados no procedimento?

REFLEXÃO
Estamos encerrando nosso primeiro capítulo. Vimos, aqui, alguns conceitos que serão fun-
damentais na compreensão dos outros conteúdos abordados no livro. Já deve ter dado para
perceber que, mesmo estando no início da disciplina, as aplicações práticas que você poderá
fazer na sua área de atuação serão muitas. A compreensão e interpretação das mais varia-
das informações, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do
conhecimento de certos elementos estatísticos.
Estamos apenas no começo. Muitas técnicas ainda serão abordadas. Lembre-se de que
o conhecimento e o domínio da es­tatística certamente levarão você, futuro engenheiro, a
tomar as decisões mais acertadas.

28 • capítulo 1
LEITURA
Consulte os links a seguir para conhecer mais sobre os assuntos abordados nesse capítulo:

HISTÓRIA DA PROBABILIDADE Disponível em: <http://m3.ime.unicamp.br/recursos/1252>.


E ESTATÍSTICA
Disponível em: <http://oglobo.globo.com/emprego/estatisticos-en-
PROFISSÃO DO ESTATÍSTICO tram-em-cena-carreira-tem-segundo-melhor-salario-7347090>.

IBGE Disponível em: <http://www.ibge.gov.br/ibge/default.php>.

Disponível em: <http://www.ibge.gov.br/ibgeteen/


IBGE TEEN censo2k/index.html>.

DIEESEI Disponível em: <http://www.dieese.org.br/>.

INEP Disponível em: <http://www.inep.gov.br/>.

NORMAS DE APRESENTAÇÃO Disponível em: <http://biblioteca.ibge.gov.br/visualizacao/


TABULAR IBGE livros/liv23907.pdf>.

REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatística aplicada à
administração e economia. São Paulo: Pio­neira Thomson Learning, 2003.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro:
LTC, 2014.
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. São Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatística. São Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatística aplicada. São Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à estatística.
Rio de Janeiro: LTC, 2003.25 Conceitos introdutórios e técnicas de amostragem
FONSECA, Jairo Simon; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano. Estatística
aplicada. São Paulo: Atlas, 1985.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora Ltda.,
2000.
LEVIN, Jack; FOX, James Alan. Estatística para ciências humanas. São Paulo: Prentice Hall, 2004.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.

capítulo 1 • 29
MARTINS, Gilberto de Andrade. Estatística geral e aplicada. São Paulo: Atlas, 2002.
McClave, James T.; BENSON P. George.; SINCICH, Terry. Estatísti­ca para administração e
economia. São Paulo: Pearson Prentice Hall, 2009.
MEMÓRIA, José M. P. Breve História da Estatística. Disponível em: <http://www.im.ufrj.
br/~lpbraga/prob1/historia_estatistica.pdf>. Acesso em: 25 setembro 2014.
MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Pioneira Thomson Learning, 2004.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.
VIEIRA, Sonia. Elementos de estatística. São Paulo: Atlas, 2003. Disponível em: <http://www.
ufrgs.br/mat/graduacao/estatistica/histo­ria-da-estatistica>. Acesso em: 25 set. 2014

30 • capítulo 1
2
Distribuição
de Frequências
Representação
Tabular e
Representação
Gráfica
Nesse capítulo, vamos trabalhar os conceitos da estatística descritiva. Quando
realizamos uma coleta de dados, geralmente esta­mos lidando com uma quan-
tidade muito grande de informa­ções, por isso torna-se imprescindível a utili-
zação de certas técnicas visando simplificar sua leitura. Saber organizar dados
brutos e extrair informações deles é um dos objetivos da estatística descritiva.
Para que se tenha uma visão do todo ( o fenômeno que está sendo estudado)
precisamos, por exemplo, dispor as informações em tabe­las ou apresentá-las
em gráficos, que é exatamente o que será apresentado agora.
Observe o artigo “Manutenção centrada em confiabilidade (MCC): análise
quantitativa de um forno elétrico a indução”, O(deletar O) extraído da Revista
Produção Online, vinculada à Abepro (CERVEIRA, 2015). Para que os autores
chegassem a um diagnóstico para a melhor estratégia de manutenção a ser
aplicada em um forno elétrico instalado em uma fundição de aços especiais,
foi necessária a coleta de dados numéricos referentes, entre outros, ao tempo
que o equipamento demorava para apresentar uma falha e ao tempo de dura-
ção da manutenção no equipamento. Baseada na coleta e na organização de
dados históricos e simples como estes, uma eficiente estratégia de manutenção
centrada na confiabilidade foi definida.
Note o quanto é importante o que estamos estudando. Provavelmente na
sua trajetória profissional, você terá de lidar com situações como esta. Vamos
aos estudos!

OBJETIVOS
Ao final deste capítulo você deverá ser capaz de organizar, resumir e apresentar as informa-
ções contidas em grandes conjuntos de dados por meio da criação de tabelas simples, nas
quais os dados não estarão agrupados em classes, e de tabelas com dados agrupados em
classes, inserindo as frequências simples, relativas e acumuladas. Ainda será possível cons-
truir gráficos calcados nas tabelas e identificar o gráfico mais indicado para representar uma
determinada frequência ou um tipo de dado.

32 • capítulo 2
2.1  Representação Tabular de Dados
Uma das vantagens da apresentação tabular dos dados é a de condensar, de
forma consistente, as informações necessárias ao estudo desejado. Surgem ge-
ralmente valores que se repetem e a representação em tabelas só mostra os
valores diferentes entre eles ou, então, aparece um número muito grande e va-
riado de dados e só uma tabela permitirá o agrupamento desses valores. Isso
favorece uma análise e uma interpretação mais rápida e clara da natureza e do
comportamento do fenômeno estudado.

2.1.1  Dados brutos

Ao iniciar a coleta dos dados, deparamo-nos inicialmente com os dados brutos.


Nesta etapa, os dados estão sem ordenação e dispostos da maneira como foram
coletados.

EXEMPLO
Exemplo 1 – Número mensal de acidentes de trabalho não fatais nos últimos 60 meses, na
empresa ABC:

3 3 3 3 3 7 6 8 2 8 4 4

4 4 4 5 6 5 5 5 4 6 6 6

6 6 6 4 4 8 8 7 5 4 4 7

6 7 9 4 4 7 8 9 8 4 4 5

5 5 5 5 6 6 6 5 4 6 8 5

Note que, como esses valores estão desordenados, fica difícil fazer qualquer tipo de
inferência sobre as observações.

capítulo 2 • 33
2.1.2  Rol

Dando um passo adiante, podemos colocar os dados brutos em ordem crescen-


te ou decrescente. A esta forma de apresentação é dado o nome de rol.

EXEMPLO
Exemplo 2 – Número mensal, em ordem crescente, de acidentes de trabalho não fatais, nos
últimos 60 meses, na empresa ABC:

2 3 3 3 3 3 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 5 5 5 5 5 5 5

5 5 5 5 5 6 6 6 6 6 6 6 6 6

6 6 6 6 7 7 7 7 7 8 8 8 8 8

8 8 9 9

2.1.3  Distribuição de frequências

Para entender a ideia de distribuição de frequências, vamos analisar a seguinte


situação: quando um pesquisador termina de coletar os dados para sua pes-
quisa, geralmente fica com muitos questionários em mãos (respondidos pelas
pessoas que foram sorteadas para pertencer à sua amostra) ou com os dados
digitados em alguma planilha eletrônica. O fato é que os dados brutos (sem tra-
tamento) não trazem as informações de forma clara, por isso devemos tabulá
-los. Ao tabular esses dados, estaremos resumindo as informações para melhor

34 • capítulo 2
compreensão da variável em estudo. A esta tabulação dá-se o nome de distribui-
ção de frequências (ou tabela de frequências).
Distribuição de frequências é uma tabela que resume gran­des quantidades
de dados, determinando o número de vezes em que eles ocorrem (frequência)
e a porcentagem com que aparecem (frequência relativa). Para facilitar a con-
tagem do número de vezes que cada dado ocorre, podemos ordenar os dados
brutos em um rol, conforme visto no item anterior.
Os tipos de frequência com os quais iremos trabalhar são:
•  Frequência simples ou absoluta ou simplesmente frequência (fi): é o nº de
vezes que cada dado aparece na pesquisa.
•  Frequência relativa ou percentual (fr): é o quociente da frequência absolu-
ta pelo número total de dados. Esta frequência pode ser expressa em porcenta-
gem. O valor de (fr x 100) é definido como fr (%).
•  Frequência acumulada (Fi): é a soma de cada frequência com as que lhe
são anteriores na distribuição.
•  Frequência relativa acumulada (Fr): é o quociente da frequência acumula-
da pelo número total de dados. Esta frequência também pode ser expressa em
porcentagem. O valor de (Fr x 100) é definido como Fr (%).

Veremos detalhadamente cada um desses tipos de frequência no próximo


item, representando os dados em tabelas, nas quais os valores se apresentam
em correspondência com suas repetições, evitando assim que eles apareçam
mais de uma vez. Estudaremos dois tipos de tabelas:
1 – Tabelas em que os dados não estão agrupados em classes.
2 – Tabelas em que os dados estão agrupados em classes.

2.1.3.1  Distribuição de frequências de dados tabulados não agrupados em


classes

É uma tabela onde os valores da variável aparecem individualmente, utilizada


para representar variáveis qualitativas ou variáveis quantitativas discretas com
pequena dispersão (variação).

capítulo 2 • 35
EXEMPLO
Exemplo 3 – Utilizando os dados do exemplo 2, vamos descrever um esquema “passo a
passo” para a construção de uma tabela sem dados agrupados em classe.

2 3 3 3 3 3 4 4 4 4 4 4 4 4

4 4 4 4 4 4 4 5 5 5 5 5 5 5

5 5 5 5 5 6 6 6 6 6 6 6 6 6

6 6 6 6 7 7 7 7 7 8 8 8 8 8

8 8 9 9

X é a representação para a variável em estudo. Neste exemplo, X é o número de aciden-


tes mensais.
•  Passo 1 – Identifique o menor valor encontrado na pesquisa: X mínimo = 2.
•  Passo 2 – Identifique o maior valor encontrado na pesquisa: X máximo = 9.
•  Passo 3 – Calcule a amplitude total (variação ou dispersão) que é igual à diferença entre o
maior valor e o menor valor encontrados na pesquisa:
At = Xmáx – Xmín = 9 – 2 = 7

Como o tipo de dado é quantitativo discreto e a amplitude total (dispersão) é pequena,


usaremos uma tabela sem classes. A tabela deverá conter as seguintes colunas:
1ª coluna – Indicaremos o índice i, representado por números inteiros de 1 a n, sendo n
o tamanho da amostra ou população.
2ª coluna – Indicaremos a variável x que está sendo tratada. Neste caso, o número de
acidentes mensais não fatais em ordem crescente é de 2 até 9.
3ª coluna – Indicaremos a frequência simples, representada por fi, isto é, a repetição de
cada valor observado para a variável x.
4ª coluna – Indicaremos a frequência relativa, fr, de cada valor observado para a variá-
vel x.
5ª coluna – Indicaremos a frequência acumulada simples, Fi, para cada valor da variável
observada x.
Assim ficará a tabela:

36 • capítulo 2
FI
XI FI REPETIÇÃO FR
FREQUÊNCIA
I Nº DE ACIDEN- DOS ACIDENTES FREQUÊNCIA
SIMPLES
TES MENSAIS (MESES) RELATIVA
ACUMULADA
1 2 1 1,67% 1
2 3 5 8,33% 6
3 4 15 25,00% 21
4 5 12 20,00% 33
5 6 13 21,67% 46
6 7 5 8,33% 51
7 8 7 11,67% 58
8 9 2 3,33% 60
--- TOTAL 60 100,00% ---

Vamos detalhar cada coluna:


Frequência Simples
A coluna da frequência simples é registrada por meio da observação dos dados brutos e
da simples contagem das vezes em que cada valor se repetiu. A contagem fica mais simples
quando esses dados estão organizados em um rol. O somatório das frequências simples
representa n, o tamanho da amostra (ou da população quando for o caso). A notação mate-
mática é dada por:

k
n = ∑ fi ou simplesmente n = ∑ fi
i =1

Lê-se da seguinte forma: o tamanho da amostra n é o somatório das frequências sim-


ples com i variando de 1 até k. k indica a quantidade de valores diferentes que a variável n
observada pode assumir. Neste exemplo n é 60, indicando que a amostra tem tamanho 60.
Desdobrando esta fórmula, temos:

k
n = ∑ fi = f1 + f2 + ... + fk
i =1

n = 1 + 5 + 15 + 12 +13 + 5 + 7 + 2 = 60

Frequência Relativa
Como visto no item anterior, a frequência relativa é calculada sobre a divisão de cada
valor de frequência simples pelo tamanho da amostra:

fi fi
fr = = k
n
∑ fi
i =1

capítulo 2 • 37
Geralmente, é mostrada em porcentagem com duas casas decimais. Para isso, faça a
divisão, multiplique por 100 e coloque o símbolo %. Atenção para o arredondamento, pois a
soma das frequências relativas deve totalizar 1 ou 100%.

Frequência Acumulada
Quando falamos apenas em frequências acumuladas, estamos nos referindo à frequên-
cia acumulada simples abaixo, mas podemos ter frequências acumuladas simples e relativas,
abaixo e acima, portanto podemos ter 4 colunas para representar as frequências acumuladas:
1 – Frequência acumulada abaixo: soma de todas as frequências simples ou relativas
até um dado valor, inclusive esse valor.
2 – Frequência acumulada acima: soma de todas as frequências simples ou relativas
além de um dado valor, inclusive esse valor.

No exemplo, para o registro de acidentes mensais o cálculo foi o seguinte:


1º valor – repete o 1º valor da frequência simples;
2º valor – soma o valor da 1ª frequência acumulada com o 2º valor da frequência simples;
3º valor – soma o valor da 2ª frequência acumulada com o 3º valor da frequência simples;
e assim sucessivamente, acumulando os valores. Isto pode ser feito para a frequência
simples ou relativa, assim como pode ser calculado de cima para baixo (frequência acumula-
da abaixo) ou de baixo para cima (frequência acumulada acima).

FI
XI FI FI
REPETI- FR
NÚMERO DE FREQUÊNCIA SIM- FREQUÊNCIA SIM-
I ÇÃO DOS FREQUÊNCIA
ACIDENTES PLES ACUMULADA PLES ACUMULADA
ACIDENTES RELATIVA
MENSAIS ABAIXO (MESES) ACIMA (MESES)
(MESES)
1 2 1 1/60 x 100%= 1,67% 1 59+1=60
2 3 5 5/60 x 100%= 8,33% 1+5=6 54+5=59
15/60 x 100%=
3 4 15 6+15=21 39+15=54
25,00%
12/60 x 100%=
4 5 12 21+12=33 27+12=39
20,00%
13/60 x 100%=
5 6 13 33+13=46 14+13=27
21,67%
6 7 5 5/60 x 100%= 8,33% 46+5=51 9+5=14
7 8 7 7/60 x 100%= 11,67% 51+7=58 2+7=9
8 9 2 2/60 x 100%= 3,33% 58+2=60 2
--- TOTAL 60 100,00% ---

38 • capítulo 2
Vamos analisar o que está representado na terceira linha da tabela:
Identificou-se a ocorrência de 4 acidentes não fatais mensais, em 15 meses, dos 60 ob-
servados. Isto representou 25% dos meses observados. Em 21 meses, dos 60 observados,
tivemos 4 ou menos acidentes mensais. Em 54 meses, dos 60 observados, tivemos 4 ou
mais acidentes mensais.

Obs.: abra o arquivo 02distribuicaodefrequencias.xls e em PLAN 1 veja como tudo


isso pode ser feito no Excel. Dê um clique sobre cada célula e veja as fórmulas e funções
que foram usadas.

2.1.3.2  Distribuição de frequências de dados tabulados agrupados em classes

Agora veremos como construir uma tabela onde os valores observados apare-
cem agrupados em classes ou faixas. Ela deverá ser usada quando a variável do
estudo for quantitativa contínua ou quando a variável do estudo for quantitati-
va discreta e a dispersão (variação) desses valores for muito grande.
Seu uso visa evitar inconvenientes como:
•  a grande extensão de uma tabela;
•  o aparecimento de valores com frequência nula;
•  a dificuldade de visualização do comportamento como um todo.

Para construir uma tabela com classes calcada em dados brutos, podemos
seguir estes passos:

Passo 1 – Encontrar a amplitude total do conjunto de valores observados:


At = XMÁX – XMIN

Como visto no item anterior, é a diferença entre o maior e o menor valor


observados da variável em estudo.

capítulo 2 • 39
Passo 2 – Escolher o número de classes K que será usado:
É cada um dos grupos de valores em que se subdivide a amplitude total.
Você pode usar uma das 4 sugestões de cálculo a seguir (em que n = quantidade
total de valores observados):
a) K = n ou
b) k ≅ 1 + 3,32 log n ou
c) Escolher k com base na tabela:

n 5 10 25 50 100 200 500 1000


K 2 4 6 8 10 12 15 15

ou
c) Escolher um número entre 5 e 20.

Use seu bom senso para determinar o número de classes, ressaltando que,
quanto maior o número de observações, maior deverá ser o número de classes.
A definição do número de classes tem um pouco de tentativa e erro na procura
da melhor distribuição que represente os valores da variável. Este deverá ser
sempre um número inteiro.
Passo 3 – Calcular a amplitude h de cada intervalo de classe:

AT
h=
k

A amplitude do intervalo de classe é igual ao quociente entre a amplitude to-


tal da série e o número de classes escolhido. Muitas vezes, é preciso arredondar
o número para um valor que facilite o cálculo.
Futuramente, quando trabalharmos com uma tabela já montada, podere-
mos encontrar o valor de h subtraindo os valores do limite inferior dos valores
do limite superior de uma mesma classe, representado por:
Li = limite inferior da classe
Ls = limite superior da classe
h = Ls – Li

Os limites de classes são seus valores extremos. Sua escolha deve ser feita de
forma que, dentro do possível, seus pontos médios coincidam com a concen-
tração dos valores reais. É recomendável que sejam números inteiros. Como

40 • capítulo 2
padrão, o limite inferior da primeira classe é escolhido ligeiramente inferior
que o menor valor da amostra e, da mesma maneira, o limite superior da última
classe ligeiramente excede o maior valor da amostra, entretanto nada impede a
utilização dos valores extremos como limites.

( L i + Ls )
O ponto médio de classe é dado por: PM =
2

O ponto médio de cada classe é calculado somando-se os limites inferiores


e superiores de cada classe e dividindo-os por 2.

Passo 4 – Definir a representação dos intervalos de classes:


A |— B = inclui A, exclui B.
A —| B = exclui A, inclui B.
A |—| B = inclui A, inclui B.
A — B = exclui A, exclui B.
Dessa maneira, A é o limite inferior da classe e B é o limite superior. Como
prática corrente, o limite superior de cada classe inclui o próprio valor; tecnica-
mente, o limite superior é fechado e o inferior é aberto, com exceção da primei-
ra classe, isto é, o limite é fechado na esquerda e na direita. Esta é a premissa
usada pela função frequência no Excel.
Vamos construir a tabela utilizando os dados brutos (em formato de Rol) a
seguir, que representam os dias de afastamento por acidente de trabalho não
fatal, relativos aos últimos 60 acidentes ocorridos na empresa XYZ:

3 19 25 28 32 35
8 20 25 28 33 36
11 20 26 28 33 36
12 20 26 28 33 36
12 23 26 28 34 41
13 23 26 29 34 41
14 24 26 29 35 41
16 24 26 30 35 41
17 25 26 30 35 42
19 25 26 31 35 43

capítulo 2 • 41
Passo a passo dos cálculos das classes:

n= 60
X mínimo = 3
X máximo = 43
At = Xmín. – Xmáx. = 40

Número de classes: deve ser um número inteiro k.

K = 1+ 3,32 * log (n) = 6,867899


Vamos usar K = 7

Amplitude de cada classe: é melhor que seja um número inteiro h.

h = At/k = 5,714286

Vamos usar h = 6

Iniciaremos com 3, que é o X mínimo, e somaremos 6. O resultado 9 será o


limite superior da primeira classe e será também o limite inferior da segunda
classe. Somaremos 9+6. Chegaremos a 15, que será o limite superior da segun-
da classe e o inferior da terceira classe. Somaremos 6 sucessivamente até che-
garmos a um valor maior ou igual a X máximo.

Nossa tabela ficará assim:

K DIAS DE AFASTAMENTO (CLASSES) FI REPETIÇÃO FR FI


1 3 |---| 9 2 3,33% 2
2 9 ---| 15 5 8,33% 7
3 15 ---| 21 7 11,67% 14
4 21 ---| 27 16 26,67% 30
5 27 ---| 33 14 23,33% 44
6 33 ---| 39 10 16,67% 54
7 39 ---| 45 6 10,00% 60
--- TOTAL 60 100,00% ---

42 • capítulo 2
Como calcular cada frequência inserida na tabela? Vamos ao passo a passo.

Frequência simples
Vimos no item anterior que a frequência simples é dada por:
k k
n = ∑ fi ou simplesmente n = ∑ fi ou n = ∑ fi = f1 + f2 + ... + fk
i =1 i =1

Nesse exemplo, para a primeira classe, faremos a pergunta: Quantos aci-


dentes registraram afastamentos de 3 a 9 dias inclusive? Encontraremos 2 afas-
tamentos: um com 3 e outro com 8 dias.
Para a segunda classe, faremos a pergunta: Quantos acidentes registraram
afastamentos de mais de 9 dias até 15 dias inclusive? Encontraremos 5 valores:
11, 12, 12, 13 e 14 e assim sucessivamente.

Frequência relativa
É calculada com a divisão de cada valor de frequência simples pelo tamanho

fi fi
da amostra, assim como visto no item anterior: fr = = k
n
∑ fi
i =1

FI
FR
REPETIÇÃO
2 2/60 x 100% =3,33%

5 5/60 x 100% =8,33%

7 7/60 x 100% =11,67%

16 16/60 x 100% =26,67%

14 14/60 x 100% =23,33%

10 10/60 x 100% =16,67%

6 6/60 x 100% =10,00%

60 100,00%

capítulo 2 • 43
Frequência acumulada

DIAS DE AFASTAMENTO FI
FR FI ABAIXO FI ACIMA
K (CLASSES) REPETIÇÃO
1 3 |---| 9 2 3,33% 2 58+2=60
2 9 ---| 15 5 8,33% 2+5=7 53+5=58
3 15 ---| 21 7 11,67% 7+7=14 46+7=53
4 21 ---| 27 16 26,67% 14+16=30 30+16=46
5 27 ---| 33 14 23,33% 30+14=44 16+14=30
6 33 ---| 39 10 16,67% 44+10=54 6+10=16
7 39 ---| 45 6 10,00% 54+6=60 6

--- TOTAL 60 100% --- ----


Obs.: abra o arquivo 02distribuicaodefrequencias.xls e em PLAN 2 veja
como tudo isso pode ser feito no Excel. Dê um clique sobre cada célula e veja as
fórmulas e funções que foram usadas.

2 – Representação gráfica
A partir de agora, aprenderemos a construir gráficos para as tabelas e frequên-
cias que estudamos até aqui. Veremos que alguns gráficos têm mais afinida-
de com certas frequências, isto é, são mais adequados a representar algumas
frequências e tipos de dados. Lembre-se de quantos relatórios, pesquisas e re-
portagens que você já leu ou preparou que continham gráficos. Gráficos são
usados para resumir informações extraídas de dados coletados em pesquisas.
São mais uma opção para representar as informações que extraímos de dados
brutos.
Apresentação gráfica:
•  É um complemento da apresentação tabular.
•  É usada para apresentar visualmente dados qualitativos (texto) ou quanti-
tativos (números), propiciando mais facilidade e rapidez para sua compreensão.
•  Serve para apresentar conclusões ou resultados de uma análise.
•  Permite a visualização imediata da distribuição dos valores observados.
•  Propicia uma ideia mais satisfatória da concentração e da dispersão
dos valores.

44 • capítulo 2
•  Mostra mais claramente os fatos essenciais e as relações mais difíceis de
reconhecer em massas de dados estatísticos.
Por proporcionar uma visualização rápida e clara do fenômeno observado,
o gráfico deve ser o mais completo possível. Deve conter título, data e fonte de
origem. As legendas podem ser omitidas, desde que as informações estejam
presentes nos eixos do gráfico. A representação gráfica geralmente apresenta
dados dispostos em duas dimensões: eixos X e Y. No eixo X, está representada
a variável observada, a variável xi ou as classes presentes nas tabelas. No eixo Y,
fica representada a frequência que se deseja indicar.
A seguir, mostraremos os principais tipos de gráficos que usaremos na esta-
tística. Cada um será construído com o apoio do Excel. Aprenderemos a cons-
truir gráficos de colunas e barras, gráficos de setores, histogramas e polígonos
de frequências, gráficos de linha ou ogiva de Galton, gráfico de Pareto, cartas de
controle e gráficos de dispersão. Tenha em mente que serão necessários régua,
compasso, transferidor, esquadros, papel milimetrado ou, melhor, no lugar de
tudo isto, basta o Excel!

2.1.4  Principais tipos de gráficos que representam frequências em


tabelas sem classes

São usados para representar tabelas compostas por variáveis qualitativas ou


quantitativas discretas.

2.1.4.1  Gráfico de colunas (verticais)

Compara grandezas por meio de retângulos de igual largura e altu-


ra proporcional às respectivas grandezas da frequência indicada, geral-
mente a frequência simples. Cada coluna representa a intensidade ou
repetição de uma modalidade do atributo. As colunas só diferem em com-
primento, e não em largura, a qual é arbitrária. As colunas devem vir se-
paradas umas das outras pelo mesmo espaço. Como regra prática, pode-
-se tomar o espaço entre as colunas como aproximadamente a metade ou

capítulo 2 • 45
dois terços da largura de suas colunas. Ao ser usado para representação de
séries relacionadas com o tempo, as colunas devem estar dispostas em or-
dem cronológica.

Renda mensal de carvão da empresa X


250
Quantidade em

200
mil toneladas

150
100
50
0
Jan Fev Mar Abr Mai Jun Jul Ago

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.4.2  Gráfico de colunas compostas

Apresenta a coluna segmentada em partes componentes. Serve para repre-


sentar comparativamente dois ou mais atributos.

Importação de vinho e champanhe no ano X


350
300
Valor em 100 dólares

250
200
150
100
50
0
França Itália Chile
Países
Champanhe Vinho

Obs.: Veja na planilha 03graficos.xls como fazer este gráfico no Excel.

46 • capítulo 2
2.1.4.3  Gráfico de colunas agrupadas

Estabelece comparação entre categorias.

Importação de vinho e champanhe no ano X


250

200
Valores em 100 dólares

150

100

50

0
França Portugal Itália Espanha Chile Argentina
Países
Champanhe Vinho

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.4.4  Gráfico de colunas bidirecionais

Utilizado para representar quantidades positivas e negativas.

Encerramento da bolsa dia XX/XX/XX


3,00%

2,50%

2,00%

1,50%
Taxa Bm %

1,00%

0,50%

0,00%
São Paulo

Argentina

México

Paris

Frankfurt

Londres

Tóquio
Down Jones (NY)

Nasdaq (NY)

–0,50%

–1,00%

–1,50%

Obs.: Veja na planilha 03graficos.xls como fazer este gráfico no Excel.

capítulo 2 • 47
2.1.4.5  Gráfico de barras (horizontais)

Os gráficos de barras prestam-se à mesma finalidade que os gráficos de colu-


nas verticais, sendo preferíveis a estes quando as legendas a se inscreverem na
lateral dos retângulos forem longas. A única diferença entre os gráficos de bar-
ras ou de colunas reside na posição dos retângulos. Tudo o que foi dito para as
colunas vale para as barras.
Vendas de vasilhas no ano X
Vasilhas caseiras
Garrafas de refrigerantes
Tipos de vasilhas

Alimentos boca estreita


Licores
Garrafas de cerveja
Utilidade geral
Farmácia e cosméticos
Para alimentos boca larga

0 10 20 30 40
Vendas anuais

Obs: Veja na planilha 03graficos.xls como fazer este gráfico no Excel.corri-


gir: refrigerantes, cerveja, geral, Farmácia, cosméticos, alimentos

2.1.4.6  Gráfico de barras compostas

Apresenta a coluna segmentada em partes componentes. Serve para represen-


tar comparativamente dois ou mais atributos.
Importação de vinho e champanhe no ano X

Argentina

Chile

Espanha
Países

Itália

Portugal

França

0 100 200 300 400


Valor em 100 dólares
Champanhe Vinho

Obs.: Veja na planilha 03graficos.xls como fazer este gráfico no Excel.

48 • capítulo 2
2.1.4.7  Gráfico de barras agrupadas

Estabelece comparação entre categorias.

Importação de vinho e champanhe no ano X

Argentina

Chile

Espanha
Países

Itália

Portugal

França

0 50 100 150 200 250


Valor em 100 dólares
Champanhe Vinho

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.4.8  Gráfico de barras bidirecionais

Utilizado para representar quantidades positivas e negativas.

Encerramento da bolsa dia XX/XX/XX


Tóquio

Frankfurt

México

Nasdaq (NY)

São Paulo

–1,50% –1,00% –0,50% 0,00% 0,50% 1,00% 1,50% 2,00% 2,50% 3,00%
Taxa em %

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

capítulo 2 • 49
2.1.4.9  Gráfico em setores ou de porcentagens

Mostra a participação percentual de cada atributo ou valor no total mostrado.


Usado para representar valores absolutos ou porcentagens complementares
(frequência relativa). No Excel, é representado pelo gráfico de pizza.

Produção agrícola do estado no mês X

6%
8% Café
28%
Açúcar
13%
Milho
Feijão
19% Soja
26%
Laranja

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.4.10  Gráfico de linha

É usado para representação de séries de tempo e frequências acumuladas.


Quando cobre um grande número de períodos, o gráfico de colunas pode ficar
sobrecarregado e a linha substitui com clareza a altura das colunas. É o gráfico
ideal quando existem muitas flutuações. Para construí-lo, basta marcar os pon-
tos e uni-los com um traço contínuo.
Quantidade de casos de dengue no Estado XX
40000
35000
30000
25000
20000
15000
10000
5000
0
16/01/2015
18/01/2015
20/01/2015
22/01/2015
24/01/2015
26/01/2015
28/01/2015
30/01/2015
01/02/2015
03/02/2015
05/02/2015
07/02/2015
09/02/2015
11/02/2015
13/02/2015
15/02/2015
17/02/2015
19/02/2015

Obs: Veja na planilha 03graficos.xls como fazer este gráfico no Excel.corri-


gir: dengue, 40.000, 35.000, 30.000, 25.000, 20.000, 15.000, 10.000, 5.000

50 • capítulo 2
2.1.5  Principais tipos de gráficos que representam frequências em
tabelas com classes

São utilizados para representar tabelas compostas por variáveis quantitativas dis-
cretas (que apresentem grande dispersão nos dados) ou quantitativas contínuas.

2.1.5.1  Histograma

Trata-se de um gráfico formado por um conjunto de retângulos justapostos, de


forma que a área de cada retângulo seja proporcional à frequência simples de
classe que ele represente. Assim, a soma das áreas dos retângulos será igual à
frequência total.
No eixo horizontal, serão anotados os valores individuais da variável em es-
tudo ou dos limites de classes. A dimensão horizontal de cada retângulo repre-
sentará a classe.
No eixo vertical, será construída a escala onde estarão os valores das obser-
vações ou as frequências simples de classes. É representado por um gráfico de
colunas no Excel.

Histograma - vendas diárias em milhares $

9
8
8
7
Frequência absoluta fi

6
6
5
4 4
4
3
3
2
1

0
310 340 370 400 430

–I –I –I –I –I

280 310 340 370 400

Vendas diárias em milhares $

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

capítulo 2 • 51
2.1.5.2  Polígono de frequências

É baseado na união dos pontos médios das bases superiores dos retângulos do
histograma. Refere-se às frequências simples absolutas ou relativas. É repre-
sentado por um gráfico de área no Excel.

Polígono de frequências - Vendas diárias em milhares $


9 8
8
7
Frequência absoluta fi

6
6
5 4 4
4 3
3
2
1
0
310 340 370 400 430

–I –I –I –I –I

280 310 340 370 400

Vendas diárias em milhares $

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.5.3  Gráfico em setores

São usados para representar valores absolutos ou porcentagens complementa-


res (frequência relativa). No Excel, é representado pelo gráfico de pizza.

52 • capítulo 2
Gráfico de setores - Percentual de vendas diárias
em milhares $

12% 16%

280 -I 310
310 -I 340
24% 16%
340 -I 370
370 -I 400
400 -I 430

32%

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.5.4  Polígono de frequência acumulada – Ogiva de Galton

É a representação gráfica das tabelas de frequências acumuladas abaixo de ou


acima de. É representado como um gráfico de linha no Excel.

Ogiva de Galton - Vendas diárias acumuladas


em milhares $
30

25 25
22
Frequência absoluta fi

20

16
15

10
8
5
4

0
310 340 370 400 430

–I –I –I –I –I

280 310 340 370 400

Vendas diárias em milhares $

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

capítulo 2 • 53
2.1.6  Gráficos Especiais

2.1.6.1  Gráfico de Pareto


É um gráfico de colunas usado para dados qualitativos onde as colunas são
dispostas em ordem decrescente de frequência simples e relativa. É muito útil
quando queremos chamar a atenção para as categorias mais importantes. No
eixo horizonta, são representadas as diferentes categorias do dado qualitativo
que está sendo tratado. No eixo vertical, representamos a frequência simples e/
ou a relativa. Este pode ser um gráfico combinado, mostrando simultaneamen-
te a frequência simples no eixo vertical da esquerda e a frequência acumulada
relativa no eixo vertical da direita. O Excel tem recurso para fazer este gráfico.
A regra de Pareto ou regra 80/20 diz que 80% das consequências advêm de
20% das causas. por exemplo, 80% dos acidentes são causados por 20% dos mo-
toristas, 80% dos defeitos provêm de 20% das causas.

Defeitos mais frequentes em aparelhos Splits -


Empresa XYZ - 10/05/2015
60 53 98% 100% 120%
88% 94%
50 80% 100%
40 66% 80%
30 60%
20 11 40%
10 6 5 3 20%
2
0 0%
Compressor e Ventilador O compressor O compressor O ventilador O aparelho
ventilador não funciona não desliga não parte gira não resfria
não lentamente
funcionam
fi Fafr

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.6.2  Carta de controle

Este gráfico é extremamente útil para controlar o desempenho de indicado-


res de processos, isto é, para se fazer o controle estatístico de processos. As
medidas coletadas ao longo do tempo são dispostas em um gráfico onde, no
eixo horizontal, indicamos a escala de tempo e, no eixo vertical, os valores
coletados no monitoramento. Acrescentam-se a este gráfico 3 linhas: uma in-

54 • capítulo 2
dicando o valor médio das observações feitas e outras duas indicando o limite
superior de controle – LSC e o limite inferior de controle – LIC, calculados
de acordo com o desvio padrão dessas medidas (aprenderemos a calcular o
desvio padrão no capítulo 4). Com ele, podemos visualizar qualquer desvio
no desempenho do processo monitorado. Constitui-se em mais uma ferra-
menta para a gestão da qualidade. No Excel, usamos o gráfico de linha com
marcadores.

Carta de controle - Pesos de sacos de 25 kg de farinha ao


longo do dia XX/XX/XX
25,4

25,3

25,2
Peso do saco de farinha em Kg

25,1

25

24,9

24,8

24,7

24,6

24,5

24,4
8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 16,5 17

Horas

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

2.1.6.3  Gráficos de dispersão

É um gráfico de “nuvem”, onde registramos um ponto para cada par ordenado


coletado na pesquisa, e é usado para demostrar o comportamento de duas va-
riáveis. Analisando este gráfico, é possível determinar se uma variável influen-
cia ou não o comportamento de outra. Caso influencie, podemos determinar se
esta influência é diretamente ou inversamente proporcional. Destina-se a estu-
dos de correlação e regressão entre variáveis nas ciências físicas, econômicas,
biológicas etc. e também para o controle de qualidade.

capítulo 2 • 55
Renda anual X Anos de estudo do
chefe da família
20
18
y = 0,146x + 2,6578
16
14
Anos de estudo
12
10
8
6
4
2
0
0 10 20 30 40 50 60 70 80 90 100 110
Renda anual R$ mil

Obs.: veja na planilha 03graficos.xls como fazer este gráfico no Excel.

ATIVIDADES
01. A tabela a seguir indica o número mensal de aparelhos de TV de 20’’ defeituosos, rejei-
tados pelo controle de qualidade da empresa Panasonic durante os últimos 4 anos.
•  Organize a tabela de frequências dos aparelhos defeituosos.
•  O quanto representou o número de meses com 6 ou mais aparelhos defeituosos em rela-
ção ao total de meses observados, Isto é, qual a sua frequência relativa?
•  Ao longo desses 4 anos, em quantos meses a empresa teve 8 ou mais aparelhos com
defeito por mês?

MÊS
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
ANO
1998 6 2 5 6 0 8 7 6 3 4 5 8

1999 10 9 7 6 3 4 6 4 5 4 0 1

2000 3 6 7 9 3 1 4 6 5 3 5 4

2001 7 2 5 8 6 4 2 5 1 6 5 2

02. A tabela a seguir indica as medidas de altura de alunos de uma classe de 1ª série do
ensino médio.
a) Organize a tabela de frequências de alturas.

56 • capítulo 2
b) Qual a porcentagem de alunos com altura maior ou igual a 170 cm, Isto é, qual a fre-
quência acumulada para a altura de 170 cm?

ALTURA EM CENTIMETROS
163 168 168 170 170 166

166 163 164 169 166 163

171 164 165 165 169 171

165 166 169 165 170 164

164 170 170 172 164 171

03. Considere a tabela de frequências a seguir, que representa o peso de atletas participan-
tes de uma competição de judô. Com base na tabela, responda ao que se pede.
a) Quantos atletas participaram da competição?
b) Quantos tinham menos de 70 kg?

PESO EM KG 66 67 68 69 70 71 72 73 74

FREQUÊNCIA 6 7 10 9 9 8 12 10 11

04. Vamos medir a audiência de canais de TV. A tabela a seguir mostra o número de TVs
sintonizadas em certo canal num mesmo horário durante 100 dias consecutivos, em um bair-
ro com aproximadamente 5 000 televisores. Agrupe estas medidas em intervalos de classes
Calcule a frequência simples, a relativa e a acumulada para a relativa. Interprete os dados da
última classe.

NÚMERO DE APARELHOS SINTONIZADOS EM CERTO CANAL – 100 MEDIDAS


762 451 602 440 570 553 367 520 454 653

433 508 520 603 532 673 480 592 565 662

712 415 595 580 643 542 470 743 608 503

566 493 635 780 537 622 463 613 502 577

618 581 644 605 588 695 517 537 552 682

340 537 370 745 605 673 487 412 613 470

548 627 576 637 787 507 566 628 676 750

442 591 735 523 518 612 589 648 662 512

663 588 627 584 672 533 738 455 512 622

544 462 730 567 588 705 695 541 537 563

capítulo 2 • 57
05. Em um exame de vestibular, foi cronometrado o tempo, em minutos, gasto por cada um
dos 50 alunos para entregar a prova. Use K igual a 7. Obteve-se a tabela de dados brutos a
seguir. Faça a tabela de frequências e de frequência relativa para este caso. Imagine os inter-
valos abertos na esquerda e fechados na direita. Qual a maior frequência relativa observada?

TEMPO EM MINUTOS
61 65 43 53 55 51 58 55 59 56

52 53 62 49 68 51 50 67 62 64

53 56 48 50 61 44 64 53 54 55

48 54 57 41 54 71 57 53 46 48

55 46 57 54 48 63 49 55 52 51

06. Monte a distribuição de frequências e de frequência relativa para esta lista de notas
obtidas em um concurso para polícial federal. Use K igual a 8.

6 63 69 69 68 68 68 65
64 64 71 75 67 67 68 67
67 66 65 66 61 68 68 69
67 60 65 68 67 71 71 70
74 72 66 63 62 61 61 69
69 74 69 69 69 67 66 67
63 66 67 68 68 67 66 64
64 68 68 69 69 67 67 66
64 71 72 73 72 66 66 65
68 65 68 64 68 64 68 61
64 64 65 70 70 70 70 70
71 68 70 67 68 69 70 71
70 69 67 67        

07. Obtenha a distribuição de frequências e de frequência relativa para a tabela a seguir,


que representa o número de acidentes sem vítimas registrados em 100 finais de semana, em
uma rodovia para o litoral. Utilize K=10

58 • capítulo 2
7 11 6 6 10 6 31 28 13 19

6 18 9 7 5 5 9 8 10 6

10 3 4 6 7 9 9 19 7 9

17 33 17 12 7 5 7 10 7 9

18 17 4 6 11 13 7 6 10 7

7 9 8 15 16 11 10 7 5 14

12 10 6 7 7 13 10 5 6 4

10 6 7 11 19 17 6 9 6 5

6 13 4 7 6 12 9 14 9 7

18 5 12 8 8 8 13 9 13 15

08. Complete as tabelas a seguir com os valores que estão faltando:

XI FI FR FA XI FI FR FA
1   10%   200 2    
2   40%   300   0,1 6
3   20%   400 6    
4   20%   500   0,25  
5   10%   600     38

TOTAL 60 100%   700   0,05  

TOTAL      

FI
XI FI FA FR XI FR FA
FI
10   2   10   5% 1
11   6   20 4    
12   12   30     11
13   24   40 8 40%  
14   26   50 1    

TOTAL   ---   TOTAL      

capítulo 2 • 59
09. Uma agência de turismo está interessada em conhecer o perfil de seus clientes com
relação à variável estado civil. Para isso, o gerente desta agência pediu ao funcionário do
setor de vendas que fizesse um gráfico que resumisse estas informações. Construa o gráfico
e interprete-o com base nos dados coletados:

Estado civil Número de clientes


Solteiros = 2 600
Casados = 900
Viúvos = 345
Separados = 1 200
Outros = 1 020

10. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava
em um determinado supermercado no primeiro sábado após receber o pagamento (salário).
Para isso, ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h e anotou
os valores gastos por cada um deles. Estes valores estão listados a seguir:

4,89 – 11,00 – 5,60 – 73,85 – 24,83 – 98,00 – 186,00 – 234,87 – 58,00 – 198,65
223,86 – 341,42 – 94,76 – 445,76 – 82,80 – 35,00 – 455,00 – 371,00 – 398,60 – 234,00 –
64,90 – 54,98 – 48,80 – 68,90 – 120,32 – 126,98 – 76,43 – 6,35 – 9,98 – 12,68 – 243,00
– 18,65 – 134,90 – 11,10 – 321,09 – 290,76 – 74,00 – 48,80 – 74,52 – 138,65 – 26,00 –
210,13 – 15,78 – 197,45 – 75,00 – 76,55 – 32,78 – 166,09 – 105,34 – 99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Qual é a variável em estudo? Classifique-a.
b) Construa uma tabela de frequências baseada no conjunto de dados brutos.
c) Construa um histograma e um polígono de frequências para a tabela construída no
item b.

11. Construir a tabela (sem classe) de frequências indicando as frequências simples (ou
absolutas), relativa e acumulada da amostra a seguir. Faça também os gráficos para cada
uma das frequências.

10 9 9 9 10 11 8 8
10 11 12 13 10 11 12 7

60 • capítulo 2
12. A amostra seguinte refere-se ao tempo dispendido em minutos pelos gerentes das em-
presas de uma cidade no trajeto matutino entre a residência e o local de trabalho. Construir
a tabela de frequências com classes. Calcule as frequências simples, relativa e relativa acu-
mulada. Faça os gráficos para cada uma dessas 3 frequências calculadas.

28 25 48 37 41 19 32 26 16 23 23 29 36
31 26 21 32 25 31 43 35 42 38 33 28  

13. Para os dados brutos a seguir, construa a tabela de frequências com classes. Calcule a
frequência simples. Faça o histograma.
As 50 primeiras das 500 maiores empresas privadas por vendas – Ano anterior

REVISTA XXXXXX – MELHORES E MAIORES – REVISTA XXXXXX – MELHORES E MAIORES –


JULHO XXXX JULHO XXXX
VENDAS EM US$ VENDAS EM US$
EMPRESA EMPRESA
MILHÕES MILHÕES
Pernambucanas $ 1.058,9 Santista Alimentos $ 1.716,5

Philip Morris $ 1.164,4 Xerox $ 1.760,0

Armazém Martins $ 1.190,8 CPFL $ 1.816,6

Bompreço Supermercados $ 1.264,3 Credicard $ 1.861,4

Alcoa $ 1.320,2 Cargill $ 1.880,5

Ponto Frio $ 1.337,2 Copersucar $ 1.915,4

Basf $ 1.366,9 Ceval $ 2.015,9

Ericsson $ 1.371,9 Multibrás $ 2.034,8

Bosch $ 1.391,1 Lojas Americanas $ 2.044,0

Makro $ 1.410,4 Usiminas $ 2.131,3

Vasp $ 1.436,2 Casas Bahia $ 2.221,4

Copene $ 1.439,9 Light $ 2.241,2

Cosipa $ 1.493,0 IBM $ 2.320,5

Arapuã $ 1.507,8 CSN $ 2.762,2

Sadia Concórdia $ 1.563,1 Mercedes-Benz $ 2.852,1

Sendas $ 1.568,8 Cotia $ 2.905,5

NEC $ 1.603,3 Vale do Rio Doce (Vale


$ 2.943,0
S.A.)
Gerdau $ 1.704,7
Varig $ 3.200,4

capítulo 2 • 61
REVISTA XXXXXX – MELHORES E MAIORES – REVISTA XXXXXX – MELHORES E MAIORES –
JULHO XXXX JULHO XXXX
VENDAS EM US$ VENDAS EM US$
EMPRESA EMPRESA
MILHÕES MILHÕES
Pão de Açúcar $ 3.353,4 Ipiranga $ 4.669,7

Esso $ 3.362,3 Carrefour $ 5.097,9

Texaco $ 3.542,4 Souza Cruz $ 5.471,9

Gessy Lever $ 3.563,4 Shell $ 6.002,3

Nestlé-SP $ 3.564,1 Fiat Automóveis $ 7.411,2

Bramha $ 3.826,6 GM $ 7.629,5

Ford $ 4.442,9 Volkswagen $ 8.380,2

14. Com os retornos mensais do ativo XXX registrados na tabela seguinte, construir a tabela
de frequências com 5 classes, o gráfico de setores para a frequência relativa e o gráfico de
linha para a frequência relativa e acumulada.

MÊS RETORNO %
mai/12 –2,44%
jun/12 –3,15%
jul/12 7,61%
ago/12 11,17%
set/12 8,34%
out/12 –11,60%
nov/12 6,06%
dez/12 –1,82%
jan/13 19,83%
fev/13 –3,76%
mar/13 –0,06%
abr/13 4,22%
mai/13 10,92%
jun/13 5,52%
jul/13 1,31%
ago/13 2,22%
set/13 2,99%
out/13 1,34%
nov/13 2,03%
dez/13 5,61%
jan/14 13,14%
fev/14 10,85%

62 • capítulo 2
mar/14 2,44%
abr/14 10,37%
mai/14 13,64%
jun/14 10,78%
jul/14 2,43%
ago/14 –17,58%
set/14 11,20%
out/14 –23,83%
nov/14 4,54%
dez/14 8,54%
jan/15 –4,67%
fev/15 8,74%
mar/15 13,02%
abr/15 –2,25%

REFLEXÃO
Neste capítulo, aprendemos a identificar dados brutos e rol, assim como a construir tabelas
com e sem classes e a simplificar a análise desses dados por meio de sua representação
nos gráficos Como engenheiro, você certamente precisará ter conhecimentos em gestão da
qualidade total. Um método bastante usado pelos gerentes da área da qualidade é o MASP:
método de análise e solução de problemas. Veja no arquivo anexo 03 MASP.docx como o
uso de gráficos é essencial para se fazer análise de situações e processos. Perceba que as
ferramentas da qualidade têm seu uso baseado na metodologia estatística de representação
de dados e cálculo de indicadores estatísticos.

LEITURA
Recomendamos a leitura do texto “Como analisar de forma simples um grande número de
dados?”, que aborda de maneira clara alguns procedimentos que podem ser utilizados quan-
do nos deparamos com situações em que se precisa resumir as informações de grandes
conjuntos de dados.
Disponível em:
<http://www.klick.om.br/materia/20/display/0,5912,POR-20-91-931-,00.html>.

capítulo 2 • 63
REFERÊNCIAS BIBLIOGRÁFICAS
CERVEIRA, Diego; SELLITTO, Miguel. Manutenção centrada em confiabilidade (MCC): análise
quantitativa de um forno elétrico a indução. Revista Produção Online v. 15, n. 2 (2015). Disponível em:
<http://producaoonline.org.br/rpo/article/ view/1615/1266>.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I. ; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.

64 • capítulo 2
3
Medidas de
Posição Medidas
de Tendência
Central e Medidas
Separatrizes
Nesse capítulo, aprenderemos como caracterizar um conjunto de dados com
medidas numéricas que sejam representativas de todo o conjunto. As medidas
de posição têm o objetivo de representar o ponto central de um conjunto de
dados. As mais conhecidas são a média, a mediana e a moda. Além dessas me-
didas, podemos citar outras medidas de posição importantes, que não as cen-
trais, chamadas de medidas separatrizes. São elas os quartis, os decis e os per-
centis. Vamos estudar cada uma dessas medidas de posição. Primeiramente,
vamos fazer um estudo para os dados não tabulados, ou seja, quando os dados
não estiverem na forma de distribuição de frequência. Em seguida, as mesmas
medidas serão calculadas com base em dados tabulados.

OBJETIVOS
Ao final deste capítulo, esperamos que você seja capaz de calcular e de interpretar as medi-
das de posição aplicadas a conjuntos de dados; calcular a média, a moda e a mediana para
dados brutos e para tabelas com e sem classes; selecionar a melhor medida de posição e
tendência central para um conjunto numérico; comparar as características de cada medi-
da estudada; calcular as medidas separatrizes: quartil, decil e percentil; construir o gráfico
boxplot e identificar valores outliers em um conjunto numérico. Efetuar os cálculos usando
o Excel.

66 • capítulo 3
3.1  Medidas de tendência central
As medidas de tendência central ou promédias são assim denominadas em vir-
tude da tendência mostrada pelos dados observados de se agruparem em torno
desses valores centrais. São medidas que sumarizam certas características im-
portantes da distribuição de frequências. As mais usadas são a média aritméti-
ca, a mediana e a moda.

3.1.1  Média aritmética

Média é o valor representativo de um conjunto de dados e pode ser de dois ti-


pos: simples ou ponderada. A média é única para um dado conjunto de valores.
Algumas características dessa medida devem ser ressaltadas:
•  Qualquer variação nos valores do conjunto observado implica um novo
valor de média. Não é uma medida resistente, pois mudanças nos valores da
variável mudam o valor da média.
•  Seu resultado é afetado pelos valores extremos, isto é, tende para os valo-
res extremos.
•  Das três medidas estudadas é a que tem o maior significado matemático.
•  É representada pelo símbolo X . Lê-se: X barra.

3.1.1.1  Média aritmética simples

É igual ao quociente entre a soma dos valores do conjunto e o número total de


valores. Será calculada sempre que os valores não estiverem tabelados, como
é o caso dos dados brutos. Para dados não tabelados, a fórmula é a seguinte:

n
∑ Xi
X = i =1 onde
n

•  Σ ⇒ letra grega sigma – indica o somatório de diversas parcelas, neste


caso a soma dos diversos valores observados, do primeiro ao enésimo;
Xi ⇒ são os valores da variável;
•  n ⇒ o número total de valores observados;
a média X é a soma dos valores observados dividida pela quantidade dos
valores observados.

capítulo 3 • 67
EXEMPLO
Exemplo 1 – Dados brutos
Calcule o salário médio mensal pago a 5 contínuos de uma empresa, que receberam:
R$ 800,00, R$ 780,00, R$ 820,00, R$ 810,00 e R$ 790,00.

n
∑ Xi 800 + 780 + 820 + 810 + 790 4000
X = i =1 = = = 800
n 5 5

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo media,, como fazer


este cálculo no Excel.

3.1.1.2  Média aritmética ponderada

É obtida pelo quociente entre o produto dos valores da variável pelos respecti-
vos pesos e a soma dos pesos e usada para calcular a média de dados tabelados
ou ponderados. Nesse caso, a frequência simples fi é o peso, a repetição de cada
valor da variável.
K
∑ X i fi ∑ X f soma do (produto dos valores da variavel pelos respectivos pesos)
X = i =1K = i i
=
n soma dos pesos
∑ fi
i =1

onde
•  Σ ⇒ letra grega sigma – indica o somatório de diversas parcelas, neste
caso a soma da multiplicação de cada valores observados pela sua repetição (fi)
do primeiro ao enésimo;
•  Xi ⇒ são os valores da variável x ou o ponto médio (para tabela agrupada
em classes);
•  fi ⇒ são as frequências de cada valor da variável observada;
•  n ⇒ o número total dos valores observados;
•  K ⇒ número de classes ou de valores individuais diferentes da variável.

68 • capítulo 3
EXEMPLO
Exemplo 2 – Tabela sem classes
As notas de 20 alunos são as seguintes:

4 5 5 5 5
5 6 6 6 6
6 6 7 7 7
7 7 8 8 8

Organizando esses dados brutos em tabela de frequências temos:

I NOTAS XI FREQUÊNCIA FI
1 4 1
2 5 5
3 6 6
4 7 5
5 8 3
TOTAL 20 = N

Podemos calcular a média ponderada das notas da tabela de frequências da seguin-


te forma:

I NOTAS XI FREQUÊNCIA FI XI*FI


1 4 1 4x1=4
2 5 5 5x5=25
3 6 6 6x6=36
4 7 5 7x5=35
5 8 3 8x3=24
TOTAL 20 = N 124

ou usando diretamente a fórmula temos:

X=
∑ Xifi = (4X1) + (5X5) + (6X6) + (7X5) + (8X3) = 6, 2
n 1+ 5 + 6 + 5 + 3

Note que o resultado é o mesmo que encontraríamos se calculássemos a média aritmé-


tica simples das notas acima:

n
∑ Xi 4 + 5 + 5 + 5 + 5 + 6 + 6 + 6 + 6 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 124
i =1
X= = = = 6,, 2
n 20 20

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo media, como fazer


este cálculo no Excel.

capítulo 3 • 69
Exemplo 3 – Tabela com classes
Para o cálculo da média ponderada para a tabela com classes, você deverá proceder da
seguinte forma:
•  Calcule o ponto médio PM de cada classe.
•  Multiplique cada ponto médio PM pela frequência simples fi correspondente.
•  Some todos os produtos encontrados e divida pelo tamanho da amostra n.

XI
CLASSES FI PONTO MÉDIO DE XI*FI
CADA CLASSE
10 |- 20 5 (10+20)/2=15 15x5=75
20 |- 30 10 (20+30)/2=25 25x10=250
30 |- 40 15 (30+40)/2=35 35x15=525
40 |- 50 10 (40+50)/2=45 45x10=450
50 |- 60 5 (50+60)/2=55 55x5=275
TOTAL 45 ----- 1575
K
∑ Xifi ∑ X f 75 + 250 + 525 + 450 + 275 1575
Média = X = i=1K = ii
= = = 35
n 45 45
∑i f
i =1

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo media, como fazer


este cálculo no Excel.

3.1.1.3  Propriedades da média

1ª – A soma algébrica dos desvios de um conjunto de números, em relação


à média, é zero.
n
∑ di = ∑ ( Xi − X ) = 0 para dados brutos
i =1
n
∑ difi = ∑ ( Xi − X )fi = 0 para dados tabelados
i =1

Obs.: veja o exemplo em 04mediamodamediana.xlsx na


aba 1ªpropriedademedia.

70 • capítulo 3
2ª – Somando-se ou subtraindo-se uma constante a cada valor do conjunto,
a nova média será a original aumentada ou diminuída do valor dessa constante.
3ª – Multiplicando-se ou dividindo-se cada valor do conjunto por uma
constante, a nova média será a original multiplicada ou dividida do valor des-
sa constante.
4ª – A média de um conjunto de números pode ser sempre calculada.
5ª – Para um dado conjunto de números, a média é única.
6ª – A média é sensível a (ou afetada por) todos os valores do conjunto.

3.1.2  Moda

É o valor da variável que mais se repete, que se destaca em relação aos outros
valores, ou seja, é o valor mais frequente quando comparamos sua frequência
com a dos outros valores do conjunto. A moda é o valor da variável que ocorre
com a maior frequência simples em um conjunto de números.
A moda pode não existir (amodal – caso em que todos os valores da variável
em estudo ocorrem com a mesma intensidade) e, mesmo que exista, pode não
ser única (quando houver mais de um valor predominante). Pode ser unimodal,
bimodal, trimodal e assim por diante.
A mudança de um valor no conjunto observado pode não mudar a moda,
pois, ao contrário da média, a moda é uma medida resistente. Características
da moda:
•  Não é afetada pelos valores extremos.
•  É a única medida que pode ser determinada para uma variável qualitativa.

Seu símbolo e X ou Mo. Lê-se: X chapéu.

3.1.2.1  Moda para dados brutos não tabelados

A determinação é imediata. Basta procurar o valor mais frequente, ou seja, o


que mais se repete.

capítulo 3 • 71
EXEMPLO
Exemplo 4 – Encontre o valor da moda para os conjuntos a seguir:
X = {4,5,5,6,6,6,7,7,8,8} A moda Mo = 6, pois é o valor quer aparece mais vezes.
Y = {4,4,5,5,6,6} Não tem moda, amodal, pois todos os valores aparecem com a mes-
ma frequência.
Z ={1,2,2,2,3,3,4,5,5,5,6,6} Bimodal, pois o 2 e o 5 aparecem em igual intensidade
Mo =2 e Mo = 5.
W = {1,2,3,4,5} Trata-se de outro conjunto amodal.
Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo moda, como fazer
este cálculo no Excel.

3.1.2.2  Moda para dados tabelados não agrupados em classes

A determinação é imediata. A moda será o valor de Xi correspondente à maior


frequência simples.

EXEMPLOS
Exemplo 5 – Qual a temperatura mínima diária mais comum medida no mês abaixo?

TEMPERATURA FI
0 oC 3
1 oC 9
2 oC 12
3 oC 6
Total 30

O valor da moda para a tabela é 2 °C. Basta olhar a tabela e identificar o valor da variável
observada que mais se repete. O valor 2 °C se repete 12 vezes, portanto o valor da moda é
2 °C.

Exemplo 6 – Encontre a moda para a tabela que representa o número de peças defei-
tuosas devolvidas mensalmente pelo controle de qualidade.

72 • capítulo 3
NÚMERO DE PEÇAS DEFEITUOSAS XI NÚMERO DE MESES FI
0 2
1 4
2 6
3 8
4 4
5 2
6 1
TOTAL 27
O valor da moda é 3. Três peças defeituosas devolvidas mensalmente é o valor que mais
se repete, ou seja, ele aparece oito vezes.

3.1.2.3  Moda para dados tabelados agrupados em classes

Para uma tabela com classes, podemos usar dois métodos para determinar o
valor da moda: moda bruta ou moda czuber. Eles estão descritos a seguir:

3.1.2.3.1  Moda bruta


É o método mais rudimentar. É representada pelo ponto médio da classe mo-
dal. Classe modal é a classe que apresenta a maior frequência simples.

3.1.2.3.2  Moda de Czuber


É o método que retorna um valor mais preciso, por levar em consideração a in-
fluência dos valores ao redor da moda. Calcula-se da seguinte forma:
1º – Identificar a classe modal (classe correspondente à maior frequên-
cia simples).
2º – Aplicar a fórmula de Czuber para o cálculo da moda:

∆1
X = li + ⋅h
∆1 + ∆ 2
onde:
li ⇒ limite inferior da classe modal
D1 ⇒ diferença entre a frequência simples da classe modal e a imediatamen-
te anterior = frequência da classe modal menos frequência da classe anterior
D2 ⇒ diferença entre a frequência simples da classe modal e a imediatamen-
te posterior = frequência da classe modal menos frequência da classe posterior
h ⇒ amplitude do intervalo da classe modal = limite superior menos limi-
te inferior

capítulo 3 • 73
EXEMPLO
Exemplo 7 – Determine a moda bruta e a moda de Czuber para os dados abaixo:

CLASSES FI

10 |- 20 2
20 |- 30 3
30 |- 40 10
40 |- 50 9
50 |- 60 4
TOTAL 28

Moda bruta: a classe modal que mais se repete é a classe 30|-- 40. Seu ponto médio é
igual a (30+40)/2 =35, portanto a moda bruta é igual a 35.
Moda de Czuber: a classe modal que mais se repete é a classe 30|– 40.
•  Limite inferior da classe modal li = 30
•  Delta 1 é a frequência simples da classe modal menos a frequência simples
anterior D1 =10-3= 7
•  Delta 2 é a frequência simples da classe modal menos a frequência simples
posterior D2 =10 – 9= 1
•  Amplitude da classe modal é h = 40 – 30= 10
•  Aplicando a fórmula, temos que a moda é:
Mo= li + h (D1 /(D1 + D2)) = 30 + (10(7/(7+1))10 = 38,75

3.1.3  Mediana

A mediana de um conjunto de valores, dispostos segundo uma ordem (crescen-


te ou decrescente), é o valor central. Sua característica principal é dividir esse
conjunto de números em duas partes iguais, com a mesma quantidade de valo-
res. Dessa forma 50% dos valores observados são menores que a mediana e 50%
desses valores são maiores que a mediana. É única e sempre pode ser calculada.
Sempre existirá um valor de mediana para um conjunto numérico.
Seu símbolo pode ser Md ou X . Lê-se: X til.

74 • capítulo 3
Se, por exemplo, o maior valor da variável for duplicado, a mediana não se
alterará: é uma medida resistente. Seu resultado não é afetado pelos valores ex-
tremos. Certas pesquisas de preço e salários preferem usar a mediana em vez
da média pelo fato de ela não ser influenciada por valores pequenos ou grandes
demais, ditos fora do padrão.

3.1.3.1  Mediana para dados brutos, não tabulados

Para dados brutos, o cálculo é feito da seguinte forma:


1º – Ordenar os valores do conjunto observado.
2º – Verificar se n (o tamanho da amostra) é impar ou par.
3º – Para n ímpar, a mediana é o valor do meio, ou seja, o elemento que ocu-
pa a posição EMd = (n+1)/2.
Para n par, a mediana é a média dos dois valores centrais, do elemen-
to que
ocupa a posição EMd = (n)/2 e com o seguinte,
onde EMd= elemento mediano indica a posição da mediana.

EXEMPLO
Exemplo 8 – Calcule a mediana para os valores abaixo:
A = {2, 3, 6, 12, 15, 23, 30)
n=7 è ímpar
Md = 12, pois é o elemento que ocupa a quarta posição, em que EMd = (n+1)/2 =
(7+1)/2 = 4ª posição.
B = {3, 6, 9, 12, 14, 15, 17, 20}
N=8 è par
Md = (12+14)/2 = 13
Mediana é a média entre o elemento do meio, de ordem EMd =(n/2)=4º, com o
elemento seguinte, o 5º.

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo mediana, como


fazer este cálculo no Excel.

capítulo 3 • 75
3.1.3.2  Mediana para dados tabulados não agrupados em classes

Para uma tabela sem classes, o cálculo é feito da seguinte forma:


1º – Verificar se a coluna de Xi está ordenada.
2º – Verificar se n é impar ou par.
3º – Localizar, na coluna das frequências acumuladas abaixo (Fa), o meio
da distribuição. A mediana será o valor da variável correspondente ao pon-
to central.
•  Para n ímpar, a mediana é o valor do meio e está na posição EMd = (n+1)/2.
•  Para n par, a mediana é a média dos dois valores centrais, ou seja, o valor
que ocupa a posição (EMd=n/2) com o valor seguinte.

EXEMPLO
Exemplo 9 – Calcule a mediana para as tabelas a seguir:

VALORES XI FREQUÊNCIA FI
VALORES XI FREQUÊNCIA FI
2 5
3 10
3 3
4 15
4 6
5 12
5 9
6 5
6 8
7 3
7 6
TOTAL =N = 50
8 4
TOTAL =N = 36
VALORES XI FREQUÊNCIA FI
3 3
4 6
5 9
6 8
7 6
8 3
TOTAL =N = 35

76 • capítulo 3
Resolução:
Para cada uma das 3 tabelas, calcule a frequência simples acumulada abaixo Fa. Na
coluna da Fa encontre a posição da media observando se n é par ou ímpar. Selecione o valor
do x correspondente.

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba exemplo mediana, como


fazer este cálculo no Excel.

capítulo 3 • 77
3.1.3.3  Mediana para dados tabulados agrupados em classes

Para uma tabela com classes, o cálculo da mediana é feito usando a fórmu-
la abaixo:
1o – Verificar se a coluna das classes está ordenada.

n
2o – Calcular a posição da mediana dada por EMd = , não se fazendo distin-
2
ção entre número par ou ímpar de observações.
3o – Identificar o intervalo que contém a mediana localizando o EMd na colu-
na das frequências simples acumuladas abaixo Fa.
4o – Aplicar a fórmula da interpolação para o cálculo da mediana:

EMd − Faa
Md = X = li + .h
fi
MEDIANA

Onde:
•  li ⇒ limite inferior da classe mediana
•  EMd ⇒ posição da mediana = n/2
•  Faa ⇒ frequência acumulada anterior à classe mediana
•  fiMEDIANA ⇒ frequência simples da classe mediana
•  h ⇒ amplitude do intervalo da classe mediana

EXEMPLOS
Exemplo 10 – Calcule a mediana para a tabela a seguir:

CLASSES FI
10 |- 20 10
20 |- 30 20
30 |- 40 35
40 |- 50 40
50 |- 60 25
60 |- 70 15
70 |- 80 5
TOTAL 150

78 • capítulo 3
Resolução

Exemplo 11 – Calcular o consumo mediano de eletricidade (kw/h) dos 80 usuários selecio-


nados e dispostos na tabela abaixo.

CLASSES NÚMERO DE USUÁRIOS FI


5 |- 25 4
25 |- 45 6
45 |- 65 14
65 |- 85 26
85 |- 105 14
105 |- 125 8
125 |- 145 6
145 |- 165 2
TOTAL 80

Resolução

capítulo 3 • 79
Exemplo 12 – Calcular a mediana para a tabela com classes a seguir.

CLASSES FI
3 |--- 6 2
6 |--- 9 5
9 |--- 12 8
12 |--- 15 3
15 |--- 18 1
TOTAL 19

Resolução

Obs.:veja na planilha 04mediamodamediana.xlsx, na aba ex mediana com classes, como


fazer este cálculo no Excel.

80 • capítulo 3
3.1.4  Comparações entre média, moda e mediana

A média corresponde ao centro de gravidade estudado em física, portanto a


média é influenciada por cada valor do conjunto, inclusive os extremos. Já a
mediana é relativamente insensível aos valores extremos.
O cálculo da média é simples e, como envolve todos os valores observados,
quando adequada terá a preferência.. Quando se trata de muitas classes de po-
pulações, por haver menos variabilidade entre as médias aritméticas calcula-
das com base em várias amostras aleatórias, ela é preferível às demais medidas,
medianas e modas, para estimar a tendência central.
A média aritmética pode ser calculada com base nos dados brutos, sem re-
correr a qualquer agrupamento ou ordenação dos valores originais, o que não
ocorre com a moda e a mediana.
A média aritmética simples não pode ser calculada para distribuições com
classes ou limites abertos. Para tanto, usa-se a média ponderada. Neste caso,
usaremos o ponto médio como valor aproximado para xi. A média será, portan-
to, um valor aproximado. Se não tivermos os dados brutos, e sim uma tabela
com classes, de qualquer forma este cálculo é uma opção para não se ficar sem
um valor estimado para a média.
A ordenação dos dados para a determinação da mediana, por vezes, pode
ser difícil.
A moda, comparada à média e à mediana, é a medida menos útil por não
ter nenhum tratamento matemático, mas, do ponto de vista descritivo, a moda
indica o valor “típico” em termos de maior ocorrência.
A utilidade da moda acontece quando um valor ou um grupo de valores
ocorrem com uma frequência muito maior que os demais. Quando todos ou
quase todos os valores ocorrem aproximadamente com a mesma frequência, a
moda nada acrescenta em termos de descrição dos dados.
A moda, por não depender de todos os valores, não se altera com a modifi-
cação de alguns deles:
{ 6, 6, 6, 6, 6, 7, 8, 9, 9, 5} Mo = 6
{ 6, 6, 6, 6, 8, 7, 8, 9, 9, 5} Mo = 6

A moda tem existência real (exceção para dados agrupados) e pode ser cal-
culada, na maioria dos casos, para classes ou limites abertos.

capítulo 3 • 81
3.2  Medias separatrizes
São medidas de posição que dividem um conjunto de valores ordenados em
partes iguais, portanto o conjunto de valores deve estar ordenado para se efe-
tuar o cálculo das separatrizes. O cálculo das medidas separatrizes não segue
um padrão muito rígido, por isso costuma-se encontrar diferenças nas fórmu-
las de interpolação usadas por diferentes softwares estatísticos. De forma geral,
podemos usar as fórmulas a seguir.

3.2.1  Quartis para dados não agrupados em classes

Vimos que a mediana divide a distribuição em duas partes iguais, já os quartis


(Q1, Q2 e Q3), como o próprio nome sugere, divide a distribuição dos dados
ordenados em quatro partes, sendo Q1 o quartil que separa os 25% valores infe-
riores dos 75% superiores, Q2 o que divide o conjunto ao meio e Q3 o que separa
os 75% valores inferiores dos 25% superiores. Dividem o conjunto em 4 partes
iguais. O segundo quartil é a própria mediana.
n.i
Cada quartil é determinado pelo elemento de ordem: EQi =
4
onde
•  i = número do quartil a ser calculado
•  n = número de observações

Como os quartis são medidas separatrizes, precisamos primeiramente or-


denar o conjunto de dados. O primeiro quartil (Q1) será o valor da variável que
ocupar a posição n/4. O segundo quartil (Q2) será o valor da variável que ocu-
par a posição 2n/4 e o terceiro quartil (Q3) será o valor da variável que ocupar
a posição 3n/4. Quando ocorrem estas divisões para encontrar as posições dos
quartis, pode acontecer de o resultado ser um número inteiro ou um número
fracionário. Então, adotaremos a seguinte convenção:
• Se a divisão resultar num número fracionário, ele será arredondado para
cima e o valor do quartil será a resposta da variável encontrada nesta posição.
• Se a divisão for um número inteiro, o quartil será a média aritmética da res-
posta da variável que ocupar a posição encontrada com a resposta da variável
que ocupar a posição seguinte.

82 • capítulo 3
EXEMPLO
Exemplo 13
Um escritório que presta consultoria em administração levantou o tempo de espera de
pacientes que chegam a uma clínica de ortopedia para atendimento de emergência. Foram
coletados os seguintes dados, em minutos, durante uma semana: 2, 5, 10, 11, 3, 14, 8, 8, 7,
12, 3, 4, 7, 3, 4, 2, 6, 7. Encontre os quartis.

Resolução:
Para encontrar os quartis, precisamos ordenar o conjunto de dados. Então: 2, 2, 3, 3, 3,
4, 4, 5, 6, 7, 7, 7, 8, 8, 10, 11, 12, 14
•  Posição do primeiro quartil (Q1): n/4 = 18/4 = 4,5
Como a divisão resultou em um valor fracionário, ela será arredondada para 5. Assim, o
primeiro quartil é o valor que está na quinta posição: Q1 = 3
Então, pelo menos 25% das observações são menores ou iguais a 3 minutos.

•  Posição do segundo quartil (Q2): 2n/4 = 2*18/4 = 9


Como a divisão resultou em um valor inteiro, o segundo quartil será o resultado da média
aritmética entre o valor que está na nona posição e o valor que está na décima posição.
Q2 = (6 + 7)/2 = 6,5
Temos que pelo menos 50% das observações são maiores ou iguais a 6,5 minutos.

•  Posição do terceiro quartil (Q3 ): 3n/4 = 3*18/4 = 13,5


Como a divisão resultou em um valor fracionário, vamos arredondar para 14, assim o
terceiro quartil é o valor que está na décima quarta posição.
Q3 = 8
Neste conjunto de dados, pelo menos 25% das observações são maiores ou iguais a
8 minutos.

3.2.2  Percentis para dados não agrupados em classes

Os percentis dividem o conjunto em 100 partes iguais. O quinquagésimo centil


é a mediana.
n.i
Cada percentil é calculado por: EPi =
100

capítulo 3 • 83
onde
•  i = número do percentil a ser calculado
•  n = número de observações

Da mesma forma que nos quartis, o conjunto de dados deve estar ordenado.
Quando dividimos o conjunto de dados em 100 partes, obtemos 99 percentis.
Adotaremos a seguinte convenção para o cálculo dos percentis:

•  Se a divisão resultar num número fracionário, ele será arredondado para


cima e o valor do percentil será a resposta da variável encontrada nesta posição.
•  Se a divisão for um número inteiro, o percentil será a média aritmética da
resposta da variável que ocupar a posição encontrada com a resposta da variá-
vel que ocupar a posição seguinte.

EXEMPLO
Exemplo 14 – Calcule o P60 da sequência x={2;8;7,5;6;10;12;2;9}
EP60 = (60. 8 )/100 = 4,8 è é o elemento de ordem 4,8
Este valor não inteiro indica que o P60 é um valor situado entre o quarto e o quinto
elemento da sequência.
P60= (7,5 + 8 )/2 = 7,75
60% dos valores estão abaixo de 7,75.
40% dos valores estão acima de 7,75.

3.2.3  Decis para dados não agrupados em classes

Os decis, por sua vez, dividem a distribuição dos dados em 10 partes iguais (Di,
i = 1, 2, ..., 9). O quinto decil é a mediana.

n.i
Cada decil é determinado por: EDi =
10

84 • capítulo 3
onde
•  i = número do decil a ser calculado
•  n = número de observações

Para dados brutos, encontre a posição dada por EDi e determine o valor da
mediana. Caso EDi resulte em um valor não inteiro (com casas decimais), o de-
cil será a média dos dois inteiros mais próximos (anterior e posterior).

EXEMPLO
Exemplo 15 – Calcule o D4 da série abaixo:

2 5 8 5 5 10 1 12 12 11 13 15

EDi = n.i /10 = 12 x 4/10 = 4,8


Colocando em ordem crescente, o 4º decil está entre a quarta e a quinta posição.

1 2 5 5 5 8 10 11 12 12 13 15

D4 = (5+5)/2 = 5
40% dos valores estão abaixo de 5.
60% dos valores estão acima de 5.

Obs.: veja na planilha 04mediamodamediana.xlsx, na aba separatrizes 1, estes exem-


plos resolvidos com funções do EXCEL.

Veja na planilha 04mediamodamediana.xlsx, na aba separatrizes 2 e 3, como construir


o gráfico boxplot Ele se apoia no cálculo dos quartis para mostrar o comportamento de uma
distribuição de valores. Observe o exemplo de 3 distribuições com assimetrias diferentes e
seus respectivos boxplots.

capítulo 3 • 85
ATIVIDADES
01. Calcule o consumo médio ponderado para a tabela a seguir que representa o consumo
de energia em kW de 80 usuários:

NÚMERO
CLASSES CONSUMO
DE USUÁRIOS
EM KW
FI
5 |- 25 4
25 |- 45 6
45 |- 65 14
65 |- 85 26
85 |- 105 14
105 |- 125 8
125 |- 145 6
145 |- 165 2
TOTAL 80

02. Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13,
15, 16, 18 e 12 quilos, qual a venda média diária na semana?

03. O exame final, em um curso, tem peso 3 e as provas correntes peso 1. Um estudante
tem grau 85 naquele exame final e 70 e 90 nas provas, então seu grau médio é:

04. Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino. Calcular a quantidade média de meninos por família.

NÚMERO DE NÚMERO DE FAMÍLIAS


MENINOS XI FI
0 2
1 6
2 10
3 12
4 4
TOTAL

86 • capítulo 3
05. Calcular a estatura média de bebês conforme a tabela a seguir.

ESTATURA ( CM ) NÚMERO DE BEBÊS


50 ---| 54 4
54 ---| 58 9
58 ---| 62 11
62 ---| 66 8
66 ---| 70 5
70 ---| 74 3
TOTAL 40

06. A tabela mostra a distribuição de frequências dos salários semanais, em reais, de 65


empregados da empresa WZY:

SALÁRIOS R$ NÚMERO DE EMPREGADOS


50 ---| 60 8
60 ---| 70 10
70 ---| 80 16
80 ---| 90 14
90 ---| 100 10
100 ---| 110 5
110 ---| 120 2
TOTAL 65

Determine:
a) a média dos salários.
b) o limite inferior da sexta classe.
c) o limite superior da quarta classe.
d) o ponto médio da terceira classe.
e) a amplitude do quinto intervalo de classe.
f) a frequência relativa da terceira classe.
g) a porcentagem de empregados que ganham R$ 80,00 ou menos.
h) a percentagem de empregados que ganham desde R$ 60 e até R$ 100 por semana.

capítulo 3 • 87
07. Os tempos de reação de um indivíduo a determinados estímulos foram medidos por um
psicólogo como sendo 0,53; 0,46; 0,50; 0,49; 0,52; 0,53; 0,44 e 0,55 segundos, respectiva-
mente. Determinar o tempo médio de reação do indivíduo a esses estímulos.

08. Três professores de Economia atribuíram os graus médios de exame de 75, 82 e 84 a


suas respectivas classes, que se compunham de 32, 25 e 17 estudantes, respectivamente.
Determinar o grau médio geral.

09. A tabela mostra a distribuição, em toneladas, das cargas máximas suportadas por certos
cabos fabricados por uma companhia. Determinar a média das cargas máximas:

CARGA MÁXIMA ( TONELADAS ) NÚMERO DE CABOS

9,3 ---| 9,7 2

9,7 ---| 10,1 5

10,1 ---| 10,5 12

10,5 ---| 10,9 17

10,9 ---| 11,3 14

11,3 ---| 11,7 6

11,7 ---| 12,1 3

12,1 ---| 12,5 1

TOTAL 60

10. Calcule a moda para os seguintes valores: X = { 7, 8, 9, 10, 10, 10, 11, 12 }

11. Calcule a moda para os seguintes valores: X = { 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 }

12. Calcule a moda para os seguintes valores: X = { 2, 2, 3, 3, 4, 4, 5, 5, 7, 7, 9, 9, 10, 10 }

13. Calcule a moda para os seguintes valores: X = { 3, 5, 8, 10, 12 }

14. Calcule a moda para os seguintes valores: X = { 2, 8, 3, 5, 4, 5, 3, 5, 5, 1 }

88 • capítulo 3
15. Considere as distribuições a seguir. Determine a moda.

XI FI XI FI XI FI
0 2 1 2 4 3

2 5 2 5 5 3
3 8 3 4 8 3
4 3 4 5 10 3
5 1 5 1 Total  

TOTAL   TOTAL  

16. Calcule a moda bruta e a moda de Czuber para a tabela.

CLASSES FI
54 ---| 58 9

58 ---| 62 11

62 ---| 66 8

66 ---| 70 5

TOTAL

17. Encontre a mediana para X = { 3, 7, 9, 2, 10, 11, 1, 8, 12, 8 }

18. Encontre a mediana para X = { 5, 2, 6, 13, 9, 15, 10 }

19. Considere as distribuições mostradas. Determine a mediana.

XI FI XI FI
2 1 0 3

5 4 1 5

8 10 2 8

10 6 3 10

12 2 5 6

TOTAL   TOTAL  

capítulo 3 • 89
20. Calcular a mediana.

CLASSES FI
3 ---| 6 2
6 ---| 9 5
9 ---| 12 8
12 ---| 15 3
15 ---| 18 1
TOTAL

21. Em uma série ordenada, qual é o percentual de elementos que ficam à esquerda de cada
uma das medidas separatrizes: D1, Q3, P70?

22. Em uma série ordenada, qual é o percentual de elementos que ficam à direita de cada
uma das medidas separatrizes: D4, Q1, P20?

23. Dada a série x={3,15,6,9,10,4,12,15,17,20,29}, calcule: D4, Q3, P90.

24. A distribuição das frequências no quadro representa a idade em anos de 50 alunos de


uma classe do primeiro ano de uma faculdade. Calcule D1, Q3, P95.

17 17 17 18 18 18 18 18 18 18

18 18 18 18 18 18 18 18 18 19

19 19 19 19 19 19 19 19 19 19

20 20 20 20 20 20 20 20 20 19

21 21 21 21 21 18 18 19 19 19

25. A distribuição das frequências na tabela representa o consumo por nota de 50 notas
fiscais emitidas durante um dia em uma loja de departamentos. Calcule D7, Q3, P90. Interprete
cada valor obtido. Tomando como amostra esta tabela, o gerente desta loja decidiu, numa
promoção, premiar com um brinde 10% dos fregueses que mais consumirem nos próximos
30 dias. A partir de qual valor de consumo de nota fiscal os clientes serão premiados?

90 • capítulo 3
11 106 141 163 204
0 109 143 165 227
15 109 144 166 233
16 114 146 174 248
29 115 148 175 258
49 121 148 177 262
59 123 154 182 269
65 138 157 187 274
92 139 157 191 282
99 141 162 195 307

26. Uma empresa estabeleceu o salário de seus vendedores com base na produtividade.
Desta forma, 10% é fixo e 90% são comissões sobre vendas. Uma amostra de salários
mensais nesta empresa revelou o quadro a seguir. Se uma empresa decidir, como incentivo,
fornecer uma cesta básica para 5% dos vendedores que tiverem desempenho ruim durante o
próximo mês, com base nesta amostra qual será o maior salário que receberá a cesta básica?

1084 1376 1457 1563 1636


1218 1378 1463 1569 1637
1241 1381 1470 1570 1639
1251 1381 1476 1574 1643
1251 1392 1476 1581 1649
1258 1398 1478 1586 1651
1292 1402 1479 1587 1655
1293 1407 1482 1588 1656
1296 1409 1484 1590 1677
1296 1412 1489 1591 1678
1299 1412 1490 1594 1695
1302 1430 1497 1595 1699
1320 1430 1506 1602 1715
1325 1431 1507 1604 1715
1329 1440 1510 1607 1720
1346 1441 1514 1607 1726
1348 1443 1538 1626 1729
1349 1444 1539 1627 1744
1368 1450 1546 1632 1803
1369 1456 1557 1635 1837

capítulo 3 • 91
27. A tabela representa o número de faltas semestrais dos funcionários de uma empresa.
Determine: D3, Q3, Q1, P10, P90. Interprete cada valor obtido.

3 5 3 4 7 5
3 4 7 5 5 3
5 4 3 5 6 3
3 2 6 3 4 3
5 7 3 5 2 2

28. Uma amostra do tempo de vida útil de uma peça forneceu a seguinte distribuição. Se
o produtor desejar estabelecer uma garantia mínima para o número de horas de vida útil de
uma peça, trocando a peça que não apresentar este número mínimo de horas, qual é a ga-
rantia, se ele está disposto a trocar 8% das peças?

538 591 453 757 383


186 402 496 405 725
606 760 306 598 397
648 603 253 609 681
448 481 426 260 411
519 482 523 577 832
563 305 307 440 383
454 604 302 384 301
645 442 566 412 565
731 641 341 541 177

29. Os valores a seguir representam os valores de notas fiscais, em R$, emitidas por 3 filiais
da loja de departamentos QWE. Construa o gráfico de boxplot para cada filial e interprete os
valores encontrados:

A B C
18 191 232 280 326 23 164 218 252 303 103 181 226 270 338
75 192 235 283 335 28 164 219 255 304 103 190 228 279 339
78 195 235 285 351 45 166 220 257 305 103 193 230 281 340
89 196 236 287 354 46 172 222 258 309 103 194 230 283 341
102 197 239 288 358 65 175 224 261 311 113 195 230 283 344
109 200 243 290 363 67 183 224 264 311 119 195 240 287 346
111 200 251 291 373 87 183 227 265 313 120 196 242 289 350
125 204 252 298 380 99 186 227 271 320 133 200 245 290 351
157 205 252 301 380 102 191 230 271 325 141 201 247 290 351
163 205 255 301 386 106 192 231 273 325 142 206 247 291 357

92 • capítulo 3
166 206 258 303 388 109 194 234 273 326 143 210 249 302 365
172 206 259 306 389 148 194 234 273 330 143 211 251 316 373
174 207 260 306 390 149 195 235 274 338 149 212 251 318 401
177 216 260 306 390 152 196 236 274 345 150 212 253 319 408
178 221 261 314 412 155 198 237 277 353 152 213 256 319 409
183 225 261 315 412 160 200 238 291 383 155 217 264 320 411
184 226 266 315 418 161 202 241 292 390 174 218 264 321 417
186 228 269 321 419 163 206 241 297 402 176 221 267 323 424
186 229 269 322 426 163 207 244 298 431 178 223 267 330 488
188 230 275 323 427 163 216 250 298 528 178 225 268 335 533

REFLEXÃO
Que a média é a medida de posição mais utilizada em nosso dia a dia talvez nem seja neces-
sário dizer, mas é preciso tomar certo cuidado quando a utilizamos como parâmetro de um
conjunto de dados. Você sabe que, se a média de sua turma em Estatística for igual a 7,0 (por
exemplo), não quer dizer que toda ela ou a maioria teve bom desempenho nem que metade
da turma teve desempenho igual ou superior a 7,0.
Outras medidas, como vimos, podem complementar as informações dadas pela média.

LEITURA
Veja o texto da recente reportagem que trata do aquecimento global, disponível em:
<http://g1.globo.com/natureza/noticia/2015/07/junho-bate-recorde-de-calor-no-pla-
neta-desde-fim-do-seculo-19.html>.
Perceba que os indicadores para a temperatura global estão todos baseados na média
das temperaturas medidas ao longo do último século. Como a média é uma medida descritiva
muito utilizada no dia a dia, sugerimos que você ouça o áudio “Médias que interessam”, da
Série: Problemas e Soluções. Há dois módulos, cujos conteúdos alertam para o cuidado que
se deve ter na interpretação da média, que mostram uma aplicação da média ponderada e
fazem uma análise crítica da utilização da média como uma informação única. O endereço
para acesso é: <http://m3.ime.unicamp.br/recursos/1315>.

capítulo 3 • 93
REFERÊNCIAS BIBLIOGRÁFICAS
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L.. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S.; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.

94 • capítulo 3
4
Medidas de
Dispersão
Nesse quarto capítulo, estudaremos as medidas de dispersão, que servem para
indicar o quanto os dados se apresentam dispersos em torno da região central.
Fornecem, portanto, o grau de va­riação existente no conjunto de dados. Dois
conjuntos de dados podem ter a mesma média, porém os valores poderão estar
muito mais dispersos em um conjunto do que em outro, apresentando graus de
homogeneidade diferentes.
Veja a seguinte situação: supondo que a temperatura máxima durante os
três últimos dias na cidade de São Paulo tenha sido de 27°, 28° e 29°, podemos
afirmar que a temperatura média foi de 28°. Em Porto Alegre, nestes mesmos
dias, a temperatura máxima foi de 22°, 28° e 34°, então a média de Porto Alegre
também foi de 28°. Percebemos que São Paulo passou por 3 dias de calor e Porto
Alegre passou por dois dias de calor e um de temperatura amena. Observamos
que a temperatura de Porto Alegre variou muito mais. A amplitude das tempe-
raturas nesta cidade foi acentuada. Como quantificar esta variação? Que con-
clusões se pode tirar dessas observações? Como interpretar estes valores?
Você se lembra de, após ter feito uma prova bimestral, algum profes­sor ter
informado que o desempenho médio da turma ficou em torno de 7,2? Para efei-
to de comparação, ele também pode ter calculado a média de outra turma e
verificado que o desempenho médio também ficou em torno de 7,2. Surgem
os seguintes questiona­mentos: será que as notas das duas turmas foram
iguais? Será que as notas das turmas estão próximas da mé­dia ou dispersas?
Utilizaremos os conceitos deste capítulo para respon­der a estas perguntas.
Aprenderemos a calcular e aplicar a diversas situações de apoio à decisão
as medidas de dispersão que são: variância, desvio padrão e coeficiente de
variação.

OBJETIVOS
Ao final deste capítulo, você deverá ser capaz de calcular o desvio padrão, a variância
e o coeficiente de variação para dados brutos e para tabelas com e sem classes, assim
como selecionar a melhor medida para descrever um conjunto numérico. Saberá ainda
interpretar e comparar as características de cada medida estudada.

96 • capítulo 4
4.1  Medidas de dispersão
As medidas de dispersão proporcionam um conhecimento mais completo do
fenômeno a ser analisado, permitindo estabelecer comparações entre fenôme-
nos de mesma natureza e mostrando até que ponto os valores se distribuem
acima ou abaixo do valor de tendência central, no caso a média, como será vis-
to. Antes, porém, vamos analisar os exemplos abaixo.

EXEMPLOS
Exemplo 1 – Imagine que as duas amostras a seguir representem o tempo, em minutos, de
atendimento em um call center telefônico. Estes números se referem aos 11 últimos atendi-
mentos dos funcionários A e B.

A B
9,14 6,56
8,14 6,1
8,74 7,71
8,77 8,84
9,26 8,47
8,1 7,04
6,13 5,27
3,1 5,26
9,13 7,91
7,26 6,89
4,74 12,5

A seguir, estão os valores da média para estas duas amostras:

A B
MÉDIA = 7,50 7,50

Observe que os resultados são iguais, porém, mesmo assim as amostras são bem
diferentes.
Veja outros indicadores destes dois conjuntos:

A B
MEDIANA= 8,14 7,04
MÍNIMO= 3,1 5,26
MÁXIMO= 9,26 12,5
AMPLITUDE = 6,16 7,24

capítulo 4 • 97
A amplitude da amostra B é maior que a da amostra A, mas o valor mínimo da amostra A
é menor, enquanto o valor máximo da amostra B é maior. Conforme visto no capítulo anterior,
com base na mediana, podemos afirmar que, na amostra A, 50% dos valores são maiores
que 8,14 e, na amostra B, 50% dos valores são maiores que 7,04.
Agora, observe um gráfico de dispersão para estas amostras. Também com base na
mediana, podemos afirmar que existe uma assimetria à direita para a amostra B e uma assi-
metria à esquerda para a amostra A.

Gráfico de dispersão
2,5

1,5
A
1 B

0,5

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Obs.: veja os cálculos do exemplo 1 na planilha 05dispersao.xls na aba A.

Agora observe os três conjuntos abaixo.

Exemplo 2
X = { 10, 1, 18, 20, 35, 3, 7, 15, 11, 10 }
Y = { 12, 13, 13, 14, 12, 14, 12, 14, 13, 13 }
Z = { 13, 13, 13, 13, 13, 13, 13, 13, 13, 13 }

Calcule a média para cada um desses conjuntos.

Obs.: veja os cálculos do exemplo 2 na planilha 05dispersao.xls na aba A.

Observe que todos os resultados são iguais a 13, porém, mais uma vez, observamos que
as variações desses conjuntos diferem bastante. O conjunto X apresenta a maior variação ou
dispersão dos dados, seguido pelo conjunto Y e pelo conjunto Z, que não varia. Dessa forma,
vemos que para caracterizar estes conjuntos, o cálculo da média não basta.

98 • capítulo 4
Exemplo 3 – Suponha que se deseje comparar a performance de dois empregados com
base na produção diária de peças:
A = 70, 71, 69, 70, 70 – Média A = 70 peças por dia
B = 60, 80, 70, 62, 83 – Média B = 71 peças por dia
Obs.: veja os cálculos do exemplo 3 na planilha 05dispersao.xls na aba A.

Apesar de as médias apresentarem valores próximos, percebemos que os valores das


produções diárias de cada empregado são bem diferentes. Observando apenas a média, po-
demos dizer que o empregado B tem maior produção média, mas, olhando os valores diários,
notamos que o empregado A tem uma produção mais constante, mais uniforme. Esta peque-
na dispersão é considerada um sinal de qualidade em um processo produtivo.
Aí está o ponto: a dispersão é uma medida que indica a presença ou não de uniformida-
de no processo ou fenômeno analisado. Quanto mais uniformes, consequentemente menos
dispersos, forem os valores observados, podemos inferir que o processo apresentará mais
qualidade e confiabilidade. É um processo sob controle e previsível. Já um fenômeno ou pro-
cesso com alta dispersão indica maior risco, pior qualidade e falta de controle na qualidade
do resultado.

4.1.1  Desvio Padrão

Desvio padrão é a medida de dispersão absoluta mais usada e representa o des-


vio ou afastament da média aritmética. O cálculo do desvio padrão é oriundo da
média quadrática dos desvios da média aritmética de um conjunto de núme-
ros, ou seja, é a raiz quadrada da média aritmética dos quadrados dos desvios,
calcados na média aritmética. É sempre um número positivo.
Antes de fazer o cálculo do desvio padrão, devemos definir se os dados têm
origem em uma amostra ou população.
Representação:

Para dados populacionais, usamos a letra sigma σ minúscula.

Para dados amostrais, usamos a letra S.

capítulo 4 • 99
Ao trabalhar com dados brutos (não tabelados), usaremos as fórmulas
a seguir:

DADOS BRUTOS (NÃO TABELADOS)


Σ PARA DADOS POPULACIONAIS S PARA DADOS AMOSTRAIS

2 2

σ=
∑ ( Xi − X) S=
∑ ( Xi − X)
n n −1

Para dados brutos (não tabelados), podemos usar as funções no Excel


DESVPAD.P DESVPAD.A

Para trabalhar com dados tabelados, usaremos as fórmulas a seguir. Perceba


o surgimento do termo fi nas fórmulas (frequência simples). Caso a tabela este-
ja com classes, usaremos os valores dos pontos médios de cada classe como os
valores de Xi na fórmula.

DADOS TABULADOS – XI É O VALOR DA VARIÁVEL OU SEU PONTO


MÉDIO (QUANDO TABULADOS POR CLASSES).
PARA DADOS POPULACIONAIS PARA DADOS AMOSTRAIS

2 2

σ=
∑ ( Xi − X) fi S=
∑ ( Xi − X) fi
n n −1

4.1.1.1  Características do desvio padrão

É importante ressaltarmos as principais características do desvio padrão:


1. Quanto menos for o desvio padrão, mais os valores da variável se aproxi-
marão de sua média.
2. Quanto mais os valores da variável se afastarem de sua média, maiores se-
rão os desvios e, consequentemente, maior será o desvio padrão e mais aberta
será a distribuição de frequências da variável.
3. Se duas variáveis tiverem a mesma média e desvios padrões diferentes,
a distribuição da variável com maior desvio padrão será mais aberta que a da
variável com menor desvio padrão.

100 • capítulo 4
4. Na prática, queremos encontrar um desvio padrão pequeno que im-
plica uma homogeneização do comportamento. Este é o fundamento da
Metodologia de gestão de qualidade seis sigma (leitura recomendada no final
desse capítulo).

4.1.1.2  Propriedades do desvio padrão

A seguir, listamos as propriedades do desvio padrão:


1 – Somando ou subtraindo um valor constante e arbitrário de cada elemen-
to de um conjunto de números, o desvio padrão não se alterará.
2 – Multiplicando ou dividindo por um valor constante e arbitrário cada
elemento de um conjunto de números, o desvio padrão ficará multiplicado ou
dividido pela constante.

4.2  Variância
Variância é a média dos quadrados dos desvios. É uma medida de dispersão
absoluta igual ao quadrado do desvio padrão.
Ao trabalhar com dados brutos (não tabelados), usaremos as fórmulas
a seguir:

DADOS BRUTOS OU NÃO TABULADOS:


PARA DADOS POPULACIONAIS PARA DADOS AMOSTRAIS
2 2

σ2 =
∑ ( Xi − X ) S2 =
∑ ( Xi − X)
n n −1
Para dados brutos (não tabelados), podemos usar as funções no Excel
VAR.P VAR.A

Ao trabalhar com dados tabelados, usaremos as fórmulas a seguir. Perceba


o surgimento do termo fi nas fórmulas (frequência simples). Caso a tabela este-
ja com classes, usaremos os valores dos pontos médios de cada classe como os
valores de Xi na fórmula.

capítulo 4 • 101
DADOS TABULADOS – XI É O VALOR DA VARIÁVEL OU SEU PONTO MÉDIO
(QUANDO TABULADOS POR CLASSES)
PARA DADOS POPULACIONAIS PARA DADOS AMOSTRAIS
2 2

σ2 =
∑ ( Xi − X) fi S2 =
∑ ( Xi − X) fi
n n −1

Resumindo, desvio padrão é a raiz quadrada da variância.

Para dados populacionais, usamos a letra sigma σ minúscula. σ = σ2

Para dados amostrais, usamos a letra S. S = S2

Desvio padrão é a medida de dispersão mais usada, pois mantém a unida-


de usada na variável observada. Já a variância, em função do seu cálculo, fica-
rá com a unidade elevada ao quadrado. Se estivermos, por exemplo, tratando
de uma variável medida em minutos (min), o desvio padrão ficará em minutos
(min) e a variância em minutos ao quadrado (min²). Esta não é uma medida
para a qual temos sensibilidade, o que dificulta sua aplicação e interpretação,
mas, para chegarmos ao cálculo do desvio padrão, inevitavelmente calculare-
mos a variância.

4.2.1  Propriedades da variância

A seguir, vamos ver as propriedades da variância:


1 – Somando ou subtraindo um valor constante e arbitrário de cada elemen-
to de um conjunto de números, a variância não se alterará.
2 – Multiplicando ou dividindo por um valor constante e arbitrário cada ele-
mento de um conjunto de números, a variância ficará multiplicada ou dividida
pelo quadrado da constante.

4.3  Cálculo da variância e do desvio padrão


Vamos agora aplicar cada uma das fórmulas e entender como o cálculo do des-
vio padrão e da variância são feitos.

102 • capítulo 4
4.3.1  Cálculo do desvio padrão para dados brutos de uma amostra

EXEMPLO
Exemplo 4 – Para esta pequena amostra, X = {5;10;12}, calcule o desvio padrão e a variância.
2

Solução: usaremos a fórmula S =


∑ ( Xi − X) .
n −1

Para isso, organizaremos os valores como uma tabela. Siga os passos:


1. Calcule a média dos 3 valores.
2. Subtraia a média de cada um dos valores da amostra. Perceba que a soma desses
resultados é zero.
3. Eleve cada resultado ao quadrado e some todos eles.
4. Como estamos trabalhando com uma amostra, dividiremos este resultado por n–1.
Neste caso 3 – 1 = 2. Este é o valor da variância.
Tire a raiz quadrada deste resultado e encontre o desvio padrão.

XI XI -MÉDIA (XI-MEDIA)²
5 (5–9)=-4 (5–9)²=16

10 (10–9)=1 (10–9)²=1

12 (12–9)=3 (12–9)²=9

TOTAL 27 0 26

Média = 27/3 = 9

Variância = 26/2 = 13

Desvio padrão = raiz(13) = 3,6056

capítulo 4 • 103
4.3.2  Cálculo do desvio padrão para dados brutos de uma
população

EXEMPLO
Exemplo 5 – Para esta pequena população, X = {5;10;12}, calcule o desvio padrão e
a variância.
2

Solução: usaremos a fórmula S =


∑ ( Xi − X) .
n

Para isso, organizaremos os valores como uma tabela. Siga os passos.


1. Calcule a média dos 3 valores.
2. Subtraia a média de cada um dos valores da população. Perceba que a soma desses
resultados é zero.
3. Eleve cada resultado ao quadrado e some todos eles.
4. Como estamos trabalhando com uma população, dividiremos este resultado por n.
Neste caso, 3. Este é o valor da variância.
5. Tire a raiz quadrada deste resultado e encontre o desvio padrão.

XI XI -MÉDIA (XI-MÉDIA)²
5 (5–9)=-4 (5–9)²=16

10 (10–9)=1 (10–9)²=1

12 (12–9)=3 (12–9)²=9

TOTAL 27 0 26

Média = 27/3 = 9

Variância = 26/3 = 8,6667

Desvio padrão =raiz(8,6667)= 2,9439

104 • capítulo 4
4.3.3  Cálculo do desvio padrão para dados tabelados sem classes
de uma amostra

EXEMPLO
Exemplo 6 – Para a tabela a seguir, calcule o desvio padrão e a variância:

XI FI
10 4
12 10
14 6
Total 20

Solução: usaremos a fórmula S =


∑ ( Xi − X) .fi
.
n −1

Siga os passos:
1. Calcule a média ponderada dos valores.
2. Subtraia a média de cada um dos valores da amostra. Eleve cada resultado ao quadra-
do. Multiplique-o pelo valor da frequência simples correspondente.
3. Some todos eles.
4. Como estamos trabalhando com uma amostra, dividiremos este resultado por n –1.
Este é o valor da variância.
5. Tire a raiz quadrada deste resultado e encontre o desvio padrão.

XI FI XI. FI (XI-MÉDIA)²FI
10 4 (10x40)=40 (10–12,2)².4=19,36

12 10 (12x10)=120 (12–12,2)².10=0,4

14 6 (14x6)=84 (14–12,2)².6=19,44

TOTAL 20 244 39,2

Média = 244/20 = 12,2000


Variância = 39,2 / 19= 2,0632
Desvio padrão = raiz(2,0632)= 1,4364

capítulo 4 • 105
4.3.4  Cálculo do desvio padrão para dados tabelados sem classes
de uma população

No caso de uma amostra, basta repetir o procedimento descrito. Apenas use


como denominador o tamanho da população n.

∑ ( X i − X ) fi
2

σ=
n

4.3.5  Cálculo do desvio padrão para dados tabelados com classes


de uma amostra

EXEMPLO
Exemplo 7 – Para a tabela a seguir, calcule o desvio padrão e a variância:

CLASSES FI
2 ---| 4 9
4 ---| 6 15
6 ---| 8 11
TOTAL 35
2

Solução: usaremos a fórmula S =


∑ ( Xi − X) ⋅ fi
.
n −1

Siga os passos:
1. Calcule a média ponderada dos valores. Como estamos trabalhando com classes, será
preciso calcular o ponto médio de cada classe. Este será usado como xi na fórmula da média
e do desvio padrão.
2. Subtraia a média de cada um dos valores da amostra. Eleve cada resultado ao quadra-
do. Multiplique-o pelo valor da frequência simples correspondente.
3. Some todos eles.
4. Como estamos trabalhando com uma amostra, dividiremos este resultado por n –1.
Este é o valor da variância.
5. Tire a raiz quadrada deste resultado e encontre o desvio padrão.

106 • capítulo 4
4.3.6  Cálculo do desvio padrão para dados tabelados com classes
de uma população

No caso de uma amostra, basta repetir o procedimento descrito. Apenas use


como denominador o tamanho da população n.

∑ ( X i − X ) fi
2

σ=
n

4.4  Coeficiente de variação de Pearson


O Coeficiente de variação de Pearson ou simplesmente coeficiente de variação
é a comparação, em percentual, entre o desvio padrão e a média. Ao contrário
da variância, é uma medida de dispersão relativa.

σ
CV = ⋅ 100% ⇒ Para dados populacionais
X

S
CV = ⋅100% ⇒ Para dados amostrais
X

A comparação da dispersão de duas ou mais distribuições pelo simples con-


fronto de seus desvios padrão nem sempre é suficiente, pois as amostras ou po-
pulações podem ter unidades diferentes ou, tendo a mesma unidade, seus valo-
res de média serem bastante afastados. Deve ser especialmente usada quando
as médias dos conjuntos observados forem diferentes.
Comparando duas variáveis, a variável que tiver menor CV – coeficiente de
variação –terá menor dispersão, menor variabilidade, menor risco e, portanto,
maior qualidade.
Diz-se que a distribuição possui:

BAIXA dispersão quando o coeficiente estiver entre 0 ≤ CV ≤ 15%

MÉDIA dispersão quando o coeficiente estiver entre 15% < CV ≤ 30%

ALTA dispersão quando o coeficiente for maior que CV > 30%

capítulo 4 • 107
EXEMPLO
Exemplo 8 – Um teste foi aplicado a dois grupos de 50 alunos e apresentou os seguin-
tes resultados:

GRUPO MÉDIA DAS NOTAS DESVIO PADRÃO DAS NOTAS


A 6 2
B 6,2 1,5

Baseado no coeficiente de variação, analise os resultados.


Solução:
Coeficiente de variação de A = 2/6 = 1/3 = 33,33%
Coeficiente de variação de B = 1,5/6,2 = 24,19%
Percebe-se que o CVB é menor, em virtude de ele ser derivado de um desvio menor e
uma média maior. Quanto menores o coeficiente de variação e o desvio, melhor o desempe-
nho daquele grupo. Seguindo a classificação, o grupo B apresenta média dispersão e o grupo
A alta dispersão. Isto mostra que os valores do grupo B estão mais próximos, com menor
dispersão relativa.

4.5  Interpretação do desvio padrão


A regra empírica (baseada na experiência, sem caráter científico), que será
apresentada a seguir, aplica-se a qualquer conjunto de dados, cuja distribuição
de frequências seja simétrica e tenha formato de um monte ou sino. As porcen-
tagens dadas nos intervalos demonstram uma boa aproximação mesmo quan-
do a distribuição dos dados é ligeiramente assimétrica. A regra se aplica tanto à
população como à amostra (S=desvio para amostra e s=desvio para população).
A regra diz que para um experimento realizado:
•  entre a média mais ou menos um desvio padrão, estão 68% dos valo-
res observados.
•  entre a média mais ou menos dois desvios padrão, estão 95% dos valo-
res observados.
•  entre a média mais ou menos três desvios padrão, estão 99,7% dos valo-
res observados.

108 • capítulo 4
68% das medidas estão entre x±s

95% das medidas estão entre x ± 2s

99,7% das medidas estão entre x ± 3s

Isto mostra que a maior concentração de valores observados está em torno


da média. Raramente, temos valores acima ou abaixo de 3 desvios padrão dis-
tantes da média.
Para trabalhar com esta regra, é importante saber:
•  A área sob a curva representa a probabilidade de ocorrência de determi-
nado intervalo de valores de x; esse valor é obtido pelo cálculo de integral ou
consultando uma tabela de curva normal (aprenderemos isto mais adiante).
•  A área total sob a curva é igual a 1 ou 100%.
•  Considerando a distribuição simétrica, a média é igual à moda, que é
igual à mediana; sendo assim, 50% dos valores observados são menores que a
média e 50% dos valores observados são maiores.
•  Esta é uma regra proveniente de exaustivas experimentações. Seus valo-
res são aproximados. Posteriormente, com estudos sobre a curva normal, esses
valores foram comprovados e podem ser encontrados em uma tabela de curva
normal ou curva de Gauss. A seguir, está a função da curva normal.

1
e−(1 2 ) ( x −µ )
2
f (x) = σ 
σ 2π

•  Ter um processo ou experimento com valores compreendidos entre esses


6 desvios padrão é a base para qualquer sistema de qualidade total, como o sis-
tema Lean Seis Sigma ou 6s.

EXEMPLOS
Exemplo 9 – Para entender melhor a regra empírica, aqui está uma curva normal. Supondo
a curva simétrica, com média igual a 60 e desvio padrão igual a 10, segue:
•  Entre 50 e 60, temos 68% dos valores observados.
•  Entre 40 e 80, temos 95% dos valores observados.
•  Entre 30 e 90, temos 99,7% dos valores observados.
•  Como a curva é simétrica, temos 50% dos valores acima da média e 50% dos valores
abaixo da média.
•  Entre 30 e 40, temos 2,5% das observações.

capítulo 4 • 109
•  Entre 40 e 50, temos 13,5% das observações.
•  Entre 50 e 60, temos 34% das observações.
•  O mesmo raciocínio se repete à direita da média.

Histograma
7
fi

6
5
4
3
2
1 34% 34%
2,5%13,5% 13,5% 2,5%
0
0 10 20 30 40 50 60 70 80 90 100
xi
68%
2,5% 95% 2,5%
99,7%

Exemplo 10 – Uma pesquisa feita com jovens de 25 anos na cidade de Brasília mostrou que
eles têm em média 1,76 m de altura com 8 cm de desvio padrão. Supondo esta distribuição
em formato de um monte, use a regra empírica do desvio padrão e calcule a probabilidade
de um jovem ter:
a) mais de 1,92 m de altura.
b) menos de 1,52 m de altura.
c) altura entre 1,68 e 1,84 m.
d) altura entre 1,92 e 2,00 m.
e) menos de 1,76 m de altura.

Solução: construindo o gráfico da curva normal para média igual a 176 cm e desvio
padrão de 8 cm, temos:

110 • capítulo 4
fi
8
7
6
5
4
3
2
1
0
152 160 168 176 184 192 200
68%
95%
99,7%

68% As medidas estão entre x ± s →168 e 184.


95% As medidas estão entre x ± 2s →160 e 192.
99,7% As medidas estão entre x ± 3s → 152 e 200.

a) = (100% – 95% ) / 2 = 2,5%


b) (100% – 99,7%) /2 = 0,15%
c) 68%
d) (99,7% – 95%)/2 = 2,350%
e) 50%

ATIVIDADES
01. Numa família de 7 pessoas (pai, mãe, quatro filhos e avó), a variável X representa a idade
em anos completos dessa família. As idades são: 45, 44, 21, 18, 16, 10 e 70. Calcule a média
aritmética, a mediana, a moda, o desvio padrão e a variância.

02. Dois estudantes obtiveram os seguintes resultados em 5 provas, realizadas ao longo do


ano letivo:
A=1–2–5–8–9
B=3–4–5–6–7
Analisar a performance dos 2 alunos.

capítulo 4 • 111
03. Na tabela, estão as quantidades de telefonemas recebidos por um médico durante uma
semana. Calcule a média, a mediana, a moda e o desvio padrão da variável X = número de
chamadas por dia recebidas pelo médico naquela semana.

DIA N.º DE CHAMADAS


SEG 14
TER 8
QUA 13
QUI 17
SEX 12
SÁB 8
DOM 5

04. A idade dos 6 jogadores de uma equipe de vôlei é, individualmente,:28, 27, 28, 31, 25 e
28 anos. Calcule a média, a mediana, a moda e o desvio padrão dessa variável.

05. A estatura de bebês ao nascerem é individualmente, em centímetros, 48, 52, 53 e 54.


a) Calcule a estatura média e o desvio padrão.
b) Se após um mês, cada bebê crescer exatamente 3 cm, qual será a nova média e o novo
desvio padrão?

06. Pesquisei o preço de um artigo em 6 lojas e obtive os seguintes valores em moe-


da nacional:

210.000 260.000 240.000 300.000 270.000 340.000.

a) Calcule o preço médio e o desvio padrão.


b) Dividindo os preços dos artigos agora por 10 000, qual será a nova média e o novo
desvio padrão?

07. Calcule a variância e o desvio padrão:


a) da população: X = { 2; 3; 7; 9; 11; 13 }
b) da população: X = { 5; 12; 4; 20; 13; 17 }
c) da amostra: X = { 15; 16; 17; 20; 21 }
d) da amostra: X = { 6; 5; 10; 12; 19 }

112 • capítulo 4
08. Dados os conjuntos de números:
A = { 1 000; 1 001; 1 002; 1 003; 1 004; 1 005 }
B = { 0; 1; 2; 3; 4; 5 }
podemos afirmar:
a) O desvio padrão de A é igual a 1 000 vezes o desvio padrão de B.
b) O desvio padrão de A é igual ao desvio padrão de B.
c) O desvio padrão de A é igual ao desvio padrão de B multiplicado pelo quadrado de
1 000.
d) O desvio padrão de A é igual ao desvio padrão de B dividido por 1 000.
e) O desvio padrão de A é igual ao quadrado do desvio padrão de B.

09. Calcular a variância e o desvio padrão das seguintes amostras:


A = { 0, 0, 0, 1, 1, 1 }
B = { –2, –1, 0, 1, 2 }

10. A distribuição de frequências dos pesos de cem operários de uma fábrica é a seguinte:

PESOS NO. DE OPERÁRIOS


50 |— 58 10
58 |— 66 15
66 |— 74 25
74 |— 82 24
82 |— 90 16
90 |— 98 10

Calcular o desvio padrão do peso dos cem operários.

11. Dados os conjuntos de números:


A = { 220, 230, 240, 250, 260 }
B = { 20, 30, 40, 50, 60 }
que relação existe entre os desvios padrão dos dois conjuntos?

12. Considere os seguintes conjuntos de números:


A = { 10, 20, 30, 40, 50 }
B = { 100, 200, 300, 400, 500 }
Que relação existe entre os desvios padrão dos dois conjuntos?

capítulo 4 • 113
13. Examinando a figura, podemos afirmar que:

B
A

0 xa xb x

a) o desvio padrão de A é igual ao de B.


b) o desvio padrão de A é maior do que o de B.
c) o desvio padrão de A é menor do que o de B.
d) não há possibilidade de se compararem os desvios padrão dessas distribuições, uma vez
que suas médias são diferentes.

14. Numa classe de 25 alunos, há 2 que não tem irmãos, 8 que tem 1 irmão cada um, 11 que
tem 2 irmãos cada um, 2 que tem 3 irmãos cada um, um com 4 irmãos e um com 5 irmãos.
A distribuição de frequência da variável él X = número de irmãos. Calcule a média, a moda,
a mediana o desvio padrão.

15. Nos primeiros jogos de um campeonato paulista, o Corinthians marcou as seguintes


quantidades de gols: 0, 1, 0, 4, 0, 0, 0, 1, 3, 2, 5, 3, 4, 5, 4, 0, 3, 0. Agrupe esses dados numa
tabela de frequências e calcule a média, a mediana, a moda e o desvio padrão da variável X
= número de gols por jogo.

16. As notas dos alunos de uma classe, em um teste que valia 4 pontos, foram: 3, 2, 2, 1,
4, 1, 0, 4, 3, 2, 3, 3, 4, 1, 1, 2, 2, 2, 0, 4, 1, 2, 3, 3, 3, 3, 1, 4, 0, 2, 2, 4, 3, 0, 2. Faça a tabela
de distribuição de frequências e calcule a média, a mediana, a moda e o desvio padrão das
notas, sendo X a nota dos alunos.

17. Numa empresa de grande porte, a distribuição dos salários é a seguinte:

N.º DE
SALÁRIOS
EMPREGADOS
8.000 12
12.000 5
20.000 3

114 • capítulo 4
a) a) Qual é o salário médio dos empregados dessa empresa?
b) b) A empresa vai contratar um diretor geral e não gostaria de que a nova média salarial
superasse R$12.000. Qual é o salário máximo que ela pode oferecer ao diretor?
c) c) calcule o desvio padrão incluindo o salário deste novo diretor.

18. Num feriado prolongado, 200 000 mil carros desceram para as praias do litoral. Sabendo
que 10% dos carros tinham só o motorista, 20% tinham 2 pessoas, 20% tinham 3 pessoas,
30% tinham 4 pessoas e 20% tinham 5 pessoas, em média quantas pessoas havia por carro?

19. Numa classe, 45% dos alunos são rapazes que pesam em média 52 Kg. Sabendo que
as moças pesam em média 42 Kg, qual o peso médio de todos os alunos da classe?

20. Consideremos a tabela a seguir e vamos calcular a média, a mediana, a moda e o desvio
padrão da variável X = peso em gramas de cada criança. Calcule o desvio padrão, a mediana
e a moda.

CLASSES FI
2460 –| 2580 2
2580 –| 2700 5
2700 –| 2820 7
2820 –| 2940 10
2940 –| 3060 12
3060 –| 3180 6
3180 –| 3300 5
3300 –| 3420 3

21. O professor de Estatística de uma faculdade experimentou dar uma prova sem limite de
tempo para os alunos. Os alunos gastaram os minutos indicados na tabela. Calcule a media-
na, a moda, o desvio padrão e o coeficiente de variação.

TEMPO EM MINUTOS NÚMERO DE ALUNOS


100 –| 120 12
120 –| 140 20
140 –| 160 16
160 –| 180 14
180 –| 200 8
200 –| 220 6
220 –| 240 4

capítulo 4 • 115
22. Dados os conjuntos A={10,11,12,13} B={9,8,11,15} e C={6,8,10,12}, faça o que se
pede. Qual conjunto possui maior desvio padrão? Qual é esse valor? (R=2,68). Se aumen-
tarmos cada elemento do conjunto A em 2 unidades, os do conjunto B em 1 unidade, o
conjunto C permanecendo fixo, qual deles terá a menor variância e qual seu valor? (R=1,25).
Tomando todos os números dos conjuntos A, B e C e formando um único conjunto, determine
a mediana e a moda.

23. Uma empresa tem suas faixas salariais conforme a tabela a seguir. Deseja-se contratar
dois gerentes pagando salários iguais para ambos, mas a média da folha de pagamento
não pode ultrapassar R$1.000. Qual deve ser o salário máximo oferecido aos gerentes?
(R= R$ 7.055,00). Calcule o desvio padrão incluindo os dois gerentes.

SALÁRIOS NÚMERO DE EMPREGADOS


500 10
650 15
810 14
1200 4

24. Aplicou-se uma prova a certa turma em que a média final foi 6,5. Sabendo que a média
dos rapazes foi de 4,5 e das moças foi 8, pergunta-se: qual é a porcentagem de moças que
fizeram a prova?

25. O Condomínio Novo Mundo tem 20 apartamentos com 4 quartos, 35 com 3 quartos,
40 com 2 quartos e 85 com 1 quarto. Calcule a média, a moda, a mediana e o desvio padrão
para a situação, considerando a variável como o número de quartos.

26. Uma empresa dividiu seus funcionários em classes de idade em que o intervalo de cada
classe era 4 anos. Sabendo-se que o mais jovem possuía 21 anos e o mais velho 60 anos e
a frequência de classes da menor idade para a maior era 3, 8, 4, 6, 10, 5, 3, 8, 4, 1, calcule a
mediana e o desvio padrão.

27. Para conhecer o número de horas por semana que os principais executivos das maiores
empresas trabalham, a empresa de consultoria realizou uma pesquisa com 12 executivos

116 • capítulo 4
escolhidos aleatoriamente dentre as quinhentas maiores empresas. Calcular a média e o
desvio padrão da seguinte amostra.

60 66 64 62 58 62 62 60 62 60 64 66

28. A seguir, está o tempo, em segundos, medido em 5 testes para dois nadadores em
100 metros nado livre. Calcule o tempo médio, o desvio padrão e o coeficiente de varia-
ção para cada atleta. Baseando-se no CV, qual deles demonstrou um comportamento
mais constante?

29. Supondo duas ações – Petrobrás e Natura – com retornos médios iguais a 32,5% e
28,7% ao ano respectivamente e desvios iguais a 5% e 4% ao longo dos últimos 5 anos,
encontre a ação de maior risco.

30. Um laboratório desenvolveu um novo reagente buscando aumentar sua confiabilidade


em relação ao que é usado atualmente. Tendo submetido esse novo reagente à prova, che-
gou-se à conclusão de que a reação ocorre com média de 139 minutos e desvio padrão de
15 minutos contra uma média de 88 minutos e desvio padrão de 14 minutos do reagente
antigo. Com base no coeficiente de variação, analise esses resultados e informe o produto
que proporciona a maior confiabilidade.

31. Ao comparar os retornos anuais de duas ações, a que apresentar maior coeficiente de
variação apresentará maior risco. A tabela a seguir registra o retorno da ação A e da ação
B durante 5 anos. Calcule o coeficiente de variação para cada ação. Determine a ação de
maior risco.

AAÇÃO A AAÇÃO B
9% 12%
10% 10,5%
12% 9,5%
10,5% 11%
9,5% 12,5%

Verificar vírgula antes do 5%

capítulo 4 • 117
32. Os valores abaixo representam o lucro em % de 50 empresas no ano passado. Calcule
a média e o desvio padrão. Encontre a quantidade de valores que estão entre os intervalos
x ± s , x ± 2s e x ± 3s . Indique-os em forma de porcentagem. Compare esses resultados
com os obtidos pela regra empírica.

13,5 8 8,2 9,6 7,1


8,4 7,9 8 7,2 13,2
10,5 6,8 7,7 8,8 7,7
9 9,5 7,4 11,3 5,9
9,2 8,1 6,5 8,5 5,2
9,7 13,5 9,5 9,4 5,6
6,6 9,9 8,2 10,5 11,7
10,6 6,9 6,9 6,9 6
10,1 7,5 7,2 6,5 7,8
7,1 11,1 8,2 7,5 6,5

33. Um fabricante de baterias de automóvel diz que a média de tempo de vida de suas bate-
rias tipo A é de 60 meses. A garantia é dada para 36 meses. Supondo um desvio padrão de
10 meses e a distribuição de frequências em formato de um monte, responda às questões.
•  Qual porcentagem de baterias irá durar mais de 50 meses?
•  Qual porcentagem de baterias irá durar menos de 40 meses?
•  Supondo que sua bateria dure 37 meses, o que você poderia inferir sobre os parâmetros
divulgados pelo fabricante?

34. O comprador de uma fábrica de tábuas de madeira precisa decidir-se sobre a compra
de um pedaço de terra contendo 5.000 pinheiros. Se, pelo menos, 1.000 árvores possuírem
40 pés de altura, a terra será comprada; caso contrário, não haverá compra. O proprietário
relata que as árvores têm em média 30 pés com desvio padrão de 3 pés. Baseado nesta
informação, qual será a decisão do comprador?

35. O número de veículos que passam por um cruzamento foi registrado durante um ano
por um engenheiro de trânsito. O objetivo deste estudo é determinar a porcentagem de dias
que passam mais de 425 veículos. Suponha a média igual a 375 veículos por dia e o desvio
padrão de 25 veículos. O que se pode dizer da porcentagem de dias em que passam mais
de 425 veículos?

36. Quando está trabalhando corretamente, a máquina que enche sacos de 25 libras de fari-
nha coloca uma média de 25 libras por saco, com desvio padrão de 0,1 libra. Para monitorar a

118 • capítulo 4
performance da máquina, o inspetor pesa um saco cheio a cada meia hora durante todo o dia.
Se dois sacos consecutivos apresentarem pesos maiores que 2 desvios padrões acima
da média, a máquina será considerada fora de controle e será mandada para um ajuste.
Os dados da tabela abaixo são os pesos medidos ontem. Assumindo que cada parada não
demore mais que 15 minutos, em quais momentos ontem a máquina foi parada para ajuste?

HORA PESO LIBRAS HORA PESO LIBRAS


8:00AM 25,1 1:00PM 24,95
8:30AM 25,15 1:30PM 24,8
9:00AM 24,81 2:00PM 24,95
9:30AM 24,75 2:30PM 25,21
10:00AM 25 3:00PM 24,9
10:30AM 25,05 3:30PM 24,71
11:00AM 25,23 4:00PM 25,31
11:30AM 25,25 4:30PM 25,15
12:00PM 25,01 5:00PM 25,2
12:30PM 25,06

REFLEXÃO
Vimos, nesse capítulo, que tão importante quanto conhecer a média de um conjunto de da-
dos, por exemplo, é determinar o seu grau de variabilidade (ou dispersão). Na maioria dos
estudos que realizamos, deparamo-nos com conjuntos que podem apresentar maior ou me-
nor grau de homogeneidade.
Conjuntos com características de maior homogeneidade tendem a fornecer informações
mais precisas e confiáveis. Imagine, por exem­plo, um estabelecimento que diariamente pres-
ta atendimento a seus clientes. Se a quantidade desses clientes variar muito de um dia para
outro, ficará mais difícil determinar o número de funcionários necessários para realizar o
atendimento. Se esse número, no entanto, variar pouco (apresen­tar-se mais homogêneo) de
um dia para o outro, ficará muito mais fácil mon­tar uma estrutura adequada de atendimento.

LEITURA
Vejam os arquivos anexos, 05curso3seissigma.pdf e 05RISKforSixSigma_PT.pdf , que
tratam da metodologia de controle de qualidade chamada Lean Seis Sigma. Esta é uma me-

capítulo 4 • 119
todologia de melhoria de qualidade e produtividade, mundialmente usada por empresas. Suas
ferramentas baseiam-se em conceitos de média e desvio padrão. O Seis Sigma pretende
identificar e reduzir processos com alta variabilidade. Processos com alta variabilidade têm
grande probabilidade de gerarem produtos fora da especificação do cliente. Um profissional
que atue na área de qualidade pode certificar-se no uso e implantação desta metodologia,
tornando-se um black-belt (faixa preta) no assunto. Também existem no mercado ferramen-
tas de software desenvolvidas para apoiar a implantação desta metodologia, como o software
@Risk.
Sugerimos também a leitura do artigo “E se todos fossem ao cinema ao mes­mo tempo?”
do professor Luiz Barco, disponível em:<http://super.abril.com.br/ciencia/lei-regularida-
de-estatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml>. Ele
retrata, de forma bem interessante, a questão da regularidade dos fenômenos relacionados
ao comportamento social.

REFERÊNCIAS BIBLIOGRÁFICAS
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A Estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 2013.

120 • capítulo 4
5
Introdução à
Probabilidade
Nos capítulos anteriores, conhecemos as ferramentas da estatística descritiva
e vimos como organizar e descrever conjuntos de dados por meio de gráficos,
tabelas e medidas resumo, tais como: medidas de posição e dispersão. Obser-
vamos que os resultados obtidos auxiliam na análise e interpretação dos dados.
Neste capítulo, estudaremos conceitos básicos de probabilidade, dando início
ao estudo das ferramentas da estatística indutiva.
Você, certamente, já deve ter feito perguntas cujas respostas dependiam do
cálculo de probabilidades, por exemplo: Qual a probabilidade de chover no pró-
ximo final de semana prolongado? Qual a probabilidade de se acertar a Mega
Sena jogando um cartão com seis números? Qual a probabilidade de as vendas
de determinado produto decrescerem se aumentarmos o preço do produto?
O cálculo destas e de outras probabilidades nos auxiliam na tomada de de-
cisões. Nesse capítulo, introduziremos inicialmente alguns conceitos básicos
da probabilidade. Em seguida, será realizada uma revisão sobre as técnicas de
contagem e, na sequência, aprenderemos a aplicar a regra da soma, da pro-
babilidade condicional e da multiplicação. Por fim, estudaremos o teorema
de Bayes.

OBJETIVOS
Com o estudo dos conceitos abordados neste capítulo, você será capaz de identificar experi-
mentos aleatórios e calcular probabilidades de ocorrência de determinados eventos, usando
as técnicas de contagem e a definição de probabilidade. Deverá também saber aplicar as
regras de adição, multiplicação e probabilidade condicional no cálculo de probabilidades e
ainda a utilizar o teorema de Bayes.

122 • capítulo 5
5.1  Experimentos aleatórios
Acredita-se que a história da probabilidade tenha se iniciado na Idade Média
em função das apostas efetuadas em jogos de azar, por isso, ao procurar expli-
cações sobre o tema, invariavelmente vamos nos deparar com exemplos ligados
a jogos com dados, roletas e cartas de baralho.
A probabilidade lida essencialmente com as chances de ocorrência de dife-
rentes resultados em eventos, apresentando técnicas para o calculá-las.
Por exemplo, compare esses dois eventos:
I – O resultado do lançamento de uma moeda pode ser cara ou coroa.
II – Em uma pesquisa de intenção de voto, 43% dos eleitores preferem o can-
didato A, 37% dos eleitores preferem o candidato B e os restantes 20% dos elei-
tores não sabem em quem votar.

O que estes dois experimentos têm em comum?


O fato de que o resultado não pode ser previsto com antecedência. O resul-
tado irá variar toda vez que lançarmos uma moeda ou extrairmos diferentes
amostras para a pesquisa de intenção de voto.
A fenômenos desse tipo damos o nome de experimentos ou fenômenos
aleatórios. Pelo fato de não sabermos o resultado exato de um fenômeno alea-
tório é que buscamos os resultados prováveis, as chances, as probabilidades de
um determinado resultado ocorrer. A teoria das probabilidades é um ramo da
matemática que cria, elabora e pesquisa modelos para estudar experimentos
ou fenômenos aleatórios.

5.1.1  Conceitos básicos

Estamos acostumados a ler e escutar termos relacionados à probabilidade


utilizados de maneira informal. Frases como “provavelmente o dólar conti-
nuará subindo nos próximos meses” ou “a probabilidade do candidato X se
reeleger é muito pequena” ou ,ainda, “as chances de chover no próximo fim
de semana são muito grandes” são encontradas com frequência no nosso dia
a dia. Por isso, é importante que sejam introduzidos inicialmente alguns con-
ceitos básicos formais para melhor entendimento e interpretação do assunto
em questão.

capítulo 5 • 123
5.1.2  Experimento

Experimento é todo processo de realizar observações e obter dados.

5.1.3  Experimento aleatório

É aquele que, apesar de se conhecerem todos os possíveis resultados, não se


pode antecipar seu resultado.

5.1.4  Espaço amostral

É um conjunto formado por todos os possíveis e diferentes resultados de um


experimento aleatório.

EXEMPLO
Exemplo 1 – Lançamento de duas moedas
O espaço amostral será: S = {CaCa, CaCo, CoCa, CoCo} em que Ca=Cara e Co=Coroa.

5.1.5  Evento

É um subconjunto formado por um ou mais resultados (eventos elementares)


do espaço amostral.

EXEMPLO
Exemplo 2 – Ao se jogarem duas moedas, este é o evento dos resultados que têm exata-
mente apenas uma cara: A = {CaCo, CoCa}.

5.1.6  Evento elementar

Evento Elementar é um único resultado do espaço amostral, com uma única


característica. Não pode ser particionado nem dividido.

124 • capítulo 5
5.1.7  Evento composto

Trata-se de um conjunto de eventos elementares, com 2 ou mais característi-


cas, ou seja, no evento elementar encontra-se um único resultado e no evento
composto há mais de um resultado.

5.1.8  Complemento de um evento

É um subconjunto formado por elementos do espaço amostral que não estão


incluídos no evento. A interseção de dois eventos complementares é zero ou
um conjunto vazio.

EXEMPLO
Exemplo 3 – O complemento de A é o conjunto B = {CaCa,CoCo}.

5.1.9  Operações com eventos

Algumas operações podem ser efetuadas com os seguintes possíveis eventos:


1. A união dos eventos A e B gera um novo evento formado pela união dos
elementos dos dois conjuntos.
2. A intersecção dos eventos A e B gera um novo evento formado pelos ele-
mentos comuns aos dois eventos.
3. A união do evento A com seu complemento é o próprio espaço amostral.
4. A interseção do evento A com seu complemento é um conjunto vazio.

5.1.10  Eventos mutuamente excludentes

Para entender esse conceito, pense no lançamento de uma moeda. O resultado


só pode ser cara ou coroa. Um resultado impede a ocorrência de outro, pois ele
não pode ser, ao mesmo tempo, cara e coroa. Serão mutuamente excludentes
eventos nos quais a interseção for vazia, ou seja, são eventos disjuntos, pois não
têm nenhum elemento em comum.

capítulo 5 • 125
5.1.11  Eventos coletivamente exaustivos

Ocorre quando a união dos eventos forma o espaço amostral, no qual cada
evento pode ter elementos repetidos no outro. A união deles é 1.

EXEMPLO
Exemplo 4 – Analisar os resultados do lançamento de uma moeda.
Solução: como o espaço amostral do lançamento de uma moeda tem apenas dois even-
tos, os eventos elementares Ca e Co são mutuamente excludentes, complementares e co-
letivamente exaustivos.

Exemplo 5 – A nota final do curso de Estatística pode ser conceito A, B ou C. Analisar os


resultados das notas.
Solução: o espaço amostral da nota final de Estatística será formado por três eventos
elementares: A, B e C. Os três conceitos são eventos mutuamente excludentes e eventos
coletivamente exaustivos, pois, quando agrupados, formam o espaço amostral de todos os
conceitos. Não são eventos complementares, pois o complemento de A é a união dos con-
ceitos B e C.

5.1.12  Visualização de um espaço amostral

Para facilitar a análise de cada situação em estudo, a visualização do espaço


amostral pode ser feita por meio de algumas representações como: árvore de
possibilidades, tabela de contingências, diagrama de Venn, entre outras. A
árvore de possibilidades, por exemplo, é a representação gráfica dos eventos
elementares de um espaço amostral. Esta representação é muito útil para orga-
nizar os cálculos de experimentos com mais de uma etapa.

EXEMPLO
Exemplo 6 – A árvore de possibilidades do lançamento de uma moeda três vezes segui-
das será:

126 • capítulo 5
Ca Ca Ca Evento 1
Co Evento 2
Co Ca Evento 3
Co Evento 4
Co Ca Ca Evento 5
Co Evento 6
Co Ca Evento 7
Co Evento 8

5.1.13  Probabilidade

A probabilidade de sucesso de um evento A, representada por P(A), é um núme-


ro entre zero e um:

0 ≤ P( A ) ≤ 1
P(S) = 1
→ onde S é o espaço amostral

Se, A ∩ B = ϕ ⇒ P( A ∪ B) = P( A ) + P(B)

Para eventos mutuamente exclusivos:


Sabendo que a probabilidade P(A) está associada à proporção de sucessos
do evento A, vem:
Se P(A) = 0, o evento A nunca ocorrerá, pois é um evento impossível.
Se P(A) = 1, o evento A sempre ocorrerá, pois é um evento certo.

A soma das probabilidades de todos os resultados (eventos elementares de um espa-


ço amostral) é sempre igual a um.

A probabilidade de um evento não ocorrer é igual a um menos a probabili-


dade de o evento ocorrer.
P(ϕ) = 0
P( A ) = 1 − P( A )
seA ⊂ B ⇒ P( A ) ≤ P(B)
se A e B s o dois eventos quaisquer P( A ∪ B) = P( A ) + P(B) − P( A ∩ B)

Corrigir: se A e B forem dois eventos quaisquer:

capítulo 5 • 127
5.2  Técnicas de contagem
O cálculo efetivo de uma probabilidade depende frequentemente do uso dos
resultados da análise combinatória. A análise combinatória é a parte da mate-
mática que desenvolve técnicas e métodos de contagem. Apresentaremos, nos
itens a seguir, um resumo dos principais resultados dessa área da matemáti-
ca elementar.
Listar ou contar eventos elementares só é um procedimento simples para ex-
perimentos com espaço amostral pequeno, como o lançamento de uma moeda
2 vezes seguidas. Para eventos mais numerosos, precisamos de outras técnicas.
As técnicas de contagem (também conhecidas como análise combinatória)
determinam, sem enumeração direta, o número de resultados possíveis de um
espaço amostral. Observe os exemplos a seguir:

EXEMPLOS
Exemplo 7 – Determinar o número de resultados possíveis do lançamento de um dado 3
vezes seguidas.
Solução: para contar os resultados possíveis, procederemos como segue:
Cada lançamento do dado tem 6 resultados possíveis.
Cada resultado dos 6 resultados do segundo lançamento poderá ser combinado com os
6 do primeiro lançamento, totalizando 36 resultados possíveis.
Cada resultado dos 6 resultados do terceiro lançamento poderá ser combinado com os
36 do segundo lançamento, totalizando 216 resultados.
6 x 6 x 6 = 63 = 216

Exemplo 8 – A placa de um carro é formada inicialmente por 3 letras e em sequência por


3 dígitos de 0 a 9. Determinar o número de placas possíveis, considerando que podem ser
usadas 22 letras em cada posição e o primeiro dígito não pode ser zero.
Solução: o número de placas possíveis é obtido pela expressão:
22 x 22 x 22 x 9 x 10 x 10 = 9 583 200

128 • capítulo 5
5.2.1  Princípio fundamental da contagem

De modo geral, temos:

Se um evento for composto de duas etapas sucessivas e independentes, de tal ma-


neira que o número de possibilidades na 1a etapa seja m e na 2a etapa seja n, então
o número de possibilidades do evento ocorrer será dado por m.n.

O produto dos números de possibilidades vale para qualquer número de


etapas independentes.

EXEMPLO
Exemplo 9 – Se, em um restaurante, encontrarem-se no cardápio 3 tipos de saladas, 4
pratos quentes e 2 sobremesas, de quantas maneiras diferentes é possível montar uma re-
feição completa?
Solução: 3 x 4 x 2 = 24 maneiras

5.2.2  Permutação simples

A permutação simples fornece o número de agrupamentos possíveis de formar


quando temos n elementos e todos serão usados em cada agrupamento.
Na permutação, a ordem em que os objetos aparecem é importante, defi-
nem um novo e distinto objeto. A ordem diferencia o elemento. Assim abc é
diferente de bac e de cba e assim por diante.

EXEMPLO
Exemplo 10 – Quantos são os anagramas (diferentes disposições das letras de uma pala-
vra) da palavra ANEL?

capítulo 5 • 129
Solução:

4
3 2 1
possibilidades
possibilidades possibilidades possibilidade
A, N, E ou L

Pelo princípio fundamental da contagem, temos 4 · 3 · 2 · 1 = 24 possibilidades


Assim, conclui-se que:
Se temos n elementos distintos, então o número de agrupamentos ordenados que pode-
mos obter com todos esses n elementos é dado por:
n · (n – 1) · (n – 2) · ... · 3 · 2 · 1

Esses grupamentos ordenados que diferem pela ordem recebem o nome de permuta-
ções simples. Indica-se por Pn o número de permutações simples de n elementos:
Pn = n · (n – 1) · (n – 2) · ... · 3 · 2 · 1

O valor obtido com Pn também é conhecido como fatorial de n ou n fatorial e é repre-


sentado pelo n!
n! = Pn = n · (n – 1) · (n – 2) · ... · 3 · 2 · 1

Resumindo:

N elementos → todos usados


A ordem define um novo elemento.
Sem repetição
OBS: fatorial de zero é um: 0! = 1.

No EXCEL, use a função fatorial (n)

5.2.3  Arranjo simples

O arranjo simples fornece o número de agrupamentos possíveis de formar


quando temos n elementos e nem todos serão usados em cada agrupamento.

130 • capítulo 5
No arranjo a ordem em que os objetos aparecem é importante, definem um
novo e distinto objeto. A ordem diferencia o elemento, assim como na permuta-
ção. Dessa forma abc é diferente de bac e de cba e assim por diante.

EXEMPLOS
Exemplo 11 – Usando os algarismos 2, 3, 5, 7, 8 e 9, quantos números naturais de 4 alga-
rismos distintos podemos formar?
Solução:

6 5 4 3

Há 6 possibilidades para o 1o algarismo.


Há 5 possibilidades para o 2o algarismo.
Há 4 possibilidades para o 3o algarismo.
Há 3 possibilidades para o 4o algarismo.
No total, podemos formar 6 · 5 · 4 · 3 = 360 números.
Neste caso, fizemos arranjos de 6 elementos 4 a 4, assim indicados:
A6,4 = 6 · 5 · 4 · 3 = 360

Exemplo 12 – Qual o número de arranjos de cinco objetos identificados pelas letras a, b, c,


d e e tomados 3 a 3?
Solução:
O primeiro objeto pode ser qualquer um dos 5.
O segundo objeto será um dos 4 restantes.
O terceiro será um dos 3 restantes.
Pela fórmula da multiplicação, há:
60 = 5 x 4 x 3 palavras distintas.
Arranjos simples A(n,p) de n objetos associados em grupos de p (p ≤ n) são os agru-
pamentos ordenados diferentes que se podem formar com p dos n elementos dados. São
calculados pela fórmula:

A (n,p ) = n ⋅ (n − 1) ⋅ (n − 2) ⋅ ... ⋅ (n − p + 1)

p ⋅ fatores

capítulo 5 • 131
Usando a notação fatorial:

n!
A ( n,p ) =
(n − p)!

Aplicando esta fórmula no exemplo dado: A(5,3) = 5! / 2! = (5x4x3x2x1) / (2x1) =


5x4x3 = 60.
Quando n = p, temos:

n! n! n!
A n, n = = = = n! = Pn
(n − n)! 0 ! 1

Concluímos que um arranjo é um subconjunto, um caso, da permutação.


Resumindo:

N elementos → NEM todos são usados.


A ordem define um novo elemento.
Sem repetição

No EXCEL, use a função Permut (n;p).

Exemplo 13 – Usando os algarismos 1, 4, 7 e 9, quantos números naturais de 3 algarismos


podemos formar com algarismos distintos ou com algarismos repetidos?
Solução:
Repetidos → Isto é um caso de arranjo com repetição de 4 elementos 3 a 3, assim
indicados:

4 4 4

AR4,3= 4 · 4 · 4=43 = 64
Distintos → 4 x 3 x 2 = 24

Exemplo 14 – Quantos números de 3 algarismos, com repetição, podemos formar com os


algarismos 5 e 8?

132 • capítulo 5
Solução:

2 2 2

AR2,3= 2 · 2 · 2 = 23
Assim, podemos generalizar → arranjo com repetição = ARn,p=np

5.2.4  Combinações

Quando a ordem dos objetos não é importante, estamos realizando a contagem


denominada combinação. Nesse caso, a mudança de ordem não gera um novo
elemento. Assim abc é igual a bac e cba.

EXEMPLO
Exemplo 15 – Ana, Elisa, Rosana, Felipe e Gustavo formam uma equipe. Apenas 2 deles irão
representar a equipe em uma apresentação. Quantas são as possibilidades de representação?
Solução:
As 5 pessoas formam um conjunto. Quantos subconjuntos de 2 pessoas podemos
formar?
Nesse caso, a ordem dos elementos não importa, pois Ana e Elisa é a mesma dupla
que Elisa e Ana.
Então, os subconjuntos de 2 elementos são:
{A; E}, {A; R}, {A; F}, {A; G}, {E; R}, {E; F}, {E; G}, {R; F}, {R; G}, {F; G}
O número total de combinações é 10.
C5, 2 = 10

Exemplo 16 – De um conjunto com 3 elementos {a;b;c}, quantos subconjuntos de 2 elemen-


tos podemos formar?
Solução:
{a;b}
{a;c}
{b;c}

capítulo 5 • 133
O número total de combinações é 3.
C3,2=3
Seu resultado também pode ser obtido com a seguinte fórmula:

n! A n,p
Cn,p = =
p !(n − p)! p!

Como são subconjuntos de um conjunto, a ordem dos elementos não importa. Só consi-
deramos subconjuntos distintos os que diferem pela natureza dos seus elementos.
Resumindo:

N elementos → NEM todos são usados.


A ordem NÃO define um novo elemento.
Sem repetição

No EXCEL use a função Combin (n,p).


Propriedades da combinação:
Cn,p = Cn,n−p
n! 1
Cn,n = = =1
n!( 0 !) 1

Exemplo 17 – Qual o número de combinações de cinco objetos identificados pelas letras a,


b, c, d, e tomados 3 a 3?
Solução: C(5,3) = 5! / (3! 2!) = (5x4x3x2x1) / (3x2x1x2x1) = 5x2 = 10 = (5·4·3)/(3·2·1)
Lapponi

Exemplo 18 – Quantas comissões de 3 pessoas pode-se formar com um grupo de


10 pessoas?

10 ! 10.9.8.7!
Solução: C10,3 = = = 120 = (10 · 9 · 8)/(3 · 2 · 1)=1 · 3 · 4
3!(10 − 3)! 3.2.7!

5.3  Obtenção de probabilidades de eventos


Dentre as diversas formas de obter a probabilidade de sucesso de um evento,
apresentaremos a frequência relativa e a probabilidade teórica.

134 • capítulo 5
5.3.1  Frequência relativa

A frequência relativa, também conhecida por método clássico ou empírico, vem


da experimentação. É preciso realizar o experimento repetidas vezes e depois
anotar o número de sucessos do evento procurado. A frequência relativa cal-
culada em uma tabela de frequências é o resultado da probabilidade buscada.
Se um experimento for repetido um número muito grande de vezes, podere-
mos perceber uma tendência nos resultados. Esta tendência terá maior aproxi-
mação de um resultado teórico quanto maior for o número de repetições.
No arquivo 08aulaexercicio.xls, na planilha 1 está registrado o lançamen-
to de uma moeda 1.500 vezes, que, do ponto de vista estatístico, ainda é um
número pequeno de repetições, mas já é possível observar uma tendência nos
resultados.

Propabilidade de aparecer zeros em 1500 experimentos


52,00%

50,00%

48,00%
Zeros

46,00%

44,00%

42,00%

40,00%
0 200 400 600 800 1000 1200 1400 1600
Lançamentos
Zeros

A probabilidade de obter cara no lançamento de uma moeda é 0,5, entre-


tanto esse resultado não significa que, depois de lançar uma moeda cinquenta
vezes seguidas, sempre ocorrerão vinte e cinco caras e vinte e cinco coroas. O
gráfico mostra que a frequência relativa do evento cara é variável.
Se o experimento for repetido um número muito grande de vezes (muito
mais que 1500), a diferença entre a frequência relativa do evento e a probabili-
dade teórica será cada vez menor.

capítulo 5 • 135
Assim, embora os resultados de um experimento aleatório sejam incertos,
em longo prazo os resultados têm uma distribuição de frequências definida.
Previsões de tempo, resultados eleitorais, mortalidade causada por doenças,
entre outras, são probabilidades calculadas usando-se frequências relativas de
pesquisas estatísticas. Nesses casos, quanto maior for o histórico de dados ana-
lisados, melhor será a previsão.
Depois de se repetir um experimento aleatório um número muito grande de
vezes, a proporção de ocorrência de um dos resultados é denominada probabi-
lidade. Isso é chamado de lei dos grandes números.
Ao aumentar o número de experimentos a frequência relativa de cada even-
to se aproximará do seu valor teórico, de sua probabilidade de ocorrer.
Essa probabilidade é calculada da seguinte forma:

número de sucessos do evento


P(A) =
xperimento
numero de repetições do ex

Isso é exatamente o que vínhamos fazendo na estatística descritiva, em que


um experimento era realizado e seus resultados eram organizados em uma ta-
bela de frequências. Em seguida, calculávamos as frequências simples, relativa
e acumulada. Para aquele evento que foi realizado, a frequência relativa indica
exatamente a probabilidade de ocorrência de cada resultado observado.

5.3.2  Probabilidade teórica de eventos

Quando os eventos de um experimento são igualmente prováveis, a probabilidade


de cada evento pode ser obtida de um cálculo teórico
1/m em que m é o número total de eventos elementares.

Quando um evento A contém r pontos ou eventos elementares a P(A) = r ·


1/m = r/m
Esta relação vem do resultado da divisão do número de eventos que aten-
dem à condição estabelecida pelo número total de resultados possíveis do es-
paço amostral.

número de casos favoráveis NCF


P(A) = =
número total de casos NCT
T

136 • capítulo 5
EXEMPLOS
Exemplo 19 – No lançamento de uma moeda, o espaço amostral tem apenas dois eventos
elementares mutuamente excludentes: cara e coroa. Estes são igualmente prováveis e não
existem condições que estabeleçam preferências ou dependências. A probabilidade de sair
cara é então ½ = 50%.

Exemplo 20 – Qual a probabilidade teórica de obter 2 no lançamento de um dado?


O espaço amostral tem 6 eventos elementares mutuamente excludentes {1,2,3,4,5,6}.
Como os seis resultados são igualmente prováveis, a probabilidade teórica é 1/6.

Exemplo 21 – No lançamento de um dado perfeito, qual é a probabilidade de sair um nú-


mero maior do que 4?
Espaço amostral A = {1, 2, 3, 4, 5, 6}
n(A) = 6
B = {5, 6} → número maior do que 4 → n(B) = 2

nœmero de casos favorÆveis 2 1


P(B)= = = = 0, 333 = 33, 33%
nœmero de casos totais 6 3

Exemplo 22 – Qual a probabilidade de sair um “dois”, ao retirar, por acaso, uma carta de um
baralho de 52 cartas?
Num baralho, há 4 cartas “dois”.

nœmero de casos favorÆveis 4 1


=P ( C) == = = 7,69%
0,076923
nœmero de casos totais 52 13

Exemplo 23 – No lançamento simultâneo de 3 moedas perfeitas distinguíveis, qual é a


probabilidade de serem obtidas:
a) pelo menos 2 caras?
b) exatamente 2 caras?

capítulo 5 • 137
Usando o diagrama de árvore, temos:

CA CA CA EVENTO 1
CA CA Co EVENTO 2
CA Co CA EVENTO 3
Ca Co Co EVENTO 4
Co CA CA EVENTO 5
Co Ca Co EVENTO 6
Co Co Ca EVENTO 7
Co Co Co EVENTO 8

O espaço amostral tem 8 eventos elementares.


O evento A = obter pelo menos 2 caras tem 4 eventos elementares.
P(A) = 4/8 = ½ = 0,50 = 50%
O evento B = obter exatamente 2 caras tem 3 eventos elementares.
P(B) = 3/8 = 0,375 = 37,5%

5.4  Regras da soma, probabilidade


condicional e multiplicação

5.4.1  Regra da soma

Seja um espaço amostral finito S={a1, a2 ..., an}. Considere o evento formado por
um simples resultado A={ai}.
A cada evento simples está associada uma probabilidade pi que satisfaz às
seguintes condições:

pi ≥ 0
p1 + p2 + ... + pn = 1

A probabilidade P(A) de um evento composto (com mais de um elemento) é então


definida pela soma das probabilidades dos pontos de A.

138 • capítulo 5
Aplicando as regras das operações de união e interseção de conjuntos, os
eventos de um mesmo espaço amostral podem ser combinados. Assim, a pro-
babilidade de uma combinação de eventos pode ser obtida das probabilidades
dos eventos, como mostra a seguir a regra da soma de eventos:

Sejam dois eventos mutuamente excludentes A e B com probabilidades P(A) e


P(B). A probabilidade P(A ou B) de ocorrer A ou B é igual à soma das probabilidades
dos eventos:

P(A ou B) =P(A∪B) = P(A) + P(B)

Se A e B forem dois eventos quaisquer, então:

P (A ou E) = P (A∪A) = P (A) = P(B) – P (A∩B)

Na construção do espaço amostral de eventos não igualmente prováveis devem ser


atendidas as seguintes condições:
•  Os eventos do espaço amostral devem ser mutuamente excludentes e coletivamente
exaustivos (não ter elementos em comum e a soma dos elementos formar o espaço amostral).
•  A soma das probabilidades dos eventos deve ser igual a um.

Exemplo 24 – Calcule a probabilidade de, em um baralho, ser selecionada ao acaso uma


carta e ela ser de ouros ou uma figura.
P(ouros ou figura) = P(ouros) + P (figura) – P(ouros ∩ figura) = 13/52 + 12/52 –
3/52 = 22/52

Exemplo 25 – Ao retirar uma carta de um baralho de 52 cartas, qual é a probabilidade de


que essa carta seja vermelha ou um as?
P(V ou A)= P(V) + P(A) – P(V ∩ A)
‑Num baralho de 52 cartas, há 26 cartas vermelhas, 4 ases, dos quais 2 são vermelhos.

26 4 2 28
P( V ∪ A ) = + − = = 0, 5384 = 53, 84%
52 52 52 52

capítulo 5 • 139
Exemplo 26 – Calcular a probabilidade de ocorrer apenas uma cara nos três lançamento
seguidos de uma moeda.
Analisando na árvore de possibilidades apenas os eventos elementares E4, E6 e E7, há
uma cara.
P(E4 ou E6 ou E7) = P(E4) + P(E6) + P(E7) = 1/8 + 1/8 + 1/8 = 3/8 = 0,375 = 37,5%

Exemplo 27 – Continuando com os três lançamentos seguidos de uma moeda. qual a pro-
babilidade de ocorrerem duas ou mais caras?
Analisando na árvore de possibilidades apenas os eventos elementares E1, E2, E3 e E5,
há uma cara.
P(E1 ou E2 ou E3 ou E5) = P(E1) + P(E2) + P(E3) + P(E5) = 1/8+1/8+1/8+1/8
=4/8= 0,5 = 50%

Exemplo 28 – Na tabela de ocorrências, qual a probabilidade de os seguintes eventos


ocorrerem?

EVENTO
EVENTO TOTAL
C D
A 4 2 6
B 1 3 4
TOTAL 5 5 10

P(A)=
P(D)=
P(C∩B)=
P(A∪D)=
P(B∩D)=
P(B∪C)=

Solução:

P(A)= 6/10
P(D)= 5/10
P(C∩B)= 1/10
P(A∪D)= P(A) + P(D) – P(A∩D) = 6/10 + 5/10 – 2/10 = 9/10
P(B∩D)= 3/10
P(B∪C)= P(B) + P(C) – P(B∪C) = 4/10 + 5/10 – 1/10 = 8/10

140 • capítulo 5
5.4.2  Probabilidade condicional

A probabilidade de que aconteça o Evento X, tendo acontecido ou sabendo que


aconteceu o Evento Y, é obtida do novo espaço amostral definido pelo evento Y.
A probabilidade P(X/Y) é denominada probabilidade condicional de X dado
Y ou probabilidade de ocorrer X, tendo ocorrido Y.
A probabilidade condicional P(X/Y) entre os eventos X e Y pode ser obtida
como resultado da divisão da probabilidade conjunta P(X e Y) pela probabili-
dade do evento Y:

P(X/Y) = P(X e Y) / P(Y)

A base de referência muda do espaço amostral S para Y.


Observe que a P(X) = P(X∩S) / P(S) = P(X) / 1 = P(X) = P(X/S)
Troque S por Y e teremos a probabilidade condicional.

NCF( X ∩ Y )
P( X ∩ Y ) NTC NCF( X ∩ Y )
P( X / Y ) = = =
P( Y ) NCF( Y ) NCF( Y )
NTC

P(X/Y) = número de casos favoráveis a X interseção com Y, dividido pelo nú-


mero de casos favoráveis a Y:

NCF( X ∩ Y )
P( X / Y ) =
NCF( Y )

EXEMPLOS
Exemplo 29 – Em um baralho, tiramos uma carta preta. Qual a probabilidade de que esta
carta seja um ás?
Solução:
Lê-se da seguinte forma: dado que saiu uma carta preta, qual a chance de elal ser um ás?
P(ás/Preta) = P(ás ∩ Preta) / P(Preta) = (2/52) / (26/52) = 2/26 = 7,69%

capítulo 5 • 141
Exemplo 30
Dada a tabela de ocorrências, qual a probabilidade de os seguintes eventos ocorrerem?

EVENTO
EVENTO TOTAL
C D
A 4 2 6
B 1 3 4
TOTAL 5 5 10

P(A/D)=
P(C/B)=

Solução:

P(A/D)= P(A∩D) / P(D) = (2/10) / (5/10) = 2/5


P(C/B)= P(C∩B) / P(B) = (1/10) / (4/10) = 1/4

5.4.3  Regra da multiplicação

Por meio da definição de probabilidade condicional, pode-se enunciar o teore-


ma do produto:

A probabilidade de ocorrência simultânea de dois eventos A e B do mesmo es-


paço amostral é igual ao produto da probabilidade de um deles pela probabilidade
condicional do outro, dado o primeiro.

Apresentando de outra forma a probabilidade condicional, temos:

NCF( X ∩ Y )
P( X ∩ Y ) NTC NCF( X ∩ Y )
P( X / Y ) = = =
P( Y ) NCF( Y ) NCF( Y )
NTC

P( X ∩ Y )
P( X / Y ) =
P( Y )
P( X ∩ Y ) = P( X / Y ) ⋅ P( Y )

142 • capítulo 5
P(X e Y) = P(X/Y) . P(Y)
Um evento X é considerado independente de outro evento Y, se a probabi-
lidade de X for igual à probabilidade condicional de X dado Y, isto é, se P(X/Y)
= P(X).
Para eventos independentes então:
P(X e Y) = P(X) · P(Y)

EXEMPLOS
Exemplo 31 – Nos dez lançamentos seguidos de uma moeda honesta, ocorreram dez co-
roas. Se a moeda for lançada mais uma vez, qual a probabilidade de que seja cara?
A probabilidade de o evento X = ser cara continua sendo 50%, pois são eventos
independentes.

Exemplo 32 – Num lote de 12 peças, 4 são defeituosas. Duas peças são retiradas uma após
a outra sem reposição. Qual a probabilidade de ambas serem boas?
A={a primeira peça é boa}
B={ a segunda peça é boa}

8 7 14
P ( A ∩ B ) = P ( A ) ⋅ P (B / A ) = ⋅ = = 0, 424242
12 11 33

Exemplo 33 – Qual a probabilidade de ocorrerem três caras no lançamento de três moedas?


A probabilidade de cada lançamento é 0,50. São eventos independentes. A probabilida-
de de ocorrerem 3 caras é:
P(X e Y e Z) = P(X) · P(Y) · P(Z) = 0,5 · 0,5 · 0,5 = 0,125
Se usarmos a árvore de possibilidades, encontraremos 1/8 =0,125.
Ou

2 × 2 × 2 = 8

= 8 possibilidades
3 caras é apenas uma das 8 possibilidades è 1 em 8 è 1/8 = 0,125

capítulo 5 • 143
5.5  Teormea de Bayes
Agora que já estudamos a probabilidade condicional, podemos utilizar o teore-
ma de Bayes, uma importante ferramenta que relaciona a probabilidade condi-
cional com a sua inversa. É também conhecido como o teorema da probabili-
dade a posteriori.

O teorema de Bayes diz:


Sejam os eventos A1, A2, A3, ..., An , formados pela partição de um espaço amostral.
Esteja B contido nesse espaço amostral e sejam conhecidas P(Ai) e P(B/Ai), i=1, 2,
3, ..., n. Então:
P(Aj/B) = P(Aj) . P(B/Aj) , j = 1, 2, ..., n
∑ P(Ai) · P(B/Ai)
em que
P(Aj/B) é chamada de probabilidade posteriori.
P(Aj) é chamada de probabilidade a priori.
P(B/Aj) é a probabilidade condicional.
∑ P(Ai) · P(B/Ai) é a probabilidade total.

Vemos assim que o teorema de Bayes estabelece a razão entre uma das par-
celas da probabilidade total com a probabilidade total.
A melhor forma de entendê-lo é por meio de um exemplo prático.

EXEMPLOS
Exemplo 34 – Suponha que a previsão do tempo para o próximo feriado seja anunciada em
um jornal:
60% (ou 0,6) de probabilidade de chover;
30% (ou 0,3) de probabilidade de formação de neblina;
10% (ou 0,1) de probabilidade de fazer sol;
e que estudos tenham sido feitos a respeito do número de acidentes nas estradas em
diversas condições climáticas:
30% (0,3) de chance de ocorrerem acidentes em dias de chuva;
20% (ou 0,2) de chance de ocorrerem acidentes em dias com formação de neblina;
10% (ou 0,1) de chance de ocorrerem acidentes em dias de sol.

144 • capítulo 5
Você está programando uma viagem e resolve verificar qual a maior probabilidade de
ocorrerem acidentes nas estradas. Nesse momento, obviamente, lembra-se do teorema
de Bayes.
Inicialmente você calcula a probabilidade total. Para isso, multiplica a probabilidade a
priori de cada situação pela probabilidade condicional:

CHUVA: 0,6 X 0,3 = 0,18


NEBLINA: 0,3 X 0,2 = 0,06 Probabilidade total 0,25
SOL: 0,1 A X 0,1 = 0,01

Dessa forma, passa a calcular a probabilidade posteriori de cada evento:


Chuva: 0,18/0,25 = 0,72 ou 72%
Neblina: 0,06/0,25 = 0,24 ou 24%
Sol: 0,01/0,25 = 0,04 ou 4%

Nesse caso, os resultados encontrados para a probabilidade de ocorrência de acidentes


em cada situação já eram mais ou menos esperados, pois sabe-se que o perigo em dias de
chuva é muito maior que em dias de sol, além disso a probabilidade de chover nesse final de
semana era maior que as outras duas opções. Vamos, então, avaliar uma outra situação em
que também é possível utilizar o teorema de Bayes.

Imagine agora que você é o engenheiro responsável por uma linha de produção e está
avaliando o desempenho de três máquinas:
Máquina X, responsável por 50% da produção, fornece 1% das peças com defeito.
Máquina Y, responsável por 40% da produção, fornece 2% das peças com defeito.
Máquina Z, responsável por 10% da produção, fornece 3% das peças com defeito.
A empresa comprou uma máquina nova para substituir uma das três antigas e você pre-
cisa dizer qual delas deverá ser substituída. Na mesma hora, lembra-se do teorema de Bayes
e corre para sua mesa:
Inicialmente calcula a probabilidade total:

MÁQUINA X: 0,5 X 0,01 = 0,005


MÁQUINA Y: 0,4 X 0,02 = 0,008 Probabilidade total = 0,016
MÁQUINA Z: 0,1 X 0,03 = 0,003

capítulo 5 • 145
Em seguida, calcula a probabilidade posteriori de cada evento:
Máquina X; 0,005/0,0016 = 0,3125 ou 31,25%
Máquina Y: 0,008/0,016 = 0,5000 ou 50,00%
Máquina Z: 0,003/0,016 = 0,1875 ou 18,75%
Note que a máquina Y, que deverá ser substituída, não era uma opção óbvia, mas, graças
a Bayes, você garantiu o seu emprego.

ATIVIDADES
01. Considere todos os números naturais de 4 algarismos distintos (não pode repetir) que
se pode formar com os algarismos 1,3,4,7,8 e 9. Escolhendo um deles ao acaso, qual é a
probabilidade de sair um número que comece por 3 e termine por 7?

CASOS TOTAIS 6. 5. 4. 3 = n(S)=6.5.4.3=360=A6,4


CASOS FAVORÁVEIS 3 4 3 7 =n(A)=4.3=12=A4,2

02. Num grupo de 75 jovens, 16 gostam de música, esporte e leitura; 24 gostam de música
e esporte; 30 gostam de música e leitura; 22 gostam de esporte e leitura; 6 gostam somente
de música, 9 gostam somente de esporte; 5 gostam somente de leitura.
a) Qual a probabilidade de, ao apontar ao acaso um desses jovens, ele gostar de música?
b) Qual a probabilidade de, ao apontar ao acaso um desses jovens, ele não gostar de ne-
nhuma dessas atividades?

03. Um dado é jogado três vezes, uma após a outra. Pergunta-se:


a) Quantos são os números possíveis de construir em que os 3 algarismos obtidos sejam
diferentes? Nesse caso, a ordem gera um novo elemento.
b) Ao jogar 3 dados em sequência, assumindo a possibilidade de algarismos repetidos, qual
a probabilidade de a soma dos resultados ser maior ou igual a 16?

04. Escolha aleatoriamente (a expressão aleatório indica que os espaços são equiprováveis
– que cada ponto amostral tem a mesma probabilidade) uma carta do baralho com 52 cartas.
Seja A={a carta é de ouros} e B={a carta é uma figura}. Calcular:
a) P(A)
b) P(B)

146 • capítulo 5
05. Três cavalos A, B e C estão em uma corrida. A tem duas vezes mais probabilidade de
ganhar que B; B tem duas vezes mais probabilidade de ganhar que C. Quais são as probabi-
lidades de vitória de cada um? Qual seria a probabilidade de B ou de C ganhar? Não existe
a possibilidade de empate.

06. O quadro abaixo representa a classificação por sexo e por estado civil de um conjunto
de 50 deputados presentes em uma reunião:

ESTADO CIVIL HOMEM MULHER TOTAL


CASADO 10 8
SOLTEIRO 5 3
VIÚVO 7 5
DIVORCIADO 8 4
TOTAL
Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:
A = ser um homem;
B = ser uma mulher;
C = ser uma pessoa casada;
D = ser uma pessoa solteira;
E = ser uma pessoa viúva;
F = ser uma pessoa divorciada.
G = ser um homem divorciado
H = ser homem ou casados
I = ser uma mulher casada
J = ser mulher ou divorciados

07. O quadro abaixo representa a classificação por sexo e por estado civil de um conjunto
de 50 deputados presentes em uma reunião:

ESTADO CIVIL HOMEM MULHER TOTAL


CASADO 10 8 18
SOLTEIRO 5 3 8
VIÚVO 7 5 12
DIVORCIADO 8 4 12
TOTAL 30 20 50

Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:


P(Homem/casado)=
P(solteira/mulher)=
P(mulher/divorciado)=

capítulo 5 • 147
08. Sabendo que no lançamento de 3 moedas não aconteceram 2 nem 3 coroas, qual a
probabilidade de que as 3 moedas sejam caras?

09. Uma urna contém 3 bolas, duas verdes e uma branca. Duas bolas são retiradas em
sequência, uma por vez com reposição. Calcular a probabilidade de que a segunda bola seja
verde, sabendo que a primeira também foi verde.

10. Dois dados são lançados. Consideremos os eventos:


A={(x1;x2)/x1+x2=10}
B={(x1;x2)/x1>x2}
em que x1 é o resultado do dado 1 e x2 o resultado do dado 2.
Avaliar P(A), P(B), P(A/B) e P(B/A).

11. Em um colégio, os estudantes presentes em uma reunião foram classificados por sexo
e por opção de área de formação segundo o quadro a seguir:

SEXO
OPÇÃO
MASCULINO FEMININO
ADM 10 8
CC 6 5
ECO 8 4

Calcular as probabilidades (probabilidade condicional):


a) Sendo aluna, qual a probabilidade de optar por administração: P(ADM/F)?
b) Sendo aluno, qual a probabilidade de optar por economia: P(ECO/M)?
c) Sendo de ciências contábeis, qual a probabilidade de ser homem: P(M/CC)?
d) Sendo aluno, qual a probabilidade de optar por ciências contábeis: P(CC/M)?

12. Em uma caixa, temos 10 peças das quais 4 são defeituosas. São retiradas duas peças,
uma após a outra, com reposição. Calcular a probabilidade de ambas serem boas.

13. Num grupo de 100 pessoas da zona rural, 25 estão afetadas pela gripe A e 11 pela
gripe B, não se verificando nenhum caso de incidência conjunta de A e B. Duas pessoas
desse grupo são escolhidas aleatoriamente, uma após a outra, sem reposição. Determine a
probabilidade de que, dessa dupla, a primeira pessoa esteja afetada por A e a segunda por B.
Qual a probabilidade de a primeira ter gripe A e a segunda ter gripe B?

148 • capítulo 5
14. Uma urna contém 3 bolas pretas e 5 bolas brancas. Quantas bolas azuis devem ser
colocadas nessa urna de modo que, retirando-se uma bola ao acaso, a probabilidade de que
ela seja azul é igual a 2/3?

15. Considere agora que outra urna contenha 1 bola preta, 4 bolas brancas e x bolas azuis.
Uma bola é retirada ao acaso dessa urna, a sua cor é observada e a bola é devolvida à urna.
Em seguida, retira-se novamente, ao acaso, uma bola dessa urna. Para que valores de x a
probabilidade de que as duas bolas sejam da mesma cor vale ½?

16. Num lote de 12 peças 4 são defeituosas. Duas peças são retiradas aleatoriamente.
Calcule:
a) probabilidade de ambas serem defeituosas.
b) a probabilidade de ambas não serem defeituosas.
c) a probabilidade de ao menos uma ser defeituosa.

17. Uma máquina produziu 50 parafusos dos quais 5 ficaram defeituosos. Ao pegar, ao
acaso, 3 parafusos, qual é a probabilidade de que:
a) os três sejam perfeitos?
b) os 3 sejam defeituosos?
c) pelo menos dois sejam defeituosos?
d) pelo menos 1 seja defeituoso?

18. Um certo programa pode ser usado com uma entre duas sub-rotinas A e B, dependendo
do problema. A experiência tem mostrado que a sub-rotina A é usada em 40% das vezes e
B é usada em 60% das vezes. Se a sub-rotina A for usada, haverá 75% de chance de que o
programa chegue a um resultado dentro do limite de tempo. Se a sub-rotina B for usada, a
chance será de 50%. Considerando que o programa foi realizado dentro do limite de tempo,
qual a probabilidade de que a sub-rotina A tenha sido escolhida?

REFLEXÃO
O estudo de probabilidades que iniciamos neste capítulo tem muitas aplicações no dia a
dia do engenheiro. Até o momento, a nossa preocupação foi apresentar a teoria referente
ao assunto, no entanto as aplicações que podemos fazer do cálculo de probabilidades são
muito diversificadas: determinar a margem de erro e o grau de confiança de uma pesquisa,

capítulo 5 • 149
fazer previsões (com certo grau de confiança) de eventos futuros, auxiliar na tomada de
decisões, calcular riscos de certos investimentos, entre outros. Procure assimilar bem todos
os procedimentos e conceitos apresentados neste capítulo para que possa acompanhar o
desenvolvimento dos métodos que serão apresentados mais adiante.

LEITURA
Recomendamos a leitura do texto “É possível quantificar o acaso?”, disponível no endereço:
<http://www.klick.com.br/materia/20/display/0, 5912,POR-20-89-957-,00.html>, que
apresenta uma interessante situação sobre o estudo de probabilidades.

REFERÊNCIAS BIBLIOGRÁFICAS
DEVORE, Jay L. Probabilidade e estatística: para engenharia e ciências. São Paulo: Pioneira
Thomson Learning, 2006.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 2013.

150 • capítulo 5
6
Distribuições de
Probabilidade
Quando o espaço amostral de um experimento não é constituído por números,
não podemos usar os recursos da estatística descritiva (vimos na última aula
que espaço amostral é o conjunto formado por todos os possíveis e diferen-
tes resultados de um experimento aleatório.) Para resolver este caso, precisa-
mos estabelecer uma função que transforme o espaço amostral não numérico
em numérico.
Por exemplo, ao se lançar uma moeda e registrar a face superior, teremos
um espaço amostral S = {ca; co} não numérico.
Neste capitulo, veremos como transformar um espaço amostral não numé-
rico em numérico, estudando as variáveis aleatórias e suas funções de probabi-
lidade. Aprenderemos também a calcular a esperança matemática e a variância
de variáveis aleatórias.
Quando aplicamos a estatística na resolução de problemas, é comum veri-
ficar que algumas situações têm características semelhantes que se repetem.
Nesses casos, podemos estabelecer modelos matemáticos que nos ajudarão
nas soluções.
1. Os modelos trabalham com os seguintes componentes:
2. Os possíveis valores que a variável aleatória pode assumir.
3. A função de probabilidade associada a ela.
4. O valor esperado
5. A variância e o desvio padrão estimados

Aprenderemos a trabalhar e aplicar os modelos discretos de probabilidade:


a distribuição de Bernoulli, a distribuição binomial e a distribuição de Poisson.
Em seguida, aprenderemos a trabalhar e aplicar o modelo contínuo de pro-
babilidade: a distribuição normal. Estudaremos como consultar os valores de
probabilidades em uma tabela de curva normal e a usar as funções do Excel
para estes cálculos.

152 • capítulo 6
OBJETIVOS
Ao final deste capitulo, você deverá ser capaz de:
•  Definir uma variável aleatória.
•  Associar funções de probabilidade a variáveis aleatórias.
•  Calcular a esperança matemática e a variância de variáveis aleatórias.
•  Utilizar as propriedades e operações inerentes às variáveis aleatórias.
•  Aplicar modelos discretos de probabilidade.
•  Utilizar a distribuição de Benoulli para solucionar problemas.
•  Tomar decisões baseadas na aplicação da distribuição binomial para a resolução
de problemas.
•  Identificar o momento em que a distribuição de Poisson deve ser usada.
•  Calcular probabilidades baseadas na distribuição de Poisson.
•  Aplicar o modelo contínuo de probabilidade: distribuição normal.
•  Resolver problemas de probabilidade que envolvem a distribuição normal.
•  Interpretar o gráfico da distribuição normal.

capítulo 6 • 153
6.1  Variável Aleatória Discreta
Quando o espaço amostral S de um experimento não é constituído por núme-
ros, não podemos usar os recursos da estatística descritiva. Para resolver este
caso, estabelecemos uma função que transforme o espaço amostral não numé-
rico em numérico.

EXEMPLOS
Exemplo 1: ao lançarmos uma moeda e registrar a face superior, geramos um espaço amos-
tral S = {ca; co} → não numérico.

Criamos, então, uma função de x, representada por f(x), em que a variável aleatória x
assumirá valores numéricos correspondentes a cada ocorrência do espaço amostral.

S ___________ R
ca ___________ x(ca) = 0
co ___________ x(co) = 1

A variável aleatória x transformou o espaço amostral S = {ca; co} em um espaço amostral


numérico S = {0;1}.

Exemplo 2: no lançamento de dois dados, a observação das faces superiores cria o espaço
amostral S={(1,1), (1,2), ... , (3,1), (3,2), ..., (6,5), (6,6)}, que não é representado por um número
real. Para isso, estabelecemos a variável aleatória x que anota a soma das faces superiores
dos dois dados gerando o seguinte espaço amostral S = {2, 3, 4, 5 ,6, 7, 8, 9, 10, 11, 12}.

DADO 1 DADO 2 SOMA DADO 1 DADO 2 SOMA DADO 1 DADO 2 SOMA


1 1 2 3 2 5 5 3 8
1 2 3 3 3 6 5 4 9
1 3 4 3 4 7 5 5 10
1 4 5 3 5 8 5 6 11
1 5 6 3 6 9 6 1 7
1 6 7 4 1 5 6 2 8
2 1 3 4 2 6 6 3 9
2 2 4 4 3 7 6 4 10
2 3 5 4 4 8 6 5 11
2 4 6 4 5 9 6 6 12
2 5 7 4 6 10
2 6 8 5 1 6
3 1 4 5 2 7

154 • capítulo 6
Muitas variáveis aleatórias podem ser definidas para um mesmo experimento. A definição
da variável aleatória deve ser aquela que interessa à solução do problema abordado. No ex-
perimento anterior, poderíamos ter estabelecido, por exemplo, que x é a variável que anota o
produto das faces dos dois dados ou a diferença das faces ou quantas faces pares aparecem
e assim por diante.

6.1.1  Função de Probabilidade

Para cada variável aleatória, podemos definir uma função de probabilidade as-
sociada a ela.

EXEMPLOS
Exemplo 3: no lançamento de uma moeda, x é a variável aleatória que anota o número de
coroas obtidas. A função de probabilidade para esta variável é:

  X P(X)
CA 0 0,5
CO 1 0,5
  TOTAL 1

Exemplo 4: no lançamento de dois dados, a variável x anota a soma das faces superiores.
Sua função de probabilidade é:

FREQUÊNCIA
X FREQ. RELATIVA P(X)
SIMPLES
2 1 0,027778
3 2 0,055556
4 3 0,083333
5 4 0,111111
6 5 0,138889
7 6 0,166667
8 5 0,138889
9 4 0,111111
10 3 0,083333
11 2 0,055556
12 1 0,027778
TOTAL 36 1

capítulo 6 • 155
Sua representação gráfica é:

p(x)
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
2 3 4 5 6 7 8 9 10 11 12

6.2  Esperança Matemática e a Variância de


Variáveis Aleatórias

6.2.1  Valor Esperado de uma Variável Aleatória

Na estatística descritiva, trabalhamos com amostras e para elas calculamos a


média, a variância e o desvio padrão designados pelos seguintes símbolos: x, s2,
s (x barra, esse dois, esse). (x barra, esse dois, esse).
A variável aleatória será usada para estabelecer modelos teóricos de proba-
bilidade com a finalidade de descrever populações. Sua média, variância e o
desvio padrão serão designados pelos seguintes símbolos: µ, σ, σ2 (mi, sigma
dois, sigma).
O valor esperado da variável x, chamado de esperança matemática, por ser a
expectativa da média, é dado por:
µ = ∑ x i ⋅ p( x i ) = E( x ) = Média da variável aleatória x

em que
E(x) = expectativa de média = esperança matemática da variável x

156 • capítulo 6
Fazendo uma analogia com a fórmula da média de amostra e lembrando
que p(x) = número de casos favoráveis / número total de casos , temos:

∑ x i ⋅ fi = x ⋅ fi ⇒ x ⋅ p( x ) = µ
x= ∑ i n ∑ i i
∑ fi

Observe que:

x → depende das frequências, então é preciso realizar o experimento para poder


calcular seu valor; é calculada a posteriori.
µ → baseada no conceito de probabilidade, pode ser estabelecida antes da ocorrên-
cia da variável aleatória; é uma média a priori.

6.2.2  Variância de uma Variável Aleatória

A mesma analogia feita no item anterior para a média vale para a variância e
para o desvio padrão. Assim:

∑ ( x i − x )2 ⋅ fi → σ2 =
s2 =
n
∑ ( x i − µ)2 ⋅ p( x i ) = Variância
Para o desvio padrão a fórmula é: σ = ∑ ( x i − µ)2 ⋅ p( x i )

EXEMPLOS
Exemplo 5: no lançamento de uma moeda, a variável aleatória x anota o número de caras
obtidas. Calcule a média, a variância e o desvio padrão da variável aleatória x.

  X P(X) X.P(X) (X – MI)²P(X)


CO 0 0,5 0 0,125
CA 1 0,5 0,5 0,125
  TOTAL 1 0,5 0,25

MÉDIA MI = E(X) = 0,50


VARIÂNCIA 0,25
DESVIO PADRÃO 0,50

capítulo 6 • 157
Exemplo 6: no lançamento de dois dados, a variável aleatória x anota a soma dos pontos da
face superior. Calcule a média, a variância e o desvio padrão da variável aleatória x.

X FREQUÊNCIA P(X) X P(X) (X – MI)²P(X)


2 1 0,0278 0,0556 0,6944
3 2 0,0556 0,1667 0,8889
4 3 0,0833 0,3333 0,7500
5 4 0,1111 0,5556 0,4444
6 5 0,1389 0,8333 0,1389
7 6 0,1667 1,1667 0,0000
8 5 0,1389 1,1111 0,1389
9 4 0,1111 1,0000 0,4444
10 3 0,0833 0,8333 0,7500
11 2 0,0556 0,6111 0,8889
12 1 0,0278 0,3333 0,6944
TOTAL 36 1 7 5,8333

MÉDIA MI = E(X) = 7,0000


VARIÂNCIA 5,8333
DESVIO PADRÃO 2,4152

6.2.3  Propriedades do Valor Esperado

1 – Se uma variável assume um único valor K, então:

µ = ∑ x i ⋅ p( x i ) = K ⋅ 1 = K

O valor esperado de x é K.

2 – Se K for um número real constante e x uma variável aleatória


µ( K ⋅ x ) = K ⋅ µ( x )

3 – Se uma variável aleatória y for dada por y = ax+b, onde a e b são números
reais e x é outra variável aleatória, então: µ( y ) = a ⋅ µ( x ) + b

158 • capítulo 6
6.2.4  Propriedades da Variância

1 – Se uma variável aleatória x assume um único valor real K, então

σ2 = ∑ (k − k )2 ⋅ p(k ) = ∑ 02 ⋅ 1
σ2 = 0

2 – Se K pertence à real e x é uma variável aleatória, então:


σ2 (Kx ) = K 2 σ2 ( x )

3 – Se uma variável aleatória y for dada por y = ax+b, em que a e b são núme-
ros reais e x é outra variável aleatória, então:

σ2 ( y ) = a 2 σ2 ( x )

6.2.5  Soma de Variáveis Aleatórias

Há inúmeras situações em que temos que considerar uma variável aleatória


como a soma de outras variáveis aleatórias. Supondo as variáveis independentes:

A média da soma ou da diferença de duas ou mais variáveis aleatórias é igual à


soma ou à diferença das médias das variáveis aleatórias.

A variância da soma ou diferença de duas ou mais variáveis aleatórias é igual à


soma das variâncias dessas variáveis aleatórias.

µx± y = µx ± µ y
e
σ2 x ± y = σ2x + σ2y

σ x ± y = σ2x + σ2y

capítulo 6 • 159
EXEMPLO
Exemplo 7– Se a variável aleatória x apresentar µ( x ) = 10 e σ( x ) = 3 calcule:

µ( 3x )
µ(2x + 1)
µ(5x − 3)
3 4
µ( − x + )
5 3

µ( 3x ) = 3µ( x ) = 3.10 = 30
µ(2x + 1) = 2µ( x ) + 1 = 2.10 + 1 = 21
µ(5x − 3) = 5µ( x ) − 3 = 5.10 − 3 = 47
3 4 ( −18 + 4)
µ( − x + ) = −3 / 5µ( x ) + 4 / 3 = −3.2 + 4 / 3 = = −14 / 3
5 3 3

Seriam pontos de multiplicação (3 · 10) por exemplo?

Exemplo 8 – Se a variável aleatória x apresentar µ( x ) = 20 e σ( x ) = 3 calcule:

σ2 (2x )
σ2 (5x − 10)
σ2 ( −3x + 200)
2
σ2 ( x − 4)
5

σ2 (2x ) = 4.σ2 ( x ) = 4.9 = 36


σ2 (5x − 10) = 25.σ2 ( x ) = 25.9 = 225
σ2 ( −3x + 200) = ( −3)2 .σ2 ( x ) = 9.9 = 81
2
σ2 ( x − 4) = 4 / 25.σ2 ( x ) = 4 / 25.9 = 36 / 25
5

EXERCÍCIOS RESOLVIDOS
01. (MEDEIROS – v. 1, pág. 153, ex. 3) O experimento consiste no lançamento de duas
moedas e na observação do número de caras obtidas neste lançamento. Determine o espaço
amostral do experimento e a função de probabilidade.

160 • capítulo 6
02. (MEDEIROS – v. 1, pág. 154, ex. 4) O experimento consiste no lançamento de dois da-
dos e na observação da soma dos pontos das faces superiores. Determine o espaço amostral
do experimento e a função de probabilidade.

03. (MEDEIROS – vol. 1, pág. 156, ex. 8) O experimento consiste em lançar 3 moedas e ob-
servar a diferença entre o número de caras e o número de coroas obtidos neste lançamento.
Determine a função de probabilidade.

04. (MEDEIROS – vol. 1, pág. 156, ex. 9) O experimento consiste em retirar ao acaso uma
bola de uma urna que contém 20 bolas iguais em peso e volume, sendo 5 bolas brancas, 8
pretas e 7 amarelas, e anotar sua cor. Determine a função de probabilidade.

05. (MEDEIROS – vol 1, pág. 156, ex. 10) O espaço amostral de um experimento é
S={1,2,7,10}. Sabendo que as probabilidades de ocorrência destes valores são diretamente
proporcionais aos respectivos valores, determine a função de probabilidade associada a este
espaço amostral.

06. (Ex. 4 Medeiros 2 – pág. 16) No lançamento de dois dados, a variável aleatória x anota,
em módulo, a diferença dos pontos das faces superiores. Determine os valores de x e a fun-
ção de probabilidade associada.

07. (Ex. 6 Medeiros 2 – pág. 16) Uma carta é retirada aleatoriamente de um baralho comum
de 52 cartas e a variável X anota o número de damas obtidas nesta retirada. Determine os
valores de x e a função de probabilidade associada.

08. (Ex. 7 Medeiros 2 – pág. 17) Duas cartas são retiradas aleatoriamente, sem reposição,
de um baralho comum de 52 cartas e a variável X anota o número de valetes obtidos nesta
retirada. Determine os valores de x e a função de probabilidade associada.

09. (Ex. 8 Medeiros 2 – pág. 17) Uma urna A contém 3 bolas brancas e 2 pretas. A urna
B contém 5 bolas brancas e 1 bola preta. Uma bola é retirada ao acaso de cada urna e a
variável aleatória x anota o número de bolas brancas obtidas. Determine os valores de x e a
função de probabilidade associada.

10. (Ex. 9 Medeiros 2 – pág. 17) Uma urna A contém 3 bolas brancas e 4 pretas. A urna
B contém 2 bolas brancas e 3 bolas vermelhas. Uma bola é retirada ao acaso da urna A e

capítulo 6 • 161
colocada na urna B. Em seguida, retira-se ao acaso uma bola da urna B. A variável aleatória
x anota o número de bolas brancas obtidas nesta última extração. Determine os valores de x
e a função de probabilidade associada.

11. (Ex. 10 Medeiros 2 – pág. 17) Uma urna contém 3 peças boas e duas defeituosas.
Uma a uma as peças são retiradas da urna, sem reposição e analisadas. O experimento se
encerrará quando a segunda peça defeituosa for analisada. A variável aleatória x anota o
número de peças retiradas da urna ao se encerrar o experimento. Determine os valores de x
e a função de probabilidade associada.

12. (Ex. 1 Medeiros 2 – pág. 24) Calcule a média, a variância e o desvio padrão para a va-
riável aleatória x a seguir:
R: E(x)=5,2; Variância=6,96; Desvio padrão=2,64

X P(X)
2 0,3
5 0,4
8 0,2
10 0,1
Total  

13. (Ex. 2 Medeiros 2 – pág. 24) Calcule a média, a variância e o desvio padrão para a va-
riável aleatória x a seguir:
R: E(x)=0,4m; Variância=2,24; Desvio padrão=1,5

X P(X)
–1 0,4
0 0,2
1 0,2
3 0,2
Total  

14. (Ex. 4 Medeiros 2 – pág. 24) Uma confeitaria produz cinco bolos em determinado dia.
As probabilidades de não se vender nenhum e de se vender(em) um, dois, três, quatro ou
cinco valem respectivamente 1%, 5%, 20%, 30%, 29% e 15%. O custo total de cada bolo

162 • capítulo 6
é de 10 u.m. e o preço unitário de venda é de 20 u.m. Calcule o lucro médio, a variância e o
desvio padrão.

15. (Ex. 5 Medeiros 2 – pág. 24) Um negociante espera vender um automóvel até sexta
feira. A expectativa de que venda na segunda é de 50%, na terça de 30%, na quarta feira é
de 10%, na quinta é de 5% e na sexta é de 5%. Seu lucro é de 3 mil u.m. se vender na se-
gunda e diminui 40% a cada dia. Calcule o valor esperado de lucro nesta venda, a variância
e o desvio padrão.
R: E(x)=2.199,84 um; Variância=777.897,44 um²; Desvio padrão=881,98 um.

16. (Ex. 6 Medeiros 2 – pág. 24) Um produto deverá ser lançado no mercado no próximo
ano. A expectativa do departamento de marketing de que o projeto seja bem-sucedido é de
80%. Neste caso, o retorno esperado em sua vida útil é de 100 mil u.m. Se isto não acontecer,
o prejuízo deverá chegar a 50 mil u.m. Calcule o lucro médio, a variância e o desvio padrão.
R: E(x)=70.000,00 um Variância=3.600.000.000,00 um² Desvio padrão=60.000,00 um

17. (Ex. 7 Medeiros 2 – pág. 24) O trem do metrô para no meio do túnel. O defeito pode ser
na antena receptora ou no painel de controle. Se o defeito for na antena receptora o conserto
poderá ser feito em 5 minutos. Se o defeito for no painel, o conserto poderá ser feito em 15
minutos. O encarregado da manutenção acredita que a probabilidade do defeito ser no painel
é de 60%. Qual a expectativa do tempo de conserto?
R: E(x)=11 min.

18. (Ex. 8 Medeiros 2 – pág. 24) Um vendedor prepara quatro visitas e espera vender 1000
u.m. em cada uma delas. A expectativa de vendas em cada cliente é de 80%, independente-
mente. Qual o valor esperado de vendas deste vendedor?
R: E(x) = 3.200,00 u.m.

19. (Ex. 9 Medeiros 2 – pág. 24) Uma máquina fabrica placas de papelão que podem apre-
sentar nenhum, um, dois, três ou quatro defeitos, com probabilidade de 90%, 5%, 3%, 1% e
1% respectivamente. O preço de venda de uma placa perfeita é de 10 u.m. e, à medida que
apresente defeitos, seu preço cai 50% para cada defeito apresentado. Qual é o preço médio
de venda dessas placas?
R: E(x) = 9,34 u.m.

capítulo 6 • 163
20. (Ex. 10 Medeiros 2 – pág. 25) Uma prensa de fraldas descartáveis produz quatro mode-
los: A, B, C e D. A tabela a seguir anota as proporções fabricadas, a expectativa de vendas
de cada tipo, os lucros correspondentes e as peças vendidas. A peça não comercializada é
reaproveitada com um custo adicional. Qual o retorno esperado por unidade?

EXPECTATIVA DE LUCRO POR UNIDADE CUSTO ADICIONAL POR PROPORÇÃO NA


 
VENDA VENDIDA UNIDADE NÃO VENDIDA PRODUÇÃO TOTAL
A 70% 0,04 0,02 50%
B 80% 0,08 0,05 30%
C 60% 0,02 0,01 10%
D 60% 0,1 0,04 10%

21. (Ex. 1 Medeiros 2 – pág. 30) Uma variável aleatória x assume os valores 2; 3 e 5 com
probabilidades 0,30, 0,50, e 0,20 respectivamente. Calcule o valor esperado e o desvio
padrão de y = 2x +5.
(Ex. 2 Medeiros 2 – pág. 30) Dada a variável aleatória

X P(X)
–1 0,2
2 0,3
5 0,4
8 0,1
4
calcule a média e o desvio padrão da variável y = x−3
3

22. (Ex. 3 Medeiros 2 – pág. 30) Se a variável aleatória x apresenta µ( x ) = 8 e σ( x ) = 2


calcule:

µ( 2 x )
σ2 (2x )
µ( 3x − 2)
σ(4x − 3)

23. (Ex. 4 Medeiros 2 – pág. 30) Um produto é embalado em caixas de papelão que pesam
em média 200 gramas com desvio padrão de 10 gramas. Cada caixa contém seis unidades
do produto. O peso médio de cada unidade é 1 kg, com desvio padrão de 5 g. Calcule o peso
médio e o desvio padrão de uma caixa cheia.

164 • capítulo 6
24. (Ex. 5 Medeiros 2 – pág. 30) O custo fixo de produção de um bem é de 10.000 u.m. O
custo unitário variável de produção é uma variável aleatória com média de 5 u.m. e desvio
padrão de 0,2 u.m. O preço unitário de venda do bem é outra variável aleatória com média de
20 u.m e desvio padrão de 1,5 u.m. Determine:
a) o custo médio de produção para 1 000 unidades e o desvio padrão correspondente.
b) a receita média e o desvio padrão para 1 000 unidades vendidas.
c) o lucro médio e o desvio padrão para 1 000 unidades vendidas.

6.3  Modelos Discretos de Probabilidade.


6.3.1  Distribuição de Bernoulli

Se uma variável aleatória x:


•  só pode assumir os valores 0 e 1,
•  com P(x = 0) = q e P(x = 1) = p,
•  em que p é a probabilidade de sucesso e q a probabilidade de fracasso
•  com p + q = 1,

então a variável x admite a distribuição de Bernoulli.


Imagine uma variável que só pode assumir dois valores: zero e um e a pro-
babilidade de sair zero está associada ao fracasso, portanto ao valor q, e a pro-
babilidade de sair p e está associada ao sucesso do experimento. Construindo a
tabela a seguir, podemos calcular o valor da esperança matemática E(x) = p²q =
p².(1-p) da variância p² e do desvio padrão x da seguinte forma:

X P(X) X. P(X) (X - µ)² P(X)


0 q 0 p²q = p².(1-p)
1 p p (1-p)².p
TOTAL 100% P P².(1-P) + (1-P)².P

A esperança matemática ou média é:

m(x) = p

capítulo 6 • 165
Lembre que p = 1–q e que p+q = 1
σ² (x) = p²·(1-p) + (1-p)²·p =
σ² (x) = p(1–p) (p+(1–p)) =
σ² (x) = pq (p+q) = pq(1) =

A variância é σ²(x) = p · q

e o desvio padrão é: σ( x ) = p ⋅ q

Dessa forma, se for identificada a possibilidade de usar a distribuição de


Bernoulli, poderemos aplicar diretamente as fórmulas em vez de desenvolver
toda a tabela, como foi feito anteriormente.

Veja os exemplos a seguir:

EXEMPLOS
Exemplo 9 – No lançamento de uma moeda, a variável aleatória x anota o número de caras
obtidas. Determine a média, a variância e o desvio padrão da variável aleatória x.

Se a variável se interessar por caras, então sair cara é sucesso e está associado ao valor
1 com probabilidade p. Sair coroa é fracasso e está associado ao valor 0 e à probabilidade
q. Como só temos duas possibilidades igualmente prováveis, p e q assumirão o valor 05 ou
½. Este é um caso em que se pode aplicar o modelo de Bernoulli. É a única repetição de um
experimento que só pode assumir dois resultados: ou é cara ou não é cara. Então:

E( x ) = µ = p = 0, 5
σ2 ( x ) = p ⋅ q = 0, 5.0, 5 = 0, 25
σ( x ) = pq = 0, 25 = 0, 5

Exemplo 10 – No lançamento de um dado, a variável aleatória x anota o número de faces


3 obtidas neste lançamento. Determine a média, a variância e o desvio padrão da variável
aleatória x.

166 • capítulo 6
O problema informa que a variável registra o número de faces 3 obtidas. No lançamento
de um dado, podemos obter ou não a face 3. Os possíveis resultados de x são: 0 para não ser
cara com probabilidade q = 5/6 e 1 para ser cara com probabilidade p =1/6. Este é um
caso em que se pode aplicar o modelo de Bernoulli. Então:

E( x ) = µ = p = 1
6
1 5 5
σ ( x) = p ⋅ q = ⋅ =
2
6 6 36
5 5
σ( x ) = pq = =
36 6

Exemplo 11 – Uma carta é retirada ao acaso de um baralho com 52 cartas. A variável alea-
tória x anota o número de damas obtidas nesta retirada. Determine a média, a variância e o
desvio padrão da variável aleatória x.

A variável x se interessa por damas na extração de uma carta de um baralho. Esta carta
poderá então ser ou não ser dama. Os possíveis resultados de x são 1 ou 0 respectivamente,
com probabilidades de sucesso p =4/52 ou probabilidade de fracasso q=48/52 . Este é um
caso em que se pode aplicar o modelo de Bernoulli. Então:

E( x ) = µ = p = 4
52
4 48 1 12 12
σ2 ( x ) = p ⋅ q = ⋅ = ⋅ =
52 52 13 13 169
12 12
σ( x ) = pq = = = 26, 65%
169 13

6.3.2  Distribuição Binomial

Suponha a seguinte situação: determine a probabilidade de se obterem exata-


mente duas faces 4 em três lançamentos de um dado.
Estes eventos são mutuamente exclusivos e independentes (suas probabili-
dades são constantes, independentemente da repetição do experimento), en-
tão devemos calcular a soma das probabilidades de obter um 4, outro 4 e uma
carta qualquer em qualquer ordem que isto ocorra. Matematicamente, repre-
sentamos assim:

capítulo 6 • 167
P[(4 ∩ 4 ∩ n) ∪ (4 ∩ n ∩ 4) ∪ (n ∩ 4 ∩ 4)] =
1 1 5 1 5 1 5 1 1
= ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ =
6 6 6 6 6 6 6 6 6
2 1
1 5
= 3⋅  ⋅   = 0, 069 = 6, 9%
6 6

As probabilidades dos 3 casos são iguais. O que interessa é determinar


o número de casos que podemos formar. Este número pode ser calculado
por combinação:

n!
Cnx =
(n − x )! x !
3!
C32 = =3
(3 − 2)!2!

Como uma grande quantidade de problemas envolvem essas mesmas ca-


racterísticas, podemos construir um modelo estatístico teórico para resolvê-lo:
a distribuição binomial.

Descrição:
x : 0,1, 2,3,..., n
P( x = K ) = Cnk pk qn −k onde K = 0,1,..., n
µ( x ) = np
σ2 ( x ) = n ⋅ p ⋅ q
σ( x ) = n ⋅ p ⋅ q

A variável aleatória x representa o número de sucessos em n tentativas. X


assume valores inteiros maiores ou iguais a 0 e menores ou iguais a n.

0 ″ x″ n

Pode-se entender a distribuição binomial como n repetições de uma distri-


buição de Bernoulli. Por isso, a média e a variância ficam multiplicadas por n.

168 • capítulo 6
EXEMPLOS
Exemplo 12 – O gerente de uma loja estima que, de dez vendas realizadas, três são micro-
computadores e sete são equipamentos eletrônicos em geral. Qual a probabilidade de que
uma das quatro próximas vendas seja um microcomputador?

O experimento está interessado em vendas de microcomputadores. Isto é o sucesso.


Chamemos a venda de equipamento eletrônico de E e a venda de microcomputador
de M.
Os eventos elementares são = MEEE, EMEE, EEME e EEEM.
O problema informa que as probabilidades são 70% de vendas de equipamentos eletrô-
nicos e 30% de vendas de microcomputadores. Portanto:
•  p = 30%= 0,3 associada à venda do micro;
•  q = 70% = 0,7 associada à venda de equipamentos em geral.

Usando o cálculo de probabilidades, temos:

P(x=1) = P(MEEE)+ P(EMEE) + P(EEME) + P(EEEM) =


=0,7·0,7·0,7·0,3 + 0,7·0,7·0,7·0,3 + 0,7·0,7·0,7·0,3 + 0,7·0,7·0,7·0,3 = 4 · 0,73 ·0,31 =
= 0,4116 = 41,16%
Aplicando diretamente a fórmula da distribuição binomial, temos:

P( x = K ) = Cnkpk qn−k onde K = 0,1,..., n

4!
P( x = 1) = C14 0, 310, 73 = ⋅ 0, 31 ⋅ 0, 73 = 0, 4116 = 4116
, %
3!.1!

Chegamos ao mesmo resultado de maneira mais rápida, pois não foi preciso determinar
todas as combinações possíveis. Bastou calcular quantas eram as combinações possíveis.

Exemplo 13 – Uma prova é constituída de 20 questões, cada uma com cinco alternativas,
das quais apenas uma é correta. Se um estudante responder às questões ao acaso, qual a
probabilidade de acertar exatamente 10 questões?

capítulo 6 • 169
O experimento consiste em responder a uma questão.
Pode ter dois resultados:

Certo: com probabilidade P(C) = 1/5 = p


Errado: com probabilidade P(E) = 4/5 = q

n = 20 repetições independentes do experimento

Estamos interessados em 10 sucessos e (20–10)=10 fracassos, independentemente da


ordem de ocorrência, portanto temos um problema que se enquadra na distribuição binomial.

x : 0, 1, 2, 3, ..., 20
10 20 −10 10 20 −10
20  1   4 
p( x = 10) = Cnkpk qn−k = C10 =
20 !  1   4 
⋅   
   
5 5 10 !.10 !  5   5 
p( x = 10) = 184756.10 , 24 ⋅10−7 ⋅ 0,1073742 = 0, 2031%

Exemplo 14 – Uma empresa produz 10% de peças defeituosas. As peças são embaladas
em caixas que contêm 12 peças. Calcule a probabilidade de um cliente comprar uma caixa:
a) sem nenhuma peça defeituosa;
b) com uma peça defeituosa.

O experimento consiste em examinar uma peça.


Pode ter dois resultados:
Defeituosa: com probabilidade P(D) = 0,1= p
Boa: com probabilidade P(B) = 0,9 = q
n = 12 repetições independentes do experimento
Estamos interessados em defeitos, por isso detectar uma peça defeituosa é o sucesso
neste caso, portanto temos um problema que se enquadra na distribuição binomial.

a) Queremos zero defeito:

x : 0,12
, , 3,...,12
12 !
0 ( 0,1) ( 0, 9 ) . ( 0,1) ( 0, 9 )
0 12 0 12
P( x = 0) = Cnkpk qn−k = C12 =
0 !.12 !
P( x = 0) = 28, 24295%
ou
p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B)) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) = 0, 912

170 • capítulo 6
b) Queremos uma peça defeituosa:

x : 0,12
, , 3,...,12
12 !
1 ( 0,1) ( 0, 9 ) = . ( 0,1) ( 0, 9 )
1 11 1 11
P( x = 1) = Cnkpk qn−k = C12
1!.11!
P( x = 1) = 37, 65727%
ou
12.[p(D) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B) ∩ p(B)] =
= 12.0,1.0, 911

Exemplo 15 – Um levantamento efetuado na carteira de uma agência bancária indicou que


20% dos títulos eram pagos com atraso. Se em determinado dia foram pagos 20 títulos da
carteira, determine a probabilidade de que:
a) no máximo dois sejam pagos com atraso.
b) no mínimo três sejam pagos sem atraso.
c) mais de 70% sejam pagos sem atraso.

O experimento consiste em examinar um titulo.


Pode ter dois resultados:
Sem atraso: com probabilidade P(SA) = 0,8= q
Com atraso: com probabilidade P(CA) = 0,2 = p
n = 20 repetições independentes do experimento, portanto temos um problema que se
enquadra na distribuição binomial.

a) Estamos interessados em sucesso = com atraso. No máximo, dois títulos sejam pagos
com atraso, isto é, 0, 1 ou 2 títulos pagos com atraso em 20 títulos.

x : 0,12
, , 3,..., 20
P( x ≤ 2) = P( 0) + P(1) + P(2) =
= C20 0
0 0, 2 .0, 8
20 + C20 0, 21.0, 819 + C20 0, 22.0, 818 =
1 2
20 ! 20 ! 20 !
. ( 0, 2 ) ( 0, 8 ) + . ( 0, 2 ) ( 0, 8 ) + . ( 0, 2 ) ( 0, 8 ) =
0 20 1 19 2 18
=
0 !.20 ! 1!.19 ! 2 !.18 !
= 0, 0115292 + 0, 0576461+ 0,1369094 =
P( x ≤ 2) = 20, 6085%

capítulo 6 • 171
b) Considerando sucesso = sem atraso. Estamos interessados em que, no mínimo, três
títulos sejam pagos sem atraso. Neste caso, p=0,8 e q=0,2. Atenção, pois a situação se
inverteu.

x : 0,12
, , 3,..., 20
P( x ≥ 3) = 1− P( x ≤ 2) =
= 1− ( C20 0
0 0, 8 .0, 2
20 + C20 0, 81.0, 219 + C20 0, 82.0, 218 ) =
1 2
20 ! 20 ! 20 !
. ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) ) =
0 20 1 19 2 18
= 1− (
0 !.20 ! 1! .19 ! 2 !.18 !
= 1− (1.10−14 + 8, 4.10−131+ 3, 2.10−11) = 1− ( 0 + 0 + 0) =
P( x ≥ 3) = 1

c) Mais de 70% sejam pagos sem atraso! Considerando sucesso = sem atraso, estamos
interessados em 15 ou mais títulos sem atraso.
x : 0,12
, , 3,..., 20
p( x ≥ 15) = p( x = 15) + p( x = 16) + p( x = 17) + p( x = 18) + p( x = 19) + p( x = 20) =
20 0, 815.0, 25 + C20 0, 816.0, 24 + C20 0, 817.0, 23 + C20 0, 818.0, 22 + C20 0, 819.0, 21 + C20 0, 820.0, 20 ) =
= ( C15 16 17 18 19 20
20 ! 20 ! 20 ! 20 ! 20 !
. ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 ) + . ( 0, 8 ) ( 0, 2 )
15 5 16 4 17 3 18 2 19 1
=
15!.5! 16 !.4 ! 17!.3! 18 !.2 ! 19 !.1!
20 !
. ( 0, 8 ) ( 0, 2 ) =
20 0
+
20 !.0 !
= 0,1746 + 0, 2182 + 0, 2054 + 0,1369 + 0, 0576 + 0, 0115 = 80, 42%

ATIVIDADES
Todos os exercícios propostos estão resolvidos na planilha anexa.

01. No lançamento de um dado, a variável aleatória x anota o número de face 4 obtido. De-
termine a média, a variância e o desvio padrão da variável aleatória x.

02. Uma urna contém 15 bolas brancas e 25 bolas vermelhas. Uma bola é retirada ao acaso
e a variável x anota o número de bolas brancas obtidas. Determine a média, a variância e o
desvio padrão da variável aleatória x.

172 • capítulo 6
03. Uma caixa contém 12 canetas das quais 5 são defeituosas. Uma caneta é selecionada
ao acaso e a variável x anota o número de canetas defeituosas obtidas. Determine a média,
a variância e o desvio padrão da variável aleatória x.

04. Um lote contém 50 peças boas e 5 defeituosas. Uma peça é retirada deste lote e a variá-
vel aleatória x anota o número de peças defeituosas obtidas. Determine a média, a variância
e o desvio padrão da variável aleatória x.

05. Uma variável aleatória admite distribuição de Bernoulli com variância 0,24. Sabendo que
a média da variável aleatória x é maior que 0,5, determine esta média.

06. Uma empresa contratou uma agência de publicidade para fazer dois anúncios. A empre-
sa definiu critérios para aferir o sucesso de cada anúncio. Desta forma, o resultado de cada
anúncio poderá ser o fracasso ou o sucesso. Para cada anúncio com sucesso, a agência
receberia R$ 100.000,00. A agência nada receberia no caso de fracasso. A empresa quer
planejar o gasto com esta agência de publicidade. Acredita que a probabilidade de sucesso
em cada anúncio é de 1/6 e que há independência entre os sucessos dos anúncios.
a) Encontre a função de probabilidade (distribuição de probabilidades) do gasto com
a agência.
b) Calcule o gasto médio esperado com a agência.
c) Calcule a variância e o desvio-padrão do gasto no dia com a agência.

07. Uma das maiores frustrações do comércio varejista norte-americano é o abuso de clien-
tes em relação a políticas de troca e devolução de mercadorias. Em um ano recente, as
devoluções de mercadorias representaram 13% das vendas em lojas de departamento. Con-
sidere uma amostra de 20 consumidores que tenham feito compras em uma loja de departa-
mentos. Utilize o modelo binomial para responder às seguintes perguntas:
a) Qual é o valor esperado, ou a média aritmética, da distribuição binomial?
b) Qual é o desvio padrão da distribuição binomial?
c) Qual é a probabilidade de que nenhum dos 20 consumidores venha a efetuar devolução
de mercadoria?
d) Qual é a probabilidade de que não mais de 2 consumidores venham a efetuar devolução
de mercadoria?

capítulo 6 • 173
e) Qual é a probabilidade de que 3 ou mais dos consumidores venham a efetuar devolução
de mercadoria?

08. Em uma pesquisa realizada pela Sociedade de Administração de Recursos Humanos,


68% dos trabalhadores afirmaram que os empregadores têm o direito de monitorar o uso dos
telefones na empresa. Suponha que seja selecionada uma amostra aleatória de 20 trabalha-
dores e que lhes seja perguntado se os empregadores têm o direito de monitorar o uso dos
telefones na empresa. Qual é a probabilidade de que:
a) 5 ou menos desses trabalhadores concordem?
b) 10 ou menos desses trabalhadores concordem?
c) 15 ou menos desses trabalhadores concordem?

09. O gerente de controle de qualidade da Biscoitos Nestle está inspecionando um lote de


biscoitos com gotas de chocolate que acabou de ser assado. Se o processo de produção es-
tiver sob controle, a média aritmética do número médio de gotas de chocolate por biscoito é
6,0. Qual é a probabilidade de que em um determinado biscoito que está sendo inspecionado:
a) sejam encontradas menos de cinco gotas de chocolate?
b) sejam encontradas exatamente cinco gotas de chocolate?
c) sejam encontradas cinco ou mais gotas de chocolate?
d) sejam encontradas quatro ou cinco gotas de chocolate?

10. Uma firma exploradora de petróleo acha que 5% dos poços que perfura acusam depo-
sito de gás natural. Se ela perfurar 6 poços, determine a probabilidade de:
a) nenhum poço ter gás natural.
b) dois poços terem gás natural.
c) dois ou menos poços terem gás natural.

11. Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam pedi-
dos sem mostarda. Se 7 pessoas pedem cachorro-quente, determine a probabilidade de que:
a) todos queiram mostarda.
b) 5 pessoas queiram mostarda.
c) 5 ou mais pessoas queiram mostarda.

174 • capítulo 6
6.3.3  Distribuição de Poisson

A distribuição de Poisson é útil para descrever probabilidades do número de


ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço).
Exemplos de variáveis que podem usar o modelo da distribuição de Poisson
são: defeitos por centímetro quadrado, acidentes por dia, clientes por hora,
chamadas telefônicas por minuto, vacas por acre e assim por diante. Note que a
unidade de medida, tempo ou área é contínua, mas a variável aleatória (número
de ocorrências) é discreta.
Aprenderemos como trabalhar com a distribuição de Poisson e estudare-
mos como calcular a distribuição de Poisson baseados no conhecimento da
distribuição binomial.
Uma aplicação imediata da distribuição de Poisson ocorre quando uma
variável aleatória admite distribuição binomial com número n de repetições
muito grande (n ≥ 100) e com probabilidade p de sucesso muito pequena (p <
0,05) ou média = np ≤ 10. Distribuições binomiais com probabilidade de suces-
so menor que 0,5 têm inclinação para a direita e serão tanto mais inclinadas
quanto maior for a probabilidade p de tender a zero. Assim, se a probabilidade
p for muito pequena e o número de experimentos for muito grande, no limite,
teremos a distribuição de Poisson.
A distribuição de Poisson descreve a contagem x de ocorrências de um even-
to definido em intervalos fixos, finitos de tempo ou espaço, nos seguintes casos:
•  As ocorrências são todas independentes, isto é, a ocorrência de um evento
não muda a probabilidade de outro ocorrer.
•  A probabilidade de uma ocorrência é a mesma em todos os interva-
los possíveis.

Como a distribuição de Poisson descreve eventos aleatórios independen-


tes, ela serve de indicador para os casos em que a variável se afasta substan-
cialmente do que seria esperado neste modelo. Assim, por exemplo, quando a
contagem dos casos de meningite em uma cidade excede o que seria razoável
de se esperar de uma distribuição de Poisson, podemos concluir que os casos
de meningite não são distribuídos aleatória e independentemente, mas sim
que sugerem a configuração de um surto epidêmico.
Assim a distribuição de Poisson é tipicamente usada para descrever fenô-
menos aleatórios raros.

capítulo 6 • 175
A distribuição de Poisson fica completamente caracterizada por um único
parâmetro: a média do processo. Se uma variável aleatória VA mostrar resulta-
dos distribuídos segundo Poisson e conhecendo a média de ocorrências por
unidade de tempo ou espaço, podemos determinar a probabilidade de qual-
quer resultado usando as tabelas ou as fórmulas a seguir.
Uma variável aleatória x admite distribuição de Poisson se:
x : 0,1, 2,3,..., n
e − λ λ k e − λt ( λ t )k
p( x = K ) = =
k! k!
onde.K = 0,1,..., n
µ(( x ) = E( x ) = λ = np
σ2 ( x ) = λ
σ( x ) = λ
e− λ λ k
Cnk pk qn −k ≈
k!

Onde:
•  x é o número de ocorrências (sucessos).
•  l – lambda – é a taxa média por unidade de medida, ou seja, é a taxa de
frequência por unidade de tempo ou área.
•  t é o número de unidades, tempo ou área.
•  l t – a quantidade l t representa o número médio de ocorrências no in-
tervalo t.

Como a média e a variância da distribuição de Poisson são iguais, quando a


média de ocorrências for elevada a variância também o será. Isto fará com que
a distribuição se torne achatada, ampla e larga. Observe na planilha 09poisson.
xls as abas lambda 2, lambda 3 e lambda 5. Nelas, geramos números aleatórios
conforme a distribuição de Poisson. À medida que lambda aumenta, o histo-
grama caminha de uma assimetria à direita para uma curva simétrica, isto é, à
medida que a média aumenta, ela se desloca para o centro da distribuição.
A distribuição de Poisson, além da utilização para o cálculo aproximado da
distribuição binomial, tem vasta aplicação em problemas de fila de espera, con-
trole de estoques, controle de qualidade, programação de equipamentos etc.

176 • capítulo 6
Vejamos os exemplos a seguir:

EXEMPLOS
Exemplo 16 – Uma máquina produz nove peças defeituosas a cada 1 000 peças produzidas.
Calcule a probabilidade de que em um lote que contém:
a) 200 peças, sejam encontradas oito peças defeituosas;
b) 500 peças, não haja nenhuma peça defeituosa.
Solução:
Experimento = examinar um peça.
Pode ter dois resultados: p = 1 – q
Defeituosa = sucesso = com probabilidade p(D) = 9 / 1 000 = 0,009 = 0,9%= p
Normal = fracasso = com probabilidade p(N) = 1 – 0,009 = 0,991 = q

a) n = 200 repetições independentes do experimento. Queremos K=8 sucessos e 192


fracassos, independentemente da ordem de ocorrência.

λ = np = 200.0, 009 = 18
,
e − λ λk 2, 718281−18
, .18
, 8
p( x = 8) = = = 0, 00045 = 0, 045%
k! 8!

b) n = 500 repetições independentes do experimento. Queremos k = 0 sucesso:

λ = np = 500.0, 009 = 4, 5
e − λ λk 2, 718281−4,5.4, 50
p( x = 0) = = = 0, 0111 = 111
, %
k! 0!

Exemplo 17 – Supondo que o número de carros que chegam a uma fila do guichê de um pe-
dágio tenham distribuição de Poisson a uma taxa de três por minuto, calcule a probabilidade
de que cheguem cinco carros nos próximos dois minutos.
Solução:
Calcule a taxa lambda para os dois minutos solicitados no problema. Depois, calcule a
probabilidade de que ocorram 5 sucessos nos próximos 2 minutos.

λ = np = 3carros/minutos= 6carros/2minutos
e − λ λk 2, 7182
281−6.65
p( x = 5) = = = 0,1606 = 16, 06%
k! 5!

capítulo 6 • 177
Exemplo 18 – Um tear produz um defeito a cada 200 m de tecido produzido. Se o número
de defeitos admitir a distribuição de Poisson, calcule a probabilidade de:
a) uma peça com 20 m não apresentar defeitos;
b) um lote de 10 peças de 20 m cada apresentar exatamente um defeito.
Solução:
a–
λ = np = 1defeito / 200metros = 0,1defeito / 20metros = 0,1defeito / pe a
e − λ λk 2, 718281−0,1.0,10
p( x = 0) = = = 0, 9048 = 90, 48%
k! 0!
b–
λ = np=10.0,1defeito/20metros=1defeito/pe a
e − λ λk 2, 718281−1.11
p( x = 1) = = = 0, 3679 = 36, 79%
k! 1!

Exemplo 19 – Um processo mecânico produz tecido para tapetes com uma média de dois
defeitos por metro. Determine a probabilidade de um metro quadrado ter exatamente um
defeito, admitindo que o processo possa ser bem aproximado pela distribuição de Poisson.
Solução:
l = 2, então:

e − λ λk 2, 718281−2.21
p( x = 1) = = = 0, 270 = 27%
k! 1!

Exemplo 20 – Suponhamos que os navios cheguem ao porto à razão de l=2 navios/hora


e que essa razão seja bem aproximada pelo processo de Poisson. Observando o processo
durante um período de meia hora (t=1/2), determine a probabilidade de:
a) não chegar nenhum navio.
b) chegarem 3 navios.
Solução:
A média é de 2 navios por hora. Para meia hora, a taxa de chegada de navios l = 1 navio.
l = µ t = 2. ½ = 1, então e-1 = 0,368

e − λ λk 2, 718281−1.10
p( x = 0) = = = 0, 368 = 36, 8%
k! 0!
e − λ λk 2, 718281−1.13
p( x = 3) = = = 0, 061 = 6,1%
k! 3!

178 • capítulo 6
Exemplo 21 – Suponhamos que os defeitos em fios para tear possam ser aproximados pelo
processo de Poisson com média de 0,2 defeitos por metro (l=0,2). Inspecionando-se peda-
ços de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 defeitos
(isto é, 0 ou 1).
Solução:
l = 0,2 /metro = 1,2/6 metros = 1,2/peça, então:

2, 718281−12 , 0 2, 718281−12
, .12 , .12
, 1
p( x ≤ 1) = p( 0) + p(1) = + = 0, 301+ 0, 301.12
, = 66, 22%
0! 1!

Exemplo 22 – As lâmpadas de iluminação da área de manufatura da montadora são subs-


tituídas numa média de 8 lâmpadas por dia. Se a distribuição de frequências das lâmpadas
substituídas for do tipo Poisson:
a) qual a probabilidade de amanhã serem substituídas cinco lâmpadas?
b) qual a probabilidade de amanhã serem substituídas no máximo cinco lâmpadas?
Solução:

e − λ λk 2, 718281−8.85
p( x = 5) = = = 0, 0916 = 9,16%
k! 5!
5 5
e − λ λk e −8 8k
p( x ≤ 5) = ∑ =∑ = 0,1912
k =0 k ! k =0 k !

Exemplo 23 – O erro de digitação cometido pelos caixas é de 0,35 por hora.


a) Qual a probabilidade de que um caixa cometa dois erros numa hora?
Solução:

e − λ λk 2, 718281−0,35.0, 352
p( x = 2) = = = 0, 04316 = 4, 316%
k! 2!

capítulo 6 • 179
ATIVIDADES
12. O gerente de controle de qualidade da Nestlé está inspecionando um lote de biscoitos
com gotas de chocolate que acabou de ser assado. Se o processo de produção estiver sob
controle, a média aritmética do número médio de gotas de chocolate por biscoito será 6,0.
Qual é a probabilidade de que em um determinado biscoito que está sendo inspecionado:
a) sejam encontradas menos de cinco gotas de chocolate?
b) sejam encontradas exatamente cinco gotas de chocolate?
c) sejam encontradas cinco ou mais gotas de chocolate?
d) sejam encontradas quatro ou cinco gotas de chocolate?

13. Com base em experiências do passado, pressupõe-se que o número de imperfeições


por metro em rolos de papel do tipo 2 segue a distribuição de Poisson, com média de 1 im-
perfeição para cada 5 metros de papel (0,2 imperfeições por metro). Qual é a probabilidade
de que em:
a) um rolo de papel com 1 metro haja pelo menos 2 imperfeições?
b) um rolo de papel com 12 metros haja pelo menos 1 imperfeição?

14. A caxumba é uma infecção viral suave e assintomática em até 20% dos indivíduos in-
fectados, no entanto podem surgir complicações que provocam até a surdez e a infertilidade.
Por isso, a vacinação é muito importante. No estado do Ceará, o número médio de casos
mensais relatados é de cerca de 0,1 no mesmo período. Em relação a esses casos mensais,
de acordo com a distribuição de Poisson, qual a probabilidade de que em um mês não haja
mais que um caso de caxumba?

15. Em um período recente de 100 anos, houve 93 terremotos de pelo menos 6° na escala
Richter. Suponha que a distribuição de Poisson seja um modelo adequado para esta variável.
a) Calcule o número médio de terremotos com grau maior que 6 por ano.
b) Se P(x) é a probabilidade de x grandes terremotos por ano, calcule P(0), P(1), P(2),
P(3), P(4), P(5), P(6) e (7).

180 • capítulo 6
6.4  Modelo Contínuo de Probabilidade

6.4.1  Distribuição Normal

Conforme visto anteriormente, uma variável pode ser categórica (qualitativa)


ou numérica (quantitativa). Dentre as variáveis numéricas, podemos encontrar
as discretas e as contínuas. O foco da nossa última aula está nas variáveis contí-
nuas, que, como sabemos, são aquelas obtidas por meio de medições, podendo
gerar infinitos números ou valores em intervalos. Como exemplos de experi-
mentos que geram variáveis aleatórias contínuas, podemos citar o peso de 100
pessoas, o tempo entre as chegadas de carros de corrida, as horas trabalhadas
por dia ou a despesa com alimentação ao longo de um ano.
Vimos, nas últimas aulas, alguns modelos de distribuição discreta e agora
veremos um modelo de distribuição contínua de probabilidade, a distribuição
normal, também conhecida por distribuição gaussiana.
A distribuição normal é a base da inferência estatística e pode descrever di-
versos processos e fenômenos, sendo também utilizada para aproximar algu-
mas distribuições discretas.

6.4.2  Probabilidade de uma Variável Aleatória Contínua

6.4.2.1  Função Densidade


A função densidade de probabilidade correlaciona cada valor x à sua frequência
correspondente f(x):

Frequência

(Valor, frequência)
f(x)

x
a
Valor

capítulo 6 • 181
6.4.2.2  Cálculo da Probabilidade

Como x varia de um valor a até um valor b, a integral de f(x) em relação a x, va-


riando de a até b, é igual à área total sob a curva: ƒ f(x)dx = 1 para f(x) ≥ 0 e a ≤
x ≤ b. A probabilidade de uma variável contínua é dada pela área sob a curva,
conforme ilustrado na figura a seguir:
d
P(c ≤ x ≤ d) = ∫ c f(x)dx
f(x)

I
x
a c d

6.4.2.3  Curva Normal

A função densidade que define a curva da distribuição normal é dada por:


1 2
1  X − µx 
f (x) = e  
2πσ2x 2
σx 

•  f(x) = função de densidade padrão


•  π = 3.14159; e = 2.71828
•  σx = desvio-padrão populacional
•  X = valor da variável aleatória (– < X < )
•  µx= média populacional

A curva característica da distribuição normal tem forma de sino e é simé-


trica em relação à média, que se encontra na mesma posição que a moda e
a mediana.

f(x)

Média
Moda
Mediana

182 • capítulo 6
À direita da posição central, onde é marcado o valor da média, encontra-se
o desvio padrão e somado a ela, à esquerda, encontra-se o desvio padrão sub-
traído da média.

Média (µ)
Desvio - Padrão (σ)

σ σ

x
µ–σ µ µ+σ

Se a média aumentar ou diminuir, veremos a curva transladando ("andan-


do") respectivamente para a esquerda ou para a direita. Já o desvio padrão é
responsável pelo espalhamento da curva; se o valor do desvio padrão aumentar,
a curva ficará mais aberta, caso contrário, mais fechada. Podemos observar na
figura os efeitos da variação da média e do desvio padrão sobre a curva normal.

f(X)
B

A C

As curvas A e B representam distribuições com a mesma média, pois estão


localizadas exatamente no mesmo ponto do eixo x e essa média é menor que a
da distribuição representada pela curva C, uma vez que a média de C está de-
pois do ponto onde estão A e B. Já o desvio padrão de A e C são iguais, pois a
abertura das curvas é a mesma em ambos os casos e, ao mesmo tempo, maior
que da curva B, indicando que o desvio padrão da distribuição representada
pela curva B é menor que das outras duas.

capítulo 6 • 183
Como vimos no item anterior, a probabilidade de uma distribuição contí-
nua é obtida pelo cálculo da área sob a curva definida por sua função densida-
de, cálculo esse efetuado com auxílio de integrais. Para facilitar esse processo,
foi criada uma tabela onde pode-se encontrar valores já calculados para essas
probabilidades.
Você deve estar se perguntando como isso é possível, pois, se para cada
par de valores de média e de desvio padrão existe uma curva diferente, teriam
de existir infinitas tabelas com diferentes resultados para a área sob cada cur-
va. A solução encontrada para esse problema foi a utilização de uma fórmula
para transformar qualquer curva normal em uma curva normal padronizada,
com média igual a zero e desvio padrão igual a 1, resultando em uma única
tabela com as probabilidades referentes a essa distribuição padronizada. A
esta fórmula usada para calcular o valor de Z damos o nome de transformada
Z. Desta forma, para qualquer valor de x, média e desvio padrão, a informação
resultante de Z informa quantos desvios padrões existem entre a média e o
valor de x.

X − µx
Z=
σx

Distribuição Distribuição
normal normal padronizada
σx σz = 1

x z
µx µz= 0
Uma tabela!

A partir de agora trabalharemos com todos os exemplos sempre partindo da


distribuição normal com média 5 e desvio padrão 10.
Vamos entender como essa fórmula deve ser utilizada no exemplo a seguir.
Imagine uma distribuição normal, cuja média seja igual a 5 e desvio padrão
igual a 10, e seja necessário calcular a probabilidade de se encontrar um valor
entre 5 e 6,2. Ao substituir 6,2 por x, 5 no lugar de µ e 10 no lugar de σ, vamos
calcular o valor de z:

184 • capítulo 6
X − µx 6 ⋅2 − 5
Z= = = 12
σx 10

Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1

x z
µx = 5 6.2 µz= 0 .12

A nova área a ser calculada estará compreendida entre 0 e 0,12, mas, na ver-
dade, não precisará ser calculada, pois o resultado já se encontra na tabela. Veja
como encontrar o valor dessa probabilidade na próxima figura:

Tabela de probabilidade
normal padronizada

z .00 .01 .02

0.0 .0000 .0040 .0080 σz = 1


0.1 .0398 .0438 .0478 .478
0.2 .793 .0832 .0871
z
0.3 .1179 .1217 .1255 µz= 0 .12
Probabilidades

O valor encontrado para z foi 0,12. Esse número deve ser desmembrado, fa-
zendo-se um corte após o primeiro algarismo à direita da vírgula: 0,12 = 0,1 +
0,02. Toma-se, então, a primeira parte do número, nesse caso 0,1, e percorre-se
a primeira coluna até encontrá-lo. Ao chegar à linha onde está localizado 0,1,
caminhe sobre ela até chegar à direção do 0,02. O valor aí encontrado represen-
ta a área sob a curva entre 0 e 0,12 ou a probabilidade de se obter um valor entre
0 e 0,12, correspondentes a 5 e 6,12 no problema inicial. Na tabela, as probabi-
lidades são dadas em decimal, nesse exemplo, o resultado foi 0,0478 ou 4,78%.
É importante aqui destacar que mesmo se o valor de z for um número nega-
tivo, a área sob a curva será positiva e encontrada da mesma maneira que acaba-
mos de ver. Ainda no exemplo anterior, caso você quisesse calcular a probabili-
dade de se encontrar um valor entre 3,8 e 5, ao substituir os dados na fórmula,

capítulo 6 • 185
encontraria z = – 0,12, mas você iria utilizar apenas o módulo desse resultado
para consultar a tabela: 0,12 e acabaria encontrando a mesma probabilidade
de 0,0478.

X − µx 3 ⋅8 − 5
Z= = = 12
σx 10

Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.478

x z
3.8 µx = 5 –.12 µz= 0

Vamos calcular agora a probabilidade de se encontrar um valor entre 2,9


e 7,1. Observe que os valores encontrados na tabela são todos calculados em
relação ao ponto central da curva, onde se localiza a média. Dessa forma, não
é possível calcular de uma só vez essa probabilidade. Primeiramente, devemos
encontrar a probabilidade de se encontrar um valor entre 2,9 e 5 e, depois, en-
contrar a probabilidade de se encontrar um valor entre 5 e 7,1, para então so-
mar os dois resultados.

P ( 2 .9 ≤ X ≤ 7 .1 )
X − µx 2, 9 − 5
Z= = = −21
σx 10
X − µx 7,1 − 5
Z= = = −21
σx 10

Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.1664

x z
2.9 5 7.1 –.21 0 .21

Vamos a mais um caso que ainda pode ser estudado no mesmo exemplo.
Vamos supor que seja necessário calcular a probabilidade de obter valores
maiores que 8 nessa distribuição. Lembrando que os valores da tabela são

186 • capítulo 6
referências ao centro da curva, calcula-se primeiramente a probabilidade de se
obter um valor entre 5 e 8, para depois então subtrair esse valor de 0,5, corres-
pondente à metade da área sob a curva.

P ( X ≥ 8)
X − µx 8−5
Z= = = 30
σx 10

Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.5000
.1179
.3821

x z
µx = 5 8 µz = 0 .30

Agora, vamos transportar o que aprendemos para uma situação real.

Você trabalha no setor de Controle de Qualidade da GE. A vida útil de uma


lâmpada tem distribuição normal com media µx= 2.000 horas e desvio padrão
µx=200 horas. Qual é a probabilidade de uma lâmpada durar:
a) entre 2.000 e 2.400 horas?
b) menos de 1.470 horas?

a) Como a vida útil média das lâmpadas da GE é de 2.000 horas, a proba-


bilidade de encontrar uma lâmpada que dure entre 2.000 e 2.400 horas pode
ser obtida diretamente da tabela de distribuição normal padronizada, sem ne-
nhum cálculo secundário:

P ( 2.000 ≤ X ≤ 2.400 )
X − µx 2.400 − 2.000
Z= = = 2, 0
σx 200

Distribuição Distribuição
normal normal padronizada
σx = 200 σz = 1
.4772

x z
µx = 2000 2400 µz= 0 2.0

capítulo 6 • 187
b) Já para a probabilidade de a vida útil da lâmpada ser menor que 1.470
horas, devemos inicialmente fazer o cálculo em relação à média (2.000 horas) e
depois subtrair o resultado de 50%.

P ( X ≤ 1.470 )
X − µx 1.470 − 2.000
Z= = = −2,65
σx 200

Distribuição Distribuição
normal normal padronizada
σx = 200 σz = 1
.5000
.0040 .4960

x z
1470 µx = 2000 –2.65 µz = 0

Ainda pode existir uma situação inversa, em que se conhece a probabilidade


e deseja-se saber para que valor ela existe.

Tabela de probabilidade
Qual é o Z dado normal padronizada
P(Z) = .1217?
σz = 1 z .00 .01 .02
.1217
0.0 .0000 .0040 .0080

0.1 .0398 .0438 .0478


z 0.2 .793 .0832 .0871
µz= 0 .31
0.3 .1179 .1217 .1255

Neste caso, procuramos na tabela o valor de probabilidade informado.


Encontramos o valor de z e o substituímos na formula da transformada Z. Em
seguida, calculamos o valor de x.

Distribuição Distribuição
normal normal padronizada
σx = 10 σz = 1
.1217

x z
µx = 5 ? µz= 0 .31

188 • capítulo 6
ATIVIDADES
Todos os exercícios propostos estão resolvidos na planilha anexa. Atente para a re-
solução das fórmulas, para o uso da tabela normal e para o uso das funções DISTNOM
E DISTNORMP.
•  DISTNOM – usa as informações de média e desvio padrão.
•  DISTNORMP – é a normal padronizada, trabalha com o valor de Z.

16. A duração de certo componente eletrônico pode ser considerada normalmente distri-
buída com média de 850 dias e desvio padrão de 45 dias. Calcular a probabilidade de um
componente durar:
a) entre 700 e 1.000 dias.
b) mais que 800 dias.
c) menos que 750 dias.
d) exatamente 1.000 dias.

17. Os pesos de 600 estudantes são normalmente distribuídos com média de 65,3 kg e
desvio padrão de 5,5 kg. Encontrar o número de alunos que pesam:
a) entre 60 e 70 kg
b) mais de 63,2kg.

18. Suponha que as notas de uma prova sejam normalmente distribuídas com média de
73 e desvio padrão 15. Quinze por cento dos alunos mais adiantados receberam a nota A e
12% dos mais atrasados receberam nota F. Encontrar:
a) o mínimo para receber A.
b) o mínimo para passar e não receber F.

19. Uma fábrica de pneus fez um teste para medir o desgaste de seus pneus e verificou que
ele obedecia a uma distribuição normal de média 48.000 km e desvio padrão de 2.000 km.
Calcular a probabilidade de um pneu escolhido ao acaso:
a) durar mais que 46.000 km.
b) durar entre 45.000 e 50.000 km.

20. O salário semanal dos operários industriais é distribuído normalmente em torno de uma
média de $ 180 com desvio padrão de $ 25. Pede-se:

capítulo 6 • 189
•  encontrar a probabilidade de um operário ter salário semanal situado entre $ 150 e
$ 178. b) para responder, dentro de que desvio, de ambos os lados da média, cairão 96%
dos salários.

21. Um certo produto tem peso médio de 10 g e desvio padrão de 0,5 g. É embalado em
caixas de 120 unidades que pesam em média 150 g e têm desvio padrão de 8 g. Qual a
probabilidade de que uma caixa cheia pese mais de 1.370 g?

22. Um avião de turismo de 4 lugares pode levar uma carga útil de 350 hg. Supondo que
os passageiros tenham peso médio de 70 kg, com distribuição normal e desvio padrão de
20 kg, e que a bagagem de cada passageiro pese em média 12 kg com desvio padrão de 5
kg e distribuição normal de peso, calcule a probabilidade de:
a) haver sobrecarga se o piloto não pesar os quatro passageiros e as respectivas bagagens.
b) que o piloto tenha de tirar pelo menos 50 kg de gasolina para evitar sobrecarga.

23. Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores
a 19. Encontrar a média e a variância da distribuição.

24. O peso de um item produzido por uma empresa tem distribuição normal com media de
230 g e desvio padrão de 3 g. Este produto é embalado em caixas com 20 unidades cada
uma. A caixa vazia tem peso distribuído normalmente com media 30 e desvio 5 g. Calcule a
probabilidade de uma caixa cheia pesar mais que 4.660 g.

25. Uma fábrica de elevadores estabelece que a carga máxima permitida é de 10 pessoas.
Sabe-se que o peso das pessoas é normalmente distribuído com média de 70 kg e desvio
padrão de 15 kg.
a) Se o elevador opera sem problemas com carga máxima de 880 kg, qual é a probabilida-
de de ele apresentar problemas em uma operação com 10 pessoas?
b) Se a probabilidade de apresentar problemas em uma operação com 10 pessoas
deve ser no máximo 0,025%, qual deverá ser a carga máxima suportável para operar
sem problemas?

26. O Departamento de Marketing de uma empresa sabe que o preço de um produto no


mercado tem distribuição normal com media $ 60 e desvio padrão $ 5. O custo, segundo o
Departamento de Produção, tem distribuição normal com media $ 26 e desvio padrão $ 4. Se

190 • capítulo 6
a empresa pretende colocar no mercado 1 000 unidades por semana, qual é a probabilidade
de o lucro ser:
a) pelo menos 25,5% do valor médio das vendas?
b) pelo menos 50% do valor médio dos custos?
c) negativo, isto é, haver prejuízo nesta operação?

27. Dados a média e o desvio das variáveis aleatórias X1 e X2, calcule a média e o desvio
da variável aleatória h = 5.X1 + 2.X2.

28. Considere as variações anuais de duas ações. Calcule a média, o desvio e o coeficiente
de variação de cada uma. Depois crie uma carteira com 30% do capital em ações A e mais
70% do capital em ações B. Calcule a nova média, o novo desvio e o novo CV. O que é pos-
sível perceber? Considere as variáveis independentes.

29. As médias e variâncias de X1 e X2 são registradas na tabela a seguir. Calcule a


média, a variância e o desvio da variável aleatória H=0,5X1 + 0,5X2. Suponha as variá-
veis independentes.

30. Calcular a média e o desvio padrão da variável aleatória H=10+5X, considerando que a
média e a variância de X são respectivamente 0,124 e 0,0454.

31. A quantidade de estações gráficas vendidas mensalmente pelo vendedor é normalmen-


te distribuída, com media de 0,8 estações por mês e variância 0,25. Mensalmente, o vende-
dor recebe $ 5.000,00 fixos mais $ 10.00,00 por estação gráfica vendida. Calcular a remu-
neração média mensal por mês e o desvio padrão correspondente. Em qual porcentagem dos
meses o vendedor receberá entre 8 e 13 mil?

REFLEXÃO
Nesta aula:
•  Definimos uma variável aleatória;
•  Associamos funções de probabilidade a variáveis aleatórias;
•  Calculamos a esperança matemática e a variância de variáveis aleatórias;
•  Utilizamos as propriedades e operações inerentes às variáveis aleatórias;
•  Aprendemos a trabalhar e aplicar modelos discretos de probabilidade;

capítulo 6 • 191
•  Estudamos a distribuição de Bernoulli e suas aplicações;
•  Estudamos a distribuição binomial e suas aplicações;
•  Aprendemos a trabalhar com a distribuição de Poisson;
•  Calculamos a distribuição de Poisson com base na aproximação da distribuição binomial;
•  Aprendemos a trabalhar com a distribuição normal.
•  Aprendemos a usar a tabela normal;
•  Aprendemos a usar as fórmulas e funções do Excel para a distribuição normal;
•  Aplicamos os conhecimentos de soma e multiplicação de variáveis aleatórias em situações
de cálculo de risco e de cálculo de lucro.

REFERÊNCIAS BIBLIOGRÁFICAS
DEVORE, Jay L. Probabilidade e estatística: para engenharia e ciências. São Paulo: Pioneira
Thomson Learning, 2006.
BALDI, Brigitte; MOORE, David S. A prática da estatística nas ciências da vida. Rio de Janeiro: LTC,
2014.
LAPPONI, Juan Carlos. Estatística usando o Excel. São Paulo: Lapponi Treinamento de Editora
LTDA, 2000.
LEVINE, David M.; STEPHAN, David F.; KREHBIEL, Timothy C.; BERENSON, Mark L. Estatística –
teoria e aplicações. Rio de Janeiro: LTC, 2008.
MC CLAVE, James; BENSON, P. George; SINCICH, Terry. Statistics for business and economics.
Ney Jersey: Pearson, 2005.
MOORE, David S; NOTZ, William I.; FLINGER, Michael A. A estatística básica e sua prática. Rio de
Janeiro: LTC, 2014.
MORETTIN, Pedro; BUSSAB, Wilton. Estatística básica. São Paulo: Saraiva, 2002.
TOLEDO, Geraldo; OVALE, Ivo. Estatística básica. São Paulo: Atlas, 1985.
TRIOLA, Mario F.. Introdução à estatística. Rio de Janeiro: LTC, 2013.

192 • capítulo 6

Potrebbero piacerti anche