Sei sulla pagina 1di 201

PROBABILIDADE E ESTATÍSTICA

Material de Apoio à Disciplina

Profª: Susana Machado Ferreira

1- INTRODUÇÃO

A palavra ESTATÍSTICA, de origem latina STATUS (ESTADO), significou por


muito tempo ciência dos Negócios do Estado. Nas mãos dos estadistas era uma verdadeira
ferramenta administrativa, pois registrava o número de habitantes, de nascimentos, de
óbitos, faziam estimativas das riquezas individual e social, distribuía terras aos povos,
cobravam impostos, etc.
No século XVII, a nova ciência (ou método mais cientifico) foi batizada por Gottfried
Achenwall como o nome de ESTATÍSTICA.
A estatística tem evoluído até o dia de hoje, como uma ferramenta auxiliar de todas as
ciências; ela utiliza números para a coleta, organização, resumo e apresentação de dados e
também para a obtenção de conclusões e a tomada de decisões razoáveis.

1.1- O QUE É ESTATÍSTICA

Definição

Estatística é a parte da matemática que fornece métodos para coleta, organização,


descrição, analise e interpretação de dados para tomada de decisões.

Aplicações Usuais da Estatística

- Índices econômicos
- Taxas de natalidade e mortalidade
- Eleições
- Pesquisa de opinião
- Pesquisa de mercado

1.2 – TIPOS DE ESTATÍSTICA

1.2.1) Estatística Descritiva - é a parte da estatística que procura descrever e analisar


um certo fenômeno.

1.2.2) Estatística Inferencial – é a parte da estatística que se preocupa em tirar


conclusões e fazer interpretações dos resultados obtidos.

1
1.3 - POPULAÇÃO VERSUS AMOSTRA

Em estatística uma população não necessariamente significa um ajuntamento de


pessoas. Pode, na verdade, representar um ajuntamento de pessoas ou de qualquer tipo de
item, como, por exemplo, casas, livros, aparelhos de televisão ou carros. A população de
interesse geralmente é chamada de população-alvo.

População ou População-Alvo – é a coleção de todas as observações sobre


determinado fenômeno.

Exemplo: População dos tipos de pedras preciosas no RS. População das idades dos
alunos da Universidade em 2008.

Amostra – é o conjunto de dados observados ou extraídos da população.

Exemplo: Amostra definida da população dos tipos de pedras preciosas no RS, na


região da fronteira. Amostra das idades dos alunos da Universidade na disciplina de
probabilidade e estatística.

Censo e Pesquisa por Amostragem – Uma pesquisa que inclui todos os membros da
população é chamada de censo. A técnica de coletar informações a partir de uma parcela da
população é denominada pesquisa por amostragem.

Exemplo: Se coletarmos informações sobre os rendimentos de todas as famílias em


Bagé no ano de 2008, isso vai ser chamado de censo.
Se coletarmos informações sobre os rendimentos de 50 famílias de Bagé no ano de
2008, estaremos fazendo uma pesquisa por amostragem.

Amostra Representativa – Uma pesquisa que representa, o mais próximo possível, as


características da população é chamada de amostra representativa.

Exemplo: Para se encontrar a renda média das famílias que vivem na cidade de Bagé,
por meio da condução de uma pesquisa por amostragem, a amostra deve conter famílias
que pertençam a diferentes faixas de renda, quase na mesma proporção existente na
população. Esse tipo de amostra é chamado de amostra representativa.

Amostra Aleatória - Uma amostra extraída de maneira tal que cada elemento da
população tenha uma chance de ser selecionado é chamado de amostra aleatória. Caso a
chance de ser selecionado seja a mesma para cada elemento da população, a amostra
denomina-se amostra aleatória simples.

Exemplo: Uma maneira de selecionar uma amostra aleatória é por meio de sorteio ou
extração. Por exemplo, se formos selecionar 5 alunos de uma classe de 50, escrevemos os
50 nomes em pedaços separados de papel. Depois, colocamos todos os 50 pedaços em uma
caixa e misturamos bastante. Finalmente, de maneira aleatória, extraímos da caixa cinco

2
pedaços de papel. Os cinco nomes extraídos compõem uma amostra aleatória. Por outro
lado, se colocarmos todos os 50 nomes em ordem alfabética e, então, selecionarmos os
cinco primeiros nomes da lista, isso representa uma amostra não-aleatória.

Uma amostra pode ser selecionada com ou sem reposição.

Na amostragem com reposição, cada vez selecionamos um elemento a partir da


população colocamos esse elemento de volta na população antes de selecionar o elemento
seguinte.

Exemplo: Considere uma caixa contendo 25 bolas de diferentes cores. Suponha que
retiremos uma bola, anotemos sua cor e a coloquemos de volta na caixa antes de extrair a
próxima bola. Cada vez que extraímos uma bola, a caixa contém 25 bolas. Este representa
um exemplo de amostragem com reposição.

A amostragem sem reposição ocorre quando o elemento selecionado não é recolocado


na população.

Exemplo: Considere uma pesquisa de opinião baseada em um determinado número de


eleitores, selecionamos a partir da população de todos os eleitores registrados. Nesse caso,
o mesmo eleitor não é selecionado mais de uma vez.

Exercício:
1) Explique a cada uma das questões a seguir constitui uma população ou uma
amostra.
a) Resultados de todos os alunos em uma turma de estatística.

b) Produção de batatas para 10 glebas de terra.

c) Salários semanais correspondentes a todos os empregados de uma empresa.

d) Gado possuído por 100 fazendeiros em Iowa.

e) Número de computadores vendidos durante a última semana em todas as lojas de


computadores de Los Angeles.

1.4 – TERMOS BÁSICOS

Esta seção explica o significado de um elemento (ou membro), uma variável, uma
observação e um conjunto de dados.
Cada empresa listada na tabela 1.1 constitui um elemento ou um membro da amostra.

Elemento ou Membro – Um elemento ou membro de uma amostra ou população


representa um sujeito ou objeto específico sobre o qual a informação é coletada.

3
Tabela 1.1
Vendas em 2001 de Sete Empresas dos EUA
___________________________________________
Empresa Vendas em 2001
(milhões de dólares)
____________________________________________
Lojas Wal-Mart 217.799
IBM 85.866
General Motors 177.260
Dell Computadores 31.168
Procter & Gamble 39.262
JC Penney 32.004
Home Depot 53.553
____________________________________________

Em nosso exemplo, vendas em 2001 é chamada de variável. Vendas em 2001 é uma


característica das empresas que estão sendo pesquisadas ou estudadas.

Variável – Uma variável corresponde a uma característica sob estudo que assume
diferentes valores para diferentes elementos.

Cada um dos valores que representa vendas em 2001, para as sete empresas
apresentadas na tabela 1.1, é chamado de observação ou medição.

Observação ou Medição – O valor de uma variável para um elemento é chamado de


observação ou medição.

As informações fornecidas na tabela 1.1, que dizem respeito a vendas das empresas em
2001, são chamadas de dados ou conjuntos de dados.

Conjunto de Dados – Um conjunto de dados é uma complicação de observações sobre


uma ou mais variável.

Outros exemplos de conjunto de dados são: uma lista de preços de 25 casas


recentemente vendidas, notas de 15 alunos, opiniões de 100 eleitores.

Exercício:
1) A tabela a seguir fornece o número de mordidas de cachorro relatadas à policia
no ano passado em seis cidades.

______________________________________________

4
Cidade Número de Mordidas
______________________________________________
Center City 47
Elm Grove 32
Franklin 51
Bay City 44
Oakdale 12
Sand Point 3
______________________________________________

a) Qual é a variável para esse conjunto de dados?

b) Quantas observações estão nesse conjunto de dados?

c) Quantos elementos esse conjunto de dados contem?

1.5 – TIPOS DE VARIÁVEIS

Uma variável pode ser classificada como quantitativa ou qualitativa. Esses dois tipos de
variáveis são explicados a seguir:

1.5.1 – Variáveis Quantitativas

Variável Quantitativa – Uma variável que pode ser mensurada numericamente é


chamada de variável quantitativa.

Exemplos:
Rendas, estaturas, preços de casa, etc.

Tais variáveis quantitativas podem ser classificadas como variáveis discretas ou


como variáveis continuas.

Variável Discreta – Uma variável cujos valores são contáveis é chamada de variável
discreta. Em outras palavras, uma variável discreta pode assumir determinados valores sem
valores intermediários.

Exemplos:
O número de carros vendidos, o número de pessoas que vão ao banco em um dia
qualquer, o número de carros em um estacionamento.

Variável Contínua – Uma variável que assumir qualquer valor numérico, ao longo de
um determinado intervalo, ou intervalos, é chamada de variável continua.

5
Exemplos:
O tempo gasto para completar uma prova, pesos de pessoas, estatura de uma pessoa.

1.5.2 – Variáveis Qualitativas ou Variáveis Categóricas

Variável Qualitativa ou Variável Categórica – Uma variável que não pode assumir
um valor numérico, mas pode ser classificada em duas ou mais categorias não-numéricas,
denomina-se variável qualitativa ou variável categórica.

Exemplos:
O nível de um aluno que ainda não se formou na faculdade, a cor do cabelo, o sexo de
uma pessoa e o modelo de um carro.

Exercício:
1) Indique quais das seguintes variáveis são quantitativas e quais são qualitativas.
a) Número de erros tipográficos em um jornal

b) Contas mensais de TV a cabo

c) Locais favoritos dos alunos de faculdade para as férias de primavera

d) Número de carros possuídos por famílias

e) Receitas de estados oriundos de loterias

1.6 – DADOS DE SEÇÕES CRUZADAS VERSUS DADOS DE SÉRIES


TEMPORAIS

Os dados podem ser classificados como dados de seções cruzadas ou como dados de
series temporais.

1.6.1 - Dados de Seções Cruzadas

Definição: Dados coletados sobre diferentes elementos no mesmo ponto no tempo ou


no mesmo período são conhecidos como dados de seções cruzadas.

Exemplo:
As informações sobre rendas de 100 famílias para 2002.

1.6.2 - Dados de Séries

Definição: Dados coletados sobre o mesmo elemento, para a mesma variável, em


diferentes pontos do tempo, ou para diferentes períodos de tempo, são chamados de dados
de séries temporais.

6
Exemplo:
As informações sobre as exportações dos EUA para os anos de 1983 a 2002.

1.7 – FONTES DE DADOS

A disponibilidade de dados precisos e apropriados é essencial para a obtenção de


resultados confiáveis. Os dados podem ser obtidos a partir de fontes internas, de fontes
externas ou de pesquisas e experimentos.

Exercício:
1) Classifique os dados a seguir como dados de seções cruzadas ou como dados de
séries temporais.
a) Preços médios de casa em 100 cidades

b) Salários de 50 empregados

c) Número de carros vendidos pela General Motors, por ano, de 1980 até 2002

d) Número de empregados contratados por uma empresa, por ano, de 1985 até 2002

1.8 – NOTAÇÃO DE SOMATÓRIO

Muitas vezes, a notação matemática auxilia na expressão concisa de uma relação


matemática. A notação de somatório, é utilizada para denotar a soma de valores.
A letra grega maiúscula ∑ (sigma) é utilizada para representar o somatório de todos
os valores. Utilizando a notação ∑ , podemos escrever a soma da seguinte maneira:
∑x = x 1 + x 2 + x 3 + ... + x n

A notação ∑x nessa expressão representa a soma de todos os valores de x e é lida


como “sigma de x” ou “somatório de todos os valores de x”.

Exemplos:
1) Os salários anuais (em milhares de dólares) de quatro trabalhadores são 75, 42, 125 e 61.
Encontre:
a) ∑x

b) (∑x ) 2

7
c) ∑x 2

2) A tabela a seguir lista quatro pares de valores para m e f.


______________________________________________
m 12 15 20 30
____________________________________________
f 5 9 10 16
____________________________________________

Calcule o seguinte:
a) ∑m

b) ∑f 2

c) ∑m. f

d) ∑m 2
f

Exercícios:
1) As contas de telefone referentes a janeiro de 2003 para quatro famílias foram
US$83, US$205, US$57 e US$134. Faça com que y seja a quantia referente à conta
de telefone correspondente a janeiro de 2003 para uma família. Encontre:

a) ∑y

8
b) ( ∑y ) 2

c) ∑y 2

2) O número de alunos (arredondando para milhar mais próximo) atualmente


matriculados em sete universidades são: 7, 39, 21, 16, 3, 43 e 19. Seja x o número
de alunos atualmente matriculados em uma universidade. Encontre:
a) ∑x

b) (∑x ) 2

c) ∑x 2

Teste de Auto-Revisão

1) Em estatística, uma população significa um conjunto de todos(as) os(as)


a) homens e mulheres
b) sujeitos e objetos
c) pessoas que vivem em um pais

2) Em estatística, uma amostra significa uma parcela referente a (à)


a) pessoas selecionadas a partir da população de um país
b) pessoas selecionadas a partir da população de uma área
c) população de interesse

3) Indique qual dos itens a seguir representa um exemplo de amostragem com


reposição e qual representa um exemplo de amostragem sem reposição.
a) Dez alunos são selecionados a partir de um curso de estatística de maneira tal que,
assim que um aluno é selecionado, seu nome é apagado da lista antes de o próximo
aluno ser selecionado.

9
b) Uma caixa contém cinco bolas de diferentes cores. Uma bola é extraída da caixa, sua
cor é registrada e a bola é colocada de volta na caixa antes de a próxima bola ser extraída.
Esse experimento é repetido 12 vezes.

4) Indique quais das seguintes variáveis são quantitativas e quais são qualitativas.
Classifique as variáveis quantitativas como discretas ou continuas.
a) Programas de TV favoritos de mulheres

b) Salários de jogadores de futebol

c) Número de animais de estimação possuídos por famílias

e) Total de indenizações pagas por 15 seguradores de automóveis em 2002

5) Uma pesquisa de opiniões on-line, com 30.270 entrevistados, conduzida durante o


período de 14 a 21 de janeiro de 2002, formulou a pergunta “Qual é o melhor
emprego no Super Bowl?” A tabela a seguir fornece o número de pessoas que votou
em cada um dos cinco empregos.

________________________________________________
Emprego Votos
________________________________________________
Jogador 11.715
Locutor/repórter 9982
Líder de torcida 5221
Técnico 1927
Árbitro 1425
__________________________________________________
Fonte: Monster.com pesquisa on-line. USA TODAY,
1º de fevereiro de2002.

Explique o significado de membro, variável, medição e conjunto de dados com


referência na tabela.

6) O total de cômodos em cada uma das cinco casas é 8, 5, 10, 6, 5 e 8. Seja x o


número de cômodos em uma casa. Encontre:
a) ∑x

10
b) (∑x ) 2

c) ∑x 2

MINIPROJETO

1) Pegue uma amostra de 30 alunos e pergunte-lhes o quanto gastaram em livros no


semestre 2008/02. Uma vez que você tenha coletado as informações, escreva um
relatório conciso que inclua respostas em relação a essas questões.
a) Liste os dados.

b) Qual é a população-alvo razoável para a amostra que você utilizou?

c) A sua amostra é uma amostra aleatória a partir dessa população-alvo?

d) Você acredita que a sua amostra é representativa dessa população?

e) Este é um exemplo de amostragem com reposição ou de amostragem sem


reposição?

f) Os dados da amostra são discretos ou contínuos?

g) Descreva o significado de um elemento, uma variável e uma medição para esse


conjunto de dados?

h) Descreva quaisquer problemas que você tenha tido enquanto coletava os dados.

Alguns desses dados seria inútil? Se positivo, explique por quê?

2. ORGANIZANDO DADOS

Este capítulo explica como organizar e exibir dados utilizando tabelas e gráficos.
Aprenderemos a preparar tabelas de distribuição de freqüências para dados qualitativos e
para dados quantitativos; aprenderemos a construir gráficos de barras, gráficos de pizza,

11
histogramas e polígonos para esses dados; e aprenderemos a preparar disposições ramo-e-
folha.

2.1 – Dados Brutos

Dados Brutos - na seqüência em que foram coletados, e antes de serem processados


ou classificados, são chamados de dados brutos.

2.2 – Organizando e Elaborando Gráficos com dados Qualitativos

Os conjuntos de dados são organizados em tabelas, e os dados são exibidos utilizando-


se gráficos.

2.2.1 – Distribuição de Freqüência

Na tabela, a variável correspondente a tipo de ocupação, que representa uma variável


qualitativa. As categorias (representando o tipo de ocupação) listadas na primeira coluna
são mutuamente excludentes. Em outras palavras, cada um dos 100 alunos pertence a uma,
e somente uma, dessas categorias. O número de alunos que pertencem a uma determinada
categoria é chamado de freqüência dessa categoria. Uma distribuição de freqüências
revela como as freqüências estão distribuídas ao longo das várias categorias. A tabela 2.1 é
chamada de tabela de distribuição de freqüências ou, simplesmente, tabela de freqüências.

Tabela 2.1
Tipo de Ocupação à qual os Alunos Pretendem se Dedicar
_____________________________________________________
Tipo de Ocupação Número de Alunos
_____________________________________________________
Empresas/negócios privados 44
Governo Federal 16
Governo estadual/prefeitura 23
Negócio próprio 17
____________________________________________________
Soma=100
_____________________________________________

Definição

Distribuição de Freqüência para Dados Qualitativos – Uma distribuição de


freqüências para dados qualitativos lista todas as categorias, bem como os números de
elementos que pertencem a cada uma das categorias.

12
O exemplo 2.1 é uma ilustração de como se constrói uma tabela de distribuição de
freqüências para dados qualitativos.

Exemplo 2.1:
Uma amostra de 30 empregados de grandes empresas foi selecionada, e esses
empregados foram indagados sobre o quão estressante era o seu trabalho. As respostas
desses empregados estão registradas a seguir, em que muito representa muito estressante,
mais ou menos representa mais ou menos estressante e nada corresponde a nada estressante.

Construa uma tabela de distribuição de freqüências para esses dados.

Tabela 2.2
Distribuição de Freqüências do Estresse no Trabalho
____________________________________________________
Estresse no Trabalho Marcação Freqüência (f)
_____________________________________________________
Muito
Mais ou menos
Nada
_____________________________________________________
Soma = 30
_____________________________________________________

2.2.2 – Distribuições de Freqüências Relativas e Distribuições de Percentagens

A freqüência relativa de uma categoria é obtida pela divisão da freqüência daquela


categoria pela soma de todas as freqüências.

Calculando a Freqüência Relativa de uma Categoria

Freqüência relativa de uma categoria = Freqüência daquela categoria/Soma de todas


as freqüências

13
A porcentagem para uma categoria é obtida pela multiplicação da freqüência
relativa daquela categoria por 100. Uma distribuição de percentagens lista as percentagens
para todas as categorias.

Calculando Percentagens
Percentagem = (Freqüência relativa) . 100

Exemplo 2.2
1) Determine a distribuição de freqüências relativas e a distribuição de percentagens
para os dados apresentados na tabela 2.3.
Observe que a soma das freqüências relativas é sempre igual a 1,00 (ou
aproximadamente 1,00, se as freqüências estiverem arredondadas), e a soma das
percentagens é sempre igual a 100 ((ou aproximadamente 100, se as percentagens
estiverem arredondadas).

Tabela 2.3
Distribuição de Freqüências Relativas e Distribuição de Percentagens do Estresse
no Trabalho
Estresse no Trabalho Freqüência relativa Percentagem
Muito
Mais ou menos
Nada
Soma = 1,00 soma = 100

2.2.3 – Apresentação Gráfica de Dados Qualitativos

Uma distribuição gráfica pode revelar, de imediato, as principais características de um


conjunto de dados. O gráfico de barras e o gráfico de pizza são dois tipos de gráficos
utilizados para exibir dados qualitativos.

Gráficos de Barras

Para construir um gráfico de barras (também chamado de diagrama de barras),


marcamos as várias categorias no eixo horizontal, como na figura 2.1. Observe que todas as
categorias estão representadas por intervalos da mesma amplitude. Marcamos as
freqüências no eixo vertical. Em seguida, desenhamos uma barra para cada categoria, de
maneira tal que a altura da barra represente a freqüência da categoria correspondente.
Deixamos uma pequena lacuna entre as barras adjacentes. A figura 2.1 fornece o gráfico de
barras para a distribuição de freqüências da tabela 2.2.

14
Definição

Gráfico de Barras – Um gráfico composto de barras cujas alturas representam as


freqüências das respectivas categorias é chamado de gráfico de barras.

Gráficos de Pizza

Um gráfico de pizza é mais comumente utilizado para apresentar percentagens,


embora pode ser utilizado para exibir freqüências ou freqüências relativas. A pizza (ou
círculo) completa representa a amostra total ou população total. Em seguida, dividimos a
pizza em diferentes porções, que representam as diferentes categorias.

Definição: Gráfico de Pizza – Um círculo dividido em porções que representam as


freqüências relativas, ou as percentagens, de uma população ou de uma amostra,
pertencentes a diferentes categorias, é chamado de gráfico de pizza.

Conforme, sabemos, um círculo contém 360 graus. Para construir um gráfico de


pizza, multiplicamos 360 pela freqüência relativa de cada categoria, para obter a medida em
graus, ou tamanho do ângulo, para a categoria correspondente. A tabela 2.4 mostra os
cálculos dos tamanhos dos ângulos para as várias categorias da tabela 2.3.

Tabela 2.4
Calculando Tamanhos de Ângulos para o Gráfico de Pizza
________________________________________________________________
Estresse no Trabalho Freqüência relativa Tamanho do Ângulo
________________________________________________________________
Muito
Mais ou menos
Nada
________________________________________________________________
Soma = 1,000 Soma = 360
________________________________________________________________

A figura 2.2 mostra o gráfico de pizza para a distribuição de percentagens da tabela


2.3, que utiliza os tamanhos dos ângulos calculados na Tabela 2.4.

15
2.3 – Organizando e Elaborando Gráficos com dados Quantitativos

2.3.1 – Distribuição de Freqüências

A tabela 2.5 fornece os ganhos semanais correspondentes a 100 empregados de uma


grande empresa. A primeira coluna lista as classes, que representam a variável
(quantitativa) ganhos semanais. Para dados quantitativos, um intervalo que inclua todos os
valores que se posicionem entre dois números, o limite inferior e o limite superior, é
chamado de classe. Observe que as classes sempre representam uma variável. Como
podemos observar, as classes não se sobrepõem; ou seja, cada valor em relação a ganho
pertence a uma, e somente uma, classe. A segunda coluna na tabela lista o número de
empregados que apresentam os ganhos dentro de cada classe. Os números listados na
segunda coluna são chamados de freqüências, que fornecem o número de valores que
pertencem a diferentes classes. As freqüências são representadas por f.

Tabela 2.5
Ganhos Semanais de 100 Empregados de uma Empresa
___________________________________________________________
Ganhos Semanais (dólares) Números de Empregados f
___________________________________________________________
401 até 600 9
601 até 800 22
801 até 1000 39
1001 até 1200 15
1201 até 1400 9
1401 até 1600 6
___________________________________________________________

Definição

Distribuição de Freqüências para Dados Quantitativos – Uma distribuição de


freqüências para dados quantitativos lista todas as classes e o número de valores que
pertencem a cada classe. Os dados apresentados no formato de uma distribuição de
freqüências são chamados de dados agrupados.

16
Para encontrar o ponto médio entre o limite superior da primeira classe e o limite
inferior da segunda classe na tabela 2.5, dividimos a soma desses dois limites por 2. Assim,
sendo, esse ponto médio corresponde a

600 + 601
= 600 ,5
2

O valor de 600,5 é chamado de fronteira superior da primeira classe e de fronteira


inferior da segunda classe. Utilizando essa técnica, podemos converter os limites de classes
da tabela 2.5 em fronteiras de classes, que também são chamadas de limites reais de
classes. A segunda coluna da Tabela 2.6 lista as fronteiras para a Tabela 2.5.

Definição

Fronteira de Classe – A fronteira de classe é representada pelo ponto médio entre o


limite superior de uma classe e o limite inferior da classe seguinte.

A diferença entre as duas fronteiras de uma classe representa a amplitude da


classe. A amplitude da classe também é chamada de tamanho de classe.

Tabela 2.6
Fronteiras de Classes, Amplitudes de classes e Pontos Médios de Classes para a
tabela 2.5
Limites de Classes Fronteiras de Classes Amplitude de Classe Ponto Médio
da Classe
401 até 600 400,5 até menos que 600,5 200 500,5
601 até 800 600,5 até menos que 800,5 200 700,5
801 até 1000 800,5 até menos que 1000,5 200 900,5
1001 até 1200 1000,5 até menos que 1200,5 200 1100,5
1201 até 1400 1200,5 até menos que 1400,5 200 1300,5
1401 até 1600 1400,5 até menos que 1600,5 200 1500,5

Encontrado a Amplitude da Classe

Amplitude da Casse = Fronteira superior – Fronteira inferior

Desta maneira, na tabela 2.6,

Amplitude da primeira classe = 600,5 – 400,5 = 200

O ponto médio da classe, ou marco da classe, é obtido pela divisão do resultado da


soma dos dois limites (ou das duas fronteiras) de uma classe por 2.

17
Calculando o Ponto Médio da Classe ou Marco da Classe

Ponto médio ou marco da classe = Limite inferior + limite superior/2

Logo, o ponto médio da primeira classe na tabela 2.5, ou na Tabela 2.6, é calculado da
seguinte maneira:

Ponto médio da primeira classe = 401+600/2 = 500,5

Observe que na Tabela 2.6, quando expressamos classes utilizando fronteiras de


classes, escrevemos até menos que, para garantir que cada valor pertença a uma, e somente
uma, classe. Como podemos verificar, a fronteira superior da classe precedente e a fronteira
inferior da classe sucessiva representam a mesma coisa.

2.3.2 – Construindo Tabelas de Distribuição de freqüências

Ao construir uma tabela de distribuição de freqüências, precisamos tomar as três


importantes decisões a seguir apresentadas.

Número de Classes

De maneira geral, o número de classes para uma tabela de distribuição de


freqüências varia desde 5 até 20, dependendo principalmente do número de observações
existentes no conjunto de dados.
Uma regra para auxiliar na decisão sobre o número de classes é a fórmula de Sturge:

c =1 + 3,3 log n

na qual c representa o número de classes e n representa o número de observações no


conjunto de dados. O valor de log n pode ser obtido inserindo-se o valor de n em uma
calculadora e pressionando-se a tecla log.

Amplitude da Classe

Calculando a Amplitude da Classe

Amplitude aproximada da classe = Maior valor – Menor valor/Número de Classes

Limite Inferior da Primeira Classe ou Ponto de Partida

Qualquer número conveniente, que seja igual ou menor do que o menor valor no
conjunto de dados, pode ser utilizado como o limite inferior da primeira classe.

Exemplo 2.3

18
1) A tabela 2.7, a seguir fornece o total de rebatidas com voltas completas (home e
runs) obtidas por todos os jogadores de cada um dos 30 times da Liga Principal de Beisebol
durante a temporada de 2002. Construa uma tabela de distribuição de freqüências.

Tabela 2.7
Rebatidas com Voltas Completas dos Times da Liga Principal de Beisebol Durante a
Temporada de 2002
Time Voltas Completas Time Voltas Completas
Anaheim 152 Milwaukee 139
Arizona 165 Minnesota 167
Atlanta 164 Montreal 162
Baltimore 165 New York Mets 160
Boston 177 New York Yankees 223
Chicago Cubs 200 Oakland 205
Chicago White Sox 217 Philadelphia 165
Cincinnati 169 Pittsburgh 142
Cleveland 192 St. Louis 175
Colorado 152 San Diego 136
Detroit 124 San Francisco 198
Florida 146 Seattle 152
Houston 167 Tampa Bay 133
Kansas City 140 Texas 230
Los Angeles 155 Toronto 187

Obs: Nesses dados, o valor mínimo corresponde a 124 e o valor máximo é igual a
230. Suponha que tomemos a decisão de agrupar esses dados utilizando cinco classes de
igual amplitude.
230 −124
Amplitude aproximada de cada classe = = 21,2
5
Agora, arredondamos essa amplitude para um número conveniente – digamos 22. Então,
nossas classes serão:

124-145, 146-167, 168-189, 190-211, 212-233

Registramos essas cinco classes na primeira coluna da tabela 2.8, a seguir.

Tabela 2.8
Distribuição de Freqüências para os Dados da Tabela 2.7
Total de Voltas Completas Marcação f

19
∑f =30

2.3.3 – Distribuição de Freqüências Relativas e Distribuição de Percentagem

Calculando a Freqüência Relativa e a Percentagem

Freqüência Relativa de uma Classe = Freqüência daquela classe/Soma de todas as


f
freqüências =
∑f
Percentagem = (Freqüência relativa) . 100

Exemplo 2.4
1) Calcule as freqüências relativas e as percentagens para a tabela 2.8.

Tabela 2.9
Distribuição de Freqüências Relativas e Distribuição de Percentagens para a Tabela
2.8
Total de Voltas Completas Fronteiras de Classes Freqüência Relativa Percentagem

Soma = 0,999 Soma = 99,9%

2.3.4 – Elaborando gráficos com Dados Agrupados

Dados agrupados (quantitativos) podem ser dispostos em um histograma ou em um


polígono.

Histogramas

Um histograma é um determinado tipo de gráfico que pode ser utilizado para


desenhar uma distribuição de freqüências, uma distribuição de freqüências relativas ou uma
distribuição de percentagens. Para desenhar um histograma, primeiramente marcamos as
classes no eixo horizontal e as freqüências (ou freqüências relativas, ou percentagens) no

20
eixo vertical. A seguir, desenhamos uma barra para cada classe, de maneira que a sua altura
represente a freqüência daquela classe. As barras em um histograma são desenhadas de
forma adjacente, uma em relação à outra, sem nenhum espaço entre elas.

Definição

Histograma – Um histograma é um gráfico no qual as classes são marcadas no eixo


horizontal, e as freqüências relativas ou as percentagens são marcadas no eixo vertical. As
freqüências relativas ou as percentagens são representadas por meio de alturas das barras.
Em um histograma, as barras são desenhadas de forma adjacente uma em relação à outra.

As figuras 2.3 e 2.4 mostram o histograma de freqüências relativas,


respectivamente, para os dados das Tabelas 2.8 e 2.9. Os dois histogramas parecem iguais,
uma vez que representam os mesmos dados. Um histograma de percentagens pode ser
desenhado para a distribuição de percentagens da Tabela 2.9, marcando as percentagens no
eixo vertical.

Polígonos

Um polígono é um outro dispositivo que pode ser utilizado para apresentar dados
quantitativos em forma de gráfico.

Definição

21
Polígono – Um gráfico formado pela junção, por meio de linhas retas, dos pontos
médios das partes superiores de barras sucessivas em um histograma é chamado de
polígono.

A figura 2.5 mostra o polígono de freqüências de Tabela 2.8.

Para um conjunto de dados muito grande, à medida que o número de classes é


aumentado (e a amplitude das classes é diminuída), o polígono de freqüências
eventualmente se transforma em uma curva suave. Tal curva é chamada de curva de
distribuição de freqüências, ou simplesmente curva de freqüências. A figura 2.6 mostra a
curva de freqüências para um grande conjunto de dados, com um grande número de classes.

2.3.5 – Mais sobre Classes e Distribuições de Freqüências

Método “Menos Que” para Descrever Classes

O método menos que é mais apropriado quando um conjunto de dados contém


valores fracionários. O exemplo 2.5 ilustra o método menos que.

22
Exemplo 2.5Os dados a seguir fornecem o tempo médio gasto no trajeto de casa
para o trabalho (em minutos), em 50 estados. Os dados foram baseados em uma pesquisa
feita por amostragem, com 70.000 domicílios, conduzida pelo Census Bureau (USA
TODAY, 6 de agosto de 2001).

22,4 18,2 23,7 19,8 26,7 23,4 23,5 22,5 24,3 26,7 24,2
19,7 27,0 21,7 17,6 17,7 22,5 23,7 21,2 29,2 26,1 22,7
21,6 21,9 23,2 16,0 16,1 22,3 24,4 28,7 19,9 31,2 22,6
15,4 22,1 19,6 21,4 23,8 21,9 21,9 15,6 22,7 23,6 20,8
21,1 25,4 24,9 25,5 20,1 17,1

Construa uma tabela de distribuição de freqüências. Calcule as freqüências relativas


e as percentagens para todas as classes.

OBS: O valor mínimo nesse conjunto de dados é 15,4, e o valor máximo, 31,2.
Suponha que tenhamos decidido agrupar esses dados utilizando seis classes com igual
amplitude.

Tabela 2.10
Distribuição de Freqüências, Distribuição de Freqüências Relativas e Distribuição de
Percentagens do Tempo Médio Gasto no Trajeto para o Trabalho
Tempo Médio Gasto no f Freqüência Relativa Percentagem
Trajeto Para o Trabalho
(minutos)
15 até menos que 18 7 0,14 14
18 até menos que 21
21 até menos que 24
24 até menos que 27
27 até menos que 30
30 até menos que 33
∑f =50 Soma= 1,00 Soma= 100%

Classes com Valor Único

Se as observações em um conjunto de dados assumirem somente alguns poucos


valores (inteiros) distintos, pode ser apropriado preparar uma tabela de distribuição de
freqüências utilizando classes com valor único. O exemplo 2.6 exibe tal situação.

Exemplo 2.6

23
A administração pública de uma grande cidade deseja conhecer a distribuição de
veículos possuídos por domicílios naquela cidade. Uma amostra de 40 domicílios,
aleatoriamente selecionados, a partir dessa cidade, produziu os seguintes dados, sobre o
número de veículos possuídos:

4 1 1 2 0 1 1 2 1 1
1 3 3 0 2 5 1 2 3 4
2 1 2 2 1 2 2 1 1 1
4 2 1 1 2 1 1 4 1 3

Construa uma tabela de distribuição de freqüências para esses dados utilizando classes com
valor único.

Tabela 2.11
Distribuição de Freqüências de Veículos Possuídos
______________________________________________
Veículos Possuídos Número de Domicílios (f)
______________________________________________

_______________________________________________
∑f =40
_______________________________________________

Os dados da Tabela 2.11 também podem ser dispostos em um gráfico de barras,


conforme mostra a figura 2.7 a seguir. Para construir um gráfico de barras, marcamos as
classes no eixo horizontal, como intervalos, com uma pequena lacuna entre os intervalos
consecutivos. As barras representam as freqüências das respectivas classes.

2.4 – FORMATOS DE HISTOGRAMAS

Um histograma pode assumir qualquer formato entre um grande número de


formatos. Os mais comuns dentre esses formatos são:
1. Simétrico

24
2. Assimétrico
3. Uniforme ou retangular

Um histograma simétrico é idêntico em ambos os lados, em relação a seu ponto


central. Os histogramas mostrados na figura 2.8 são simétricos em torno das linhas
tracejadas, que representam seus pontos centrais.

Um histograma assimétrico é não-simétrico. Para um histograma assimétrico, a cauda


em um dos lados é mais longa do que a cauda do outro.

Um histograma retangular ou uniforme possui a mesma freqüência para cada


classe. A Figura 2.10 é uma ilustração de tal caso.

As Figuras 2.11a e 2.11b exibem curvas simétricas de freqüências. As Figuras 2.11c


e 2.11d exibem, respectivamente, uma curva de freqüências assimétrica à direita e uma
curva de freqüências assimétrica à esquerda.

25
Exercícios:
1) Um conjunto de dados sobre gastos mensais (arredondados para o dólar mais
próximo) realizados em lanchonetes, para uma amostra de 500 domicílios, teve um valor
mínimo de $3 e um valor máximo de $147. Suponha que desejamos agrupar esses dados em
seis classes de igual amplitude.
a) Partindo do pressuposto de que $1 represente o limite inferior da primeira classe, e
que $150 seja o limite superior da sexta classe, escreva os limites de classes para todas as
seis classes.

b) Determine as fronteiras de classes e as amplitudes de classes.

c) Encontre os pontos médios das classes.

2) No Nixon Corporation fabrica terminais de computador. Os dados a seguir


correspondem aos números de terminais de computador produzidos pela empresa para uma
amostra de 30 dias.

24 32 27 23 33 33 29 25 23 28
21 26 31 22 27 33 27 23 28 29
31 35 34 22 26 28 23 35 31 27

26
a) Construa uma tabela de distribuição de freqüências utilizando as classes 21-23, 24-26,
27-29, 30-32 e 33-35.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Construa um histograma e um polígono para a distribuição de percentagens.

d) Para que percentagens dos dias o número de terminais de computador produzidos


encontra-se contido no intervalo 27-29?

3) A tabela a seguir fornece o número de crianças de menos de 18 anos para cada


uma das 30 famílias aleatoriamente selecionadas.

2 1 2 0 3 1 1 2 2 1
1 2 0 1 0 2 1 2 0 0
1 0 0 2 1 2 3 2 0 1

a) Prepare uma tabela de distribuição de freqüências para esses dados utilizando classes de
valor único.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Quantas famílias nessa amostra têm duas ou três crianças de menos de 18 anos?

d) Desenhe um gráfico de barras para a distribuição de freqüências.

27
2.5 – DISTRIBUIÇÃO DE FREQUÊNCIAS ACUMULADAS

Definição

Distribuição de Freqüências Acumuladas – Uma distribuição de freqüências


acumuladas fornece o número total de valores que se posicionam abaixo da fronteira
superior de cada classe.

Em uma tabela de distribuição de freqüências acumuladas cada classe possui o


mesmo limite inferior, mas possui o limite superior diferente. O exemplo 2.7 ilustra o
procedimento para se preparar uma distribuição de freqüências acumuladas.

Exemplo 2.7
Utilizando a distribuição de freqüências da Tabela 2.8, aqui reproduzida, prepare
uma distribuição de freqüências acumuladas para as rebatidas com voltas completas dos
times da Liga Principal de Beisebol durante a temporada de 2002.

___________________________________
Total de Voltas Completas f
___________________________________
124.145 6
146.167 13
168.189 4
190.211 4
212.233 3

28
___________________________________

Para obter a freqüência acumulada de uma classe, adicionamos a freqüência dessa


classe na Tabela 2.8, as freqüências de todas as classes precedentes. AS freqüências
acumuladas encontram-se registradas na terceira coluna da Tabela 2.12. A segunda coluna
dessa tabela lista as fronteiras de classe.

Tabela 2.12
Distribuição de Freqüências Acumuladas para Voltas Completas dos Times de
Beisebol
Limites de Classes Fronteiras de Classes freqüências Acumuladas
124-145 123,5 até menos que 145,5 6
124-167 123,5 até menos que 167,5 6+13 = 19
124-189 123,5 até menos que 189,5 6+13+4 = 23
124-211 123,5 até menos que 211,5 6+13+4+4 = 27
124-233 123,5 até menos que 233,5 6+13+4+4+3 = 30

Calculando a Freqüência Relativa Acumulada e a Percentagem Acumulada

Freqüência relativa acumulada = Freqüência acumulada de uma classe/Total de


observações no conjunto de dados

Percentagem acumulada = (Freqüência relativa acumulada) . 100

A Tabela 2.13 contém as freqüências relativas acumuladas e as percentagens


acumuladas para a Tabela 2.12. Podemos observar, por exemplo, que 76,7% dos times de
Liga Principal de Beisebol rebateram um total de 189 vezes, ou menos, com voltas
completas.
Tabela 2.13
Distribuição de Freqüências Relativas Acumuladas e Distribuição de Percentagens
Acumuladas para Rebatidas com Voltas Completas dos Times de Beisebol
Limites de Classes Freqüências Relativas Acumuladas Percentagens Acumuladas
124-145 6/30 = 0,200 20,0
124-167
124-189
124-211
124-233
Ogivas

Quando desenhadas em um diagrama, as freqüências acumuladas apresentam uma


curva que chamada de ogiva. A figura 2.12 fornece uma ogiva para a distribuição de
freqüências acumuladas da Tabela 2.14. Para desenhar a ogiva na figura 2.12, a variável
total de voltas completas é marcada no eixo horizontal e as freqüências acumuladas são
marcadas no eixo vertical. Em seguida, as marcações são feitas acima das fronteiras
superiores de várias classes nas alturas equivalentes às correspondentes freqüências

29
acumuladas. A ogiva é obtida juntando-se os pontos consecutivos por meio de linhas retas.
Observe que a ogiva se inicia na fronteira inferior da primeira classe e termina na fronteira
superior da última classe.

Definição

Ogiva – Uma ogiva é uma curva desenhada para as distribuições de freqüências


acumuladas, juntando-se, por meio de linhas retas, as marcações feitas acima das fronteiras
superiores de classes nas alturas equivalentes às freqüências acumuladas das respectivas
classes.

2.6 – DISPOSIÇÃO RAMO-E-FOLHA

Uma disposição ramo-e-folha é construída somente para dados quantitativos.

Definição

Disposição ramo-e-folha – Uma disposição ramo-e-folha para dados quantitativos,


cada valor é dividido em duas partes – um ramo e uma folha. As folhas para cada ramo são
mostradas separadamente em uma disposição.

Exemplo:
1) Apresentamos a seguir os resultados de 30 alunos de faculdade em um teste de
estatística.
75 52 80 96 65 79 71 87 93 95
69 72 81 61 76 86 79 68 50 92
83 84 77 64 71 87 72 92 57 98
Construa uma disposição ramo-e-folha.

30
2) A disposição ramo-e-folha, a seguir, é preparada para o número de horas que 25
alunos gastaram trabalhando em computadores durante o mês passado.
0
1
2
3
4
5
6
7
8

Prepare uma nova disposição ramo-e-folha agrupando os ramos.

31
Exercícios:
1) Considere esta disposição ramo-e-folha:
2 −3
4 −5
6 −8
Escreva o conjunto de dados que é representado por essa disposição.

2) Construa uma disposição ramo-e-folha para os dados a seguir, que fornecem os


tempos (em minutos) que 24 clientes gastaram esperando para falar com um representante
do serviço de atendimento ao cliente quando telefonaram para resolver problemas
relacionados a seu provedor da Internet.
12 15 7 29 32 16 10 14 17 8 19 21
4 14 22 25 18 6 22 16 13 16 12 20

3) Considere esta disposição ramo-e-folha:

32
3
4
5
6
7
Escreva o conjunto de dados que foi utilizado para construir essa disposição ramo-e-folha.

4) A tabela a seguir fornece a distribuição de freqüências dos tempos (arredondados para a


hora mais próxima) que 90 fãs gastaram esperando na fila para comprar entradas para um
concerto de rock.
___________________________________________
Tempo de espera (horas) Freqüência
____________________________________________
0 até 6 5
7 até 13 27
14 até 20 30
21 até 27 20
28 até 34 8
_____________________________________________

Faça um circulo na resposta correta, em cada uma das seguintes afirmações, que são
baseadas na tabela.
a) O número de classes na tabela é 5, 30, 90.

b) A amplitude da classe é 6, 7, 34.

c) O ponto médio da terceira classe é 16,5; 17; 17,5.

d) A fronteira inferior da segunda classe é 6,5; 7; 7,5.

e) O limite superior da segunda classe é 12,5; 13; 13,5.

f) O tamanho da amostra é 5, 90, 11.

g) A freqüência relativa da segunda classe é 0,22; 0,41; 0,30.

33
Lista de Exercícios:

1) Complete a tabela abaixo:

i Classes fi fr i Fi Fr i
1 0 8 4
2 8 16 10
3 16 24 14
4 24 32 9
5 32 40 3
∑=40 ∑=1,00

2) O posto de saúde de um certo bairro mantém um arquivo com o número de crianças nas
famílias que se utilizam do Posto. Os dados são os seguintes:

3 4 3 4 5 1
6 3 4 5 3 4
3 3 4 3 5 5
5 5 6 11 10 2
1 2 3 1 5 2
a) Organize uma tabela de freqüência.

b) Faça a representação gráfica.

34
3) Um empregado perdeu uma das 10 notas de compras feitas na hora do
encerramento. O valor médio de todas as 10 notas era de R$7,20, e as nove
notas restantes tinham os valores

R$4,80 R$7,10 R$7,90


R$9,55 R$4,45 R$5,72
R$7,54 R$8,34 R$9,70

Qual é o valor da nota perdida?

4) A tabela abaixo informa os tipos de lazer preferidos por 80 garotos da 1ª série do ensino
médio de um colégio.

Lazer Freqüência Absoluta Freqüência Relativa


Jogar futebol com os amigos 48 a
Computador e videogame b c
Paquerar no Shopping d e
Viajar para a praia f g
∑=80 1,00

Complete a tabela, sabendo que c é o dobro de e , que é o quíntuplo de g.

35
5) A tabela seguinte informa os valores de 160 empréstimos solicitados a um banco por
pessoas físicas durante uma semana.

Valor do Empréstimo (em R$) Freqüência Absoluta Freqüência Relativa


200 400 a b
400 600 60 c
600 800 d e
800 1000 f 0,05
1000 1200 g h
Total ∑=160 ∑=1,00

Complete a tabela, sabendo que 52,5% dos empréstimos representavam valores


2
maiores ou iguais a R$600,00 e que, entre eles, eram inferiores a R$800,00.
3

6) Os gráficos seguintes mostram a disposição dos alunos das turmas da 3ª série do ensino
médio para fazer cursinho pré-vestibular paralelamente a freqüentar a aulas do colégio.

36
Sabendo que as turmas da manhã contam com 340 alunos e as da tarde com 280 alunos,
determine:
a) o número total de alunos que não pretendem fazer cursinho;

b) a diferença entre o número de alunos do vespertino e do matutino que pretendem fazer


cursinho o ano inteiro.

7) Em uma cidade, o mercado de leite é disputado por quatro marcas: X, Y, Z e W. Os


resultados de uma sondagem a propósito da marca preferida, realizada com 400
consumidores, estão parcialmente apresentados na tabela e no gráfico seguinte.

____________________________________________
Marca de Preferência Freqüência Absoluta
____________________________________________
X 230
Y 120
Z .....
W .....
___________________________________________

Determine:
a) a diferença entre o número de consumidores que preferem Z a W.

b) diferença entre os ângulos correspondentes a X e Y.

37
3- MEDIDAS DESCRITIVAS NUMÉRICAS

3.1- MEDIDAS DE TENDÊNCIA CENTRAL PARA DADOS NÃO-


AGRUPADOS

Uma medida de tendência central fornece o centro de um histograma ou de uma curva


de distribuição de freqüências. Esta seção trata de três diferentes medidas de tendência
central: a média aritmética, a mediana e a moda. Vamos calcular cada uma dessas medidas
para dados não-agrupados. Lembre-se de que os dados que fornecem informações em
relação a cada membro da população ou amostra, individualmente, são conhecidos como
dados não-agrupados, enquanto dados agrupados são apresentados em forma de tabela de
distribuição de freqüência.

3.1.1- Média Aritmética

A média aritmética, também conhecida como média, representa a medida de


tendência central mais freqüentemente utilizada. Para os dados não-agrupados, a média
aritmética é obtida por meio da divisão da soma de todos os valores pelo número de valores
do conjunto de dados.

Média Aritmética = Soma de todos os valores / Número de valores

Calculando a média aritmética para dados não-agrupados - A média aritmética


para dados não-agrupados é obtida por meio da divisão da soma de todos os valores pelo
número de valores no conjunto de dados. Por conseguinte,

Média aritmética para dados da população: µ = ∑


x
N

Média aritmética para dados de amostras: x = ∑


− x
n

em que ∑x corresponde à soma de todos os valores, N representa o tamanho da


população, n corresponde o tamanho da amostra, µ representa a média aritmética da

população e x corresponde à média aritmética da amostra.

Exemplo 3.1
A tabela 3.1 fornece o total de folhas de pagamento de 2002, correspondentes a cinco
times da Liga Principal de Beisebol (MLB – Major baseball League).

Tabela 3.1

38
____________________________________________________
Time da MLB Total de Folha de Pagamento de 2002
(milhões de dólares)
____________________________________________________
Anaheim Angels 62
Atlanta Braves 93
New York Yankees 126
St. Louis Cardinals 75
Ta,mpa Bay Devil Rays 34
__________________________________________________

Encontre a média das folhas de pagamento de 2002 desses cinco times da MLB.

Portanto, a média aritmética da folha de pagamento de 2002 desses cinco times da


MLB correspondeu a ..............

Exemplo 3.2
Os dados a seguir representam as idades de todos os oito empregados de uma
pequena empresa:
53 32 61 27 39 44 49 57
Encontre a média aritmética da idade desses empregados.

Portanto, a média aritmética da idade de todos os oito empregados dessa empresa é


igual a ...........................................

Às vezes, um conjunto de dados pode conter alguns poucos valores demasiadamente


pequenos, ou alguns poucos valores demasiadamente grandes. Esses valores são conhecidos
como outliers ou valores extremos.

Definição

39
Outliers ou Valores Extremos – Valores que são demasiadamente pequenos, ou
demasiadamente grandes, em relação à maior parte dos valores em um conjunto de dados,
são chamados de outliers ou valores extremos.

Exemplo 3.3
A tabela 3.2 apresenta uma lista das populações no ano de 2000 (em milhares), dos
cinco estados norte-americanos na costa do Pacífico.
Tabela 3.2
__________________________________________
Estado População (milhares)
__________________________________________
Washington 5894
Oregon 3421
Alasca 627
Havaí 1212
Califórnia 33.872
_________________________________________

Portanto, a inclusão da Califórnia causa um aumento equivalente a mais de três


vezes o valor da média aritmética, uma vez que a média aritmética muda de 2788,5 mil para
9005,2 mil.

3.1.2 – Mediana

Outra medida importante de tendência central corresponde à mediana.

Definição

Mediana – A mediana representa o valor relativo ao termo posicionado no meio em


um conjunto de dados que tenha sido classificado em ordem crescente.

O cálculo da mediana consiste em duas etapas:

1) Classificar o conjunto de dados em ordem crescente.


2) Encontrar o termo posicionado no meio.
n +1
Posição do termo do meio = .
2
Podemos redefinir mediana da seguinte maneira:

40
Valor da Mediana para Dados Não-Agrupados

 n +1 
Mediana = Valor do   ésimo termo em um conjunto de dados classificados.
 2 

Caso o número de observações em um conjunto de dados seja ímpar, então a


mediana é fornecida pelo valor do termo posicionado no meio dos dados classificados. Se o
número de observações for par, então a mediana é fornecida pela média dos valores
correspondentes aos dois termos do meio.

Exemplo 3.4
Os dados a seguir fornecem a perda de peso (em libras) de uma amostra de cinco
membros de um clube de saúde ao final de dois meses de associação ao clube.
10 5 19 8 3
Encontre a mediana.

A mediana da perda de peso para essa amostra de cinco membros desse clube de
saúde corresponde a .................................

3.1.3 – Moda

Na estatística, a moda representa o valor mais comum em um conjunto de dados.

Definição

Moda - A moda corresponde ao valor que ocorre com a maior freqüência em um


conjunto de dados.

Exemplo 3.5
Os dados a seguir fornecem as velocidades (em milhas por hora) de oito carros, que foram
parados na I-95 por excesso de velocidade.
77 69 74 81 71 68 74 73
Encontre a moda.

41
Exemplo 3.6
As rendas do ano passado, para cinco famílias aleatoriamente selecionadas. Foram
$36.150; $95.750; $54.985; $77.490 e $23.740. Encontre a moda.

Exemplo 3.7
Os preços de uma mesma marca de aparelho de televisão, em oito lojas, foram
registrados como $495; $486; $503; $495; $470; $505; $470 e $499. Encontre a moda.

Exemplo 3.8
As idades de 10 alunos aleatoriamente selecionados, a partir de uma sala de aula,
são 21, 19, 27, 22, 29, 19, 25, 21, 22 e 30. Encontre a moda.

3.1.4 – Relações entre a Média Aritmética, a Mediana e a Moda

1) Para um histograma e uma curva de freqüências simétricos, com um


único pico, os valores da média aritmética, da mediana e da moda são
idênticos e se posicionam no centro da distribuição.

2) Para um histograma e uma curva de freqüências assimétricos à direita, o valor da


média aritmética é o maior deles, o valor para a moda é o menor deles, e o valor
correspondente à mediana se posiciona entre esses dois valores. (Observe que a moda
sempre ocorre no ponto correspondente ao pico). O valor da média aritmética é o maior

42
neste caso, uma vez que é sensível a valores extremos que ocorrem na cauda direita. Esses
valores extremos puxam a média aritmética para a direita.

3) Caso o histograma e a curva de distribuição sejam assimétricos à esquerda, o


valor da média aritmética é o menor deles, e o valor para a moda é o maior deles, com o
valor da mediana se posicionando entre esses dois valores. Neste caso, os valores extremos
na cauda esquerda puxam a média aritmética para a esquerda.

3.2 – MEDIDAS DE DISPERSÃO PARA DADOS NÃO-AGRUPADOS

Esta seção discute sobre três medidas de dispersão: a amplitude, a variância e o


desvio padrão.

3.2.1 – Amplitude

A amplitude representa a medida de dispersão mais simples de calcular. Para obter


a amplitude, toma-se a diferença entre o maior valor e o menor valor em um conjunto de
dados.

Encontrando a Amplitude para Dados Não-Agrupados

Amplitude = Maior valor-Menor valor

43
Exemplo 3.9
A tabela 3.3 fornece as áreas totais, em milhas quadradas, correspondentes aos
quatro estados do lado oeste do Centro-Sul dos Estados Unidos.

Tabela 3.3
_____________________________________________
Estados Área Total (milhas ao quadrado)
_____________________________________________
Arkansas 53.182
Louisiana 49.651
Oklahoma 69.903
Texas 267.277
____________________________________________

Encontre a amplitude para esse conjunto de dados.

Assim sendo, as áreas totais desses quatro estados encontram-se dispersas ao longo
de uma amplitude de ....................milhas quadradas.

3.2.2- Variância e Desvio-Padrão

O desvio-padrão representa a medida de dispersão mais utilizada. O valor relativo


ao desvio-padrão nos informa quão próximos os valores de conjunto de dados estão
agrupados em torno da média aritmética.
O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância. A
variância calculada para os dados da população é representada por σ 2 (lê-se sigma ao
quadrado), e a variância calculada para dados de amostras é representada por s 2 .
2

∑ x − x 

∑( x − µ)
2

σ2 = e
N s2 =
n −1

em que σ 2 corresponde à variância da população e s 2 corresponde à variância da amostra.


O valor x − µ ou x − x nas fórmulas acima é chamado de desvio do valor de x em

relação à média aritmética. A soma dos desvios dos valores de x em relação à média
∑( x − µ) = 0 e ∑x − x  =0 .

aritmética é sempre igual a zero; ou seja,
Por exemplo, suponha que os resultados de final de semestre, para uma amostra
contendo quatro alunos, sejam 82, 95, 67 e 92. Então, a média aritmética do resultado
relativo a esses quatro alunos é

44
− 82 + 95 + 67 + 92
x= = 84
4

Os desvio dos quatro resultados em relação à média aritmética são calculados na


tabela 3.4. Como podemos observar a partir da tabela, a soma dos desvio dos valores de x
 −

em relação à média aritmética é igual a zero; ou seja, ∑

x − x  =0 . Por esta razão,

elevamos os desvios ao quadrado para calcular a variância e o desvio-padrão.

Tabela 3.4
__________________________

x x−x
__________________________
82 82 – 84 = -2
95 95 – 84 = +11
67 67 – 84 = -17
92 92 – 84 = +8
___________________________

Do ponto de vista de cálculos, é mais fácil e mais eficiente utilizar fórmulas de


atalho para calcular a variância e o desvio-padrão. Utilizando as fórmulas de atalho,
reduzimos o tempo de cálculo e erros decorrentes de arredondamentos. As fórmulas de
atalho para se calcular a variância e o desvio-padrão são apresentadas a seguir.

Fórmulas de Atalho para Variância e Desvio-Padrão para Dados Não-


Agrupados

(∑ x) 2
(∑ x) 2

∑x 2

N e ∑x 2

n
σ2 = s2 =
N n −1
em que σ 2 corresponde à variância da população e s 2 representa a variância da amostra.

O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância.

Desvio-padrão da população: σ = σ 2
Desvio-padrão da amostra: s = s 2

Exemplo 3.10
Volte aos dados da tabela 3.1 sobre as folhas de pagamento de 2002 (em milhões de
dólares) de cinco times da MLB. Esses dados são aqui reproduzidos.

45
____________________________________________________
Time da MLB Total de Folha de Pagamento de 2002
(milhões de dólares)
____________________________________________________
Anaheim Angels 62
Atlanta Braves 93
New York Yankees 126
St. Louis Cardinals 75
Ta,mpa Bay Devil Rays 34
__________________________________________________

Encontre a variância e o desvio-padrão para esses dados.

Tabela 3.5
____________________________________
x x2
____________________________________
62
93
126
75
34
____________________________________
∑x =390 ∑x 2
=
____________________________________

Assim sendo, o desvio-padrão das folhas de pagamento de 2002 desses cinco times
da MLB corresponde a ...........................

OBS:

1) Os valores da variância e do desvio-padrão nunca são negativos.

2) As unidades de medida da variância são sempre iguais ao quadrado das unidades


de medidas dos dados originais. Isso ocorre porque os valores originais são elevados ao
quadrado para se calcular a variância.

46
Exemplo 3.11
Apresentamos a seguir os rendimentos de 2002 (em milhares de dólares), sem
impostos, para todos os seis empregados de uma pequena empresa.

48,50 38,40 65,50 22,60 79,80 54,60

Calcule a variância e o desvio-padrão para esses dados.

Tabela 3.6
____________________________________
x x2
____________________________________
48,50
38,40
65,50
22,60
79,80
54,60
____________________________________
∑x =30 9,40 ∑x 2
=
____________________________________

Por conseguinte, o desvio-padrão dos rendimentos de 2002, para todos os seis


empregados da empresa, é ..............

3.2.3 – Parâmetros da População e Estatísticas da Amostra

Uma medida numérica, tal como a média aritmética, a mediana, a moda, a


amplitude, a variância ou o desvio-padrão, calculada para um conjunto de dados de uma
população, é conhecida como um parâmetro da população, ou simplesmente parâmetro.
Uma medida resumida, calculada para um conjunto de dados de uma amostra, é chamada
de estatística da amostra, ou simplesmente estatística. Assim sendo, µ e σ

correspondem a parâmetros da população, enquanto x e s correspondem a estatísticas da
amostra.

47
3.3 – MÉDIA ARITMÉTICA, VARIÂNCIA E DESVIO-PADRÃO PARA
DADOS AGRUPADOS

3.3.1 – Média Aritmética para dados agrupados

As fórmulas utilizadas para calcular a média aritmética para dados agrupados são
apresentadas a seguir.

Calculando a Média Aritmética para Dados Agrupados

Média aritmética para dados de populações: µ = ∑


mf
N

Média aritmética para dados de amostras: x = ∑


− mf
n

em que m corresponde ao ponto médio e f corresponde à freqüência de uma classe.

Para calcular a média aritmética para dados agrupados, inicialmente encontre o


ponto médio de cada classe e, em seguida, multiplique os pontos médios pelas freqüências
das classes correspondentes. A soma desses produtos, representada por ∑mf , fornece
uma aproximação para a soma de todos os valores. Para encontrar o valor da média
aritmética, divida essa soma pelo número total de observações nos dados.

Exemplo 3.12
A tabela 3.7 fornece a distribuição de freqüências dos tempos gastos com transporte
por dia (em minutos), de casa para o trabalho, para todos os 25 empregados de uma
empresa.

Tabela 3.7
______________________________________________________________
Tempo Gasto Diariamente com Transporte Número de
(minutos) Empregados
______________________________________________________________
0 até menos que 10 4
10 até menos que 20 9
20 até menos que 30 6
30 até menos que 40 4
40 até menos que 50 2

48
______________________________________________________________

Calcule a média aritmética para os tempos gastos diariamente com transporte.

Solução: Observe que, na tabela 3.8, m representa os pontos médios das classes.

Tabela 3.8
___________________________________________________________________
Tempo Gasto Diariamente com Transporte f m mf
(minutos)
___________________________________________________________________
0 até menos que 10 4 5 20
10 até menos que 20 9 15 135
20 até menos que 30 6 25 150
30 até menos que 40 4 35 140
40 até menos que 50 2 45 90
____________________________________________________________________
n = 25 ∑mf =535
____________________________________________________________________

A média aritmética é obtida dividindo-se essa soma pela freqüência total. Por conseguinte,
µ=
∑mf =
N

Assim sendo, os empregados da empresa gastam..........minutos por dia, em média,


com transporte de casa para o trabalho.

Exemplo 3.13
A tabela 3.9 fornece a distribuição de freqüências do número de pedidos recebidos a
cada dia, durante os últimos 50 dias, no escritório de uma empresa de entrega de
encomendas.

Tabela 3.9
____________________________________________
Número de Pedidos Número de Dias
____________________________________________
10 12 4
13 15 12
16 18 20
19 21 14
____________________________________________

49
Calcule a média aritmética.

Solução: Uma vez que o conjunto de dados inclui somente 50 dias, ele representa uma
amostra. O valor de ∑mf é calculado na tabela 3.7.

Tabela 3.10
_________________________________________________
Número de Pedidos f m mf
_________________________________________________
10 12 4 11 44
13 15 12
16 18 20
19 21 14
__________________________________________________
n = 50 ∑mf =832

O valor da média aritmética da amostra é



x=
∑mf =
n

Por conseguinte, esta empresa de entrega de encomendas recebeu uma média


de ...........pedidos por dia durante esses 50 dias.

3.3.2 – Variância e Desvio-Padrão para Dados Agrupados

Apresentaremos a seguir o que chamaremos de fórmulas básicas, utilizadas para


calcular a variância da população e a variância da amostra para dados agrupados.
2
 −

σ2 =
∑ f (m − µ) 2

e ∑ f m − x 
 
N s =
2

n −1

em que σ 2 corresponde à variância da população, s 2 representa a variância da amostra e


m corresponde ao ponto médio de uma classe.

Novamente, as fórmulas de atalho são mais eficientes para o cálculo da variância e


do desvio-padrão.

Fórmulas de Atalho para a Variância e para o Desvio-Padrão relativas a Dados


Agrupados

50
( ∑ mf ) 2
( ∑ mf ) 2

∑m 2
f −
N e ∑m 2
f −
n
σ =
2
s =
2

N n −1

em que σ 2 corresponde à variância da população, s 2 representa a variância da amostra e


m corresponde ao ponto médio de uma classe.

O desvio-padrão é obtido extraindo-se a raiz quadrada positiva da variância.


Desvio-padrão da população: σ = σ 2

Desvio-padrão da amostra: s = s 2

Exemplo 3.14
Os dados a seguir apresentados da tabela 3.8, fornecem a distribuição de freqüências
dos tempos diários gastos com transporte (em minutos) de casa para o trabalho para todos
os 25 empregados de uma empresa.

______________________________________________________________
Tempo Gasto Diariamente com Transporte Número de
(minutos) Empregados
______________________________________________________________
0 até menos que 10 4
10 até menos que 20 9
20 até menos que 30 6
30 até menos que 40 4
40 até menos que 50 2
______________________________________________________________

Calcule a variância e o desvio-padrão.

Tabela 3.11
_________________________________________________________________________
Tempo Gasto Diariamente com Transporte f m mf m2 f
(minutos)
_________________________________________________________________________
0 até menos que 10 4 5 20 100
10 até menos que 20 9
20 até menos que 30 6
30 até menos que 40 4
40 até menos que 50 2
N = 25 ∑mf =535
∑m 2
f =14 .825

51
Etapa 1. Calcular o valor de ∑mf .

Etapa 2. Encontre o valor de ∑m 2


f .

Etapa 3. Calcule a Variância.


( ∑ mf ) 2
∑m f − N =
2

σ2 =
N

Etapa 4. Calcule o desvio-padrão.

σ = σ2 =

Assim sendo, o desvio-padrão dos tempos gastos diariamente com transporte, para
esses empregados, corresponde a ...........minutos.

Exemplo 3.15
Os dados a seguir apresentados, reproduzidos da Tabela 3.9, fornecem a distribuição
de freqüências do número de pedidos recebidos a cada dia, durante os últimos 50 dias, no
escritório de uma empresa de encomendas.
____________________________________________
Número de Pedidos f
____________________________________________
10 12 4
13 15 12
16 18 20
19 21 14
____________________________________________

Calcule a variância e o desvio-padrão.

Tabela 3.12
______________________________________________________________________

52
Número de Pedidos f m mf m2 f
______________________________________________________________________
10 12 4 11 44 484
13 15 12
16 18 20
19 21 14
n = 50 ∑mf =832 ∑m 2 f =14 .216

Colocando os valores na fórmula correspondente à variância da amostra, obtemos

( ∑ mf ) 2

∑m 2
f −
n =
s =
2

n −1

Portanto o desvio-padrão é igual a

s = s2 =

Logo, o desvio-padrão do número de mordidas recebidas no escritório desse


empresa de entrega de encomendas, durante os últimos 50 dias, é igual a ...........

3.4 – UTILIZAÇÃO DO DESVIO-PADRÃO

Utilizando a média aritmética e o desvio-padrão, podemos encontrar a proporção ou


a percentagem das observações totais, que se posicionam dentro de um determinado
intervalo em torno da média aritmética. Esta seção discute sucintamente o teorema de
Chebyshev e a regra empírica, que demonstram essa utilização do desvio-padrão.

3.4.1 – Teorema de Chebyshev

O teorema de Chebyshev fornece um limite inferior para a área sob a curva entre
dois pontos que se encontram em lados opostos da média aritmética e à mesma distância da
média aritmética.

Definição

53
O Teorema de Chebyshev – Para qualquer número k maior que 1, pelo menos
 1 
1 − 2  dos valores de dados se posicionam dentro dos limites de k desvios-padrão em
 k 
relação à média aritmética.
A figura 3.5 ilustra o teorema de Chebyshev.

Assim, por exemplo, se k = 2 , então


1
1− 2 =
k

Portanto, de acordo com o teorema de Chebyshev, pelo menos 0,75 ou 75% dos
valores de um conjunto de dados se posicionam dentro dos limites de dois desvios-padrão
em relação à média aritmética. Isso é mostrado na Figura 3.6.

Se k = 3 , então,
1
1− =
k2

De acordo com o teorema de Chebyshev, pelo menos 0,89 ou 89% dos valores irão
se posicionar dentro dos limites de três desvios-padrão em relação à média aritmética. Isso
é mostrado na Figura 3.7.

54
Embora nas Figuras 3.5 a 3.7 tenhamos utilizado a notação da população para a
média aritmética e para o desvio-padrão, o teorema se aplica tanto a dados de amostras
quanto a dados de populações. Observe que o teorema de Chebyshev é aplicável a uma
distribuição com qualquer formato. Entretanto, o teorema de Chebyshev pode ser utilizado
1
somente para k >1 . Isso ocorre dessa maneira porque quando k =1 , o valor 1 − 2 é
k
1
zero, e quando k <1 , o valor de 1 − 2 é negativo.
k
Exemplo 3.16
Constatou-se que a pressão sanguínea sistólica média para 400 mulheres que foram
avaliadas em relação a pressão sanguínea elevada era 187, com um desvio-padrão de 22.
Utilizando o teorema de Chebyshev, encontre qual a percentagem mínima de mulheres
nesse grupo que apresenta pressão sanguínea sistólica entre 143 e 231.

Sejam µ =187 e σ = 22 .

Para encontrar a percentagem de mulheres cujas pressões sanguíneas sistólicas


encontram entre 143 e 231, a primeira etapa corresponde a determinar o k.

O valor de k é obtido dividindo-se a distância entre a média aritmética e cada um


dos pontos, pelo desvio-padrão. Assim sendo,

Portanto de acordo com o teorema de Chebyshev, pelo menos 75% das mulheres
apresentam pressão sanguínea sistólica entre 123 e 231. Essa porcentagem é mostrada na
Figura 3.8.

55
3.4.2 – Regra Empírica

Regra Empírica – Para uma distribuição em formato de sino, aproximadamente.


1. 68% das observações se posicionam dentro dos limites de um desvio-padrão em
relação à média aritmética.

2. 95% das observações se posicionam dentro dos limites de dois desvios-padrão em


relação à média aritmética.

3. 99,7% das observações se posicionam dentro dos limites de três desvios-padrão


em relação à média aritmética.

A figura 3.9 ilustra a regra empírica. Novamente, a regra empírica se aplica a dados
de populações, bem como a dados de amostras.

Exemplo 3.17
A distribuição das idades de uma amostra de 5000 pessoas tem formato de sino,
com média aritmética de 40 anos e desvio-padrão de 12 anos. Determine a percentagem
aproximada de pessoas que estão entre16 e 64 anos.
Solução:
Com base nas informações fornecidas para essa distribuição,

x = 40 anos e s =12 anos

Cada um dos dois pontos, 16 e 64, encontra-se 24 unidades distante da média


aritmética. Dividindo 64 por 12, convertemos a distância entre cada um dos dois pontos e a

56
média aritmética, em termos de desvio-padrão. Assim, a distância entre 16 e 40 e entre 40 e
64 é, cada qual, igual a 2 s . Conseqüentemente, como mostra a figura 3.10, a área desde 16
− −
até 64 corresponde a área desde x − 2 s até x + 2 s .

3.5 – MEDIDAS DE POSIÇÃO

Uma medida de posição determina a posição de um único valor em relação a outros


valores em um conjunto de dados de amostra ou um conjunto de dados de população.
Existem muitas medidas de posição; entretanto, discutiremos apenas quartis, percentis e
classificação de percentis.

3.5.1 – Quartis e Amplitude Interquartil

Quartis são as medidas resumidas que dividem um conjunto de dados classificados


em quatro partes iguais. Essas três medidas correspondem ao primeiro quartil
(representado por Q1 ), ao segundo quartil (representado por Q2 ) e ao terceiro quartil
(representado por Q3 ). Os dados devem ser classificados em ordem crescente antes que os
quartis sejam determinados. Os quartis são definidos da seguinte maneira.

Definição

Quartis – Quartis representam três medidas resumidas que dividem um conjunto de


dados classificados em quatro partes iguais. O segundo quartil é o mesmo que a mediana
para um conjunto de dados. O primeiro quartil representa valor do termo do meio, entre as
observações que são menores que a mediana, e o terceiro quartil representa o valor do
termo do meio, entre as observações que são maiores que a mediana.

A figura 3.11 descreve as posições dos três quartis.

57
A diferença entre o terceiro quartil e o primeiro quartil para um conjunto de dados é
chamada de amplitude interquartil (AIQ).

Calculando a Amplitude Interquartil – A diferença entre o terceiro quartil e o


primeiro quartil fornece a amplitude interquartil; ou seja,

AIQ = Amplitude interquartil = Q3 − Q1

Exemplo 3.18
Os dados a seguir correspondem a idades de nove empregados de uma empresa seguradora:
47 28 39 51 33 37 59 24 33

a) Encontre os dados dos três quartis. Onde a idade de 28 anos se posiciona em relação às
idades desses empregados?

b) Encontre a amplitude interquartil.

58
3.5.2 – Percentis e Classificação de Percentil

Percentis são as medidas resumidas que dividem um conjunto de dados classificados


em 100 partes iguais. Cada conjunto de dados (classificados) tem 99 percentis, que dividem
o mesmo em 100 partes iguais. Os dados devem ser classificados em ordem crescente para
o cálculo dos percentis. O k . 0 percentil é representado por Pk , sendo que k representa
um número inteiro no intervalo entre 1 e 99. Por exemplo, o 25 . 0 percentil é representado
por P25 . A figura 3.12 mostra as posições dos 99 percentis.

Logo, o k . 0 percentil, Pk pode ser definido como um valor em um conjunto de


dados tal que cerca de k % das medições sejam menores que o valor de Pk e cerca de (
100 − k )% das medições sejam maiores que o valor de Pk .
O valor aproximado do k . 0 percentil é determinado da maneira explicada a seguir.

Calculando Percentis – O valor (aproximado) do k . 0 percentil, representado por


Pk , é
 kn 
Pk = Valor do   ésimo termo em um conjunto de dados classificados.
 100 
Em que k representa o número do percentil e n representa o tamanho da amostra.

Exemplo 3.19
Os dados a seguir fornecem as velocidades, medidas por radar, de 13 carros que
trafegam na rodovia I-84.
73 75 69 68 78 69 74
76 72 79 68 77 71
a) Encontre os valores dos três quartis e a amplitude interquartil.

59
b) Calcule o valor (aproximado) do 35 .0 percentil.

c) Encontre a classificação de percentil de 71.

Exercícios:
1) Os dados a seguir apresentados fornecem o número de horas gastas em festas, por 10
alunos de faculdade aleatoriamente selecionados, durante a última semana.
7 14 5 0 9 7 10 4 0 8
Calcule a média aritmética, a mediana e a moda.

60
2) Para quaisquer dados, a soma de todos os valores é igual ao produto entre o tamanho da
amostra e a média aritmética. Suponha que a média da quantia em dinheiro gasta em
compras por 10 pessoas durante uma determinada semana, seja $85,50. Encontre a quantia
total em dinheiro, gasta em compras, por essas 10 pessoas.

3) Os dados a seguir fornecem o número de pessoas que realizam furtos em lojas, flagradas
durante cada uma das oito últimas semanas em uma grande loja de departamentos.
7 10 8 3 15 12 6 11

a) Encontre a média aritmética para esses dados. Calcule os desvios dos valores de dados,
em relação a média aritmética. A soma desses valores é igual a zero?

b) Calcule a amplitude, a variância e o desvio-padrão.

61
4) A tabela a seguir fornece a distribuição de freqüências para total de horas gastas fora da
sala de aula em exercícios aeróbicos, durante um curso de educação física para adultos,
com duração de 12 semanas, por 30 adultos matriculados no curso.

____________________________________________
Horas de Exercício Número de adultos
____________________________________________
0 até menos que 30 1
30 até menos que 60 6
60 até menos que 90 10
90 até menos que 120 7
120 até menos que 150 4
150 até menos que 180 2
____________________________________________

Encontre a média aritmética, a variância e o desvio-padrão.

Horas de Exercício f m mf m2 f
0 até menos que 30 1
30 até menos que 60 6
60 até menos que 90 10
90 até menos que 120 7
120 até menos que 150 4
150 até menos que 180 2

62
5) As vendas brutas de 2002, para todas as empresas de uma grande cidade, tem média
aritmética de $2,3 milhões e desvio-padrão de $0,6 milhão. Utilizando o teorema de
Chebyshev, encontre a percentagem mínima de empresas da cidade que tiveram vendas
brutas em 2002 de:
a) $1,1 a $3,5 milhões

b) $0,8 a $3,8 milhões

c) $0,5 a $4,1 milhões

Lista de Exercícios:

1) O valor do termo do meio em um conjunto de dados classificados é chamado de


a. média aritmética b. mediana c. moda

2) Qual, ou quais, das seguintes medidas resumidas é influenciada por valores extremos?
a. média aritmética b. mediana c. moda d. amplitude

63
3) Qual, ou quais, das medidas resumidas a seguir pode ser calculada para dados
qualitativos?
a. média aritmética b. mediana c. moda

4) Qual, ou quais, das seguintes medidas resumidas pode ter mais de um valor?
a. média aritmética b. mediana c. moda

5) Qual, ou quais, das seguintes medidas resumidas é obtida tomando-se a diferença entre o
maior valor e o menor valor de um conjunto de dados?
a. variância b. amplitude c. média aritmética

6) Qual das seguintes medidas corresponde à média aritmética dos desvios elevados ao
quadrado de valores de x em relação à média aritmética?
a. desvio-padrão b. variância da população c. variância da amostra

7) Os valores da variância e do desvio-padrão são


a. nunca negativos b. sempre positivos c. nunca iguais a zero

8) Uma medida resumida calculada para os dados da população é chamada de


a. um parâmetro da população b. uma estatística da amostra c. um valor extremo

9) Uma medida numérica calculada para os dados da amostra é chamada de


a. um parâmetro da população b. uma estatística da amostra c. box-plot

10) O teorema de Chebyshev pode ser aplicado em


a. qualquer distribuição
b. apenas distribuição em formato de sino
c. apenas distribuições assimétricas

11) A regra empírica pode ser aplicada em


a. qualquer distribuição
b. apenas distribuição em formato de sino
c. apenas distribuições assimétricas

12) O primeiro quartil corresponde a um valor em um conjunto de dados classificados, de


maneira tal que cerca de
a. 75% dos valores são menores e cerca de 25% são maiores que esse valor
b. 50% dos valores são menores e cerca de 50% são maiores que esse valor
c. 25% dos valores são menores e cerca de 75% são maiores que esse valor

13) O terceiro quartil corresponde a um valor em um conjunto de dados classificados, de


maneira tal que cerca de
a. 75% dos valores são menores e cerca de 25% são maiores que esse valor
b. 50% dos valores são menores e cerca de 50% são maiores que esse valor
c. 25% dos valores são menores e cerca de 75% são maiores que esse valor

64
14) O 75.º percentil corresponde a um valor em um conjunto de dados classificados, de
maneira tal que cerca de
a. 75% dos valores são menores e cerca de 25% são maiores que esse valor
b. 25% dos valores são menores e cerca de 75% são maiores que esse valor

15) Os dados a seguir fornecem o número de vezes em que 10 pessoas utilizaram seus
cartões de crédito durante os últimos três meses.

9 6 28 14 2 18 7 3 16 6

Calcule a média aritmética, a mediana, a moda, a amplitude, a variância e o desvio-padrão.

16) A tabela a seguir fornece a distribuição de freqüências dos números de computadores


vendidos durante as últimas 25 semanas em uma loja de computadores.
____________________________________________
Computadores Vendidos Freqüência
____________________________________________
4a9 2
10 a 15 4
16 a 21 10
22 a 27 6
28 a 33 3
___________________________________________

a. O que representa a coluna de freqüências na tabela?

b. Calcule a média aritmética, a variância e o desvio-padrão.

65
17) Os carros possuídos por todas as pessoas que vivem em uma cidade tem, em média, 7,3
anos de uso, com desvio-padrão de 2,2 anos.
a. Utilizando o teorema de Chebyshev, encontre a percentagem mínima de carros nessa
cidade que têm
i) 1,8 a 12,8 anos de uso

ii) 0,7 a 13,9 anos de uso

b. Utilizando o teorema de Chebyshev, encontre o intervalo que contém os anos de uso de


pelo menos 75% dos carros possuídos por todas as pessoas nessa cidade.

66
18) ) Os anos de uso de carros possuídos por todas as pessoas que vivem em uma cidade
apresentam uma distribuição em formato de sino, com média aritmética de 7,3 anos e
desvio-padrão de 2,2 anos.
Utilizando a regra empírica, encontre a percentagem de carros nessa cidade que têm
i) 5,1 a 9,5 anos de uso

ii) 0,7 a 13,9 anos de uso

19) Os dados a seguir fornecem o número de vezes em que um detector de metais foi
acionado por passageiros em um pequeno aeroporto, durante 15 períodos consecutivos de
meia hora, em 1.º de fevereiro de 2003.

7 2 12 13 0 8 10
15 3 5 14 20 1 11 4

67
a. Calcule os três quartis e a amplitude interquartil. Onde o valor de 4 se posiciona em
relação a esses quartis?

b. Encontre o valor (aproximado) do 60.º percentil.

c. Calcule a classificação de percentil de 12.

20) A média aritmética dos salários semanais de uma amostra de 15 empregados de uma
empresa é igual a $435. A média aritmética dos salários semanais de uma amostra de 20
empregados de uma outra empresa é igual a $490. Encontre a média aritmética combinada
para esses 35 empregados.

EXERCÍCIOS COMPLEMENTARES

1) O conjunto de dados a seguir fornece os números de anos durante os quais 24


trabalhadores permaneceram em seu emprego atual.

15 12 9 10 5 12 3 7 16 13 11 4
3 8 7 14 11 8 4 13 2 18 6 19

68
a) Construa uma distribuição de freqüências. Considere 1 o limite inferior da primeira
classe e 4 a amplitude de cada classe.

b) Calcule as freqüências relativas e as percentagens para todas as classes.

c) Que percentagem dos empregados permaneceu em seu emprego atual por oito anos ou
menos?

d) Desenhe o histograma de freqüências e o polígono.

2) Uma propriedade da média aritmética corresponde ao fato de que, caso conheçamos as


médias aritméticas e os tamanhos de amostra de dois (ou mais) conjuntos de dados,
podemos calcular a média aritmética combinada de ambos (ou de todos) os conjuntos de
dados. A média aritmética combinada para dois conjuntos de dados é calculada por meio da
fórmula

Média Aritmética Combinada = x− = n1 x1 + n 2 x 2
n1 + n 2

69
na qual n1 e n 2 correspondem aos tamanhos de amostras relativos a dois conjuntos de
− −
dados x 1 e x 2 correspondem às médias aritméticas dos dois conjuntos de dados,
respectivamente. Suponha que uma amostra contendo 10 livros de estatística fornecesse
uma média aritmética de preço correspondente a $95, e uma amostra contendo 8 livros de
matemática fornecesse uma média aritmética de preço correspondente a $104. Encontre a
média aritmética combinada.

3) A média aritmética da idade de seis pessoas corresponde a 46 anos. As idades


correspondentes a cinco dessas seis pessoas são iguais a 57, 39, 44, 51 e 37 anos. Encontre
a idade da sexta pessoa.

4) A média aritmética aparada é calculada retirando-se uma determinada percentagem dos


valores de cada extremidade de um conjunto de dados classificados. A média aritmética
aparada é especialmente útil como uma média de tendência central, quando um conjunto de
dados contém alguns poucos valores extremos, em cada uma das extremidades. Suponha
que os dados a seguir apresentados forneçam as idades de 10 empregados de uma empresa:

47 53 38 26 39 49 19 67 31 23

Para calcular a média aritmética aparada em 10%, inicialmente classifique esses valores de
dados em ordem crescente, em seguida, retire 10% dos menores valores e 10% dos maiores
valores. A média aritmética dos 80% remanescentes fornecerá uma média aritmética
aparada em 10%. A média aritmética dos 8 valores remanescentes corresponderá à média
aritmética aparada em 10%. Calcule a média aritmética aparada em 10% para esse conjunto
de dados.

70
5) A seguir são apresentadas as temperaturas (em graus Fahrenheit) observadas durante oito
dias de inverno em uma cidade do centro-oeste dos Estados Unidos.

23 14 6 -7 -2 11 16 19

Calcule a amplitude, a variância e o desvio-padrão.

6) Os salários anuais de todos os empregados que trabalham para uma empresa têm uma
média aritmética de $42350 e um desvio-padrão de $3820. Os anos de escolaridade para os
mesmos empregados têm uma média aritmética de 15 anos e um desvio-padrão de 2 anos.
A variação relativa nos salários é maior ou menor que a variação relativa correspondente
aos anos de escolaridade desses empregados?
σ
Para dados da população = CV = µ × 100 %
s
Para dados de amostra = CV = − × 100%
x

71
7) A média aritmética mensal de amortizações pagas por todos os proprietários de imóveis
em uma cidade é igual a $1365, com um desvio-padrão igual a $240.
a) Utilizando o teorema de Chebyshev, encontre a percentagem mínima de todos os
proprietários de imóveis naquela cidade que pagam uma amortização mensal de
i) $885 até $1845

ii) $645 até $2085

b) Utilizando o teorema de Chebyshev, encontre o intervalo que contém os pagamentos


mensais de amortização de pelo menos 84% de todos os proprietários de imóveis.

8) Os dados a seguir fornecem os pesos (em libras) perdidos por 15 membros em um clube
de saúde ao final de dois meses após terem ingressado no clube.

5 10 8 7 25 22 5 14
11 10 21 9 8 11 18

a) Calcule os valores dos três quartis e a amplitude interquartil.

72
b) Calcule o valor (aproximado) de 82.º percentil.

c) Encontre a classificação de percentil de 10.

9) Apresentamos a seguir as jardas conquistadas, durante a temporada de 2002, por 14 RBs


(corredores) de 14 times universitários de futebol americano.

745 921 1133 1024 848 775 800


1009 1275 857 933 1145 967 995

Prepare uma distribuição ramo-e-folha. Arrume em ordem crescente as folhas para cada
ramo.

10) Se numa livraria comprou-se 26 mapas a $1,6 cada; e 31 livros a $17,20 cada e 18
cadernos a $9,00 cada, qual é o custo médio por quantidade de artigos?

x=
∑p
Média Harmônica = p
∑x

73
11) Um estudante obtém as notas 60, 84 e 90 em testes, e 88 no exame final. Calcule a
média ponderada das notas se cada teste corresponde a 20% e o exame final corresponde a
40% da nota final.


Média Ponderada = x =
∑x. p
∑p

12) Numa sala de conferência sobre esportes, estão 42 alunos do curso de administração, 37
do curso de economia, 28 do curso de geografia e 19 do curso de ciências contábeis. As
percentagens dos alunos que praticam algum esporte, entre os presentes são,
respectivamente 82%, 71%, 90% e 54%. Qual a percentagem média dos alunos praticantes
de esportes que compareceram a essa conferência.

13) Um produto é vendido em três supermercados por $13,00/kg, $13,20/kg e $13,50/kg.


Determine quantos $/kg se paga em média pelo produto?

4 – PROBABILIDADE

4.1 - Experimento, Resultados e Espaço Amostral

Definição

Um experimento corresponde a um processo que, ao ser realizado, resulta em uma e


somente uma de muitas observações. Essas observações são conhecidas como resultados do

74
experimento. A coleção de todos os resultados para um experimento é conhecida como
espaço amostral.

Um espaço amostral é representado por S. Os elementos de um espaço amostral são


conhecidos como pontos da amostra.

A tabela 4.1 apresenta alguns exemplos de experimentos, seus resultados e seus


espaços amostrais.

Tabela 4.1
Exemplos de Experimentos, Resultados e Espaços Amostrais
Experimento Resultados Espaço Amostral
Lançar uma moeda uma única vez Cara, Coroa S={cara, Coroa}
Jogar um dado uma única vez 1, 2, 3, 4, 5, 6 S={1, 2, 3, 4, 5, 6}
Jogar na Loteria Ganhar, Perder S={Ganhar, Perder}
Selecionar um aluno Homem, Mulher S={Homem, Mulher}

O espaço amostral para um experimento também pode ser ilustrado desenhando-se


um diagrama de Venn ou um diagrama de árvore.
Os exemplos 4.1 a 4.3 descrevem a maneira de desenhar esses diagramas para
esperimentos estatísticos.

Exemplo 4.1
Desenhe os diagramas de Venn e de árvore para o experimento sobre o lançamento
único de uma moeda.
S={CA, CO}

Exemplo 4.2
Desenhe o diagrama de Venn e o diagrama de árvore para o primeiro sobre dois
lançamentos de uma moeda.
S={CACA, CACO, COCA, COCO}

75
Exemplo 4.3
Suponha que tenhamos selecionado aleatoriamente duas pessoas, entre os membros
de um clube, e tenhamos observado se a pessoa selecionada a cada vez é um homem ou
uma mulher. Escreva todos os resultados para este experimento. Desenhe o diagrama de
Venn e o diagrama de árvore para este experimento.

4.1.1 – Eventos Simples e Eventos Compostos

Um evento representa um ou mais resultados de um experimento.

Definição

Evento – Um evento corresponde a uma coleção de um ou mais dos resultados de


um experimento.

76
Um evento pode corresponder a um evento simples ou a um evento composto. Um
evento simples também é conhecido como evento elementar, e um evento composto é
também conhecido como evento múltiplo.

Definição

Evento Simples – Um evento que inclui em, e somente um, dos resultados (finais)
de um experimento é conhecido como evento simples, e é geralmente representado por E i .
O exemplo 4.4 descreve eventos simple.

Exemplo 4.4
Reconsidere o exemplo 4.3 sobre a seleção de duas pessoas entre os membros de um
clube, observando a pessoa selecionada a cada vez é homem ou mulher. Cada um dos
quatro resultados finais (HH, HM, MH e MM) para este experimento corresponde a um
evento simples. Esses quatro eventos podem ser representados por E1 , E 2 , E 3 eE 4 ,
respectivamente. Portanto,
E1 = ( HH ) , E 2 = ( HM ) , E 3 = ( MH ) e E 4 = ( MM )

Evento Composto

Um evento composto consiste em mais do que um resultado.

Definição

Evento Composto – Um evento composto corresponde a uma seleção de mais do


que um resultado para um experimento.

Exemplo 4.5
Reconsidere o exemplo 4.3, que trata da seleção de duas pessoas entre os membros
de um clube, observando a pessoa selecionada a cada vez corresponde a um homem ou a
uma mulher. Seja A o evento no qual no máximo um homem foi selecionado. O evento A
irá ocorrer se nenhum homem ou apenas um único homem for selecionado.
A={HM, MH, MM}
O diagrama de Venn na figura 4.4 traz a apresentação gráfica do evento composto A.

Exemplo 4.6
Em um grupo de pessoas, algumas são favoráveis à engenharia genética, enquanto
outras são contrárias. Duas pessoas são selecionadas aleatoriamente, a partir desse grupo, e
são indagadas sobre o fato de serem favoráveis ou contrárias à engenharia. Quantos
resultados distintos são possíveis? Desenhe um diagrama de Venn e um diagrama de árvore
para este experimento. Liste todos os resultados incluídos em cada um dos seguintes
eventos, e mencione se correspondem a eventos simples ou a eventos compostos.
(a) Ambas as pessoas são favoráveis à engenharia genética

77
(b) No máximo uma pessoa é contrária à engenharia genética

(c) Exatamente uma pessoa é favorável à engenharia genética

4.2 – CALCULANDO A PROBABILIDADE

A probabilidade, que fornece a possibilidade de ocorrência de um evento, é


representada por P. A probabilidade de que um evento simples E i venha a ocorrer é
representada por P ( E i ) , e a probabilidade de um evento composto A venha a ocorrer é
representada por P(A).

Definição

Probabilidade – A probabilidade corresponde à medida numérica da possibilidade


de que um determinado evento venha a obter.

Duas Propriedades da Probabilidade

1. A probabilidade de um evento sempre se posiciona no intervalo entre 0 e 1.

0 ≤ P ( E i ) ≤1
0 ≤ P ( A) ≤1

Um evento que nunca pode ocorrer tem probabilidade igual a zero; esse tipo de
evento é conhecido como evento impossível. Para um evento que é certo de ocorrer tem
probabilidade igual a 1 e é conhecido como evento certo. Ou seja,

Para um evento impossível M : P( M ) = 0


Para um evento certo C : P(C ) =1

78
2. A soma das probabilidades de todos os eventos simples (ou resultados finais)
para um experimento, representada por ∑P( E i ) , é sempre igual a 1.

∑P( E i ) = P( E1 ) + P ( E 2 ) + P ( E 3 ) + ... =1

4.2.1 – Três Abordagens Conceituais para a Probabilidade

Probabilidade Clássica

Muitas vezes, vários resultados para um experimento podem ter a mesma


probabilidade de ocorrência. Esses resultados são conhecidos como resultados igualmente
possíveis ou eventos igualmente possíveis.

Regra da Probabilidade Clássica para se Encontrarem Probabilidades

P ( E i ) = 1/Número total de resultados para o experimento

P ( A) = Número de resultados favoráveis a A/Número total de resultados para o


experimento

Exemplo 4.7
Encontre a probabilidade de se obter cara para um lançamento de uma moeda.

Exemplo 4.8
Encontre a probabilidade de se obter um número par em um lançamento de um
dado.

Utilizando a Freqüência Relativa como uma Aproximação da Probabilidade –


Caso um experimento seja repetido n vezes e um evento A seja observado f vezes, então, de
acordo com o conceito de freqüência relativa de probabilidade,

f
P ( A) =
n
Exemplo 4.9

79
Dez entre 500 carros aleatoriamente selecionados, fabricados em uma determinada
fábrica de automóveis, são avaliados como sendo abacaxis. Supondo-se que os abacaxis
sejam fabricados de maneira aleatória, qual é a probabilidade de que o próximo carro
fabricado nessa fábrica de automóveis venha a ser um abacaxi.
n= f =

Tabela 4.2
Distribuição de Freqüências e Distribuição de Freqüências Relativas para a Amostra
de Carros
_______________________________________________
Carro f Freqüência Relativa
_______________________________________________
Perfeito
Abacaxi
______________________________________________
n=500 Soma = 1,00
______________________________________________

Leis dos Grandes Números – Caso um experimento seja repetido inúmeras vezes,
a probabilidade de que um evento obtido a partir da freqüência relativa se aproxima da
probabilidade verdadeira ou teórica.

Probabilidade Subjetiva – Representa a probabilidade atribuída a um evento com


base no julgamento, na experiência, nas informações e na crença subjetiva.

4.3 – REGRA DE CONTAGEM

Regra de Contagem para Encontrar Resultados Totais – Caso um experimento


consista em três etapas, e a primeira etapa possa resultar em m resultados, a segunda etapa
em n resultados e a terceira etapa em k resultados, então

Resultados totais para o experimento = m.n.k

Exemplo 4.10
Um futuro comprador de carros pode escolher entre uma taxa de juros fixa e uma
taxa de juros variável, e pode também escolher um prazo de pagamento de 36 meses, 48
meses ou 60 meses. Quantos resultados totais são possíveis?

80
4.4 – PROBABILIDADE MARGINAL E PROBABILIDADE CONDICIONAL

Probabilidade Marginal – A probabilidade marginal representa a probabilidade de


um único evento, sem levar em conta qualquer outro evento. A probabilidade marginal
também chamada de probabilidade simples.

Probabilidade Condicional – A probabilidade condicional representa a


probabilidade de que um evento venha ocorrer, sabendo-se que um outro evento já tenha
ocorrido. Caso A e B sejam dois eventos, a probabilidade condicional de A, sendo
conhecida B, é escrita como

P( A ∩ B)
P( A / B) = , se P ( B ) ≠ 0
P( B)
P ( B ∩ A)
P ( B / A) = , se P ( A) ≠ 0
P ( A)

Exemplo 4.11
1 3 11
Sendo P( A) = , P( B ) = e P( A ∪ B) = , calcular P ( A / B) .
3 4 12

Exemplo 4.12
A probabilidade de que um aluno aleatoriamente selecionado de uma faculdade seja
quartanista é 0,20, e a probabilidade conjunta de que o aluno esteja se especializando em
ciência da computação e seja e seja quartanista é igual a 0,03. Encontre a probabilidade
condicional de que um aluno selecionado ao acaso esteja se especializando em ciência da
computação, sabendo-se que ele/ela é quartanista.

81
4.5 – EVENTOS MUTUAMENTE EXCLUDENTES

Definição

Eventos Mutuamente excludentes – Eventos que não podem ocorrer


conjuntamente são conhecidos como eventos mutuamente excludentes.

Exemplo 4.13
Considere os seguintes eventos para um lançamento de um dado:
A = um número par é observado = {2, 4, 6}
B = um número ímpar é observado = {1, 3, 5}
C = um número menor do que 5 é observado = {1, 2, 3, 4}
Os eventos A e B são mutuamente excludentes? Os eventos A e C são mutuamente
excludentes?

4.6 - EVENTOS INDEPENDENTES VERSUS EVENTOS DEPENDENTES

Eventos Independentes – Dois eventos são considerados independentes se a


ocorrência de um deles não afetar a probabilidade de ocorrência do outro. Em outras
palavras, A e B são eventos independentes se

P ( A / B ) = P ( A)ouP ( B / A) = P ( B )

Exemplo 4.14
Uma caixa contém um total de 100 CDs que foram fabricados em dois
equipamentos. Desse total, 60 foram fabricados no equipamento I. Do total de CDs, 15 são
defeituosos. Dos 60 CDs que foram fabricados no equipamento I, 9 são defeituosos. Sejam

82
D o evento no qual um CD aleatoriamente selecionado é defeituoso e A o evento no qual
um CD aleatoriamente selecionado foi fabricado no Equipamento I. Os eventos D e A são
independentes?

OBS:
1. Dois eventos mutuamente excludentes não podem ser independentes, e vice-
versa?
(a) Eventos mutuamente excludentes são sempre dependentes.

(b) Eventos independentes nunca são mutuamente excludentes.

2. Eventos dependentes podem, ou não, ser mutuamente excludentes.

4.7 – EVENTOS COMPLEMENTARES

Definição

Eventos Complementares – O complemento do evento A, representado por A e
lido como “A barra” ou “complemento de A”, corresponde ao evento que inclui todos os
resultados para um experimento, que não estão em A.

Exemplo 4.15
Em um grupo de 5000 adultos, 3500 são a favor de leis mais rígidas para o controle
do uso de armas, 1200 são contra essas leis e 300 não têm opinião a respeito. Um adulto é
aleatoriamente selecionado nesse grupo. Seja A um evento no qual esse adulto seja a favor
de leis mais rígidas para o controle de armas. Qual é o evento complementar de A? Quais
são as probabilidades dos dois eventos?

4.8 – INTERSEÇÃO DE EVENTOS E A REGRA DE MULTIPLICAÇÃO

83
4.8.1 – Interseção de Eventos

A interseção de dois eventos é fornecida pelos resultados que são comuns a ambos.

A interseção dos eventos A e B é representada por AeB , A ∩ B ou AB .

4.8.2 – Regra de Multiplicação

Probabilidade Conjunta – A probabilidade de interseção de dois eventos é


chamada de probabilidade conjunta, e é escrita como

P ( AeB )
A probabilidade de interseção de dois eventos é obtida multiplicando-se a
probabilidade marginal de um evento pela probabilidade condicional do segundo evento.
Essa regra é denominada regra de multiplicação.

Regra de Multiplicação para Encontrar a Probabilidade Conjunta – A


probabilidade de interseção de dois eventos, A e B, é

P ( AeB ) = P ( A) P ( B / A)
Exemplo 4.16
A tabela 4.3 traz a classificação de todos os empregados de uma empresa por sexo e
graduação em alguma faculdade.

Tabela 4.3
Classificação de Empregados por Sexo e Graduação
Graduação em Faculdade (G) Não-Graduado na Faculdade (N) Total
Masculino (M) 7 20 27
Feminino (F) 4 9 13
Total 11 29 40

Caso um desses empregados seja selecionado ao acaso para ser membro do comitê de
gerenciamento de empregos, qual é a probabilidade de que esse empregado seja do sexo
feminino e graduado em alguma faculdade?

84
Regra de Multiplicação para Eventos Independentes

Regra da Multiplicação para se Calcular a Probabilidade de Eventos


Independentes – A probabilidade da interseção de dois eventos, A e B, é

P( AeB ) = P ( A) P( B )

Exemplo 4.17
Um edifício comercial dispõe de dois alarmes contra incêndio. A probabilidade de
que um alarme desse tipo venha a falhar durante um incêndio é igual a 0,02. Encontre a
probabilidade de que ambos os alarmes deixem de funcionar em caso de incêndio.

Probabilidade Conjunta de Eventos Mutuamente Excludentes – A


probabilidade conjunta de dois eventos mutuamente excludentes é sempre igual a zero.
Caso A e B sejam dois eventos mutuamente excludentes, então,

P( AeB ) = 0
Exemplo 4.18
Considere os dois eventos a seguir apresentados, para uma ficha cadastral
preenchida por uma pessoa, no intuito de obter financiamento para a compra de automóvel:
A = evento no qual a ficha cadastral é aprovada
B = evento no qual a ficha cadastral é reprovada.
Qual é a probabilidade conjunta de A e R?

4.9 - UNIÃO DE EVENTOS E A REGRA DE ADIÇÃO

4.9.1 – União de Eventos

85
A união de dois eventos, A e B, inclui todos os resultados que estão em A ou em B,
ou tanto em A quanto em B.

Definição
União de Eventos – Sejam A e B dois eventos definidos em um espaço amostral. A
união dos eventos A e B corresponde à compilação de todos os resultados que pertencem a
A ou a B, ou tanto a A quanto a B, e é representada por

A ou B, A ∪ B

Exemplo 4.19
Um clube de idosos possui 300 membros. Entre eles, 140 são homens; 210 tomam
pelo menos um medicamento de uso permanente; e 95 são homens e tomam pelo menos um
medicamento de uso permanente. Descreva a união dos eventos “masculinos” e “tomam
pelo menos um medicamento de uso permanente”.

4.9.2 – Regra de Adição

Regra de Adição para se Encontrar a Probabilidade de União de Eventos – A


probabilidade da união de dois eventos A e B é

P ( AouB ) = P ( A) + P ( B) − P ( AeB )

Exemplo 4.20
O reitor de uma universidade propôs que todos os alunos façam um curso de ética
como requisito para a graduação. Trezentos professores e alunos dessa universidade foram
entrevistados acerca da opinião de cada um sobre essa questão. A tabela 4.4 traz a
classificação cruzada das respostas desses professores e alunos da universidade.

Tabela 4.4
Classificação Cruzada de Respostas
A Favor Contra Neutro Total
Professor 45 15 10 70
Aluno 90 110 30 230
Total 135 125 40 300

86
Encontre a probabilidade de que uma pessoa selecionada ao acaso entre essas 300 pessoas
seja professor da faculdade, ou seja a favor dessa proposta.

Regra de Adição para Eventos Mutuamente Excludentes

A probabilidade da união de dois eventos mutuamente excludentes é fornecida pela


soma de suas probabilidades marginais.

Regra de Adição para se Encontrar a Probabilidade da União de Eventos


Mutuamente Excludentes – A probabilidade da união de dois eventos mutuamente
excludentes, A e B, é
P( AouB ) = P ( A) + P ( B )

Exemplo 4.21
A probabilidade de que uma pessoa seja a favor da engenharia genética é igual a
0,55, e a probabilidade de que a pessoa seja contra é igual a 0,45. Duas pessoas são
aleatoriamente selecionadas, e é observado se são a favor ou contra a engenharia genética.
(a) Desenhe um diagrama de árvore para este medicamento.
(b) Encontre a probabilidade de que pelo menos uma das duas pessoas seja a favor da
engenharia genética.

87
EXERCÍCIOS:
1) Cinco pacientes, 3 mulheres e 2 homens, estão numa sala, para fazer um exame
médico. Se escolhermos, ao acaso, um paciente de cada vez, qual a probabilidade de
considerarmos alternadamente um de cada sexo?

88
2) Consideremos 2 caixas iguais, uma com 15 frutas, das quais 8 estão verdes e
outra com 12 frutas, das quais 8 estão verdes. Selecionamos uma caixa, ao acaso e
retiremos uma fruta. Qual a probabilidade de que ela esteja madura?

3) Temos duas estantes iguais: uma com 5 livros, sendo 2 de Matemática e 3 de


Português, a outra estante com 6 livros, sendo 1 de matemática e 3 de português. Seleciona-
se uma estante, ao acaso, e retira-se um livro. Qual a probabilidade de que ele seja de
Matemática?

4) No curso de Biologia, 10% dos alunos foram reprovados em Bioestatística, 12%


foram reprovados em Genética e 8% foram reprovados em Bioestatística e Genética ao
mesmo tempo. Um estudante do curso é selecionado ao acaso. Se ele foi reprovado em
Genética. Qual a probabilidade de que tenha sido reprovado também em Bioestatística?

89
5) Num ginásio de esportes, 26% dos freqüentadores jogam vôlei, 36% jogam
basquete e 12% praticam os dois esportes. Um dos freqüentadores é sorteado para ganhar
uma medalha. Sabendo-se que ele joga basquete, qual a probabilidade de que também jogue
vôlei?

6) Um conjunto de 50 pessoas num SPA, está formado do seguinte modo:

Obesos Não Obesos


Homens 18 9
Mulheres 15 8

Escolhemos ao acaso uma pessoa. Se for do sexo feminino, qual a probabilidade de que
seja obesa?

7) A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas e 8


azuis. Joga-se uma moeda “honesta”. Se a moeda der cara, extrai-se uma ficha da urna A;
se der coroa, extrai-se uma ficha da urna B. Uma ficha vermelha é extraída. Qual a
probabilidade de ter saído cara no lançamento?

90
8) Num certo colégio, 4% dos homens e 1% das mulheres têm mais de 1,75m de
altura. 60% dos estudantes são mulheres. Um estudante é escolhido ao acaso e tem mais de
1,75m. Qual a probabilidade de que seja homem?

4
9) A probabilidade de um remédio X curar a doença Y é de . Qual a
7
probabilidade de que a doença não seja curada pelo remédio X?

10) Dois dados são lançados conjuntamente. Determine a probabilidade de a soma


ser 10 ou maior que 10.

11) A urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5
bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes.
Uma bola é retirada de cada uma. Qual é a probabilidade de as três bolas retiradas da
primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde?

91
12) Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves.
Uma peça é escolhida ao acaso. Calcule a probabilidade de que:
a) ela não tenha defeitos graves;

b) ela não tenha defeitos;

c) ela seja boa ou não tenha defeitos graves.

13) Uma urna contém 50 bolas idênticas. Sendo as bolas numeradas de 1 a 50, determine a
probabilidade de, em uma extração ao acaso:
a) obtermos a bola de número 27;

b) obtermos uma bola de número par;

c) obtermos uma bola de número maior que 20;

d) obtermos uma bola de número menor ou igual a 20.

5 - VARIÁVEIS ALEATÓRIAS DISCRETAS E SUAS DISTRIBUIÇÕES DE


PROBABILIDADES

5.1 – VARIÁVEIS ALEATÓRIAS

Definição

Variável Aleatória – Uma variável aleatória é uma variável cujo valor é


determinado pelo resultado de um experimento aleatório.

Uma variável aleatória pode ser discreta ou contínua.

5.1.1 – Variável Aleatória Discreta

Definição

92
Variável Aleatória Discreta – Uma variável aleatória que assume valores contáveis
é chamada de variável aleatória discreta.

Exemplos:
O número de casas em um determinado condomínio.
O número de peixes capturados em uma pescaria.
O número de clientes que visitam um banco durante qualquer hora especifica.
O número de caras obtidas em três lançamentos de uma moeda.

5.1.2 – Variável Aleatória Contínua

Definição

Variável Aleatória Contínua – Uma variável aleatória que pode assumir qualquer
valor contido em um ou mais intervalos é chamada de variável aleatória contínua.

Exemplos:
A estatura de uma pessoa.
O tempo gasto para se fazer uma prova.
O peso de um peixe.
O preço de uma casa.

5.2 – DISTRIBUIÇÃO DE PROBABILIDADES DE UMA VARIÁVEL


ALEATÓRIA DISCRETA

Definição

Distribuição de Probabilidades de uma Variável Aleatória Discreta – A


distribuição de probabilidades de uma variável aleatória discreta apresenta todos os valores
possíveis que uma variável aleatória pode assumir, bem como suas probabilidades
correspondentes.
Duas Características de uma Distribuição de Probabilidades – A distribuição de
probabilidades de uma variável aleatória discreta tem as duas características a seguir:
1. 0 ≤ P( x ) ≤1 para cada valor de x
2. ∑P( x) =1

Exemplo 5.1
Cada uma das tabelas a seguir apresenta determinados valores de x e suas
respectivas probabilidades. Determine se cada tabela representa, ou não, uma distribuição
de probabilidades válida.
a)
________________
x P(x)
________________
0 0,08
1 0,11

93
2 0,39
3 0,27
________________

b)
________________
x P(x)
________________
2 0,25
3 0,34
4 0,28
5 0,13
________________

c)
________________
x P(x)
________________
7 0,70
8 0,50
9 - 0,20
________________

Exemplo 5.2
A tabela 5.1 apresenta a distribuição de probabilidades do número de defeitos em
uma máquina, apresentados a cada semana, com base em dados do passado.

Tabela 5.1
___________________________________________________________
Defeitos por semana 0 1 2 3
___________________________________________________________
Probabilidade 0,15 0,20 0,35 0,30
___________________________________________________________

a) Apresente graficamente essa distribuição de probabilidades.

94
Figura 5.1 – Representação gráfica da distribuição de probabilidades da Tabela 5.1

b) Encontre a probabilidade de que o número de defeitos para esta máquina durante uma
determinada semana seja:
i. exatamente 2

ii. de 0 a 2

iii. maior do que 1

iv. no máximo 1

Exemplo 5.3
De acordo com uma pesquisa, 60% de todos os alunos em uma grande universidade
sofrem de ansiedade em relação à matemática. Dois alunos são aleatoriamente selecionados
nessa universidade. Seja x o número de alunos dessa amostra que sofrem de ansiedade
relativa à matemática. Desenvolva a distribuição de probabilidade de x.

95
5.3 – MÉDIA ARITMÉTICA DE UMA VARIÁVEL ALEATÓRIA DISCRETA

Média Aritmética de uma Variável Aleatória Discreta – A média aritmética de uma


variável aleatória discreta, x, representa o valor que se espera que ocorra por repetição, em
média, caso um experimento seja repetido um grande número de vezes. É representado por
µ e calculada como µ = ∑xP (x) .

A média aritmética de uma variável aleatória discreta, x, é também chamada de valor


esperado e é representada por E ( x ) , ou seja,
E ( x ) =∑xP ( x )

Exemplo 5.4
Na tabela 5.2, x representa o número de defeitos de um equipamento durante uma
determinada semana e P(x) representa a probabilidade do valor correspondente de x.

Tabela 5.2
______________________
x P(x)
______________________
0 0,15
1 0,20
2 0,35
3 0,30
_____________________

Encontre a média aritmética do número de defeitos apresentados por semana por esse
equipamento.

96
5.4 – DESVIO-PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA

A fórmula básica para se calcular o desvio-padrão de uma variável aleatória discreta é

σ= ∑[( x −µ) 2
.P ( x ) ]

No entanto, é mais conveniente utilizar a seguinte fórmula de atalho para calcular o


desvio-padrão de uma variável aleatória discreta.

O desvio-padrão de uma variável aleatória discreta x mede a dispersão de sua


distribuição de probabilidades e é calculado como

σ= ∑x 2
P( x) − µ2

Observe que a variância, σ 2 , de uma variável aleatória discreta é obtida elevando-


se ao quadrado o seu desvio-padrão.

Exemplo 5.5
A Baier’s Eletronics fabrica peças de computador, que são fornecidas por muitas
empresas de computação. Apesar de dois inspetores de controle de qualidade na Baier’s
Eletronics verificarem todas as peças em busca de defeitos antes que sejam transportadas
para outra empresa, algumas poucas peças defeituosas efetivamente passam por essas
inspeções sem serem detectadas. Seja x o número de peças de computador defeituosas em
uma remessa de 400. A tabela a seguir fornece a distribuição de probabilidade de x.

x 0 1 2 3 4 5
P(x) 0,02 0,20 0,30 0,30 0,10 0,08

Calcule o desvio-padrão de x.

Solução:
A tabela a seguir mostra os cálculos necessários para se encontrar o desvio-padrão de x.

Tabela 5.3
Cálculos para Encontrar o Desvio-Padrão
x P( x) xP ( x ) x2 x 2 P( x)
0 0,02 0 0 0
1 0,20 0,20 1 0,20
2 0,30 0,60 4 1,20
3 0,30 0,90 9 2,70

97
4 0,10 0,40 16 1,60
5 0,08 0,40 25 2,00
∑xP (x) = 2,50 ∑x 2
P( x) = 7,70

σ = 1,45 =1,204

Por conseguinte, espera-se que uma determinada remessa de 400 peças de


computador contenha uma média de...........peças defeituosas, com um desvio-padrão
de..............

Interpretação do Desvio-Padrão
Aprendemos que, de acordo com o teorema de Chebyshev, pelo menos
[1 − (1 / k 2 )] ×100 % da área total abaixo da curva se posiciona dentro do limite de k
desvios-padrão em relação à média aritmética, sendo k qualquer número maior que 1.
Dessa maneira, se k = 2 , pelo menos 75% da área abaixo de uma curva se posicionam
entre µ − 2σ e µ + 2σ . No exemplo 5.5,

Portanto,

µ − 2σ = 2,50 − 2(1,204 ) = 0,092


µ + 2σ = 2,50 + 2(1,204 ) = 4,908

Utilizando o teorema de Chebyshev podemos afirmar que é esperado que pelo menos 75%
das remessas (cada qual contendo 400 peças de computador) contenham de 0,092 a 4,908
peças de computador defeituosas em cada remessa.

5.5 – FATORIAIS E COMBINAÇÕES

5.5.1 – Fatoriais

Definição

Fatoriais – O símbolo n!, que se lê como “n fatorial”, representa o produto de todos os


números inteiros desde n até 1. Em outras palavras,

n! = n( n −1)( n − 2)( n −3)... 3.2.1

Por definição,
0! =1

Exemplo 5.6
Calcule 7! .

98
Exemplo 5.7
Calcule (12 −4)!.

5.5.2 – Combinações

Definição

Notação de Combinações – Combinações fornecem o número de maneiras pelas quais


x elementos podem ser selecionados a partir de n elementos. A notação utilizada para
representar o número total de combinações é

n Cx
que se lê como “o número de combinações de n elementos, selecionados x a cada vez”.

Suponha que existe um total de n elementos, dos quais desejamos selecionar x elementos.
Então,

n C x = o número de combinações de n elementos, selecionados x a cada vez

O número total de combinações pode também ser representado pelas seguintes


notações:

 n n
C(n, x) =   = Cx
 x
Número de Combinações – O número de combinações para se selecionar x a partir
de n elementos distintos é fornecido pela fórmula

n!
n Cx =
x! ( n − x )!

99
sendo n!, x! e (n − x )! lidos como “n fatorial”, “x fatorial” e “n menos x fatorial”,
respectivamente.

Na fórmula para combinações,

n!= n( n −1)( n −2)( n −3)... 3.2.1


x!= x ( x −1)( x −2)... 3.2.1
( n −x )! = ( n −x )( n −x −1)( n −x −2)... 3.2.1

Observe que, em combinações, n é sempre maior ou igual a x. Se n for menor que x,


não podemos selecionar x elementos distintos a partir de n.

Exemplo 5.8
Uma loja de sorvetes oferece seis sabores de sorvete. Kristen deseja comprar dois
sabores de sorvete. Caso ela aleatoriamente selecione dois sabores entre seis, quantas
combinações possíveis existem?

Exemplo 5.9
Três membros de um júri serão aleatoriamente selecionados entre cinco pessoas.
Quantas combinações diferentes são possíveis?

5.5.3 – Utilizando a Tabela de Combinações

A tabela III no Apêndice C apresenta o número de combinações de n elementos,


selecionados x a cada vez. O exemplo a seguir ilustra como ler essa tabela para encontrar
combinações.

Exemplo 5.10
A Marv & Sons anunciou a contratação de um analista financeiro. A empresa recebeu
formulários de 10 candidatos que parecem igualmente qualificados. A gerente da empresa
decidiu chamar apenas três desses candidatos para uma entrevista. Caso esta gerente
selecione aleatoriamente 3 candidatos entre 10, quantas seleções totais são possíveis?

100
Solução:
O número total de maneiras de selecionar 3 candidatos entre 10 é fornecido por 10 C3 .
Tabela 5.4
Determinando o Valor de 10 C 3 .
n x 0 1 2 3 ... 20
1 1 1
2 1 2 1
3 1 3 3 1
. . . . .
. . . . .
. . . . .
10 1 10 45 120 ... ...
. . . . . ... ...
. . . . . ... ...

O número localizado na interseção entre a linha para n =10 e a coluna para x = 3


fornece o valor de 10 C 3 , que é

10 C 3 = 120

Logo, o gerente da empresa pode selecionar 3 candidatos entre 10 de 120 maneiras.

OBS:
Caso o número total de elementos e o número de elementos a serem selecionados
sejam os mesmos, existe apenas uma combinação. Em outras palavras,
n C n =1
Dessa maneira, o número de combinações para se selecionar zero item a partir de n
é igual a 1; ou seja,
n C 0 =1
Por exemplo,
5! 5! 120
5 C5 = = = =1
5! (5 −5)! 5!0! 120 (1)
8! 8! 40320
8 C0 = = = =1
0! (8 −0)! 0!8! (1)( 40320 )

5.6 – A DISTRIBUIÇÃO DE PROBABILIDADES BINOMIAIS

5.6.1 – Experimento Binomial

Condições de um Experimento Binomial – Um experimento binomial deve satisfazer


as quatro condições a seguir:
1. Existem n testes idênticos.
2. Cada teste tem somente dois resultados possíveis.

101
3. As probabilidades dos dois resultados permanecem constantes.
4. Os testes são independentes.

Exemplo 5.11
Considere o experimento que consiste em 10 lançamentos de uma moeda. Determine se
esta representa, ou não representa, um experimento binomial.

5.6.2 – A Distribuição de Probabilidades Binomiais e a Fórmula Binomial

Fórmula Binomial – Para um experimento binomial, a probabilidade de exatamente x


sucessos em n testes é fornecida pela fórmula binomial

P( x ) =n C x p x q n −x
na qual

n = número total de testes


p = probabilidade de sucesso
q = 1 – p = probabilidade de insucesso
x = número de sucessos em n testes
n – x = número de insucessos em n testes

Exemplo 5.12
Cinco por cento de todos os videocassetes fabricados por uma grande empresa de
produtos eletrônicos são defeituosos. Um inspetor do controle de qualidade seleciona
aleatoriamente três aparelhos da linha de produção. Qual é a probabilidade de que
exatamente um desses três aparelhos seja defeituoso?

102
5.6.3 – Utilizando a Tabela de Probabilidades Binomiais

Exemplo 5.13
Segundo um estudo realizado em 2001 pela Escola de Saúde Púbica da Universidade de
Harvard com alunos universitários, 19,3% dos alunos incluídos no estudo se abstiveram de
beber (USA TODAY, 3 de abril de 2002). Suponha que, todos os atuais alunos
universitários nos Estados Unidos, 20% se abstenham de beber. Uma amostra aleatória de 6
alunos universitários é selecionada. Utilizando a tabela IV do Apêndice C, responda os
seguintes itens:
a) Encontre a probabilidade de que exatamente três alunos universitários dessa amostra se
abstenham de beber.

Solução:
a) Para ler a probabilidade procurada na Tabela IV do Apêndice C, inicialmente
determinamos os valores de n, x e p. Por exemplo,
n = número de alunos universitários da amostra = 6
x = número de alunos universitários, entre seis, que se abstêm de beber = 3
p = P(um aluno universitário que se abstêm de beber) = 0,20

Tabela 5.5
Determinando P(x = 3) para n = 6 e p = 0,20
P
n x 0,05 0,10 0,20 ... 0,95

103
6 0 0,7351 0,5314 0,2621 ... 0,0000
1 0,2321 0,3543 0,3932 ... 0,0000
2 0,0305 0,0984 0,2458 ... 0,0001
3 0,0021 0,0146 0,0819 ... 0,0021
4 0,0001 0,0012 0,0154 ... 0,0305
5 0,0000 0,0001 0,0015 ... 0,2321
6 0,0000 0,0000 0,0001 ... 0,7351

P (x = 3) =

Utilizando a Tabela IV ou Tabela 5.5, escrevemos a tabela 5.6, que pode ser utilizada para
responder aos itens remanescentes deste exemplo.

Tabela 5.6
Parte da Tabela IV para n = 6 e p = 0,20
______________________________________
p
____________________
n x 0,20
______________________________________
6 0 0,2621
1 0,3932
2 0,2458
3 0,0819
4 0,0154
5 0,0015
6 0,0001
______________________________________

104
b) Encontre a probabilidade de que no máximo dois alunos universitários dessa amostra se
abstenham de beber.

c) Encontre a probabilidade de que pelo menos três alunos universitários dessa amostra se
abstenham de beber.

d) Encontre a probabilidade de que um a três alunos universitários dessa amostra se


abstenha de beber.

e) Seja x o número de alunos universitários dessa amostra que se abstenham de beber.


Apresente a distribuição de probabilidades de x e desenhe um gráfico de barras para essa
distribuição de probabilidades.

5.6.4 – Probabilidade de Sucesso e o Formato da Distribuição Binomial

Para qualquer número de testes n:

1. A distribuição de probabilidades binomiais é simétrica se p = 0,50.

2. A distribuição de probabilidades binomiais é assimétrica à direita se p for menor que


0,50.

3. A distribuição de probabilidades binomiais é assimétrica à esquerda se p for maior


que 0,50.

1. Sejam n = 4 e p = 0,50. Utilizando a Tabela IV do Apêndice C, apresentamos a


distribuição de probabilidades de x na Tabela 5.7 e colocamos a mesma em forma de

105
gráfico na figura 5.1. Como podemos observar na Tabela 5.7 e na figura 5.2, a distribuição
de probabilidades é simétrica.

Tabela 5.7
Distribuição de probabilidades de x para n = 4 e p = 0,50
_______________________________________________
x P(x)
_______________________________________________
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
_______________________________________________

2. Sejam n = 4 e p = 0,30 (que é menor que 0,50). A tabela 5.8, que é construída a
partir da tabela IV do Apêndice C, e o gráfico de distribuição de probabilidades da Figura
5.3 mostram que a distribuição de probabilidades de x para n = 4 e p = 0,30 é assimétrica à
direita.

Tabela 5.8
Distribuição de Probabilidades de x para n = 4 e p = 0,30
_______________________________________________
x P(x)
_______________________________________________
0 0,2401
1 0,4116
2 0,2646
3 0,0756
4 0,0081
_______________________________________________

106
3. Sejam n = 4 e p = 0,80 (que é maior que 0,50). A tabela 5.9, que é construída
utilizando-se a tabela IV do Apêndice C, e o gráfico de distribuição de probabilidades da
Figura 5.4 mostram que a distribuição de probabilidades de x para n = 4 e p = 0,80 é
assimétrica à esquerda.

Tabela 5.9
Distribuição de Probabilidades de x para n = 4 e p = 0,80
_______________________________________________
x P(x)
_______________________________________________
0 0,0016
1 0,0256
2 0,1536
3 0,4096
4 0,4096

5.6.5 – Média Aritmética e Desvio-Padrão da Distribuição Binomial

Média Aritmética e Desvio-Padrão de uma Distribuição Binomial – A média


aritmética e o desvio-padrão de uma distribuição binomial são

107
µ = np e σ = npq

em que n corresponde ao número total de testes; p representa a probabilidade de


sucesso; e q representa a probabilidade de insucesso.

Exemplo 5.14
Em uma pesquisa de opinião da Maritz, realizada com adultos motoristas em julho
de 2002, 45% afirmaram que “freqüentemente” ou “algumas vezes” comem ou bebem
enquanto dirigem (USA TODAY, 23 de outubro de 2002). Suponha que este resultado seja
verdadeiro para a população atual de todos os adultos motoristas. Uma amostra de 40
adultos motoristas é selecionada. Seja x o número de motoristas dessa amostra que
“freqüentemente” ou “algumas vezes” comem ou bebem enquanto dirigem. Encontre a
média aritmética e o desvio-padrão da distribuição de probabilidades de x.

Portanto, a média aritmética da distribuição de probabilidades de x é.........e o desvio-padrão


é................

5.7 – A DISTRIBUIÇÃO DE PROBABILIDADES HIPERGEOMÉTRICAS

Distribuição de Probabilidades Hipergeométricas

Sejam
N = Número total de elementos na população
r = número de sucessos na população
N – r = número de insucessos na população
n = número de testes (tamanho da amostra)
x = número de sucessos em n testes
n – x = número de insucessos em n teste

A probabilidade de x sucessos em n testes é dada por

108
C xN −r C n −x
P( x) = r

N Cn

Exemplo 5.15
A Brown Manufacturing fabrica peças de automóveis que são vendidas para
concessionárias. Na semana passada, a empresa remeteu 25 peças de automóveis para uma
concessionária. Posteriormente, descobriu que cinco dessas peças eram defeituosas. No
momento em que o gerente da empresa conseguiu entrar em contato com a concessionária,
quatro peças daquela remessa já haviam sido vendidas. Qual é a probabilidade de que três
das quatro peças vendidas fossem perfeitas e uma fosse defeituosa?

Solução
N = número total de elementos (peças de automóveis) =
r = número de sucessos (peças perfeitas) na população =
N – r = Número de insucessos (peças imperfeitas) na população =
n = número de testes (tamanho da amostra) =
x = número de sucessos quatro testes =
n – x = número de insucessos em quatro testes =

Utilizando a fórmula hipergeométrica, a probabilidade desejada é calculada da


seguinte maneira:
C C
P ( x = 3) = r xN −r n −x =
N Cn

Portanto, a probabilidade de que os três das quatro peças vendidas sejam perfeitas e
uma seja defeituosa é igual a .....................

5.8 - A DISTRIBUIÇÃO DE PROBABILIDADES DE POISSON

Condições para Aplicar a Distribuição de Probabilidades de Poisson – As três


condições a seguir devem ser satisfeitas para que seja aplicada a distribuição de
probabilidades de Poisson.

1. x deve ser uma variável aleatória discreta

2. As ocorrências devem ser aleatórias

3. As ocorrências devem ser independentes

109
Fórmula de Distribuição de Probabilidades de Poisson – De acordo com a
distribuição de probabilidades de Poisson, a probabilidade de x ocorrências em um
intervalo é

λx e −λ
P ( x) =
x!

em que λ (pronuncia-se lambda) representa a média aritmética do número de ocorrências


no intervalo e o valor de e é aproximadamente 2,71828.

Exemplo 5.16
Em média, um domicilio recebe 9,5 chamadas telefônicas de telemarketing por
semana. Utilizando a fórmula da distribuição de Poisson, encontre a probabilidade de que
um domicílio aleatoriamente selecionado receba exatamente seis chamadas telefônicas de
telemarketing durante uma determinada semana.

Solução:
Seja λ a média aritmética do número de chamadas telefônicas recebidas por um
domicilio por semana. Então, λ = 9,6 . Seja x o número de chamadas telefônicas de
telemarketing recebidas por um domicilio durante uma determinada semana. Vamos
encontrar a probabilidade de x = 6. Substituindo todos os valores na fórmula de Poisson,
obtemos
λx e −λ
P ( x = 6) = =
x!

Para realizar esses cálculos, podemos encontrar o valor de 6! Na tabela II do


Apêndice C e o valor de e −9, 5 utilizando a tecla e x em uma calculadora, ou utilizando a
Tabela V.
Exemplo 5.17
Uma máquina de levar roupas em uma lavanderia apresenta defeito, em média, três vezes
por mês. Utilizando a fórmula da distribuição de probabilidades de Poisson, encontre a
probabilidade de que durante o próximo mês esta máquina venha a apresentar
a) exatamente dois defeitos
Solução
Seja λ a média aritmética do número de defeitos por mês e x o número efetivo de
defeitos observados durante o mês seguinte para esta máquina. Então,
λ=
A probabilidade de que exatamente dois defeitos venham a ser observados durante o
próximo mês é
λx e −λ
P ( x = 2) = =
x!
b) no máximo um defeito

110
A probabilidade de que no máximo um defeito venha a ser observado durante o próximo
mês é dada pela soma das probabilidades de zero defeito e de um defeito. Portanto,
P (no máximo 1 defeito) =

OBS:
Um ponto importante em relação à distribuição de probabilidades de Poisson
corresponde ao fato de que os intervalos para λ e x devem ser iguais. Caso não sejam
iguais, a média aritmética, λ , deve ser redefinida para tornar iguais os intervalos.

Exemplo 5.18
A empresa de Remessas Postais de Cyntia oferece um exame gratuito de seus
produtos por um período de sete dias. Caso não esteja completamente satisfeito, o cliente
pode devolver o produto dentro desse período e obter um reembolso total. Segundo
registros do passado da empresa, uma média de 2 entre cada 10 produtos vendidos por essa
empresa é devolvida para fins de reembolso. Utilizando a fórmula da distribuição de
probabilidades de Poisson, encontre a probabilidade de que exatamente 6 dos 40 produtos
vendidos por essa empresa em um determinado dia venham a ser devolvidos para
reembolso.

Portanto, a probabilidade de que exatamente 6 produtos entre 40 vendidos em um


determinado dia venham a ser devolvidos é igual a .......................

Observe que o exemplo 5.19 representa efetivamente um problema binomial, com p


= 2/10 = 0,20; n = 40 e x = 6. Em outras palavras, a probabilidade de sucesso (ou seja, a
probabilidade de que um produto seja devolvido) é igual a 0,20 e o número de testes
(produtos vendidos) é igual a 40. Desejamos encontrar a probabilidade de seis sucessos
(devoluções). No entanto, utilizamos a distribuição de Poisson para selecionar este
problema. Isso é conhecido como utilizar a distribuição de Poisson como uma aproximação
para a distribuição binomial. Podemos, também, utilizar a distribuição binomial para
encontrar essa probabilidade da seguinte maneira:

40 !
P ( x = 6)=40 C 6 (0,20 ) 6 (0,80 ) 34 = (0,20 ) 6 (0,80 ) 34 = (3.838 .380 )( 0,00050706 ) = 0,1246
6! (40 − 6)!
Logo, a probabilidade P ( x = 6) é igual a 0,1246 quando utilizamos a distribuição
binomial.

111
Como podemos observar, simplificar os cálculos agora apresentados para a fórmula
binomial é bastante complicado quando n é grande. É bem mais fácil solucionar este
problema utilizando a distribuição de Poisson. Como regra geral, caso represente um
problema binomial, com n > 25 mas µ ≤ 25 , podemos utilizar a distribuição de Poisson
como uma aproximação para a distribuição binomial. No entanto, se n > 25 e µ > 25 ,
preferimos utilizar a distribuição normal como uma aproximação para a distribuição
binomial.

5.8.1 – Utilizando a Tabela de Probabilidades de Poisson

Exemplo 5.19
Em média, duas novas contas são abertas, por dia, em uma agência do Imperial
Savings Bank. Utilizando a Tabela VI do Apêndice C, encontre a probabilidade de que, em
um determinado dia, o número de novas contas abertas nesse banco venha a ser
a) exatamente 6

b) no máximo 3

c) pelo menos 7

Solução:
a) Sejam
λ =média aritmética do número de novas contas abertas por dia nesse banco
x = número de novas contas abertas neste banco em um determinado dia
λ = 2 e x =6

Tabela 5.10
Parte da Tabela VI para λ = 2,0
x 1,1 1,2 λ 2,0
0 0,1353
1 0,2707
2 0,2707
3 0,1804
4 0,0902
5 0,0361
6 0,0120
7 0,0034
8 0,0009
9 0,0002
_________________________________________________________________________

112
P (x = 6) =

b) A probabilidade de que no máximo três novas contas sejam abertas em um determinado


dia é obtida somando-se as probabilidades de 0, 1, 2 e 3 novas contas. Logo, utilizando a
Tabela VI do Apêndice C, ou Tabela 5.10, obtemos

P(no máximo 3) = P ( x = 0) + P( x =1) + P ( x = 2) + P( x = 3) =

c) A probabilidade de que pelo menos 7 novas contas sejam abertas em um determinado dia
é obtida somando-se as probabilidades de 7, 8 e 9 novas contas. Observe que 9 representa o
último valor de x para λ = 2,0 na Tabela VI do Apêndice C, ou na Tabela 5.10. Portanto,
9 representa o último valor de x, cuja probabilidade está incluída na soma. Entretanto, isso
não significa que, em um determinado dia, mais do que nove novas contas não possam ser
abertas. Significa simplesmente que a probabilidade de 10 ou mais contas é próxima de
zero. Logo,

P(pelo menos 7) = P( x = 7) + P ( x = 8) + P( x = 9) =

5.8.2 – Média Aritmética e Desvio-Padrão da Distribuição de Probabilidades de


Poisson

Para a distribuição de probabilidades de Poisson, a média aritmética e a variância


são ambas iguais a λ e o desvio-padrão é igual a λ . Ou seja, para a distribuição de
probabilidades de Poisson,

µ =λ
σ 2 =λ
σ= λ

EXERCÍCIOS
1) A tabela a seguir fornece a distribuição de probabilidades de uma variável
aleatória discreta de x.

x 0 1 2 3 4 5
P(x) 0,03 0,17 0,22 0,31 0,15 0,12

Encontre as seguintes probabilidades:


a) P ( x =1)

b) P ( x ≤1)

c) P ( x ≥3)

113
e) A probabilidade de que x assuma um valor menor do que 3.

f) A probabilidade de que x assuma um valor maior do que 3.

g) A probabilidade de que x assuma um intervalo entre 2 e 4.

2) Seja x o número de erros que aparecem em uma página aleatoriamente


selecionada de um livro. A tabela a seguir apresenta a distribuição de probabilidades de x.

x 0 1 2 3 4
P(x) 0,73 0,16 0,06 0,04 0,01

Encontre a média aritmética e o desvio-padrão de x.

3) Um departamento de língua inglesa em uma universidade possui 16 professores.


Dois dos professores serão aleatoriamente selecionados para representar o departamento em
um comitê. De quantas maneiras o departamento pode selecionar 2 professores entre 16.
Utilize a fórmula apropriada.

4) Em uma pesquisa de opinião realizada com adultos pelo Instituto Gallup em


dezembro de 2001, 80% dos entrevistados afirmaram sentirem-se estressados
“freqüentemente” ou “algumas vezes” em seu dia-a-dia (USA TODAY, 24 de janeiro de
2002). Suponha que essa percentagem seja verdadeira para a atual população de todos os
adultos. Utilizando a tabela de probabilidades binomiais (Tabela IV do Apêndice C),
encontre a probabilidade de que o número de adultos em uma amostra aleatória de 15
adultos que se sentem estressados freqüentemente ou algumas vezes são
a) no máximo 9

114
b) pelo menos 11

c) 10 a 12

5) Na Express House Delivery Service, fornecer serviços de alta qualidade aos


clientes representa a prioridade máxima da gerência. A empresa garante uma restituição de
todo o valor cobrado caso uma encomenda que a empresa esteja entregando não chegue ao
destino no tempo especificado. Sabe-se, com base em dados do passado, que apesar de
todos os esforços, 4% das encomendas remetidas por essa empresa não chegam ao destino
no tempo especificado. Suponha que uma empresa remeta 20 encomendas por meio da
Express House Delivery Service em um determinado dia.
a) Encontre a probabilidade de que exatamente 1 dessas 20 encomendas não chegue
ao destino no tempo especificado.

b) Encontre a probabilidade de que no máximo 1 dessas 20 encomendas não chegue


ao destino no tempo especificado.

6) A Dawn Corporation tem 12 empregados que ocupam posições gerenciais. Entre


eles, sete são do sexo feminino e cinco são do sexo masculino. A empresa está planejando
enviar 3 desses 12 gerentes a uma conferência. Caso 3 gerentes sejam aleatoriamente
selecionados entre 12,
a) Encontre a probabilidade de que todos os 3 sejam do sexo feminino.

115
b) Encontre a probabilidade de que no Maximo 1 seja do sexo masculino.

7) Um domicilio recebe uma média de 1,7 e-mail indesejado por dia. Encontre a
probabilidade de que esse domicilio venha a receber exatamente três e-mails não-desejados
em um determinado dia. Utilize a fórmula da distribuição de Poisson.

8) Em média, 12,5 quartos permanecem desocupados por dia em um grande hotel.


Encontre a probabilidade de que, em um determinado dia, exatamente três venham a ficar
desocupados. Utilize a fórmula da distribuição de Poisson.

116
6 – VARIÁVEIS ALEATÓRIAS CONTÍNUAS E A DISTRIBUIÇÃO
NORMAL

6.1 – DISTRIBUIÇÃO DE PROBABILIDADES CONTÍNUAS

A curva da distribuição de probabilidades de uma variável aleatória contínua é


também conhecida como função de densidade das probabilidades dessa variável.

A distribuição de probabilidades de uma variável aleatoriamente continua possui as


duas características a seguir apresentadas:

1. A probabilidade de que x assuma um valor em qualquer intervalo se posiciona no espaço


de 0 a 1.

2. A probabilidade total de todos os intervalos (mutuamente excludentes), dentro dos quais


x pode assumir um determinado valor, é igual a 1,0.

117
Figura 6.1 – Área entre dois pontos sob uma curva

Figura 6.2 – Área total sob uma curva da distribuição de probabilidades

A probabilidade de que uma variável aleatória continua, x, assuma um valor dentro


de um determinado intervalo, é fornecida com base na área sob a curva, entre os dois
limites do intervalo, conforme mostrado na Figura 6.3. A área sombreada sob a curva,
desde a até b, nessa figura, fornece a probabilidade de que x se posicione no intervalo de a
até b, ou seja,

P (a ≤ x ≤ b) = Área sob a curva, de a a b.

Figura 6.3 – Área sob a curva representando uma probabilidade

A probabilidade de que uma variável aleatória continua, x, assuma um único


valor é sempre igual a zero. Isso é verdadeiro porque a área correspondente a uma linha
que representa um único ponto é igual a zero. Por exemplo, caso x represente a estatura de
uma estudante do sexo feminino, aleatoriamente selecionada a partir daquela universidade,

118
então, a probabilidade de que esta estudante tenha exatamente 67 polegadas de altura é
igual a zero, ou seja,
P ( x = 67 ) = 0

Figura 6.4 – A probabilidade de um único valor de x é zero

Em geral, se a e b forem dois dos valores que x pode assumir, então

P(a) = 0 e P (b) = 0

Com base nisso, podemos deduzir que, para uma variável aleatória continua,

P ( a ≤ x ≤ b) = P ( a < x < b )

6.2 – DISTRIBUIÇÃO NORMAL

A distribuição de Probabilidades Normal – Uma distribuição de probabilidades


normal, quando colocada em um gráfico, fornece uma curva em formato de sino, de
maneira que

1. A área total sob a curva é igual a 1,0.

2. A curva é simétrica em torno da média aritmética.

3. As duas caudas da curva se estendem até o infinito.

119
Figura 6.5 – Distribuição normal com média aritmética µ e desvio-padrão σ.
Uma distribuição normal possui as três características a seguir:

1. A área total sob uma curva da distribuição normal é igual a 1,0 ou 100%,
conforme mostra a figura 6.6.

Figura 6.6 – Área total sob uma curva da normal

2. Uma curva da distribuição normal é simétrica em torno da média aritmética.


Conseqüentemente, 1/2 da área total sob uma curva da distribuição normal se posiciona no
lado esquerdo da média aritmética e 1/2 se posiciona no lado direito da média aritmética.

Figura 6.7 – Uma curva da normal é simétrica em torno da média aritmética

3. As caudas de uma curva da distribuição normal se estendem infinitamente em


ambas as direções sem tocar ou cruzar o eixo horizontal. Embora uma curva da distribuição
normal nunca encontre o eixo horizontal, além dos pontos representados por µ − 3σ e
µ + 3σ , ela se torna tão próxima deste eixo que a área sob a curva além desses pontos, em
ambas as direções, pode ser considerada como praticamente igual a zero.

120
O valor de µ determina o centro de uma curva da distribuição normal no eixo horizontal, e
o valor de σ fornece a dispersão da curva da distribuição normal.

Figura 6.8 – As áreas da curva da normal além de µ ± 3σ .

As três curvas da distribuição normal desenhadas na figura 6.9 possuem a mesma


média aritmética, mas diferentes desvios-padrão.

Em contrapartida, as três curvas da distribuição normal apresentadas na Figura 6.10


possuem diferentes médias aritméticas, mas o mesmo desvio-padrão.

Figura 6.10 – Três curvas de distribuição normal, com diferentes médias aritméticas mas
com o mesmo desvio-padrão

6.3 – DISTRIBUIÇÃO NORMAL PADRONIZADA

121
Definição

Distribuição Normal Padronizada – A distribuição normal, com µ = 0 e σ =1 é


chamada de distribuição normal padronizada.

As unidades para a curva da distribuição normal padronizada são representadas por z e


são chamadas de valores de z ou resultados de z. Essas unidades são chamadas também de
unidades-padrão ou resultados-padrão.

Figura 6.11 – Curva da distribuição normal padronizada


Definição
Valores de z ou Resultados de z – As unidades marcadas no eixo horizontal da
curva da normal padronizada são representadas por z e são chamadas de valores de z
ou resultados de z. Uma valor específico de z fornece a distância entre a média
aritmética e o ponto representado por z em termos do desvio-padrão.

Aprendemos anteriormente que a área total sob uma curva de distribuição normal é
igual a 1,0. Aprendemos também que, em decorrência da simetria, a área em cada um dos
lados da média aritmética corresponde a 0,5. Este fato é demonstrado na Figura 6.12.

OBS:
Embora os valores de z no lado esquerdo da média aritmética sejam negativos, a
área sob a curva é sempre positiva.

A área sob a curva da normal padronizada, entre quaisquer dois pontos, pode ser
interpretada como a probabilidade de que z assuma um valor dentro daquele intervalo.

Figura 6.12 – Área sob a curva da normal padronizada

122
Exemplo 6.1
Encontre a área sob a curva da normal padronizada entre z = 0 e z =1,95 .
Solução
Dividimos o número 1,95 em duas partes: 1,9 (o digito anterior à casa decimal e o
digito posterior à casa decimal) e 0,05 (o segundo digito depois da casa decimal). (Observe
que 1,95 = 1,9 + 0,05 .) Para encontrar a área desejada, sob a curva da normal padronizada,
localizamos 1,9 na coluna correspondente a z, no lado esquerdo da tabela VII, e 0,05 na
linha correspondente a z na parte superior da Tabela VII. O valor no qual a linha para 1,9 e
a coluna para 0,05 fazem uma interseção fornece a área sob a curva da normal padronizada,
entre z = 0 e z = 1,95.
Tabela 6.1
Área sob a curva da Normal Padronizada, desde z = 0 até z = 1,95
z 0,00 0,01 ... 0,05 ... 0,09
0,0 0,0000 0,0040 ... 0,0199 ... 0,0359
0,1 0,0398 0,0438 ... 0,0596 ... 0,0753
0,2 0,0793 0,0832 ... 0,0987 ... 0,1141
. . . ... . ... .
. . . ... . ... .
. . . ... . ... .
1,9 0,4713 0,4719 ... 0,4744 ... 0,4767
. . . ... . ... .
. . . ... . ... .
. . . ... . ... .
3,0 0,4987 0,4987 .. 0,4989 ... 0,4990

A área entre z = 0 e z = 1,95 pode ser interpretada como a probabilidade de que z


assuma um valor entre 0 e 1,95; ou seja,

Área entre 0 e 1,95 = P(0 < z <1,95 ) = 0,4744

Figura 6.13 – Área entre z = 0 e z = 1,95

Conforme mencionado anteriormente, a probabilidade de que uma variável aleatória


contínua assuma um único valor é igual a zero. Por conseguinte,

123
P ( z = 0) = 0 e P ( z =1,95 ) = 0

Assim sendo,

P (0 < z <1,95 ) = P (0 ≤ z ≤1,95 ) = 0,4744

Exemplo 6.2
Encontre a área sob a curva da normal padronizada, desde z = -2,17 até z = 0.
Solução:
Uma vez que a distribuição normal é simétrica em torno da média aritmética, a área desde z
= -2,17 até z = 0 é igual à área desde z = 0 até z = 2,17, conforme mostra a Figura 6.14.

Figura 6.14 – Área desde z = 0 até z = 2,17 igual à área desde z = -2,17 até z = 0.

Para encontrar a área desde z = -2,17 até z = 0, procuramos a área desde z = 0 até z
= 2,17, na tabela de distribuição normal padronizada (Tabela VII).

Figura 6.15 – Área desde z = -2,17 até z = 0.

A área desde z = -2,17 até z = 0 fornece a probabilidade de que z se posicione no


intervalo –2,17 até 0; ou seja,

Área desde –2,17 até 0 = P (−2,17 ≤ z ≤ 0) =

Exemplo 6.3
Encontre as seguintes áreas sob a curva da normal padronizada.
a) Área à direita de z = 2,32

124
Solução
Para encontrar a área à direita de z = 2,32, inicialmente encontramos a área entre z = 0 e z =
2,32. Em seguida, subtraímos esta área de 0,5, que corresponde à área total à direita de z =
0.

Figura 6.16 – Área à direita de z = 2,32.

A área à direita de z = 2,32 fornece a probabilidade de que z seja maior do que 2,32.
Por conseguinte,

Área à direita de 2,32 = P (z > 2,32 ) =

b) Área à esquerda de z = -1,54


Solução
Para encontrar a área sob a curva da normal padronizada, à esquerda de z = -1,54,
inicialmente encontramos a área entre z = -1,54 e z = 0 e, em seguida, subtraímos esta área
de 0,5, que representa à área total à esquerda de z = 0.

Figura 6.17 – Área à esquerda de z = -,154.

A área à esquerda de z = -1,54 fornece a probabilidade de que z seja menor do que –


1,54. Por conseguinte,

Área à esquerda de –1,54 = P (z < −1,54 ) =

Exemplo 6.4
Encontre as seguintes probabilidades para a curva da normal padronizada.
a) P (1,19 < z < 2,12 )

125
Figura 6.18 – Encontrando P (1,19 < z < 2,12 )

Portanto, a probabilidade procurada é

P (1,19 < z < 2,12 ) = Área entre 1,19 e 2,12 =

b) P(−1,56 < z < 2,31 )

Figura 6.19 – Encontrando P( −1,56 < z < 2,31 )

Portanto, a probabilidade procurada é

P ( −1,56 < z < 2,31 ) = Área entre -1,56 e 2,31 =

c) P( z > −0,75 )

Figura 6.20 – Encontre P( z > −0,75 )

Portanto, a probabilidade procurada é

P ( z > −0,75 ) Área à direita de -0,75 =

Utilizando a tabela da distribuição normal, podemos agora verificar a regra empírica


da seguinte maneira:

126
1. A área total contida em uma unidade de desvio-padrão em relação à média
aritmética é igual a 68,26%. Esta área é fornecida por meio da soma das áreas entre z = -1,0
e z = 0, e entre z = 0 e z = 1,0. Conforme mostrado na figura 6.15, cada uma dessas duas
áreas corresponde a 0,3413, ou 34,13%. Conseqüentemente, a área total entre z = -1,0 e z =
1,0 é igual a 68,26%.

Figura 6.21 – Área contida em uma unidade de desvio-padrão em relação à média


aritmética.

2. A área total contida em duas unidades de desvio-padrão em relação à média


aritmética é igual a 95,44%. Esta área é fornecida pela soma das áreas entre z = -2,0 e z = 0,
e entre z = 0 e z = 2,0. Cada uma dessas duas áreas é igual a 0,4772 ou 47,72%. Por
conseguinte, a área total entre z = -2,0 e z = 2,0 é igual a 95,44%.

Figura 6.22 – Área contida em duas unidades de desvios-padrão em relação à média


aritmética.

3. A área total contida em três unidades de desvio-padrão em relação à média


aritmética é igual a 99,74%. Esta área é fornecida pela soma das áreas entre z = -3,0 e z = 0,
e entre z = 0 e z = 3,0. Cada uma dessas duas áreas é igual a 0,4987 ou 49,87%. Por
conseguinte, a área total entre z = -3,0 e z = 3,0 é igual a 99,74%.

127
Figura 6.23 - Área contida em três unidades de desvios-padrão em relação à média
aritmética.

Exemplo 6.5
Encontre as seguintes probabilidades para a curva da normal padronizada.
a) P(0 < z < 5,67 )
Solução
Uma vez que z = 5,67 é maior do que 3,09, e não pode ser encontrado na Tabela VII, a área
sob a curva da normal padronizada, entre z = 0 e z = 5,67, pode ser aproximada para 0,5.

Figura 6.24 – Área entre z = 0 e z = 5,67.

A probabilidade procurada é

P (0 < z < 5,67 ) = Área entre 0 e 5,67 = aproximadamente 0,5

Observe que a área entre z = 0 e z = 5,67 não é exatamente 0,5, mas muito próxima
de 0,5

b) P ( z < −5,35 )

Solução
A área entre z = -5,35 e z = 0 corresponde aproximadamente 0,5. Conseqüentemente, a área
sob a curva da normal padronizada, à esquerda de z = -5,35, é aproximadamente igual a
zero.

Figura 6.25 – Área à esquerda de z = -5,35.

A probabilidade procurada é

128
P (z < −5,35 ) = Área à esquerda de –5,35 =

6.4 – PADRONIZANDO UMA DISTRIBUIÇÃO NORMAL

Convertendo um valor de x em um Valor de z – Para uma variável aleatória normal


x, um determinado valor de x pode ser convertido em seu valor correspondente de z
utilizando-se a fórmula
x −µ
z=
σ

onde µ e σ correspondem à média aritmética e ao desvio-padrão da distribuição normal


de x, respectivamente.

Exemplo 6.6
Faça com que x seja uma variável aleatória contínua, que possua uma distribuição
normal, com uma média aritmética de 50, e um desvio-padrão de 10. Converta os seguintes
valores de x em valores de z.
a) x = 55

Solução
Para a distribuição normal fornecida, µ = 50 e σ = 10 .
x −µ
z= =
σ

Figura 6.26 – Valor de z para x = 55.

b) x = 35

Solução
Uma vez que x = 35 encontra-se do lado esquerdo da média aritmética, seu valor de z é
negativo.

129
x −µ
z= =
σ

Figura 6.27 – Valor de z para x = 35

OBS:
O valor de z para um valor de x que seja maior que µ é positivo, o valor de z para
um valor de x que seja igual a µ é zero, e o valor de z para um valor de x que seja menor
que µ é negativo.

Exemplo 6.7
Faça com que x seja uma variável aleatória continua, que seja normalmente
distribuída, com uma média aritmética de 25 e um desvio-padrão de 4. Encontre a área
a) entre x = 25 e x = 32

Solução
O valor de z para x = 25 é igual a zero, uma vez que representa a média aritmética da
distribuição normal. O valor de x = 32 é
x −µ
z= =
σ

P ( 25 < z < 32 ) =

130
Figura 6.28 – Área entre x = 25 e x = 32

b) entre x = 18 e x = 34
Solução
Inicialmente, calculamos os valores de z para x = 18 e x = 34, da seguinte maneira:

x −µ
Para x = 18: z = =
σ

x −µ
Para x = 34: z = =
σ

P (18 < z < 34 ) =

Figura 6.29 – Área entre x = 18 e x = 34.

6.5 – APLICAÇÕES DA DISTRIBUIÇÃO NORMAL

Exemplo 6.8
A vida útil de uma calculadora fabricada pela Texas Instruments possui uma
distribuição normal, com uma média aritmética de 54 meses, e um desvio-padrão de 8
meses. A companhia garante que qualquer calculadora que comece a apresentar defeitos,
dentro do período de 36 meses após a compra, será substituída por uma nova calculadora.
Que percentagem aproximada de calculadoras fabricadas por essa empresa espera-se que
tenham de ser substituídas?

131
Figura 6.30 – Área à esquerda de x = 36.

A probabilidade de que qualquer calculadora, aleatoriamente selecionada, fabricada


pela Texas Instruments, venha a começar a apresentar defeitos dentro do período de 36
meses após a compra é igual a .............. Portanto, é esperado que ..........das calculadoras
venham a ser substituídas.

6.6 – DETERMINANDO OS VALORES DE Z E DE X QUANDO UMA ÁREA


SOB A CURVA DA DISTRIBUIÇÃO NORMAL É CONHECIDA

Vamos encontrar o valor correspondente de z ou x quando uma área sob a curva da


distribuição normal é conhecida.

Exemplo 6.10
Encontre um ponto z tal que a área sob a curva da normal padronizada, entre 0 e z,
seja 0,4251 e o valor de z seja positivo.
Solução
Conforme mostrado na figura 6.31, desejamos encontrar o valor de z tal que a área entre 0 e
z seja 0,4251.

Figura 6.31 – Encontrando o valor de z.

Para encontrar o valor desejado de z, localizamos 0,4251 no corpo da tabela da


distribuição normal, Tabela VII do Apêndice C. Em seguida, lemos os números na coluna e
na linha para z, que correspondem a 0,4251. Conforme mostrado na Tabela, esses números
são 1,4 e 0,04, respectivamente. Combinando esses dois números, obtemos o valor desejado
de z = 1,44.
Encontrando um Valor de x para uma Distribuição Normal – Para uma curva da
normal, com valores conhecidos de µ e σ , e para uma determinada área sob a curva,
entre a média aritmética e x, o valor de x é calculado como

x = µ + zσ
Exemplo 6.12
Quase todos os alunos do curso secundário que pretendem entrar na faculdade
fazem o teste SAT. Em 2002, a média aritmética do resultado do SAT (na prova oral e na

132
prova de matemática) de todos os alunos foi de 1020. Debbie está planejando fazer o teste
em breve. Suponha que os resultados do SAT, para todos os alunos que fazem este teste
com Debbie, venham a ter uma distribuição normal, com uma média aritmética de 1020, e
um desvio-padrão de 153. Qual deve ser o resultado de Debbie neste teste, de maneira que
somente 10% de todas as pessoas que estão fazendo o exame façam mais pontos do que
ela?

Figura 6.32 – Encontrando um valor de x.


x = µ + zσ =
Portanto, caso Debbie faça ...........pontos no SAT, é esperado que somente cerca de
10% de todas as pessoas que estarão fazendo o exame venham a fazer mais pontos do que
ela.

6.7 – A APROXIMAÇÃO DA NORMAL PARA A DISTRIBUIÇÃO


BINOMIAL

A Distribuição Normal como uma Aproximação para a Distribuição Binomial


– Geralmente, a distribuição normal é utilizada como uma aproximação para a distribuição
binomial, quando np e nq são ambos maiores do que 5, ou seja, quando

np > 5 e nq > 5

Definição

Fator de Correção para Continuidade – A soma 0,5 ao valor, ou valores, de x


e/ou a subtração de 0,5 do valor, ou valores, de x, quando a distribuição normal é utilizada
como uma aproximação para a distribuição binomial, onde x representa o número de
sucessos em n testes, é chamada de fator de correção para continuidade.

Exemplo 6.13
Em uma pesquisa recente, realizada pela revista Money, 80% das mulheres (casadas
ou solteiras) entrevistadas afirmaram que possuem agora um maior conhecimento sobre
investimentos do que tinham há apenas cinco anos atrás (Money, junho de 2002). Suponha
que esse resultado seja verdadeiro para a população atual de todas as mulheres. Qual é a
probabilidade de que, em uma amostra aleatória de 100 mulheres, 72 a 76 delas venham a
afirmar que sabem mais sobre investimentos agora do que há apenas cinco anos atrás?

133
Solução
Faça com que n represente o número total de mulheres na amostra; x corresponde ao
número de mulheres na amostra que afirmaram que possuem maior conhecimento sobre
investimentos agora do que há cinco anos atrás; e p seja a probabilidade de que uma mulher
afirme que possui maior conhecimento sobre investimentos agora do que há apenas cinco
anos atrás. Então, este corresponde a um problema binomial, com

n= p= q=

Desejamos encontrar a probabilidade de 72 a 76 sucessos em 100 testes. Uma vez que n é


grande, é mais fácil aplicar a aproximação da normal do que utilizar a fórmula binomial.
Podemos verificar que np e nq são ambos maiores do que 5. A média aritmética e o desvio-
padrão da distribuição binomial são

µ = np =

σ = npq =

Para realizar a correção para continuidade, subtraímos 0,5 de 72 e somamos 0,5 de 76, para
obter o intervalo de 71,5 a 76,5. Com base na área sob a curva da distribuição normal,
desde x = 71,5 até x = 76,5.

x −µ
Para x = 71,5: z = =
σ

x −µ
Para x = 76,5: z = =
σ

Figura 6.33 – Área desde x = 71,5 até x = 76,5.

P (71,5 ≤ z ≤ 76 ,5) =

Portanto, a probabilidade de que 72 a 76 mulheres, em uma amostra aleatória de 100


mulheres, afirmaram que possuem mais conhecimento sobre investimentos agora do que
tinham há cinco anos atrás é aproximadamente .....................

134
EXERCÍCIOS
1) Encontre a área sob a curva da normal padronizada
a) entre z = 0 e z = 1,95

b) entre z = 1,15 e z = 2,37

c) desde z = -1,53 até z = -2,88

d) desde z = -1,67 até z = 2,44

2) Encontre a área sob a curva da normal padronizada


a) à direita de z = 1,56

b) à esquerda de z = -1,97

135
3) Determine as seguintes probabilidades para a distribuição normal padronizada.
a) P ( −1,83 ≤ z ≤ 2,57 )

b) P(0 ≤ z ≤ 2,02 )

4) Encontre o valor de z para cada um dos seguintes valores de x, para uma distribuição
normal com µ = 30 e σ = 5 .
a) x = 39

b) x = 17

c) x = 22

d) x = 42

5) Encontre as seguintes áreas sob a curva da distribuição normal, com µ = 20 e σ = 4 .


a) Área entre x = 20 e x = 27

b) Área entre x = 23 e x = 25

c) Área desde x = 9,5 até x = 17

136
6) Faça com que x seja uma variável aleatória contínua, que seja normalmente distribuída,
com uma média aritmética de 25 e um desvio-padrão de 6. Encontre a probabilidade de que
x assuma um valor
a) entre 29 e 35

b) entre 22 e 33

7) Faça com que x represente o tempo necessário para completar uma corrida. Suponha que
x seja distribuído de maneira aproximadamente normal, com uma média aritmética de 190
minutos e um desvio-padrão de 21 minutos. Se um corredor for selecionado ao acaso, qual
é a probabilidade de que este corredor venha a completar essa corrida
a) em menos de 150 minutos?

b) em 205 até 245 minutos?

8) O U.S. Bureau of Labor Statistic (Departamento de Estatísticas do Trabalho dos EUA)


conduz pesquisas periódicas com o intuito de coletar informações sobre o mercado de
trabalho. De acordo com uma dessas pesquisas, a média de salários dos trabalhadores do

137
comércio varejista foi de $10 por hora em agosto de 2002 (Bureau of Labor Statistics
News, 18 de setembro de 2002). Suponha que os salários por hora desses trabalhadores, em
agosto de 2002, possuam uma distribuição normal, com uma média aritmética de $10 e um
desvio-padrão de $1,10. Encontre a probabilidade de que os salários por hora de um
trabalhador do comércio varejista, aleatoriamente selecionado, em agosto de 2002, seja
a) mais que $12

b) entre $8,50 e $10,80

9) De acordo com registros de uma empresa de serviços de energia elétrica da área de


Boston, a média aritmética do consumo de energia elétrica para todos os domicílios,
durante o inverno, é igual a 1650 quilowatts-hora por mês. Suponha que o consumo mensal
de energia elétrica durante o inverno, por parte de todos os domicílios nessa área, possua
uma distribuição normal, com uma média aritmética de 1650 quilowatts-hora e desvio-
padrão de 320 quilowatts-hora.
a) Encontre a probabilidade de que o consumo mensal de energia elétrica durante o inverno,
por parte de um domicílio aleatoriamente selecionado dessa área, seja inferior a 1850
quilowatts-hora.

b) Que percentagem dos domicílios nessa área possui um consumo de energia elétrica de
900 até 1340 quilowatts-hora.

138
10) A media do resultado da prova de matemática do SAT foi 516 em 2002. Suponha que
os resultados da prova de matemática de todos os alunos que fizeram o SAT em 2002
tivessem sido normalmente distribuídos, com uma média aritmética de 516 e um desvio-
padrão de 90.
a) Que percentagem dos alunos fez mais do que 600 pontos nessa prova?

b) Que percentagem dos alunos fez mais do que 450 pontos nessa prova?

c) Uma faculdade técnica de elite exige que o resultado da prova de matemática do SAT de
um aluno seja 700 ou mais, de modo que esse aluno possa ser considerado apto para fins de
matrícula. Que percentagem de alunos que fizeram o SAT em 2002 será apta para ser
matriculada nessa faculdade?

11) Faça com que x seja uma variável aleatória contínua, que segue uma distribuição
normal, com uma média aritmética de 200 e um desvio-padrão de 25. Encontre o valor de
x, tal que a área sob a curva da normal, à esquerda de x, seja aproximadamente 0,6330.

139
7. DISTRIBUIÇÕES DE AMOSTRAGEM

7.1- DISTRIBUIÇÕES DA POPULAÇÃO E DISTRIBUIÇÃO DE AMOSTRAGEM

7.1.1- Distribuição da População

Definição: A distribuição da população representa a distribuição de probabilidade


dos dados da população.

Suponha que existam somente cinco alunos em um curso avançado de estatística, e


que os resultados das provas semestrais para esses cinco alunos sejam

70 78 80 80 95

Faça com que x represente o resultado correspondente a um aluno. Utilizando


classes de valor único (uma vez que existem cinco valores de dados, não é necessário
agrupá-los). Podemos construir a distribuição de freqüências dos resultados, na forma
apresentada na Tabela 7.1, juntamente com as freqüências relativas de classes, que são
obtidas por meio da divisão das freqüências de classes pelo tamanho da população. A
Tabela 7.2, que representa as probabilidades correspondentes aos vários valores de x,
ilustra a distribuição de probabilidades da população. Observe que essas probabilidades são
iguais as freqüências relativas.

Tabela 7.1
Distribuição de Freqüências da População e Distribuição
De Freqüências Relativas da População
_________________________________________________
x f Freqüência Relativa
_________________________________________________
70 1 1/5 = 0,20
78 1 1/5 = 0,20
80 2 2/5 = 0,40
95 1 1/5 = 0,20
_________________________________________________
N=5 Soma = 1,00
_________________________________________________

140
Tabela 7.2
Distribuição de Probabilidades da População
____________________________________
x P(x)
____________________________________
70 0,20
78 0,20
80 0,40
95 0,20
______________________________________
∑P( x) =1,00
______________________________________

Os valores da média aritmética e o desvio-padrão, calculados para a distribuição de


probabilidades da Tabela 7.2, fornecem os valores dos parâmetros da população, µ e σ .
Esses valores são µ =80 ,60 e σ =8,09 .

7.1.2 – Distribuição da Amostragem

Definição: A distribuição de probabilidades de x é chamada de distribuição de


amostragem de x . Ela representa os vários valores que x pode assumir, bem como a
probabilidade de cada valor de x .
Em geral, a distribuição de probabilidades de uma estatística da amostra é chamada
de distribuição de amostragem dessa estatística.

Reconsidere a população relativa aos resultados semestrais correspondentes a cinco


alunos, fornecidos na Tabela 7.1. Considere todas as amostras possíveis, com três
resultados cada, que possam ser selecionados sem reposição a partir daquela população.

Número total de amostras =

7.2 - ERROS DE AMOSTRAGEM E ERROS NÃO INERENTES À AMOSTRAGEM

7.2.1 - Erro de Amostragem

141
Definição: Representa a diferença entre o valor de uma estatística da amostra e o
valor do parâmetro correspondente da população. No caso da média aritmética,

Erro de amostragem = x −µ

considerando-se que a amostra seja aleatória e que nenhum erro não inerente à amostragem
tenha sido cometido.
7.2.2 – Erros Não Inerentes à Amostragem

Definição: Os erros que ocorrem na coleta, no registro e na tabulação de dados são


chamados de erros não inerentes à amostragem.

Exemplo 7.1
Reconsidere a população relativa aos cinco resultados fornecidos na Tabela 7.1.
Suponha que uma amostra de três resultados seja selecionada a partir dessa população e que
essa amostra inclua os resultados 70, 80 e 95. Encontre o erro de amostragem.

Solução:
A média aritmética da população é µ =

A média aritmética para essa amostra é x=

Conseqüentemente,

Erro de amostragem = x −µ=

7.3 – MÉDIA ARITMÉTICA E DESVIO-PADRÃO DE X

Definição: A média aritmética da distribuição de amostragem de x e o desvio-


padrão da distribuição de amostragem de x são chamados de média aritmética de x de
desvio-padrão de x e são representados por µx e σx , respectivamente.

Média Aritmética da Distribuição de Amostragem de x : A média aritmética da


distribuição de amostragem de x é sempre igual a média aritmética da população. Dessa
maneira,
µx = µ

O desvio-padrão de x é igual ao desvio-padrão da população, dividido pela raiz


quadrada do tamanho da amostra; ou seja,
σ
σx =
n

142
Esta fórmula para o desvio-padrão de x permanece verdadeira somente quando a
amostragem é feita sem reposição, a partir de uma população finita, ou é feita com ou sem
reposição, a partir de uma população infinita. Essas duas condições podem ser substituídas
pela condição de que a fórmula anterior permaneça verdadeira, se o tamanho da amostra for
pequeno quando comparado com o tamanho da população. O tamanho da amostra é
considerado pequeno quando comparado com o tamanho da população caso o tamanho da
amostra seja igual ou menor do que 5% do tamanho da população – ou seja, se,
n
≤ 0,05
N

Se esta condição não for satisfeita, utilizamos a seguinte fórmula para calcular σx :
σ N −n
σx =
n N −1

onde o fator

N −n
N −1

é chamado de fator de correção de população finita.

Na maior parte das aplicações práticas, o tamanho da amostra é pequeno,


comparado ao tamanho da população. Conseqüentemente, na maior parte dos casos, a
σ
fórmula utilizada para calcular σx é σ x = .
n
Desvio-Padrão da Distribuição de Amostragem de x : O desvio-padrão da
distribuição de amostragem de x é

σ
σx =
n
onde σ representa o desvio-padrão da população, e n é o tamanho da amostra. Esta
n
fórmula é utilizada quando ≤ 0,05 , onde N é o tamanho da população.
N

Exemplo 7.2
A média aritmética do salário, por hora, para todos os 5000 empregados que
trabalham em uma grande empresa, é de $17,50, e o desvio-padrão é $2,90. Faça com que
x seja a média aritmética do salário, por hora, para uma amostra aleatória de determinados
empregados, selecionados a partir dessa empresa. Encontre a média aritmética de x e o
desvio-padrão de x para uma amostra com tamanho de

(a) 30

143
(b)75

(c)200

7.4 – FORMATO DA DISTRIBUIÇÃO DE AMOSTRAGEM DE x

O formato da distribuição de amostragem de x relaciona-se aos seguintes dois casos:


1. A população a partir da qual as amostras são extraídas tem uma distribuição normal.
2. A população a partir da qual as amostras são extraídas não tem uma distribuição normal.

7.4.1 – Fazendo Amostragem a Partir de uma População Normalmente Distribuída

Quando a população a partir da qual as amostras são extraídas é normalmente


distribuída, com sua média aritmética igual a µ , e seu desvio-padrão igual a σ , então

1. A média aritmética de , µx , é igual à média aritmética da população, µ .


x
σ n
2. O desvio-padrão de x , σx , é igual a , considerando ≤ 0,05 .
n N
3. O formato da distribuição de amostragem de x é normal, seja qual for o valor de n.

Distribuição de Amostragem de x Quando a População Possui uma


Distribuição Normal: Caso a população, a partir da qual as amostras são extraídas, seja
normalmente distribuída, com uma média aritmética µ , e desvio-padrão σ , então a
distribuição de amostragem da média aritmética da amostra, x , também será normalmente
distribuída, com a média aritmética e o desvio-padrão a seguir apresentados,
independentemente do tamanho da amostra:
σ
µx = µ e σx =
n

Exemplo 7.3
Em um recente teste do SAT, a média aritmética dos resultados para todos os candidatos foi
igual a 1020. Considere que a distribuição dos resultados do SAT, para todos os candidatos,
seja normal, com uma média aritmética de 1020 e um desvio-padrão de 153. Faça com que

144
x seja a média aritmética dos resultados para o SAT, para uma amostra aleatória de
determinados candidatos. Calcule a média aritmética e o desvio-padrão de x , e descreva o
formato de sua distribuição de amostragem quando o tamanho da amostra for
(a) 16

(b) 50

(c) 1000

145
7.4.2 – Fazendo Amostragem a Partir de uma População que Não Seja Normalmente
Distribuída

O formato da distribuição de amostragem de x é deduzido a partir de um teorema


muito importante, chamado de teorema do limite central.

Teorema do limite central: De acordo com o teorema do limite central, para uma
amostra de tamanho grande, a distribuição de amostragem de x é aproximadamente
normal, independentemente do formato da distribuição da população. A média aritmética e
o desvio-padrão da distribuição de amostragem de x são

σ
µx = µ e σx =
n

O tamanho da amostra é usualmente considerado como sendo grande, se n ≥ 30 .

De acordo com o teorema do limite central,

1. Quando n ≥ 30 , o formato da distribuição de amostragem de x é aproximadamente


normal, independentemente do formato da distribuição da população.

2. A média aritmética de , µx , é igual à média aritmética da população, µ .


x
σ n
3. O desvio-padrão de x , σx , é igual a , considerando ≤ 0,05 .
n N

Exemplo 7.4
A média aritmética dos aluguéis pagos por todos os inquilinos em uma grande cidade é de
$1550, com um desvio-padrão de $225. Entretanto, a distribuição da população de aluguéis,
para todos os inquilinos nessa cidade, é assimétrica à direita. Calcule a média aritmética e o

146
desvio-padrão de x , e descreva o formato de sua distribuição de amostragem, quando o
tamanho da amostra é
(a) 30

(b) 100

7.5 – APLICAÇÕES DA DISTRIBUIÇÃO DE AMOSTRAGEM DE X

147
Segundo o teorema do limite central, para grandes amostras, a distribuição de
amostragem de x é aproximadamente normal. Com base nesse resultado, podemos fazer
as seguintes afirmações em relação a x para grandes amostras. As áreas sob a curva de x
, mencionadas nessas afirmações, são encontradas a partir da tabela da distribuição normal.

1. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma


população, e calcularmos a média aritmética para cada uma dessas amostras, então
aproximadamente 68,26% das médias aritméticas das amostras estarão dentro dos limites
de uma unidade de desvio-padrão em relação à média aritmética da população.
P ( µ −1σx ≤ x ≤ µ +1σx ) = 0,6826

2. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma


população, e calcularmos a média aritmética para cada uma dessas amostras, então
aproximadamente 95,44% das médias aritméticas das amostras estarão dentro dos limites
de duas unidades de desvio-padrão em relação à média aritmética da população.

P ( µ − 2σx ≤ x ≤ µ + 2σx ) = 0,9544

3. Se extrairmos todas as possíveis amostras de mesmo tamanho (grande), a partir de uma


população, e calcularmos a média aritmética para cada uma dessas amostras, então
aproximadamente 99,74% das médias aritméticas das amostras estarão dentro dos limites
de três unidades de desvio-padrão em relação à média aritmética da população.
P ( µ − 3σx ≤ x ≤ µ + 3σx ) = 0,9974

148
Exemplo 7.5
Considere que os pesos de todas as embalagens de uma determinada marca de biscoitos
sejam distribuídos normalmente, com uma média aritmética de 32 onças e um desvio-
padrão de 0,3 onças. Encontre a probabilidade de que a média aritmética do peso, x , para
uma amostra aleatória de 20 embalagens dessa marca de biscoitos, venha a estar entre 31,8
e 31,9 onças. Obs.: 1 onça equivale a 28,35 g.

OBS:
Valor de z para um valor de x : O valor de z para um valor de x é calculado como
x −µ
z=
σx
7.6 – PROPORÇÃO DA POPULAÇÃO E PROPORÇÃO DA AMOSTRA

Proporção da População e Proporção da Amostra: A proporção da população e a


^
proporção da amostra, representada por p e
p , respectivamente, são calculadas como
X ^
p= e x
N p =
n

onde
N = número total de elementos na população
n = número total de elementos na amostra
X = número total de elementos na população, que possuem uma característica especifica.
x = número total de elementos na amostra, que possuem uma característica especifica.

149
Exemplo 7.6
Suponha que um total de 789.654 famílias resida em uma cidade e 563.282 delas possuam
casa própria. Uma amostra de 240 famílias é selecionada a partir dessa cidade, e 158 delas
possuem casa própria. Encontre a proporção de famílias na população e na amostra, que
possuem casa própria.

Erro de amostragem?

7.7 – MÉDIA ARITMÉTICA,


DESVIO-PADRÃO E FORMATO DA
^
DISTRIBUIÇÃO DE AMOSTRAGEM DE
P
^
7.7.1 – Distribuição de Amostragem
p
^
Definição: A distribuição de probabilidades da proporção da amostra,
p , é chamada de
^
sua distribuição de amostragem. Ela fornece os vários valores que pode assumir, bem
p
como suas propriedades.

Exemplo 7.7
A Boe Consultant Associates possui cinco empregados. A tabela 7.3 fornece os nomes
desses cinco empregados, e informações em relação a seu conhecimento sobre estatística.
Tabela 7.3
Informações sobre os Cinco Empregados
da Boe Consultant Associates
______________________________________
Nome Conhece Estatística
______________________________________
Ally sim
John não
Susan não
Lee sim
Tom sim
_____________________________________

150
Se definirmos a proporção da população, p, como a proporção de empregados que
conhecem estatística, então

p = 3 / 5 = 0,60

Agora, suponha que extraiamos todas as amostras possíveis, com três empregados
cada, e calculemos a proporção de empregados, para cada amostra, que conhece estatística.
O número total de amostras de tamanho três, podem ser extraídas dessa população de cinco
empregados é,
5! 5 .4 .3 .2 .1
Número total de amostras = 5 C 3 = 3! (5 −3)! = 3.2.1.2.1 =10

A tabela 7.4 apresenta essas 10 amostras possíveis, e a proporção de empregados


que conhecem estatística, para cada uma dessas amostras. Observe que arredondamos os
^
valores de para duas casas decimais.
p
^
Utilizando a Tabela 7.4, preparamos a distribuição de freqüências de
p , conforme
registrado na Tabela 7.5, juntamente com as freqüências relativas de classes, que são
obtidas pela divisão entre as freqüências de classes e o tamanho da população. As
freqüências relativas são utilizadas como probabilidades, e estão apresentadas na tabela 7.6.
^
Esta tabela fornece a distribuição de amostragem de
p.
Tabela 7.4
Todas as Amostras Possíveis de Tamanho 3,
^
e os Valores de para cada Amostra
p
__________________________________________________
^
Amostra Proporção que Conhece Estatística
p
___________________________________________________
Ally, John, Susan 1/3 = 0,33
Ally, John, Lee 2/3 = 0,67
Ally, John, Tom 2/3 = 0,67
Ally, Susan, Lee 2/3 = 0,67
Ally, John, Tom 2/3 = 0,67
Ally, Lee, Tom 3/3 = 1,00
John, Susan, Lee 1/3 = 0,33
John, Susan, Tom 1/3 = 0,33
John, Lee, Tom 2/3 = 0,67
Susan, Lee, Tom 2/3 = 0,67
___________________________________________________

151
Tabela 7.5
^
Distribuição de Freqüências e Distribuição de Freqüências Relativas
p
Quando o Tamanho da Amostra é 3
_______________________________________________________________
^
f Freqüência Relativa
p
_______________________________________________________________
0,33 3 3/10 = 0,30
0,67 6 6/10 = 0,60
1,00 1 1/10 = 0,10
_______________________________________________________________
∑f =10 Soma = 1,00
______________________________________________________________

Tabela 7.6
^
Distribuição de Amostragem de
p
Quando o Tamanho da Amostra é 3
____________________________________
^ ^
P(
p p)
____________________________________
0,33 0,30
0,67 0,60
1,00 0,10
___________________________________
^
∑ P( p) = 1,0 0
__________________________________

^
7.7.2 – Média Aritmética e Desvio-Padrão de
p
Média Aritmética da Proporção da Amostra: A média aritmética da proporção da

amostra,
^
µ ^ , e é igual à proporção da população, p. Dessa maneira,
p , é representada por p

152
µ^= p
p
^
A proporção da amostra,
p , é chamada de estimador da proporção da população, p.

Desvio-Padrão da Proporção da Amostra: O desvio-padrão da proporção da

amostra,
^
σ ^ , e é fornecido pela fórmula
p , é representado por p

pq
σ^=
p n

onde p é a proporção da população, q =1 − p , e n é o tamanho da amostra. Esta fórmula é


n
utilizada quando ≤ 0,05 , onde N é o tamanho da população.
N

Entretanto, se
n
for maior do que 0,05, então σ ^ é calculado como segue:
N p

pq N− n
σ^=
p n N−1

onde o fator
N −n
N −1

é chamado de fator de correção de população finita.

^
7.7.3 – Formato da Distribuição de Amostragem de
p
^
O formato da distribuição de amostragem de é deduzido a partir do teorema do
p
limite central.

Teorema do Limite Central para a Proporção da Amostra: De acordo com o


^
teorema do limite central, a distribuição de amostragem de é aproximadamente normal
p
para uma amostra de tamanho suficientemente grande. No caso da proporção, o tamanho da

153
amostra é considerado como suficientemente grande se np e nq forem ambos maiores do
que 5, ou seja, se

np >5 nq >5

Exemplo 7.8
A Pesquisa Nacional das Matrículas de Alunos nos EUA mostrou que 87% dos calouros e
quartanistas classificaram a sua experiência na faculdade como “boa” ou “excelente” (USA
TODAY, 12 novembro de 2002). Considere esse resultado como verdadeiro para a
^
população atual de todos os calouros e quartanistas. Faça com que seja a proporção de
p
calouros e quartanistas, em uma amostra aleatória de 900 calouros e quartanistas que
^
mantêm esse ponto de vista. Encontre a média aritmética e o desvio-padrão de e
p
descreva o formato de sua distribuição de amostragem.

^
7.8 – APLICAÇÕES DA DISTRIBUIÇÃO DE AMOSTRAGEM DE
P
Exemplo 7.9
De acordo com uma pesquisa da Universidade de Michigan, realizada em 2002, somente
cerca de um terço dos norte-americanos esperavam que os cinco anos seguintes trouxessem
tempos de contínua felicidade (The New York Times, 11 de novembro de 2002). Considere
que 33% da atual população de todos os norte-americanos mantenham essa opinião. Faça
^
com que seja a proporção, em uma amostra aleatória de 800 norte-americanos que irão
p
^
manter essa opinião. Encontre a probabilidade de que o valor de esteja entre 0,35 e
p
0,37.

154
OBS:
^ ^
Valor de z para um valor de : O valor de z para um valor de é calculado como
p p
^
p− p
z=
σ^
p
Exemplo 7.10
Maureen Webster, que está concorrendo para a prefeitura em uma grande cidade, declara
que é favorita de 53% de todos os eleitores registrados naquela cidade. Considere que esta
afirmação seja verdadeira. Qual a probabilidade de que, em uma amostra aleatória de 400
eleitores registrados, extraída a partir daquela cidade, menos do que 49% venham a votar a
favor de Maureen Webster?

155
LISTA DE EXERCÍCIOS
1) A média aritmética mensal dos custos relativos a medicamentos com receita médica,
para todos os cidadãos idosos em uma cidade, é igual a $233, com um desvio-padrão
correspondente a $72. Faça com que x seja a média aritmética de tais custos para uma
amostra aleatória de 25 cidadãos idosos dessa cidade. Encontre a média aritmética e o
desvio-padrão da distribuição de amostragem de x .

2) Suponha que o desvio-padrão dos custos de recrutamento por jogadora, para todas as
jogadoras de basquete recrutadas por todas as universidades públicas no centro-oeste dos
EUA, seja $405. Faça com que x seja a média aritmética dos custos de recrutamento para
uma amostra de um determinado número de tais jogadoras. Qual tamanho de amostra irá
fornecer um desvio-padrão de x igual a $45?

3) Os GPAs para todos os 5540 alunos matriculados em uma universidade possuem uma
distribuição aproximadamente normal, com uma média aritmética de 3,02 e um desvio-
padrão de 0,29. Faça com que x seja a média aritmética do GPA para uma amostra
aleatória de 48 alunos, selecionada a partir dessa universidade. Encontre a média aritmética
e o desvio-padrão de x , e comente sobre o formato de sua distribuição de amostragem.

156
4) De acordo com estimativas do U.S. Bureau of Labor Statistics, a média dos salários dos
trabalhadores na construção civil era de $18,96 por hora, em agosto de 2002 (Bureau of
Labor Statistics News, 18 de setembro de 2002). Considere que os salários atuais de todos
os trabalhadores na construção civil sejam normalmente distribuídos, com uma média
aritmética igual a $18,96 por hora e um desvio-padrão igual a $3,60 por hora. Encontre a
probabilidade de que a média aritmética dos salários, por hora, de uma amostra aleatória de
25 trabalhadores na construção civil,
a) esteja entre $18 e $20 por hora

b) seja maior do que a média aritmética da população em $1,5 ou mais.

157
5) As dividas com cartão de crédito para todos os alunos de faculdade possuem uma
distribuição que é assimétrica à direita, com uma média aritmética de $1840 e um desvio-
padrão de $453. Encontre a probabilidade de que a média aritmética das dividas com cartão
de crédito, para uma amostra aleatória de 36 alunos de faculdade, venha a
a) estar entre $1750 e $1950

b) ser menor que $1700

6) As estaturas de todos os adultos em uma grande cidade possuem uma distribuição que é
assimétrica à direita, com uma média aritmética de 68 polegadas (aproximadamente 1,73m)
e um desvio-padrão de 4 polegadas (aproximadamente 0,10m). Encontre a probabilidade de
que a média aritmética das estaturas de uma amostra aleatória de 100 alunos, selecionados a
partir dessa cidade,
a) seja menor do que 67,8 polegadas

158
b) esteja entre 67,5 polegadas e 68,7 polegadas

c) seja menor do que a média aritmética da população, em 0,5 polegadas ou mais

7) Em uma pesquisa com trabalhadores, realizada pela International Communications


Research para a J. Howard & Associates, 39% afirmaram que o mérito era a chave para a
promoção, enquanto que outros indicaram antiguidade, amizade ou sorte (USA TODAY, 2
de outubro de 2002). Considere que 39% de todos os atuais trabalhadores sintam que o
^
mérito seja a chave para a promoção, e que seja a proporção de trabalhadores, em uma
p
amostra aleatória de 300 trabalhadores, que mantenham esse ponto de vista. Encontre a
^
probabilidade de que o valor de
p
a) esteja entre 0,35 e 0,45

b) seja maior do que 0,36

159
8) A Brooklyn Corporation fabrica CDs. É conhecido que a máquina que é utilizada para
fabricar esses CDs produz 6% de CDs defeituosos. O inspetor de controle de qualidade
seleciona uma amostra de 100 CDs a cada semana e os inspeciona em relação a estarem
perfeitos ou defeituosos. Se 8% ou mais, dentre os CDs na amostra, forem defeituosos, o
processo é interrompido e a máquina é ajustada. Qual é a probabilidade de que, com base
em uma amostra de 100 CDs, o processo venha a ser interrompido para ajustar a máquina?

160
8. ESTIMATIVA DA MÉDIA ARITMÉTICA E DA PROPORÇÃO

8.1 – ESTIMATIVA: UMA INTRODUÇÃO

Estimativa: É a atribuição de um valor, ou valores, a um parâmetro de uma população,


com base em um valor da estatística correspondente da amostra.

A estatística da amostra, utilizada para estimar um parâmetro da população, é chamada de


estimador.

O procedimento de estimativa envolve as seguintes etapas:


1. Selecionar uma amostra.
2. Coletar as informações necessárias a partir de membros da amostra.
3. Calcular o valor da estatística da amostra.
4. Atribuir valor (ou valores) ao parâmetro correspondente da população.

8.2- ESTIMATIVAS DE PONTO E ESTIMATIVAS DE INTERVALO

8.2.1 – Uma Estimativa de Ponto

Definição

Estimativa de Ponto: O valor de uma estatística da amostra, que é utilizado para estimar
um parâmetro da população, é chamado de estimativa de ponto.

Para a estimativa da média aritmética da população, a margem de erro é calculada


da seguinte maneira:

Margem de erro = ±1,96 σx ou ±1,96 s x

Ou seja, encontramos o desvio-padrão da média aritmética da amostra e


multiplicamos por 1,96. Nesse caso, s x representa um estimador de ponto de σx .

8.2.2 – Uma Estimativa de Intervalo

Definição

161
Estimativa de Intervalo: Na estimativa de intervalo, um intervalo é construído em torno
da estimativa de ponto, e é afirmado que esse intervalo é passível de conter o parâmetro
correspondente da população.

Nível de Confiança e Intervalo de Confiança: Cada intervalo é construído com relação a


um determinado nível de confiança, e é chamado de intervalo de confiança. O nível de
confiança associado a um intervalo de confiança declara a dimensão da confiança que
temos de que esse intervalo contém o verdadeiro parâmetro da população. O nível de
confiança é representado por (1 − α ).100 % .
Embora qualquer valor correspondente ao nível de confiança possa ser escolhido
para construir um intervalo de confiança, os valores mais comuns são 90%, 95% e 99%. Os
coeficientes de confiança correspondentes são 0,90; 0,95 e 0,99.

8.3 – ESTIMATIVA DE INTERVALO DA MÉDIA ARITMÉTICA DE UMA


POPULAÇÃO: AMOSTRAS GRANDES

Quando o tamanho da amostra for 30 ou mais, iremos utilizar a distribuição


normal para construir um intervalo de confiança para µ . Sabemos, com base no capitulo
σ
7, que o desvio-padrão de x é σ x = . No entanto, caso o desvio-padrão da população,
n
σ , não seja conhecido, então utilizamos o desvio-padrão da amostra, s , substituindo σ .
Conseqüentemente, utilizamos
s
sx =
n
σ
para σ x = . Observe que o valor de s x representa uma estimativa de ponto de σx .
n

Intervalo de Confiança para µ para Grandes Amostras: O intervalo de confiança para


µ(1 − α ). 100 % é
x ± zσx se σ é conhecido
x ± zs x se σ não é conhecido
onde
σ x =σ / n e sx = s / n

O valor de z , aqui utilizado, é lido a partir da tabela da distribuição normal


padronizada para o nível de confiança especificado.

O valor de zσx (ou zs x , quando σ não é conhecido), na fórmula do intervalo de


confiança, é chamado de erro máximo da estimativa e é representado por E .

Definição

Erro Máximo da Estimativa para µ : O erro máximo da estimativa para µ ,


representado por E , corresponde ao valor que é subtraído e adicionado ao valor de x , de
modo a obter um intervalo de confiança para µ . Por conseguinte,

162
E = zσ x ou zs x

Exemplo 8.1
Uma editora acabou de publicar um novo livro didático para faculdade. Antes de a empresa
decidir sobre o preço pelo qual deverá vender esse livro didático, ela deseja conhecer o
preço médio de todos os livros desse tipo no mercado. O departamento de pesquisas da
empresa extraiu uma amostra de 36 livros didáticos similares e coletou informações em
relação a seus preços. Essas informações produziram uma média aritmética de preço de
$70,50 para essa amostra. Sabe-se que o desvio-padrão dos preços de todos esses livros
didáticos é igual a $4,50.
(a) Qual a estimativa de ponto da média aritmética do preço de todos esses livros didáticos
para faculdade? Qual a margem de erro para essa estimativa?

(b) Construa um intervalo de confiança de 90% para a média aritmética do preço de todos
esses livros didáticos para faculdade.

8.4 – ESTIMATIVA DE INTERVALO DA MÉDIA ARITMÉTICA DE UMA


POPULAÇÃO: AMOSTRAS PEQUENAS

Condições nas Quais a Distribuição t É Utilizada para Construir um Intervalo de


Confiança em Torno de µ

A distribuição t é utilizada para construir um intervalo de confiança em torno de µ se

1. A população a partir da qual a amostra é extraída é (aproximadamente) distribuída de


maneira normal

163
2. O tamanho da amostra é pequeno (ou seja, n<30)

3. O desvio-padrão da população, σ , não é conhecido.


8.4.1 – A distribuição t

Definição

A Distribuição t : A distribuição t representa um tipo especifico de distribuição em


formato de sino, com uma menor altura e uma maior dispersão em comparação com a
distribuição normal padronizada. À medida que o tamanho da amostra torna-se maior, a
distribuição t se aproxima da distribuição normal padronizada. A distribuição t possui
somente um único parâmetro, conhecido como graus de liberdade (gl ) . A média
aritmética da distribuição t é igual a 0 (zero) e o desvio-padrão é igual a gl ( gl −2) .

A figura abaixo mostra a distribuição normal padronizada e a distribuição t para 9


graus de liberdade. O desvio-padrão da distribuição normal padronizada é 1,0, e o desvio-
padrão da distribuição t é gl ( gl −2) = 9 /( 9 −2) =1,134 .

Exemplo 8.2
Encontre o valor de t para 16 graus de liberdade e uma área de 0,05 na cauda direita de
uma curva da distribuição t .

Solução:
Na Tabela VIII do Apêndice C, localizamos 16 na coluna de graus de liberdade (com o
título gl ) e 0,05 na linha correspondente a Área na cauda direita sob a curva da
distribuição t no topo da tabela. O valor localizado na interseção entre a linha
correspondente a 16 e a coluna correspondente a 0,05, que corresponde a 1,746, fornece o
valor desejado de t .

164
8.4.2 – Intervalo de Confiança para µ Utilizando a Distribuição t

Quando as três condições a seguir se mantêm verdadeiras, utilizamos a distribuição


t para construir um intervalo de confiança para a média aritmética da população, µ .

1. A população a partir da qual a amostra é extraída é (aproximadamente) distribuída de


maneira normal.

2. O tamanho da amostra é pequeno (ou seja, n<30).

3. O desvio-padrão da população, σ , não é conhecido.


Intervalo de Confiança para µ para Amostras Pequenas: O intervalo de confiança de
(1 − α ). 100 % corresponde a
s
x ±ts x onde s x =
n

O valor de t é obtido a partir da tabela da distribuição t para n −1 graus de


liberdade e para o nível de confiança especificado.

Exemplo 8.3
O Dr. Moore desejava estimar a média aritmética do nível de colesterol para todos os
adultos do sexo masculino que moram em Hartford. Ele extraiu uma amostra de 25 adultos
do sexo masculino de Hartford e descobriu que a média aritmética do nível de colesterol
para esta amostra correspondia a 186, com um desvio-padrão igual a 12. Considere que os
níveis de colesterol para todos os adultos do sexo masculino em Hartford sejam
aproximadamente distribuídos de maneira normal. Construa um intervalo de confiança de
95% para a média aritmética, µ .

165
Exemplo 8.4
Vinte e cinco adultos aleatoriamente selecionados, que compram livros para leitura em
geral, foram questionados em relação à quantia em dinheiro que geralmente gastam em
livros por ano. A amostra produziu uma média aritmética de $1450 e um desvio-padrão de
$300 para essas despesas anuais. Considere que essas despesas, para todos os adultos que
compram livros para leitura em geral, possuam uma distribuição aproximadamente normal.
Determine um intervalo de confiança de 99% para a média aritmética correspondente da
população.

8.5 - ESTIMATIVA DE INTERVALO DA PROPORÇÃO DE UMA POPULAÇÃO:


AMOSTRAS GRANDES

Com base no capitulo 7, sabemos que, para grandes amostras:


^
1. A distribuição de amostragem da proporção da amostra,
p, é (aproximadamente)

normal.
^
2. A média aritmética, µp , da distribuição de amostragem de é igual à proporção da
p
população, p.

3. O desvio-padrão, σ^ da distribuição de amostragem da proporção da amostra,


^
p p, é
pq / n , onde q =1 − p .

166
Estimador do Desvio-Padrão de
^
s ^ , que fornece uma estimativa de
p : O valor de p

ponto de σ ^ , é calculado como


p

^
pq
s^ =
p n
^
A proporção da amostra,
p, representa o estimador de ponto da população

correspondente, p. Da mesma maneira que no caso da média aritmética, sempre que


utilizamos a estimativa de ponto para a proporção da população calculamos a margem de
erro associada àquela estimativa de ponto. Para a estimativa da proporção da população, a
margem de erro é calculada da seguinte maneira:

Margem de erro: ± 1,9 6s ^


p
Ou seja, encontramos o desvio-padrão da proporção da amostra e multiplicamos
esse valor por 1,96. O intervalo de confiança ( (1 − α ).100 % para p é construído utilizando-
se a fórmula a seguir apresentada.

Intervalo de Confiança para a Proporção da População, p: O intervalo de confiança


(1 − α ). 100 % para a proporção da população, p, é
^
p± z s^
p
O valor de z, utilizado neste caso, é obtido a partir da tabela da distribuição normal
^
p q.
padronizada para o nível de confiança especificado e
s^ =
p n

Exemplo 8.5
De acordo com uma pesquisa realizada em 2002 pela Findlaw.com, 20% dos norte-
americanos necessitaram de consultoria jurídica durante o ano anterior, com o objetivo de
solucionar questões espinhosas, como custódias de filhos e litígios entre locador e locatório
(CBS. MarketWatch.com, 6 de agosto de 2002). Suponha que uma amostra recente de 1000

167
adultos norte-americanos tenha mostrado que 20% deles precisaram de consultoria jurídica
durante o ano anterior para resolver essas questões civis.
(a) Qual é a estimativa de ponto da proporção da população? Qual é a margem de erro
dessa estimativa?

(b) Encontre, com um nível de confiança de 99%, a percentagem de todos os adultos norte
americanos que precisaram de consultoria jurídica durante o ano de 2001 para resolver
questões civis.

Exemplo 8.6
De acordo com a análise de uma pesquisa de opinião realizada pelo grupo CNN-USA
TODAY-Gallup, em outubro de 2002, “o estresse tornou-se uma parcela comum da vida
diária nos Estados Unidos. As demandas de trabalho, família e afazeres domésticos
representam um fardo na vida norte-americano típico”. De acordo com essa pesquisa, 40%
dos norte-americanos incluídos na pesquisa indicaram que possuíam uma quantidade de
tempo limitada para relaxar (Gallup.com, 8 de novembro de 2002). A pesquisa foi baseada
em uma amostra de nível nacional de 1502 adultos aleatoriamente selecionados, com idade
de 18 anos ou mais. Construa um intervalo de confiança de 95% para o proporção da
população correspondente.

168
8.6 – DETERMINANDO O TAMANHO DA AMOSTRA PARA A ESTIMATIVA DA
MÉDIA ARITMÉTICA

OBS: Aprendemos que E = zσ x é chamado de erro máximo da estimativa para µ .


σ
Como sabemos, o desvio-padrão da média aritmética da amostra é igual a . Portanto,
n
podemos escrever o erro máximo da estimativa para µ como
σ
E = z.
n

Determinando o Tamanho da Amostra para a Estimativa de µ : Sendo conhecido o


nível de confiança e o desvio-padrão da população, o tamanho da amostra que irá produzir
um erro máximo predeterminado, E , da estimativa do intervalo de confiança de µ , é

z 2σ 2
n=
E2
Exemplo 8.7
Uma associação de ex-alunos deseja estimar a média aritmética das dívidas de alunos
graduados este ano. Sabe-se que o desvio-padrão da população das dívidas dos alunos
graduados este ano corresponde a $11.800. De que tamanho deve ser a amostra selecionada
de maneira tal que a estimativa, com um nível de confiança de 99%, esteja contida no
intervalo de $800 em relação à média aritmética da população.

169
8.7 – DETERMINANDO O TAMANHO DA AMOSTRA PARA A ESTIMATIVA DA
PROPORÇÃO

Determinando o Tamanho da Amostra para a Estimativa de p: Sendo conhecidos o


nível de confiança e os valores de p e q, o tamanho da amostra que irá produzir um erro
máximo predeterminado, E , da estimativa do intervalo de confiança de p é

z 2 pq
n=
E2

Exemplo 8.8
A Lombard Electronics Company acabou de instalar uma nova máquina que fabrica uma
peça que é utilizada em relógios. A empresa deseja estimar a proporção de peças
defeituosas produzidas por essa máquina. O gerente da empresa deseja que essa estimativa
esteja dentro de 0,02 em relação à proporção da população para um nível de confiança de
95%. Qual é a estimativa mais conservadora do tamanho da amostra que irá limitar o erro
máximo em até 0,02 em relação à proporção da população?

Exemplo 8.9
Considere novamente o exemplo 8.8. Suponha que uma amostra preliminar de 200 peças
produzidas por essa máquina tenha mostrado que 7% delas seja defeituosas. Que tamanho
de amostra a empresa deve selecionar de maneira tal que o intervalo de confiança de 95%
para p esteja contido em 0,02 em relação à proporção da população?

170
LISTA DE EXERCÍCIOS
1) O desvio-padrão para uma população é σ =15 ,3 . Uma amostra de 36 observações
selecionadas a partir desta população forneceu uma média aritmética igual a 74,8.
a) Construa um intervalo de confiança de 90% para µ .

b) Construa um intervalo de confiança de 95% para µ .

c) Determine um intervalo de confiança de 99% para µ .

2) De acordo com a revista Money, o patrimônio líquido dos domicílios nos EUA, em
2002, correspondia a $355.000 (Money, outubro de 2002). Suponha que essa média
aritmética seja baseada em uma amostra aleatória de 500 domicílios e que o desvio-padrão

171
da amostra seja de $125.000. Construa um intervalo de confiança de 99% para a média
aritmética do patrimônio líquido dos domicílios nos EUA em 2002.

3) De acordo com a revista CFO, um típico diretor executivo financeiro ganhou, em 2001,
$961.000 (Business Week, 16 de setembro de 2002). Suponha que essa média aritmética
seja baseada em uma amostra aleatória de 60 diretores executivos financeiros e que o
desvio-padrão da amostra seja $180.000.
a) Qual é a estimativa de ponto da média aritmética correspondente da população?

b) Construa um intervalo de confiança de 90% para a média aritmética correspondente da


população.

4) Encontre o valor de t para a distribuição t correspondente a cada um dos seguintes


itens.
a) Área na cauda direita = 0,05 e gl =12

b) Área na cauda esquerda = 0,025 e n = 26

c) Área na cauda esquerda = 0,001 e gl =19

172
5) Suponha, para uma amostra selecionada a partir de uma população normalmente
distribuída; que x =68 ,50 e s =8,9 .
a) Construa um intervalo de confiança de 90% para µ considerando n =16 .

b) Construa um intervalo de confiança de 90% para µ considerando n =16 . A amplitude


do intervalo de confiança de 90% é menor do que a amplitude do intervalo de confiança de
95% calculado no item a?

6) Uma amostra aleatória de 16 passageiros de uma companhia aérea no aeroporto de Bay


City mostrou que a média aritmética do tempo gasto em espera na fila para o check-in no
guichê foi de 31 minutos, com um desvio-padrão de 7 minutos. Construa um intervalo de
confiança de 99% para a média aritmética do tempo gasto esperando em fila por parte de
todos os passageiros naquele aeroporto. Considere que esses tempos de espera para todos os
passageiros sejam normalmente distribuídos.

173
7) Uma empresa deseja estimar a média aritmética do peso líquido de suas caixas do cereal
Top Taste. Uma amostra de 16 dessas caixas produziu uma média aritmética do peso
líquido equivalente a 31,98 onças, com um desvio-padrão de 0,26 onça. Construa um
intervalo de confiança de 95% para a média aritmética do peso líquido de todas as caixas do
cereal Top Taste. Considere que o peso líquido de todas essas caixas de cereais possua uma
distribuição normal.

8) Em uma pesquisa realizada pela At-a-Glance Communications, 611 trabalhadores de


escritório foram questionados em relação ao tempo que levavam para responder a um e-
mail (USA TODAY, 7 de maio de 2002). Trinta e seis por cento deles afirmaram que
respondem a e-mails tão logo retornam para suas mesas. Suponha que esses 611
trabalhadores de escritório perfaçam uma amostra aleatória de todos os trabalhadores de
escritório nos Estados Unidos.
a) Qual é a estimativa de ponto da proporção correspondente da população? Qual é a
margem de erro associada a essa estimativa de ponto?

b) Encontre um intervalo de confiança de 95% para a proporção correspondente da


população.

174
175
9 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA E EM
RELAÇÃO À PROPORÇÃO

9.1 - INTRODUÇÃO

O teste de hipótese é uma técnica para a realização de inferência estatística, isto é, a


partir de dados amostrais pode-se generalizar conclusões sobre a população.
Uma hipótese estatística é uma suposição ou afirmação relativa a uma ou mais
populações.

Exemplo 9.1
A proporção de crianças do sexo masculino nascidos em certa localidade é diferente de 0,5.
O teste de hipótese consiste em verificar se a afirmação é verdadeira ou falsa.

9.1.1– Duas Hipóteses

Hipótese Nula: Uma hipótese nula corresponde a uma afirmação (ou declaração a um
determinado parâmetro da população, que é presumida como verdadeira, até que seja
declarada falsa.

A hipótese alternativa, em nosso exemplo estatístico, será de que a afirmação da


empresa é falsa, e que suas latas de refrigerante contêm em média, menos do que 12 onças
de refrigerante – ou seja, µ <12 onças. A hipótese será escrita como
H 1 : µ < 12 (A afirmação da empresa é falsa)

Hipótese Alternativa: Uma hipótese alternativa é uma afirmação em relação a um


determinado parâmetro da população, que será verdadeira se a hipótese nula for falsa.

9.1.2 – Dois Tipos de Erros

Erro do Tipo I: Um erro do tipo I ocorre quando uma hipótese nula verdadeira é rejeitada.
O valor de α representa a probabilidade de cometer este tipo de erro; ou seja,
α = P (H 0 é rejeitada | H 0 é verdadeira)

O valor de α representa o nível de significância para o teste.


Apesar de qualquer valor pode ser atribuído a α , os valores comumente utilizados
são: 0,01; 0,025; 0,05; e 0,10. Usualmente, o valor atribuído a α não excede 0,10 (ou
10%).

Erro do Tipo II: Um erro do tipo II ocorre quando uma hipótese nula falsa não é rejeitada.
O valor de β representa a probabilidade de cometer um Erro do tipo II; ou seja,
β = P (H 0 não é rejeitada | H 0 falsa)

176
O valor de 1 − β é chamado de eficácia do teste. Ele representa a probabilidade de
que não seja cometido um Erro do tipo II.

Os dois tipos de erro que ocorrem nos testes de hipóteses são dependentes entre si.
Não podemos diminuir o valor de α e o valor de β, simultaneamente, para um teste de
hipótese com um tamanho fixo de amostra.Diminuir o valor de α irá aumentar o valor de
β, enquanto diminuir o valor de β irá aumentar o valor de α .

9.1.3 – Caudas de um Teste

Definição

Caudas do Teste: Um teste bicaudal possui regiões de rejeição em ambas as caudas; um


teste com cauda à esquerda possui a região de rejeição na cauda esquerda; e um teste com
cauda à direita possui a região de rejeição na cauda direita da curva de distribuição.

Um Teste Bicaudal

De acordo com U.S. Bureau of the Census, a média aritmética do tamanho das
famílias nos Estados Unidos correspondia a 3,18 em 1998. Um pesquisador deseja verificar
se esta média aritmética se alterou ou não, desde 1998. A palavra-chave, neste caso, é
alterou. A média aritmética do tamanho da família terá se alterado caso a média aritmética
tenha aumentado ou diminuído ao longo do período desde 1998. Este é um exemplo de
teste bicaudal. Faça com que µ seja a atual média aritmética do tamanho das famílias para
todas as famílias. As duas possíveis decisões são:

1. A média aritmética do tamanho das famílias não se alterou – ou seja, µ =3,18 .

2. A média aritmética do tamanho das famílias se alterou – ou seja, µ ≠3,18 .

Escrevemos a hipótese nula e a hipótese alternativa para este teste como

H 0 : µ = 3,18 (A média aritmética do tamanho das famílias não se alterou)


H 1 : µ ≠ 3,18 (A média aritmética do tamanho das famílias se alterou)

Um teste com cauda à Esquerda

177
A hipótese nula e a hipótese alternativa para este teste podem ser escritos como

H 0 : µ = 12 onças (A média aritmética não é menor que 12 onças)


H 1 : µ < 12 onças (A média aritmética é menor que 12 onças)

Considerando H 0 como verdadeira, x possui uma distribuição normal, para uma


amostra grande, com sua média aritmética igual a 12 onças (o valor de µ em H 0 ).
Rejeitaremos H 0 se o valor de x , obtido a partir da amostra, se posicionar na região de
rejeição; não rejeitaremos H 0 caso ocorra o contrário.

Um Teste com Cauda à Direita

Escrevemos a hipótese nula e a hipótese alternativa para este teste como


H 0 : µ = $25 .735 (A média aritmética dos salários iniciais atuais não é maior que
$25.735)
H 1 : µ > $25 .735 (A média aritmética dos salários iniciais atuais é maior que $25.735)

Novamente, supondo que H 0 seja verdadeira, x possui uma distribuição normal,


para uma amostra grande, com sua média aritmética correspondente a $25.735 (o valor de
µ em H 0 ). Rejeitaremos H 0 se o valor de x , obtido a partir da amostra, se posicionar
na região de rejeição. De outra maneira, não rejeitaremos H 0 .
A Tabela 9.1 resume a discussão anterior sobre a relação entre os sinais em H 0 e
H 1 e as caudas de um teste.

178
9.2 – TESTES DE HIPÓTESES EM RELAÇÃO A µ PARA AMOSTRAS
GRANDES UTILIZANDO A ABORDAGEM DO VALOR-P

Definição:

Valor-p: O valor-p é o menor nível de significância no qual a hipótese nula é rejeitada.

Utilizando a abordagem do valor-p, rejeitamos a hipótese nula se

valor-p < α ou α> valor-p

e não rejeitamos a hipótese nula se

valor-p ≥ α ou α ≤ valor-p

Para um teste bicaudal, o valor-p é fornecido com base na área na cauda da curva da
distribuição de amostragem, que se posiciona além do valor observado para a estatística da
amostra. A Figura 9.5 mostra o valor-p para um teste com cauda à direita em relação a µ.

Para um teste bicaudal, o valor-p é duas vezes a área na cauda da curva da


distribuição de amostragem que se posiciona além do valor observado da estatística da
amostra. A figura 9.6 mostra o valor-p para um teste bicaudal. Cada uma das áreas nas duas
caudas fornece metade do valor-p.

179
Calculando o Valor de z para x : Para uma amostra grande, o valor de z para x , para
um teste de hipótese em relação a µ , é calculado como segue:

x −µ
z=
σx se σ é conhecido

x −µ
z=
sx
se σ é não é conhecido

onde
σ s
σx = e sx =
n n

O valor calculado de z para x , utilizando a fórmula, é também chamado de valor


observado de z.

Em seguida, encontramos a área sob a cauda da curva da distribuição normal, que se


posiciona além deste valor de z . Esta área fornece o valor-p, ou metade do valor-p,
dependendo do fato de tratar-se de um teste unicaudal ou de um teste bicaudal.
Um procedimento de teste de hipóteses que utiliza a abordagem do valor-p envolve
as quatro etapas a seguir.

Etapas para Realizar um Teste de hipóteses Utilizando à Abordagem do Valor-p

1. Declare a hipótese nula e a hipótese alternativa


2. Selecione a distribuição que será utilizada
3. Calcule o valor-p
4. Tome uma decisão

Exemplo 9.2
Na Cânon Food Corporation, foram necessários, em média, 50 minutos para os novos
trabalhadores aprendessem uma tarefa correspondente ao processamento de alimentos.
Recentemente, a empresa instalou uma nova máquina de processamento de alimentos. O
supervisor da empresa deseja saber se a média aritmética do tempo gasto pelos novos

180
trabalhadores, para aprender o procedimento de processamento de alimentos nesta nova
máquina, é diferente de 50 minutos. Uma amostra de 40 trabalhadores mostrou que levava,
em média, 47 minutos para que eles aprendessem o procedimento de processamento dos
alimentos nesta nova máquina, com um desvio-padrão correspondente a 7 minutos.
Encontre o valor-p correspondente ao teste de que a média aritmética do tempo de
aprendizado para o procedimento de processamento de alimentos na nova máquina seja
diferente de 50 minutos. Qual seria sua conclusão, se α = 0,01 .

Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar.

Etapa 3. Calcule o valor-p.

9.3 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA DA


POPULAÇÃO: AMOSTRAS GRANDES

Estatística do Teste: Nos testes de hipóteses em relação a µ , para amostras grandes, a


variável aleatória

181
x −µ x −µ
z= ou z=
σx sx

onde

σ s
σx = e sx =
n n

é chamada de estatística do teste. A estatística do teste pode ser definida como uma regra
ou critério, que é utilizado para tomar a decisão, seja para rejeitar, seja para não rejeitar a
hipótese nula.

Um procedimento de teste de hipóteses que utiliza um nível de significância


predeterminado envolve as cinco etapas a seguir apresentadas.]

Etapas para Desenvolver um Teste de Hipóteses com α Predeterminado


1. Declare a hipótese nula e a hipótese alternativa.
2. Selecione a distribuição a utilizar.
3. Determinar a região de rejeição e a região de não-rejeição.
4. Calcule o valor da estatística do teste.
5. Tome uma decisão.

Exemplo 9.3
A Companhia Telefônica TIV fornece serviços de telefonia de longa distância em uma
determinada área. De acordo com os registros da empresa, a média da duração de todas as
chamadas de longa distância feitas por intermédio da empresa em 1999 foi de 12,44
minutos. A gerência da empresa deseja verificar se a média aritmética da duração das
chamadas atuais de longa distância é diferente de 12,44 minutos. Uma amostra de 150
dessas chamadas, realizadas por meio desta empresa, produziu uma média aritmética da
duração equivalente a 13,71 minutos, com um desvio-padrão correspondente a 2,65
minutos. Utilizando o nível de significância de 5%, você pode concluir que a média
aritmética da duração de todas as chamadas atuais de longa distância é diferente de 12,44
minutos?
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

182
Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

Exemplo 9.4
De acordo com uma pesquisa salarial da National Association of Colleges and Employers
(Associação Nacional de Faculdades e Empregadores), o salário médio oferecido aos
formados em ciências da computação que obtiveram a graduação em maio de 2002, era
igual a $50.352 (Journal of Accountancy, setembro de 2002). Suponha que este resultado
seja verdadeiro para todos os formados em ciências da computação que tenham se graduado
em maio de 2002. Uma amostra aleatória de 200 formandos em ciências da computação,

183
que se graduaram neste ano, mostrou que a eles era oferecida uma média aritmética de
salário correspondente a $51.750, com um desvio-padrão igual a $5240. Utilizando o nível
de significância de 1%, você pode concluir que a média aritmética dos salários dos
graduados este ano em ciências da computação seja maior do que $50.352?
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

184
Exemplo 9.5
O prefeito de uma grande cidade afirma que a média do patrimônio liquido das famílias que
vivem naquela cidade é de, pelo menos, $300.000. Uma amostra aleatória de 100 famílias,
selecionadas a partir daquela cidade, produziu uma média aritmética do patrimônio líquido
correspondente a $288.000, com um desvio-padrão equivalente a $80.000. Utilizando o
nível de significância de 2,5%, você pode concluir que a afirmação do prefeito é falsa?
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

185
Etapa 5. Tome uma decisão.

9.4 – TESTES DE HIPÓTESES EM RELAÇÃO À MÉDIA ARITMÉTICA DE UMA


POPULAÇÃO: AMOSTRAS PEQUENAS

Condições nas Quais a Distribuição t é Utilizada para Realizar Testes de Hipóteses


em Relação a µ : A distribuição t é utilizada para conduzir um teste de hipóteses em
relação a µ se
1. O tamanho da amostra for pequeno ( n < 30 )
2. A população a partir da qual a amostra é extraída dor distribuída de maneira
(aproximadamente) normal.
3. O desvio-padrão da população, σ , for desconhecido.

O procedimento que é utilizado para realizar testes de hipóteses em relação a µ , no


caso de amostras pequenas, é similar ao teste de hipóteses para amostras grandes.
Realizamos as mesmas cinco etapas, e a única diferença corresponde a utilizar a
distribuição t em lugar da distribuição normal.

Estatística do teste: O valor da estatística do teste t para a média aritmética da amostra,


x , é calculado como

186
x−µ s
t= onde s x =
sx n
O valor de t , calculado para x utilizando esta fórmula, é também chamado de valor
observado de t .

Exemplo 9.6
Um psicólogo afirma que a média aritmética da idade na qual as crianças começam a andar
corresponde a 12,5 meses. Carol desejava verificar se essa afirmação é verdadeira. Ela
extraiu uma amostra aleatória de 18 crianças e descobriu que a média aritmética da idade na
qual essas crianças começam a andar era de 12,9 meses, com um desvio-padrão
correspondente a 0,80 mês. Utilizando o nível de significância de 1%, você pode concluir
que a média aritmética da idade na qual todas as crianças iniciam a andar seja diferente de
12,5 meses? Considere que as idades nas quais todas as crianças começam a andar tenham
uma distribuição aproximadamente normal.
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

187
Etapa 5. Tome uma decisão.

Exemplo 9.7
A Grand Auto Corporation produz baterias automotivas. A empresa afirma que as suas
baterias de primeira linha, Never Die, são boas, em média, no mínimo até 65 meses. Uma
agência de proteção ao consumidor testou 15 de tais baterias no sentido de verificar esta
afirmação. A agência descobriu que a média aritmética da vida útil dessas 15 baterias era de
63 meses, com um desvio-padrão de 2 meses. No nível de significância de 5%, você pode
concluir que a afirmação da empresa é verdadeira? Considere que a vida útil da tais baterias
tenha uma distribuição aproximadamente normal.
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

188
Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

9.5 - TESTES DE HIPÓTESES EM RELAÇÃO À PROPORÇÃO DE UMA


POPULAÇÃO: AMOSTRAS GRANDES

^
Estatística do Teste: O valor da estatística do teste z para a proporção da amostra,
p,é
calculada como

189
^
p− p pq
z= onde σ =
σ^
^
p n
p
O valor de p utilizado nesta fórmula é aquele utilizado na hipótese nula, o valor de q é igual
a 1−p .
^
O valor de z, calculado para
p utilizando a fórmula anterior, também é chamado de

valor observado de z.
Exemplo 9.8
Em uma pesquisa realizada pelo National Center for Womem and Aging (Centro Nacional
para Mulheres e a Idade) na Universidade Brandeis, 51% das mulheres acima de 50 anos
afirmaram que o envelhecimento não é tão ruim quanto elas haviam esperado (USA
TODAY, 19 de novembro de 2002). Suponha que esse resultado mantenha-se verdadeiro
em relação à população de 2002 para todas as mulheres com idade de 50 anos ou mais. Em
uma amostra aleatória de 400 mulheres, com idade de 50 anos ou mais, 54% disseram que o
envelhecimento não é tão ruim quanto elas tinham esperado. Utilizando o nível de
significância de 1%, você pode concluir que a percentagem atual das mulheres com idade
de 50 anos ou mais acreditam que o envelhecimento não é tão ruim quanto elas tinham
esperado seja diferente da percentagem correspondente a 2002?
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

Etapa 4. Calcule o valor da estatística do teste.

190
Etapa 5. Tome uma decisão.

Exemplo 9.9
Quando está operando apropriadamente, uma máquina utilizada para fazer chips para
calculadoras não produz mais do que 4% de chips defeituosos. Sempre que a máquina
produz mais de 4% de chips defeituosos, ela necessita de um ajuste. Para verificar se a
máquina está operando apropriadamente, o departamento de controle de qualidade da
empresa freqüentemente extrai amostras de chips e os inspeciona para determinar se eles
estão perfeitos, ou se estão defeituosos. Uma dessas amostras aleatórias de 200 chips,
recentemente extraída da linha de produção, continha 14 chips defeituosos. Teste, no nível
de significância de 5%, se a máquina precisa, ou não, de ajuste.
Solução:
Etapa 1. Declare a hipótese nula e a hipótese alternativa.

Etapa 2. Selecione a distribuição a utilizar

Etapa 3. Determine a região de rejeição e a região de não-rejeição.

191
Etapa 4. Calcule o valor da estatística do teste.

Etapa 5. Tome uma decisão.

Exercícios:
1) De acordo com a U.S. Bureau of Labor Statistics, existiam 8,1 milhões de pessoas
desempregadas, com 16 anos de idade ou mais, em agosto de 2002. A duração média do

192
desemprego para estas pessoas era de 16,3 semanas (Bureau of Labor Statistics News, 6 de
setembro de 2002). Suponha que uma recente amostra aleatória, de 400 desempregados
norte-americanos, com idade de 16 anos ou mais, tenha fornecido uma média aritmética da
duração do desemprego igual a 16,9 semanas, com um desvio-padrão de 4,2 semanas.
Encontre o valor-p para o teste de hipóteses, com a hipótese alternativa de que a média
aritmética atual da duração do desemprego, para todos os desempregados norte-americanos,
com 16 ou mais, exceda 16,3 semanas. Você irá rejeitar a hipótese nula com α = 0,02 ?

2) Um estudo afirma que todos os adultos gastam, em média, 14 horas ou mais, em


trabalhos domésticos, durante um final de semana. Um pesquisador deseja verificar se esta
afirmação é verdadeira. Uma amostra aleatória de 200 adultos, extraída por este
pesquisador, mostrou que estes adultos gastam, em média, 13,75 horas em trabalhos
domésticos, durante um fim de semana, com um desvio-padrão igual a 3,0 horas. Encontre
o valor-p para o teste de hipóteses com a hipótese alternativa de que todos os adultos
gastam menos do que 14 horas em trabalhos domésticos durante um fim de semana. Você
irá rejeitar a hipótese nula com α = 0,05 ?

3) Realize os seguintes testes de hipóteses:



a) H 0 : µ = 80 , H 1 : µ ≠ 80 , n = 33 , x = 76 ,5 , ∂ =15 , α = 0,10 .

193

b) H 0 : µ = 32 , H 1 : µ < 32 , n = 75 , x = 26 ,5 , s = 7,4 , α = 0,01 .


a) H 0 : µ = 55 , H 1 : µ > 55 , n = 40 , x = 60 ,5 , s = 4 , α = 0,05 .

4) Uma empresa franqueadora de restaurantes possui uma política de abrir novos


restaurantes somente naquelas áreas que tiverem uma média aritmética de renda domiciliar
correspondente a pelo menos $35.000 por ano. A empresa atualmente está avaliando uma
área para abrir um novo restaurante. O departamento de pesquisas da empresa extraiu uma
amostra de 150 domicílios, a partir da daquela área, e descobriu que a média aritmética da
renda desses domicílios é igual a $33.400 por ano, com um desvio-padrão de $5400.
a) Utilizando o nível de significância de 1%, você concluiria que a empresa não deveria
abrir um restaurante nessa área?

194
b) Qual seria sua decisão no item a se a probabilidade de cometer um Erro do Tipo I fosse
zero? Explique.

5) Um estudo afirma que todos os moradores em casas gastam, em média, 8 horas ou mais
em limpeza da casa e jardinagem durante um final de semana. Um pesquisador desejava
verificar se esta afirmação era verdadeira. Uma amostra aleatória de 200 moradores de
casas, extraída por este pesquisador, mostrou que eles gastam, em média, 7,68 horas em tais
atividades, durante um final de semana, com um desvio-padrão de 2,1 horas.
a) Utilizando o nível de significância de 1%, você pode concluir que seja falsa a afirmação
de que todos os moradores em casas gastam, em média, 8 horas ou mais em tais atividades
durante um fim de semana?

b) Faça o teste do item a utilizando o nível de significância de 2,5%. A sua decisão é


diferente daquela do item a? Comente sobre os resultados dos itens a e b?

6) Um reitor de uma universidade afirma que a média aritmética do tempo gasto em festas
por todos os alunos naquela universidade não é maior do que 7 horas por semana. Uma
amostra aleatória de 20 alunos, extraída a partir daquela universidade, mostrou que os
alunos gastaram, em média, 10,50 horas participando de festas na semana anterior, com um
desvio-padrão de 2,3 horas. Considerando que o tempo gasto participando de festas por
todos os alunos naquela universidade, seja distribuído de maneira aproximadamente
normal, teste, no nível de significância de 2,5%, se a afirmação do reitor é, ou não,
verdadeira. Explique, com suas palavras, a sua conclusão.

195
7) Um fabricante de refrigerantes afirma que suas latas de 12 onças (aproximadamente 355
ml) não contêm, em média, mais do que 30 calorias. Uma amostra aleatória de 16 latas
deste refrigerante, que foram analisadas em relação a calorias, continha uma média
aritmética correspondente a 32 calorias, com um desvio-padrão equivalente a 3 calorias.
Suponha que o número de calorias, em latas de refrigerante de 12 onças, seja normalmente
distribuído. As afirmações da amostra apóiam a hipótese alternativa de que a afirmação do
fabrificante é falsa? Utilize um nível de significância de 5%. Explique, com suas palavras, a
sua conclusão.

8) Considere H o : µ = 80 versus H 1 : µ ≠ 80 para uma população que seja normalmente


distribuída.
a) Uma amostra aleatória de 25 observações extraídas a partir desta população produziu
uma média aritmética da amostra igual a 77 e um desvio-padrão igual a 8. Utilizando
α = 0,01 , você rejeitaria a hipótese nula?

b) Uma amostra aleatória de 25 observações extraídas a partir desta população produziu


uma média aritmética da amostra igual a 86 e um desvio-padrão igual a 6. Utilizando
α = 0,01 , você rejeitaria a hipótese nula?

196
9) Considere H 0 : p = 0,45 versus H 1 : p < 0,45 .
a) Uma amostra aleatória de 400 observações produziu uma proporção da amostra igual a
0,42. Utilizando α = 0,025 , você rejeitaria a hipótese nula?

b) Outra amostra aleatória de 400 observações, extraída a partir da mesma população,


produziu uma proporção da amostra igual a 0,39. Utilizando α = 0,025 , você rejeitaria a
hipótese nula?

10) De acordo com o sétimo relatório anual da Employment Policy Foundation (Fundação
para Políticas de Emprego), institulado Challenges Facing the American Workplace
( Desafios que Enfrentam os Ambientes de Trabalho Norte-Americanos), as mulheres
ocupavam 49% das funções de gerência e das funções burocráticas em 2000 (The Hartford
Courant, 2 de setembro de 2002). Suponha que uma amostra aleatória recente de 200 de
tais funções tenha descoberto que 52% delas eram ocupadas por mulheres. Você pode
concluir que a percentagem de tais funções que sejam ocupadas por mulheres, atualmente,
exceda 49%? Utilize α = 0,025 .

197
11) Uma empresa de reembolso postal afirma que pelo menos 60% de todos os pedidos são
postados dentro de 48 horas. De tempos em tempos, o departamento de controle de
qualidade da empresa verifica se essa promessa é totalmente cumprida. Recentemente, o
departamento de controle de qualidade dessa empresa extraiu uma amostra de 400 pedidos
e descobriu que 208 deles foram postados dentro do período de 48 horas após a colocação
dos pedidos.
a) Testando no nível de significância de 1%, você pode concluir que a afirmação da
empresa é verdadeira?

b) Qual seria sua decisão no item a se a probabilidade de cometer um Erro do tipo I fosse
zero? Explique.

10- Análise de Regressão

198
199
REFERÊNCIAS BIBLIOGRÁFICAS:

BARBETTA, Pedro A. et alli. Estatística para cursos de Engenharia e Informática. São


Paulo. Atlas, 2008.

200
CRESPO, Antônio A. Estatística fácil. São Paulo: Saraiva, 2002.
MANN, Prem S. Introdução à Estatística. Tradução Eduardo Bendito Curtolo, Tereza C.
P. de Souza. Rio de Janeiro: LTC, 2006.
FONSECA, Jairo Simon & MARTINS, Gilberto de Andrade. Curso de Estatística. São
Paulo: Atlas, 1988, 3ª.ed.
GONÇALVES, C. F. F. Estatística. Londrina: Ed. UEL, 2002.
MEYER, P. L. Probabilidade, Aplicações à Estatística. Rio de Janeiro: Ao Livro Técnico
S. A., 1983.
MOORE, D. A estatística básica e sua pratica. Rio de Janeiro: LTC Editora, 2005. 482 p.
MORETTIN, P. A. Introdução à estatística para as ciências exatas. São Paulo. Atual
Editora, 1981. 211 p.
SPIEGEL, Murray R. Estatística. São Paulo: McGraw-Hill, 1993, 3ª.ed.

201