Sei sulla pagina 1di 109

PROBABILIDADE E ESTATÍSTICA

1- Introdução

Encontramos na literatura diversas definições para ESTATÍSTICA. Podemos simplificar


dizendo que Estatística é “Ciência que dispõe de processos apropriados para
recolher, organizar, apresentar, classificar e interpretar conjuntos de dados".

Dados são valores recolhidos da variável em estudo. Na Figura 1.1 mostramos como o
estudo da estatística é normalmente realizado.

Figura 1.1 – Organização do estudo da estatística.

A definição pode parecer complexa, mas a humanidade já aplicava os rudimentos da


estatística desde a antiguidade. Vários povos já registavam o número de habitantes, de
nascimentos, de óbitos; faziam estimativas das riquezas individuais e social; distribuíam
terras ao povo; cobravam impostos e realizavam inquéritos quantitativos por processos
que, hoje, chamamos de “Estatística.

Na época do imperador Otávio Augusto, que governou Roma por 41 anos, já se fazia
gestão pública e se tomava decisões por meio de indicadores. Roma chegou a abrigar 1
milhão de pessoas no início da era Cristã. E a diversão com jogos de azar também vem
de longa data.

A estatística se consolidou como ciência a partir do século XVII com Bernoulli, Pascal
(Figura 1.2), Gauss, Galton, Gosset entre outros grandes nomes.
Figura 1.2– Ilustração do matemático Blaise Pascal

Todos os dias tomamos diversas decisões. E fazemos isso sem perceber, na maioria das
vezes de forma intuitiva. Mas podemos se desejamos intervir na realidade de forma não
acidental, precisamos conhecê-la. Se não podemos avaliar um fenómeno com precisão
não podemos tomar as decisões mais acertadas.

Para ilustrar a importância da estatística na engenharia vamos imaginar um exemplo


simples. Vamos construir a estrutura de 200 torres de telecomunicações. Cada uma delas
é composta por 50 barras de perfil em “I”. Qual deve ser a tensão de projecto nesse caso
se sabemos que nem todas as barras da treliça têm a mesma resistência? Um procedimento
normalmente realizado é a medição da resistência de 5 peças escolhidas aleatoriamente.
Os resultados obtidos poderiam ser descritos como segue para a tensão máxima
admissível: 2050N, 2020N, 1920N, 2220N e 1800N. Nesse caso, a amostra é adequada?
Qual deveria ser a amostra mínima para se fazer uma afirmação da resistência à tracção
com intervalo de confiança de 95%?

Como exemplo na área da educação sabemos que temos dificuldades em combater a


evasão escolar. Se alguém fosse nomeado(a) Ministro(a) da Educação o que faria
inicialmente? Sabemos que a resposta depende do estilo de cada gestor. Mas é possível
que o primeiro passo a ser feito seja um bom diagnóstico da situação presente (avaliação
diagnóstica). Temos que conhecer quais são os índices de evasão escolar nessa região ou
país.
As correlações são importantes para a tomada de decisões. Na Figura 1.3 mostramos uma
correlação entre consumo de energia per capita e IDH.
Figura 1.3 – Correlação entre consumo de energia per capita em TEP/ano versus
IDH

Existe relação entre democracia e desenvolvimento? E entre educação e riqueza das


nações? Quantos bilhões de pessoas seremos em 2040? A segurança social em S. Tomé
e Príncipe será capaz de garantir pensões dignas dentro de 20 anos? Uma nova vacina é
capaz de conter uma epidemia? O nível de consumo das classes D e E terá crescimento
na próxima década? A realidade é complexa e exige aplicação de técnicas da estatística
para intervenção.

Podemos continuar esta lista de situações. Mas vamos suspendê-la para tratarmos de
outros assuntos relacionados.

2- Estatística Descritiva

A estatística descritiva utiliza um conjunto de técnicas tais como: medidas de posição e


dispersão, tabelas e gráficos para resumir as características dos dados.

Para simplificar o que chamamos de estatística descritiva vamos fazer a análise da altura
dos estudantes de uma turma. A altura dos 40 alunos foi medida e os resultados são
apresentados na forma de uma tabela de frequências e de um histograma, conforme
visualizamos na Figura 2.1.
Figura 2.1- Histograma das alturas dos alunos de uma turma.

Na Figura observamos que existem intervalos da variável altura. Na tabela de dados bruta
deve se avaliar qual o valor menor (limite inferior) e o valor maior (limite superior). A
diferença chama-se amplitude da classe. Com esse valor e com o número de dados
podemos estabelecer o número de classes. No exemplo acima são 6 intervalos de classe.
O número de classes deve ser fixado de forma que as classes consigam representar
adequadamente a amostra de dados em estudo. O número (𝑘) pode ser calculado da
seguinte forma (deve-se arredondar o valor final):

𝑘 = 1 + 3,322 × 𝑙𝑜𝑔(𝑛) = 1 + 3,322 × 𝑙𝑜𝑔(40) = 6,3

Considere ainda o exemplo: A vida útil dos pneus dos carros. Os dados são descritos e
organizados por meio do diagrama de caule e folhas, da tabela de frequências e do
histograma.
Analisando-se a tabela 2.1 a seguir não é tão fácil tirar conclusões sobre como se
comportam as viscosidades para as três misturas analisadas. Por isso é muito comum o
uso de diagramas de caixa, também chamados de box plot ou caixa de bigodes. Nesses
diagramas os dados são divididos em duas partes (50% para cada lado), tendo o valor
central chamado de mediana. Cada parte também é dividida em 2 (25% = 𝑞𝑢𝑎𝑟𝑡𝑖𝑙).

Tabela 2.1- Medidas de viscosidade:


Figura 2.4- Representação de um diagrama de caixa.

A seguir temos um exemplo de correlação estatística relacionando tempo de estudo de


matemática com notas obtidas na estatística.
Figura 2.5- Representação de uma correlação linear.

Da mesma forma podemos observar como se relacionam a potência do motor (HP) e o


tempo para se acelerar um carro. O que podemos inferir a partir do gráfico?
Figura 2.6- Representação de uma correlação negativa.

Poderíamos afirmar que há correlação estatística entre o peso (N) e a altura dos estudantes
de uma turma? E entre horas de estudo e resultados nas provas? Ou entre temperatura no
verão e venda de cervejas? Ou entre tempo de exposição de uma marca e resultado nas
vendas? Ou entre anos de escolaridade e salários? A partir dessas reflexões podemos
compreender a importância de correlacionarmos variáveis como forma de entender os
fenómenos que nos rodeiam. Na Figura a seguir apresentamos os quatro tipos mais
comuns de diagramas de dispersão. Observamos que a correlação é mais forte quando o
valor de “𝑟” é mais próximo da unidade.
Figura 2.7 Diagramas de dispersão mais comuns.

Conforme pode ser observado é fundamental o uso de gráficos para facilitar a


compreensão de análises estatísticas. O gráfico é uma forma de apresentação dos dados
estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma
impressão mais rápida e viva do fenómeno em estudo, já que os gráficos falam mais
rápido à compreensão que as séries. Em estatística são usados vários tipos de gráficos tais
como gráfico de linha, de barras, de sectores, polar, pictograma, caule e folhas, de pontos,
de Pareto, de dispersão, de caixa, histograma, polígono de frequência, ogiva de Galton.
Existem algumas definições básicas na Estatística descritiva, que mostraremos a seguir:

Média Aritmética é a mais usada dentre todas as médias, face à sua aplicabilidade a
situações práticas. Podemos calcular a média aritmética de várias maneiras, dependendo
apenas da forma em que os dados se encontram:

𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
Quando os dados estão agrupados em intervalos de classe, convenciona-se que todos
os valores incluídos num determinado intervalo de classe coincidem com o seu ponto
médio, e determina-se a média aritmética ponderada pela fórmula:

𝑛 𝑛
1
𝑥̅ = ∑ 𝑥𝑖 𝐹𝑖 𝑜𝑢 𝑥̅ = ∑ 𝑥𝑖 𝑓𝑖
𝑛
𝑖=1 𝑖=1

onde: 𝑥𝑖 é o ponto médio de cada classe 𝑖, 𝐹𝑖 é a frequência absoluta e 𝑓𝑖 a frequência


relativa.

Moda – é o valor da amostra que mais aparece (de maior frequência). Uma amostra pode
ser: amodal, unimodal, bimodal, trimodal ou multimodal. Da mesma forma que a média,
podemos calcular a moda de várias maneiras, dependendo apenas da forma em que os
dados se encontram:

Mediana – A mediana de uma amostra é aquele valor que ocupa a posição central do rol,
isto é, a mediana é o valor que divide a amostra em duas partes iguais. A mediana pode
não pertencer a amostra.

Quartis (Qi) – são os valores da série que dividem a amostra em quatro partes iguais.

Variância - baseia-se nos desvios em torno da média, porém determinando a média


aritmética dos quadrados dos desvios. Para uma população fazemos:

𝑛 𝑛
1 1
𝜎 2 = ∑(𝑥𝑖 − 𝑥̅ )2 𝑜𝑢 𝜎 2 = ∑(𝑥𝑖 − 𝑥̅ )2 𝐹𝑖
𝑛 𝑛
𝑖=1 𝑖=1

Quando o interesse não se restringe à descrição dos dados partindo da população, mas da
amostra, visando tirar inferências válidas para a respectiva população, usaremos:

𝑛 𝑛
1 1
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 𝑜𝑢 𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 𝐹𝑖
𝑛−1 𝑛−1
𝑖=1 𝑖=1
Quando as informações são apresentadas por meio de tabela de frequências fazemos o
cálculo do desvio padrão e da média conforme ilustramos a seguir:
Faixa de alturas dos estudantes Quantidade de alunos em
cada faixa de altura
160-165 4
165-170 8
170-175 20
175-180 8
180-185 4

A quantidade de alunos na turma é 𝑛 = 44.

Para calcularmos a média de alturas da turma e o desvio padrão fazemos inicialmente o


(160 + 165)
cálculo do ponto médio de cada faixa de altura. Na primeira faixa fazemos: 2

𝑥𝑖 Ponto 𝐹𝑖 Freq.
médio absoluta 𝑥𝑖 𝐹𝑖 𝑥𝑖2 𝑥𝑖2 𝐹𝑖

162,5 4 650 26406,25 105625


167,5 8 1340 28056,25 224450
172,5 20 3450 29756,25 595125
177,5 8 1420 31506,25 252050
182,5 4 730 33306,25 133225
Total (Soma) 7590 1310475

A média é calculada pela equação:

𝑛 5
1 1 7590
𝑥̅ = ∑ 𝑥𝑖 𝐹𝑖 = ∑ 𝑥𝑖 𝐹𝑖 = = 172,5
𝑛 44 44
𝑖=1 𝑖=1

Os cálculos da variância e do desvio padrão são realizados da seguinte forma:


𝑛 𝑛 𝑛 2
1 𝑛
𝑠2 = ∑(𝑥𝑖 − 𝑥̅ )2 𝐹𝑖 = [∑ 𝑥𝑖2 𝐹𝑖 − (∑ 𝑥𝑖 𝐹𝑖 ) ]
𝑛−1 𝑛(𝑛 − 1)
𝑖=1 𝑖=1 𝑖=1

44 52800
= (1310475 − (7590)2 ) = = 27,9
44(44 − 1) 1892

𝑠 = √𝑠 2 = √27,9 = 5,28

3- Princípios da teoria de probabilidades

Diversos autores apontam que o cálculo das Probabilidades teve início na Idade Média,
com as primeiras tentativas de análise matemática das chances de se vencer nos jogos de
azar, muito difundidos na época. Os jogos também eram utilizados para se prever o futuro,
decidir conflitos e dividir heranças.
Devem-se aos algebristas italianos Pacioli, Cardano e Tartaglia (séc. XVI) as
primeiras considerações matemáticas acerca dos jogos e das apostas.
No entanto, a contribuição decisiva para o início da Teoria das Probabilidades foi dada
pela correspondência trocada entre os matemáticos franceses Blaise Pascal e seu amigo
Pierre de Fermat, em que ambos, por diferentes caminhos, chegam à solução correta do
célebre problema da divisão das apostas em 1654, quando jogo é interrompido antes do
final.

Há alguns conceitos fundamentais na estatística que são: espaço amostral e eventos: Ao


conjunto de todos os resultados possíveis numa experiência aleatória chamamos de
Espaço Amostral, que indicaremos como “S”. Por exemplo, o espaço amostral dos naipes
de um baralho pode ser escrito como: 𝑆1 = {𝑜𝑢𝑟𝑜, 𝑐𝑜𝑝𝑎𝑠, 𝑝𝑎𝑢𝑠, 𝑒𝑠𝑝𝑎𝑑𝑎𝑠}. O espaço
amostral das possíveis faces de um dado pode ser escrito como: 𝑆2 = {1, 2, 3, 4, 5, 6} }.
Podemos ter também espaços amostrais infinitos tais como a contagem de carros que
passa numa determinada ponte: 𝑆3 = {0,1,2,3,4, . . . , 𝑛}.

Um evento é qualquer conjunto de resultados de uma experiência, que pertence ao espaço


amostral 𝑆 . Ao lançarmos um dado temos o espaço amostral 𝑆1 = {1, 2, 3, 4, 5, 6} e
podemos desejar calcular a probabilidade de que saia uma face “par”. Nesse caso,
podemos chamar de evento 𝐴 = 𝑠𝑎𝑖𝑟 𝑢𝑚 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑎𝑟 𝑒 𝑒𝑠𝑐𝑟𝑒𝑣𝑒𝑟: 𝐴 = {2, 4, 6}

Laplace definiu a Probabilidade de ocorrência de um evento “A” como sendo:

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟á𝑣𝑒𝑖𝑠


𝑃(𝐴) =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠

No exemplo acima, a probabilidade de sair um número par em um dado honesto


(equilibrado) é de 3/6, pois há três possibilidades de ocorrência de uma face par num total
de 6.

Para análise de eventos probabilísticos é muito comum o uso de diagramas de Veen.

Figura 3.1- Diagrama de VEEN.

Há diversos teoremas e axiomas da probabilidade. As regras mais importantes são:


Regra Geral da Multiplicação:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵\𝐴) 𝑠𝑒 𝑃(𝐴) ≠ 0


𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵) ∗ 𝑃(𝐴\𝐵) 𝑠𝑒 𝑃(𝐵) ≠ 0

Se 𝐴 e 𝐵 são independentes então: 𝑃(𝐴/𝐵) = 𝑃(𝐴) e por consequência se A for


independente de 𝐵, 𝐵 será independente de 𝐴. Nesse caso: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵).
Se jogarmos dois dados ao mesmo tempo, a probabilidade de sair um número par no
primeiro dado seguido de um número menor que 3 no segundo dado é calculado como
sendo 𝑃(𝐴) × 𝑃(𝐵) = 1/6 . Nesse caso podemos dizer que os eventos 𝐴 e 𝐵 são
independentes.

Se 𝐴 e 𝐵 são dois eventos quaisquer, que podem ser mutuamente exclusivos ou não,
podemos escrever: 𝑃(𝐴 𝑈 𝐵) = 𝑃(𝐵) + 𝑃(𝐵) – 𝑃 (𝐴 ∩ 𝐵).

No caso de 𝐴 e 𝐵 serem eventos mutuamente exclusivos (ou disjuntos) então escrevemos:


𝑃(𝐴 𝑈 𝐵) = 𝑃(𝐵) + 𝑃(𝐵)

Podemos definir ainda Probabilidade condicional como sendo: a probabilidade de ocorrer


um determinado evento, dado que se sabe que ocorreu um outro evento anteriormente.
Nesse caso podemos ler: probabilidade de sair o evento 𝐴, dado que aconteceu 𝐵, que é
calculado por:

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴/𝐵) =
𝑃(𝐵)

Como exemplo, vamos supor que queremos saber a probabilidade de ocorrer uma face 3
num dado honesto se sabemos que ocorreu face ímpar. Nesse caso fazemos 𝑃(𝐴/𝐵) =
(1/6)/(3/6) = 1/3.

Podemos ainda definir o teorema da probabilidade total (Teorema de Bayes), ilustrado na


figura:

𝑃(𝐴𝑖 )𝑃(𝐵|𝐴𝑖 )
𝑃(𝐴𝑖 |𝐵) = 𝑛
∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵|𝐴𝑖 )

4- Distribuição de probabilidades

A distribuição de probabilidades associa uma probabilidade a cada resultado numérico de


uma experiência, ou seja, dá a probabilidade de cada valor de uma variável aleatória.
Quando lançamos duas vezes uma moeda podemos ter nenhuma coroa, uma coroa ou
duas coroas. Nesse caso trata-se de uma variável aleatória discreta (que assumem valores
0,1,2,3. . . 𝑛).

Se chamarmos de 𝑋 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑜𝑟𝑜𝑎𝑠 temos então a seguinte distribuição de


probabilidades: 𝑋 = 0 quando não sair nenhuma coroa, 𝑋 = 1 quando sair apenas 1
coroa e 𝑋 = 2 quando sair duas coroas.

Figura 4.1- Distribuição de probabilidade binomial.

Em Estatística há diversos tipos de distribuição de probabilidades tais como: de Bernoulli


ou binomial, normal, T Student, Poisson, uniforme entre outras.

Distribuição de Bernoulli

Considerando a variável aleatória 𝑋 que representa o número de sucessos em “𝑛” provas


de Bernoulli tem uma distribuição denominada Binomial dada por:

𝑛
𝑃(𝑋 = 𝑥) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0, 1, 2, 3, … , 𝑛
𝑥
onde 𝑝=probabilidade de sucesso e 1 − 𝑝 = 𝑞=probabilidade de insucesso, sendo 𝑝 +
𝑞 = 1. Numa distribuição binomial podemos calcular a média e o desvio padrão.
𝑀é𝑑𝑖𝑎: 𝜇 = 𝑛𝑝 𝐷𝑒𝑠𝑣𝑖𝑜 𝑝𝑎𝑑𝑟ã𝑜: 𝜎 = √𝑛𝑝𝑞

Distribuição de Poisson
Na prática muitas situações nas quais interessa o número de observações de uma variável
num intervalo contínuo (tempo ou espaço) podem ser convenientemente explicadas pela
distribuição de Poisson. Exemplos: número de chamadas telefónicas por minuto, número
de mensagens que chegam a um serviço por segundo, número de acidentes por dia,
número de defeitos por 𝑚2 .

𝑒 −𝜆 . 𝜆𝑥
𝑃(𝑋 = 𝑥) = 𝜆 − 𝑛ú𝑚𝑒𝑟𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎𝑠 𝑛𝑜 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑥!

Ao contrário de uma variável aleatória discreta, uma variável aleatória contínua pode
assumir qualquer valor fraccionário dentro de um intervalo definido de valores. Por isso
não podemos enumerar todos os possíveis valores da variável com os valores de
probabilidade correspondentes. O que fazemos é construir uma FUNÇÃO DENSIDADE
DE PROBABILIDADE. O tempo de vida de um rolamento e a altura dos alunos de uma
escola são variáveis aleatórias contínuas.

A mais importante distribuição de probabilidade contínua é a NORMAL (também


conhecida como curva de Gauss). A curva que representa a distribuição normal de
probabilidade tem uma forma de sino.

Figura 4.2- Ilustração de uma curva NORMAL.

Observamos que os valores da variável aleatória 𝑋 mais próximos da média ocorrem com
maior frequência. Os valores simétricos da variável 𝑋 em relação à média ocorrem com
mesma frequência. A área sobre a curva tem valor unitário 1. Do lado esquerdo da curva
tem-se uma probabilidade e ocorrência de 50%. Para facilitar os cálculos há tabelas para
distribuição normal padrão, que tem 𝑚é𝑑𝑖𝑎 = 0 e 𝑣𝑎𝑟𝑖â𝑛𝑐𝑖𝑎 = 1. Para se transformar
uma curva normal real em uma curva normal padrão faz-se:

Figura 4.3- Transformação em curva normal padronizada (tabelada).

Também podemos a recorrer a softwares e aplicativos tais como Wolfram, Mathlab e “R”
para realizarmos os cálculos necessários.

Quando o número de observações ou tentativas for relativamente grande, a distribuição


de probabilidade normal pode ser utilizada para aproximações das probabilidades
binomiais. Nesse caso fazemos uma correcção de continuidade somando-se ou se
adicionando 0,5.

Uma distribuição comum é a distribuição uniforme, com os parâmetros 𝑎 e 𝑏, que tem a


seguinte função densidade da probabilidade:

Figura 4.4- Distribuição de probabilidade uniforme.


5- Teorema Central do Limite e Inferência estatística

Uma das definições mais importantes na área de estatística é o Teorema Central do


Limite, porque permite que façamos inferência a uma população a partir de amostras
selecionadas aleatoriamente. Pelo Teorema, não importa qual é a distribuição de 𝑋, a
distribuição de sua média se aproxima da normal a medida que o número de elementos
das amostras cresce.

A inferência estatística tem por objectivo generalizar conclusões obtidas de uma amostra
para toda uma população. Um exemplo são as pesquisas eleitorais realizadas com uma
pequena amostra dos eleitores.

Figura 5.1- Ilustração de uma inferência estatística.

Dada uma população com desvio padrão 𝜎 , a forma geral do INTERVALO DE


CONFIANÇA para o valor médio de μ (com nível de confiança estipulado) será:

𝜎 𝜎
[𝑋̅ − 𝑧 , 𝑋̅ + 𝑧 ]
√𝑛 √𝑛

(Nível de) Confiança 𝒛


90% 1,645
95% 1,96
Quando não conhecemos o desvio padrão da população devemos calcular o desvio padrão
da amostra e utilizar a Tabela T de Student (Gosset) para obter o valor de “t” que será
utilizado na equação acima no lugar da variável “Z”. Para obtenção de “t” usamos o nível
de confiança desejado e o grau de liberdade 𝐺𝐿 = 𝑁– 1. A Tabela T de Student encontra-
se no anexo.

6- Testes de hipóteses

Para testarmos parâmetros de uma população, formulamos hipóteses a respeito de seus


parâmetros. Essas hipóteses são chamadas de

𝐻0 = ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑛𝑢𝑙𝑎
𝐻1 = ℎ𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎

Devemos testar as hipóteses formuladas para decidir se aceitamos ou rejeitamos a


hipótese nula 𝐻0 . Quando se rejeita a hipótese nula, automaticamente estamos aceitando
a hipótese alternativa 𝐻1 .

O teste de hipótese se relaciona com o intervalo de confiança, pois qualquer hipótese que
estiver fora do intervalo de confiança pode ser considerada rejeitada. Por isso o intervalo
de confiança pode ser tomado como um conjunto de hipóteses não rejeitáveis.

Ao conjunto de valores que levam à rejeição da Hipótese nula damos o nome de Região
de rejeição do teste.

Ao realizarmos o teste de hipóteses há a possibilidade de que a decisão tomada seja errada,


conforme mostramos na tabela:

Conclusão do teste: 𝑯𝟎 verdadeira 𝑯𝟎 falsa


não rejeitar 𝐻0 Decisão correcta Decisão errada
Rejeitar 𝐻0 Decisão errada Decisão correcta
Há o ERRO TIPO I quando rejeitamos 𝐻0 , mas 𝐻0 é verdadeira e o ERRO TIPO II,
quando não se rejeita 𝐻0 , embora 𝐻0 seja falsa.

Se a variância é conhecida (𝜎 2 ) e se 𝑋 é uma variável aleatória normalmente distribuída


e com média podemos fazer o seguinte teste:

Considere que 𝜇 = µ0 , calcula-se o valor de 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 como sendo:

𝑋̅ − 𝜇0
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 𝜎
√𝑛

Obter valor de 𝑍𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 na Tabela normal padronizada usando Nível de confiança


(𝑁𝐶 = 1 − 𝛼) . Se hipótese alternativa for: 𝐻1 : 𝜇 < 𝜇0 , então deve-se rejeitar 𝐻0 se
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 < 𝑍𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 . Já se hipótese alternativa for: 𝐻1 : 𝜇 > 𝜇0 , então deve-se rejeitar
𝐻0 se 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑍𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 . No caso de 𝐻1 : 𝜇 ≠ 𝜇0 então deve-se rejeitar 𝐻0 se
𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 for menor que 𝑍𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 para 𝛼/2 ou se 𝑍𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 for maior que 𝑍𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜
para 𝛼/2.

Se o valor da variância for desconhecido então no lugar de 𝑍 usar Estatística de Teste 𝑇


de Student e substituir 𝜎 (desvio padrão da população) pelo desvio padrão da amostra (𝑠).
Na Figura a seguir resumimos graficamente estes procedimentos.

Figura – Testes estatísticos para uma média


Em diversas situações é conveniente o uso da distribuição QUI-QUADRADO para
comparar a discrepância entre as frequências observadas e as frequências esperadas. Um
exemplo de uso da distribuição QUI-QUADRADO é quando a variância não é conhecida,
mas pode se estimar o valor do desvio padrão da amostra. Nesse caso, se a população
tiver distribuição normal, o valor verdadeiro da variância estará dentro do intervalo de
confiança dado por:

(𝑛 − 1)𝑠 (𝑛 − 1)𝑠
2 < 𝜎2 < 2
𝜒𝑔𝑙, 𝛼⁄ 𝜒𝑔𝑙,(1−𝛼⁄
2 2)

Exemplo: Uma amostra de 12 resistores apresentou desvio padrão de 2ohms. Construir o


intervalo de confiança do desvio padrão para nível de confiança de 95%. Assumir que a
distribuição é normal.

Nesse caso, o grau de liberdade é 𝑁 − 1 = 11. Na Tabela temos (QUI-QUADRADO) 𝜒 2


para 0,025 e (QUI-QUADRADO) 𝜒 2 para 0,975. Observamos que se queremos 𝑁𝐶 =
95% temos 2,5% para cada lado da curva, da mesma forma que fazemos para a curva
normal.

2 2
𝜒(11,𝛼=0,975) = 21,92 𝑒 𝜒(11,𝛼=0,025) = 3,82

Calculando-se o intervalo de confiança temos:


(12 − 1)2 (12 − 1)𝑠
< 𝜎2 <
21,92 3,82
Também podemos usar a distribuição QUI-QUADRADO para testar hipóteses
envolvendo uma variância. No exemplo a seguir mostramos como fazer o teste.

As variações num determinado processo de fabricação de eixos para motores devem ser
tais que desvio padrão do diâmetro seja menor ou igual a 0,50. Uma amostra de tamanho
𝑁 = 15 foi analisada. O valor de (desvio padrão) 𝑠 é de 0,64. Com o nível de confiança
de 95% podemos dizer que a diferença é casual e que o desvio padrão do processo pode
mesmo ser 0,50? A distribuição dos diâmetros é normal.

Considerar 𝐻0 : 𝜎 = 0,50 𝑒 𝐻1 : 𝜎 > 0,50


𝑁í𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛ç𝑎 = 95%, 𝑜𝑢 𝑠𝑒𝑗𝑎 𝛼 = 0,05

Devemos rejeitar 𝐻0 se (QUI-QUADRADO) 𝜒 2 calculado for MAIOR que 𝜒 2 tabelado


(𝑝𝑎𝑟𝑎 𝛼 = 0,05 𝑒 𝐺𝐿 = 𝑛 − 1).

2
(𝑛 − 1)𝑠 2 2
𝜒𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 2 > 𝜒𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜
𝜎0
2
Para 𝐺𝑟𝑎𝑢 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒 = 15 − 1 = 14 𝑒 𝛼 = 0,05 temos: 𝜒𝑡𝑎𝑏𝑒𝑙𝑎𝑑𝑜 = 23,7
Como o 22,94<23,68 NÃO PODEMOS REJEITAR 𝐻0 . Não há evidência que o desvio
padrão do processo seja maior que 0,50. O valor do desvio da amostra é casual com nível
de confiança de 95%.

Outra aplicação comum do Teste de QUI-QUADRADO é para analisar a existência de


aderência entre dados observados e medidos de uma amostra.

Como exemplo, suponha que uma indústria produza refrigerantes do tipo A, tipo B e do
tipo C. O objectivo do departamento de marketing é avaliar se a venda destes produtos
está relacionada ao género do consumidor para direccionar melhor a política de
publicidade. Foram seleccionados aleatoriamente 150 consumidores para responder um
questionário sobre a preferência pelos refrigerantes do tipo A, B ou C. Os resultados são
tabelados a seguir: (Frequências observadas)

Género Tipo A Tipo B Tipo C Total


Mulheres 20 40 20 80
Homens 30 30 10 70
Total 50 70 30 150

Para solucionar essa questão fazemos o teste de hipóteses:

Ho = hipótese nula – a preferência não tem relação com o sexo do consumidor Há


= hipótese alternativa – a preferência depende do sexo.

O primeiro passo é calcular as freqüências esperadas em cada uma das 6 freqüências


observadas:

(Frequências esperadas)
Tipo A Tipo B Tipo C Total
Mulheres 26,67 37,33 16 80
Homens 23,33 32,67 14 70
50 70 30 150

O cálculo de X2 é realizado pela equação:

O grau de liberdade é calculado pela equação: (no de linhas -1).(no de colunas -1)
=2
Na tabela para QUI quadrado, com GL = 2 e nível de confiança de 95% temos: X2crítico
=
5,99.

Como X2crítico é menor que X2 (5,99 < 6,13) a hipótese nula deve ser rejeitada. Logo,
com 95% de nível de confiança a hipótese alternativa é aceita e a preferência pelos
refrigerantes do tipo A, B e C depende sim do sexo do consumidor.

A seguir, apresentamos mais um exemplo. Vamos verificar se há dependência entre a


renda e o número de filhos em famílias de uma cidade. Suponha que, a partir de 250
famílias escolhidas ao acaso, tenhamos a tabela:
Determinação do grau de liberdade = 2 x 3 = 6 . Na tabela, com nível de confiança de
95% temos X2 tabelado = 12,6.
Como X2 calculado (crítico) é maior que X2 tabelado rejeitamos a Hipótese nula. Com
95% de nível de confiança podemos afirmar que não existe independência entre a renda
e o número de filhos.
Na Figura a seguir ilustramos os procedimentos para se fazer teste de hipóteses relativas
a duas médias que são comparadas.

Figura - Testes de hipóteses de duas médias – Fonte: Notas de aula Prof. Armando
Albertazzi

7- Técnicas de Amostragem
Uma amostra é uma parte representativa da população. Ou seja, a amostra deve possuir
as mesmas características básicas da população. Como exemplo, para se calcular a
estatura média das alunas de uma escola devemos inicialmente saber a quantidade de
alunas por sala de aula e fazer a seleção aleatória das alunas de forma proporcional. Prof.
Barbeta (2012) apresenta a fórmula para o cálculo do tamanho mínimo da amostra:

“N” o tamanho da população,


“n” o tamanho da amostra,

é uma primeira aproximação para o tamanho da amostra e “E0” o erro amostral tolerável.
As principais técnicas de amostragem são: aleatória simples, sistemática, estratificada,
estratificada proporcional, conglomerado (agrupamento), não aleatórias: por cotas, por
julgamento, etc. A seguir serão apresentadas quatro técnicas de amostragem:
a) Amostragem Casual ou Aleatória Simples – é equivalente a um sorteio
aleatório. Nesse tipo de amostragem é necessário que os elementos da população sejam
numerados. Quando o número de elementos da amostra é muito grande, esse tipo de
sorteio torna-se muito trabalhoso. Existem Tabelas de Números Aleatórios, construída
de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas.
b) Amostragem Estratificada Proporcional – na maioria das vezes a população se
divide em sub-populações – estratos. Exemplo: uma turma de engenharia tem 66 alunos,
onde 57 são meninos e 9 são meninas. Tem-se; portanto; dois estratos nesta população
(sexo masculino e feminino), logo para uma amostra de 10% da população tem-se 1
menina e 6 meninos.
c) Amostragem Sistemática – quando os elementos da amostra já se acham
ordenados, não há necessidade de construir o sistema de referência. Exemplos: linha de
produção, prédio de uma rua, prontuários de um hospital, etc. Nestes casos, a seleção dos
elementos que constituirão a amostra pode ser feita por um sistema feito pelo pesquisador.
Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar
um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o
tamanho da amostra em 10% da população. Exemplo: supondo que, uma fábrica possui
em estoque 450 computadores ordenados. O setor de controle de qualidade da fábrica
deseja obter uma amostra formada por 25 unidades. Pode-se, neste caso, usar o seguinte
procedimento: como 450/25 = 18, escolhese por sorteio casual um número de 1 a 18
(inclusive), o qual indica o primeiro elemento sorteado para a amostra; os demais serão
periodicamente considerados de 18 em 18. Assim, se o número sorteado for o 4, toma-se,
o 40 computador, o 220, o 400 etc., até completar a amostra.
d) Amostragem por Agrupamento – Quando a população apresenta ocorrência
natural de subgrupos, cada um deles com características similares. Dividida a população
em grupos, chamados de agrupamentos e selecione todos os membros de um ou mais
agrupamentos (mas não todos). Exemplo – População de domicílios de uma cidade, os
quarteirões formam os agrupamentos de domicílios.
A finalidade da técnica de amostragem é fazer generalizações sobre um universo ou uma
população grande sem precisar examinar todos os componentes do grupo. Para
populações que possuem distribuição normal uma amostra de mais de 30 elementos é
suficiente para se fazer inferência da população. Podemos escolher inúmeras amostras
para cada população. Para cada uma delas haverá um intervalo de confiança da média
obtida, quando extrapolada para fazer inferência da média da população. O intervalo de
confiança é calculado por meio de uma relação entre a estatística “t” (quando desvio
padrão é desconhecido) ou pela estatística “z” (quando desvio padrão é conhecido)
multiplicado pelo desvio padrão (da amostra se usarmos “t” ou da população se usarmos
“z”) dividido pela raiz de “n”, onde n é o número de elementos da amostra.
Uma população consiste de todas as observações possíveis de um determinado
fenômeno. Um censo é o exame de todos os elementos de uma população ou universo. A
composição de uma amostra estatística é o que diferencia uma pesquisa de uma enquete.
Enquanto a enquete ouve pessoas que se auto-selecionam, arbitrariamente, a pesquisa é
realizada com uma amostra com representatividade estatística.
A construção do plano amostral começa na análise dos grandes levantamentos do
Instituto Brasileiro de Geografia e Estatística (IBGE): o Censo e a Pesquisa Nacional por
Amostra de Domicílios (Pnad). Normalmente, o processo de construção de uma amostra
para saber a preferência de candidato a presidente por exemplo envolve várias etapas: são
selecionadas quase todas as capitais do País. Em seguida, são realizados sorteios para a
seleção de municípios para conferirem representatividade ao interior dos estados. Depois
disso, são realizados novos sorteios, agora para a definição dos setores censitários em
cada município. Daí em diante os pesquisadores saem em busca de um número de pessoas
que possam representar proporcionalmente a população, com base em critérios de ramo
de atividade, nível de escolaridade, faixa etária e sexo. Com isso, chega-se a uma amostra
que
possa ser considerada um retrato do universo que representa.
Quando não se conhece o tamanho da população é utilizada a seguinte equação (com
nível de confiança de 95%):
Tabela para obtenção dos valores de X2crítico (Teste de QUI QUADRADO)
Exercícios Resolvidos
1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule
a média e a mediana dos dados. Determine qual o desvio padrão.

4, 2, 3, 4, 11, 8, 5, 15
2- Calcule a correlação que relaciona a idade e a altura de uma criança.

Idade (anos) Altura (cm)


6 70
8 110
10 130
12 150
3- Uma empresa precisa selecionar 1 novo colaborador entre 50 que realizaram 6 tipos
de provas. 3 deles obtiveram as melhores notas: A, B e C, conforme a tabela.
Considerando-se o critério de escolha o candidato com menor variância, qual deles
deve ser escolhido?
Candidato Prova 1 Prova 2 Prova 3 Prova 4 Prova 5 Prova 6
A 7 7,5 8 8 8,5 9
B 6 7 8 8 9 10
C 7,5 8 8 8 8 8,5

4- Cinco empregados coletados aleatoriamente de 3 empresas (A, B e C). Perguntou-se


o salário deles (em salários-mínimos) Em qual você trabalharia a partir dessa
pesquisa?
A B C
5,5 4 5
6 5 6
6 6 6
6 6 6
6,5 9 7

5- Calcule o coeficiente R de Pearson para a relação entre a venda de cerveja com a


temperatura do dia.

6- O quadro seguinte representa as alturas (em cm) de 40 alunos de uma classe.

a) Construir uma tabela de freqüência das alturas dos alunos.


b) Construir o histograma.

K = 6 Classes – Na primeira linha lemos 148 inclusive até 153 (não incluso).
7- O quadro seguinte representa as massas de um conjunto de estudantes. Organize
os dados em 6 intervalos de classes:
8- Construa a tabela com os intervalos de classes:

9- Qual a reta ajustada que melhor representa a correlação entre a grandeza X e Y


representada abaixo?

Xi 5 8 7 10 6 7 9 3 8 2
Yi 6 9 8 10 5 7 8 4 6 2
10- Calcule a média, a mediana e a moda dos dados apresentados a seguir:

82, 86, 88, 84, 85, 85, 91, 93


11- Um fabricante pretende avaliar a correlação existente entre a temperatura do dia e
o consumo de cerveja. Os dados foram inseridos na tabela a seguir. Avalie qual a
correlação é mais adequada.

12- Calcular a média dos dados apresentados por meio da tabela de classes / frequência:

Intervalo de Frequência
classe
170 a 175 8
175 a 180 12
180 a 185 5
13- Construir o diagrama de caixa (Box-plot) dos dados:

13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17
14- Dado um histograma, qual a moda e o terceiro quartil ?

15- As notas de 40 alunos são mostradas na tabela. Qual a média e a mediana?


Nota Quantidade
2 2
4 4
6 26
8 6
10 2
16- Na Páscoa uma tia compra ovos para seus 5 sobrinhos. Ela comprou 1 chocolate
Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo
que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/6. Já para o
chocolate Garoto a chance é de 1/12. Nesse caso, qual é a probabilidade do sobrinho mais
velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade do
sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto?

17-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U,


sabendo que ele está fora das especificações?
Tipo B Tipo C Tipo U Total
Dentro das especificações 500 4500 1500 6500
Fora das especificações 30 270 50 350
Total 530 4770 1550 6850

18- Uma caixa possui 12 peças, mas 4 delas são defeituosas. Selecionando-se
aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ?

19- Uma empresa tem 2 alarmes que funcionam de forma independente. Qual a
probabilidade de que um problema seja detectado por apenas um deles? A probabilidade
do alarme funcionar quando o sensor detecta uma invasão é de 95% no alarme A e 90%
no alarme B.
20- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 3,
se
já temos a informação de que a face que saiu é ímpar ?

21- Um sistema funciona a partir de uma combinação de relés. A probabilidade de


cada relé funcionar é “p”. Qual a probabilidade do sistema funcionar ?
22- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade
de
sair apenas 1 cara nesses 3 lançamentos?
23- Uma caixa tem 3 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente
(por sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas? E se
houvesse reposição?

24- Considere que dois dados honestos sejam lançados juntos. Em cada jogada,
calcula-
se a soma dos resultados. Qual a probabilidade de que a soma seja 6 ou 7 ?

25- Um piloto tem probabilidade de vencer uma corrida calculada em 1/5. Qual a
probabilidade do piloto não vencer a corrida? Qual a probabilidade de vencer 3
corridas seguidas?

26- De um baralho de 52 cartas extraem-se 2 cartas sucessivamente e sem reposição.


Qual a probabilidade de se obter um ás e um valete nessa ordem?

27- Uma urna tem bolas numeradas de 1 a 25. Sorteamos uma bola aleatoriamente.
Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ?

28- No lançamento de 2 dados honestos simultaneamente, qual a probabilidade de


obtermos 1 no primeiro dado e 5 no segundo?

29- Uma caixa tem 9 bolas, sendo 2 brancas, 3 vermelhas e 4 pretas. Qual a
probabilidade de ser retirar uma bola que não seja preta?

30- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o
dobro de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de
um
dado não viciado. Qual a freqüência da face 1?

31- Uma peça é montada a partir de 3 módulos. A probabilidade de ocorrer 1 defeito


no primeiro módulo é de 80 por 1 milhão, no segundo é de 50 em 1 milhão e no terceiro
120 em 1 milhão. Selecionado um módulo aleatoriamente na produção, qual a
probabilidade dele não ter nenhum defeito? Qual a probabilidade de serem fabricados
1000 módulos sem defeito?
32- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo
de sabão em pó. Verificou-se que 6500 usam a marca X. 5500 usam a marca Y. 2000
utilizam as duas marcas. Foi sorteada uma pessoa entre as 10000 e verificou-se que ela
usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y?

33- Em um colégio 5% dos homens e 2% das mulheres têm mais que 1,80m de altura.
O total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente
e tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher?
34- Uma caixa contém 11 bolas numeradas de 1 a 11. Retirando-se uma delas ao
acaso, observa-se que o número que ela traz é impar. Determine a probabilidade de que
esse número seja menor que 5.

35- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que
15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C,
6000 lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C, 1000
lêem os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é probabilidade
de que ela leia pelo menos um jornal? Qual a probabilidade de que ela leia apenas 1
jornal?
36- Uma caixa tem 5 bolas, sendo 2 pretas e 3 brancas. Qual a probabilidade de se
sortear 2 bolas pretas na seqüência (com e sem reposição) ?

37- Um dado equilibrado (honesto) é lançado 3 vezes. Qual a probabilidade de se obter


a
face 5 duas vezes?

38- Dado o espaço amostral:


S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos
A = {0,2,4,6,8}, B={1,3,5,7,9} e C={2,3,4,5}, encontre:
a) AUC
b) AnC
c) C´
39- Uma caixa tem bolas numeradas de 1 a 10. Sorteamos uma bola. Qual a
probabilidade de sair múltiplo de 2 ? E qual a probabilidade de sair múltiplo de 3 ?

40- Um casal pretende ter 3 filhos. Qual a probabilidade de nascerem


EXATAMENTE dois meninos?

41- Dados os algarismos 1,2,3,4,5,6,7 construímos todos os números que podem ser
representados usando-se dois deles sem repetir. Escolhendo-se um dos números formados
(aleatoriamente), qual a probabilidade dele ser par?
42- Considere o experimento aleatório E = dado honesto é lançado e a face é
observada e os eventos A = ocorre face 3 e B = ocorre face impar. Qual a probabilidade
de que o evento A ocorrer? Qual a probabilidade do evento A ocorrer sabendo que o
evento B já
ocorreu?

43- Uma empresa de aluguel de carros anota o número de carros alugados. Em um


determinado período, a probabilidade de alugar 10 carros é de 25%, a de alugar 11 carros
é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 10%. Calcule o número
médio de carros alugados por semana.
aleatoriamente sejam azuis?

45- Uma pesquisa realizada com 100 estudantes, sendo 50 mulheres e 50 homens,
mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido
tanto para homens quanto para mulheres foi de 170ms com um desvio padrão de 30ms.
Considerando que o tempo de reação obedece a uma distribuição normal, qual é a
probabilidade de encontrar uma pessoa com tempo de reação maior que 140ms e menor
que 200ms ?
46- Em uma rede de computadores, em 50% dos dias ocorre alguma falha. Considere
a variável aleatória X = número de dias com falha na rede. Considere o período de
observação de 30 dias e suponha que os eventos são independentes. Qual a probabilidade
de ocorrer 12 ou mais dias de falha na rede, considerando os 30 dias de observação? Qual
a probabilidade de ocorrer exatamente 12 dias de falha na rede, considerando os mesmos
30 dias de observação?

47- Uma pesquisa com 100 pessoas mediu o tempo de reação para frear um carro em
milisegundos. O valor médio obtido foi de 180ms com desvio padrão de 50ms.
Considerando que o tempo de reação é normalmente distribuído, qual é a probabilidade
de encontrar entre as 100 pessoas, uma que tenha tempo de reação menor que 100ms?

48- Pesquisas mostram que o percentual de gênios na população obedece uma curva
normal com média de QI = 100 e desvio padrão de 15. Qual a probabilidade de
encontramos pessoas com QI superior a 130 em uma população?

49- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No
entanto, a massa é normalmente distribuída com desvio padrão de 2kg. Selecionando-se
um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor
que 48kg?
50- Uma máquina produz discos de diâmetro médio de 2cm com desvio padrão de
0,01cm. As peças que se afastam por mais de 0,03cm desse valor médio são consideradas
com defeito. Qual o percentual de peças consideradas defeituosas?

51- A vida média de uma marca de televisão é de 8 anos com desvio padrão de 1,8
anos. A campanha de lançamento diz que todos os produtos que tiverem defeito dentro
do prazo de garantia serão trocados por novos. Se você fosse o gerente de produção, qual
seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas?
52- Uma empresa produz resistores com resistência média de 40 ohms e desvio padrão
de 6 ohms. A resistência é normalmente distribuída. Quais os valores de resistências
correspondem a 45% da área da curva normal à esquerda e área de 14% à direita da
curva normal ?

53- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de
800h e desvio padrão de 40h. Ao selecionarmos uma lâmpada aleatoriamente, qual a
probabilidade de que ela queime entre 778 e 834 horas?
54- Nma fábrica, um grande lote de resistores possui resistência elétrica normalmente
distribuída com valor médio de 40 ohms e desvio padrão de 2 ohm. Qual a probabilidade
de encontrarmos um resistor com resistência maior que 43 ohms?

55- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos
equipamentos produzidos é de 10 anos com desvio padrão de 2 anos. Os motores com
defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 3% dos
motores que apresentarem defeito, qual deve ser o tempo de garantia?
56- Um cruzamento tem uma média de 3 acidentes por mês. Qual a probabilidade de
ocorrer 4 ou mais acidentes em um mês qualquer?

57- Um taxista recebe em média 4 chamadas a cada 30min. Qual a probabilidade de


não receber nenhuma chamada em 30 minutos?

58- Num tipo de fabricação de uma fita especial para computação, ocorrem defeitos a
uma taxa de 1 a cada 2000 metros. Qual a probabilidade de que em um rolo de 2000
metros de fita não tenha nenhum defeito? Ou que tenha pelo menos dois defeitos?
59- Uma equipa de futebol joga 3 partidas. Assumindo que a probabilidade de vitória em
cada jogo é de 50%, qual é a probabilidade de que a equipa vença exatamente dois jogos?

60- Um posto de gasolina atende em média 6 clientes por hora. Qual a probabilidade
de que apenas 3 clientes sejam atendidos numa hora?

61- Uma delegacia de polícia recebe uma média de 5 solicitações por hora. Qual a
probabilidade de que ela receba 2 solicitações em uma determinada hora selecionada
aleatoriamente?
62- Suponha que em uma linha de produção a probabilidade de se obter uma peça
defeituosa seja de 10%. Toma-se uma amostra de 30 peças para serem inspecionadas.
Qual a probabilidade de se obter na amostra: a) Uma peça defeituosa? b) Nenhuma peça
defeituosa? c) Mais que 2 peças defeituosas?

63- Suponha que numa linha de produção a probabilidade de se obter uma peça
defeituosa (sucesso) é 𝑝 = 0,1 . Toma-se uma amostra de 10 peças para serem
inspecionadas. Qual a probabilidade de se obter: a) Uma peça defeituosa? b) mais que
uma peça defeituosa?
64- Um jogador tem precisão de 40% nos arremessos. Em 5 lances qual é a
probabilidade de acertar mais que 2 cestas?

65- Em uma rede de computadores, em 60% dos dias ocorre alguma falha. Construir
a distribuição de probabilidades para a variável aleatória X = número de dias com falha
na rede, considerando o período de observação de 3 dias. Suponha que os eventos são
independentes.
66- Uma empresa de telefonia sabe que em um determinado lote de telefones
produzidos, 10% deles são defeituosos. Retirando-se aleatoriamente 6 telefones para
avaliação, qual é a probabilidade de se encontrar pelo menos um telefone defeituoso?
Qual a probabilidade de se encontrar apenas um telefone defeituoso? Qual a probabilidade
de encontrar mais que dois telefones defeituosos?

67- Um determinado gene ocorre em 20% de uma população. Se uma amostra


aleatória de 7 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos
nesse conjunto exatamente 3 pessoas com o gene?
68- Em uma cidade sabe-se que 59% das casas têm TV a cabo. Escolhemos 6 casas
aleatoriamente e perguntamos para eles se eles possuem TV a cabo. Qual a probabilidade
de encontrarmos 5 famílias com TV a cabo na amostra?

69-Qual a probabilidade de encontrarmos entre 3 e 6 caras no lançamento de uma moeda


honesta 10 vezes? Faça o mesmo cálculo por meio de uma aproximação com a
distribuição normal.
70- Uma moeda é lançada 400 vezes. Qual a probabilidade de encontrarmos um
número de caras entre 185 e 210 caras?

71- Em uma população de uma pequena cidade, 70% são favoráveis a um determinado
projeto. Se escolhermos aleatoriamente uma amostra de 10 pessoas, qual a probabilidade
de que a maioria seja favorável ao projeto?
72- Qual a probabilidade de se obter 2 caras em 5 lançamentos de uma moeda honesta?
Qual a probabilidade de se obter no máximo 2 caras?

73- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra
aleatória de 14 pessoas é analisada. Qual a probabilidade de que se encontrem 3
desempregados na amostra?
74- Uma prova tem 12 questões com 4 alternativas cada. Um aluno pouco estudioso
resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 6
questões? Qual a probabilidade dele acertar 7 questões?

75- Uma escola tem 35 professores, sendo 21 homens e 14 mulheres. O Director


formou uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou mais
mulheres?

76- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a
probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20 empresas?
77- Uma moeda viciada é lançada 8 vezes. A probabilidade de se obter cara em cada
jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras?
79- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa
líquida de 400g (desconsiderando a massa da lata). No entanto, a massa segue uma
distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram uma
amostra aleatória de 25 latas para avaliação. A média das massas encontradas
(descontadas as massas das latas) foi de 402g. A partir dessa média amostral, qual é a
probabilidade de encontrarmos na população uma lata de leite com massa menor que
400g?

80- Um fabricante produz resistores com desvio padrão de 8Ω. O valor da resistência
dos resistores produzidos segue uma distribuição normal. A resistência média de uma
amostra aleatória de 20 resistores foi medida como sendo de 80 Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
de 95,0%.
81- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os
rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos
produzidos, um engenheiro coletou uma amostra aleatória de 12 esferas da produção
diária. Usando um paquímetro ele obteve as seguintes medições para as esferas. Calcule
o intervalo de confiança para a média das esferas produzidas pela máquina com nível de
confiança de 95%.
8,2 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 8,2 8,4

82- Um engenheiro de telecomunicações está desconfiado de que a resistência de


ruptura de um perfil metálico usado para construção de torres para antenas de celular está
fora das especificações definidas no contrato com o fornecedor. Ele selecionou
aleatoriamente no pátio da fornecedora uma amostra de 10 perfis e levou para avaliação
no laboratório de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma
distribuição normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir
desses valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos
perfis metálicos que estão sendo utilizados. Utilize nível de confiança de 95%.

8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4 8,2

83- Por norma, uma fábrica de café em pó deve produzir sacos com massa de 500 g
de café (desconsiderando a massa do saco). Todos os dias são produzidos 10.000 sacos
de café. A massa de café nos sacos apresenta uma distribuição normal com desvio padrão
de 10g. Funcionários do INMETRO retiraram uma amostra aleatória de 30 sacos para
avaliação. As massas foram pesadas uma a uma, obtendo-se uma massa média das
amostras de 502 gramas. Baseado nessas informações, qual a probabilidade de
encontrarmos pacotes com menos que 500g entre os 10.000 sacos de café (população).

84- Um fabricante produz resistores com desvio padrão desconhecido e distribuição


normal. A resistência média obtida em uma amostra aleatória de n = 25 resistores foi
98,0Ω. O desvio padrão da amostra foi 16Ω. Calcule o intervalo de confiança para a média
da população de resistores produzidos. Use o nível de confiança 95,0%.

85- Um fabricante produz resistores com desvio padrão 12Ω e distribuição normal. A
resistência média de uma amostra aleatória de n=25 foi 98,0Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
95,0%.

86- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE


20 esferas de rolamentos produzidos por uma máquina. Construa um intervalo de
confiança, a 95%, para a média da população de todas as possíveis esferas produzidas por
essa máquina.
15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2 15,4
15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3 15,5
87- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob
determinadas condições. Ele já obteve previamente a informação de que essa variável é
normalmente distribuída. Uma amostra aleatória de tamanho 11 é escolhida, obtendo-se
os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0
6,3 5,9 7,2 6,8. A partir desses valores, calcule qual o intervalo de confiança para a
resistência à ruptura média dessa liga de aço, com 90% de nível de confiança.

88- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 140 e
160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as
medidas relacionadas a seguir:

137 154 159 155 167 159 158 159 152 169
154 158 140 149 145 157 160 155 155 143 157 139 159 139 129 162 151
150 134 151

a) Qual o intervalo de confiança da média de diâmetros das peças produzidas?


b) Determine a proporção de peças fabricadas pela máquina que satisfazem as
especificações, com nível de confiança de 98%.

89- Foi realizada uma pesquisa envolvendo uma amostra de 600 pacientes de um
hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles
mediu-se a taxa de índice cardiáco. Os 600 pacientes foram divididos em 40 grupos de
15 pacientes cadas. Em um desses grupos tem-se os seguintes valores para a taxa de índice
cardíaco: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172. A
partir desses valores construa o intervalo de confiança para o valor médio de índice
cardíaco com nível de confiança de 95%.

90- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma


grandeza normalmente distribuída com variância igual a 4 MPa2. Uma amostra aleatória
de 10 corpos de prova é testada em laboratório, obtendo-se os seguintes valores para a
ruptura em MPa: 7,9 / 6,8 / 5,4 / 7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9. Calcule qual o
intervalo de confiança para a resistência média do material com nível de confiança de
90%. Se o desvio padrão não fosse dado, como você resolveria a questão?

91- São realizados teste de tensão de ruptura em 22 corpos de prova. A carga no ponto
de falha foi calculada em um valor médio de 13,71MPa e desvio padrão de 3,55. Os dados
obtidos nos permite afirmar com nível de confiança de 95% que a tensão de
ruptura da população dos corpos de prova é superior a 10 MPa?

92- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de
2000 horas e desvio padrão de 50 horas. Um comprador desconfiado fez um teste com
16 lâmpadas e obteve que o tempo de vida útil é de 1970 horas. Com um nível de
confiança de 95% é possível afirmar que o fabricante está mentindo?

93- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C.


Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de testes,
sendo 40 de cada material. Os valores médios e desvios padrões das respectivas amostras
estão na tabela abaixo. Com base nestes dados, e com nível de confiança de 95%, é
possível afirmar que as resistências destes materiais são significativamente diferentes?
Use testes de hipóteses para justificar sua resposta.

Material Valor médio Desvio padrão


A 230,2 MPa 12,5 MPa
B 227,4 MPa 11,9 MPa
C 223,4 MPa 12,9 MPa

94- Um determinado tipo de barbante é vendido como sendo capaz de resistir 180 N.
Um cliente retirou 5 amostras e obteve valores de resistência de 185N, 182N, 187N, 183N
e 189N. Com um nível de confiança de 99% é possível afirmar que os barbantes vendidos
têm resistência superior à 180N ?
95- Um estudante fez um ensaio para determinar a influência da corrente de
alimentação de um laser diodo na qualidade de um certo tipo de imagem. Para tal, realizou
seis ensaios com a corrente de 60 mA e seis outros ensaios com a corrente de 100 mA.
Para cada ensaio, calculou um certo coeficiente, encontrando os resultados da tabela
abaixo. Quanto maior o valor do coeficiente, melhor é qualidade da imagem. Com 95%
de probabilidade é possível afirmar que a corrente de alimentação do laser diodo influi na
qualidade da imagem?

Corrente Ensaio 1 Ensaio 2 Ensaio 3 Ensaio 4 Ensaio 5 Ensaio 6


60 mA 208,6 209,0 208,1 208,3 209,2 208,3
100 mA 202,1 197,9 200,4 200,7 203,0 203,1
96- Um professor está pensando em se candidatar a vereador de uma cidade da Grande
Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de
Pesquisas Lopes Populix. A cidade tem 30.000 habitantes. Para uma margem de erro de
10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no
professor?

97- Em uma empresa com 10.000 funcionários, desejamos estimar o percentual de


pessoas que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da
amostra para que o erro da pesquisa seja menor que 4%?

98- Quantas pessoas devem ser entrevistadas para conhecermos a opinião dos 1000
alunos
de uma escola sobre a qualidade dos serviços da lanchonete?

99- Um pesquisador não conhece a população de uma cidade, mas deseja saber a
preferência de voto para presidente. Nesse caso, quantas pessoas devem ser entrevistadas
para obter um resultado com margem de erro de 2% e nível de confiança
de 95%?

100- Qual a diferença de amostragem sistemática e estratificada?


R. Na amostra estratificada coletamos elementos de forma proporcional em que eles
aparecem na população. Na amostra sistemática podemos escolher valores de uma lista
já ordenada, sorteando-se o primeiro número (posição) de referência e escolhendo os
próximos números de forma a mantermos os mesmos intervalos a partir do primeiro
(exemplo: escolher de 20 em 20 números a partir de um número selecionado).
ANEXO A – QUESTÕES COMPLEMENTARES

1- Ordene os dados. Indique o 1º, 2º e 3º quartil. Desenhe o diagrama de caixa. Calcule


a média e a mediana dos dados. Determine qual o desvio padrão.

11, 12, 4, 2, 3, 4, 11, 8, 5, 15, 20, 21

3- Calcule a correlação que relaciona a idade e a altura de uma criança.


Idade (anos) Altura (cm)
6 70
8 110
10 130
12 150
14 155
15 160

3- O dono de uma lanchonete anotou quanto de refrigerantes (em litros) ele vende ao
longo dos dias de acordo com a temperatura. Qual a relação entre estas duas informações?

temp. litros

15 22

20 25

25 28

27 30

30 32

31 31

32 33

35 35

4- O quadro seguinte representa as alturas (em cm) de 25 alunos de uma classe.


Construa o histograma e calcule a média e o desvio padrão.

155 163 148 166 169

164 165 159 175 155

170 165 176 157 157

150 150 160 165 164


166 169 152 170 190

5- Qual a reta ajustada que melhor representa a correlação entre as grandezas X e Y


representadas abaixo?

Xi 5 7 7 10 6 7 9
Yi 7 9 8 10 5 7 8

6- Calcule a média, a mediana e a moda dos dados apresentados a seguir:

80, 94, 86, 88, 84, 85, 85, 91, 93

7- Calcular a média e o desvio padrão dos dados apresentados por meio da tabela de
classes / frequência:

Classe Frequência

150 a 155 2

156 a 160 4

161 a 165 6

166 a 170 15

171 a 175 6

176 a 180 4

181 a 185 3

8- Construir o diagrama de caixa (Box-plot) dos dados:

12, 16, 13, 9, 18, 15, 14, 21, 7, 10, 11, 20, 5, 18, 37, 16, 17

9- Dado um histograma, qual a moda e o terceiro quartil ?


10- As notas de turma de alunos são mostradas na tabela. Qual a média e a mediana?

Nota Quantidade
2 2
4 4
6 12
8 6
10 2

11- Na Páscoa uma tia compra ovos para seus 3 sobrinhos. Ela comprou 1 chocolate
Lacta e 2 chocolates Garotos para cada sobrinho. Dentro do chocolate há brindes, sendo
que a probabilidade de se encontrar um brinde no chocolate Lacta é de 1/3. Já para o
chocolate Garoto a chance é de 1/6. Nesse caso, qual é a probabilidade do sobrinho mais
velho ser o único a ganhar um brinde no chocolate Lacta? Qual a probabilidade do
sobrinho mais novo ganhar um prêmio da Lacta ou da Garoto?

12-Qual a probabilidade de uma caixa de leite, escolhida aleatoriamente seja do tipo U,


sabendo que ele está fora das especificações?
Tipo B Tipo C Tipo U Total
Dentro das especificações 500 4500 1500 6500
Fora das especificações 80 270 50 400
Total 580 4770 1550 6900

13- Uma caixa possui 10 peças, mas 4 delas são defeituosas. Selecionando-se
aleatoriamente 2 bolas sem reposição, qual a probabilidade de obtermos 2 peças boas ?
14- Um dado equilibrado é lançado. Qual a probabilidade de sair a face o número 4,
se já temos a informação de que a face que saiu é par ?

15- Considere 3 lançamentos seguidos de uma moeda honesta. Qual a probabilidade


de sair exatamente 2 cara nesses 3 lançamentos?

16- Uma caixa tem 5 bolas brancas e 2 bolas pretas. Selecionando-se aleatoriamente
(por sorteio) 2 bolas sem reposição, qual a probabilidade de sair 2 bolas pretas?

17- Considere que dois dados honestos sejam lançados juntos. Em cada jogada,
calcula-se a soma dos resultados. Qual a probabilidade de que a soma seja 5 ou 7 ?

18- Um piloto tem probabilidade de vencer uma corrida calculada em 1/10. Qual a
probabilidade do piloto vencer duas corridas em 5 ?

19- Uma urna tem bolas numeradas de 1 a 20. Sorteamos uma bola aleatoriamente.
Qual a probabilidade de sair um número múltiplo de 2 ou de 3 ?

20- Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o
triplo de freqüência da face 1 e que as outras faces saiam com a freqüência esperada de
um dado não viciado. Qual a freqüência da face 1?

21- Uma pesquisa é realizada com 10.000 consumidores sobre a preferência por tipo
de sabão em pó. Verificou-se que 7.500 usam a marca X. 4.500 usam a marca Y. 2.000
utilizam as duas marcas. Foi sorteada uma pessoa entre as 10.000 e verificou-se que ela
usa a marca X. Qual a probabilidade dessa pessoa também ser usuária da marca Y?

22- Em um colégio 10% dos homens e 8% das mulheres têm mais que 1,80m de altura.
O total de homens é de 60% dos estudantes. Se um estudante é escolhido aleatoriamente
e tem mais que 1,80m de altura, qual é a probabilidade de que seja mulher?

23- Uma cidade tem 50.000 pessoas e 3 jornais em circulação: A, B e C. Sabe-se que
15000 pessoas lêem o jornal A, 10000 pessoas lêem o jornal B, 8000 lêem o jornal C,
6000 lêem os jornais A e B, 4000 lêem os jornais A e C, 3000 lêem os jornais B e C,
2.000 lêem os jornais A, B e C. Uma pessoa é escolhida aleatoriamente. Qual é
probabilidade de que ela leia pelo menos um jornal? Qual a probabilidade de que ela leia
apenas 1 jornal?

24- Dado o espaço amostral:


S = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9} e os eventos
A = {0,2,4,6}, B={1,3,5,9} e C={2,4,5}, encontre:
d) AUC
e) AnC
f) C´

25- Um casal pretende ter 4 filhos. Qual a probabilidade de nascerem


EXATAMENTE dois meninos?

26- Uma empresa de aluguel de carros anota o número de carros alugados. Em um


determinado período, a probabilidade de alugar 10 carros é de 30%, a de alugar 11 carros
é e 30%, de alugar 12 carros é de 35% e de alugar 13 carros é de 15%. Calcule o número
médio de carros alugados por semana.

27- Uma pesquisa realizada com 1.000 estudantes, sendo 500 mulheres e 500 homens,
mediu o tempo de reação para frear um carro em milisegundos. O valor médio obtido
tanto para homens quanto para mulheres foi de 150ms com um desvio padrão de 25ms.
Considerando que o tempo de reação obedece a uma distribuição normal, qual é a
probabilidade de encontrar uma pessoa com tempo de maior que 200ms?

28- Em uma rede de computadores, em 20% dos dias ocorre alguma falha. Considere
a variável aleatória X = número de dias com falha na rede. Considere o período de
observação de 10 dias e suponha que os eventos são independentes. Qual a probabilidade
de ocorrer mais que 6 dias e falhas na rede, considerando os 10 dias de observação?

29- Uma fábrica de cimentos necessita encher sacos com peso médio de 50kg. No
entanto, a massa é normalmente distribuída com desvio padrão de 1kg. Selecionando-se
um saco de cimento aleatoriamente, qual a probabilidade de que ele tenha massa menor
que 49kg?

30- Uma máquina produz discos de diâmetro médio de 3cm com desvio padrão de
0,08cm. As peças que se afastam por mais de 0,16cm do diâmetro médio são consideradas
com defeito. Qual o percentual de peças consideradas defeituosas?

31- A vida média de uma marca de televisão é de 10 anos com desvio padrão de 1,5
anos. A campanha de lançamento diz que todos os produtos que tiverem defeito dentro
do prazo de garantia serão trocados por novos. Se você fosse o gerente de produção, qual
seria o tempo de garantia que você especificaria para ter no máximo 5% de trocas?

32- Uma empresa produz resistores com resistência média de 60 ohms e desvio padrão
de 4 ohms. A resistência é normalmente distribuída. Qual a probabilidade de
encontrarmos resistores com resistência inferior a 50 ohms?

33- A vida útil de um tipo de lâmpada é normalmente distribuída com valor médio de
1.000h e desvio padrão de 50h. Ao selecionarmos uma lâmpada aleatoriamente, qual a
probabilidade de que ela queime entre 500 e 600 horas?

34- O engenheiro de uma fábrica de motores elétricos sabe que a vida média dos
equipamentos produzidos é de 12 anos com desvio padrão de 2 anos. Os motores com
defeito são trocados se estiverem na garantia. Se a fabrica quiser trocar somente 5% dos
motores que apresentarem defeito, qual deve ser o tempo de garantia?

35- Um cruzamento tem uma média de 5 acidentes por mês. Qual a probabilidade de
ocorrer 4 acidentes em um mês qualquer?

36- Um taxista recebe em média 5 chamadas a cada hora. Qual a probabilidade de não
receber nenhuma chamada em uma determinada hora ?

37- Um time de futebol joga 8 partidas. Assumindo que a probabilidade de vitória em


cada jogo é de 40%, qual é a probabilidade de que o time vença exatamente 4 jogos?
38- Um posto de gasolina atende em média 8 clientes por hora. Qual a probabilidade
de que apenas 4 clientes sejam atendidos em uma hora?

39- Suponha que em uma linha de produção a probabilidade de se obter uma peça
defeituosa seja de 5%. Toma-se uma amostra de 30 peças para serem inspecionadas. Qual
a probabilidade de se obter na amostra mais que 2 peças defeituosas?

40- Suponha que numa linha de produção a probabilidade de se obter uma peça
defeituosa é de 10%. Toma-se uma amostra de 10 peças para serem inspecionadas. Qual
a probabilidade de se obter duas peças defeituosas?

41- Um jogador tem precisão de 60% nos arremessos. Em 5 lances qual é a


probabilidade de acertar mais que 2 cestas?

42- Uma empresa de telefonia sabe que em um determinado lote de telefones


produzidos, 20% deles são defeituosos. Retirando-se aleatoriamente 10 telefones para
avaliação, qual é a probabilidade de se encontrar pelo menos um telefone defeituoso?

43- Um determinado gene ocorre em 10% de uma população. Se uma amostra


aleatória de 10 pessoas é selecionada ao acaso, qual é a probabilidade de encontrarmos
nesse conjunto exatamente 3 pessoas com o gene?

44- Uma moeda honesta é lançada 400 vezes. Qual a probabilidade de encontrarmos
um número de caras maior que 250?

45- Em uma população de uma pequena cidade, 60% são favoráveis a um determinado
projeto. Se escolhermos aleatoriamente uma amostra de 30 pessoas, qual a probabilidade
de que a maioria seja favorável ao projeto?

46- Qual a probabilidade de se obter 2 caras em 8 lançamentos de uma moeda honesta?

47- Uma cidade tem 20% de sua força de trabalho desempregada. Uma amostra
aleatória de 20 pessoas é analisada. Qual a probabilidade de que se encontrem 5
desempregados na amostra?
48- Uma prova tem 30 questões com 5 alternativas cada. Um aluno pouco estudioso
resolve escolher aleatoriamente as respostas. Qual a probabilidade dele acertar 15
questões ou mais?

49- Uma escola tem 40 professores, sendo 18 homens e 22 mulheres. O Diretor


formou uma comissão de 3 pessoas. Qual a probabilidade de na comissão tenha 2 ou
mais mulheres?

50- Sabemos que 70% das empresas estão aptas a participar de uma licitação. Qual a
probabilidade de encontrar pelo menos 1 apta em uma amostra aleatória de 20 empresas?

51- Uma moeda viciada é lançada 10 vezes. A probabilidade de se obter cara em cada
jogada é de 0,60. No total de lançamentos, qual a probabilidade de se obter 5 caras?

52- Por norma uma fábrica de leite em pó (Ninhol) deve produzir latas com massa
líquida de 500g (desconsiderando a massa da lata). No entanto, a massa segue uma
distribuição normal com desvio padrão de 5g. Funcionários do INMETRO retiraram uma
amostra aleatória de 25 latas para avaliação. A média das massas encontradas
(descontadas as massas das latas) foi de 502g. A partir dessa média amostral, qual é a
probabilidade de encontrarmos na população uma lata de leite com massa menor que
500g?

53- Um fabricante produz resistores com desvio padrão de 10Ω. O valor da resistência
dos resistores produzidos segue uma distribuição normal. A resistência média de uma
amostra aleatória de 25 resistores foi medida como sendo de 90 Ω. Calcule o intervalo de
confiança para a média da população de resistores produzidos. Use o nível de confiança
de 95,0%. Se retirarmos aleatoriamente um resistor da produção, qual a probabilidade
dele ter resistência menor que 80 Ω ?

54- Uma fábrica de Jaraguá do Sul produz rolamentos para a Fórmula 1. Os


rolamentos são feitos de esferas de aço polido. Para avaliar a qualidade dos rolamentos
produzidos, um engenheiro coletou uma amostra aleatória de 10 esferas da produção
diária. Usando um paquímetro ele obteve as seguintes medições para os diâmetros das
esferas. Calcule o intervalo de confiança para a média das esferas produzidas pela
máquina com nível de confiança de 95%.

8,2 8,3 8,4 8,2 8,2 8,4 8,3 8,2 8,4 8,4

55- Um engenheiro de telecomunicações está desconfiado de que a resistência de


ruptura de um perfil metálico usado para construção de torres para antenas de celular está
fora das especificações definidas no contrato com o fornecedor. Ele selecionou
aleatoriamente no pátio da fornecedora uma amostra de 12 perfis e levou para avaliação
no laboratório de metrologia do IFSC. Sabe-se que a resistência de ruptura segue uma
distribuição normal. Os valores a seguir foram obtidos em MPa (megapascals). A partir
desses valores, calcule qual o intervalo de confiança para a tensão de ruptura média dos
perfis metálicos que estão sendo utilizados. Utilize nível de confiança de 95%.

18,3 18,4 18,2 18,2 18,4 18,3 18,2 18,4 18,4 18,2 18,8 19,0

56- Um fabricante produz resistores com desvio padrão desconhecido e distribuição


normal. A resistência média obtida em uma amostra aleatória de n = 20 resistores foi
100Ω. O desvio padrão da amostra foi 12 Ω. Calcule o intervalo de confiança para a média
da população de resistores produzidos. Use o nível de confiança 90,0%.

57- Os dados a seguir correspondem ao diâmetro em mm de UMA AMOSTRA DE


18 esferas de rolamentos produzidos por uma máquina. Construa um intervalo de
confiança, a 90%, para a média da população de todas as possíveis esferas produzidas por
essa máquina.
15,7 15,4 15,9 15,5 15,7 15,9 15,8 15,9 15,2 15,7 15,9 16,2 15,1 14,9 15,4 15,2 15,1 15,3

58- Um pesquisador está estudando a resistência à tração de uma certa liga de aço sob
determinadas condições. Ele já obteve previamente a informação de que essa variável é
normalmente distribuída. Uma amostra aleatória de tamanho 12 é escolhida, obtendo-se
os seguintes valores para a tensão de ruptura (em MPa): 7,9 6,8 5,4 7,5 7,9 6,4 8,0
6,3 5,9 7,2 6,8 e 8,2. A partir desses valores, calcule qual o intervalo de confiança
para a resistência à ruptura média dessa liga de aço, com 95% de nível de confiança.
59- Os rolamentos produzidos por uma empresa precisam ter diâmetro entre 150 e
160mm. Uma amostra de 30 rolamentos é selecionada aleatoriamente, obtendo-se as
medidas relacionadas a seguir:

135 154 159 155 167 159 158 159 152 169
154 158 140 149 145 157 160 155 155 143
157 139 159 139 129 162 151 150 134 155

a) Qual o intervalo de confiança da média de diâmetros das peças produzidas?


b) Determine a proporção de peças fabricadas pela máquina que satisfazem as
especificações, com nível de confiança de 95%.

60- Foi realizada uma pesquisa envolvendo uma amostra de 400 pacientes de um
hospital. Cada um desses pacientes foi submetido a um conjunto de exames. Entre eles
mediu-se a taxa de glicose. Os 400 pacientes foram divididos em 20 grupos de 20
pacientes. Em um desses grupos foram tabelados os seguintes valores para a taxa de
glicose: 405, 348, 365, 291, 135, 260, 300, 155, 34, 294, 758, 472, 559, 143, 172, 420,
380, 180, 200, 250. A partir desses valores construa o intervalo de confiança para o valor
médio da taxa de glicose com nível de confiança de 95%.

61- Um pesquisador está estudando a resistência mecânica de um material. Essa é uma


grandeza normalmente distribuída. Uma amostra aleatória de 12 corpos de prova é testada
em laboratório, obtendo-se os seguintes valores para a ruptura em MPa: 7,9 / 6,8 / 5,4 /
7,5 / 7,9 / 6,4 / 8,0 / 6,3 / 4,4 / 5,9 / 6,5 / 7,0. Calcule qual o intervalo de confiança para
a resistência média do material com nível de confiança de 90%.

62- São realizados teste de tensão de ruptura em 20 corpos de prova. A carga no ponto
de falha foi calculada em um valor médio de 13MPa e desvio padrão de 2MPa. Os dados
obtidos nos permite afirmar com nível de confiança de 95% que a tensão de ruptura da
população dos corpos de prova é superior a 13 MPa?

63- Um fabricante afirma em seu catálogo que suas lâmpadas apresentam vida útil de
2000 horas e desvio padrão de 100 horas. Um comprador desconfiado fez um teste com
20 lâmpadas e obteve que o tempo de vida útil é de 1900 horas. Com um nível de
confiança de 95% é possível afirmar que o fabricante está mentindo?

64- Pretende-se comparar as tensões de ruptura de três materiais distintos: A, B e C.


Cento e vinte corpos de prova similares foram avaliados em uma mesma bateria de testes,
sendo 30 de cada material. Os valores médios e desvios padrões das respectivas amostras
estão na tabela abaixo. Com base nestes dados, e com nível de confiança de 95%, é
possível afirmar que as resistências destes materiais são significativamente diferentes?
Use testes de hipóteses para justificar sua resposta.

Material Valor médio Desvio padrão


A 230MPa 12 MPa
B 225 MPa 11 MPa
C 220 MPa 10 MPa

65- Um determinado tipo de barbante é vendido como sendo capaz de resistir 185 N.
Um cliente retirou 6 amostras e obteve valores de resistências de 184N, 182N, 187N,
183N e 189N e 190. Com um nível de confiança de 99% é possível afirmar que os
barbantes vendidos têm resistência superior à 185N ?

66- Um estudante fez um ensaio para determinar a influência da corrente de


alimentação na qualidade da imagem. Ele realizou 5 ensaios com a corrente de 50 mA e
outros 5 ensaios outros ensaios com a corrente de 100 mA. Para cada um deles, calculou
o coeficiente de nitidez, encontrando os resultados da tabela abaixo. Quanto maior o valor
do coeficiente, melhor é qualidade da imagem. Com 90% de probabilidade é possível
afirmar que a corrente de alimentação influencia na qualidade da imagem?

Corrente Ensaio 1 Ensaio 2 Ensaio 3 Ensaio 4 Ensaio 5


50 mA 208,6 209,0 208,1 208,3 209,2
100 mA 202,1 197,9 200,4 200,7 203,0
67- Um professor está pensando em se candidatar a vereador de uma cidade da Grande
Florianópolis e quer saber se tem chances de ser eleito. Para isso contratou o Instituto de
Pesquisas Lopes Populix. A cidade tem 50.000 habitantes. Para uma margem de erro de
10% qual deve ser a quantidade de pessoas entrevistas para saber se votariam no
professor?

68- Em uma empresa com 5.000 funcionários, desejamos estimar o percentual de


pessoas que são favoráveis a um determinado treinamento. Qual deve ser o tamanho da
amostra para que o erro da pesquisa seja menor que 5%?

69- Se uma fábrica possui em seu quadro 2.000 mulheres e 500 homens, qual seria a
amostra de mulheres e de homens necessária para se fazer uma pesquisa de opinião sobre
a qualidade da creche? A margem de erro tolerável é de 10%.
ANEXO E – APLICAÇÕES DE ESTATÍSTICA EM TELECOMUNICAÇÕES
Apresentação do prof. Mário Noronha Neto
O ruído está sempre presente na área de telecomunicações. É uma fonte de impurezas que
temos que conviver. Parte é de natureza humana: uma rede lógica próxima de uma rede de
corrente está sujeita à interferência. No projeto temos que evitar essa situação dando o
espaçamento adequado. Há ainda o ruído natural, que independe da ação humana. Um dos mais
importantes é o ruído térmico, que é gerado por qualquer circuito eletrônico pela dissipação de
calor decorrente da passagem dos elétrons. Há diversas técnicas para se combater esse ruído
térmico tanto na forma analógica, quanto na digital.
Existe uma medida chamada SNR que é a relação sinal – ruído. Uma vez que o ruído é parte
do sistema de telecomunicações temos que saber modelá-lo e combatê-lo usando técnicas
apropriadas. Na Figura 1 apresentamos duas relações de sinal – ruído para a voz humana (sinal
de fala). No caso onde SNR = 0 há sinal de ruído interferindo no sinal transmitido. No segundo
caso, onde SNR = 30dB tem se uma relação sinal-ruído mais apropriada, pois a potência do
sinal se sobressaiu ao ruído (som transmitido de forma mais nítida). Uma potência de 3dB
significa que a potência do sinal é duas vezes a potência do ruído, pois a escala é logarítmica.
Quando temos SNR = 30 significa que a potência do sinal é 1.000 vezes a potência do ruído e
isso torna o sinal mais apropriado para ser transmitido em um sistema de telecomunicações. O
MatLAB é muito utilizado para simular relações de sinal – ruído.

Figura 1- Transmissão da voz humana – Fonte: notas de aula de Diego Medeiros

Na Figura 2 temos a representação da transmissão de fala por meio de um sinal digital, o sinal
de ruído é representado pelas linhas irregulares. A linha de forma regular é a representação do
sinal digital sem o ruído.
Figura 2- Modelagem do sinal com e sem ruído – Fonte: notas de aula de Diego Medeiros
Não é possível encontrar uma expressão matemática para se dizer como o sinal de ruído varia. O
ideal seria saber qual o sinal de ruído no instante t + 5. Mas isso não é possível. Somente sabemos
o valor do ruído no momento em que ele ocorre porque o ruído tem uma natureza aleatória. É
importante conseguirmos modelar de alguma maneira o ruído, porque se não tivéssemos nenhuma
informação sobre ele ficaria inviável saber em quanto temos que proporcionar uma relação sinal-
ruído para que o sinal se sobressaia.
A análise do ruído é modelada estatisticamente por uma distribuição de probabilidades, o que
possibilita a aferição de média, variância, desvio padrão e valor médio quadrático do ruído. Estas
são chamadas de medidas estatísticas de primeira e segunda ordem.
O ruído térmico é um dos elementos mais estudados na área de telecomunicações e pode ser
modelado por uma distribuição normal (gaussiana). O Teorema do Limite Central diz que se temos
um conjunto de variáveis aleatórias que tende ao infinito, a média das variáveis aleatórias tende a
uma distribuição normal. A integral da função de –infinito até +infinito tem valor unitário (1), que
é a área sob a curva da gaussiana.

Figura 3- Ilustração de uma curva normal de sinal de ruído.

O desvio padrão em telecomunicações se relaciona com a tensão e a variância se relaciona com a


potência. Se tivermos uma situação em que o ruído varia muito temos a situação descrita na curva
D, enquanto se o ruído varia pouco temos a situação descrita na curva C. A curva D tem o desvio
padrão maior que o desvio padrão da curva C. A chance em que o valor de tensão destoar da média
é maior no caso D.
Se imaginarmos que um sistema envia sinais binários (0,1) e que 0 represente transmissão de 5V
e 1 represente 10V. O sinal é transmitido por um sistema. O receptor tem que decidir se o bit
transmitido é 0 ou 1. A regra lógica utilizada é a análise da amplitude. Se for negativo ou menor
que zero, o bit é zero. Se a amplitude for maior que zero o bit é 1. Mas quando se tem ruído no
sistema, a amostra tem um valor de x adicionado. Nesse caso precisamos conhecer a distribuição
do ruído para saber quando o receptor vai errar ao considerar ao somar o ruído e o sinal recebido
ser interpretado de forma equivocada. Temos que saber qual a probabilidade de ocorrência de bits
de valores mais elevados. Para sinais de voz e fala é aceitável determinada probabilidade de erros,
mas na transmissão de dados bancários isso não é aceitável.

Figura 4- Ilustração de 4 curvas de ruído com diferentes médias e desvios padrões.

Figura 5- Modelagem da propagação de um sinal por multipercursos.

Figura 6- Intensidade do sinal recebido.


Figura 7- Distribuições de probabilidades utilizadas na área de telecomunicações.

ANEXO F – CONTROLE ESTATÍSTICO DO PROCESSO (CEP)

Potrebbero piacerti anche