Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
VIÇOSA - MG
22 de maio de 2019
LISTA DE FIGURAS
Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Figura 1 Gráfico de setores da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Figura 2 Gráfico de setores da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 3 Gráfico de setores da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 4 Gráfico de setores da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 5 Gráfico de setores da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 6 Gráfico de setores da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 32
Figura 7 Gráfico de setores da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 8 Gráfico de setores da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Figura 9 Gráfico de setores da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 10 Gráfico de barras da variável sexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 11 Gráfico de barras da variável fuma . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Figura 12 Gráfico de barras da variável trabalha . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Figura 13 Gráfico de barras da variável time . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 14 Gráfico de barras da variável curso . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 15 Gráfico de barras da variável nomofobia . . . . . . . . . . . . . . . . . . . . . . . . 39
Figura 16 Gráfico de barras da variável presença . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Figura 17 Gráfico de barras da variável voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 18 Gráfico de barras da variável tolerância . . . . . . . . . . . . . . . . . . . . . . . . . 42
Figura 19 Gráfico de barras da variável idade - valores absolutos . . . . . . . . . . . . . . . . . 44
Figura 20 Gráfico de barras da variável idade - valores percentuais . . . . . . . . . . . . . . . . 45
Figura 21 Gráfico de barras da variável horas de estudo - valores absolutos . . . . . . . . . . . 46
Figura 22 Gráfico de barras da variável horas de estudo - valores percentuais . . . . . . . . . . 46
Figura 23 Gráfico de barras da variável nota - valores absolutos . . . . . . . . . . . . . . . . . 47
Figura 24 Gráfico de barras da variável nota - valores percentuais . . . . . . . . . . . . . . . . 47
Figura 25 Gráfico de barras da variável período - valores absolutos . . . . . . . . . . . . . . . 48
Figura 26 Gráfico de barras da variável período - valores percentuais . . . . . . . . . . . . . . 49
Figura 27 Histograma para a variável altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Figura 28 Histograma para a variável peso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Figura 29 Histograma para a variável tempo de espera . . . . . . . . . . . . . . . . . . . . . . 56
Figura 30 Histograma para a variável tempo de sobrevivência . . . . . . . . . . . . . . . . . . 58
Figura 31 Histograma para a variável número de pessoas diabéticas, que necessitam do medi-
camento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Figura 1 Gráfico de dispersão de Idade versus Massa muscular . . . . . . . . . . . . . . . . . 101
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
Figura 1 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 239
Figura 2 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 240
Figura 3 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 243
Figura 4 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 244
Figura 5 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 246
Figura 6 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
Figura 7 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Figura 8 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 253
Figura 9 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
Figura 10 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
Figura 11 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 258
Figura 12 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
Figura 13 Região crítica do teste t, para uma média, unilateral à esquerda. . . . . . . . . . . . 263
Figura 14 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
Figura 15 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
Figura 16 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 270
Figura 17 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 272
Figura 18 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 273
Figura 19 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 276
Figura 20 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
Figura 21 Região crítica do teste t, para uma média, unilateral à direita. . . . . . . . . . . . . 280
Figura 22 Região crítica do teste t, para uma média, bilateral. . . . . . . . . . . . . . . . . . . 282
Figura 23 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 285
Figura 24 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
Figura 25 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 289
Figura 26 Região crítica do teste t, para duas médias, unilateral à esquerda. . . . . . . . . . . 291
Figura 27 Região crítica do teste t, para duas médias, unilateral à direita. . . . . . . . . . . . 294
Figura 28 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
Figura 29 Região crítica do teste Z, para uma média, unilateral à esquerda. . . . . . . . . . . 298
Figura 30 Região crítica para o teste. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
Figura 31 Região crítica do teste t, para duas médias, bilateral. . . . . . . . . . . . . . . . . . 303
Figura 32 Região crítica para o teste de χ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
LISTA DE TABELAS
Capítulo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Capítulo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Tabela 1 Exemplo de uma tabela de números aleatórios . . . . . . . . . . . . . . . . . . . . . 8
Capítulo III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Tabela 1 Distribuição de frequências da variável sexo . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 2 Distribuição de frequências da variável fuma . . . . . . . . . . . . . . . . . . . . . . 25
Tabela 3 Distribuição de frequências da variável trabalha . . . . . . . . . . . . . . . . . . . . 25
Tabela 4 Distribuição de frequências da variável time . . . . . . . . . . . . . . . . . . . . . . 26
Tabela 5 Distribuição de frequências da variável curso . . . . . . . . . . . . . . . . . . . . . . 27
Tabela 6 Distribuição de frequências da variável nomofobia . . . . . . . . . . . . . . . . . . . 28
Tabela 7 Distribuição de frequências da variável presença . . . . . . . . . . . . . . . . . . . . 28
Tabela 8 Distribuição de frequências da variável voto . . . . . . . . . . . . . . . . . . . . . . 28
Tabela 9 Distribuição de frequências da variável tolerância . . . . . . . . . . . . . . . . . . . 29
Tabela 10 Distribuição de frequências para a idade . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 11 Distribuição de frequências para horas de estudo . . . . . . . . . . . . . . . . . . . . 43
Tabela 12 Distribuição de frequências para a nota . . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 13 Distribuição de frequências para o período . . . . . . . . . . . . . . . . . . . . . . . 44
Tabela 14 Distribuição de frequências para a variável “altura” . . . . . . . . . . . . . . . . . . 50
Tabela 15 Distribuição de frequências para a variável “peso” . . . . . . . . . . . . . . . . . . . 53
Tabela 16 Distribuição de frequências para a variável “tempo de espera”. . . . . . . . . . . . . 56
Tabela 17 Distribuição de frequências para a variável “tempo de sobrevivência”. . . . . . . . . 58
Tabela 18 Distribuição de frequências para a variável “número de pessoas diabéticas, que
necessitam do medicamento”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Capítulo IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Capítulo V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
Capítulo VI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Capítulo VII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Capítulo VIII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
SUMÁRIO
CAPÍTULO I
Introdução à Estatística
CAPÍTULO II
Amostragem
8
1) Qual a principal diferença entre uma amostra probabilística e uma amostra não probabilística?
A amostragem probabilística é aquela em que cada elemento da população tem uma chance conhecida
e diferente de zero de ser selecionado para compor a amostra.
Amostragem não probabilística é aquela em que a seleção dos elementos da população para compor
a amostra depende ao menos em parte do julgamento do pesquisador ou do entrevistador no campo.
Dessa forma a principal diferença entre as duas amostragens é a forma de se compor a amostra,
ocorrendo algum mecanismo de sorteio na amostragem probabilística, enquanto que na amostragem
não probabilística isso não ocorre.
10
A amostragem aleatória simples é utilizada quando os elementos que compõem a população são
homogêneos. Nesse tipo de processo de amostragem, todos os elementos da população tem a mesma
probabilidade de serem amostrados e, sorteia-se um a um cada elemento a fim de se compor a amostra
aleatória.
A amostragem sistemática tem os mesmos pressupostos que a amostragem aleatória simples, mas
o modo de se obter a amostra é um processo mais rápido que aquele empregado na amostragem
aleatória simples.
a) Qual o tamanho amostral indicado para que os erros amostrais não ultrapassem 5%?
1 1
& ' & '
n0 = = = 400.
2
E0 (0, 05)2
Como N = 40, podemos corrigir, a expressão anterior:
N.n0 40 × 400
n= = = d36, 36e = 37.
N + n0 40 + 400
O tamanho amostral obtido é próximo, do tamanho da população. Isso se dá pelo fato de que o
tamanho da população é pequeno e também devido ao erro amostral admitido no estudo. Fixado um
erro amostral, quanto maior for o tamanho da população, mais distantes estarão o tamanho amostral
obtido e o tamanho da população; fixado o tamanho da população, quanto menor for o erro amostral,
mais próximos estarão o tamanho amostral obtido e o tamanho da população.
c) Qual o processo de amostragem indicado para selecionar uma amostra, a fim de estudar a média
salarial?
O processo de amostragem mais indicado seria o estratificado, pois na população em estudo percebe-
se, claramente, três subconjuntos (Senadores, Prefeitos e Vereadores) com características diferentes
entre os estratos, porém dentro de cada estrato há homogeneidade.
12
4) Uma empresa tem 3414 empregados distribuídos nos seguintes departamentos: Administração
(914), Transportes (348), Produção (1401) e Outros (751). Deseja-se extrair uma amostra entre
os empregados, para verificar o grau de satisfação, em relação à qualidade da comida servida no
refeitório. Admitindo-se um erro amostral de 6%, determine quantos empregados de cada estrato
deverão ser selecionados?
1 1
& ' & '
n0 = = = d277, 78e = 278.
2
E0 (0, 06)2
Esse seria o tamanho amostral indicado se não soubéssemos o tamanho da população e, admitindo-se
um erro de 6%. Como sabemos que o número total de estudantes é N = 3414, o tamanho amostral
é dado por:
N.n0 3414 × 278
n= = = 258
N + n0 3414 + 278
devemos assim tomar n = 258 empregados.
Temos h = 4 estratos, quais sejam, Administração, Transportes, Produção e Outros, sendo que os
tamanhos dos estratos são N1 = 914, N2 = 348, N3 = 1401 e N4 = 751, respectivamente. Além
disso, vimos que, o número total de empregados a serem amostrados é 258 e, o número de elementos
de cada estrato que devem ser selecionados é:
N1 914
n1 = ×n = × 258 = d69, 07e = 70,
N 3414
empregados;
N2 348
n2 = ×n = × 258 = d26, 3e = 27,
N 3414
empregados;
N3 1401
n3 = ×n = × 258 = d105, 88e = 106,
N 3414
empregados;
13
N4 751
n4 = ×n = × 258 = d56, 75e = 57,
N 3414
empregados.
Note que, nesse caso temos uma amostra de tamanho n = 70 + 27 + 106 + 57 = 260 e não 258, como
anteriormente pedia-se. Isso deve-se ao fato da impossibilidade de amostrar um número não inteiro
de elementos e, a fim de garantir o erro tolerável admitido, por vezes uma amostra um pouco maior
pode ser necessária.
14
E01 E02 E03 E04 E05 E06 E07 E08 E09 E10
E11 E12 E13 E14 E15 E16 E17 E18 E19 E20
E21 E22 E23 E24 E25 E26 E27 E28 E29 E30
Utilize a tabela de números aleatórios, iniciando na linha 04, coluna 05 e siga horizontalmente para
a esquerda. Ao chegar no início da linha vá para o final da linha de cima.
N 30
k= = = d3, 33e = 4.
n 9
Sabemos que k = 4, assim sendo, somente os k = 4 primeiros elementos da amostra serão considera-
dos, isto é,
Considerando-se a linha e a coluna indicadas (linha 04, coluna 05), selecionaremos primeiramente.
Os demais elementos serão obtidos somando-se o salto amostral da seguinte forma:
1◦ elemento 02
2◦ elemento 02 + 4 = 6
3◦ elemento 6 + 4 = 10
4◦ elemento 10 + 4 = 14
5◦ elemento 14 + 4 = 18
6◦ elemento 18 + 4 = 22
7◦ elemento 22 + 4 = 26
8◦ elemento 26 + 4 = 30
9◦ elemento 4
6) Uma empresa pública conta com 70 servidores. Uma pesquisa por amostragem precisa ser realizada,
sendo que, a princípio deseja-se 5% de erro.
1 1 1
& ' & ' & '
n0 = = = = 400,
2
E0 0, 052 0, 0025
n0 N 400 × 70 28000
logo n = = = = 60.
n0 + N 400 + 70 470
b) Devido à impossibilidade da realização de uma pesquisa desse tamanho, somente 25 serão pesqui-
sados, sendo assim, qual o novo erro da pesquisa?
n0 N n0 × 70
n= ⇒ 25 =
n0 + N n0 + 70
25 × (n0 + 70) = 70n0 ⇒ 70n0 − 25n0 = 1750
1750
45n0 = 1750 ⇒ n0 = = 38, 89.
45
Desse modo
1 1
n0 = 2
⇒ 2 = 38, 89
E0 E0
1
E02 = ⇒ E02 = 0, 0257
38, 89
√
E0 = 0, 0257 = 0, 1604.
16
S = {08, 13, 67, 68, 58, 14, 26, 69, 37, 43, 19, 01, 49, 64, 52, 40, 42, 23, 54, 32, 28, 16, 02, 07, 21} ,
e ordenando-os temos
S = {01, 02, 07, 08, 13, 14, 16, 19, 21, 23, 26, 28, 32, 37, 40, 42, 43, 49, 52, 54, 58, 64, 67, 68, 69} .
17
8) Uma empresa possui 35 empregados (listados abaixo) e, ao final do ano, devido ao bom desempenho
por parte dos funcionários, o proprietário resolveu presentear 5 deles com uma semana de folga em
um resort e tudo pago pela empresa. Como todos trabalharam arduamente durante o ano todo e,
para que não houvessem injustiças, ele resolveu utilizar a amostragem aleatória simples e uma tabela
de números aleatórios para realizar o sorteio.
Se ele utilizar a tabela de números aleatórios e, começar na terceira linha, segunda coluna, seguindo
verticalmente para baixo e, ao chegar ao final da coluna for para o início da próxima coluna, quais
serão os empregados sorteados?
e ordenando-os temos
S = {05, 06, 27, 31, 35} .
18
Universidade Alunos
UFV 55
UFLA 105
USP 155
UFMG 85
Deseja-se estudar a opinião dos alunos acerca do conteúdo de uma palestra, admitindo-se um erro
amostral de 10%. Assim sendo, responda às seguintes questões:
a) A amostragem estratificada é a indicada nesse caso. Justifique essa afirmação baseando-se nos
pré-requisitos para que ela seja utilizada.
A amostragem estratificada é a indicada nesse caso porque a população está dividida em estratos
(universidades), que são homogêneos internamente e, quando comparamos dois quaisquer eles são
heterogêneos.
Temos aqui h = 4 estratos, quais sejam, UFV, UFLA, USP e UFMG, sendo que os tamanhos dos
estratos são N1 = 55, N2 = 105, N3 = 155 e N4 = 85 respectivamente.
1 1
& ' & '
n0 = = = 100.
2
E0 (0, 1)2
Assim
N1 55
n1 = ×n = × 80 = 11.
N 400
N2 105
n2 = ×n = × 80 = 21.
N 400
19
N3 155
n3 = ×n = × 80 = 31.
N 400
N4 85
n4 = ×n = × 80 = 17.
N 400
20
10) A cárie é considerada uma doença comportamental que afeta principalmente crianças em idade
escolar. Uma cirurgiã-dentista, voluntária em um projeto social visitou algumas escolas em regiões
rurais para tentar estimar a prevalência desse mal e planejar ações futuras de tratamento. A amos-
tragem aleatória simples foi utilizada para selecionar n = 6 crianças em cada escola. A listagem a
seguir indica os nomes das N = 35 crianças de uma dessas escolas. Pede-se: Informe os seis nomes.
Ponto de partida: linha 03 e coluna 08 da tabela de números aleatórios. Direção: horizontal. Sentido:
esquerda para direita. Ao chegar ao final da linha volte ao início da linha anterior.
e ordenando-os temos
S = {02, 08, 16, 23, 28, 32} .
21
11) Em uma convenção partidária estão presentes 30000 filiados. Deseja-se realizar uma pesquisa de
aceitação de um certo candidato para as próximas eleições com 5% de erro tolerável. Dessa forma,
o tamanho da amostra deveria ser de 394,74 (ou seja, 395 pessoas), entretanto, somente 271 filiados
devolveram o questionário. Pergunta-se: Qual o novo erro tolerável da pesquisa?
30000 × n0
271 =
30000 + n0
29729n0 = 8130000
8130000
n0 = = 273, 47.
29729
1
Assim como n0 = , logo
(E0 )2
1 1
E0 = √ = √ = 0, 0605.
n0 273, 47
12) Uma metrópole possui 110 locais de venda de carne. Devido a uma nova lei de armazenamento,
um inspetor foi designado para verificar se as novas exigências estavam sendo cumpridas. No entanto,
por falta de tempo, o mesmo optou por inspecionar uma amostra composta por 35 locais. Dado que
o cumprimento da nova lei exige alguns investimentos, para não correr o risco de selecionar muitos
locais de maior rentabilidade e que possivelmente se adequariam à mudança, ele optou por uma
amostra estratificada, classificando cada local de acordo com o seu tamanho, da seguinte forma:
Hipermercado (6), Supermercado (14), Mercado (30), Açougues e Mercearias (60). Determine o
número de elementos que devem ser amostrados em cada estrato.
N1 6
n1 = ×n = × 35 = d1, 91e = 2;
N 110
N2 14
n2 = ×n = × 35 = d4, 45e = 5;
N 110
N3 30
n3 = ×n = × 35 = d9, 55e = 10;
N 110
N4 60
n4 = ×n = × 35 = d19, 09e = 20.
N 110
Note que queríamos 35 elementos, mas obtivemos um total de 37. Isso deve-se ao fato de garantirmos
que o erro amostral desejado seja alcançado.
n1 = 2 n2 = 4 n3 = 10 n4 = 19
CAPÍTULO III
Estatística descritiva
Tipo Variável
Sexo: “sexo”;
Fuma: “fuma”;
Trab: “trabalha”;
Time: “time para o qual torce”;
Qualitativa nominal
Curs: “curso no qual está matriculado”;
Nomo: “viciado em celular”;
Pres: “viria a aula se a presença não fosse obrigatória”;
Voto: “teria votado na última eleição se o voto não fosse obrigatório”;
Qualitativa ordinal Tole: “tolerância ao cigarro”;
Idad: “idade em anos”;
Estu: “número de horas semanais dedicadas a disciplina”;
Quantitativa discreta
Nota: “nota pretendida nessa disciplina”;
Peri: “período que está cursando esse semestre”;
Quantitativa contínua Altu: “altura”.
24
n = 30, n1 = 21, n2 = 9,
n1 21
f1 = = = 0, 7,
n 30
n2 9
f2 = = = 0, 3,
n 30
1
fac1 = fj = f1 = 0, 7,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 7 + 0, 3 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
1.
n = 30, n1 = 29, n2 = 1,
n1 29
f1 = = = 0, 9667,
n 30
n2 1
f2 = = = 0, 0333,
n 30
1
fac1 = fj = f1 = 0, 9667,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 9667 + 0, 0333 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
2.
Para a variável “trabalha”, temos que:
25
n1 20
f1 = = = 0, 6667,
n 30
n2 10
f2 = = = 0, 3333,
n 30
1
fac1 = fj = f1 = 0, 6667,
X
j=1
2
fac2 = fj = f1 + f2 = 0, 6667 + 0, 3333 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
3.
n = 30, n1 = 7, n2 = 1, n3 = 1, n4 = 8, n5 = 4, n6 = 1, n7 = 8,
7 1 1 8
f1 = = 0, 2333, f2 = = 0, 0333, f3 = = 0, 0333, f4 = = 0, 2667,
30 30 30 30
4 1 8
f5 = = 0, 1333, f6 = = 0, 0333, f7 = = 0, 2667,
30 30 30
26
1
fac1 = fj = 0, 2333,
X
j=1
2
fac2 = fj = 0, 2333 + 0, 0333 = 0, 2667,
X
j=1
3
fac3 = fj = 0, 2333 + 0, 0333 + 0, 0333 = 0, 3,
X
j=1
4
fac4 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 = 0, 5667,
X
j=1
5
fac5 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 = 0, 7,
X
j=1
6
fac6 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 = 0, 7333,
X
j=1
7
fac7 = fj = 0, 2333 + 0, 0333 + 0, 0333 + 0, 2667 + 0, 1333 + 0, 0333 + 0, 2667 = 1
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
4.
n = 30, n1 = 4, n2 = 5, n3 = 5, n4 = 15, n5 = 1,
4 5 5
f1 = = 0, 1333, f2 = = 0, 1667, f3 = = 0, 1667,
30 30 30
15 1
f4 = = 0, 5, f5 = = 0, 0333,
30 30
27
1
fac1 = fj = 0, 1333,
X
j=1
2
fac2 = fj = 0, 1333 + 0, 1667 = 0, 3,
X
j=1
3
fac3 = fj = 0, 1333 + 0, 1667 + 0, 1667 = 0, 4667,
X
j=1
4
fac4 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 = 0, 9667,
X
j=1
5
fac5 = fj = 0, 1333 + 0, 1667 + 0, 1667 + 0, 5 + 0, 0333 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
5.
n = 30, n1 = 23, n2 = 7,
23 7
f1 = = 0, 7667, f2 = = 0, 2333,
30 30
1
fac1 = fj = 0, 7667,
X
j=1
2
fac2 = fj = 0, 7667 + 0, 2333 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
6.
Para a variável “presença”, temos que:
1
fac1 = fj = 0, 0333,
X
j=1
2
fac2 = fj = 0, 0333 + 0, 9667 = 1,
X
j=1
28
n = 30, n1 = 1, n2 = 29,
1 29
f1 = = 0, 0333, f2 = = 0, 9667,
30 30
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
7.
11 19
f1 = = 0, 3667, f2 = = 0, 6333,
30 30
1
fac1 = fj = 0, 3667,
X
j=1
2
fac2 = fj = 0, 3667 + 0, 6333 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
8.
n = 30, n1 = 9, n2 = 7, n3 = 14,
29
9 7 14
f1 = = 0, 3, f2 = = 0, 2333, f3 = = 0, 4667,
30 30 30
1
fac1 = fj = 0, 3,
X
j=1
2
fac2 = fj = 0, 3 + 0, 2333 = 0, 5333,
X
j=1
3
fac3 = fj = 0, 3 + 0, 2333 + 0, 4667 = 1,
X
j=1
e, utilizando-se esses resultados obteremos a tabela de distribuição de frequências, dada pela Tabela
9.
b) O gráfico de setores;
Utilizando os resultados obtidos em a), para a variável sexo temos
21
g1 = 360◦ × f1 = 360◦ × = 252◦ ,
30
9
g2 = 360 × f2 = 360 ×
◦ ◦
= 108◦ ,
30
Masculino
30 %
Figura 1: Gráfico de setores da variável sexo
30
29
g1 = 360◦ × f1 = 360◦ × = 348◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30
NAO
96,67 %
SIM
3,33 %
20
g1 = 360◦ × f1 = 360◦ × = 240◦ ,
30
10
g2 = 360◦ × f2 = 360◦ × = 120◦ ,
30
SIM
33,33 %
Figura 3: Gráfico de setores da variável trabalha
31
7
g1 = 360◦ × f1 = 360◦ × = 84◦ ,
30
1
g2 = 360◦ × f2 = 360◦ × = 12◦ ,
30
1
g3 = 360◦ × f3 = 360◦ × = 12◦ ,
30
8
g4 = 360◦ × f4 = 360◦ × = 96◦ ,
30
4
g5 = 360◦ × f5 = 360◦ × = 48◦ ,
30
1
g6 = 360◦ × f6 = 360◦ × = 12◦ ,
30
8
g7 = 360◦ × f5 = 360◦ × = 96◦ ,
30
CORINTHIANS BOTAFOGO
3,33 % 3,33 %
ATLETICO
23,33 %
CRUZEIRO
26,67 %
FLAMENGO NENHUM
13,33 % 26,67 %
FLUMINENSE
3,33 %
4
g1 = 360◦ × f1 = 360◦ × = 48◦ ,
30
5
g2 = 360◦ × f2 = 360◦ × = 60◦ ,
30
5
g3 = 360◦ × f3 = 360◦ × = 60◦ ,
30
15
g4 = 360◦ × f4 = 360◦ × = 180◦ ,
30
1
g5 = 360◦ × f5 = 360◦ × = 12◦ ,
30
ECD
16,67 %
GEO
16,67 %
CIS
13,33 %
NUT
3,33 %
MVT
50 %
Figura 5: Gráfico de setores da variável curso
23
g1 = 360◦ × f1 = 360◦ × = 276◦ ,
30
7
g2 = 360◦ × f2 = 360◦ × = 84◦ ,
30
NAO
76,67 %
SIM
23,33 %
1
g1 = 360◦ × f1 = 360◦ × = 12◦ ,
30
29
g2 = 360◦ × f2 = 360◦ × = 348◦ ,
30
NAO
3,33 %
SIM
96,67 %
11
g1 = 360◦ × f1 = 360◦ × = 132◦ ,
30
19
g2 = 360 × f2 = 360 ×
◦ ◦
= 228◦ ,
30
NAO
36,67 %
SIM
63,33 %
9
g1 = 360◦ × f1 = 360◦ × = 108◦ ,
30
7
g2 = 360 × f2 = 360 ×
◦ ◦
= 84◦ ,
30
14
g3 = 360 × f3 = 360 ×
◦ ◦
= 168◦ ,
30
34
MUITO
46,67 %
Figura 9: Gráfico de setores da variável tolerância
c) O gráfico de barras.
Utilizando os resultados obtidos em a), para a variável sexo temos a Figura 10.
20
15
10
5
0
Feminino Masculino
Utilizando os resultados obtidos em a), para a variável fuma temos a Figura 11.
25
20
15
10
5
0
NAO SIM
Utilizando os resultados obtidos em a), para a variável trabalha temos a Figura 12.
20
15
10
5
0
NAO SIM
Utilizando os resultados obtidos em a), para a variável time temos a Figura 13.
8
6
4
2
0
Utilizando os resultados obtidos em a), para a variável curso temos a Figura 14.
14
12
10
8
6
4
2
0
Utilizando os resultados obtidos em a), para a variável nomofobia temos a Figura 15.
20
15
10
5
0
NAO SIM
25
20
15
10
5
0
NAO SIM
Utilizando os resultados obtidos em a), para a variável voto temos a Figura 17.
15
10
5
0
NAO SIM
Utilizando os resultados obtidos em a), para a variável tolerância temos a Figura 18.
14
12
10
8
6
4
2
0
b) O gráfico de barras.
Faremos agora o gráfico de barras para a variável idade, utilizando as frequências absolutas na
Tabela 10 que resultarão na Figura 19; posteriormente utilizaremos os resultados obtidos nessa
mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 20).
7
6
5
4
3
2
1
0
18 19 20 21 22 23 24 26 28 29
0,25
0,20
0,15
0,10
0,05
0,00
18 19 20 21 22 23 24 26 28 29
Faremos agora o gráfico de barras para a variável horas de estudo, utilizando as frequências
absolutas na Tabela 10 que resultarão na Figura 21; posteriormente utilizaremos os resultados
obtidos nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura
22).
46
10
8
6
4
2
0
1 2 3 4 5 6 10 30
1 2 3 4 5 6 10 30
Faremos agora o gráfico de barras para a variável nota, utilizando as frequências absolutas na
Tabela 12 que resultarão na Figura 23; posteriormente utilizaremos os resultados obtidos nessa
47
mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 24).
8
6
4
2
0
60 70 75 80 85 90 95
60 70 75 80 85 90 95
Faremos agora o gráfico de barras para a variável período, utilizando as frequências absolutas
na Tabela 13 que resultarão na Figura 25; posteriormente utilizaremos os resultados obtidos
nessa mesma tabela a fim de construirmos o gráfico com as frequências relativas (Figura 26).
15
10
5
0
3 5 7 9
0,6
0,5
0,4
0,3
0,2
0,1
0,0
3 5 7 9
i) Rol.
1,55 1,56 1,57 1,58 1,58 1,59 1,60 1,60 1,60 1,61
1,62 1,63 1,63 1,65 1,65 1,65 1,66 1,66 1,67 1,68
1,68 1,69 1,69 1,69 1,70 1,72 1,73 1,80 1,82 1,86
h√ i
k= 30 = [5, 48] .
Devemos tomar o inteiro mais próximo de 5,48, desse modo devemos ter k = 5 classes.
AT (X) 0, 31 0, 31
c= = = = 0, 08. (1)
k−1 5−1 4
50
c 0, 08
LI1 = Xmin − =3− = 3 − 0, 04 = 2, 96. (2)
2 2
Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é
feito somando-se o valor do comprimento das classess, assim:
LI1 = 1, 51;
O limite superior também é obtido somando-se c = 0, 08 ao limite inferior da última classe, isto
é,
LS = LI5 + c = 1, 83 + 0, 08 = 1, 91.
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de frequências, conforme a Tabela 14.
15
Frequencia absoluta
10
5
0
Altura
5) Como parte de um estudo para se definir um novo cardápio mais balanceado para a merenda escolar,
os alunos de uma escola de ensino médio foram pesados, registrando-se os pesos em quilogramas. Os
dados obtidos foram:
44,2 77,1 52,6 58,2 40,8 63,4 64,5 53,2 54,6 66,6 76,3 75,5
84,6 60,2 49,0 64,0 58,0 60,3 42,1 55,0 57,9 63,2 40,6 63,2
i) Rol.
√
k = [ 24] = [4, 9].
Devemos tomar o inteiro mais próximo de 4,9, desse modo devemos ter k = 5 classes.
AT (X) 44 44
c= = = = 11. (3)
k−1 5−1 4
c 11
LI1 = Xmin − = 40, 6 − = 40, 6 − 5, 5 = 35, 1. (4)
2 2
Entretanto, temos 5 classes e, portanto devemos encontrar os limites das outras classes. Isso é feito
53
LI1 = 35, 1;
O limite superior também é obtido somando-se c = 11 ao limite inferior da última classe, isto é,
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de frequências, conforme a Tabela 15.
14
12
10
Frequencia absoluta
8
6
4
2
0
Peso
i) Rol.
√
ii) Número de classes. Como temos 21 dados, então k = [ 21] = [4, 58]. Devemos tomar o
inteiro mais próximo de 4,58, desse modo devemos ter k = 5 classes.
c 22, 85
LI1 = Xmin − = 39, 78 − = 39, 78 − 11, 42 = 28, 36. (6)
2 2
LI1 = 28, 36
O limite superior também é obtido somando-se c = 22, 85 ao limite inferior da última classe,
isto é,
LS = LI5 + c = 119, 76 + 22, 85 = 142, 61.
56
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 16.
8
6
4
2
0
Tempo de espera
Figura 29: Histograma para a variável tempo de espera
57
7) Nas pesquisas da área de saúde é comum o interesse por estudar o tempo até a ocorrência de
um determinado evento, em geral, o tempo até o falecimento ou o óbito de um paciente, devido a
uma determinada doença. Os dados a seguir (já em rol) apresentam informações sobre o tempo de
sobrevivência (em meses) de 20 pacientes com linfoma de Hodgkin, um tipo de câncer que afeta os
gânglios linfáticos, tendo como sintomas principais a febre, sudorese noturna, perda de peso, coceira,
cansaço e perca de apetite.
2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45
a) Agrupe os dados em uma tabela de classes de frequências (Tabela que é utilizada para fazer o
histograma);
i) Rol.
2 4 6 7 7 13 14 18 20 25 25 27 29 30 32 33 35 41 43 45
√
ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.
AT (X) 43 43
c= = = = 14, 33. (7)
k−1 4−1 3
c 14, 33
LI1 = Xmin − =2− = 2 − 7, 17 = −5, 17. (8)
2 2
LI1 = −5, 17
O limite superior também é obtido somando-se c = 14, 33 ao limite inferior da última classe, isto
58
é,
LS = LI4 + c = 37, 82 + 14, 33 = 52, 15.
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 17.
6
4
2
0
Tempo de sobrevivência
Figura 30: Histograma para a variável tempo de sobrevivência
59
8) O Diabetes é uma doença crônica na qual o organismo não produz insulina suficiente, o que eleva os
níveis de glicose no sangue e causa o quadro de hiperglicemia. Adicionalmente, se não for devidamente
controlado, o Diabetes pode prejudicar o funcionamento de órgãos como rins, olhos e até mesmo o
coração. Os dados a seguir (já em rol) indicam o número de pessoas diabéticas em 20 hospitais, que
necessitam de um medicamento específico (insulina) para o controle dessa doença.
7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12
i) Rol.
7 8 8 9 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 12
√
ii) Número de classes. Como temos 20 dados, então k = [ 20] = [4, 47]. Devemos tomar o inteiro
mais próximo de 4,47, desse modo devemos ter k = 4 classes.
AT (X) 5 5
c= = = = 1, 67. (9)
k−1 4−1 3
c 1, 67
LI1 = Xmin − =7− = 7 − 0, 83 = 6, 17. (10)
2 2
LI1 = 6, 17
LI2 = LI1 + c = 6, 17 + 1, 67 = 7, 84
LI3 = LI2 + c = 7, 84 + 1, 67 = 9, 51
O limite superior também é obtido somando-se c = 1, 67 ao limite inferior da última classe, isto
é,
LS = LI4 + c = 11, 18 + 1, 67 = 12, 85.
60
v) Com esses resultados obtemos os limites das classes e podemos construir a tabela de distribuição
de probabilidades, conforme a Tabela 18.
Tabela 18: Distribuição de frequências para a variável “número de pessoas diabéticas, que necessitam
do medicamento”.
Número de pessoas diabéticas, que necessitam do medicamento ni fi fac
6, 17 ` 7, 84 1 0,05 0,05
7, 84 ` 9, 51 7 0,35 0,4
9, 51 ` 11, 18 11 0,55 0,95
11, 18 ` 12, 85 1 0,05 1
Total 20 1
8
6
4
2
0
CAPÍTULO IV
Medidas resumo
1) João e Izabel decidiram verificar o consumo de energia elétrica (Kw/h) em sua residência. As
observações de doze meses são apresentadas a seguir.
605; 637; 305; 448; 448; 457; 534; 544; 544; 544; 544; 545
a) Determine a moda do consumo de energia elétrica nessa amostra.
Como nX = 12 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, a mediana 544
é o elemento que ocupa a posição central, sendo pelo menos 50% das observações da amostra valores
iguais ou superiores e, pelo menos 50% das observações da amostra valores iguais ou inferiores a ela.
Temos que
Assim
v
u n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 3241001 − (6155)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 12
t
n−1 12 − 1
s
83998, 9167 √
= = 7636, 2652 = 87, 3857.
11
62
Xi Xi2
605 366025
637 405769
305 93025
448 200704
448 200704
457 208849
534 285156
544 295936
544 295936
544 295936
544 295936
545 297025
12 12
Xi = 6155 Xi2 = 3241001
P P
i=1 i=1
27 27
Xi = 866, 8005, Xi2 = 29434, 1497.
X X
i=1 i=1
Temos que
27
P
Xi
866, 8005
X̄ = i=1
= = 32, 1037.
27 27
v
u n 2
u P
u
uP n
Xi
i=1
v
u X2 − u 29434, 1497 − (866,8005)2
u
t i=1 i n
q u
S (X) = S 2 (X) = = 27
t
n−1 27 − 1
s
1606, 626 √
= = 61, 7933 = 7, 8609.
26
63
3) Érica realizou a descrição estatística do comprimento (em mm) e a biomassa (em mg) em sementes
de pinhão manso (Jatropha curcas L.) (dados fictícios). Após os cálculo obteve:
Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (X)% = 5, 65% < 8, 821% = CV (Y )%
temos que o comprimento é mais homogêneo que a biomassa para as sementes de pinhão manso.
64
Após ser vendida, o novo proprietário determinou que as especificações agora não seriam mais as
mesmas, ao invés disto a correção Y = 0, 9X + 4 deveria ser efetuada.
a) Determine a massa média e a variância com que a fábrica opera após ser efetuada a correção.
Ȳ = 0, 9X̄ + 4 = 0, 9 · 50 + 4 = 49.
S(X) 2
CV (X)% = × 100% = × 100% = 4%,
X̄ 50
e,
√
S(Y ) 3, 24 1, 8
CV (Y )% = × 100% = × 100% = × 100% = 3, 67%.
Ȳ 49 49
Sabemos que a amostra mais homogênea é aquela que apresenta menor coeficiente de variação e,
como
CV (Y )% = 3, 6735% < 4% = CV (X)%
temos que a produção da fábrica tornou-se mais homogênea após a correção efetuada.
65
5) Em duas turmas de EST 103, X e Y , os alunos que realizaram as provas obtiveram as seguintes
notas:
Como nX = 15 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
elemento que ocupa a posição , isto é:
2
Como nY = 16 é par quando os dados estão organizados em rol, a mediana é dada pela média
n n
dos elementos que ocupam as posições e + 1 , isto é:
2 2
As moda são Mo1 (X) = 9, Mo2 (X) = 7, e Mo3 (X) = 6, 5, sendo o conjunto multimodal.
n
P
Xi
2 + 3 + · · · + 10 97, 5
X̄ = i=1
= = = 6, 5,
n 15 15
n
P
Yi
2, 5 + 3, 5 + · · · + 10 104
Ȳ = i=1
= = = 6, 5.
n 16 16
v
u 717, 25 − (97,5)2
u s
q 83, 5 √
S (X) = S 2 (X) = 15
= = 5, 9643 = 2, 4422,
t
15 − 1 14
v
u 755, 5 − (104)2
u s
q 79, 5 √
S (Y ) = S 2 (Y ) = 16
= = 5, 3 = 2, 3022,
t
16 − 1 15
66
S(X) 2, 4422
CV (X)% = × 100% = × 100% = 37, 57%,
X̄ 6, 5
e,
S(Y ) 2, 3022
CV (Y )% = × 100% = × 100% = 35, 42%.
Ȳ 6, 5
Como 35, 42% = CV (Y )% < CV (X)% = 37, 57% temos que a turma Y é mais homogênea que
a turma X.
67
(F) Parte da estatística que visa somente resumir, descrever e apresentar os dados, sem inferir.
(A) Pelo menos metade dos valores são maiores ou iguais e também pelo menos metade são menores
ou iguais a esse valor.
(E) É uma medida que descreve certa característica dos elementos da população.
(B) Método científico para planejar, coletar, organizar, resumir, apresentar e analisar dados. Tam-
bém inclui princípios e definições para validar resultados das análises e permitir conclusões
válidas.
(D) Variável cujos valores são numéricos, podendo ser obtidos por meio de uma contagem ou men-
suração.
(H) Conjunto de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das
informações e conclusões obtidas a partir da amostra.
68
7) Assinale (V) se a afirmativa for totalmente verdadeira, caso contrário assinale (F).
3
X
Xi
11
X̄ = i=1
= = 3, 6667.
3 3
Como nX = 3 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
elemento que ocupa a posição , isto é:
2
3
X
Xi
19
X̄ = i=1
= = 6, 3333.
3 3
Como nX = 3 é ímpar quando os dados estão organizados em rol, a mediana é dada pelo
n+1
elemento que ocupa a posição , isto é:
2
Por exemplo, considere o conjunto X = {0; 1; 9; 10; 10}. A moda é Mo1 (X) = 10, sendo o
conjunto unimodal. Como nX = 5 é ímpar quando os dados estão organizados em rol, a
n+1
mediana é dada pelo elemento que ocupa a posição , isto é:
2
(V) A variância amostral mede a dispersão em torno da média aritmética e resulta sempre em um
valor não negativo.
69
(F) Em uma amostra com n observações, tem-se pelo menos n/2 observações maiores e também
pelo menos n/2 observações menores que o valor mediano.
(F) As amostras X = {15; 13; 10; 7; 4} e Y = {105; 103; 100; 97; 94} possuem variâncias iguais, porém
os não possuem igual homogeneidade ou dispersão relativa, pois os coeficientes de variação são
diferentes.
n
P
Xi
15 + 13 + · · · + 4 49
X̄ = i=1
= = = 9, 8,
n 5 5
n
P
Yi
105 + 103 + · · · + 94 499
Ȳ = i=1
= = = 99, 8.
n 5 5
v
u 559 − (49)2
u s
q 78, 8 √
S (X) = S 2 (X) = 5
= = 19, 7 = 4, 4385,
t
5−1 4
v
u 49879 − (499)2
u s
q 78, 8 √
S (Y ) = S 2 (Y ) = 5
= = 19, 7 = 4, 4385,
t
5−1 4
S(X) 4, 4385
CV (X)% = × 100% = × 100% = 45, 29%,
X̄ 9, 8
e,
S(Y ) 4, 4385
CV (Y )% = × 100% = × 100% = 4, 45%.
Ȳ 99, 8
Como 4, 45% = CV (Y )% < CV (X)% = 45, 29% temos que a turma Y é mais homogênea que
a turma X.
70
8) A tabela a seguir apresenta os tempos de duração de chamadas telefônicas (em minutos), obtidos
em uma amostra de oito telefonemas.
Telefonema 1 2 3 4 5 6 7 8
Tempo (min.) 1 3 6 15 8 1 4 2
Calcule e interprete:
a) O tempo médio.
Temos que
n
P
Xi
1 + 3 + ··· + 2 40
X̄ = i=1
= = = 5,
n 8 8
sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.
b) O tempo mediano.
Como nX = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das ligações telefônicas com
duração igual ou superior e, pelo menos 50% das ligações telefônicas com duração menor ou inferior
a ele.
c) O tempo modal.
A moda é Mo1 (X) = 1, sendo o conjunto unimodal. Dessa forma essa é a duração telefônica que
ocorre com maior frequência.
71
Frequência 3 2 1 4
Valor 2 3 5 1
Determine:
a) O valor médio.
k
P
ni Xi
3×2+2×3+1×5+4×1
X̄ = i=1
=
k
P 3+2+1+4
ni
i=1
21
= = 2, 1. (1)
10
b) O valor mediano.
Como nX = 10 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
c) O valor modal.
10) Sejam X = {1; 5; 12; −3; 5; 7; 8; −5; 6}, Y = X + 20, Z = 20X e W = 8X − 30. Determine:
a) A média de X;
n
P
Xi
1 + 5 + ··· + 6 36
X̄ = i=1
= = = 4.
n 9 9
b) A variância de X;
2
378 − (36) 234
S (X) =
2 9
= = 29, 25.
9−1 8
c) O coeficiente de variação de X;
q √
S (X) = S 2 (X) = 29, 25 = 5, 4083,
S(X) 5, 4083
CV (X)% = × 100% = × 100% = 135, 21%.
X̄ 4
d) A média de Y ;
n
P
Yi
21 + 25 + · · · + 26 216
Ȳ = i=1
= = = 24,
n 9 9
ou
Ȳ = X̄ + 20 = 4 + 20 = 24.
e) A variância de Y ;
2
5418 − (216) 234
S (Y ) =
2 9
= = 29, 25,
9−1 8
ou
S 2 (Y ) = S 2 (X + 20) = S 2 (X) = 29, 25.
f) O coeficiente de variação de Y ;
73
√q
S (Y ) =S 2 (Y ) = 29, 25 = 5, 4083
S(Y ) 5, 4083
CV (Y )% = × 100% = × 100% = 22, 53%.
Ȳ 24
g) O coeficiente de variação de Z;
n
P
Zi
20 + 100 + · · · + 120 720
Z̄ = i=1
= = = 80,
n 9 9
ou
Z̄ = X̄ = 20 · 4 = 80,
2
151200 − (720) 93600
S (Z) =
2 9
= = 11700,
9−1 8
ou
S 2 (Z) = S 2 (20X) = 202 S 2 (X) = 400 · 29, 25 = 11700.
√q
S (Z) =S 2 (Z) = 11700 = 108, 1665
S(Z) 108, 1665
CV (Z)% = × 100% = × 100% = 135, 21%.
Z̄ 80
h) O coeficiente de variação de W .
n
P
Wi
−22 + 10 + · · · + 18 18
W̄ = i=1
= = = 2,
n 9 9
ou
W̄ = 8X̄ − 30 = 8 · 4 − 30 = 32 − 30 = 2.
2
15012 − (18) 14976
S (W ) =
2 9
= = 1872,
9−1 8
ou
S 2 (W ) = S 2 (8X − 30) = 82 S 2 (X) = 64 · 29, 25 = 1872.
74
q √
S (W ) = S 2 (W ) = 1872 = 43, 2666
S(W ) 43, 2666
CV (W )% = × 100% = × 100% = 2163, 33%.
W̄ 2
75
11) Na tabela a seguir são informadas as notas de uma amostra de 18 alunos. Calcule as medidas de
posição e dispersão abordadas e interprete o significado do valor encontrado.
Nota 59 60 61 64 65 67 68 72 73 91 99 100
Nº de alunos 1 1 1 1 3 1 2 1 2 3 1 1
Temos que
k
P
ni Xi
1 × 59 + 1 × 60 + · · · + 1 × 100 1332
X̄ = i=1
= = = 74,
k
P 1 + 1 + ··· + 1 18
ni
i=1
sendo esse um valor central, em torno do qual a duração média das chamadas tendem a se concentrar.
Como nX = 18 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
Para o conjunto de valores colocados em ordem crescente ou decrescente de grandeza, o valor mediano
obtido é o elemento que ocupa a posição central, sendo pelo menos 50% das notas são iguais ou
superiores e, pelo menos 50% das notas são menores ou inferiores a ele.
As modas são Mo1 (X) = 65 e Mo2 (X) = 91, sendo o conjunto bimodal. Dessa forma essas são as
notas que ocorrem com maior frequência.
A amplitude total é,
AT (X) = Xmáx − Xmin = 100 − 59 = 41,
e, dessa forma, a diferença entre duas observações quaisquer é, no máximo, igual a 41.
S (X) =
2 i=1
= 18
k 18 − 1
fi − 1
P
i=1
3228
= = 189, 8824,
17
q √
S (X) = S 2 (X) = 189, 8824 = 13, 7798,
sendo o desvio padrão uma medida de dispersão dos valores em torno da média.
O coeficiente de variação é
sendo a dispersão relativa, que é a razão entre a dispersão absoluta e a média. Ele mede a homoge-
neidade de um conjunto de valores e, geralmente é utilizado quando se tem interesse em comparar
variabilidades de diferentes conjuntos de valores.
77
12) O professor de EST 103 divulgou, para as três turmas da disciplina, os resultados ao final do
semestre, os quais são apresentados abaixo. Determine a média geral de todos os alunos da disciplina.
T1 T2 T3
ni 58 58 48
X̄i 76 74 64
Si (X) 2,56 3,23 4,23
Temos que
n1
P n1
P
X1i X1i n1
• X̄1 = i=1
, logo 76 = i=1
, donde X1i = 76 · 58 = 4408;
P
n1 58
i=1
n2
P n2
P
X2i X2i n2
• X̄2 = i=1
, logo 74 = i=1
, donde X2i = 74 · 58 = 4292;
P
n2 58
i=1
n3
P n3
P
X3 i X3i n3
• X̄3 = i=1
, logo 64 = i=1
, donde X3i = 64 · 48 = 3072;
P
n3 48
i=1
n n1 n2 n3
Xi = X1i + X2i +
X X X X
X3i
i=1 i=1 i=1 i=1
= 4408 + 4292 + 3072 = 11772
além disso,
n = n1 + n2 + n3 = 58 + 58 + 48 = 164,
logo
n
P 27
P
Xi Xi
11772
X̄ = i=1
= i=1
= = 71, 78.
n 27 164
78
13) Em uma empresa, cada trabalhador recebia um salário X, sendo que o salário médio dos trabalha-
dores da empresa era R$ 1800, com desvio padrão de R$ 400. A nova diretoria da empresa resolveu
que, como estímulo aos trabalhadores, promoveria um aumento de 20% a todos os trabalhadores da
empresa, além disto, uma bonificação de R$ 300 seria instituída. Dessa forma, o salário de cada
trabalhador passa a ser Yi = 1, 2Xi + 300. Pergunta-se:
Temos que Yi = 1, 2Xi + 300 e queremos determinar Ȳ . Pelas propriedades da média, temos:
• ao somarmos uma constante a cada um dos valores da variável aleatória, a média final ficará
somada dessa constante;
• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a média final
ficará multiplicada dessa constante.
Logo
= 2460.
Dessa forma, o salário médio após a nova diretoria ter assumido é de R$ 2460.
b) Os salários eram mais homogêneos antes ou após a nova diretoria ter assumido? justifique sua
resposta.
Temos que S 2 (X) = (400)2 = 160000 e Yi = 1, 2Xi + 300. Pelas propriedades da variância, temos:
• ao somarmos uma constante a cada um dos valores da variável aleatória, a variância final não se
altera;
• ao multiplicarmos cada um dos valores da variável aleatória por uma constante, a variância final
ficará multiplicada pelo quadrado dessa constante.
Assim
q √
Assim S(X) = S 2 (Y ) = 230400 = 480.
Para determinarmos o conjunto mais homogêneo, encontraremos CV (X)% e CV (Y )%, para que
possamos compará-los e, o menor coeficiente de variação estará ligado ao conjunto mais homogêneo.
79
S(X) 400
CV (X)% = × 100% = × 100% = 22, 22%,
X̄ 1800
e,
S(Y ) 480
CV (Y )% = × 100% = × 100% = 19, 51%.
Ȳ 2460
Como 19, 51% = CV (Y )% < CV (X)% = 22, 22% temos que a os salários após a nova diretoria ter
assumido (Y ) são mais homogêneos que antes dela (X).
80
14) Foram feitas 24 determinações para se avaliar a temperatura (em grau Celsius) em um certo
ambiente. Os resultados foram os seguintes:
22,0 22,9 23,3 23,6 23,9 24,0 24,1 24,2 24,5 25,2 26,0 26,8
22,6 23,0 23,4 23,6 24,0 24,0 24,2 24,3 24,8 25,2 26,0 27,0
Determine:
a) A temperatura média;
n
P
Xi
22 + 22, 9 + · · · + 27 582, 6
X̄ = i=1
= = = 24, 275.
n 24 24
b) A temperatura mediana;
Primeiramente devemos colocar os dados em rol, o qual é
22,00 22,60 22,90 23,00 23,30 23,40 23,60 23,60 23,90 24,00 24,00 24,00
24,10 24,20 24,20 24,30 24,50 24,80 25,20 25,20 26,00 26,00 26,80 27,00
Como nX = 24 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
d) A variância;
2
14178, 94 − (582,6) 36, 325
S (X) =
2 24
= = 1, 5793.
24 − 1 23
e) O desvio padrão;
q √
S (X) = S 2 (X) = 1, 5793 = 1, 2567.
f) O coeficiente de variação;
S(X) 1, 2567
CV (X)% = × 100% = × 100% = 5, 18%.
X̄ 24, 275
81
S (X) 1, 2567
S X̄ = √ = √ = 0, 2565.
n 24
82
15) Sejam X = {10; 14; 11; −3; 15; 0; 16; −1; 12; 16}, Y = 9X − 2 e W = −3X + 100. Determine:
a) A média de X;
n
P
Xi
10 + 14 + · · · + 16
X̄ = i=1
=
n 10
90
= = 9.
10
b) A variância de X;
Temos que
Xi Xi2
10 100
14 196
.. ..
. .
16 256
n n
Xi = 90 Xi2 = 1308
P P
i=1 i=1
logo
n 2
P
n
Xi
i=1
Xi2 −
P 2
n 1308 − (90)
S (X) =
2 i=1
= 10
n−1 10 − 1
498
= = 55, 33.
9
c) O coeficiente de variação de Y ;
Temos Y = 9X − 2,
Ȳ = 9X̄ − 2 = 9 × 9 − 2 = 79
S(Y ) 66, 95
CV (Y )% = × 100% = × 100% = 84, 74%.
Ȳ 79
d) O coeficiente de variação de W .
83
S(W ) 22, 32
CV (W )% = × 100% = × 100% = 30, 57%.
W̄ 73
Como 30, 57% = CV (W )% < CV (Y )% = 84, 74% temos que o conjunto W é mais homogêneo que
o conjunto Y .
84
16) Uma reportagem exibida revelou que no dia 18/07/2016 o estado de Santa Catarina (SC) foi o mais
castigados pelo frio rigoroso do inverno, apresentando registros de temperaturas negativas e geadas
em diversas cidades. Mais especificamente, na cidade de Urupema foi registrada uma temperatura
de −7, 1 °C e em São Joaquim de −4 °C. No entanto, para apresentar informações mais precisas
sobre o clima dessas duas cidades, um estudo mais completo seria necessário e uma análise descritiva
foi recomendada. A Tabela a seguir apresenta valores de temperatura dessas duas cidades, em um
determinado ano.
Cidades Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Urupema 15 12 8 7 6 -7 -9 -8 3 5 6 10
São Joaquim 17 14 10 7 9 -4 -5 -2 2 9 9 —
a) Baseado no valor médio da amostra, qual cidade pode ser considerada a mais fria?
n
P
Xi
15 + 12 + · · · + 10 48
X̄U = i=1
= = = 4,
n 12 12
n
P
Yi
17 + 14 + · · · + 9 66
ȲS = i=1
= = = 6,
n 11 11
v
u 882 − (48)2
u s
q 690 √
S (X) = S 2 (X) = 12
= = 62, 7273 = 7, 9201,
t
12 − 1 11
85
v
u 926 − (66)2
u s
q 530 √
S (Y ) = S 2 (Y ) = 11
= = 53 = 7, 2801,
t
11 − 1 10
S(X) 7, 9201
CV (X) % = × 100% = × 100% = 198%,
X̄ 4
e,
S(Y ) 7, 2801
CV (Y ) % = × 100% = × 100% = 121, 34%.
Ȳ 6
Como 121, 33% = CV (Y )% < CV (X)% = 198% temos que as temperaturas da cidade Y (São
Joaquim) é mais homogênea que as temperaturas da cidade X (Urupema).
17) Suponha que um geógrafo esteja interessado em comparar a quantidade de partículas suspensas
no ar em duas cidades distintas. Para tal, ele coletou dados de 10 PM (partículas de 10 micrômetros
ou menores) durante oito dias na cidade A e, devido a um problema com seu equipamento, durante
apenas 7 dias na cidade B. A Tabela a seguir apresenta os resultados.
Cidade A 22 26 27 35 38 40 52 52
Cidade B 34 41 45 49 52 56 59 —
Pede-se:
n
P
Xi
22 + 26 + · · · + 52 292
X̄ = i=1
= = = 36, 5,
n 8 8
n
P
Yi
34 + 41 + · · · + 59 336
Ȳ = i=1
= = = 48.
n 7 7
Como nX = 8 é ímpar, quando os dados estão organizados, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
v
u 11566 − (292)2
u s
q 908 √
S (X) = S 2 (X) = 8
= = 129, 7143 = 11, 3892,
t
8−1 7
v
u 16584 − (336)2
u s
q 456 √
S (Y ) = S 2 (Y ) = 7
= = 76 = 8, 7178,
t
7−1 6
87
e,
S(Y ) 8, 7178
CV (Y )% = × 100% = × 100% = 18, 16%.
Ȳ 48
Como 18, 16% = CV (Y )% < CV (X)% = 31, 2% temos que a quantidade de partículas suspensas no
ar da cidade B é mais homogênea que a quantidade de partículas suspensas da cidade A.
88
18) A depressão ocupa uma posição de destaque entre os problemas de saúde pública, sendo consi-
derada como a principal causa de incapacidade e suicídio. A OMS estima que anualmente cerca de
850.000 novas pessoas apresentem sintomas depressivos, o que evidencia o quão sério é esse trans-
torno. Um grupo de psicólogos avaliou o nível de depressão em jovens (com idade entre 15 e 30 anos)
e adultos (com idade entre 46 e 60 anos) de uma determinada localidade. Os valores informados na
tabela a seguir representam scores, interpretados da seguinte forma: valores entre 0 e 9 indicam que
a pessoa não tem depressão, entre 10 e 18 depressão leve, entre 19 e 29 depressão moderada e entre
30 e 63 depressão severa. Essa é a escala de depressão de Beck e os scores são originados a partir de
um questionário com 21 itens de múltipla escolha. Pede-se:
Jovens 42 14 56 23 12 11 49 10
Adultos 17 3 7 21 12 10 2 24
a) Calcule a média dos dois grupos. Baseado nesse resultado, em qual grupo a depressão parece ser
mais perigosa?
n
P
Xi
42 + 14 + · · · + 10 217
X̄ = i=1
= = = 27, 125,
n 8 8
n
P
Yi
17 + 3 + · · · + 24 96
Ȳ = i=1
= = = 12.
n 8 8
Como o nível de depressão médio é maior para os jovens com X̄ = 27, 125, enquanto que nos adultos
o nível de depressão médio é Ȳ = 12, a depressão parece ser mais perigosa no grupo de jovens.
10 11 12 14 23 42 49 56
Como nX = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
2 3 7 10 12 17 21 24
89
Como nY = 8 é par quando os dados estão organizados em rol, a mediana é dada pela média dos
n n
elementos que ocupam as posições e + 1 , isto é:
2 2
v
u 8391 − (217)2
u s
q 2504, 875 √
S (X) = S 2 (X) = 8
= = 357, 8393 = 18, 9166,
t
8−1 7
v
u 1612 − (96)2
u s
q 460 √
S (Y ) = S 2 (Y ) = 8
= = 65, 7143 = 8, 1064,
t
8−1 7
e,
S(Y ) 8, 1064
CV (Y )% = × 100% = × 100% = 67, 55%.
Ȳ 12
Como 67, 55% = CV (Y )% < CV (X)% = 69, 74% temos que o nível de depressão Y é mais homo-
gênea que o nível de depressão X, assim o nível de depressão é mais homogêneo entre os adultos do
que entre os jovens.
S (Y ) 8, 1064
S Ȳ = √ = √ = 2, 866.
n 8
90
19) Em uma turma de EST 103, as notas obtidas ao final do semestre foram:
Nota 75 97 69 60 40 23
Número de alunos 8 13 11 4 11 13
a) Determine a(s) nota(s) modal(is).
As modas são Mo1 (X) = 97 e Mo2 (X) = 23, sendo o conjunto bimodal.
O rol é dado por Como nX = 60 é par quando os dados estão organizados em rol, a mediana é dada
n n
pela média dos elementos que ocupam as posições e + 1 , isto é:
2 2
Temos que
6
P
ni Xi
8 × 75 + 13 × 97 + · · · + 13 × 23 3599
X̄ = i=1
= = = 59, 9833,
6
P 8 + 13 + · · · + 13 60
ni
i=1
d) Determine a variância.
Xi ni ni Xi ni Xi2
75 8 600 45000
97 13 1261 122317
69 11 759 52371
60 4 240 14400
40 11 440 17600
23 13 299 6877
6 6 6
ni = 60 ni Xi = 3599 ni Xi2 = 258565
P P P
i=1 i=1 i=1
91
6 2
P
6
ni Xi
i=1
ni Xi2 −
P
6
i=1 P
ni 2
258565 − (3599)
S (X) =
2 i=1
= 60
6 60 − 1
ni − 1
P
i=1
42684, 9833
= = 723, 4743,
59
q √
S (X) = S 2 (X) = 723, 4743 = 26, 8975,
CAPÍTULO V
1) Os dados a seguir provêm de um experimento para testar o desempenho de uma máquina industrial.
O experimento utilizou uma mistura de óleo diesel e gás, derivados de materiais destilados orgânicos.
O valor da capacidade da máquina (Y ) em cavalo vapor (HP) foi coletado a diversas velocidades (X)
medidas em rotações por minuto (rpm × 100).
X Y X Y X Y X Y
22,0 64,03 15,0 46,85 18,0 52,90 15,0 45,79
20,0 62,47 17,0 51,17 16,0 48,84 17,0 51,17
18,0 54,94 19,0 58,00 14,0 42,74 19,0 56,65
16,0 48,84 21,0 63,21 12,0 36,63 21,0 62,61
14,0 43,73 22,0 64,03 10,5 32,05 23,0 65,31
12,0 37,48 20,0 62,63 13,0 39,68 24,0 63,89
Yi = β0 + β1 Xi + i , pede-se:
SQRegressão 2294, 81
r2 (%) = × 100% = × 100%
SQTotal 2370, 9
= 96, 79%.
βb1 = 2, 6505 é o aumento médio estimado, em cavalo vapor (HP), da capacidade da máquina a cada
aumento da velocidade em 100rpm.
Para X = 15, 5 ⇒ Yb =?
Yb = 6, 1002 + 2, 6505 × 15, 5 = 47, 183.
94
Ybi = 9, 8 − 1, 7Xi
e, que são válidas as pressuposições usuais acerca dos erros. Ela tomou uma amostra de 15 supervi-
soras, com tempo experiência no cargo variando de zero a 5 anos, e ajustou a equação de regressão
linear com r = −0, 875. Complete corretamente as afirmações abaixo.
a) A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para uma super-
visora com 3 anos de experiência é de minutos.
Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,
dessa forma “A estimativa do tempo gasto na execução dessa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência é de 4,7 minutos.”
c) A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem experiência no
cargo (com 0 anos) é de minutos.
Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,
dessa forma “A estimativa do tempo gasto na execução dessa tarefa, para uma supervisora sem
experiência no cargo (com 0 anos) é de 9,8 minutos.”.
d) A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .
dessa forma, “A proporção da variação do tempo gasto na execução dessa tarefa relacionada com o
cargo de supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de
95
e) A correlação foi o que indica que a relação linear entre o tempo, em minutos, gasto
na execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é
.
“A correlação foi −0, 875 o que indica que a relação linear entre o tempo, em minutos, gasto na
execução da tarefa relacionada ao cargo de supervisora e o tempo de experiência no cargo é inversa.”.
96
a) Ajuste uma reta de regressão para explicar a eficiência do consumo, em termos da massa dos
veículos.
βb1 = −0, 007 é o decréscimo médio estimado da eficiência do consumo, em quilômetros por litro, a
cada aumento de um quilograma do massa.
c) Considerando que a massa dos carros avaliados variou de 800 kg a 1200 kg. Qual a eficiência do
consumo estimada para um carro que pesa 1000 kg?
Para X = 1000 ⇒ Yb =?
Yb = 19, 4726 − 0, 007 × 1000 = 12, 4726.
97
4) Uma doença contagiosa assola uma região de um determinado país. Duas cidades A e B são as mais
infectadas e pesquisadores, após observaram o número de doentes ao longo de oito meses, obtiveram:
O avanço da doença é mais preocupante na cidade A, pois a cada mês há um aumento médio estimado
de 15 casos de doença, enquanto que na cidade B, o aumento médio mensal estimado é de 10 casos.
b) Para qual das duas cidades o modelo de regressão explica melhor o progresso da doença?
A porcentagem da variabilidade explicada pelo modelo de regressão é dado pelo coeficiente de deter-
minação, (r2 %), sendo assim, para a cidade B o modelo de regressão explica melhor o progresso da
doença, por apresentar maior coeficiente de determinação.
98
5) Em um estudo acerca da influência do tamanho da população residente em uma cidade (X, em mi-
lhares de pessoas) e a taxa de mortalidade (Y , número de mortes por mil habitantes), um pesquisador
obteve os seguintes valores para doze cidades pesquisadas:
Com base no item a), marque a alternativa que completa corretamente a frase acima:
Temos que
12 12
n = 12 Xi = 1452; Xi2 = 251538;
P P
i=1 i=1
12 12 12
Yi = 420; Yi2 = 17596; Xi Yi = 45253.
P P P
i=1 i=1 i=1
45253 − (1452)(420)
−5567
rXY = r 12
=
2 2 14820, 5943
251538 − (1452)
12
17596 − (420)
12
= −0, 3756
Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que o tamanho da
população residente tende a aumentar a taxa de mortalidade tende a diminuir.
Equivalentemente, temos que X e Y são negativamente correlacionados, dessa forma à medida que
o tamanho da população residente tende a diminuir a taxa de mortalidade tende a aumentar.
6) Uma empresa está estudando como varia a demanda de certo produto (em unidades) em função de
seu preço de venda que varia de R$ 160,00 a R$ 200,00. Para isso levantou as seguintes informações:
n n n n n
n = 12, Xi = 2130, Xi2 = 379440, Yi = 2658, Yi2 = 593812, Xi Yi = 471133.
P P P P P
i=1 i=1 i=1 i=1 i=1
(2130) (2658)
SPDXY = 471133 − = −662
12
(2130)2
SQDX = 379440 − = 1365
12
(2658)2
SQDY = 593812 − = 5065
12
SPDXY −662
βb1 = = = −0, 485
SQDX 1365
2658 2130
βb0 = Ȳ − βb1 X̄ = − (−0, 485) × = 221, 5 + 86, 0875 = 307, 5875
12 12
Ybi = βb0 + βb1 Xi = 307, 5875 − 0, 485Xi .
βb0 = 307, 5875 é número médio estimado, em unidades, da demanda do produto quando o produto é
dado ao consumidor (preço de venda é R$ 0, 00). Note que esse valor trata-se de uma extrapolação,
haja vista que, no estudo o preço de venda variou de R$ 160,00 a R$ 200,00 e, assim, essa estimativa
não é confiável.
βb1 = −0, 485 é o decréscimo médio estimado, em unidades, da demanda do produto a cada aumento
de R$ 1,00 no preço de venda.
2
(SPDXY ) 2 471133 − 2130×2658
12
SQRegressão = = ,
SQDX 379440 − (2130)2
12
(−662)2
= = 321, 06
1365
(2658)2
SQTotal = SQDY = 593812 − = 5065.
12
SQRegressão 321, 06
r2 (%) = × 100% = × 100%
SQTotal 5065
= 6, 34%.
e) Para um artigo que custa R$ 180, qual o número estimado de unidades a serem vendidas?
Para X = 180 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 180 = 220, 2875.
Para um artigo que custa R$ 180, o número estimado de unidades a serem vendidas é 220,2875.
f) Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas? o que
você pode dizer acerca dessa estimativa?
Para X = 280 ⇒ Yb =?
Yb = 307, 5875 − 0, 485 × 280 = 171, 7875.
Para um artigo que custa R$ 280, qual o número estimado de unidades a serem vendidas é 171,7875.
Note que esse valor trata-se de uma extrapolação, haja vista que, no estudo o preço de venda variou
de R$ 160,00 a R$ 200,00 e, assim, essa estimativa não é confiável.
101
7) É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação,
uma nutricionista selecionou 18 mulheres, com idade entre 43 e 78 anos, e observou em cada uma
delas a idade (X) e a massa muscular (Y ).
X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78
●
110
●
100
● ●
Massa muscular
●
90
●
●
80
●
●
●
●
●
70
45 50 55 60 65 70 75
Idade
Temos que
18 18
n = 18 Xi = 1108; Xi2 = 70362;
P P
i=1 i=1
18 18 18
Yi = 1530; Yi2 = 133300; Xi Yi = 91964.
P P P
i=1 i=1 i=1
91964 − (1108)(1530)
−2216
rXY = r 18
=
2 2
2648, 574
70362 − (1108)
18
133300 − (1530)
18
= −0, 8367
102
Dessa forma, X e Y são negativamente correlacionados, dessa forma à medida que a idade tende a
aumentar a massa muscular tende a diminuir.
n
P
Xi
71 + 64 + · · · + 68 1108
X̄ = i=1
= = = 61, 5556.
n 18 18
n
P
Yi
82 + 91 + · · · + 78 1530
Ȳ = i=1
= = = 85.
n 18 18
v
u 70362 − (1108)2
u s
q 2158, 4444 √
S (X) = S 2 (X) = 18
= = 126, 9673 = 11, 268,
t
18 − 1 17
v
u 133300 − (1530)2
u s
q 3250 √
S (Y ) = S 2 (Y ) = 18
= = 191, 1765 = 13, 8267,
t
18 − 1 17
e,
Como 16, 27% = CV (Y )% < CV (X)% = 18, 31% temos que a variável Y é mais homogênea que a
variável X.
(1108) (1530)
SPDXY = 91964 − = −2216
18
(1108)2
SQDX = 70362 − = 2158, 4444
18
(1530)2
SQDY = 133300 − = 3250
18
103
SPDXY −2216
βb1 = = = −1, 0267
SQDX 2158, 4444
1530 1108
βb0 = Ȳ − βb1 X̄ = − (−1, 0267) × = 8563, 1991 = 148, 1991
18 18
Ybi = βb0 + βb1 Xi = 148, 1991 − 1, 0267Xi .
e) Considerando a reta estimada dada no item d), estime a massa muscular média de mulheres com
50 anos.
Para X = 50 ⇒ Yb =?
Yb = 148, 1991 − 1, 0267 × 50 = 96, 8641.
104
8) A tabela abaixo apresenta dados relativos ao nível de escolaridade (medido pelo número de anos
de estudo) e o salário (em R$) de 10 indivíduos. Suponha que o salário médio de um indivíduo esteja
linearmente relacionado à escolaridade do mesmo.
X 4 7 8 9 11 12 13 14 15 16
Y 420 450 600 620 700 1000 1200 1600 2000 2500
Pede-se:
Temos que
10 10
n = 10; Xi = 109; Xi2 = 1321;
P P
i=1 i=1
10 10 10
Yi = 11090; Yi2 = 16863300; Xi Yi = 142910.
P P P
i=1 i=1 i=1
(109) (11090)
SPDXY = 142910 − = 22029
10
(109)2
SQDX = 1321 − = 132, 9
10
(11090)2
SQDY = 16863300 − = 4564490
10
SPDXY 22029
βb1 = = = 165, 7562
SQDX 132, 9
11090 109
βb0 = Ȳ − βb1 X̄ = − (165, 7562) × = 1109 − 1806, 7426 = −697, 7426
10 10
Ybi = βb0 + βb1 Xi = −697, 7426 + 165, 7562Xi .
Dessa forma, “O aumento de um ano de estudo gera um aumento médio esperado de R$ 165,76 no
salário.”.
Como βb0 = −697, 7426, temos que “−697, 7426 é a estimativa da constante da regressão”.
Para X = 10 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 10 = 959, 82,
assim “R$ 959,82 é uma estimativa do salário médio para um indivíduo que estudou 10 anos”.
Temos que
142910 − (109)(11090)
22029
rXY = r 10
=
2 2 24629, 6716
1321 − (109)
10
16863300 − (11090)
10
= 0, 8944
Dessa forma “0, 8944 é o coeficiente de correlação linear entre os anos de estudo e o salário.”.
e) O percentual da variação observada nos valores de salário que é explicado pela regressão linear
simples nos valores de anos de estudo é igual a %.
2
(SPDXY ) 2 142910 − 109×11090
10
SQRegressão = = ,
SQDX 1321 − (109)2
10
(22029)2
= = 3651443, 5
132, 9
(11090)2
SQTotal = SQDY = 16863300 − = 4564490.
10
SQRegressão 3651443, 5
r2 (%) = × 100% = × 100%
SQTotal 4564490
= 80%.
O coeficiente de determinação r2 foi de 80%, dessa forma, “O percentual da variação observada nos
valores de salário que é explicado pela regressão linear simples nos valores de anos de estudo é igual
a 80%.”
Para X = 11 ⇒ Yb =?
g) Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$
seria uma do modelo.
Para X = 20 ⇒ Yb =?
Yb = −697, 7426 + 165, 7562 × 20 = 2617, 38,
assim “Estimar que o salário médio de um indivíduo com 20 anos de estudo seja igual a R$ 2617,38
seria uma extrapolação do modelo.”.
106
a) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para uma
supervisora com 3 anos de experiência no mesmo é de min.
Para X = 3 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 3 = 4, 7,
assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo, para
uma supervisora com 3 anos de experiência no mesmo é de 4,7 min.”
Como Ybi = 9, 8−1, 7Xi , temos que βb1 = −1, 7, assim: “A cada acréscimo de um ano de experiência no
cargo de supervisora do refeitório, estima-se um decréscimo de 1,7 min. no tempo gasto na execução
dessa certa tarefa relacionada com o cargo.”
c) A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de supervisora,
para uma supervisora sem experiência no cargo (com 0 anos) é de min.
Para X = 0 ⇒ Yb =?
Yb = 9, 8 − 1, 7 × 0 = 9, 8,
assim: “A estimativa do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora, para uma supervisora sem experiência no cargo (com 0 anos) é de 9,8 min.”
Como rXY = −0, 875 temos que “O grau de associação dos pontos observados e a reta foi de 87,5%.”
e) A proporção da variação do tempo gasto na execução dessa certa tarefa relacionada com o cargo de
supervisora do refeitório, que é explicada pela equação ajustada em função do tempo de experiência
no cargo é igual a .
Temos que r2 = (rXY )2 = (−0, 875)2 = 76, 56%, dessa forma, “ A proporção da variação do tempo
gasto na execução dessa certa tarefa relacionada com o cargo de supervisora do refeitório, que é
explicada pela equação ajustada em função do tempo de experiência no cargo é igual a 76,56%.”
107
O sinal negativo do coeficiente de correlação linear indica que a relação linear entre o tempo, em
minutos, gasto na execução de certa tarefa relacionada com o cargo de supervisora do refeitório de
uma grande indústria e o tempo de experiência no cargo é inversa.
108
10) O consumo máximo de oxigênio (VO2máx ) é considerado um parâmetro fisiológico que permite
avaliar o nível da capacidade funcional do sistema cardiorrespiratório. Um pesquisador decidiu
ajustar uma equação de regressão com a finalidade de predição do VO2máx em função do desempenho
em um teste de 1600 m, para a população de brasileiros jovens fisicamente ativos. A partir de X
= velocidade do indivíduo em teste de 1600 m (em m/min) e Y = consumo máximo de oxigênio
(em ml/(kg·min)), ele obteve a equação de regressão: Ybi = 8, 15 + 0, 18Xi , com um coeficiente
de determinação igual r2 = 0, 79. Os valores de X variaram de 200 a 270 m/min. Complete
CORRETAMENTE as afirmações abaixo.
a) A proporção da variação do VO2máx (consumo máximo de oxigênio) que não é explicada pela
equação de regressão ajustada em função velocidade do indivíduo em teste de 1600 m (em m/min)
é igual a %.
b) A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade de 276
m/min em teste de 1600 m é igual a ml/(kg·min). Entretanto essa estimativa
deve ser analisada com cautela em razão de essa velocidade não pertencer ao .
Para X = 276 ⇒ Yb =?
Yb = 8, 150, 18 × 276 = 57, 83,
assim: “A estimativa do VO2máx (consumo máximo de oxigênio) para um indivíduo com velocidade
de 276 m/min em teste de 1600 m é igual a 57,83 ml/(kg·min). Entretanto essa estimativa deve ser
analisada com cautela em razão de essa velocidade não pertencer ao intervalo pesquisado que variou
de 200 a 270 m/min.”
109
11) Érica supõe que as variáveis: comprimento do corpo em cm (X) de Bothrops moojeni - um tipo
de jararaca - e comprimento de sua cauda em cm (Y ) se relacionam de acordo com o modelo linear e
que são válidas as pressuposições usuais sobre o erro. Érica toma uma amostra de Bothrops moojeni
e obtém os seguintes resultados para a amostra escolhida:
Determine:
a) Os somatórios;
n n
n= Xi = Xi2 =
P P
i=1 i=1
n n n
Yi = Yi2 = Xi Yi =
P P P
i=1 i=1 i=1
n n
n=9 Xi = 1240 Xi2 = 171504
P P
i=1 i=1
n n n
Yi = 58 Yi2 = 394 Xi Yi = 8095
P P P
i=1 i=1 i=1
(1240) (58)
SPDXY = 8095 − = 103, 8889
9
(1240)2
SQDX = 171504 − = 659, 5556
9
(58)2
SQDY = 394 − = 20, 2222
9
2
(SPDXY ) 2 8095 − 1240×58
9
SQRegressão = = ,
SQDX 171504 − (1240)2
9
(103, 8889)2
= = 16, 3639
659, 5556
(58)2
SQTotal = SQDY = 394 − = 20, 2222.
9
SQRegressão 16, 3639
r2 (%) = × 100% = × 100%
SQTotal 20, 2222
= 80, 92%.
12) Considere as afirmações a seguir a respeito do coeficiente de correlação entre duas variáveis X e
Y.
I - Se rXY = −1, as observações estão todas sobre uma linha reta no diagrama de dispersão.
III - Se rXY < 0, a variável X tende a decrescer quando a variável Y tende a decrescer.
IV - rXY varia de −1 a 1, sendo que, quanto mais próximo de −1 menos correlacionadas são as
variáveis e, quanto mais próximo de 1, mais correlacionadas elas estão.
I - Verdadeiro.
II - Verdadeiro.
III - Falso. Se X e Y estão negativamente correlacionadas, isto é, −1 < rXY < 0 então as variáveis
caminham em sentido contrário e, dessa forma:
IV - Falso. Quanto mais próximo de −1 e 1, maior a correlação entre as variáveis, no primeiro caso elas
estão negativamente correlacionadas e no segundo positivamente correlacionadas. Uma correlação
próxima a zero indica que as duas variáveis não estão linearmente relacionadas.
Y 2 -1 5 1 6
X 0 0 3 -1 4
Temos que
n n n n n
Xi = 6; Xi2 = 26; Yi = 13; Yi2 = 67; Xi Yi = 38;
P P P P P
i=1 i=1 i=1 i=1 i=1
SQDX = 18, 8; SQDY = 33, 2; SPDXY = 22, 4.
38 − (6)(13)
22, 4
rXY = r 5
=√ = 0, 8966.
2 2 18, 8 × 33, 2
26 − (6)
5
67 − (13)
5
14) Com o objetivo de verificar, em certa região, a relação existente entre o nível de escolaridade
médio dos pais e o nível de escolaridade dos filhos, observou-se uma amostra de 9 indivíduos adultos,
verificando-se o número de anos que esses frequentaram (e tiveram aprovação) em escolas regulares
(Y ) e, o número médio de anos que os seus pais frequentaram (e tiveram aprovação) em escolas
regulares (X), sendo que a escolaridade dos pais variou de três a doze anos de estudo. Nesse estudo
obteve-se:
rXY = 0, 9475 e Ybi = −1, 6964 + 1, 447Xi .
a) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando aumenta-se em um
ano a escolaridade média dos filhos;
b) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando aumenta-se em
um ano a escolaridade média dos filhos;
c) 1, 6964 é o decréscimo médio estimado, em anos, da escolaridade dos pais quando diminui-se em
um ano a escolaridade média dos filhos;
d) O percentual da variabilidade observada do nível de escolaridade médio dos pais, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos filhos é 94,75%;
e) O percentual da variabilidade observada do nível de escolaridade médio dos filhos, explicado pela
regressão linear simples, nos valores do nível de escolaridade médio dos pais é 89,78%.
f) 1, 447 é o aumento médio estimado, em anos, da escolaridade dos pais quando diminui-se em um
ano a escolaridade média dos filhos;
Temos que
n n n n n
Xi = 61; Xi2 = 491; Yi = 73; Yi2 = 773; Xi Yi = 607.
P P P P P
i=1 i=1 i=1 i=1 i=1
(61) (73)
SPDXY = 607 − = 112, 2222
9
(61)2
SQDX = 491 − = 77, 5556
9
(73)2
SQDY = 773 − = 180, 8889
9
607 − (61)(73)
112, 22
rXY = r 9
=√ = 0, 9475.
2 2 77, 56 × 180, 89
491 − (61)
9
773 − (73)
9
Mês Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez.
Y −29 115 84 −8 169 74 −107 −43 75 23 −2 7
X 2, 32 1, 19 −0, 46 0, 38 0, 02 0, 8 0, 63 0, 9 1, 43 1, 26 1, 29 1, 15
Fonte: http://www.censusvicosa.com.br/images/publicacoes/475/boletim-estatstico-de-viosa-15-de-janeiro-de-2013-3pdf.pdf
Considerando quatro casas decimais nos cálculos, indique a seguir a única resposta correta:
a) 34, 9747 é o aumento médio estimado, em unidades, da variação dos empregos quando aumenta-se
em uma unidade o índice de preços ao consumidor da cidade de Viçosa;
f) n.d.r.a.
Temos que
126, 06 − (10,91)(358)
rXY = r 12
= −0, 33.
(10,91)2 (358)2
15, 6209 − 12
74728 − 12
126, 06 − 10,91×358
−199, 4217
βb1 = 12
= = −34, 9747,
15, 6209 (10,91)2
− 12 5, 7019
358 10, 91
βb0 = − (−34, 9747) × = 61, 6311,
12 12
Ybi = 61, 6311 − 34, 9747Xi .
16) Uma forma para avaliar a capacidade reprodutiva de um touro é medindo o seu índice de con-
centração sérica de testosterona. Há evidências de que animais com altos valores desse índice são
também melhores reprodutores. Portanto, existe o interesse em descobrir possíveis fatores que provo-
cam o aumento desse índice e, consequentemente, da fertilidade do touro. Nesse sentido, estudou-se
via Regressão Linear Simples (RLS) como a massa corporal dos animais (X) influenciaria o índice
de concentração sérica de testosterona (Y ), através de uma amostra de 10 touros da raça Guzerá,
com idade entre 24 e 34 meses. A Tabela a seguir apresenta os valores de X e Y , sendo que ng/ml
representa nanogramas/mililitro.
Massa (kg) 305 541 579 388 422 755 599 693 392 659
Testosterona (ng/ml) 0, 1 2, 2 2, 6 0, 74 1, 02 3, 45 2, 47 3, 24 0, 85 3, 6
a) Determine a equação ajustada de regressão linear simples;
Temos que
n n
n = 10; Xi = 5333; Xi2 = 3046595;
P P
i=1 i=1
n n n
Yi = 20, 27; Yi2 = 55, 3815; Xi Yi = 12478, 86.
P P P
i=1 i=1 i=1
c) Estime o índice de concentração sérica de testosterona e o desvio da regressão para um touro com
massa de 541 kg;
ou ainda olhando-se diretamente teremos Yb2 = 2, 0905. Logo b2 = Y2 − Yb2 = 2, 2 − 2, 0905 = 0, 1095.
Temos que
O coeficiente de determinação r2 (%) foi de 96,22%, dessa forma, o percentual da variabilidade ob-
servada do índice de concentração sérica de testosterona, explicado pela regressão linear simples, nos
valores do massa corporal dos animais é 96,22%.
119
17) Investigou-se, via regressão linear simples (RLS), como a idade dos consumidores (X, em anos)
poderia influenciar a intenção de compra de produtos de uma determinada linha. Para tal, n = 8
indivíduos foram apresentados a fotografias que ilustravam alguns desses produtos. As notas de
preferência (Y ), definidas em uma escala contínua de 1 a 6, foram atribuídas a cada imagem, conforme
apresentado na tabela a seguir:
Xi 18 19 20 23 24 25 26 27
Yi 5,4 5,6 5,3 4,7 3,9 4,0 3,7 3,3
Pede-se:
n n n
Yi = 35, 9; Yi2 = 166, 49; Xi Yi = 796, 6.
P P P
i=1 i=1 i=1
(182) (35, 9)
SPDXY = 796, 6 − = −20, 125
8
(182)2
SQDX = 4220 − = 79, 5
8
(35, 9)2
SQDY = 166, 49 − = 5, 3888
8
βb1 = −0, 2531 é o decréscimo médio estimado, da nota de preferência quando aumenta-se em um
ano a idade do consumidor;
b) A nota de preferência média estimada e o desvio da regressão para um consumidor com 20 anos;
Para X = 20 ⇒ Yb =?
c) Estime a nota de preferência média para um consumidor com idade de 10 anos. Comente sobre
esse resultado.
Para X = 10 ⇒ Yb =?
Essa estimativa obtida trata-se de uma extrapolação, haja vista que no estudo em questão, a idade
do consumidor variou de 18 a 27 anos, dessa forma, essa estimativa não é confiável.
Temos que
O coeficiente de determinação r2 (%) foi de 94,54%, dessa forma, o percentual da variabilidade ob-
servada da nota de preferência, explicado pela regressão linear simples, nos valores da idade do
consumidor é 94,54%.
121
CAPÍTULO VI
Probabilidade
a) Determine a probabilidade de que ele frequente pelo menos um dos dois cursos.
Sejam A:“o aluno frequenta o curso de natação” e, B:“o aluno frequenta o curso de computação”.
Temos que
30 20 10
P [A] = = 0, 3, P [B] = = 0, 2 e P [A ∩ B] = = 0, 1.
100 100 100
assim
Ω
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= 0, 3 + 0, 2 − 0, 1
A 0, 2 0, 1 0, 1 B
= 0, 4
0, 6
= 0, 3 − 0, 1
= 0, 2 A 0, 2 0, 1 0, 1 B
0, 6
122
2) Dentre 10 pessoas que estão na sala de espera de um médico, 3 praticam alguma atividade física.
Duas pessoas são selecionadas aleatoriamente, uma após a outra sem reposição, para serem atendidas
gratuitamente.
a) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida pratica atividade física.
Sejam A:“a primeira pessoa pratica atividade física” e, B:“a segunda pessoa pratica atividade física”.
B
2
9
3 7
10 9
Bc
2
P [B|A] = = 0, 2222 •
9
7
B
3
10 9
Ac
6
9
Bc
b) Determine a probabilidade de que a segunda pessoa escolhida pratique atividade física, sabendo
que a primeira pessoa a ser escolhida não pratica atividade física.
3
P [B|Ac ] = = 0, 3333
9
c) Determine a probabilidade de que a primeira pessoa escolhida pratique atividade física, sabendo
que a segunda pessoa a ser escolhida não pratica atividade física.
P [A ∩ B c ] P [B c |A] P [A]
P [A|B c ] = =
P [B c ] P [B c |A] P [A] + P [B c |Ac ] P [Ac ]
7 3
· 0, 2333
= 7 39 106 7 =
· + · 0, 7
9 10 9 10
= 0, 3333
123
3) Numa usina nuclear somente em um a cada 100 dias há algo errado com o reator. Em 99% dos dias
em que há algo errado com o reator o alarme dessa usina dispara e, por outro lado, ele também dispara
em 1% dos dias em que não há nada de errado com o reator. Qual é a probabilidade condicional de
haver algo errado com o reator se o alarme disparou?
B
0,99
1 0,01
100
Bc
99
B
100 0,01
Ac
0,99
Bc
P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 99 · 0, 01 0, 0099
= =
0, 99 · 0, 01 + 0, 01 · 0, 99 0, 0198
= 0, 5
124
4) Um estudante em uma certa manhã, sai de casa apressado para a escola e apanha na cozinha
aleatoriamente uma das 3 sacolas iguais que estão em cima da mesa. Uma delas contém o seu lanche:
dois sanduíches de queijo e manteiga. Outra sacola contém o lanche de sua irmã: um sanduíche de
queijo e manteiga e outro de presunto, (que ele detesta). A terceira sacola contém restos de comida
que serão dados ao gato. Pensando em ter ou não, pegado a sacola errada, no meio do caminho, ele
abre a sacola e tira um sanduíche e verifica que é de queijo e manteiga. (Fica aliviado, pelo menos
não é a sacolinha da comida do gato). Pergunta-se: Nessas condições, qual a probabilidade dele ter
apanhado a sacola correta?
Sejam A:“ele apanhou sua sacola”, B:“ele apanhou a sacola de sua irmã”, C:“ele apanhou a sacola
com restos de comida” e D:“A sacola contém um sanduíche de queijo e manteiga”. Temos que assim
1 1 1
P [A] = = 0, 3333, P [B] = = 0, 3333 P [C] = = 0, 3333
3 3 3
P [D | A] = 1, P [D | B] = 0, 5 P [D | C] = 0
P [Dc | A] = 0, P [Dc | B] = 0, 5 P [Dc | C] = 1
D
1
0
Dc
0,3333
D
0,5
• 0,3333
B
0,5
Dc
0,3333
D
0
1
Dc
P [A ∩ D] P [A] P [D|A]
P [A|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 3333 × 1
=
0, 3333 × 1 + 0, 3333 × 0, 5 + 0, 3333 × 0
0, 3333
= = 0, 6667
0, 5
125
Sejam A:“a primeira carta retirada é um ás” e, B:“a segunda carta retirada é um ás”.
B
4
52
4 48
52
P [A ∩ B] = P [B | A] · P [A] 52
Bc
4 4 16
= · =
52 52 2704 •
= 0, 0059
48
B
4
52 52
Ac
48
52
Bc
b) a primeira carta não é reposta.
B
3
P [A ∩ B] = P [B | A] · P [A] 51
3 4 12 A
= · =
51 52 2652
= 0, 0045 4 48
52 51
Bc
48
B
4
52 51
Ac
47
51
Bc
126
6) Sejam duas urnas I e II. A urna I contém três fichas vermelhas e duas fichas azuis, e a urna II
contém duas fichas vermelhas e oito fichas azuis. Joga-se uma moeda honesta. Se a moeda resultar
em cara, extrai-se uma ficha da urna I; se resultar em coroa, extrai-se uma ficha da urna II. Pede-se:
Urna I Urna II
3 Vermelhas 2 Vermelhas
2 Azuis 8 Azuis
Sejam A:“a moeda resulta em cara” e, B:“a ficha extraída é vermelha”. Temos que
3
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = = 0, 6
5
2 2 8
P [B c | A] = = 0, 4, P [B | Ac ] = = 0, 2 P [B c | Ac ] = = 0, 8
5 10 10
B
3
5
A
2
0,5 5
Bc
= 0, 4 0,5 2
B
10
Ac
8
10
Bc
b) Dado que a ficha é vermelha, qual é a probabilidade condicional de ter vindo da urna I?
P [A ∩ B] P [B|A] P [A]
P [A|B] = =
P [B] P [B|A] P [A] + P [B|Ac ] P [Ac ]
0, 6 · 0, 5 0, 3
= =
0, 6 · 0, 5 + 0, 2 · 0, 5 0, 4
= 0, 75
127
7) Em uma fábrica de peças, as máquinas A, B e C respondem por 40, 50 e 10 por cento do total
produzido, respectivamente. Da produção de cada máquina 3%, 5% e 2%, respectivamente, são peças
defeituosas. Escolhida ao acaso uma peça da produção conjunta das três máquinas, pede-se:
D
assim 0,03
0,97
Dc
0,4
D
0,05
• 0,5
B
0,95
Dc
0,1
D
0,02
0,98
Dc
= 0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02
= 0, 039.
b) Sabendo-se que a peça escolhida é defeituosa, qual a probabilidade condicional de ter vindo da
máquina B?
P [B ∩ D] P [B] P [D|B]
P [B|D] = =
P [D] P [A] P [D|A] + P [B] P [D|B] + P [C] P [D|C]
0, 5 × 0, 05
=
0, 4 × 0, 03 + 0, 5 × 0, 05 + 0, 1 × 0, 02
0, 025
= = 0, 641.
0, 039
128
8) Uma caixa contém 20 peças, das quais 5 são defeituosas. Extraem-se sucessivamente duas peças
ao acaso. Qual a probabilidade de:
B
14
P [A ∩ B] = P [B | A] · P [A] 19
14 15 210 A
= · =
19 20 380
= 0, 5526 15 5
20 19
Bc
5
B
15
20 19
Ac
4
19
Bc
b) Ambas serem defeituosas?
P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
4 5 20
= · =
19 20 380
= 0, 0526
= P [B c | A] · P [A] + P [B | Ac ] · P [Ac ]
5 15 15 5 75 75
= · + · = +
19 20 19 20 380 380
= 0, 1974 + 0, 1974 = 0, 3948
129
9) Certa firma utilizava um teste para classificar os funcionários em categorias; ao final eles eram
classificados em: 25% bons (B), 50% médios (M) e 25% fracos (F). Um novo teste é proposto, de tal
forma a classificar os funcionários como aprovado (A) ou reprovado (R). Com base em informações
do antigo teste, foram obtidas as seguintes probabilidades condicionais com o novo teste:
Pede-se: qual é a probabilidade condicional de um funcionário aprovado no novo teste, ser classificado
como fraco pelo antigo teste?
Sejam
B
0,8
P [B]=0,25, P [A|B]=0,8, 0,25
A
0,5 Ac
P [F ∩ A] P [A|F ] P [F ]
P [F |A] = =
P [A] P [A|B] P [B] + P [A|M ] P [M ] + P [A|F ] P [F ]
0, 2 × 0, 25
=
0, 8 × 0, 25 + 0, 5 × 0, 5 + 0, 2 × 0, 25
0, 05
=
0, 2 + 0, 25 + 0, 05
0, 05
= = 0, 1.
0, 5
Dessa forma, sabendo-se que o aluno foi aprovado no novo teste, a probabilidade de que ele tenha
sido classificado como fraco pelo antigo teste é 0,1.
130
Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.
HHD2
HH
1 2 3 4 5 6
D1 HH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais.
Considere o evento A : “o primeiro dado mostre a face 2 e o segundo a face 3”. Perceba que esse
evento só ocorre uma vez nos 36 resultados possíveis do espaço amostral, pois A = {(2, 3)}, e assim
n (A) = 1. Dessa maneira
n (A) 1
P [A] = = .
n 36
Considere o evento B : “ambos os dados mostrem a mesma face”. Perceba que esse evento ocorre 6 ve-
zes nos 36 resultados possíveis do espaço amostral, pois B = {(1, 1); (2, 2); (3, 3); (4, 4); (5, 5); (6, 6)},
e assim n (B) = 6. Dessa maneira
n (B) 6 1
P [B] = = = .
n 36 6
Considere o evento c : “o segundo dado mostra um número par”. Perceba que esse evento ocorre 18
vezes nos 36 resultados possíveis do espaço amostral, pois
C = {(1, 2); (2, 2); (3, 2); (4, 2); (5, 2); (6, 2); (1, 4); (2, 4); (3, 4); (4, 4);
(5, 4); (6, 4); (1, 6); (2, 6); (3, 6); (4, 6); (5, 6); (6, 6)} ,
n (C) 18 1
P [C] = = = .
n 36 2
131
11) Uma moeda perfeita é lançada 3 vezes e observado o número de caras. Qual é a probabilidade de
ocorrer?
Considere os eventos
então
1 A3 ⇒ 3 caras
2
1 A2 1
Ac3 ⇒ 2 caras
2
2
A1 1 A3 ⇒ 2 caras
2
1
2 1
2 Ac2 1
Ac3 ⇒ 1 caras
2
•
1
1 A2 2
A3 ⇒ 2 caras
1 2
2
1
Ac1 2 Ac3 ⇒ 1 cara
1
1
1 cara
2
2 Ac2 A3 ⇒
1
2 Ac3 ⇒ 0 cara
e
Seja B : “ocorre pelo menos uma cara nos três lançamentos”, nesse caso B c : “ocorre menos que uma
cara nos três lançamentos”, ou seja, B c = {Ac1 ∩ Ac2 ∩ Ac3 } é o evento em que não ocorrem caras nos
três lançamentos.
132
12) Das 10 alunas de uma classe, 3 têm olhos azuis. Se duas alunas da classe são escolhidas aleatori-
amente, qual é a probabilidade de:
Sejam A:“a primeira aluna tem olhos azuis” e, B:“a segunda aluna tem olhos azuis”.
Temos que
3 7 2
P [A] = = 0, 3, P [Ac ] = = 0, 7, P [B |A ] = = 0, 2222,
10 10 9
7 3 6
P [B c |A ] = = 0, 7778, P [B |Ac ] = = 0, 3333, P [B c |Ac ] = = 0, 6667.
9 9 9
B
2
P [A ∩ B] = P [B | A] · P [A] 9
2 3 6 A
= · =
9 10 90
= 0, 0667 3 7
10 9
Bc
7
B
3
10 9
Ac
6
9
Bc
b) Nenhuma ter olhos azuis?
P [Ac ∩ B c ] = P [B c | Ac ] · P [Ac ]
6 7 42
= · =
9 10 90
= 0, 4667
= 1 − 0, 4667 = 0, 5333
134
13) Um homem possui duas moedas, uma comum e outra cunhada com duas caras. Ele apanhou uma
moeda aleatoriamente e a lançou, se ocorreu a face cara, qual é a probabilidade condicional de que
a moeda lançada tenha sido a de duas caras?
Sejam A:“a moeda lançada é a de duas caras” e, B:“a moeda resulta em cara”. Temos que
2
P [A] = 0, 5, P [Ac ] = 0, 5 P [B | A] = =1
2
0 1 1
P [B c | A] = = 0, P [B | Ac ] = = 0, 5 P [B c | Ac ] = = 0, 5
2 2 2
B
2
2
P [A ∩ B] 0,5
0
2
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
1 · 0, 5 0, 5
= =
1 · 0, 5 + 0, 5 · 0, 5 0, 75 B
0,5
= 0, 6667
1
2
Ac
1
2
Bc
135
a) Se as duas faces mostram números diferentes, qual é a probabilidade condicional de que uma das
faces seja o 4?
Note que Ω = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n = 36 pontos amostrais, conforme mostra a
tabela a seguir.
HH
D2
H 1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Se A : “as duas faces mostram números diferentes” e B : “uma das faces mostradas é o número
quatro”. Desejamos encontrar P [B | A]. Temos que
A = {(1, 2); (1, 3); (1, 4); (1, 5); (1, 6); (2, 1); (2, 3); (2, 4); (2, 5); (2, 6);
(3, 1); (3, 2); (3, 4); (3, 5); (3, 6); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6);
(5, 1); (5, 2); (5, 3); (5, 4); (5, 6); (6, 1); (6, 2); (6, 3); (6, 4); (6, 5)} ,
B = {(1, 4); (2, 4); (3, 4); (4, 4); (5, 4); (6, 4), (4, 1); (4, 2); (4, 3); (4, 5); (4, 6)} ,
A ∩ B = {(1, 4); (2, 4); (3, 4); (4, 1); (4, 2); (4, 3); (4, 5); (4, 6); (5, 4); (6, 4)}
então
n (A) 30 5
P [A] = = = = 0, 8333
n 36 6
n (A ∩ B) 10 5
P [A ∩ B] = = = = 0, 2778
n 36 18
e
P [A ∩ B] 5
5 6 1
P [B | A] = = 18
= · = = 0, 3333.
P [A] 5
6
18 5 3
C = {(3, 6), (4, 5), (4, 6), (5, 4), (5, 5), (5, 6), (6, 3), (6, 4), (6, 5), (6, 6)}
e n(C) = 10,
136
H
E2
1 2 3 4 5 6
HH
E1 HHH
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
dessa forma
n(C) 10 5
P [C] = = = .
n 36 18
137
15) Considere dois tipos de caixas de bombons, I e II. O tipo I contém 65% de bombons doces e 35%
de bombons amargos, enquanto no tipo II essas percentagens de sabor são inversas. Além disso, 45%
de todas as caixas de bombons são do tipo I e as restantes do tipo II. Escolhe-se, aleatoriamente,
uma caixa e dela retira-se um bombom; se for constatado que ele é doce, qual é a probabilidade
condicional de ter vindo de uma caixa do tipo II?
Sejam A: “as caixas de bombons são do tipo I” e, B: “os bombons são doces”.
Temos que
B
0,65
0,35
0,45
Bc
0,55
B
0,35
Ac
0,65
Bc
P [Ac ∩ B] P [B | Ac ] P [Ac ]
P [Ac | B] = =
P [B] P [B | A] P [A] + P [B | Ac ] P [Ac ]
0, 35 · 0, 55 0, 1925 0, 1925
= = =
0, 65 · 0, 45 + 0, 35 · 0, 55 0, 2925 + 0, 1925 0, 485
= 0, 3969.
138
16) Considere dois eventos, A = {atirador A acerta o alvo} e B = {atirador B acerta o alvo}, com
probabilidades P [A] = 0, 51 e P [B] = 0, 32. Pede-se, se os atiradores A e B atiram simultaneamente
em um alvo, qual é a probabilidade do alvo ser atingido quando os eventos A e B:
a) são independentes.
Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B independentes, temos que P [A ∩ B] = P [A] P [B]
e dessa maneira
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= 0, 51 + 0, 32 − 0, 51 · 0, 32
= 0, 6668.
Note que o alvo é atingido se um dos dois atiradores acertar o alvo, dessa forma desejamos encontrar
P [A ∪ B]. Além disso, em sendo os eventos A e B mutuamente exclusivos, temos que A ∩ B = ∅ e
dessa maneira
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
= 0, 51 + 0, 32 − 0
= 0, 83.
139
17) Dois eventos A e B pertencentes a um mesmo espaço amostral possuem probabilidades P [A] = 1/5
e P [B] = 1/6. Se A e B são eventos independentes calcule a probabilidade de ocorrência de pelo
menos um dos dois eventos.
P [A ∪ B] = P [A] + P [B] − P [A ∩ B]
1 1 2
A 6 30 15 B
2
3
1 1 2
P [A ∪ B] = + +
6 30 15
= 0, 1667 + 0, 0333 + 0, 1333
= 0, 3333.
140
18) Um réu foi a julgamento acusado de homicídio. Numa tentativa de inocentar seu cliente o advo-
gado de defesa alega que ele é esquizofrênico e, portanto, deve ser tratado e não preso. O advogado
se baseia no resultado do exame de tomografia computadorizada (CAT) do réu que acusou atrofia
cerebral. Um neurologista especialista em exames CAT informa que 30% dos esquizofrênicos são
diagnosticados com atrofia cerebral enquanto que somente 2% dos indivíduos normais recebem o
mesmo diagnóstico. Se 1,5% da população são esquizofrênicos, calcule a probabilidade condicional
do réu ser um esquizofrênico, dado que seu exame CAT revelou atrofia cerebral.
Sejam A:“o indivíduo é esquizofrênico” e, B:“o exame detectou atrofia cerebral”. Temos que
B
0,3
P [A ∩ B] 0,015
0,7
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 3 · 0, 015 0, 0045
= =
0, 3 · 0, 015 + 0, 02 · 0, 985 0, 0242 B
0,985
= 0, 186 0,02
Ac
0,98
Bc
141
19) Em uma grande empresa 60% do total de funcionários são homens. Sabe-se também que 10% dos
homens e 25% das mulheres, trabalham no setor de recursos humanos dessa empresa. Pede-se: Se
aleatoriamente for selecionado um funcionário do setor de recursos humanos, qual é a probabilidade
condicional de que seja uma mulher?
Sejam A:“o indivíduo é do sexo feminino” e, B:“o indivíduo trabalha no setor de recursos humanos
da empresa”. Temos que
P [A] = 0, 4, P [Ac ] = 0, 6 P [B | A] = 0, 25
P [B c | A] = 0, 75, P [B | Ac ] = 0, 1 P [B c | Ac ] = 0, 9
B
0,25
P [A ∩ B] 0,4
0,75
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 25 · 0, 4 0, 1
= =
0, 25 · 0, 4 + 0, 1 · 0, 6 0, 16 B
0,6
= 0, 625 0,1
Ac
0,9
Bc
142
20) Numa espécie de inseto sabe-se que a população é formada por 70% de fêmeas e 30% de machos.
Sabe-se também que 90% das fêmeas e 60% dos machos são estéreis. Calcule a probabilidade de se
amostrar aleatoriamente um inseto não estéril dessa espécie.
P [A] = 0, 7, P [Ac ] = 0, 3 P [B | A] = 0, 9
P [B c | A] = 0, 1, P [B | Ac ] = 0, 6 P [B c | Ac ] = 0, 4
B
0,9
0,1
0,7
P [B ] = P [B |A] P [A] + P [B |A ] P [A ]
c c c c c
Bc
= 0, 1 · 0, 7 + 0, 4 · 0, 3 = 0, 07 + 0, 12
•
= 0, 19
0,3
B
0,6
Ac
0,4
Bc
143
21) Uma indústria inspeciona os itens que fabrica por amostragem, antes de serem enviados aos
compradores. Observações anteriores demonstraram que 8% dos itens inspecionados apresentam
defeito do tipo A, 6% apresentam defeito do tipo B, e 4% apresentam defeito do tipo C. Somente
um defeito pode ocorrer em cada item. Érica seleciona aleatoriamente, um item de um lote a ser
entregue amanhã. Determine a probabilidade de esse item apresentar pelo menos um desses três
defeitos.
Sejam
− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]
= 0, 08 + 0, 06 + 0, 04 − 0 − 0 − 0 + 0
= 0, 18
144
22) A probabilidade de a cadela Nana ganhar massa na próxima semana é de 0,1, e a probabilidade
de sua massa manter-se inalterada é 0,83. Determine a probabilidade de a massa de Nana diminuir
na próxima semana.
Sejam
Note que uma, e apenas uma, das três possibilidades ocorrerá, ou seja, A ∩ B = ∅, A ∩ C = ∅,
B ∩ C = ∅, A ∩ B ∩ C = ∅. Além disso,P [A ∪ B ∪ C] = P [Ω] = 1, logo
− P [A ∩ C] − P [B ∩ C] + P [A ∩ B ∩ C]
= 0, 1 + 0, 83 + P [C] = 0, 93 + P [C] ,
A B
0,1 0,83
0,07
C Ω
Assim
P [C] = 0, 07.
145
23) A probabilidade de sobrevivência nos próximos 30 anos de Nádia é de 0,9 e de seu marido é de
0,8. [A sobrevivência de um não depende da sobrevivência do outro]. Determine a probabilidade de
nenhum dos dois sobreviver aos próximos 30 anos.
Sejam
Assim
= 1 − (0, 9 + 0, 8 − 0, 72) = 1 − 0, 98
= 0, 02.
A 0, 18 0, 72 0, 08 B
0, 02
Assim
P [Ac ∩ B c ] = 0, 02.
146
24) Dentre 20 garotas em uma sala de aula, 8 têm olhos azuis. Marcelo escolhe três garotas, simulta-
neamente, ao acaso. Determine a probabilidade de que duas delas possuam olhos azuis [a outra não
têm olhos azuis].
Considere os eventos
então
6
18
A3
7
19
A2 12
Ac3
18
A1 7
18
A3
8
20 12
19 Ac2 11
Ac3
18
•
7
18
12
8
19
A2 A3
20
11
Ac1 18 Ac3
8
11 18
19 Ac2 A3
10
18 Ac3
e
então
25) Uma urna contém seis cartões numerados de 1 a 6. Esther retira dois cartões ao acaso dessa urna.
Determine a probabilidade de que a soma dos números dos dois cartões seja par, sabendo que um
dos cartões está numerado com o número 4.
Determinemos primeiramente o espaço amostral, para isso consideremos a tabela auxiliar que se
segue.
H C2
HH
1 2 3 4 5 6
C1 HHH
1 −−− (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) −−− (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) −−− (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) −−− (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) −−− (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) −−−
Note que Ω = {(1, 2), (1, 3), · · · , (6, 5)} constituído de n = 30 pontos amostrais.
Sejam A : “a soma dos números mostrados é par” e B : “um dos cartões está numerado com o número
4”. Queremos determinar P [A | B].
Como
A = {(1, 3), (1, 5), (2, 4), (2, 6), (3, 1), (3, 5), (4, 2), (4, 6), (5, 1), (5, 3), (6, 2), (6, 4)}
B = {(1, 4), (2, 4), (3, 4), (5, 4), (6, 4), (4, 1), (4, 2), (4, 3), (4, 5), (4, 6)}
e
A ∩ B = {(2, 4), (4, 2), (4, 6), (6, 4)} ,
n(A ∩ B) 4
P [A ∩ B] = = ,
n 30
n(B) 10
P [B] = = ,
n 30
dessa maneira
4
4 30 120 2
P [A | B] = 30
= · = = .
10
30
30 10 300 5
148
26) Comparando o resultado de dois experimentos, E1 : “lançar dois dados de seis faces não-viciados
e anotar a soma das faces superiores” e E2 : “lançar um dado não viciado de 12 faces e anotar a face
superior, em qual existe a maior probabilidade de um resultado igual a 4”.
HH D2
H
1 2 3 4 5 6
D1 HHH
1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
2 (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Note que Ω1 = {(1, 1), (1, 2), · · · , (6, 6)} constituído de n1 = 36 pontos amostrais.
e note que se A : “soma das faces voltadas para cima é quatro”, então A = {(1, 3), (2, 2), (3, 1)} e
n(A) = 4, dessa forma
n(A) 4 1
P [A] = = = .
n1 36 9
n(B) 1
P [B] = = .
n2 12
Como 1
9
= 0, 1111 > 0, 0833 = 1
12
, a probabilidade de que a soma de dois dados de seis faces resulte
em quatro é maior que a probabilidade de que observe-se o número quatro ao lançarmos um dado
não viciado de 12 faces.
149
27) Francisca realizou uma pesquisa com 680 eleitores, de várias categorias econômicas, a respeito do
seu candidato de preferência. Parte dessa pesquisa revela que
Francisca seleciona uma pessoa aleatoriamente. Determine a probabilidade de que essa pessoa não
ser da classe A e votar no candidato B.
Sejam
P [Ac ∩ B] = P [B] − P [A ∩ B] ,
além disso,
n(B) 136
P [B] = = = 0, 2
n 680
n (A ∩ B) 68
P [A ∩ B] = = = 0, 1
n 680
logo
P [Ac ∩ B] = 0, 2 − 0, 1 = 0, 1.
A 0, 1 0, 1 B
150
28) Em um estudo das necessidades futuras do bairro em que pretende residir, Joana determina dois
eventos fundamentais: A : “haverá investimento público suficiente para evitar enchentes” e B :
“haverá investimento suficiente para a conservação das vias públicas”. Ela estima que P [A ∩ B c ] =
0, 17; P [Ac ∩ B] = 0, 23; P [Ac ∩ B c ] = 0, 07. Determine a probabilidade de “haver investimento
público suficiente para evitar enchentes e também haver investimento suficiente para a conservação
das vias públicas”.
= P [A ∩ B] + 0, 23 + 0, 17 + 0, 07
= P [A ∩ B] + 0, 47,
logo
P [A ∩ B] = 1 − 0, 47 = 0, 53.
A 0, 17 0, 53 0, 23 B
0, 07
151
29) Dentre os 120 alunos que participam da Semana Acadêmica do curso de Ciências Sociais, 40 alunos
presentes se interessam pelo tema “Políticas Públicas e Educação”. Martha seleciona ao acaso três
alunos um após o outro, sem reposição, para participarem de uma ONG que se dedica a melhorar a
educação no país. Determine a probabilidade de o primeiro e o segundo alunos, selecionados, serem
interessados pelo tema “Políticas Públicas e Educação”, e o terceiro aluno não ser interessado nesse
tema.
Considere os eventos
• A : “o primeiro e o segundo alunos, selecionados, serem interessados pelo tema “Políticas Pú-
blicas e Educação”, e o terceiro aluno não ser interessado nesse tema”;
então
38
118
A3
39
119
A2 80
Ac3
118
A1 39
118
A3
40
120 80
119 Ac2 79
Ac3
118
•
39
118
80
40
119
A2 A3
120
79
Ac1 118 Ac3
40
79 118
119 Ac2 A3
78
118 Ac3
e
A = A1 ∩ A2 ∩ Ac3
então
30) Márcio realizou uma pesquisa sobre os fatores considerados necessários para se ter qualidade de
vida, com 500 indivíduos [metade com mais de 60 anos e metade com idade de 25 a 60 anos]. Ele
encontrou:
• Dentre os indivíduos com mais de 60 anos: 100 consideram a saúde e 150 consideram a atividade
física como o fator necessário para se ter qualidade de vida.
Márcio seleciona um desses indivíduos aleatoriamente. Determine a probabilidade de que esse indi-
víduo tenha considerado saúde como fator necessário para se ter qualidade de vida.
Sejam A:“o indivíduo tem mais de 60 anos” e, B:“o indivíduo considera saúde como o fator necessário
para se ter qualidade de vida”. Queremos determinar P [B], assim
P [A] = 250
500
= 0, 5, P [Ac ] = 1 − P [A] = 1 − 250
500
= 0, 5,
P [B | A] = 100
250
= 0, 4, P [B c | A] = 1 − P [B | A] = 0, 6,
P [B | Ac ] = 50
250
= 0, 2, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 8.
B
0,4
0,6
0,5
P [B] = P [B|A] P [A] + P [B|A ] P [A ] c c
Bc
= 0, 4 · 0, 5 + 0, 2 · 0, 5
•
= 0, 3
0,5
B
0,2
Ac
0,8
Bc
153
31) Luana tem dois fisioterapeutas empregados no Studio Pilates. Os atendimentos são divididos
da seguinte maneira: o fisioterapeuta A atende 20% dos pacientes, o fisioterapeuta B atende 30%,
enquanto ela atende os demais (50%) pacientes. A metade dos pacientes do fisioterapeuta A é de
convênios de saúde; um terço dos pacientes do fisioterapeuta B é de convênios de saúde; e também
a metade dos pacientes da Luana é de convênios de saúde. Um paciente é selecionado ao acaso.
Determine a probabilidade de ele ser de convênios de saúde.
Sejam
A
0,5
P [A] = 0, 2, P [D|A] = 0, 5, 0,2
D
0,6667 Dc
P [B] = 0, 3, P [D|B] = 1
= 0, 3333, • 0,3
B
3
0,3333
D
0,5
P [C] = 0, 5, P [D|C] = 0, 5. 0,5 Dc
C
0,5
D
Queremos determinar P [D],
= 0, 5 × 0, 2 + 0, 3333 × 0, 3 + 0, 5 × 0, 5
= 0, 1 + 0, 1 + 0, 25
= 0, 45.
32) Uma pesquisa realizada junto a 450 médicos veterinários mostrou que: 220 desses profissionais
gostam de tomar decisões financeiras, 190 estão dispostos a assumir riscos sérios, e 110 gostam
de tomar decisões financeiras e estão dispostos a assumir riscos sérios. Um médico veterinário é
selecionado ao acaso. Determine a probabilidade de ele estar disposto a assumir riscos, sabendo que
ele gosta de tomar decisões financeiras.
Sejam
P [A ∩ B] = n(A∩B)
n
= 110
450
= 0, 2444.
Note que
= 0, 3333
0, 3333
P [A ∩ B] 0, 2444
P [B | A] = =
P [A] 0, 4889
= 0, 5.
155
Sejam
P [A ∩ B c ] = 20
100
= 0, 2, P [Ac ∩ B] = 30
100
= 0, 3, P [A ∩ B] = n(A∩B)
n
= 40
100
= 0, 4.
n (A) = n (A ∩ B) + n (A ∩ B c ) = 40 + 20 = 60,
= 0, 1
A 0, 2 0, 4 0, 3 B
0, 1
156
34) Em um dos hospitais da cidade de Vila Viçosa em Portugal, 10% dos pacientes são portadores
do vírus H1N1 [e os demais 90% não são portadoras do vírus]. Suponha que exista um teste para
detectar o vírus H1N1 com a seguinte propriedade: 75% das pessoas portadoras do vírus e 5% das
pessoas que não são portadoras do vírus reagem positivamente ao teste. Um paciente desse hospital
é escolhido aleatoriamente. Determine a probabilidade de esse paciente não seja portador do vírus
H1N1, sabendo que ele reagiu positivamente ao teste.
Sejam A:“o paciente é portador do vírus H1N1” e, B:“o teste detecta o vírus H1N1”. Queremos
determinar P [Ac |B], assim
P [B | A] = 0, 75, P [B c | A] = 1 − P [B | A] = 0, 25,
P [B | Ac ] = 0, 05, P [B c | Ac ] = 1 − P [B | Ac ] = 0, 95.
B
0,75
P [Ac ∩ B] 0,1
0,25
P [Ac |B] = Bc
P [B]
P [B|Ac ] P [Ac ]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 05 · 0, 9 0, 045
= =
0, 75 · 0, 1 + 0, 05 · 0, 9 0, 12 B
0,9
= 0, 375 0,05
Ac
0,95
Bc
157
35) Um quartel possui dois tipos de fuzis, os da classe I e os da classe II. Os fuzis da classe I são
modernos e possuem mira melhor, acertando o alvo em 91% das vezes em que se atira com ele. Os
fuzis da classe II são mais antigos e possuem mira pior, acertando o alvo em apenas 55% das vezes
em que se atira com ele. Entretanto, o fuzil II é bem mais barato e 75% dos fuzis do quartel são dessa
classe, enquanto que apenas 25% são da classe I. O soldado João pegou um fuzil, atirou e acertou o
alvo. Determine a probabilidade condicional de que ele tenha utilizado um fuzil da classe I.
B
0,91
P [A ∩ B] 0,25
0,09
P [A|B] = Bc
P [B]
P [B|A] P [A]
=
P [B|A] P [A] + P [B|Ac ] P [Ac ] •
0, 91 · 0, 25 0, 2275
= =
0, 91 · 0, 25 + 0, 55 · 0, 75 0, 64 B
0,75
= 0, 3555 0,55
Ac
0,45
Bc
158
36) Um piloto de Fórmula um (F1) tem 50% de probabilidade de vencer determinada corrida, quando
essa se realiza sob chuva. Caso não chova durante a corrida, sua probabilidade de vitória é de 25%.
Se o serviço de meteorologia estimar em 30% a probabilidade de que chova durante a corrida, qual
é a probabilidade de que esse piloto ganhe a corrida?
Sejam A:“a corrida é realizada sob chuva” e, B:“o piloto vence a corrida”. Queremos determinar
P [B] e temos que
P [A] = 0, 3, P [Ac ] = 0, 7 P [B | A] = 0, 5
P [B c | A] = 0, 5, P [B | Ac ] = 0, 25 P [B c | Ac ] = 0, 75
B
0,5
0,5
0,3
P [B] = P [B|A] P [A] + P [B|Ac ] P [Ac ] Bc
= 0, 5 · 0, 3 + 0, 25 · 0, 7
•
= 0, 325
0,7
B
0,25
Ac
0,75
Bc
159
37) Uma disciplina é constituída de duas turmas, sendo que 39% dos alunos são da turma 01 e os
restantes da turma 02. As turmas são constituídas de alunos de Medicina Veterinária, Geografia,
Ciências Sociais e Economia Doméstica, sendo assim distribuídas:
Turma 01 Turma 02
Ciências Sociais 14% 43%
Economia Doméstica 12% 22%
Geografia 23% 5%
Medicina Veterinária 51% 30%
a) Um aluno de Ciências Sociais é selecionado, determine a probabilidade de que ele seja da Turma
02.
Sejam
Temos que
0,14 E
0,12
A 0,23 G
0,51
0,39 M
•
0,61 C
0,43
Ac 0,22 E
0,05
0,3 G
P [E ∪ C] = P [E] + P [C] − P [E ∩ C] ,
além disso,
= 0, 12 × 0, 39 + 0, 22 × 0, 61
= 0, 181 (2)
161
= 0, 14 × 0, 39 + 0, 43 × 0, 61
= 0, 3169 (3)
Dessa maneira, a probabilidade de que ele curse economia doméstica ou ciências sociais é 0,4979.
P [A ∩ M ] P [M |A] P [A]
P [A|M ] = =
P [M ] P [M |A] P [A] + P [M |Ac ] P [Ac ]
0, 51 × 0, 39
=
0, 51 × 0, 39 + 0, 3 × 0, 61
0, 1989 0, 1989
= =
0, 1989 + 0, 183 0, 3819
= 0, 5208
162
38) Considere o experimento aleatório E: “lançar um dado não viciado uma vez e observar a face
superior” e os eventos:
A = “sair uma face par”; D = “não sair uma face superior a 2”;
B = “sair uma face maior que dois”; F = “sair uma face superior a 6”.
C = “sair uma face que é um número primo”;
a) P [F ] = 1; d) A e D são independentes;
4
b) A e D são mutuamente exclusivos; e) P [C] = ;
6
c) B e C são mutuamente exclusivos; f) n.d.r.a.
Temos que
logo
P [A] = 36 ; P [C] = 36 ; P [F ] = 0
6
= 0.
P [B] = 64 ; P [D] = 62 ;
Desse modo
a) Falso. P [F ] = 0;
b) Verdadeiro. P [A ∩ D] = 1
6
= 3
6
· 2
6
= P [A] · P [D], logo A e D são independentes;
c) Falso. A ∩ D = {2} =
6 ∅, logo A e D não são mutuamente exclusivos;
d) Falso. B ∩ C = {3, 5} =
6 ∅, logo B e C não são mutuamente exclusivos;
3
e) Falso. P [C] = ;
6
f) Falso. d) é verdadeira.
163
39) Sejam A e B dois eventos em Ω. Marque V se a assertiva for verdadeira e F caso contrário e
justifique sua resposta.
c) P [A ∩ B] ≤ P [A];
e) 0 ≤ P [A ∪ B] ≤ 1;
d) Falso. Considere o experimento aleatório E: “lançar um dado uma vez e observar a face superior”
e os eventos:
e) Verdadeiro. Sabemos que a probabilidade de qualquer evento é sempre um número de zero a um,
assim 0 ≤ P [A ∪ B] ≤ 1.
164
40) Uma pesquisa ouviu 10000 habitantes de uma cidade e, verificou que 4087 aprovam as medidas
adotadas pelo vereador A e 3076 aprovam as medidas tomadas pelo vereador B, sendo que 1024 apro-
varam as medidas tomadas por ambos. Selecionado um habitante qualquer dessa cidade, determine:
a) Qual a probabilidade de que ele aprove as medidas tomadas apenas por um vereador? (somente
de A ou somente de B).
Sejam
Temos que
4087 3076 1024
P [A] = = 0, 4087, P [B] = = 0, 3076 e P [A ∩ B] = = 0, 1024.
10000 10000 10000
= P [A] − P [A ∩ B] + P [B] − P [A ∩ B] − 0
= P [A] + P [B] − 2P [A ∩ B]
= 0, 5115
0, 3861
b) Qual a probabilidade de que ele não aprove as medidas tomadas por nenhum dos vereadores?
165
= 1 − 0, 6139 = 0, 3861
ou
A B
0, 3861
Assim
P [Ac ∩ B c ] = 0, 3861
166
P [M ∩ V ∩ Ac ] = P [M ] P [V ] P [Ac ] = 0, 12 · 0, 18 · 0, 3 = 0, 0065.
A M
0,0151
0,0689 0,1109
0,0065
0,0295 0,0475
0,2165
0,5051
V Ω
Assim
P [M ∩ V ∩ Ac ] = 0, 0475.
167
42) Uma pesquisa política social constatou que em certa localidade o percentual de eleitores que se
declaram independentes, liberais e conservadores é de 46%, 30% e 24%, respectivamente. Admita
que 35% dos eleitores independentes, 62% dos eleitores liberais e 58% dos eleitores conservadores
votaram na última eleição. Se um eleitor for escolhido aleatoriamente, dado que ele votou na última
eleição, qual a probabilidade condicional de que ele se declare liberal?
Sejam
Temos que
P [L ∩ V ] 0, 62 · 0, 3 0, 186
P [L | V ] = = =
P [V ] 0, 35 · 0, 46 + 0, 62 · 0, 3 + 0, 58 · 0, 24 0, 4862
= 0, 3826.
V
0,35
I
0,65
Vc
0,46
V
0,62
• 0,3
L
0,38
Vc
0,24
V
0,58
C
0,42
Vc
168
43) Sejam os eventos C = {o time do São Paulo é rebaixado para a série B do Campeonato Brasileiro}
e V = {o time do Vasco é novamente rebaixado para a série B do Campeonato Brasileiro}, tal que
P [C] = 0, 49 e P [V ] = 0, 67. Admita também que esses dois times podem ser rebaixados juntos
nesse mesmo ano, com probabilidade de 0,33. Determine a probabilidade de:
Sejam
Temos que
P [C ∪ V ] = P [C] + P [V ] − P [C ∩ V ]
= 0, 49 + 0, 67 − 0, 33
= 0, 83,
C 0, 16 0, 33 0, 34 V
0, 17
P [C ∪ V ] = 0, 16 + 0, 33 + 0, 34
= 0, 83.
P [(C ∩ V c ) ∪ (C c ∩ V )] = P [C ∩ V c ] + P [C c ∩ V ] − P [(C ∩ V c ) ∩ (C c ∩ V )]
= P [C] − P [C ∩ V ] + P [V ] − P [C ∩ V ] − 0
= P [C] + P [V ] − 2P [C ∩ V ]
= 0, 49 + 0, 67 − 2 · 0, 33
= 0, 5
C 0, 16 0, 33 0, 34 V
0, 17
P [(C ∩ V c ) ∪ (C c ∩ V )] = 0, 16 + 0, 34 = 0, 5
170
44) Um veículo pode ter problemas mecânicos ou elétricos. Se ele tiver problemas mecânicos, não para,
mas se tiver problemas elétricos para imediatamente. A probabilidade de o veículo ter problemas
mecânicos é 0,2. A probabilidade do mesmo veículo ter problemas elétricos é de 0,15 se não houve
problema mecânico precedente, e de 0,25 se houve problema mecânico precedente. Nesse sentido,
dado que o veículo parou em certo dia, qual a probabilidade de que tenha ocorrido defeito mecânico?
a) 0,05 d) 0,29
b) 0,63 e) 0,72
c) 0,13 f) n.d.r.a.
Sejam A : “O carro tem problemas mecânicos” e B : “o carro tem problemas elétricos”. Temos que
P [A] = 0, 2 P [B |A ] = 0, 25 P [B|Ac ] = 0, 15
P [Ac ] = 0, 8 P [B c |A ] = 0, 75 P [B c |A c ] = 0, 85
B
0,25
0,75
0,2
Bc
0,8
B
0,15
Ac
0,85
Bc
0, 25 × 0, 2 0, 05
P [A |B ] = = = 0, 29.
0, 25 × 0, 2 + 0, 15 × 0, 8 0, 17
45) Um baralho comum contém 52 cartas, das quais 4 são ases, sendo um de cada naipe. Se são
retiradas aleatoriamente três cartas desse baralho, qual a probabilidade de saírem exatamente dois
ases se:
Considere os eventos
então
4
52
A3
4
52
A2 48
Ac3
52
A1 4
52
A3
4
52 48
52 Ac2 48
Ac3
52
•
4
52
48
4
52
A2 A3
52
48
Ac1 52 Ac3
4
48 52
52 Ac2 A3
48
52 Ac3
e
então
2
50
A3
3
51
A2 48
Ac3
50
A1 3
50
A3
4
52 48
51 Ac2 47
Ac3
50
•
3
50
48
4
51
A2 A3
52
47
Ac1 50 Ac3
4
47 50
51 Ac2 A3
46
50 Ac3
e
então
CAPÍTULO VII
Distribuições de probabilidade
1) Se 20% dos parafusos produzidos por uma máquina são defeituosos, determinar a probabilidade
de, entre 4 parafusos escolhidos ao acaso, no máximo 2 deles serem defeituosos.
Seja X: “número de parafusos defeituosos produzidos entre 4 amostrados”, note que X é binomial-
mente distribuída, sendo que, X ∼ Bin (4; 0, 2). Desejamos determinar P [X ≤ 2].
Observemos que
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] ,
4
!
P [X = 0] = 0, 20 (1 − 0, 2)4−0 = 1 × 1 × 0, 4096 = 0, 4096;
0
4
!
P [X = 1] = 0, 21 (1 − 0, 2)4−1 = 4 × 0, 2 × 0, 512 = 0, 4096;
1
4
!
P [X = 2] = 0, 22 (1 − 0, 2)4−2 = 6 × 0, 04 × 0, 64 = 0, 1536.
2
Dessa forma,
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2]
= 0, 9728.
174
2) Um fabricante garante que uma caixa de suas peças conterá no máximo 2 itens defeituosos. Se a
caixa contém 20 peças e a experiência tem demonstrado que esse processo de fabricação produz 2
por cento de itens defeituosos, qual a probabilidade de que uma caixa de suas peças não vá satisfazer
a garantia?
As peças do fabricante não satisfarão a garantia se o número de peças defeituosas na caixa for
superior a 2. Seja X: “número de peças defeituosos na caixa que contém 20 peças”, note que X é
binomialmente distribuída, sendo que, X ∼ Bin (20; 0, 02). Desejamos determinar P [X > 2].
Observemos que
P [X > 2] = 1 − P [X ≤ 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) ,
20
!
P [X = 0] = 0, 020 (1 − 0, 02)20−0 = 1 × 1 × 0, 6676 = 0, 6676;
0
20
!
P [X = 1] = 0, 021 (1 − 0, 02)20−1 = 20 × 0, 02 × 0, 6812 = 0, 2725;
1
20
!
P [X = 2] = 0, 022 (1 − 0, 02)20−2 = 190 × 0, 0004 × 0, 6951 = 0, 0528.
2
Dessa forma,
P [X > 2] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])
= 1 − 0, 9929 = 0, 0071.
175
e−2 22 0, 1353 × 4
P [X = 2] = =
2! 2
= 0, 2707.
Meses Acidentes
1 2
3 λ
assim λ1 = 3×2
1
= 6 e Y ∼ Poi (6).
a) Duas vezes;
Seja X: “número de vezes que aparece a face três em 5 lançamentos”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin 5; 61 , pois p = 1
6
= 0, 1667. Desejamos determinar P [X = 2].
5
!
P [X = 2] = 0, 16672 (1 − 0, 1667)5−2 = 10 × 0, 0278 × 0, 5787 = 0, 1608.
2
P [X ≤ 1] = P [X = 0] + P [X = 1] ,
5
!
P [X = 0] = 0, 16670 (1 − 0, 1667)5−0 = 1 × 1 × 0, 4019 = 0, 4019;
0
5
!
P [X = 1] = 0, 16671 (1 − 0, 1667)5−1 = 5 × 0, 1667 × 0, 4823 = 0, 4019.
1
Dessa forma,
P [X ≤ 1] = P [X = 0] + P [X = 1]
= 0, 4019 + 0, 4019
= 0, 8038.
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0] + P [X = 1]) ,
P [X ≥ 2] = 1 − (P [X = 0] + P [X = 1])
= 1 − 0, 8038 = 0, 1962.
177
5) Considere a amostragem de 3 peças que saem de uma linha de produção. Sabe-se que são produzidas
20% de peças defeituosas. Determine
3
!
P [X = 2] = 0, 22 (1 − 0, 2)3−2 = 3 × 0, 04 × 0, 8 = 0, 096.
2
Em b) temos que determinar P [X = 1], pois se temos 2 peças defeituosas em 3 amostradas, então 1
peça é defeituosa.
3
!
P [X = 1] = 0, 21 (1 − 0, 2)3−1 = 3 × 0, 2 × 0, 64 = 0, 384.
1
Em c) devemos determinar o número esperado de peças defeituosas. Sabemos que se X ∼ Bin (n; p)
então E [X] = np, dessa forma, o número esperado de peças defeituosas em 3 peças amostradas é
E [X] = np = 3 · 0, 2 = 0, 6.
178
6) Sabe-se que 24% dos indivíduos que recebem o medicamento X sofrem certos efeitos colaterais. Se
o medicamento X for ministrado a quatro pacientes, qual a probabilidade de que:
a) Nenhum sofra efeitos colaterais; c) Exatamente três não sofram efeitos colaterais.
b) Pelo menos um sofra efeitos colaterais;
Seja X: “número de indivíduos que sofrem efeitos colaterais em 4 amostrados”, note que X é bino-
mialmente distribuída, sendo que, X ∼ Bin (4; 0, 24), pois p = 0, 24.
4
!
P [X = 0] = 0, 240 (1 − 0, 24)4−0 = 1 × 1 × 0, 3336 = 0, 3336.
0
P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,
P [X ≥ 1] = 1 − P [X = 0]
= 1 − 0, 3336
= 0, 6664.
Em c) temos que determinar a probabilidade de que três não sofram efeitos colaterais. Entretanto,
como nossa variável aleatória só conta o número de indivíduos que sofrem efeitos colaterais, e se temos
3 indivíduos que não sofram efeitos colaterais em 4 amostrados, então 1 sofrerá efeitos colaterais.
4
!
P [X = 1] = 0, 241 (1 − 0, 24)4−1 = 4 × 0, 24 × 0, 439 = 0, 4214.
1
179
7) Se amostrarmos 500 casais (marido e esposa) com quatro filhos cada um, quantos casais nós
esperamos que tenham:
Para a resolução de a), utilizaremos duas variáveis aleatórias: X, a qual contará o número de filhos
do sexo masculino e, Y a qual contará o número de famílias com pelo menos um filho homem.
Seja X: “número de homens em uma família com 4 filhos”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (4; 0, 5), pois p = 0, 5.
P [X ≥ 1] = 1 − P [X < 1] = 1 − P [X = 0] ,
4
!
P [X = 0] = 0, 50 (1 − 0, 5)4−0 = 1 × 1 × 0, 0625 = 0, 0625.
0
Dessa forma,
P [X ≥ 1] = 1 − P [X = 0] = 1 − 0, 0625
= 0, 9375.
Seja Y : “número de famílias com pelo menos um filho em 500 amostradas”, note que Y é binomial-
mente distribuída, sendo que, Y ∼ Bin (500; 0, 9375).
Sabemos que se Y ∼ Bin (nY ; pY ) então E [Y ] = nY pY , dessa forma, o número esperado de famílias
com pelo menos um homem em 500 famílias amostradas é
4
!
P [X = 2] = 0, 52 (1 − 0, 5)4−2 = 6 × 0, 25 × 0, 25 = 0, 375.
2
Seja T : “número de famílias com dois filhos em 500 amostradas”, note que T é binomialmente
distribuída, sendo que, T ∼ Bin (500; 0, 375).
Sabemos que se T ∼ Bin (nT ; pT ) então E [T ] = nT pT , dessa forma, o número esperado de famílias
com exatamente dois homens em 500 famílias amostradas é
8) Numa prova com 10 questões de múltipla escolha, cada uma com 5 alternativas e somente uma
correta. Um aluno não estudou e assinala todas as questões inteiramente ao acaso, pede-se:
Em b) desejamos determinar P [X = 5]
10
!
P [X = 5] = 0, 25 (1 − 0, 2)10−5 = 252 × 0, 0003 × 0, 3277 = 0, 0264.
5
181
9) Suponha que a probabilidade de pais terem filhos com distúrbio de atenção seja 0,25. Se selecio-
narmos 6 crianças ao acaso, pede-se:
Seja X: “número de filhos com distúrbio de atenção em 6 selecionados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (6; 0, 25).
Em a) queremos determinar
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] .
6
!
P [X = 0] = 0, 250 (1 − 0, 25)6−0 = 1 × 1 × 0, 178 = 0, 178;
0
6
!
P [X = 1] = 0, 251 (1 − 0, 25)6−1 = 6 × 0, 25 × 0, 2373 = 0, 356;
1
6
!
P [X = 2] = 0, 252 (1 − 0, 25)6−2 = 15 × 0, 0625 × 0, 3164 = 0, 2966;
2
P [X ≤ 2] = P [X = 0] + P [X = 1] + P [X = 2] = 0, 178 + 0, 356 + 0, 2966
= 0, 8306.
Em b) devemos determinar
P [X ≥ 3] = 1 − P [X < 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2]) .
P [X ≥ 3] = 1 − (P [X = 0] + P [X = 1] + P [X = 2])
= 1 − 0, 8306 = 0, 1694
E [X] = np = 6 · 0, 25 = 1, 5,
10) Suponha que a renda familiar em uma comunidade, seja uma distribuição normal com média igual
a R$ 15000 e desvio padrão igual a R$ 2500. Numa amostra de 5 famílias, qual a probabilidade de
que a soma das rendas seja inferior a R$ 60000?
Sejam X : “renda familiar de uma família” e Y : “renda familiar das 5 famílias”. Queremos determinar
P [Y < 60000].
e,
σY2 = |1 × 6250000 + 1 × 6250000
{z
+ · · · + 1 × 6250000} = 5 × 6250000 = 31250000.
5 vezes
60000 µY y
= 0, 5 − 0, 3849
= 0, 1151.
Dessa maneira, a probabilidade de que a renda familiar das 5 famílias seja menor que R$ 60000 é
0,1151.
183
11) Suponha que o tempo de estudo de adultos de certo país apresente distribuição normal com média
de 11 anos e desvio padrão de 2 anos. Determine:
9 11 14 x −1 0 1.5 z
9 − 11 X − 11 14 − 11
P [9 < X < 14] = P < <
2 2 2
= P [−1 < Z < 1, 5] = P [−1 < Z < 0] + P [0 ≤ Z < 1, 5]
= 0, 3413 + 0, 4332
= 0, 7745.
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos esteja entre 9 e 14 anos é
0,7745.
X − 11 15 − 11
P [X > 15] = P [X − 11 > 15 − 11] = P >
2 2
15 − 11 4
= P Z> =P Z> = P [Z > 2]
2 2
= 0, 5 − P [0 ≤ Z ≤ 2] = 0, 5 − 0, 4772
= 0, 0228.
184
11 15 x 0 2 z
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 15 anos é
0,0228.
8 11 x −1.5 0 z
X − 11 8 − 11 3
" #
P [X > 8] = P √ > √ =P Z>−
4 4 2
= P [Z > −1, 5] = P [−1, 5 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1, 5] + 0, 5
= 0, 4332 + 0, 5
= 0, 9332.
Dessa maneira, a probabilidade de que o tempo de estudo dos adultos seja maior que 8 anos é 0,9332.
185
12) O tempo que os alunos gastam para fazer uma prova é normalmente distribuído com média de 72
minutos e desvio padrão de 5 minutos. Determine a probabilidade de um aluno gastar:
Em a) queremos determinar P [X = 72]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 72] = 0.
72 84 x 0 2.4 z
X − 72 84 − 72
P [X > 84] = P [X − 72 > 84 − 72] = P >
5 5
84 − 72 12
= P Z> =P Z> = P [Z > 2, 4]
5 5
= 0, 5 − P [0 ≤ Z ≤ 2, 4] = 0, 5 − 0, 4918
= 0, 0082.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 84 minutos
é 0,0082.
66 72 x −1.2 0 z
X − 72 66 − 72 6
" #
P [X > 66] = P √ > √ =P Z>−
25 25 5
= P [Z > −1, 2] = P [−1, 2 < Z < 0] + P [Z ≥ 0]
= P [0 < Z < 1, 2] + 0, 5
= 0, 3849 + 0, 5
= 0, 8849.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 66 minutos
é 0,8849.
62 72 83 x −2 0 2.2 z
187
62 − 72 X − 72 83 − 72
P [62 < X < 83] = P < <
5 5 5
= P [−2 < Z < 2, 2] = P [−2 < Z < 0] + P [0 ≤ Z < 2, 2]
= 0, 4772 + 0, 4861
= 0, 9633.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 62 e 83 anos
é 0,9633.
60 67 72 x −2.4 −1 0 z
60 − 72 X − 72 67 − 72
P [60 < X < 67] = P < <
5 5 5
= P [−2, 4 < Z < −1] = P [1 < Z < 2, 4]
= 0, 4918 − 0, 3413
= 0, 1505.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 60 e 67
minutos é 0,1505.
188
13) O conteúdo líquido das garrafas de um refrigerante é normalmente distribuído com média de
300 ml e desvio padrão de 2 ml.
b) Se 5 garrafas forem amostradas, qual a probabilidade de que o conteúdo médio das 5 garrafas seja
inferior a 302 ml?
Seja X : “conteúdo líquido das garrafas de refrigerante”, então Xi ∼ N (300; 4). Em a) queremos
determinar P [X < 302].
300 302 x 0 1 z
= 0, 5 + 0, 3413
= 0, 8413.
Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido das garrafas de refrigerante
é inferior a 302 ml é 0,8413.
X 1 + · · · + X5 1
µY = E = (E [X1 ] + · · · + E [X5 ])
5 5
1 5 × 300
= 300 + 300 {z + · · · + 300} = = 300
5 | 5
5 vezes
189
e,
X1 + · · · + X 5 1
σY2 = var = 2 (var [X1 ] + · · · + var [X5 ])
5
5
1 1
= 4| + 4 +{z· · · + 4} = × 20 = 0, 8.
25 25
5 vezes
= 0, 5 + 0, 4875
= 0, 9875.
Dessa maneira, o percentual de garrafas para as quais o conteúdo líquido médio das 5 garrafas de
refrigerante é inferior a 302 ml é 0,9875.
190
Seja X: “número de acidentes de trabalho em 1 mês”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Em a) desejamos determinar P [X ≥ 2]. Sabemos que
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])
e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1
logo
= 1 − 0, 1992
= 0, 8008
Meses Acidentes
1 3
2 λ
P [Y ≤ 1] = P [Y = 0] + P [Y = 1]
191
e−6 60 0, 0025 × 1
P [Y = 0] = = = 0, 0025
0! 1
e−6 61 0, 0025 × 6
P [Y = 1] = = = 0, 0149
1! 1
assim
15) A massa de estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de 5,5 kg.
Determine a probabilidade de que a massa de um estudante seja:
Em a) queremos determinar P [X = 54, 3]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 54, 3] = 0.
= 0, 3315 + 0, 3023
= 0, 6338.
= 0, 9292.
193
Dessa maneira, a probabilidade de que o massa de um estudante seja maior que 57,2 kg é 0,9292.
65.3 71 x 0 1.04 z
X − 65, 3 71 − 65, 3
" #
P [X ≤ 71] = P [X − 65, 3 ≤ 71 − 65, 3] = P √ ≤ √
30, 25 30, 25
71 − 65, 3 5, 7
" # " #
= P Z≤ =P Z≤ = P [Z ≤ 1, 04]
5, 5 5, 5
= P [Z < 0] + P [0 ≤ Z ≤ 1, 04] = 0, 5 + P [0 ≤ Z ≤ 1, 04]
= 0, 5 + 0, 3508
= 0, 8508.
16) Suponha que as notas da disciplina de Estatística estejam normalmente distribuídas com média
5 pontos e variância 4 pontos2 . Pede-se:
3.2 5 x −0.9 0 z
X −5 3, 2 − 5
" #
P [X ≤ 3, 2] = P [X − 5 ≤ 3, 2 − 5] = P √ ≤ √
4 4
3, 2 − 5 −1, 8
= P Z≤ =P Z≤ = P [Z ≤ −0, 9]
2 2
= P [Z ≥ 0, 9] = 0, 5 − P [0 ≤ Z < 0, 9] = 0, 5 − 0, 3159
= 0, 1841.
Dessa maneira, o percentual de notas da disciplina de Estatística que é inferior a 3,2 pontos é 0,1841.
X −5 3−5 2
" #
P [X > 3] = P √ > √ =P Z>−
4 4 2
= P [Z > −1] = P [−1 < Z < 0] + P [Z ≥ 0]
= 0, 8413.
195
3 5 x −1 0 z
Dessa maneira, a probabilidade de que o notas da disciplina de Estatística seja maior que 3 pontos
é 0,8413.
Em c) queremos determinar P [X = 6]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer ponto tem probabilidade zero de acontecer, assim P [X = 6] = 0.
5 6 8 x 0 0.5 1.5 z
6−5 X −5 8−5
P [6 < X < 8] = P < < = P [0, 5 < Z < 1, 5]
2 2 2
= P [0 ≤ Z < 1, 5] − P [0 < Z < 0, 5] = 0, 4332 − 0, 1915
= 0, 2417.
Dessa maneira, a probabilidade de que as notas da disciplina de Estatística esteja entre 6 e 8 pontos
é 0,2417.
196
17) As notas em um teste padronizado seguem distribuição normal com média igual a 100 pontos e
desvio padrão de 10 pontos. Determine a probabilidade de que um indivíduo submetido ao teste
tenha nota:
Em a) queremos determinar P [X = 100]. Note que a variável aleatória X é contínua e, assim sendo,
qualquer valor tem probabilidade zero de acontecer, assim P [X = 100] = 0.
100 120 x 0 2 z
= 0, 0228.
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 120 pontos é
0,0228.
80 100 x −2 0 z
X − 100 80 − 100 20
" #
P [X > 80] = P √ > √ =P Z>−
100 100 10
= P [Z > −2] = P [−2 < Z < 0] + P [Z ≥ 0]
= 0, 9772.
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 80 pontos é
0,9772.
= 0, 8664.
Dessa maneira, a probabilidade de que o notas no teste padronizado esteja entre 85 e 115 pontos é
198
0,8664.
100 110 x 0 1 z
= 0, 5 + 0, 3413
= 0, 8413.
Dessa maneira, o percentual de notas no teste padronizado que é inferior a 110 pontos é 0,8413.
100 x 0 z
Dessa maneira, a probabilidade de que o notas no teste padronizado seja maior que 100 pontos é 0,5.
200
18) Suponha que os diâmetros dos parafusos produzidos por uma fábrica sejam normalmente distri-
buídos com média de 0,25 polegadas e desvio padrão de 0,02 polegadas. Um parafuso é considerado
defeituoso se o seu diâmetro for menor que 0,2 polegadas ou maior que 0,28 polegadas. Encontre a
porcentagem de parafusos defeituosos produzidos pela fábrica.
X − 0, 25 0, 2 − 0, 25 X − 0, 25 0, 28 − 0, 25
" # " #
P [X ≤ 0, 2] + P [X ≥ 0, 28] = P ≤ +P ≥
0, 02 0, 02 0, 02 0, 02
−0, 05 0, 03
" # " #
= P Z≤ +P Z ≥
0, 02 0, 02
= P [Z ≤ −2, 5] + P [Z ≥ 1, 5] = P [Z ≥ 2, 5] + P [Z ≥ 1, 5]
= 0, 0062 + 0, 0668
= 0, 073.
Dessa maneira, a probabilidade de que as notas no teste padronizado seja menor que 0,2 ou maior
que 0,28 pontos é 0,073.
201
19) Suponha que as notas de um exame são normalmente distribuídas com média 76 pontos e desvio
padrão de 15 pontos. Os estudantes que ficarem entre as 15% melhores notas, receberão conceito
A e os estudantes que ficarem entre as 10% piores notas, receberão conceito F . Determine a nota
mínima para um estudante:
0.15 0.15
0.1 0.1
xF 76 xA x zF 0 zA z
X − 76 xF − 76 xF − 76
" # " #
0, 1 = P [X ≤ xF ] = P √ ≤ √ =P Z≤ √
225 225 225
xF − 76 xF − 76
" # " #
= P Z≥− √ = 0, 5 − P 0 ≤ Z < − √
225 225
assim
xF − 76
" #
0, 5 − P 0 ≤ Z < − √ = 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 5 − 0, 1
225
xF − 76
" #
P 0≤Z<− √ = 0, 4
225
202
xF − 76
− √ = 1, 28
225
xF − 76
√ = −1, 28
225
√
xF − 76 = −1, 28 · 225
xF = 76 − 19, 2
xF = 56, 8.
X − 76 xA − 76 xA − 76
" # " #
0, 15 = P [X ≥ xA ] = P √ ≥ √ =P Z≥ √
225 225 225
xA − 76
" #
= 0, 5 − P 0 ≤ Z < √
225
assim
xA − 76
" #
0, 5 − P 0 ≤ Z < √ = 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 5 − 0, 15
225
xA − 76
" #
P 0≤Z< √ = 0, 35
225
xA − 76
√ = 1, 04
225
xA − 76
√ = 1, 04
225
√
xA − 76 = 1, 04 · 225
xA = 76 + 15, 6
xA = 91, 6.
203
20) Uma fábrica de carros sabe que os motores por ela fabricadas tem duração normal com média de
150000 km e desvio padrão de 5000 km.
a) Qual a probabilidade de que um carro tenha motor que dure mais que 150000 km?
b) Qual a probabilidade de que um carro tenha motor que dure menos que 158000 km?
c) Qual a probabilidade de que um carro tenha motor que dure entre 140000 e 159000 km?
d) Se a fábrica substitui o motor que apresente duração inferior a garantia, qual deve ser essa garantia,
para que a porcentagem de motores substituídos seja de 2%?
150000 x 0 z
Dessa maneira, a probabilidade de que a duração do motor seja maior que 150000 quilômetros é 0,5.
= 0, 5 + 0, 4452
= 0, 9452.
= 0, 9413.
Dessa maneira, a probabilidade de que a duração do motor esteja entre 140000 e 159000 km é 0,9413.
0.02 0.02
xG 150000 x zG 0 z
assim
xG − 150000
" #
0, 5 − P 0 ≤ Z < − √ = 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 5 − 0, 02
25000000
xG − 150000
" #
P 0≤Z<− √ = 0, 48
25000000
xG − 150000
−√ = 2, 05
25000000
xG − 150000
√ = −2, 05
25000000
√
xG − 150000 = −2, 05 · 25000000
xG = 150000 − 10250
xG = 139750.
206
21) Um marinheiro recebe um telegrama avisando que sua esposa ainda não deu a luz. Ele não lembra
a data exata que esteve em casa, e refletindo um pouco chegou a conclusão de que tem pelo menos
308 dias que isso ocorreu. Se os prazos de gravidez têm distribuição normal com média de 268 dias
e desvio padrão de 15 dias, pergunta-se: o marinheiro deve se preocupar?
= 0, 0038.
Dessa maneira, a probabilidade de que o prazos de gravidez sejam maiores que 308 dias é 0,0038, e
assim o marinheiro deve sim se preocupar, pois a probabilidade de que ele seja o verdadeiro pai é
baixa.
207
22) Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média
R$ 9000 e desvio padrão R$ 1500. Um depósito é selecionado ao acaso dentre todos os referentes ao
mês em questão. A probabilidade de que o depósito exceda R$ 6000 é de
b) ( ) 94,50% d) ( ) 47,71%
6000 9000 −2 0
= 0, 9772.
Dessa maneira, a probabilidade de que o valor do depósito exceda R$ 6000 é 0,9772, sendo a resposta
correta a letra a).
208
23) Um avião de turismo de 4 lugares pode levar uma carga útil de 360 kg. Supondo que os passageiros
têm massa normalmente distribuída com média de 70 kg e desvio padrão de 20 kg e que a bagagem
de cada passageiro também é normalmente distribuída com média 12 kg e desvio padrão de 5 kg.
Calcule a probabilidade de:
a) Haver sobrecarga se o piloto não mensurar a massa dos passageiros e respectivas bagagens.
b) Que o piloto tenha que retirar pelo menos 50 kg de gasolina para evitar sobrecarga.
Sejam
W = X1 + · · · + X4 + Y1 + · · · + Y4 ,
| {z } | {z }
4 vezes 4 vezes
µW = 1| × 70 + 1 × 70
{z
+ · · · + 1 × 70} + |1 × 12 + 1 × 12
{z
+ · · · + 1 × 12}
4 vezes 4 vezes
= 4 × 70 + 4 × 12 = 280 + 48
= 328
e,
2
σW = 1| × 400 + 1 × 400
{z
+ · · · + 1 × 400} + |1 × 25 + 1 × 25
{z
+ · · · + 1 × 25}
4 vezes 4 vezes
= 4 × 400 + 4 × 25 = 1600 + 100
= 1700.
= 0, 2177.
209
Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 360 quilogramas é 0,2177.
Em b) queremos calcular P [W > 410], pois se o piloto teve que retirar pelo menos 50 kg, então a
massa inicial era, pelo menos 410 kg.
= 0, 0233.
Dessa maneira, a probabilidade de que o massa de 4 passageiros e suas respectivas bagagens sejam
maiores que 410 quilogramas é 0,0233.
210
24) Sabendo que a massa de coelhos (X), é uma variável aleatória normalmente distribuída com média
5 kg e variância 9 kg2 , determine:
a) a probabilidade de que um coelho, selecionado aleatoriamente, tenha massa superior a 2,5 kg.
2.5 5 x −0.83 0 z
X −5 2, 5 − 5 2, 5
" #
P [X > 2, 5] = P √ > √ =P Z>−
9 9 3
= P [Z > −0, 83] = P [−0, 83 < Z < 0] + P [Z ≥ 0]
= 0, 7967.
Dessa maneira, a probabilidade de que o massa de um coelho seja maior que 2,5 kg é 0,7967.
2 5 7.1 x −1 0 0.7 z
211
2−5 X −5 7, 1 − 5
P [2 < X < 7, 1] = P < <
3 3 3
= P [−1 < Z < 0, 7] = P [−1 < Z < 0] + P [0 ≤ Z < 0, 7]
= 0, 5993.
Dessa maneira, a probabilidade de que o massa de um coelho esteja entre 2 e 7,1 kg é 0,5993.
212
25) A delegacia de polícia da cidade de Atlântida recebe em média três chamadas por hora pelo
telefone 190. Calcule a probabilidade de que ela receba no mínimo duas chamadas em uma hora.
Seja X: “número dechamadas recebidas em 1 hora”, note que, X ∼ Poi (3), pois ocorrem em média
λ = 3 acidentes por mês. Desejamos determinar P [X ≥ 2]. Sabemos que
P [X ≥ 2] = 1 − P [X < 2] = 1 − (P [X = 0 + P [X = 1]])
e−3 30 0, 0498 × 1
P [X = 0] = = = 0, 0498
0! 1
e−3 31 0, 0498 × 3
P [X = 1] = = = 0, 1494,
1! 1
logo
= 1 − 0, 1992
= 0, 8008.
213
26) De uma caixa com uma lata de doce de leite defeituosa e 4 perfeitas, Joana retira quatro latas
sucessivamente com reposição. Determine:
Seja X: “número de latas de doce de leite defeituosas em 4 selecionadas”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (4; 0, 2).
4
!
P [X = 4] = 0, 24 (1 − 0, 2)4−4 = 1 × 0, 0016 × 1 = 0, 0016.
4
Em b), note que nossa variável aleatória mede o número de latas defeituosas, entretanto, o exercício
refere-se a latas perfeitas. Se pelo menos uma lata é perfeita, então teremos no máximo 3 latas
defeituosas e, podemos então determinar P [X ≤ 3].
P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
= 1 − P [X > 3] = 1 − P [X = 4] ,
P [X ≤ 3] = 1 − 0, 0016 = 0, 9984.
Outro modo de resolver b) é definir a variável Y : “número de latas de doce de leite perfeitas em 4
selecionadas”, note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (4; 0, 8).
P [Y ≥ 1] = P [Y = 1] + P [Y = 2] + P [Y = 3] + P [Y = 4]
= 1 − P [Y < 1] = 1 − P [Y = 0] ,
4
!
P [Y = 0] = 0, 80 (1 − 0, 8)4−0 = 1 × 1 × 0, 0016 = 0, 0016,
0
logo
P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
214
27) Os registros de venda da loja de Luzia indicam que, historicamente 60% das faturas diárias,
por ela emitidas, são pagas em dia. Nessa semana ela fez sete vendas independentes de um valor
consideravelmente alto, e está preocupada.
a) Determine a probabilidade de que exatamente duas faturas não sejam pagas em dia.
b) Determine a probabilidade de que pelo menos uma das faturas seja paga em dia.
Seja X: “número de faturas pagas em atraso nas 7 vendas”, note que X é binomialmente distribuída,
sendo que, X ∼ Bin (7; 0, 4).
7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613.
2
Em b), note que nossa variável aleatória, definida em a), refere-se ao número de faturas pagas em
atraso, entretanto, o exercício refere-se a faturas pagas em dia. Se pelo menos uma fatura é paga em
dia, então teremos no máximo 6 faturas pagas em atraso e, podemos então determinar P [X ≤ 6].
P [X ≤ 6] = P [X = 0] + · · · + P [X = 6] = 1 − P [X > 6] = 1 − P [X = 7] ,
e como
7
!
P [X = 7] = 0, 47 (1 − 0, 4)7−7 = 1 × 0, 0016 × 1 = 0, 0016.
7
temos
P [X ≤ 6] = 1 − 0, 0016 = 0, 9984.
Outro modo de resolver b) é definir a variável Y : “número de faturas pagas em dia nas 7 vendas”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (7; 0, 6).
P [Y ≥ 1] = P [Y = 1] + · · · + P [Y = 7] = 1 − P [Y < 1] = 1 − P [Y = 0] ,
e
7
!
P [Y = 0] = 0, 60 (1 − 0, 6)7−0 = 1 × 1 × 0, 0016 = 0, 0016,
0
logo
P [Y ≥ 1] = 1 − 0, 0016 = 0, 9984.
215
1
28) Um motorista comprou cinco pneus novos de uma certa marca para o seu carro. Sabe-se que dos
4
pneus dessa marca costumam apresentar defeito e, torna-se importante estudar essa variável, devido
a periculosidade de que haja um acidente por causa de um pneu nesse estado. Qual a probabilidade
de que ele tenha comprado:
Seja X: “número de pneus defeituosos dentre os 5 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (5; 0, 25).
5
!
P [X = 3] = 0, 253 (1 − 0, 25)5−3 = 10 × 0, 0156 × 0, 5625 = 0, 0879.
3
Em b) note que nossa variável aleatória mede o número de pneus defeituosos, entretanto, o exercício
refere-se a pneus perfeitos. Se todos os pneus estão em perfeito estado, então nenhum deles é
defeituoso e, podemos então determinar P [X = 0].
5
!
P [X = 0] = 0, 250 (1 − 0, 25)5−0 = 1 × 1 × 0, 2373 = 0, 2373.
0
Outro modo de resolver b) é definir a variável Y : “número de pneus perfeitos dentre os 5 comprados”,
note que Y é binomialmente distribuída, sendo que, Y ∼ Bin (5; 0, 75).
5
!
P [Y = 5] = 0, 755 (1 − 0, 75)5−5 = 1 × 0, 2373 × 1 = 0, 2373.
5
216
29) Em uma rodovia ocorrem, em média, dois acidentes por mês. Qual a probabilidade de, nos
próximos três meses, ocorrerem exatamente cinco acidentes?
Seja Y : “número de acidentes que ocorrem em 3 meses”. Sabemos que o número médio de acidentes
que ocorre por mês é 2, donde podemos determinar o número médio de acidentes que ocorrem em 3
meses através de uma regra de três, assim,
Meses Acidentes
1 2
3 λ
30) Dada a população de pessoas de um município em que 60% são favoráveis a um certo projeto
municipal, qual a probabilidade de, numa amostra aleatória simples de 4 pessoas dessa população,
encontrarmos exatamente 3 pessoas favoráveis ao projeto?
Seja X: “número de pneus defeituosos dentre os 4 comprados”, note que X é binomialmente distri-
buída, sendo que, X ∼ Bin (4; 0, 6).
4
!
P [X = 3] = 0, 63 (1 − 0, 6)4−3 = 4 × 0, 216 × 0, 4 = 0, 3456.
3
218
31) Numa central telefônica chegam 30 telefonemas em 60 minutos. Qual a probabilidade de que em
6 minutos cheguem 10 telefonemas?
Seja Y : “número de telefonemas recebidos em 6 minutos”. Sabemos que o número médio de telefo-
nemas por minuto é 0,5, donde podemos determinar o número médio de telefonemas ocorrem em 6
minutos através de uma regra de três,
Minutos Telefonemas
1 0,5
6 λ
logo 1 · λ = 6 · 0, 5, e assim λ = 3.
32) Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica tem
alergia aos poluentes lançados ao ar. Calcule a probabilidade de que quatro moradores tenham
alergia dentre treze selecionados ao acaso.
Seja X: “número de moradores que tem alergia dentre os 13 amostrados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (13; 0, 2).
13
!
P [X = 4] = 0, 24 (1 − 0, 2)13−4 = 715 × 0, 0016 × 0, 1342 = 0, 1535.
4
220
33) Suponha que a massa dos habitantes de uma determinada cidade seja uma variável aleatória
normalmente distribuída com média 75 kg e variância 25 kg2 . Na drogaria do senhor Joaquim,
há uma balança que mensura massas de no máximo 160 kg. Se dois moradores forem escolhidos
aleatoriamente, qual a probabilidade de que eles não possam ter massa mensurada de uma só vez
pela balança por excederem o limite de quilogramas suportado pela balança?
= 75 + 75 = 2 × 75 = 150
e,
2
σW = var [X1 + X2 ] = var [X1 ] + var [X2 ]
= 25 + 25 = 2 × 25 = 50
= 50.
= 0, 0793.
Dessa maneira, a probabilidade de que o massa de 2 moradores sejam maiores que 160 quilogramas
é 0,0793.
222
34) Uma central telefônica recebe, em média, 90 telefonemas em 60 minutos. Qual a probabilidade
de que em 2 minutos ela receba 2 telefonemas?
90 telefonemas
m= = 1, 5 telefonemas/minuto.
60 minutos
Minutos Telefonemas
1 1,5
2 λ
λ = 1, 5 × 2 = 3,
e−3 32
P [Y = 2] = = 0, 224.
2!
223
35) Um empresário pretende estabelecer uma firma para montagem de um componente mecânico.
Cada peça é composta de duas partes, A e B, cada uma com uma chance específica de ser defeituosa.
Só é possível verificar a qualidade das peças depois que elas são montadas. Se ambas são defeituosas,
a peça é descartada e dá um prejuízo de R$ 15. Se a peça B é defeituosa e A é perfeita, ainda é
possível reparar a peça e obter um lucro de R$ 20. De maneira semelhante, se A é defeituosa e B é
perfeita, o reparo permite vender a peça inteira com um lucro de R$ 30. Se as duas peças são boas,
o lucro é de R$ 40. Sendo A : “a peça A é perfeita”, B : “a peça B é perfeita” e
P [Ac ∩ B] = 0, 25 P [Ac ∩ B c ] = 0, 15
P [A ∩ B] = 0, 4 P [A ∩ B c ] = 0, 2
determine:
a) a distribuição do lucro;
Seja X : “lucro obtido por peça”. Temos que os possíveis valores obtidos para X são:
• se as peças A e B são defeituosas (Ac ∩ B c ), o “lucro” é −15, o que ocorre com probabilidade
0,15;
• se peça se A é defeituosa e B é perfeita (Ac ∩ B), o lucro é 30, o que ocorre com probabilidade
0,25;
• se as peças A e B são perfeitas (A ∩ B), o lucro é 40, o que ocorre com probabilidade 0,4;
x −15 20 30 40 Total
P [X = x] 0, 15 0,2 0,25 0,4 1
n
E [X] = xi P [X = xi ] = x1 P [X = x1 ] + x2 P [X = x2 ] + x3 P [X = x3 ] + x4 P [X = x4 ]
X
i=1
= −15 × 0, 15 + 20 × 0, 2 + 30 × 0, 25 + 40 × 0, 4 = 25, 25, (1)
h i n
E X2 = x2i P [X = xi ] = x21 P [X = x1 ] + x22 P [X = x2 ] + x23 P [X = x3 ] + x24 P [X = x4 ]
X
i=1
= (−15)2 × 0, 15 + 202 × 0, 2 + 302 × 0, 25 + 402 × 0, 4 = 978, 75. (3)
h i
var [X] = E X 2 − (E [X])2
= 341, 1875.
225
36) A probabilidade de ocorrência de turbulência em um determinado percurso a ser feito por uma
aeronave é 0,4 em um circuito diário. Seja X : “número de voos com turbulência em um total de 7
desses voos”. Pede-se:
Seja X: “número de voos com turbulência dentre os 7 estudados”, note que X é binomialmente
distribuída, sendo que, X ∼ Bin (7; 0, 4). Queremos determinar P [X ≤ 3] sendo que,
P [X ≤ 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
7
!
P [X = 0] = 0, 40 (1 − 0, 4)7−0 = 1 × 1 × 0, 028 = 0, 028,
0
7
!
P [X = 1] = 0, 41 (1 − 0, 4)7−1 = 7 × 0, 4 × 0, 0467 = 0, 1306,
1
7
!
P [X = 2] = 0, 42 (1 − 0, 4)7−2 = 21 × 0, 16 × 0, 0778 = 0, 2613,
2
7
!
P [X = 3] = 0, 43 (1 − 0, 4)7−3 = 35 × 0, 064 × 0, 1296 = 0, 2903,
3
assim
= 0, 7102
Sabemos que se X ∼ Bin (n; p) então E [X] = np, dessa forma, o número de voos com turbulência
dentre os 7 estudados é
E [X] = np = 7 · 0, 4 = 2, 8.
226
37) O gerente de uma franquia observou que o tempo de permanência de clientes na fila de pagamento
segue uma distribuição normal com média igual a 6 minutos e variância igual a 4 minutos2 . Determine
a probabilidade de que:
Queremos determinar P [X = 4]. Note que a variável aleatória X é contínua e, assim sendo, qualquer
ponto tem probabilidade zero de acontecer, assim P [X = 4] = 0.
4 6 8 x −1 0 1 z
4−6 X −6 8−6
P [4 < X < 8] = P < <
2 2 2
= P [−1 < Z < 1] = P [−1 < Z < 0] + P [0 ≤ Z < 1]
= 0, 6826.
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova esteja entre 4 e 8 minutos
é 0,6826.
X −6 4−6 2
" #
P [X ≥ 4] = P √ ≥ √ =P Z≥−
4 4 2
= P [Z ≥ −1] = P [−1 ≤ Z < 0] + P [Z ≥ 0]
= P [0 ≤ Z < 1] + 0, 5 = 0, 3413 + 0, 5
= 0, 8413.
227
4 6 x −1 0 z
Dessa maneira, a probabilidade de que o tempo gasto na resolução da prova seja maior que 4 minutos
é 0,8413.
228
38) A massa de uma caixa de peças é uma variável aleatória normal com média de 65 kg e desvio
padrão de 4 kg. Um carregamento de 120 caixas de peças selecionadas aleatoriamente é feito. Qual
é a probabilidade de que a carga tenha massa entre 7850 kg e 7900 kg?
Considere a variável Xi : “massa da carga”, para 1 ≤ i ≤ 120, dessa forma Xi ∼ N (65; 16). Seja Y =
X1 + X2 + · · · + X120 a variável que mede a massa das 120 caixas. Sabemos que Y ∼ N (7800; 1920),
pois
µY = 1 × 65 + 1 × 65 + · · · + 1 × 65 = 120 × 65 = 7800
e,
σY2 = 1 × 16 + 1 × 16 + · · · + 1 × 16 = 120 × 16 = 1920.
P [7850 < Y < 7900] = P [7850 − 7800 < Y − 7800 < 7900 − 7800]
7850 − 7800 Y − 7800 7900 − 7800
" #
= P √ < √ < √
1920 1920 1920
7850 − 7800 7900 − 7800
" #
= P <Z<
43, 8178 43, 8178
= P [0 ≤ Z < 2, 28] − P [0 ≤ Z < 1, 14]
= 0, 4887 − 0, 3729
= 0, 1158.
Dessa maneira, a probabilidade de que a massa da carga esteja entre 7850 kg e 7900 kg é 0,1158.
229
39) Em determinado setor de uma loja de departamentos, o número de produtos vendidos em um dia
pelos funcionários é uma variável aleatória discreta, com a seguinte distribuição de probabilidades:
Número de produtos 0 1 2 3 4 5 6
Probabilidade de venda 0,1 0,4 0,2 0,1 0,1 0,05 0,05
E [X] = 0 × 0, 1 + 1 × 0, 4 + 2 × 0, 2 + 3 × 0, 1 + 4 × 0, 1 + 5 × 0, 05 + 6 × 0, 05
= 2, 05,
e, para o cálculo de var [X], precisamos encontrar também E [X 2 ], o que faremos a seguir.
h i
E X2 = 02 × 0, 1 + 12 × 0, 4 + 22 × 0, 2 + 32 × 0, 1 + 42 × 0, 1 + 52 × 0, 05 + 62 × 0, 05
= 6, 75.
h i
var [X] = E X 2 − (E [X])2
= 6, 75 − (2, 05)2 = 6, 75 − 4, 2
= 2, 55.
40) Suponha que, em média, uma delegacia de uma pequena cidade prenda um indivíduo a cada dois
dias com sintomas de embriaguez. As probabilidades de que:
• em um certo dia sejam presos pelo menos dois indivíduos com sintomas de embriaguez;
Seja X : “número de indivíduos presos por dia com sintomas de embriaguez”, X ∼ Poi (0, 5) e,
queremos determinar P [X ≥ 2],
P [X ≥ 2] = 1 − P [X < 2] = 1 − P [X = 0] − P [X = 1]
e−0,5 0, 50 0, 6065 × 1
P [X = 0] = = = 0, 6065
0! 1
e−0,5 0, 51 0, 6065 × 0, 5
P [X = 1] = = = 0, 3033
1! 1
P [X ≥ 2] = 1 − 0, 6065 − 0, 3033 = 0, 0902
Dessa forma, a probabilidade de que sejam presos pelo menos dois indivíduos com sintomas de
embriaguez em um dia é 0,0902.
Seja Y : “número de indivíduos presos em uma semana com sintomas de embriaguez”, Y ∼ Poi (3, 5)
e, queremos determinar P [Y = 4],
Dessa forma, a probabilidade de que sejam presos 4 indivíduos em uma semana com sintomas de
embriaguez é 0,1888.
41) Com o objetivo de realizar uma análise da variação temporal e espacial dos registros de furto em
determinada cidade, foram consultados os dados fornecidos pela Gerência de Estatística e Análise
Criminal da mesma. Obteve-se a informação de que nas madrugadas de sábado, em um dos bairros
mais perigosos da cidade, 34% dos indivíduos que andam sozinhos têm seus objetos furtados. Se 9
pessoas passarem sozinhas por esse bairro na madrugada de sábado, qual a probabilidade de pelo
menos 7 delas sofrerem algum tipo de furto?
Seja X : “número de pessoas que sofreram algum furto em 9 selecionadas”. Desejamos determinar
P [X ≥ 7].
Note que
P [X ≥ 7] = P [X = 7] + P [X = 8] + P [X = 9] , (4)
assim
9
!
P [X = 7] = 0, 347 (1 − 0, 34)9−7 = 0, 0082, (5)
7
9
!
P [X = 8] = 0, 348 (1 − 0, 34)9−8 = 0, 0011, (6)
8
9
!
P [X = 9] = 0, 349 (1 − 0, 34)9−9 = 0, 0001. (7)
9
42) Um estudo realizado por geógrafos e climatologistas dos Estados Unidos constatou que a categoria
4 de furacões (segundo a escala de classificação Saffir - Simpson), com ventos entre 209 a 251 km/h,
ataca o Estado da Flórida a uma taxa média de um em cada quatro anos. Nesse sentido, qual a
probabilidade da Flórida ser atingida por três furacões em uma década?
Sabemos que a média do número de furacões em 4 anos é 1, donde podemos determinar a média do
número de furacões em 10 anos através de uma regra de três, assim,
Anos Furacões
4 1
10 λ
1 × 10
e, efetuando-se a regra de três chegamos a λ = = 2, 5.
4
Seja X : “número de furacões em 10 anos”. Queremos determinar P [X = 3], dessa forma:
e−2,5 2, 53
P [X = 3] =
3!
0, 0821 × 15, 625
=
6
= 0, 2138.
233
43) A regra é clara: álcool e direção não têm espaço no mesmo jogo. O fato é que, mesmo que todo
mundo saiba disso, os acidentes de trânsito causados por pessoas embriagadas continuam aconte-
cendo. O excesso de velocidade é outro fator preocupante. Quanto maior a velocidade de um veículo
maior será a distância que ele ainda percorrerá com os freios acionados. Aliando-se excesso de álcool
e de velocidade temos um fator preocupante a ser considerado. Suponha que um indivíduo, dirigindo
sóbrio a 54 km/h, após a visualização de um obstáculo percorra, em média, 40 m até a parada total
do veículo, com variância de 16 m2 . Suponha também que um indivíduo alcoolizado a mesma velo-
cidade, após a visualização de um obstáculo percorra, em média, 65 m até a parada total do veículo,
com variância de 81 m2 . Se em ambos os casos, a distância percorrida segue distribuição normal,
determine:
Seja X : “distância percorrida pelo motorista sóbrio”, então X ∼ N (40; 16). A padronização é a
seguinte:
X − µX X − 40
Z= = ∼ N (0; 1) ,
σX 4
e queremos determinar P [X > 50].
X − 40 50 − 40
P [X > 50] = P [X − 40 > 50 − 40] = P >
4 4
50 − 40
= P Z> = P [Z > 2, 5]
4
= 0, 5 − P [0 ≤ Z ≤ 2, 5] = 0, 5 − 0, 4938
= 0, 0062.
Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista sóbrio é
0,0062.
Seja Y : “distância percorrida pelo motorista alcoolizado”, então Y ∼ N (65; 81). A padronização é
a seguinte:
Y − 65 Y − 65
Z= = ∼ N (0; 1) ,
9 9
234
Y − 65 50 − 65
P [Y > 50] = P [Y − 65 > 50 − 65] = P >
9 9
50 − 65
= P Z> = P [Z > −1, 6667]
9
= 0, 5 + P [0 ≤ Z ≤ 1, 6667] = 0, 5 + 0, 4525
= 0, 9525.
Dessa maneira, a probabilidade de que o pedestre venha a ser atropelado pelo motorista alcoolizado
é 0,9525.
235
44) Suponha que a quantidade de correspondências eletrônicas recebidas por dia em uma empresa é
normalmente distribuída com média de 4000 e-mails e desvio padrão de 200 e-mails. Pede-se:
= 0, 5 − 0, 4599
= 0, 0401.
b) Se um determinado mês tem 31 dias, em quantos desses dias espera-se receber menos de 3650
e-mails?
X
Admita a combinação linear W = − 3Y e calcule:
2
a) E [W ];
1 1 1
E [W ] = E X − 3Y = E X − E [3Y ] = E [X] − 3E [Y ]
2 2 2
1
= · 48 − 3 · 6 = 24 − 18
2
= 6
b) var [W ];
1 1 1
var [W ] = var X − 3Y = var X + var [3Y ] − 2 cov X, 3Y
2 2 2
1 1
2
= var [X] + (3)2 var [Y ] − 2 · · 3 cov [X, Y ]
2 2
1
= var [X] + 9 var [Y ] − 3 · 0
4
1
= · 16 + 9 · 9 − 0 = 4 + 81
4
= 85
c) P [12 ≤ W ≤ 21].
6 12 21 x 0 0.65 1.63 z
237
= 0, 4484 − 0, 2422
= 0, 2062.
CAPÍTULO VIII
Testes de hipóteses
1) Com o objetivo de testar a influência do olfato sobre o sono dos recém nascidos, foi registrado o
tempo (em minutos) que um bebê com uma semana demora para adormecer. Foi considerado dois
grupos de bebês: grupo I (em que se colocou no berço uma peça de roupa utilizada pela mãe) e grupo
II (em que se colocou no berço uma peça de roupa utilizada por outra pessoa), sendo que é esperado
que as crianças do grupo I adormeçam mais rapidamente. Os resultados dos tempos médios obtidos
encontram-se no quadro seguinte:
em que n é o número de elementos amostrados em cada grupo. Sabendo que a variável em estudo
segue uma distribuição normal, e que as variâncias populacionais são iguais, teste se existe diferença
significativa entre o tempo médio que os dois grupos de bebês levaram para adormecer, ao nível de
5% de significância.
Sejam X1 : “tempo que bebês do grupo I levam para adormecer” e X2 : “tempo que bebês do grupo
II levam para adormecer”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias
populacionais são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste unilateral à esquerda)
: µ1 < µ2
H
1
X̄1 − X̄2
T =s ∼ t(ν) ,
1 1
Sc2 +
n1 n2
sendo ν = n1 + n2 − 2 e,
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2
239
−2,66 −1,7341 0
5, 7 − 8, 3
tcal = s = −2, 66.
1 1
4, 7885 +
10 10
Note que esse valor obtido já encontra-se na Figura 1, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que o tempo que bebês do grupo I levam para adormecer é inferior ao tempo que bebês
do grupo II levam para adormecer, ao nível de 5% de significância.
240
2) Um fabricante de queijo compra leite de uma série de fornecedores. Ele desconfia que alguns
desses fornecedores estão adicionando água ao leite para aumentar os seus lucros. O excesso de água
pode ser determinado pelo aumento da temperatura de congelamento do leite, que é em média de
−0, 545 ◦ C. Para testar esse fato, foram coletadas 6 amostras de lotes consecutivos de um fornecedor,
apontando uma média de −0, 5333 ◦ C com desvio padrão de 0, 0058 ◦ C. Supondo que a temperatura
de congelamento seja normalmente distribuída, podemos concluir que esse fornecedor adiciona água
ao leite, ao nível de 2,5% de significância?
X̄ − µ0
P2) Temos que α = 0, 025 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 6 − 1 = 5 e ttab = t(5;2,5%) = 2, 5706. Assim a região crítica é:
RC = {t ∈ R| t > 2, 5706} ,
0 2,5706 4,94
Note que esse valor obtido já encontra-se na Figura 2, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, há indícios de que a temperatura de congelamento do leite aumentou e, assim há indícios de
que esteja ocorrendo adicionamento de água ao leite.
242
3) Dois grupos de pacientes estão sendo estudados quanto a quantidade de colesterol “ruim” (LDL).
O primeiro grupo (X1 ) não praticava atividades físicas, enquanto que o segundo grupo (X2 ) foi
submetido a um rigoroso programa de atividades físicas. Supondo que a quantidade de colesterol
ruim é normalmente distribuída e com mesma variância populacional, determine com base na tabela
abaixo se o programa de atividades físicas foi eficaz no controle do colesterol ruim, ao nível de 1%
de significância.
Sejam X1 : “quantidade de colesterol do grupo que não praticava exercícios físicos” e X2 : “quantidade
de colesterol do grupo que praticava exercícios físicos”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ),
além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t de Student
para duas médias.
H : µ1 = µ2
0
P1) (Teste unilateral à direita)
: µ1 > µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 14 + 9 − 2 = 21 e ttab = t(21;1%) = 2, 5176. Assim a região crítica é:
RC = {t ∈ R| t > 2, 5176} ,
X̄1 = 162, 85, X̄2 = 153, 71, S12 = 8, 112 = 65, 7721, S22 = 6, 872 = 47, 1969,
162, 85 − 153, 71
tcal = s = 2, 79.
1 1
58, 6958 +
14 9
243
0 2,5176 2,79
Note que esse valor obtido já encontra-se na Figura 3, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
a quantidade de colesterol do grupo que não praticava exercícios físicos é estatisticamente maior para
o primeiro grupo, portanto, o programa de testes físicos foi eficaz no controle do colesterol ruim, ao
nível de 1% de significância.
244
4) Oito alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a 100) em relação
à sua Universidade, obtendo-se os seguintes resultados:
Média Variância
70,38 244,84
Sabendo que o grau de satisfação é normalmente distribuído, teste a hipótese de que o grau de
satisfação médio é igual a 72, ao nível de 5% de significância.
Seja X : “grau de satisfação em relação à sua Universidade”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.
H : µ = 72
0
P1) (Teste bilateral)
: µ 6= 72
H
1
X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;5%) = 2, 3646. Assim a região crítica é:
√
P4) Temos que X̄ = 70, 38 e SX = 244, 84 = 15, 6474, assim
70, 38 − 72
tcal = 15, 6474 = −0, 29.
√
8
Note que esse valor obtido já encontra-se na Figura 4, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que o grau de satisfação em relação à sua Universidade aumentou e, assim
não há indícios de que o grau de satisfação em relação à sua Universidade difira de 72.
246
5) O tempo médio de vida de uma lâmpada incandescente sob condições normais de funcionamento é
de 356 horas. Uma nova lâmpada apareceu recentemente no mercado e foi realizado um teste com dez
dessas lâmpadas e o tempo médio de vida foi de 380 horas com variância de 918,09 horas2 . Verifique
se o tempo de vida dessa lâmpada difere do tempo de vida das demais lâmpadas incandescentes.
Adote o nível de significância de 1%.
Seja X : “tempo médio de vida da nova lâmpada incandescente”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.
H : µ = 356
0
P1) (Teste bilateral)
: µ 6= 356
H
1
X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;1%) = 3, 4995. Assim a região crítica é:
√
P4) Temos que X̄ = 380 e SX = 918, 09 = 30, 3, assim
380 − 356
tcal = 30, 3 = 2, 24.
√
8
247
Note que esse valor obtido já encontra-se na Figura 5, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o tempo médio de vida da nova lâmpada incandescente difira do tempo
médio de vida das lâmpadas padrão, ao nível de 1% de significância.
248
6) Realize um teste de qui-quadrado com os dados apresentados na tabela abaixo, para decidir se a
resposta sim ou não independe da pergunta ser a primeira ou a segunda. Utilize o nível de significância
de 5%.
Pergunta
Resposta Primeira Segunda
Sim 120 80
Não 95 105
H0 : Pergunta e Resposta são independentes
P1)
H : Pergunta e Resposta não são independentes
1
h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,
RNRH0 RRH0
0 3,8415 6,2854
n = 400,
200 × 215 200 × 185
Fe11 = = 107, 5, Fe12 = = 92, 5,
400 400
200 × 215 200 × 185
Fe21 = = 107, 5, Fe22 = = 92, 5.
400 400
Assim
Pergunta
Resposta Primeira Segunda Total
Sim 120(107,5) 80(92,5) (200)
Não 95(107,5) 105(92,5) (200)
Total (215) (185) (400)
Dessa forma
(120 − 107, 5)2 (80 − 92, 5)2 (95 − 107, 5)2 (105 − 92, 5)2
χ2cal = + + +
107, 5 92, 5 107, 5 92, 5
156, 25 156, 25 156, 25 156, 25
= + + +
107, 5 92, 5 107, 5 92, 5
= 1, 4535 + 1, 6892 + 1, 4535 + 1, 6892
∼
= 6, 2854
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Pergunta e Resposta não são independentes, ao nível de 5% de significância.
250
7) Realizou-se uma pesquisa com os proprietários de certa marca de automóvel com o intuito de saber
a opinião deles acerca do desempenho e do consumo de combustível de seus carros. O resultado da
pesquisa de opiniões é resumido na tabela abaixo:
Desempenho
Consumo Ruim Bom
Alto 55 45
Baixo 70 30
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,
n = 200,
Assim
251
RNRH0 RRH0
0 4,8 6,6349
Desempenho
Consumo Ruim Bom Total
Alto 55(62,5) 45(37,5) (100)
Baixo 70(62,5) 30(37,5) (100)
Total (125) (75) (200)
Dessa forma
(55 − 62, 5)2 (45 − 37, 5)2 (70 − 62, 5)2 (30 − 37, 5)2
χ2cal = + + +
62, 5 37, 5 62, 5 37, 5
56, 25 56, 25 56, 25 56, 25
= + + +
62, 5 37, 5 62, 5 37, 5
= 0, 9 + 1, 5 + 0, 9 + 1, 5
∼
= 4, 8
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que Desempenho e Consumo são independentes, ao nível de 1% de signifi-
cância.
252
8) Os 36 alunos de uma turma são divididos ao acaso em dois grupos de 18. Para o primeiro grupo
o ensino de Matemática é feito usando elementos de multimídia. Enquanto isso, no segundo grupo
o ensino é feito pelo método tradicional. No final do período é aplicado um teste, comum aos dois
grupos, com os seguintes resultados:
Tamanho amostral Média Variância
Grupo 1 18 6,622 2,32
Grupo 2 18 5,744 0,74
Sejam X1 : “desempenho dos alunos do primeiro grupo” e X2 : “desempenho dos alunos do segundo
grupo”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.
H0 : µ1 = µ2
P1) (Teste unilateral à direita)
H : µ > µ
1 1 2
X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 18 − 2 = 34 e ttab = t(34;5%) = 1, 6909. Assim a região crítica é:
RC = {t ∈ R| t > 1, 6909} ,
(18 − 1) 2, 32 + (18 − 1) 0, 74
Sc2 =
18 + 18 − 2
52, 02
= = 1, 53.
34
6, 622 − 5, 744
tcal = s = 2, 13.
1 1
1, 53 +
18 18
Note que esse valor obtido já encontra-se na Figura 8, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
253
0 1,6909 2,13
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
o desempenho dos alunos do primeiro grupo é estatisticamente maior que o desempenho do segundo
grupo, portanto, o programa de ensino com elementos de multimídia apresentou-se superior ao ensino
tradicional, ao nível de 5% de significância.
254
9) Considere a tabela abaixo, na qual estão os resultados de um estudo que investiga a efetividade
dos capacetes de segurança de bicicleta na prevenção de lesões na cabeça. Os dados consistem de
uma amostra aleatória de 793 indivíduos envolvidos em acidentes ciclísticos durante um período
especificado de um ano.
Uso de capacete
Lesão na cabeça Sim Não
Sim 17 218
Não 130 428
Para examinar a efetividade dos capacetes de segurança de bicicleta, desejamos saber se há associação
entre o incidente de lesão na cabeça e o uso dos capacetes pelos indivíduos envolvidos em acidentes.
Efetue um teste de significância ao nível de 1% de significância.
H : Uso de capacete e Lesão na cabeça são independentes
0
P1)
: Uso de capacete e Lesão na cabeça não são independentes
H
1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,
n = 793,
RNRH0 RRH0
0 6,6349 28,2555
Uso de capacete
Lesão na cabeça Sim Não Total
Sim 17(43,5624) 218(191,4376) (235)
Não 130(103,4376) 428(454,5624) (558)
Total (147) (646) (793)
Assim
Dessa forma
(17 − 43, 5624)2 (218 − 191, 4376)2 (130 − 103, 4376)2 (428 − 454, 5624)2
χ2cal = + + +
43, 5624 191, 4376 103, 4376 454, 5624
705, 5611 705, 5611 705, 5611 705, 5611
= + + +
43, 5624 191, 4376 103, 4376 454, 5624
= 16, 1966 + 3, 6856 + 6, 8211 + 1, 5522
∼
= 28, 2555
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Uso de capacete e Lesão na cabeça não são independentes, ao nível de 1% de
significância.
256
10) Dois grupos de estudantes fizeram exames finais de estatística. Somente um grupo recebeu pre-
paração formal para o exame; o outro leu o texto recomendado, mas nunca compareceu às aulas. Os
resultados obtidos ao final do curso foram:
Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18
Os dados mostram evidências suficientes para afirmar que existe associação entre frequência às aulas
e aprovação no exame final? Use nível de significância igual a 5%.
H0 : Frequência e Situação são independentes
P1)
H : Frequência e Situação não são independentes
1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,
n = 58,
32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58
Assim
257
RNRH0 RRH0
0 3,8415 8,287
Frequência
Situação Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)
Dessa forma
(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649
∼
= 8, 287
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Frequência e Situação não são independentes, ao nível de 5% de significância.
258
11) A máquina de encher garrafas de refrigerantes de uma determinada empresa está regulada para
fazê-lo sob um modelo normal, colocando 290 ml no recipiente. Para verificar se a máquina estava
regulada, selecionou-se aleatoriamente uma amostra de 8 refrigerantes obtendo-se os seguintes valores:
X̄ − µ0
P2) Temos que α = 0, 1 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
S
√X
n
P3) Temos que ν = n − 1 = 8 − 1 = 7 e ttab = t(7;10%) = 1, 8946. Assim a região crítica é:
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que a quantidade de líquido colocada pela máquina na garrafa de refrigerante
difira de 290 ml, ao nível de 10% de significância.
260
12) Na tabela a seguir é apresentado um resumo de um estudo conduzido com alguns estudantes.
Foram amostrados 200 homens e esses foram categorizados quanto ao hábito de fumar e praticar
exercícios físicos. Teste a hipótese de que o hábito de fumar e o hábito de praticar exercícios físicos
são duas variáveis aleatórias independentes. Adote um nível de significância de 5% e MF=“Muito
frequente”; FR=“Frequente”; OC=“Ocasionalmente”; N=“Nunca.”
H : Hábito de fumar e Hábito de praticar exercícios são independentes
0
P1)
: Hábito de fumar e Hábito de praticar exercícios não são independentes
H
1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 12, 5916 ,
Assim
261
RNRH0 RRH0
0 11,7821 12,5916
Dessa forma
(7 − 12, 25)2 (10 − 12)2 (13 − 11, 5)2 (20 − 14, 25)2 (24 − 24, 5)2 (23 − 24)2
χ2cal = + + + + +
12, 25 12 11, 5 14, 25 24, 5 24
(25 − 23) 2
(28 − 28, 5)2
(18 − 12, 25)2
(15 − 12) 2
(8 − 11, 5)2
(9 − 14, 25)2
+ + + + + +
23 28, 5 12, 25 12 11, 5 14, 25
27, 5625 4 2, 25 33, 0625 0, 25 1 4 0, 25 33, 0625 9
= + + + + + + + + +
12, 25 12 11, 5 14, 25 24, 5 24 23 28, 5 12, 25 12
12, 25 27, 5625
+ +
11, 5 14, 25
= 2, 25 + 0, 3333 + 0, 1957 + 2, 3202 + 0, 0102 + 0, 0417 + 0, 1739 + 0, 0088 + 2, 699 + 0, 75
+ 1, 0652 + 1, 9342
∼
= 11, 7821
262
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que Hábito de fumar e Hábito de praticar exercícios são independentes, ao
nível de 5% de significância.
263
13) O tempo médio, por operário, para executar uma tarefa tem sido 100 minutos. Introduziu-se uma
modificação para diminuir esse tempo médio e, após certo período, sorteou-se uma amostra de 16
operários, medindo-se o tempo de execução de cada um. Nessa amostra, o tempo médio foi de 95
minutos e com desvio padrão de 12 minutos. Realize um teste de hipóteses para verificar se esses
resultados trazem evidências estatísticas da melhora desejada, ao nível de 1% de significância.
Seja X : “tempo que o operário leva para executar a tarefa”, então X ∼ N (µ; σ 2 ) com σ 2 desconhe-
cido, dessa forma, podemos aplicar o teste t de Student para uma média.
H : µ = 100
0
P1) (Teste unilateral à esquerda)
: µ < 100
H
1
X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 16 − 1 = 15 e ttab = t(15;1%) = 2, 6025. Assim a região crítica é:
−2,6025 −1,67 0
Figura 13: Região crítica do teste t, para uma média, unilateral à esquerda.
95 − 100
tcal = 12 = −1, 67.
√
16
264
Note que esse valor obtido já encontra-se na Figura 13, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o tempo que o operário leva para executar a tarefa diminuiu e, assim
não há indícios de que a modificação introduzida tenha surtido efeito.
265
14) Um estudo realizado com 609 homens, com idades entre 40 e 76 anos, forneceu os resultados
apresentados na tabela a seguir. Adote o nível de significância igual a 1% e teste a hipótese de que
o nível de catecolamina no sangue e a incidência de doença coronariana são independentes.
Nível de catecolamina
Doença coronariana
Alto Baixo
Presente 27 44
Ausente 95 443
H0 : Doença coronariana e Nível de catecolamina são independentes
P1)
H : Doença coronariana e Nível de catecolamina não são independentes
1
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,
RNRH0 RRH0
0 6,6349 16,2465
Assim
266
n = 609,
71 × 122 71 × 487
Fe11 = = 14, 2233, Fe12 = = 56, 7767,
609 609
538 × 122 538 × 487
Fe21 = = 107, 7767, Fe22 = = 430, 2233.
609 609
Doença coronariana
Nível de catecolamina Alto Baixo Total
Presente 27(14,2233) 44(56,7767) (71)
Ausente 95(107,7767) 443(430,2233) (538)
Total (122) (487) (609)
Dessa forma
(27 − 14, 2233)2 (44 − 56, 7767)2 (95 − 107, 7767)2 (443 − 430, 2233)2
χ2cal = + + +
14, 2233 56, 7767 107, 7767 430, 2233
163, 2441 163, 2441 163, 2441 163, 2441
= + + +
14, 2233 56, 7767 107, 7767 430, 2233
= 11, 4772 + 2, 8752 + 1, 5147 + 0, 3794
∼
= 16, 2465
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Doença coronariana e Nível de catecolamina não são independentes, ao nível de
1% de significância.
267
15) A tabela a seguir apresenta os resultados de um ensaio com 154 pacientes que apresentavam dor
abdominal. Ao grupo Tratamento foi administrado brometo de pinavério (dois comprimidos/dia);
ao grupo controle foi administrado um placebo (fármaco inerte).
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 3, 8415 ,
RNRH0 RRH0
0 3,8415 11,4223
n = 154,
63 × 36 63 × 118
Fe11 = = 14, 7273, Fe12 = = 48, 2727,
154 154
91 × 36 91 × 118
Fe21 = = 21, 2727, Fe22 = = 69, 7273.
154 154
Assim
Grupo
Permanência da dor abdominal Total
Sim Não
Tratamento 6(14,7273) 57(48,2727) (63)
Controle 30(21,2727) 61(69,7273) (91)
Total (36) (118) (154)
Dessa forma
(6 − 14, 7273)2 (57 − 48, 2727)2 (30 − 21, 2727)2 (61 − 69, 7273)2
χ2cal = + + +
14, 7273 48, 2727 21, 2727 69, 7273
76, 1658 76, 1658 76, 1658 76, 1658
= + + +
14, 7273 48, 2727 21, 2727 69, 7273
= 5, 1717 + 1, 5778 + 3, 5804 + 1, 0923
∼
= 11, 4223
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que Grupo e Permanência da dor abdominal não são independentes, ao nível de 5%
de significância.
269
16) Com a finalidade de verificar se o nível nutricional da mãe afeta a massa do recém-nascido, foram
observadas duas amostras de nascimentos. A primeira foi extraída de uma maternidade particular
(localidade X1 ), onde as mães são, em geral, bem nutridas. A outra amostra foi tirada de uma
maternidade pública, numa região extremamente pobre (localidade X2 ), onde acredita-se que as
mães não são bem nutridas. Os dados observados apresentaram:
Realize um teste de hipóteses para verificar se há evidência suficiente de que as crianças da localidade
X1 nascem em média, com massa superior aos recém nascidos da localidade X2 . Suponha que as
massas nas duas localidades são normalmente distribuídas com mesma variância e utilize o nível de
significância igual a 1%.
Sejam X1 : “massa das crianças nascidas na localidade X1 ” e X2 : “massa das crianças nascidas na
localidade X2 ”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais
são iguais, dessa forma podemos aplicar o teste t de Student para duas médias.
H0 : µ1 = µ2
P1) (Teste unilateral à direita)
H : µ > µ
1 1 2
X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 20 − 2 = 36 e ttab = t(36;1%) = 2, 4345. Assim a região crítica é:
RC = {t ∈ R| t > 2, 4345} ,
(18 − 1) 2, 56 + (20 − 1) 5, 76
Sc2 =
18 + 20 − 2
152, 96
= = 4, 2489.
36
270
0 2,09 2,4345
Figura 16: Região crítica do teste t, para duas médias, unilateral à direita.
4, 1 − 2, 7
tcal = s = 2, 09.
1 1
4, 2489 +
18 20
Note que esse valor obtido já encontra-se na Figura 16, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o massa das crianças nascidas na localidade X1 seja estatisticamente
maior que o massa das crianças nascidas na localidade X2 , ao nível de 1% de significância.
271
17) Suspeita-se que o tempo médio, por operário, para executar uma tarefa, é maior para operários
do sexo masculino. Nádia tomou duas amostras: operários do sexo masculino e do sexo feminino,
medindo o tempo de execução de cada um, tendo determinado que as variâncias são homogêneas.
Seus resultados foram: o tempo médio da amostra de 14 operários do sexo masculino foi de 94,5
minutos, e o desvio padrão foi de 10 minutos; e o tempo médio da amostra de 15 operárias do sexo
feminino foi de 89 minutos, e o desvio padrão foi de 9 minutos. Realize um teste de hipóteses para
verificar se os operários do sexo masculino são, em média, mais lentos (demoram mais) para executar
a tarefa. Adote o nível de significância 0, 025.
Sejam X1 : “tempo que os operários do sexo masculino levam para executar a tarefa” e X2 : “tempo
que as operárias do sexo feminino levam para executar a tarefa”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼
N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o teste t
de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste unilateral à direita)
: µ1 > µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 025 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 14 + 15 − 2 = 27 e ttab = t(27;2,5%) = 2, 0518. Assim a região crítica é:
RC = {t ∈ R| t > 2, 0518} ,
94, 5 − 89
tcal = s = 1, 56.
1 1
90, 1481 +
14 15
Note que esse valor obtido já encontra-se na Figura 17, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
272
0 1,56 2,0518
Figura 17: Região crítica do teste t, para duas médias, unilateral à direita.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 2,5% de significância. Dessa
forma, não há indícios de que o tempo que os operários do sexo masculino levam para executar a
tarefa seja estatisticamente maior que o tempo que as operárias do sexo feminino levam para executar
a tarefa, ao nível de 2,5% de significância.
273
18) Em uma determinada universidade a média em uma determinada disciplina tem distribuição
normal e a média tem sido de 64 pontos. Implantou-se um programa de monitorias e tutorias nessa
disciplina a fim de aumentar a nota média e, consequentemente diminuir a reprovação. Ao final do
semestre, 9 alunos foram selecionados observando-se suas notas, obtendo-se:
65 70 75 64 69 70 72 68 77
Seja X : “nota obtida pelos alunos”, então X ∼ N (µ; σ 2 ) com σ 2 desconhecido, dessa forma, podemos
aplicar o teste t de Student para uma média.
H0 : µ = 64
P1) (Teste unilateral à direita)
H : µ > 64
1
X̄ − µ0
P2) Temos que α = 0, 01 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
S
√X
n
P3) Temos que ν = n − 1 = 9 − 1 = 8 e ttab = t(8;1%) = 2, 8965. Assim a região crítica é:
RC = {t ∈ R| t > 2, 8965} ,
0 2,8965 4,34
Figura 18: Região crítica do teste t, para uma média, unilateral à direita.
274
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que a nota obtida pelos alunos aumentou e, assim há indícios de que o programa de
monitorias e tutorias foi eficaz.
275
19) O técnico de uma equipe de basquete soube que, a utilização de cafeína por parte dos jogadores
pode melhorar o desempenho dos mesmos durante os jogos. Com o intuito de testar essa hipótese,
ele realizou um treino entre seus atletas e, dividiu-os aleatoriamente em dois grupos dando-lhes uma
pílula meia hora antes do treino. O primeiro grupo (X1 ), recebeu uma pílula de farinha (placebo),
enquanto que, o grupo (X2 ) recebeu uma pílula com cafeína. Em uma série de 30 lances livres de
cada atleta, ele anotou o número de acertos que cada um deles teve, obtendo:
X1 22 13 16 9 15
X2 28 23 15 15 14
Suponha que o número de cestas de cada um dos grupos seja normalmente distribuído e com mesma
variância populacional nos dois grupos, isto é, X1 ∼ N (µ1 ; σ 2 ) e X2 ∼ N (µ2 ; σ 2 ). Há indícios, ao
nível de 1% de significância, que a cafeína melhore o desempenho dos jogadores?
Sejam X1 : “desempenho do grupo de jogadores que recebeu a pílula com o placebo” e X2 : “de-
sempenho do grupo de jogadores que recebeu a pílula com cafeína”. Então X1 ∼ N (µ1 ; σ12 ) e
X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma podemos aplicar o
teste t de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste unilateral à esquerda)
: µ1 < µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 5 − 2 = 8 e ttab = t(8;1%) = 2, 8965. Assim a região crítica é:
−2,8965 −1,15 0
Figura 19: Região crítica do teste t, para duas médias, unilateral à esquerda.
5
P
X1i
75
X̄1 = i=1
= = 15,
5 5
5
P
X2i
95
X̄2 = i=1
= = 19,
5 5
5 2
P
5 X1i
2
− i=1
P
X1i 5
2
1215 − (75)
S12 = i=1
= 5
= 17, 1915,
5−1 5−1
5
2
P
5 X2i
2
− i=1
P
X2i 5
2
1959 − (95)
S22 = i=1
= 5
= 81,
5−1 5−1
(5 − 1) 17, 1915 + (5 − 1) 81
Sc2 =
5+5−2
392, 766
= = 49, 0958.
8
15 − 19
tcal = s = −1, 15.
1 1
49, 0958 +
5 5
Note que esse valor obtido já encontra-se na Figura 19, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
277
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o desempenho do grupo de jogadores que recebeu a pílula com o placebo
seja estatisticamente inferior ao desempenho do grupo de jogadores que recebeu a pílula com cafeína,
ao nível de 1% de significância.
278
20) Em um estudo que objetivava estudar a pressão sanguínea (mmHg) e o nível de colesterol
(mg/100cm) de indivíduos adultos, obteve-se a seguinte tabela:
Pressão
Colesterol
Menos que 127 De 127 a 166 Mais que 166
Menos que 200 117 168 22
De 200 a 260 204 418 63
Mais que 260 67 145 33
h X
k
(Foij − Feij )2
χ =
2
∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 13, 2767 ,
Fo11 = 117, Fo12 = 168, Fo13 = 22, Fo21 = 204, Fo22 = 418,
Fo23 = 63, Fo31 = 67, Fo32 = 145, Fo33 = 33,
RNRH0 RRH0
0 13,2767 13,5501
Pressão
Colesterol Menos que 127 De 127 a 166 Mais que 166 Total
Menos que 200 117(96,2943) 168(181,4204) 22(29,2854) (307)
De 200 a 260 204(214,8585) 418(404,7979) 63(65,3436) (685)
Mais que 260 67(76,8472) 145(144,7817) 33(23,3711) (245)
Total (388) (731) (118) (1237)
Assim
Dessa forma
(117 − 96, 2943)2 (168 − 181, 4204)2 (22 − 29, 2854)2 (204 − 214, 8585)2
χ2cal = + + +
96, 2943 181, 4204 29, 2854 214, 8585
(418 − 404, 7979) 2
(63 − 65, 3436)2
(67 − 76, 8472)2
(145 − 144, 7817)2
+ + + +
404, 7979 65, 3436 76, 8472 144, 7817
(33 − 23, 3711) 2
+
23, 3711
428, 726 180, 1071 53, 0771 117, 907 174, 2954 5, 4925 96, 9673
= + + + + + +
96, 2943 181, 4204 29, 2854 214, 8585 404, 7979 65, 3436 76, 8472
0, 0477 92, 7157
+ +
144, 7817 23, 3711
= 4, 4522 + 0, 9928 + 1, 8124 + 0, 5488 + 0, 4306 + 0, 0841 + 1, 2618 + 0, 0003 + 3, 9671
∼
= 13, 5501
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa forma,
há indícios de que Colesterol e Pressão não são independentes, ao nível de 1% de significância.
280
21) Em um trecho de uma rodoviária estadual, quando é utilizado o radar, são verificadas em média
7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que esse número pode ter
aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos, e em média obteve-se
8 infrações diárias com desvio-padrão de 2,11. Verifique, supondo normalidade e usando nível de
significância igual a 0, 05, se houve aumento no número de infrações.
Seja X : “número de infrações diárias por excesso de velocidade”, então X ∼ N (µ; σ 2 ) com σ 2
desconhecido, dessa forma, podemos aplicar o teste t de Student para uma média.
H : µ=7
0
P1) (Teste unilateral à direita)
: µ>7
H
1
X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 10 − 1 = 9 e ttab = t(9;5%) = 1, 8331. Assim a região crítica é:
RC = {t ∈ R| t > 1, 8331} ,
0 1,5 1,8331
Figura 21: Região crítica do teste t, para uma média, unilateral à direita.
8−7
tcal = 2, 11 = 1, 5.
√
10
281
Note que esse valor obtido já encontra-se na Figura 21, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, não há indícios de que o número de infrações diárias por excesso de velocidade aumentou e,
assim não há ao nível de 5% de significância.
282
22) O INMETRO está investigando se a quantidade de Paracetamol num dado comprimido está de
acordo com o valor nominal estampado no rótulo do medicamento (750 mg). Numa amostra de 20
comprimidos, a média encontrada foi de 738 mg com um desvio-padrão de 11,85 mg. Teste a hipótese
de que a quantidade média de Paracetamol é igual ao valor nominal informado pelo fabricante. Utilize
nível de significância igual a 0, 05 e suponha normalidade da variável estudada.
Seja X : “quantidade de Paracetamol num dado comprimido”, então X ∼ N (µ; σ 2 ) com σ 2 desco-
nhecido, dessa forma, podemos aplicar o teste t de Student para uma média.
H : µ = 750
0
P1) (Teste bilateral)
: µ 6= 750
H
1
X̄ − µ0
P2) Temos que α = 0, 05 e a estatística de teste é T = ∼ t(ν) sendo ν = n − 1.
SX
√
n
P3) Temos que ν = n − 1 = 20 − 1 = 19 e ttab = t(19;5%) = 2, 093. Assim a região crítica é:
√
P4) Temos que X̄ = 738 e SX = 140, 4225 = 11, 85, assim
738 − 750
tcal = 11, 85 = −4, 53.
√
20
283
Note que esse valor obtido já encontra-se na Figura 22, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
há indícios de que a quantidade de Paracetamol num dado comprimido difira do padrão, ao nível de
5% de significância.
284
23) Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 28 homens e
34 mulheres de um grande complexo industrial, produziu os seguintes resultados:
Mulheres Homens
X̄ 3,7 anos 3,2 anos
S (X) 0,9 anos 0,8 anos
Determinar se há diferença entre o tempo de adaptação entre homens e mulheres. Utilize nível de
significância igual a 0,05 e suponha normalidade das variáveis estudadas e homocedasticidade das
variâncias.
Sejam X1 : “tempo de adaptação dos homens” e X2 : “tempo de adaptação das mulheres”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste bilateral)
: µ1 6= µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 28 + 34 − 2 = 60 e ttab = t(60;5%) = 2, 0003. Assim a região crítica é:
X̄1 = 3, 7,
X̄2 = 3, 2,
e
3, 7 − 3, 2
tcal = s = 2, 31.
1 1
0, 7165 +
28 34
285
Note que esse valor obtido já encontra-se na Figura 23, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o tempo de adaptação dos homens é estatisticamente diferente do tempo de adaptação
das mulheres, ao nível de 5% de significância.
286
24) Uma pesquisa foi desenvolvida com o intuito de avaliar a opinião sobre a qualidade do atendimento
médico em clínicas especializadas e não especializadas. Um total de 350 pessoas foram entrevistadas
quanto a opinião do atendimento (bom, regular e ruim) nos dois tipos de clínicas, e os resultados
encontram-se na tabela de frequência abaixo. Você diria que a opinião depende do tipo de clínica na
qual o paciente foi atendido? Utilize nível de significância igual a 0, 025.
Opinião
Clínica Bom Regular Ruim
Especializadas 73 37 40
Não especializadas 94 61 45
H : Clínica e Opinião são independentes
0
P1)
: Clínica e Opinião não são independentes
H
1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 7, 3778 ,
RNRH0 RRH0
0 1,7043 7,3778
Assim
Opinião
Clínica Bom Regular Ruim Total
Especializadas 73(71,5714) 37(42) 40(36,4286) (150)
Não especializadas 94(95,4286) 61(56) 45(48,5714) (200)
Total (167) (98) (85) (350)
Dessa forma
(73 − 71, 5714)2 (37 − 42)2 (40 − 36, 4286)2 (94 − 95, 4286)2
χ2cal = + + +
71, 5714 42 36, 4286 95, 4286
(61 − 56) 2
(45 − 48, 5714)2
+ +
56 48, 5714
2, 0409 25 12, 7549 2, 0409 25 12, 7549
= + + + + +
71, 5714 42 36, 4286 95, 4286 56 48, 5714
∼
= 1, 7043
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 2, 5% de significância. Dessa
forma, não há indícios de que Clínica e Opinião são independentes, ao nível de 2, 5% de significância.
288
25) Suponhamos que duas técnicas de memorização X1 e X2 deverão ser comparadas medindo-se a
eficiência pelo tempo exigido para decorar certo tipo de material. O mesmo material foi apresentado a
nX1 = 18 e nX2 = 13 pessoas que o decoraram usando as técnicas X1 e X2 respectivamente. Sabendo-
se que há normalidade das variáveis estudadas e homocedasticidade das variâncias, verifique se há
diferença significativa entre as duas técnicas de memorização, adotando nível de significância igual a
5%, sabendo que os resultados amostrais obtidos foram:
n Média(min) Variância(min2 )
X1 18 20 12
X2 13 17 15
Sejam X1 : “tempo exigido para decorar certo tipo de material pelo método de memorização X1 ” e
X2 : “tempo exigido para decorar certo tipo de material pelo método de memorização X2 ”. Então
X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais, dessa forma
podemos aplicar o teste t de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste bilateral)
: µ1 6= µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 18 + 13 − 2 = 29 e ttab = t(29;5%) = 2, 0452. Assim a região crítica é:
X̄1 = 20,
X̄2 = 17,
e
20 − 17
tcal = s = 2, 27.
1 1
13, 2414 +
18 13
289
Note que esse valor obtido já encontra-se na Figura 25, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o tempo exigido para decorar certo tipo de material pelo método de memorização X1 é
estatisticamente diferente do tempo exigido para decorar certo tipo de material pelo método de
memorização X2 , ao nível de 5% de significância.
290
26) A marca de cigarros B, mais barata, afirma que seus cigarros apresentam teor de nicotina igual
a concorrente direta (A). A empresa A não concorda, afirmando que seus cigarros são melhores por
apresentar menor teor de nicotina, e ao realizar um estudo do conteúdo de nicotina das duas marcas
de cigarros obteve os seguintes resultados:
A 18 20 21 21 22
B 20 21 23 23 25 26
Admitindo que o conteúdo de nicotinas de cada uma das duas marcas tem distribuição normal, e que
as variâncias populacionais são iguais, adotando nível de significância igual a 1%, realize um teste
de hipóteses para saber a que conclusão a empresa A chegará.
X̄1 − X̄2
P2) Temos que α = 0, 01 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
2
Sc +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 6 − 2 = 9 e ttab = t(9;1%) = 2, 8214. Assim a região crítica é:
5
P
X1i
102
X̄1 = i=1
= = 20, 4,
5 5
6
P
X2i
138
X̄2 = i=1
= = 23,
6 6
5 2
P
5 X1i
2
− i=1
P
X1i 5 2090 − (102)
2
S12 = i=1
= 5
= 140, 4225,
5−1 5−1
6
2
P
6 X2i
2
− i=1
P
X2i 6 3200 − (138)
2
S22 = i=1
= 6
= 81,
6−1 6−1
291
−2,8214 −2,17 0
Figura 26: Região crítica do teste t, para duas médias, unilateral à esquerda.
(5 − 1) 140, 4225 + (6 − 1) 81
Sc2 =
5+6−2
966, 69
= = 107, 41.
9
20, 4 − 23
tcal = s = −2, 17.
1 1
107, 41 +
5 6
Note que esse valor obtido já encontra-se na Figura 26, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, não há indícios de que o quantidade de nicotina dos cigarros da marca A seja estatisticamente
inferior ao quantidade de nicotina dos cigarros da marca B, ao nível de 1% de significância.
292
27) Duas ilhas A e B, são completamente diferentes entre si. Enquanto que a ilha A está no Oceano
Pacífico, a ilha B encontra-se no Oceano Atlântico. Suponha que a distribuição das alturas dos
habitantes sejam independentes e normalmente distribuídas, sendo que para os habitantes da ilha A
a altura média é 1,75 m com desvio padrão de 10 cm. Para os habitantes da ilha B, temos que a
altura média é 1,70 m com desvio padrão de 5 cm. Uma amostra aleatória de habitantes de uma das
ilhas é tomada e, deseja-se testar as seguintes hipóteses:
H : “Os habitantes são da ilha A”
0
.
: “Os habitantes são da ilha B”
H
1
• seleciona-se uma amostra de 16 moradores adultos de uma ilha, e determina-se a altura média
deles;
• se essa altura média for superior a 173 cm, diremos que são habitantes da ilha A; caso contrário,
diremos que são habitantes da ilha B.
b) β = 95%;
c) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A quando na
verdade origina-se da ilha B;
d) α = 5%;
e) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B e, de fato
origina-se da ilha B;
f) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha B quando na
verdade origina-se da ilha A;
g) afirmar que a amostra de valores das alturas dos habitantes é proveniente da ilha A e, de fato
origina-se da ilha A;
O erro de tipo I e o erro de tipo II são dados, respectivamente, nas letras f) e c).
293
28) Psicólogos têm estudado um tipo de padrão comportamental das pessoas, designado como Tipo A.
Pessoas com esse padrão tendem a ser competitivas, trabalham melhor com datas e prazos, chegam
mais cedo para as reuniões, etc. Pessoas que não exibem esse padrão são classificadas como Tipo
B. Um estudo com 20 indivíduos do sexo masculino, classificados como Tipos A e B, investigou
o consumo de oxigênio (% da capacidade aeróbica utilizada) quando eles corriam em uma esteira.
Suspeitava-se antes da realização dessas medições que as pessoas do Tipo A consomem mais oxigênio
que as pessoas do Tipo B. Adote nível de significância igual a 1%, suponha normalidade das variáveis
sob estudo e homocedasticidade das variâncias e conclua acerca dessa suspeita utilizando um teste
de hipóteses adequado. Dados:
Padrão de comportamento
Capacidade aeróbica utilizada % Tipo A Tipo B
Valor médio X̄ 91,4 82,8
Desvio padrão (SX ) 37,82 46,84
Tamanho da amostra (n) 10 10
X̄1 − X̄2
T =s ∼ t(ν) ,
1 1
Sc2 +
n1 n2
sendo ν = n1 + n2 − 2 e
(n1 − 1) S12 + (n2 − 1) S22
Sc2 = .
n1 + n2 − 2
RC = {t ∈ R| t > 2, 5524} ,
0 0,45 2,5524
Figura 27: Região crítica do teste t, para duas médias, unilateral à direita.
X̄1 = 91, 4,
X̄2 = 82, 8,
91, 4 − 82, 8
tcal = s = 0, 45.
1 1
1812, 169 +
10 10
Note que esse valor obtido já encontra-se na Figura 27, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância.
Dessa forma, não há indícios de que o consumo de oxigênio quando a pessoa é do tipo A seja
estatisticamente inferior ao consumo de oxigênio quando a pessoa é do tipo B, ao nível de 1%
de significância.
295
29) Nos itens abaixo assinale V se a afirmativa for completamente verdadeira ou F, caso contrário.
( F ) Uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita decidir
por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;
Um teste de uma hipótese estatística é um procedimento, ou regra de decisão, que nos possibilita
decidir por rejeitar, ou não, a hipótese formulada, com base na informação obtida na amostra;
Ao realizarmos um teste de hipóteses, e tomarmos uma decisão, favorável ou contrária a uma hipótese,
podemos cometer um dos dois erros, o erro de tipo I ou o erro de tipo II;
( F ) O erro de tipo I consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;
O erro de tipo II consiste em não rejeitarmos uma hipótese H0 , sendo essa falsa;
( F ) A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no
teste Z a variância amostral é conhecida;
A diferença entre o teste t de Student para uma média, e o teste Z para uma média é que no teste
Z a variância populacional é conhecida;
No caso do teste t de Student para a diferença de duas variáveis, os graus de liberdade são dados por
ν = nX + nY − 2.
296
30) Dois grupos distintos de estudantes fizeram um mesmo exame em uma disciplina. No entanto, so-
mente um grupo recebeu preparação formal, pois frequentavam e participavam ativamente das aulas.
O outro grupo apenas leu a apostila e estudou na véspera da prova, uma vez que não compareciam
às aulas. Adote o nível de significância de 10% e realize um teste de hipótese para verificar se existe
associação entre a situação final do aluno e a frequência às aulas. Os resultados obtidos foram.
Frequência
Situação Sim Não
Aprovado 22 10
Reprovado 8 18
H : Situação e Frequência são independentes
0
P1)
: Situação e Frequência não são independentes
H
1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 2, 7055 ,
RNRH0 RRH0
0 2,7055 8,287
n = 58,
32 × 30 32 × 28
Fe11 = = 16, 5517, Fe12 = = 15, 4483,
58 58
26 × 30 26 × 28
Fe21 = = 13, 4483, Fe22 = = 12, 5517.
58 58
Assim
Situação
Frequência Sim Não Total
Aprovado 22(16,5517) 10(15,4483) (32)
Reprovado 8(13,4483) 18(12,5517) (26)
Total (30) (28) (58)
Dessa forma
(22 − 16, 5517)2 (10 − 15, 4483)2 (8 − 13, 4483)2 (18 − 12, 5517)2
χ2cal = + + +
16, 5517 15, 4483 13, 4483 12, 5517
29, 684 29, 684 29, 684 29, 684
= + + +
16, 5517 15, 4483 13, 4483 12, 5517
= 1, 7934 + 1, 9215 + 2, 2073 + 2, 3649
∼
= 8, 287
P5) Como χ2cal ∈ RRH0 há indícios para rejeitarmos H0 ao nível de 10% de significância. Dessa
forma, há indícios de que Situação e Frequência não são independentes, ao nível de 10% de
significância.
298
31) A associação dos proprietários de indústrias metalúrgicas realizou um estudo e constatou que a
média mensal de tempo perdido com acidentes de trabalho é de 60 horas, com desvio padrão de 20
horas. Um programa de prevenção de acidentes foi então proposto e, para avaliar a sua eficiência,
tomou-se uma amostra aleatória de 9 indústrias, isto é, mediu-se o tempo de horas perdidas com
acidentes em cada uma dessas indústrias, o que forneceu um valor médio amostral de 50 horas.
Suponha normalidade da variável estudada, adote o nível de significância de 1% e, realize um teste
de hipóteses para analisar a eficiência do programa proposto.
a) Note que nesse caso a variância populacional σ 2 é conhecida e, por esse motivo utilizaremos o
H : µ = 60
0
teste Z para uma média. (Teste unilateral à esquerda);
: µ < 60
H
1
X̄ − µ0
Z= σ ∼ N (0; 1) ;
√
n
c) Temos que ztab = z0,01 = 2, 33 e assim a região crítica é dada por RC = {z ∈ R | z < −2, 33} , a
qual é descrita em termos gráficos na Figura 29.
−2,33 −1,5 0
Figura 29: Região crítica do teste Z, para uma média, unilateral à esquerda.
299
d)
50 − 60 −10
zcal = 20 = 6, 6667 = −1, 5.
√
9
e) Como zcal ∈ RN RH0 , não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
maneira, não há indícios de que o tempo perdido com acidentes de trabalho difere de 60 horas.
300
32) Uma rede de hotéis conduziu uma pesquisa para avaliar a opinião (Ótimo, Regular ou Péssimo)
dos usuários quanto à qualidade de seus serviços. Os entrevistados foram escolhidos aleatoriamente
e divididos em três classes: Solteiros, Casados e Outros (divorciados, desquitados, viúvos, etc.),
conforme apresentado na tabela a seguir. Verifique, ao nível de significância de 5%, se existe algum
tipo de associação entre as variáveis Usuário e Opinião.
Opinião
Usuário
Ótimo Regular Péssimo
Solteiro 7 10 13
Casado 24 23 25
Outros 18 15 8
H0 : Usuário e Opinião são independentes
P1)
H : Usuário e Opinião não são independentes
1
k
h X
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 9, 4877 ,
RNRH0 RRH0
0 5,7 9,4877
Opinião
Usuário Total
Ótimo Regular Péssimo
Solteiro 7 (10,28) 10 (10,07) 13 (9,65) (30)
Casado 24 (24,67) 23 (24,17) 25 (23,16) (72)
Outros 18 (14,05) 15 (13,76) 8 (13,19) (41)
Total (49) (48) (46) (143)
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa forma,
não há indícios para rejeitarmos a hipótese de que Usuário e Opinião são independentes.
302
33) Dez cobaias criadas em laboratório, foram separadas, aleatoriamente, em dois grupos: um foi
tratado com ração normalmente usada no laboratório (padrão) e o outro grupo foi submetido a uma
nova ração (experimental). As cobaias foram pesadas no início e no final do período de duração do
experimento. Os ganhos de massa (em gramas) observados foram os seguintes:
Considere que as variâncias sejam homogêneas que as variáveis sob estudo sejam normalmente dis-
tribuídas, proceda a um teste de hipóteses, ao nível α = 5%, para verificar se as duas rações diferem
entre si quanto ao ganho de massa.
Sejam X1 : “ganho de massa obtido com a ração padrão” e X2 : “ganho de massa obtido com a nova
ração”. Então X1 ∼ N (µ1 ; σ12 ) e X2 ∼ N (µ2 ; σ22 ), além disso, as variâncias populacionais são iguais,
dessa forma podemos aplicar o teste t de Student para duas médias.
H : µ1 = µ2
0
P1) (Teste bilateral)
: µ1 6= µ2
H
1
X̄1 − X̄2
P2) Temos que α = 0, 05 e a estatística de teste é T = s ∼ t(ν) , sendo ν = n1 + n2 − 2
1 1
Sc2 +
n1 n2
(n1 − 1) S12 + (n2 − 1) S22
e Sc2 = .
n1 + n2 − 2
P3) Temos que ν = 5 + 5 − 2 = 8 e ttab = t(8;5%) = 2, 306. Assim a região crítica é:
X̄1 = 188,
X̄2 = 212,
e
188 − 212
tcal = s = −4, 5.
1 1
71 +
5 5
Note que esse valor obtido já encontra-se na Figura 31, isso nos permitirá efetuarmos melhor as
conclusões necessárias no passo P5) a seguir.
P5) Como tcal ∈ RRH0 , há indícios para rejeitarmos H0 ao nível de 5% de significância. Dessa
forma, o ganho de massa obtido com a ração padrão é estatisticamente diferente do ganho de
massa obtido com a nova ração, ao nível de 5% de significância.
304
Programação
Emissora Novela Noticiário
Emissora X 26 20
Emissora Y 25 29
h X
k
(Foij − Feij )2
χ2 = ∼ χ2(ν) ,
X
n o
RC = χ2 ∈ R χ2 > 6, 6349 ,
RNRH0 RRH0
0 1,0393 6,6349
n = 100,
46 × 51 46 × 49
Fe11 = = 23, 46, Fe12 = = 22, 54,
100 100
54 × 51 54 × 49
Fe21 = = 27, 54, Fe22 = = 26, 46.
100 100
Assim
Emissora
Programação Novela Noticiário Total
Emissora X 26(23,46) 20(22,54) (46)
Emissora Y 25(27,54) 29(26,46) (54)
Total (51) (49) (100)
Dessa forma
(26 − 23, 46)2 (20 − 22, 54)2 (25 − 27, 54)2 (29 − 26, 46)2
χ2cal = + + +
23, 46 22, 54 27, 54 26, 46
6, 4516 6, 4516 6, 4516 6, 4516
= + + +
23, 46 22, 54 27, 54 26, 46
= 0, 275 + 0, 2862 + 0, 2343 + 0, 2438
∼
= 1, 0393
P5) Como χ2cal ∈ RN RH0 não há indícios para rejeitarmos H0 ao nível de 1% de significância. Dessa
forma, há indícios de que Emissora e Programação são independentes, ao nível de 1% de significância.