Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DEPARTAMENTO DE ESTATSTICA
Exerccio (1.1)
Gestantes que consumiam pelo menos 15g de peixe uma vez por
semana.
Grupos de Comparao: Mulheres com idade mdia de 53 anos com presso arterial
normal e de 58 anos hipertensas que se alimentaram de soja;
Exerccio (1.2)
Exerccio (1.3)
c) Populao: crianas que mamaram no peito por seis meses ou mais e outras crianas que o fizeram
e) Populao: Crianas cujas mes tomaram remdios contra infeces urinrias ou respiratrias, entre
outras, durante o perodo de gestao.
Amostra: 24.690 crianas cujas mes tomaram remdios contra infeces urinrias ou respiratrias,
entre outras, durante o perodo de gestao.
Exerccio (2.1)
Exerccio (2.2)
Frequencia Frequencia
Cesariana Absoluta Relativa(%)
Sim 269864 19.61
No 1106138 80.39
Total 1376002 100
Exerccio (2.3)
c)
Pelo histograma da varivel fisioterapia podemos perceber uma assimetria com concentrao
esquerda (cauda direita) que indica que o tempo de fisioterapia dos pacientes est concentrado em
tempos menores. A grande parte dos pacientes se recupera entre 4 e 5 meses.
Presena de sequelas
Pelo grfico de pizza da varivel Sequelas percebemos que a quantidade de pacientes sem sequelas
menor.
8
0
Baixa Mdia Alta
Pelo grfico de barras, podemos observar que a maior parte dos pacientes realiza cirurgia de grau
mdio.
Exerccio (2.4)
Analisando a Tabela 2.3, podemos perceber que as famlias mais freqentes so as de dois filhos
(40%), seguida pelas famlias de trs filhos. Apenas 16% das famlias tm mais de trs filhos, mas so
ainda mais comuns do que famlias sem filhos.
Exerccio (2.5)
a)
b)
1|44444
1|5555555
1|66666
1|7777777
1|88888 legenda: 1|8 leia-se 18 dias
Exerccio (2.7)
a) Esta afirmativa est errada. Na verdade, essa afirmativa refere-se mediana, pois metade dos
valores ento abaixo ou so iguais a mediana. A mdia um ponto de equilbrio da distribuio.
onde se concentram mais dados.
b) Esta afirmativa refere-se ao fato de que a mdia o ponto em que mais se concentram os dados
da distribuio, logo o valor mais tpico da distribuio. No entanto, um dos valores tpicos
do conjunto de dados, que tambm pode ser resumido usando-se a mediana ou a moda.
c) Sempre haver alunos abaixo da mdia, quando a palavra mdia se referir estatstica que
usada para resumir um conjunto de valores. Esta afirmativa tambm pode ser interpretada como
se a palavra mdia se referisse no mdia de um conjunto de dados, mas sim a uma meta que
deve ser cumprida em escolas, em geral, essa meta igual a 60 pontos. Os alunos devem ter 60
pontos ou mais para passar na matria cursada.
Exerccio (2.8)
fx
i =1
i i
X = k
, em que k o nmero de classes
f
i =1
i
fx
i =1
i i
2 1675 + 1825 + 8 1975 + 3 2125 + 2 2275
X = 5
= = 1993,75 kj/100g
2 +1+ 8 + 3 + 2
f
i =1
i
k k
2
f i ( xi X ) 2 fx i
2
i nX
64045000 16 3975039,06
S2 = i =1
= i =1
= = 29625
k
n 1 16 1
f i =1
i
Exerccio (2.9)
a)
b)
Grupos CV
Cura rpida 0,74
Cura normal 0,36
Cura lenta 0,29
O grupo cura lenta o mais homogneo enquanto que o grupo cura rpida o mais heterogneo.
c)
Exerccio (2.10)
Os valores da mediana, do primeiro e terceiro quartis so aproximadamente: 13, 12, 14.5, respectivamente.
Isso significa que 50 % das taxas de hemoglobina esto abaixo de 13 g/cm3 e 50% esto acima; 25 % das
taxas de hemoglobina esto abaixo de 12 g/cm3 e 75% esto acima; 75% das taxas de hemoglobina esto
abaixo de 14.5 g/cm3 e 25% esto acima.
Exerccio (2.11)
a)
A floresta o habitat com maior riqueza de espcies, pois sua mdia e mediana possuem valores maiores.
Este habitat tambm apresenta maior variabilidade, j que, apresenta maior desvio-padro.
Exerccio (2.12)
a.1) e a.2)
b) fcil perceber que a altura dos irmos maior, pois estes apresentam valores de mdia,
mediana, mnimo, mximo, 1 e 3 quartis maiores.
Exerccio (2.13)
a) Tabela 1.3: Estatsticas descritivas do ganho de peso (em gramas) de ratos que com dieta a base
de bife e cereal
c) O ganho de peso mdio dos ratos que consumiram bife (89,6 g) foi maior do que o dos ratos que
consumiram cereal (84,9 g). Pelo coeficiente de variao, percebemos que o grupo que comeu bife
possui uma variabilidade um pouco maior do que a variabilidade do outro grupo.
Exerccio (2.14)
a.1 e a.2 )
Observao: as variveis Protena, Gordura e Carboidrato no possuem moda enquanto que a varivel
Sdio possui trs modas.
b)
O Box-plot apresenta assimetria com concentrao esquerda, o que indica que a maioria dos
chocolates apresenta valores maiores para o percentual de gordura.
Exerccio (2.15)
O chocolate da marca A se distancia mais do grupo de chocolates quanto ao valor energticos, ficando a
aproximadamente 1.5 desvios-padro acima da mdia.
J o chocolate da marca B destaca-se por apresentar uma quantidade de sdio bem abaixo do valor tpico do
grupo, com 1.7 desvios-padro abaixo da mdia.
Exerccio (2.16)
2.09 1.70
Z= = 3.9
0.10
Como a altura do atleta est quase 4 desvios acima da mdia, ele pode ser considerado excepcionalmente
alto.
Exerccio (2.17)
Por linha:
80.6% dos pacientes que tiveram resposta baixa ao tratamento receberam placebo.
30.8% dos pacientes que tiveram resposta moderada ao tratamento receberam placebo.
31.25% dos pacientes que tiveram resposta alta ao tratamento receberam placebo.
A distribuio de pacientes que receberam ou no vacina varia muito dentro das categorias de resposta,
principalmente se analisarmos as categorias moderada e alta em comparao com a categoria baixa.
Isto um indcio de associao entre as duas variveis.
Por coluna:
Tabela 2.6: Tratamento de gripe
Resposta Placebo Vacina Total
Baixa 25 (65.78%) 6 (17.2%) 31 (42.5%)
moderada 8 (21.1%) 18 (51.4%) 26 (35.6%)
Alta 5 (13.1%) 11 (31.4%) 16 (21.9%)
Total 38 (100%) 35 (100%) 73 (100%)
A anlise desta tabela por coluna mais interessante, pois vamos analisar como se d a distribuio dos
pacientes nas categorias de resposta ao tratamento dentro de cada tipo de tratamento (vacina ou placebo).
Assim, poderemos comparar os dois tratamentos quanto s freqncias de cada tipo de resposta ao
tratamento. Por exemplo, 13.1% dos pacientes que receberam placebo tiveram resposta alta ao tratamento,
enquanto 31.4% dos pacientes que receberam vacina tiveram resposta alta. Isto tambm um indcio de
que a intensidade de resposta ao tratamento est ligada ao tipo de tratamento (vacina ou no).
Exerccio (2.18)
O grfico de linhas mostra que o nmero de partos normais muito maior do que nmero de cesarianas
durante todo o perodo estudado. O nmero de partos normais apresenta tendncia de crescimento maior do
que o nmero de cesarianas, que, por sua vez, apresenta certa tendncia estabilidade, principalmente no
final do perodo.
Exerccio (2.19)
Correlao a medida da relao entre duas variveis. Existe correlao quando uma das variveis est, de
alguma forma, relacionada com a outra. Mas ateno: a existncia de correlao entre duas variveis no
significa que uma varivel consequncia da outra. Somente significa que ambas esto relacionadas de
alguma maneira.
Exerccio (2.20)
a) Falsa. Duas variveis podem estar altamente correlacionadas, mas sem nenhuma relao de causa-e-
efeito. O exemplo clssico o grfico de disperso que mostra uma alta correlao positiva entre o
nmero de rdios fabricados na Inglaterra e o nmero de diagnsticos de loucura ao longo do sculo
20. Ambas as variveis, na verdade, so influenciadas positivamente pelo desenvolvimento da
tecnologia, e no podemos dizer, de maneira nenhuma, algo como o aumento no nmero de rdios
implica o aumento no nmero de diagnstico de loucura.
b) Verdadeira. Quando agrupamos indivduos em grupos e resumimos os grupos por meio de mdias, a
variabilidade dos dados agrupados em mdias menor do que quando usamos os dados originais.
Assim, se usarmos estas mdias para calcular o coeficiente de correlao, o valor de r tende a
aumentar. Isto porque o denominador do coeficiente de correlao r, que mede justamente a
variabilidade dos dados, fica menor. Por conseqncia, o r tende a ficar maior do que o valor
calculado com os dados sem agrupamento.
c) Falsa. O valor de r igual a zero somente significa que a correlao LINEAR inexistente. Isto
porque, se duas variveis tem um relacionamento que no seja linear (por exemplo, quadrtico,
exponencial, etc.) o coeficiente linear de Pearson (r) ser prximo de zero. No entanto, as variveis
continuam correlacionadas, mas NO linearmente.
Exerccio (2.21)
Trax em Peso em
XY X2 Y2
polegadas (X) libras (Y)
26 80 2080 676 6400
45 344 15480 2025 118336
54 416 22464 2916 173056
49 348 17052 2401 121104
35 166 5810 1225 27556
41 220 9020 1681 48400
41 262 10742 1681 68644
49 360 17640 2401 129600
39 204 7956 1521 41616
31 144 4464 961 20736
Total 410 2544 112708 17488 755448
n = 10
X = Tamanho do trax, em polegadas.
Y = Peso, em libras.
= 0,05
n n n n
[(xi x ) ( y i y )]
i =1
n (x i y i ) x i y i
i =1 i =1 i =1
r= =
n n 2 2
n n n n
(x i x ) ( y i y )
2 2
n x i2 x i n y i2 y i
i =1 i =1
i =1 i =1 i =1 i =1
84040
r= = 0,9809
85671,7475
O coeficiente de correlao est mais prximo de um, ou seja, a correlao linear entre Tamanho
do Trax, em polegadas e Peso, em libras, positiva e forte, indicando que o aumento do trax
do animal , em geral, acompanhado por um aumento de peso.
Exerccio (2.22)
Sistlica Diastlica
XY X2 Y2
(X) (Y)
138 82 11316 19044 6724
130 91 11830 16900 8281
135 100 13500 18225 10000
140 100 14000 19600 10000
120 80 9600 14400 6400
125 90 11250 15625 8100
120 80 9600 14400 6400
130 80 10400 16900 6400
130 80 10400 16900 6400
144 98 14112 20736 9604
143 105 15015 20449 11025
140 85 11900 19600 7225
130 70 9100 16900 4900
150 100 15000 22500 10000
Total 1875 1241 167023 252179 111459
n = 14
X = Sistlica
Y = Diastlica
= 0,05
n n n n
[(x
i =1
i x ) ( y i y )] n (x i y i ) x i y i
i =1 i =1 i =1
r= =
n n 2 2
n n n n
(x i x ) ( y i y )
2 2
n x i2 x i n y i2 y i
i =1 i =1
i =1 i =1 i =1 i =1
11447
r= = 0,6579
17399 ,826
Como o coeficiente de correlao positivo, mas no muito prxima de um, podemos dizer que
h uma correlao linear positiva moderada entre uma variao na presso sistlica e uma
variao na presso diastlica.
Exerccio (2.23)
Temperatura Tempo em
XY X2 Y2
(X) min (Y)
55 145,3 7991,5 3025 21112
61 148,7 9070,7 3721 22112
49 148,3 7266,7 2401 21993
62 148,1 9182,2 3844 21934
70 147,6 10332 4900 21786
73 146,4 10687 5329 21433
51 144,7 7379,7 2601 20938
57 147,5 8407,5 3249 21756
Total 478 1176,6 70318 29070 173063
n=8
X = Temperatura
Y = Tempo
= 0,05
n n n n
[(xi x ) ( y i y )]
i =1
n (x i y i ) x i y i
i =1 i =1 i =1
r= =
n n 2 2
n n n n
(x i x ) ( y i y )
2 2
n x i2 x i n y i2 y i
i =1 i =1
i =1 i =1 i =1 i =1
129,074
r= = 0,1888
683,6676
A correlao linear entre Temperatura e Tempo positiva, porm fraca, pois o coeficiente de
correlao mais prximo de zero.
Exerccio (2.24)
Cricrilos
Temperatura
em 1min XY X2 Y2
(F) (Y)
(X)
882 69,7 61475 777924 4858,1
1188 93,3 110840 1411344 8704,9
1104 84,3 93067 1218816 7106,5
864 76,3 65923 746496 5821,7
1200 88,6 106320 1440000 7850
1032 82,6 85243 1065024 6822,8
960 71,6 68736 921600 5126,6
900 79,6 71640 810000 6336,2
Total 8130 646 663245 8391204 52627
n=8
X = Cricrilos em 1 min
Y = Temperatura (F)
= 0,05
n n n n
[(xi x ) ( y i y )]
i =1
n (x i y i ) x i y i
i =1 i =1 i =1
r= =
n n 2 2
n n n n
(x i x ) ( y i y )
2 2
n x i2 x i n y i2 y i
i =1 i =1
i =1 i =1 i =1 i =1
53980
r= = 0,8736
61788,378
Como o coeficiente de correlao positivo e prximo do valor 1, podemos dizer que h uma
correlao linear positiva forte entre o nmero de cricrilos e a temperatura ambiente.
Exerccio (2.25)
n = 12
X = Altura
Y = Taxa de Pulsao
= 0,05
n n n n
[(xi x ) ( y i y )]
i =1
n (x i y i ) x i y i
i =1 i =1 i =1
r= =
n n 2 2
n n n n
(x i x ) ( y i y )
2 2
n x i2 x i n y i2 y i
i =1 i =1
i =1 i =1 i =1 i =1
104
r= = 0,0384
2711,1621
Como coeficiente de correlao prximo de zero, a correlao linear entre a altura e a taxa de pulsao por
segundo mais fraca.
Seo 3: Probabilidade
Exerccio (3.1)
b) E = { (A A), (A B), (A AB), (A O), (B A), (B AB), (B B), (B O), (AB A),
(AB B), (AB AB), (AB O), (O A), (O B), (O AB), (O O) }
c) E = { c: Cmin c Cmax }
Exerccio (3.2)
E = {1, 2, 3, 4, 5, 6}
c) Para o clculo de probabilidade de unio de eventos, sero utilizados os resultados do item, (a) e (b).
P( A B) 0
d) P(A | B) = = = 0. Ou seja, como nenhuma face do dado par e impar ao mesmo tempo, ento
P( B) 1
2
P(A | B) = 0.
Como P(A | B) P(A), os eventos A e B no so independentes.
2
P( B C )
e) P(B | C) = = 6 =0.5. Ou seja, como, das 4 faces so menores do que 5, duas so impares, ento
P (C ) 4
6
2
P(B | C) = .
4
Como P(B | C) = P(B), os eventos A e B so independentes.
Exerccio (3.3)
35
a) P(V) = = 0.4795
73
38
b) P(P) = = 0.5205
73
31
c) P(B) = = 0.4246
73
26
d) P(M) = = 0.3562
73
16
e) P(A) = = 0.2192
73
Exerccio (3.4)
DHDA
Sexo Presente Ausente Totais
Masculino 60 440 500
Feminino 6 494 500
Totais 66 934 1000
Sejam os eventos:
66
a) P(P) = = 0.066
1000
934
b) P(A) = = 0.934
1000
500
c) P(M) = = 0.5
1000
500
d) P(F) = = 0.5
1000
60
e) P(P M) = = 0.06
1000
6
f) P(P F) = = 0.006
1000
440
g) P(A M) = = 0.44
1000
494
h) P(A F) = = 0.494
1000
P( P M ) 60
i) P(P | M) = = =0.12
P( M ) 500
P( P F ) 6
j) P(P | F) = = =0.012
P( F ) 500
P( A M ) 440
k) P(A | M) = = =0.88
P( M ) 500
P( A F ) 494
l) P(A | F) = = =0.988
P( F ) 500
P( F P ) 6
m) P(F | P) = = =0.0909
P( P) 66
P( M A) 440
n) P(M | A) = = =0.4711
P( A) 934
Exerccio (3.5)
a) P(A) = P(A M ) + P(A F) = P(A | M) P(M) + P(A | F) P(F) = (0.673) (0.543) + (0.457) (0.566)
= 0.6241
Exerccio (3.6)
P( | )=?
P ( N S)
P( | )=
P (S)
P (S | N ) P ( N )
=
P (S)
P (S | N) P ( N )
=
P (S N ) + P (S N)
P (S | N) P ( N )
=
[ P (S | N ) P ( N ) + P (S | N) P (N)
0.25 0.46
=
0.25 0.46 + 0.72 0.54
= 0.228
Seo 4: Avaliao da Qualidade de Testes Clnicos
Exerccio (4.1)
Como tanto a especificidade quanto a sensibilidade tiveram valores elevados, ou seja, prximos de um, temos que a
protena um bom biomarcador de apendicite.
Exerccio (4.2)
Como a prevalncia da substncia indevida na amostra prxima da prevalncia na populao, podemos calcular
VPP e VPN diretamente da tabela
60
VPP = P(C | +) = = 0.92 PFP = 1 VPP = 0.08
65
70
VPN = P( C | -) = = 0.78 PFN = 1 VPN = 0.22
90
Exerccio (4.3)
b) Prevalencia na populao: p = ?
Prevalencia na amostra: 450/950 = 0.4737
Exerccio (4.4)
0.98 x 0.10
VPP = = 0.916
0.98 x 0.10 + (1 - 0.99)(1 - 0.10)
0.99 x (1 - 0.10)
VPN = = 0.999
0.99 (1 - 0.10) + (1 - 0.99)( 0.10)
Como a prevalncia da doena na amostra prxima da prevalncia na populao, podemos calcular VPP e VPN
diretamente da tabela.
Exerccio (5.1)
Distribuio de probabilidade de X
x P[X=x]
0 1/8
1 3/8
2 3/8
3 1/8
Total 1
Distribuio de probabilidade de Y
y P[Y=y]
0 9/16
1 6/16
2 1/16
Total 1
Distribuio de probabilidade de Z
z P[Z=z]
0 1/8
1 3/8
2 3/8
3 1/8
Total 1
Exerccio (5.2)
Seja
Distribuio de probabilidade de X
x P[X=x]
0 1/4
1 1/2
2 1/4
Total 1
Probabilidades: P[X=x] =1/4, 1/2 e 1/4, correspondente a cada valor da varivel aleatria.
Exerccio (5.3)
Experimento: Uma urna contm trs bolas numeradas 1, 2 e 3, seleciona-se duas bolas, uma de cada vez
ao acaso e sem reposio da primeira bola.
Espao amostral:
E = {(1 2), (1 3), (2 1), (2 3), (3 1), (3 2)}
Cada um dos 6 pontos do espao amostral E tem a mesma probabilidade de ocorrer, ou seja, 1/6.
Distribuio de probabilidade de X
x P[X=x]
3 1/3
4 1/3
5 1/3
Total 1
Experimento: Um determinado tratamento alcana 70% de cura de certa doena quando o mesmo
administrado a pacientes em condies bem definidas.
Espao amostral:
E = { (C C C), (C C N), (C N C), (N C C), (C N N), (N C N), (N N C), (N N N)}
a) Sabemos que a probabilidade de um indivduo se submeter ao tratamento alcana uma probabilidade de cura de
70%
Eventos Probabilidade x
CCC (0.70)3 3
CCN (0.70)2 *0.2 2
CNC (0.70)2 *0.2 2
NCC (0.70)2 *0.2 2
CNN (0.2)2 *0.7 1
NCN (0.2)2 *0.7 1
NNC (0.2)2 *0.7 1
NNN (0.2)3 0
Total 1
Distribuio de probabilidade de X
x P[X=x]
0 (0.2)3
1 3*(0.2)2 *0.7
2 3*(0.70)2 *0.2
3 (0.70)3
Total 1
Exerccio (5.5)
0,98
S P(L=2,30) = 0,98
Assim, a distribuio da varivel aleatria lucro por muda produzida dada por:
Exerccio (6.1)
Exerccio (6.2)
50!
P ( X = 45) = (0.99) 45 (0.01) 50 45 = 0.001
(50 45)!45!
50! 46 50 46
P( X = 46) = (0.99 ) (0.01) = 0.0015
(50 46)!46!
50! 47 50 47
P( X = 47 ) = (0.99 ) (0.01) = 0.0122
(50 47 )!47!
50! 48 50 48
P( X = 48) = (0.99 ) (0.01) = 0.0756
(50 48)!48!
50! 49 50 49
P( X = 49) = (0.99 ) (0.01) = 0.3056
(50 49)!49!
50! 50 50 50
P( X = 50) = (0.99 ) (0.01) = 0.6050
(50 50 )!50!
P(X 45) = 0.0001 + 0.0015 + 0.0122 + 0.0756 + 0.3056 + 0.6050 1 100%
b) O experimento tem um nmero fixo de tentativas que so independentes, classificadas nas categorias
X: nmero de pessoas com alergia quando n=12 pessoas sero selecionadas aleatoriamente.
Exerccio (6.4)
Assim,
24
P( X = x) = .(0.04) x (1 0.04) 24 x para x = 0 ou 1.
x
Estamos interessados em saber qual a probabilidade que o carregamento seja aceito, isto ,
P( X 1) = P( x = 0) + P( x = 1)
24!
P( X = 0) = (0.04) 0 (0.96) 240 = 0.375
(24 0)!0!
24!
P( X = 1) = (0.04)1 (0.96) 241 = 0.375
(24 1)!1!
P( X 1) = 0.375 + 0.375 = 0.75
Exerccio (6.5)
Assim,
10
P( X = x) = .(0.9) x (1 0.9)10 x para x = 0, 1, 2,...ou 10.
x
a) A probabilidade de que todos sobrevivam
10 10!
P( X = 10) = (0.9)10 (0.1)10 10 = (0.9)10 (0.1)1010 = 0.3487
10 (10 0)!0!
A probabilidade de que todos os pacientes sobrevivam cirurgia de 34.87%.
b) A probabilidade de que ningum sobreviva
10 10!
P( X = 0) = (0.9) 0 (0.1)10 0 = (0.9) 0 (0.1)10 0 = 1.0 10
0 (10 0)!0!
= 0.0000000001
A probabilidade de que ningum sobreviva cirurgia muito baixa.
Exerccio (6.6)
a) O modelo adequado o modelo Binomial, pois o nmero de tentativas (de uma semente germinar) fixo
para cada pacote, e a probabilidade de sucesso (semente germinar) em cada experimento sempre a mesma,
isto , uma semente germina independente dos outros.
Assim,
10
P( X = x) = .(0.9) x (1 0.9)10 x para x = 0, 1, 2,...ou 10.
x
c) Um cliente comprou um pacote destas sementes Qual a probabilidade de que pelo menos 7 sementes deste pacote
germinem?
P ( X 7 ) = P ( X = 10 ) + P ( X = 9) + P ( X = 8) + P ( X = 7 )
10!
= 0,3487 + 0,3874 + 0,1937 + ( 0,9) 7 ( 0,1)10 7
(10 7 )!7!
= 0.9872
d) Em 80 destes pacotes, qual o nmero esperado de pacotes com todas as sementes germinadas.
E[X] = n.p = 80 (0.9) = 72 pacotes.
Exerccio (6.7)
Exerccio (6.8)
Supondo X ~ Poissonl ( = 7)
Assim,
e 7 .7 x
P ( X = x) = para x = 0, 1, 2,...
x!
A probabilidade de que pelo menos um dente-de-leo achado em uma rea de 1m2 de 99.9%
Exerccio(6.10)
a) O parmetro estimado por: (0 *190 + 1*180 + 2*85 + 3*35 + 4*8 + 5*2)/500 = 0.994.
No quadro acima podemos observar que as frequncias observadas e esperadas superestimam quando o
nmero de Prmulas por quadrado, so, 0 e 3, e subestima quando so, 1 e 2, os outros resultados so
considerados prximos entre os valores observados e esperados. Assim, podemos concluir que, as plantas
de Prmula seguem aproximadamente o modelo de distribuio de Poisson.
c) Clculo da varincia amostral:
s2=[190(0-0.994)2+180(1-0.994)2+85(2-0.994)2+35(3-0.994)2+8(4-0.994)2+2(5-0.994)2]/499 = 1.04
Como E[X] = = 0,994 para o modelo de Poisson e a varincia amostral encontrada igual a 1,04, podemos
notar que h uma pequena diferena entre estes valores o que indica que aceitvel a afirmao de que
Var[X] E[X] no modelo de Poisson.
Seo 7: Distribuies de Probabilidade: Normal e Faixa de Referncia
Exerccio (7.1)
Exerccio (7.2)
Exerccio (7.3)
Exerccio (7.4)
X 9.4 15 9.4
a) P(X > 15) = P >
4.2 4.2
X 9.4 a 9.4
P < = 0.33
4.2 4.2
a 9.4
P Z < = 0.33
4.2
a 9.4
= 0.44
4.2
a = 7.552 kg
Exerccio (7.5)
a 178.1
P Z < = 0.93
40.7
a 178.1
= 1.47
40.7
a = 237.929 mg/100 mL
X: altura da mulher
X ~ N ( =161.5; =6.4)
147 185
a) P(147 X 185) = P <X<
147 161.5 185 161.5
= P <X <
6.4 6.4
= P( 2.27 < Z < 3.67 )
= P( Z < 3.67) P( Z < 2.27)
= 1 0.0116
= 0.9884
A porcentagem de mulheres da populao que satisfazem a exigncia das Foras Armadas 98.84%.
Exerccio (7.7)
a) a = P0.05% e b = P0.95%
Uma pessoa sadia se estiver na faixa [P0.05% ; P0.95%] e no sadia se estiver fora.
b) A especificidade de um teste estimada como sendo a frequncia de negativos entre as pessoas sadias. Para a faixa
proposta no exerccio, temos que 90% so consideradas negativas.
c) A sensibilidade de um teste estimada como sendo a frequncia de positivos entre as pessoas doentes. Se b o
percentil 5 na populao doente, ento 95% das pessoas doentes tm valores maiores do que b. E, pelo critrio do
teste, pessoas com valores acima de b so consideradas positivas. Sendo assim, 95% das pessoas doentes so
consideradas positivas pelo teste. Ou seja, a sensibilidade do teste 95%.
Para pensar: o que acontecer com a especificidade do teste se aumentarmos a faixa de referncia do teste para 95%?
E o que acontecer com a sensibilidade do teste?
Exerccio (7.8)
a)
26 | 33
28 | 05378
30 | 68
32 | 9
34 | 27
Figura 7.1: Peso em kg dos meninos
Como o grfico de ramos e folha mostra que os pesos no esto distribudos de maneira simtrica, temos que os
pesos dos meninos recm nascidos no se distribuem de acordo com o modelo Gaussiano.
b) A distribuio dos pesos das meninas parece ser simtrica pela anlise do box-plot e no qq-plot temos os quantis
amostrais prximos dos gaussianos. Assim, podemos supor que o peso de meninas recm-nascidas se distribui de
acordo com o modelo Gaussiano.
Exerccio (7.9)
a) Os valores referentes a gastos hospitalares parecem se distribuir de forma assimtrica com concentrao esquerda
e no qq-plot note-se que os valores dos quantis na parte superior direito encontram-se distante da linha normal o que
indica que os quantis amostrais no so prximos dos quantis gaussianos. Assim, podemos supor que os gastos
hospitalares no se distribuem de acordo a um modelo Gaussiano.
b)
Quantis i 0.5 Quantis Quantis i 0.5 Quantis
amostrais fi = gausssianos amostrais fi = gausssianos
n n
8,84 0.03 -1.83 20,06 0.57 0.17
11,05 0.10 -1.28 21,80 0.63 0.34
14,11 0.17 -0.97 23,01 0.70 0.52
18,51 0.23 -0.73 25,38 0.77 0.73
18,87 0.30 -0.52 28,75 0.83 0.95
19,07 0.37 -0.34 29,31 0.90 1.28
19,56 0.43 -0.17 32,35 0.97 1.88
19,80 0.50 0
Os gastos de internao para a amostra dada em questo, parece se distribuir de forma assimtrica com concentrao a
direita, no qqplot note-se que os valores dos quantis encontram-se fora da linha da normalidade, portanto, podemos
supor que os gastos hospitalares para estes dados no segue um modelo Gaussiano.
Exerccio (7.10)
X 80 A 80 A 80 A 80
P( X > A) = 0.05 P > = 0.05 P Z > = 0.05 P Z < = 0.05
5 5 5 5
A 80
Logo, = 1.645 A = 88.2
5
Valor de B
X 80 B 80 B 80 B 80
P( X > B) = 0.25 P > = 0.25 P Z > = 0.25 P Z < = 0.25
5 5 5 5
B 80
Logo, = 0.68 B = 83.4
5
Valor de C
X 80 C 80 C 80 C 80
P(X>C)=0.5 P > = 0.5 P Z > = 0.5 P Z < = 0.5
5 5 5 5
C 80
Logo, = 0 C = 80
5
b) Sabe-se que um aluno ser reprovado se a nota dele for inferior a 70. Ento devemos calcular P(X < 70)
X 80 70 80
P < = P[Z < 2] = 0.0228
5 5
c) Considera-se que a distribuio da varivel aleatria Y segue o modelo Binomial com parmetros n=30 e
probabilidade de sucesso p = 0.0228 (probabilidade de ser reprovado), pressupe-se que cada um dos 30 alunos so
independentes e todos com a mesma probabilidade de sucesso p.
Assim,
30
P( X = 10) = .(0.0228)10 (0.9772) 3010
10
30!
= (0.0228)10 (0.9772) 20
10!20!
0
Exerccio (8.1)
3
Como a amostra grande, pelo Teorema Central do Limite, temos que: X ~ Normal13,
60
X 13 14 13
[ ]
a) P X < 14 = P <
3 3
60 60
= P[Z < 2,58] = 0,9951
A probabilidade do tempo mdio de espera ser menor que 14 minutos 99,51%.
X 13 11.5 13
[
b) P X > 11,5 = P ] >
3 3
60 60
= P[Z > 3,87 ]
= P[Z < 3,87] 1
A probabilidade do tempo mdio de espera ser maior que 11.5 minutos de aproximadamente 100%.
Exerccio (8.2)
X 103 110 103
[ ]
a) P X > 110 = P >
15 15
50 50
= P[Z > 3,30]
= P[Z < 3,30] = 0,0005
A probabilidade do QI mdio ser maior que 110 0.05%.
X 103 100 103
[ ]
b) P X < 100 = P <
15 15
50 50
= P[Z < 1,41] = 0,0793
A probabilidade do QI mdio ser menor que 100 7.93%.
Exerccio (8.3)
Temos que: X segue uma distribuio Normal de mdia ( = 20 insetos) e desvio padro ( = 5 insetos)
Assim, X ~ N (20, 5) .
Considerando uma amostra de n = 30 plantas de algodo e pelo Teorema Central do Limite, segue que
5
X ~ N 20,
20
X 20 18 20
[ ]
a) P X < 18 = P > = P[Z < 2,19] = 0,0143
5 5
30 30
A probabilidade do nmero mdio de insetos observados para estas 30 plantas seja menor do que 18
1.43%.
5 5 5 5
b) X z ; X + z = 20 1.96 ;20 + 1.96 = [18.21; 21.79]
2 3 2 3 30 30
Exerccio (8.4)
Temos que: X segue uma distribuio Normal de mdia ( = 30 kcal/kg) e desvio padro ( = 5 kcal/kg)
Assim, X ~ N (30, 5) .
5
Pelo Teorema Central do Limite, temos que a distribuio de X ~ N 30,
50
21.5 30 X 30 24 30
[ ]
b) P 21.5 < X < 24 = P
5
<
5
<
5
= P[ 12.02 < Z < 8.48] 0
50 50 50
A probabilidade de que X esteja entre 21.5 e 24 kcal/kg aproximadamente 0.
Seo 9: Intervalos de Confiana
Exerccio (9.1)
= 0.025 .
2
s 645
E = z = 1.960 = 91.715
2 n 190
IC 95 % = [x E ; x + E ]
IC 95 % = [2700 91 .7147 ; 2700 + 91 .715 ]
IC 95 % = [2608 .285; 2791 .715 ]
Concluso: Com 95% de confiana, conclumos que a mdia de peso dos bebs que nasceram de mes
usurias de cocana est entre 2608g e 2791g.
Exerccio (9.2)
A presso sangunea sistlica mdia de 40 indivduos est entre 114.4 e 123.4, com 99% de confiana.
Exerccio (9.3)
= 0.025 .
2
Calculando a margem de erro:
s 0,62
E = z = 1.96 = 0.118
2 n 106
IC 95 % = [x E ; x + E ]
IC 95 % = [98 .2 0.118; 98 .2 + 0.118 ]
IC 95 % = [98 .082; 98.318 ]
Concluso: Com 95% de confiana, conclumos que a mdia da temperatura de 106 adultos sadios
est entre 98,08 F e 98,32 F.
Exerccio (9.4)
IC 90% = [x E ; x + E ]
IC 90% = [13.90 0,780; 13.90 + 0,780]
IC 90% = [13.120; 14.680]
Concluso: Com 90% de confiana, conclumos que o consumo mdio de oxignio do rim de pacientes
com a molstia est entre 13.09 cm3/min e 14.71 cm3/min.
Exerccio (9.5)
s 6.37
E = t = 2.262 = 1.805
2
;( n 1) n 10
IC 95% = [x E; x + E ]
IC 95% = [13.90 1.805; 13.90 + 1.805]
IC 95% = [12.095; 15.705]
Concluso: Com 95% de confiana, conclumos que o peso mdio de cada caixa de cereais est entre
12.095 gramas e 15.705 gramas.
Exerccio (9.6)
x = 12dias
s = 8dias
n = 25 pacientes
= 0,02
Visto que a varivel aleatria X tem distribuio Normal com amostra, ento o Intervalo de Confiana
dado por:
s s
x t ;( n 1) ; x + t
; ( n 1)
2 n 2 n
0,02
= 0.02 = = 0.01
2 2
O valor crtico t = 2.492 , que encontrado na Tabela t-Student, como o valor crtico correspondente
; ( n 1)
2
a n 1 = 24 graus de liberdade e a uma rea em uma cauda de 0,01.
s 8
E = t = 2.492 = 1.410
2
;( n 1) n 25
Calculando o Intervalo de Confiana:
IC 98% = [x E; x + E ]
IC 98% = [12 1.410; 12 + 1.410]
IC 98% = [10.590;13.41]
Concluso: Com 98% de confiana, conclumos que a permanncia mdia dos pacientes no Hospital
das Clnicas de So Paulo est entre 10.59 dias e 13.41 dias.
Exerccio (9.7)
n = 325
x 295
p = = = 0.91 Proporo amostral de x sucessos em uma amostra de tamanho n
n 325
= 0,01
O valor crtico z = 2.575 , que encontrado na Tabela da distribuio Normal, como o valor crtico
2
correspondente a = 0.0050 .
2
p (1 p ) 0,91(1 0.91)
E = z = 2.575 = 0.041
2
n 325
IC 99
p
%
= [ p E ; p + E ]
IC 99
p
%
= [0.91 0.041; 0.91 + 0.041]
IC 99
p
%
= [0.869; 0.951]
Concluso: Com 99% de confiana, conclumos que o mtodo parece ser eficaz, pois a proporo de
meninas substancialmente maior que 0.5.
Exerccio (9.8)
n = 420.095
x 135
p = = = 3.214 10 4 Proporo amostral de x sucessos em uma amostra de tamanho n
n 420.095
= 0,05
O valor crtico z = 1.96 , que encontrado na Tabela da distribuio Normal, como o valor crtico
2
correspondente a = 0,0250 .
2
2
n 420.095
IC 95
p
%
= [ p E ; p + E ]
IC 95
p
%
[( ) ( )( ) (
= 3,214 10 4 5,421 10 5 ; 3, 214 10 4 + 5, 421 10 5 )]
IC 95
p
%
= [0,0267 %; 0,0376 ]
Concluso: Com 95% de confiana, conclumos que os usurios de telefones celulares parecem no ter uma
taxa de cncer do crebro ou do sistema nervoso que seja diferente da taxa entre os que no usam telefones
celulares, pois 0,0340% est includo no intervalo de confiana.
Exerccio (9.9)
Varivel X: Nmero de dias entre o incio dos sintomas da Leishmaniose Visceral e a notificao do caso
s autoridades.
Pelo enunciado acima temos:
Erro da estimativa: E = .
2
Coeficiente de confiana: P(E) = = 0,95.
O valor crtico z = 1.96 foi encontrado na Tabela da distribuio Normal, correspondente a
2
=0.05 = 0.025 .
2
2
2
2
n = z / 2 = 1.96 = (1.96 2 ) = 15.366
E
2
Concluso: Logo, para que o erro cometido na estimao do nmero mdio de dias entre os sintomas da
Leishmaniose Visceral e a notificao do caso s autoridades, seja a metade do desvio-padro do nmero
de dias, com probabilidade igual a 95%, a pesquisadora deve estudar aproximadamente 16 casos.
Exerccio (9.10)
n = 2500
x 850
p = = = 0,34 Proporo amostral de x sucessos em uma amostra de tamanho n
n 2500
= 0.05
O valor crtico z = 1.96 , que encontrado na Tabela da distribuio Normal, como o valor crtico
2
correspondente a = 0.0250 .
2
p (1 p ) 0,34 (1 0,34)
E = z = 1,96 = 0,018569383
2
n 2500
IC 95
p
%
= [ p E ; p + E ]
IC 95
p
%
= [0,34 0,0186 ;0,34 + 0,0186 ]
IC 95
p
%
= [0,3214 ;0,3586 ]
Exerccio (9.11)
a) Variavel X: Nmero de ratos nos quais se desenvolve certo tipo de tumor quando submetidos
radiao.
Pelo enunciado acima temos:
- Erro da estimativa: E=0,02.
- Coeficiente de confiana: P(E) = = 0,90.
=0.10 = 0.05 .
2
Como no temos uma informao preliminar sobre p, devemos utilizar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2 2
z 1.65
n = / 2 p(1 p) = 0.25 = 1701.563
E 0.02
Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve certo
tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade igual a 0,90, o
pesquisador precisa examinar 1702 animais.
b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que em
geral esse tipo de radiao no afeta mais que 20% dos ratos?
Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de ratos nos
quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com
probabilidade igual a 0,90, o pesquisador precisa examinar 1.089 animais.
Exerccio (9.12)
E = 0.02
=0.05
z tal que A(z) = 0.975 z = 1.96
Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2 2
z 1,96
n = p(1 p) = 0, 25 = 2401 .
0, 02
O tamanho da amostra deve ser 2401 indivduos para que as condies acima sejam satisfeitas.
1.488 2
P( X < 1.488) = P Z < = P[Z < 1.28] = 0.1003
0.4
A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da amostra, pois como o valor
de p no mximo 0.1, o valor mximo de p(1-p) atingido quando p=0.10, e assim:
2 2
z 1,96
n = p(1 p ) = 0,10 * 0,90 = 864.36
0, 02
Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para aproximadamente 865
indivduos.
Seo 10: Conceitos Bsicos de Testes de Hipteses
Exerccio (10.1)
ii. Hipteses:
H0: = 50
Ha: < 50
iii. Erro tipo I: Concluir que a altura mdia dos recm nascidos menor de que 50 cm quando, na verdade, a
altura mdia 50 cm.
Erro tipo II: Concluir que a altura mdia dos recm nascidos igual a 50 cm quando, na verdade, a altura
mdia menor que 50 cm.
49.35 50
Tobs = = 1.0688
2.7198
20
Verificao: Como -1,0688 est fora da regio de rejeio, no rejeitamos H0, ao nvel de 5% de
significncia.
v. Valor p:
Concluso: Ao nvel de 5% de significncia, no temos evidncias para rejeitar a hiptese de que a altura
mdia de recm nascidos igual a 50 cm (Valor p = 0.15).
Exerccio (10.2)
a)
ii. Hipteses:
H0: = 130
Ha: > 130
iii. Erro tipo I: Concluir que a presso sistlica mdia em homens maior do que 130 mmHg, quando, na
verdade, a presso sistlica mdia 130 mmHg.
Erro tipo II: Concluir que a presso sistlica mdia em homens igual a 130 quando, na verdade, a
presso sistlica mdia maior que 130 mmHg.
133 130
Z obs = = 1,5
16
64
Verificao: Como 1.5 est fora da regio de rejeio, no rejeitamos H0, ao nvel de 5% de significncia.
v. Valor p:
Concluso: Ao nvel de 5% de significncia, no temos evidncias suficientes para rejeitar a hiptese de que
a presso sistlica mdia igual a 130 mmHg (Valor p = 0.0668).
b)
ii. Hipteses:
H0: = 130
Ha: 130
iii. Erro tipo I: Concluir que a presso sistlica mdia em homens diferente de 130 quando, na verdade, a
presso sistlica mdia 130 mmHg.
Erro tipo II: Concluir que a presso sistlica mdia em homens igual a 130 quando, na verdade, a
presso sistlica mdia diferente de 130 mmHg.
133 130
Z obs = = 1,5
16
64
Verificao: Como 1.5 est fora da regio de rejeio, no rejeitamos H0, ao nvel de 5% de significncia.
v. Valor p:
Concluso: Ao nvel de 5% de significncia, no temos evidencias suficientes para rejeitar a hiptese de que
a presso sistlica mdia igual a 130 mmHg (Valor p = 0.1336).
Como a hiptese alternativa bilateral, podemos usar o intervalo de confiana para realizar o teste de
hipteses. O intervalo ter 95% de confiana, j que, o nvel de significncia de 5%.
vi. Intervalo de confiana para :
100(1 - ) = 95
1 = 0.95
= 0.05
/2 = 0.025
Z 0,025 = 1,96
16
IC 95% = 133 1,96
64
Interpretao: A presso sistlica mdia est entre 129.08 e 136.92, com 95% de confiana.
Exerccio (10.3)
ii. Hipteses:
H0: p = 0.25
Ha: p < 0.25
iii. Erro tipo I: Concluir que a proporo de embries de frangos com anomalia menor de que 0.25 quando,
na verdade, a proporo de embries de frangos com anomalia 0.25.
Erro tipo II: Concluir que a proporo de embries de frangos com anomalia igual a 0.25 quando, na
verdade, a proporo de embries de frangos com anomalia menor que 0.25.
0.14 0.25
Z obs = = 1.7963
0.25(1 0.25)
50
Verificao: Como -1.7963 est na regio de rejeio, rejeitamos H0, ao nvel de 5% de significncia.
v. Valor p:
Concluso: Ao nvel de 5% de significncia, temos evidencias para rejeitar a hiptese de que a proporo de
embries com anomalia igual a 0.25 (Valor p = 0.0359).
Exerccio (10.4)
a)
ii. Hipteses:
H0: p = 0,60
Ha: p > 0,60
iii. Erro tipo I: Concluir que a proporo de terapeutas ocupacionais que deixam a profisso maior do que
0.60 quando, na verdade, a proporo de terapeutas ocupacionais que deixam a profisso 0.60.
Erro tipo II: Concluir que a proporo de terapeutas ocupacionais que deixam a profisso igual a 0.60
quando, na verdade, a proporo de terapeutas ocupacionais que deixam a profisso maior que 0.60.
0.63 0.60
Z obs = = 1.6155
0.60(1 0.60)
696
Verificao: Como 1.6155 est fora da regio de rejeio, no rejeitamos H0, ao nvel de 5% de
significncia.
v. Valor p:
b)
ii. Hipteses:
H0: p = 0.60
Ha: p 0.60
iii. Erro tipo I: Concluir que a proporo de terapeutas ocupacionais que deixam a profisso diferente de
0.60 quando, na verdade, a proporo de terapeutas ocupacionais que deixam a profisso igual a 0.60.
Erro tipo II: Concluir que a proporo de terapeutas ocupacionais que deixam a profisso igual a 0.60
quando, na verdade, a proporo de terapeutas ocupacionais que deixam a profisso diferente de 0.60.
0.63 0.60
Z obs = = 1.6155
0.60(1 0.60)
696
Verificao: Como 1.6155 est na regio de rejeio, rejeitamos H0, ao nvel de 5% de significncia.
v. Valor p:
Concluso: Ao nvel de 5% de significncia, no temos evidencias suficientes para rejeitar a hiptese de que
a proporo de mulheres que abandonam a profisso igual a 0.60 (Valor p =0.0526).
Como a hiptese alternativa bilateral podemos usar o intervalo de confiana para realizar o teste de
hipteses. O intervalo ter 95% de confiana, j que, o nvel de significncia de 5%.
100(1 - ) = 95
1 = 0.95
= 0.05
/2 = 0.025
Z 0,025 = 1.96
0.63(0.37)
IC 95
p
%
= 0.63 1.96
696
Interpretao: A proporo de mulheres grvidas que abandonam a profisso est entre 59% e 67%, com
95% de confiana.
Para pensar mais um pouco: se a hiptese de pesquisa fosse que a proporo de mulheres grvidas que
abandonam a profisso diferente de 0.50, qual seria a concluso da letra b)?
Exerccio (10.5)
ii. Hipteses:
H0: p = 0,60
Ha: p > 0,60
iii. Erro tipo I: Concluir que a proporo de crianas que tomaram a srie completa de vacinas maior do
que 0,60 quando, na verdade, a proporo de crianas que tomaram a srie completa de vacinas 0,60.
Erro tipo II: Concluir que a proporo de crianas que tomaram a srie completa de vacinas igual a
0,60 quando, na verdade, a proporo de terapeutas crianas que tomaram a srie completa de vacinas
maior que 0,60.