Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LISTA DE EXERCCIO 03
1. A tabela seguinte mostra os resultados dos clculos das mdias e desvios padro da taxa de
crescimento de indstrias qumicas em diferentes regies. Quais as concluses que voc pode
tirar desta tabela?
Regio Indstrias Mdia Desvio padro
So Paulo
12
-0.36
0.67
Guarulhos
8
3.35
2.47
2. Suponha que o desempenho dos alunos das trs ltimas fases do curso de Eng Qumica da
UFPR tenha distribuio normal de mdia 6,5 e desvio padro de 0,6. Selecionando
aleatoriamente um aluno desta populao, qual a probabilidade de ele acusar o desempenho
entre 2,0 e 3,5?
3. Resultados de titulaes feitas em amostras de vinagre:
Titulao
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a)
b)
c)
Concentrao(%)
3,91
4,01
3,61
3,83
3,75
3,91
3,82
3,70
3,50
3,77
3,96
3,85
3,67
3,83
3,77
3,51
3,85
4,04
3,74
3,97
d)
Que concentrao seria obtida numa titulao cujo resultado estivesse 2,5 desvios padro
acima da mdia?
e) Qual a probabilidade de uma amostra conter mais que 3,95% de cido actico?
4) Foram realizados experimentos sobre a administrao de 4 tipos de drogas (A, B, C, D) e
seus efeitos sobre uma enzimtica em um grupo de grupos de 24 indivduos. Os dados
coletados so mostrados abaixo.
Calcule e interprete:
a) mdia, moda e mediana, quartis, desvio padro dos dados, valor mximo e mnimo,
coeficiente de variao;
b) verifique a presena de outliers e comente com base na construo de histogramas
(cuidado com a quantidade de categorias escolhidas), Box plots (cuidado com a escolha
dos limites) e grficos da probabilidade normal esperada.
c) Monte uma tabela com os valores de z e p para o clculo do teste de Grubb para os dados
abaixo. Assumindo um nvel de significncia de 5 %, qual a concluso sobre a presena de
outliers?
d) Monte uma tabela com os valores da probabilidade para o teste de Chauvenet, assim
como ex do slide 12 da aula. (Use o calculador de probabilidades do Statistca para lhe
auxiliar)
e) Faa a inferncia e calcule o intervalo para 95% de confiana e discuta a influncia dos
possveis outliers sobre este resultado.
A
72
78
71
72
66
74
62
69
85
82
71
83
86
85
79
83
69
66
84
80
72
65
75
71
B
86
83
82
83
79
83
73
75
86
86
78
88
85
82
83
84
73
62
90
81
72
62
69
70
C
81
88
81
83
77
84
78
76
83
80
70
79
76
83
80
78
72
67
88
77
69
65
69
65
D
77
81
75
69
66
77
70
70
80
84
75
81
76
80
81
81
74
73
87
72
70
61
68
63
35,05
45,26
38,41
35,03
44,13
48,28
39,86
34,75
36,84
38,03
39,33
40,97
41,07
45,84
40,53
41,80
38,20
43,95
41,89
50,84
39,50
43,17
41,70
36,66
45,18
38,76
37,91
48,33
41,70
42,11
38,30
42,25
49,73
45,69
43,87
40,85
43,07
41,52
43,88
37,73
40,12
41,20
30,88
34,90
34,65
40,72
42,69
42,96
38,73
39,98
35,94
38,12
39,47
39,29
35,76
44,56
37,07
42,28
41,91
40,57
40,68
44,39
42,28
35,69
46,17
42,81
40,55
43,00
39,09
38,02
44,05
6) A resistncia interna presso (medida em psi) em garrafas de vidro usadas para bebidas
gaseificadas um aspecto importante de qualidade. Certa fbrica de garrafas tem 3 linhas
de produo: A, B e C. Periodicamente, amostras de 25 garrafas de cada linha so
retiradas por sorteio, e encaminhadas ao fabricante de bebidas para anlise. Na ltima vez
que este procedimento foi feito, os resultados abaixo foram encontrados pelo analista:
Sobre estes resultados, faa a interpretao e discusso dos dados segundo as questes
abaixo:
a) Com base apenas nas medidas de sntese do TOTAL de garrafas da tabela acima, caracterize
a tendncia central, disperso, assimetria, curtose e existncia de discrepantes da resistncia
presso.
b) Com base apenas nas medidas de sntese possvel considerar que a resistncia apresenta
distribuio normal nas 3 linhas de produo A, B e C?
c) Com base apenas nas medidas de sntese h evidncia de diferena na resistncia em funo
das linhas de produo?
7)
RESPOSTAS
1 A tabela se encontra incompleta, pois se fala de taxa de crescimento, e no se tem os dados
dessa taxa. Somente a mdia e o desvio padro dessa taxa, podendo ser interpretado
erroneamente os dados. Assim d somente para se dizer que no houve crescimento em So
Paulo das industrias, mas essa mdia entra no desvio padro e pode ser considerado que se
manteve estvel. J em Guarulhos pode ser considerado que houve um crescimento, pois a
mdia supera o desvio padro.
Podendo ser avaliado o intervalo de confiana para So Paulo e Guarulhos.
2
PARA UMA DISTRIBUIO NORMAL:
-14
P1=3,19.10
P2=2,86.10 . A
2,0
3,5
VALOR DE
DE
P=P2-
-7
P1=2,86.10 .
3 a)
Descriptive Statistics
Mean
Standard
Variable
Error
concentrao %
3,800000
0,033740
b)
c)
Descriptive Statistics (Spreadsheet3)
Confidence
Confidence
Variable
-95,000%
95,000
concentrao %
3,729380
3,870620
Comparado com o intervalo com 95% de confiana, pode-se dizer que o intervalo definido por 2
desvios padro da mdia est dentro dessa confiabilidade.
d)
temos que
. O que nos
0
0
0
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
6
6
6
6
6
7
7
7
7
7
8
8
8
8
8
9
9
9
9
9
10
10
10
10
10
11
11
11
11
11
12
12
12
12
12
13
13
13
13
13
14
14
14
14
14
15
15
15
15
15
16
16
16
16
16
17
17
17
17
17
18
18
18
18
18
19
19
19
19
19
20
20
20
20
20
21
21
21
21
21
22
22
22
22
22
23
23
23
23
23
24
24
24
24
24
25
25
25
y=chi2(x;10)
4 a)
Descriptive Statistics (Spreadsheet30)
Mean
Median
Mode Frequen Minimu Maximu Lower
Upper Std.Dev. Coef.Var Standar
cy
m
m
Quartile Quartile
.
d
of Mode
Error
Var
A
B
C
D
75,00000
73,00000
Multiple
62,00000
86,00000
70,00000
82,50000
7,247188
9,662918
1,479326
78,95833
82,00000
83,00000
62,00000
90,00000
73,00000
84,50000
7,782249
9,856147
1,588545
77,04167
78,00000
83,00000
65,00000
88,00000
71,00000
82,00000
6,746846
8,757398
1,377194
74,62500
75,00000
81,00000
61,00000
87,00000
70,00000
80,50000
6,658192
8,922200
1,359098
b)
Box Plot of B
Spreadsheet30 4v*24c
Box Plot of A
Spreadsheet30 4v*24c
95
100
90
95
85
90
80
85
75
80
70
75
65
Mean = 75
MeanSE
= (73,5207, 76,4793)
Mean2*SD
= (60,5056, 89,4944)
Outliers
Extremes
60
55
A
70
Mean = 78,9583
MeanSE
= (77,3698, 80,5469)
Mean2*SD
= (63,3938, 94,5228)
Outliers
Extremes
65
60
B
Box Plot of C
Spreadsheet30 4v*24c
Box Plot of D
Spreadsheet30 4v*24c
95
90
90
85
85
80
80
75
75
70
70
65
Mean = 77,0417
MeanSE
= (75,6645, 78,4189)
Mean2*SD
= (63,548, 90,5354)
Outliers
Extremes
65
60
Mean = 74,625
MeanSE
= (73,2659, 75,9841)
Mean2*SD
= (61,3086, 87,9414)
Outliers
Extremes
60
55
Normal P-Plot: B
Normal P-Plot: A
2,5
2,5
2,0
2,0
1,5
1,0
1,5
0,5
0,0
-0,5
-1,0
0,5
0,0
-0,5
-1,0
-1,5
-1,5
-2,0
-2,5
60
1,0
62
64
66
68
70
72
74
76
78
80
82
84
86
-2,0
60
88
65
70
75
Value
80
85
90
95
Value
Normal P-Plot: D
Normal P-Plot: C
2,5
2,0
2,0
1,5
1,5
1,0
0,5
0,0
-0,5
1,0
0,5
0,0
-0,5
-1,0
-1,0
-1,5
-1,5
-2,0
64
-2,0
66
68
70
72
74
76
78
Value
80
82
84
86
88
90
-2,5
58
60
62
64
66
68
70
72
74
Value
76
78
80
82
84
86
88
90
Histogram: A
K-S d=,16055, p> .20; Lilliefors p<,15
Expected Normal
Histogram: B
K-S d=,19371, p> .20; Lilliefors p<,05
Expected Normal
10
9
8
7
6
No. of obs.
No. of obs.
6
5
4
5
4
0
55
60
65
70
75
80
85
90
55
60
65
70
75
80
85
90
Histogram: C
K-S d=,14698, p> .20; Lilliefors p> .20
Expected Normal
Histogram: D
K-S d=,12358, p> .20; Lilliefors p> .20
Expected Normal
10
8
6
5
No. of obs.
No. of obs.
5
4
4
3
3
2
2
1
0
60
65
70
75
80
85
90
55
60
65
70
75
80
85
90
Existem outliers, pois os indivduos apresentam respostas diferentes as drogas. Mas no so dados to discrepantes
assim. Conforme a anlise que pode ser feita nos histogramas e nos grficos de probabilidade normal.
c)
Descriptive Statistics (Spreadsheet30)
Valid N Trimmed Winsorized Grubbs Test
mean
mean
Statistic
Variable
5,0000% 5,0000%
A
24
75,09091 75,08333
1,793799
B
24
79,22727 78,87500
2,179104
C
24
77,09091 77,04167
1,784785
D
24
74,68182 74,58333
2,046351
p-value
1,000000
1,000000
1,000000
1,000000
Box Plot of A
Spreadsheet30 4v*24c
Box Plot of B
Spreadsheet30 4v*24c
90
95
88
86
90
84
82
85
80
78
80
76
74
75
72
70
70
68
Mean = 75,0909
MeanSE
= (73,6814, 76,5004)
Mean2*SD
= (61,8689, 88,313)
Outliers
Extremes
66
64
62
60
Mean = 79,2273
MeanSE
= (77,7695, 80,6851)
Mean2*SD
= (65,5517, 92,9029)
Outliers
Extremes
65
60
B
Box Plot of D
Spreadsheet30 4v*24c
Box Plot of C
Spreadsheet30 4v*24c
92
90
90
88
88
86
86
84
82
84
80
82
78
80
76
78
74
76
72
74
70
72
68
70
Mean = 77,0909
MeanSE
= (75,79, 78,3918)
Mean2*SD
= (64,8877, 89,2941)
Outliers
Extremes
68
66
64
62
66
Mean = 74,6818
MeanSE
= (73,4679, 75,8957)
Mean2*SD
= (63,2945, 86,0691)
Outliers
Extremes
64
62
60
58
n=24
72
78
71
72
66
74
62
69
85
82
71
83
86
85
79
83
69
probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,339
0,021
0,661
0,021
0,290
0,021
0,339
0,021
0,107
0,021
0,445
0,021
0,036
0,021
0,204
0,021
0,916
0,021
0,833
0,021
0,290
0,021
0,865
0,021
0,935
0,021
0,916
0,021
0,710
0,021
0,865
0,021
0,204
0,021
66
84
80
72
65
75
71
media
desvio padro
-1,242
1,242
0,690
-0,414
-1,380
0,000
-0,552
n=24
-9,000
9,000
5,000
-3,000
-10,000
0,000
-4,000
75,000
7,247
n=24
81
0,107
0,893
0,755
0,339
0,084
0,500
0,290
0,021
0,021
0,021
0,021
0,021
0,021
0,021
probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,817
0,021
0,698
0,021
0,652
0,021
0,698
0,021
0,502
0,021
0,698
0,021
0,222
0,021
0,306
0,021
0,817
0,021
0,817
0,021
0,451
0,021
0,877
0,021
0,781
0,021
0,652
0,021
0,698
0,021
0,741
0,021
0,222
0,021
0,015
0,021
0,922
0,021
0,603
0,021
0,186
0,021
0,015
0,021
0,100
0,021
0,125
0,021
probabilidade de
obter um desvio
d = distancia da media d/desvio padro maior
rejeio 1/(2*n)
3,958
0,587
0,721
0,021
88
81
83
77
84
78
76
83
80
70
79
76
83
80
78
72
67
88
77
69
65
69
65
media
desvio padro
D n=24
77
81
75
69
66
77
70
70
80
84
75
81
76
80
81
10,958
3,958
5,958
-0,042
6,958
0,958
-1,042
5,958
2,958
-7,042
1,958
-1,042
5,958
2,958
0,958
-5,042
-10,042
10,958
-0,042
-8,042
-12,042
-8,042
-12,042
77,042
6,747
1,624
0,587
0,883
-0,006
1,031
0,142
-0,154
0,883
0,438
-1,044
0,290
-0,154
0,883
0,438
0,142
-0,747
-1,488
1,624
-0,006
-1,192
-1,785
-1,192
-1,785
0,948
0,721
0,811
0,498
0,849
0,556
0,439
0,811
0,669
0,148
0,614
0,439
0,811
0,669
0,556
0,227
0,068
0,948
0,498
0,117
0,037
0,117
0,037
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,639
0,021
0,831
0,021
0,522
0,021
0,199
0,021
0,098
0,021
0,639
0,021
0,244
0,021
0,244
0,021
0,790
0,021
0,920
0,021
0,522
0,021
0,831
0,021
0,582
0,021
0,790
0,021
0,831
0,021
6,375
-0,625
-1,625
12,375
-2,625
-4,625
-13,625
-6,625
-11,625
74,625
6,658
81
74
73
87
72
70
61
68
63
media
desvio padro
0,957
-0,094
-0,244
1,859
-0,394
-0,695
-2,046
-0,995
-1,746
0,831
0,463
0,404
0,968
0,347
0,244
0,020
0,160
0,040
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
e)
Descriptive Statistics (Spreadsheet30)
Confidence
Confidence
Variable
-95,000%
95,000
A
71,93978
78,06022
B
75,67218
82,24449
C
74,19272
79,89061
D
71,81349
77,43651
Box Plot of A
Spreadsheet30 4v*24c
Box Plot of B
Spreadsheet30 4v*24c
86
90
88
84
86
82
84
82
80
80
78
78
76
76
74
74
72
72
70
70
Mean = 75,0909
Mean0,95 Conf. Interval
= (72,1597, 78,0221)
Non-Outlier Range
= (65, 85)
Outliers
Extremes
68
66
64
68
Mean = 79,2273
Mean0,95 Conf. Interval
= (76,1956, 82,259)
Non-Outlier Range
= (69, 88)
Outliers
Extremes
66
64
62
60
Box Plot of C
Spreadsheet30 4v*24c
Box Plot of D
Spreadsheet30 4v*24c
90
86
88
84
86
82
84
80
82
78
80
76
78
74
76
72
74
70
72
68
Mean = 77,0909
Mean0,95 Conf. Interval
= (74,3856, 79,7962)
Non-Outlier Range
= (65, 88)
Outliers
Extremes
70
68
66
64
C
Mean = 74,6818
Mean0,95 Conf. Interval
= (72,1574, 77,2062)
Non-Outlier Range
= (63, 84)
Outliers
Extremes
66
64
62
60
D
Com este tipo de tratamento o nmero de outliers em relao aos outros tratamentos de dados diminuram os
extremos sumiram e aparecem apenas 2 outliers em B um e em D 1.
5 a)
Descriptive Statistics (Spreadsheet53)
Confidence
Confidence
Variable
-95,000%
95,000
cm
39,92814
41,70325
b)
Descriptive Statistics (Spreadsheet53)
Confidence
Confidence
Variable
-99,000%
99,000
cm
39,63751
41,99388
Sim, pois so vrios dados coletados e muito poucos se encontram foram da taxa de confiana de 99%.
c)
Descriptive Statistics (Spreadsheet53)
Mean
Standard
Variable
Error
cm
40,81569
0,445126
6 a)
O valor da tendncia central de presso oscila entre 179,81 e mdia de 179,9323 psi. A variao de
disperso total da presso de 159,13 a 207,13 psi, com desvio padro de 9,4095 psi, que representa
5,23% da mdia. A assimetria vale 0,1351, mdia e mediana de 179,9323 e 179,81 psi, e a diferena entre
quartil superior e mediana de 6,72 psi, entre mediana e quartil inferior 5,155 psi. Tudo isso aponta para uma
distribuio simtrica. A distribuio deve ser mesocrtica, pois o valor de curtose de 0,2079 est prximo
de zero. Existncia de valores menores do que 156,8425 psi seriam discrepantes. Como o valor mnimo de
159,13 psi, no h discrepantes inferiores. Valores maiores do que 204,3425 psi seriam discrepantes
superiores. Como o valor mximo 207,13 psi, portanto maior do que 204,3425 psi, pode-se afirmar que h
no mnimo um valor discrepante superior de presso.
b)
Sim, porque as condies necessrias para isso poder ser considerada normal, so duas variveis
de acordo em todas as 3 linhas de produo. Medida de assimetria precisa ser prxima de zero, a medida
de curtose tambm. Isso ocorre nas trs linhas: na linha A, assimetria -0,2809 e curtose 0,2262; na linha B,
assimetria 0,1300 e curtose 0,4853; na linha C, assimetria -0,0750 e curtose -0,8526.
c)
Com as mdias e medianas so semelhantes nas trs linhas de produo podemos realizar a
anlise comparando medianas e quartis. Os quartis e mediana da linha B so 176,17, 189,95 e 184 psi, da
linha C so 169,94,183,13 e 177,3 psi, e os da linha A so 174,07, 184,25 e 180,72 psi. As mdias so
184,142 psi na B, 176,6884 psi na C e 178,9664 psi na A.
7
com 99%