Sei sulla pagina 1di 14

Mestrando: Michael Anderson Prado

UNIVERSIDADE FEDERAL DO PARAN


PS GRADUAO EM ENGENHARIA QUMICA
ENQ 710: ESTATSTICA APLICADA
PROFA ELAINE TAKESHITA

LISTA DE EXERCCIO 03

1. A tabela seguinte mostra os resultados dos clculos das mdias e desvios padro da taxa de
crescimento de indstrias qumicas em diferentes regies. Quais as concluses que voc pode
tirar desta tabela?
Regio Indstrias Mdia Desvio padro
So Paulo
12
-0.36
0.67
Guarulhos
8
3.35
2.47
2. Suponha que o desempenho dos alunos das trs ltimas fases do curso de Eng Qumica da
UFPR tenha distribuio normal de mdia 6,5 e desvio padro de 0,6. Selecionando
aleatoriamente um aluno desta populao, qual a probabilidade de ele acusar o desempenho
entre 2,0 e 3,5?
3. Resultados de titulaes feitas em amostras de vinagre:
Titulao
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a)
b)
c)

Concentrao(%)
3,91
4,01
3,61
3,83
3,75
3,91
3,82
3,70
3,50
3,77
3,96
3,85
3,67
3,83
3,77
3,51
3,85
4,04
3,74
3,97

Calcular a mdia e o desvio padro dos dados acima;


Determine os limites do intervalo definido por 2desvios padro da mdia
Calcule o intervalo de confiana para 95% de confiana e compare com este valor.

d)
Que concentrao seria obtida numa titulao cujo resultado estivesse 2,5 desvios padro
acima da mdia?
e) Qual a probabilidade de uma amostra conter mais que 3,95% de cido actico?
4) Foram realizados experimentos sobre a administrao de 4 tipos de drogas (A, B, C, D) e
seus efeitos sobre uma enzimtica em um grupo de grupos de 24 indivduos. Os dados
coletados so mostrados abaixo.
Calcule e interprete:
a) mdia, moda e mediana, quartis, desvio padro dos dados, valor mximo e mnimo,
coeficiente de variao;
b) verifique a presena de outliers e comente com base na construo de histogramas
(cuidado com a quantidade de categorias escolhidas), Box plots (cuidado com a escolha
dos limites) e grficos da probabilidade normal esperada.
c) Monte uma tabela com os valores de z e p para o clculo do teste de Grubb para os dados
abaixo. Assumindo um nvel de significncia de 5 %, qual a concluso sobre a presena de
outliers?
d) Monte uma tabela com os valores da probabilidade para o teste de Chauvenet, assim
como ex do slide 12 da aula. (Use o calculador de probabilidades do Statistca para lhe
auxiliar)
e) Faa a inferncia e calcule o intervalo para 95% de confiana e discuta a influncia dos
possveis outliers sobre este resultado.
A
72
78
71
72
66
74
62
69
85
82
71
83
86
85
79
83
69
66
84
80
72
65
75
71

B
86
83
82
83
79
83
73
75
86
86
78
88
85
82
83
84
73
62
90
81
72
62
69
70

C
81
88
81
83
77
84
78
76
83
80
70
79
76
83
80
78
72
67
88
77
69
65
69
65

D
77
81
75
69
66
77
70
70
80
84
75
81
76
80
81
81
74
73
87
72
70
61
68
63

5) Foram coletados dados referentes ao controle de qualidade do comprimento de uma fibra


polimrica em cm, mostrados na tabela abaixo.
38,23

35,05

45,26

38,41

35,03

44,13

48,28

39,86

34,75

36,84

38,03

39,33

40,97

41,07

45,84

40,53

41,80

38,20

43,95

41,89

50,84

39,50

43,17

41,70

36,66

45,18

38,76

37,91

48,33

41,70

42,11

38,30

42,25

49,73

45,69

43,87

40,85

43,07

41,52

43,88

37,73

40,12

41,20

30,88

34,90

34,65

40,72

42,69

42,96

38,73

39,98

35,94

38,12

39,47

39,29

35,76

44,56

37,07

42,28

41,91

40,57

40,68

44,39

42,28

35,69

46,17

42,81

40,55

43,00

39,09

38,02

44,05

a) Encontrem o intervalo de 95% de confiana para a mdia populacional do comprimento da


fibra
b) Se quisssemos encontrar um intervalo de 99% de confiana para a mdia populacional do
comprimento da fibra, com uma erro mximo de 1cm, a amostra coletada seria suficiente?
JUSTIFIQUE.
a) Considerando que o erro de escala de cada medida da ordem de 0,05 cm, calcule o erro
total da mdia. Interprete o resultado comparando com a magnitude do erro aleatrio
obtido no item a.

6) A resistncia interna presso (medida em psi) em garrafas de vidro usadas para bebidas
gaseificadas um aspecto importante de qualidade. Certa fbrica de garrafas tem 3 linhas
de produo: A, B e C. Periodicamente, amostras de 25 garrafas de cada linha so
retiradas por sorteio, e encaminhadas ao fabricante de bebidas para anlise. Na ltima vez
que este procedimento foi feito, os resultados abaixo foram encontrados pelo analista:

Sobre estes resultados, faa a interpretao e discusso dos dados segundo as questes
abaixo:
a) Com base apenas nas medidas de sntese do TOTAL de garrafas da tabela acima, caracterize
a tendncia central, disperso, assimetria, curtose e existncia de discrepantes da resistncia
presso.
b) Com base apenas nas medidas de sntese possvel considerar que a resistncia apresenta
distribuio normal nas 3 linhas de produo A, B e C?
c) Com base apenas nas medidas de sntese h evidncia de diferena na resistncia em funo
das linhas de produo?

7)

O fabricante de bebidas da questo 6 deseja estimar a mdia de resistncia das garrafas


provenientes das linhas de produo A, B e C. Exige confiana de 99%. Sabe-se que as
amostras foram retiradas de lotes de 250 garrafas, e informao recente parece indicar
que as distribuies das presses nas 3 linhas podem ser consideradas aproximadamente
normais. Com base nas medidas de sntese da questo 1, obtenha os intervalos de
confiana para as mdias de resistncia e interprete os resultados.
Dica: conhece-se o tamanho da populao. Faa a correo do erro padro da mdia conforme o
slide 67 da aula. O erro associado mdia sem esta correo considervel ou no?

RESPOSTAS
1 A tabela se encontra incompleta, pois se fala de taxa de crescimento, e no se tem os dados
dessa taxa. Somente a mdia e o desvio padro dessa taxa, podendo ser interpretado
erroneamente os dados. Assim d somente para se dizer que no houve crescimento em So
Paulo das industrias, mas essa mdia entra no desvio padro e pode ser considerado que se
manteve estvel. J em Guarulhos pode ser considerado que houve um crescimento, pois a
mdia supera o desvio padro.
Podendo ser avaliado o intervalo de confiana para So Paulo e Guarulhos.

Usando a tabela de t de student


So Paulo t=3,106
I.C.= -0,360,32
Assim o limite superior e inferior com 99% de probabilidade da mdia estar entre -0,04 e -0,68
Guarulhos t=3,499
I.C.=3,353,05
Assim o limite superior e inferior com 99% de probabilidade da mdia estar entre 3,97 e 2,73

2
PARA UMA DISTRIBUIO NORMAL:

EM X1=2 TEM-SE QUE


Z:

-14

P1=3,19.10

Z1=-7,5 E EM X2=3,5, Z2=-5.


-7

P2=2,86.10 . A

PELAS PROBABILIDADES CALCULADAS PARA CADA

PROBABILIDADE DE SE ACUSAR UM DESEMPENHO ENTRE

2,0

3,5

VALOR DE

DE

P=P2-

-7

P1=2,86.10 .

3 a)
Descriptive Statistics
Mean
Standard
Variable
Error
concentrao %
3,800000
0,033740

b)

c)
Descriptive Statistics (Spreadsheet3)
Confidence
Confidence
Variable
-95,000%
95,000
concentrao %
3,729380
3,870620

Comparado com o intervalo com 95% de confiana, pode-se dizer que o intervalo definido por 2
desvios padro da mdia est dentro dessa confiabilidade.
d)

e) Para uma distribuio normal, sendo

temos que

. O que nos

da uma probabilidade de 0,1587 de se obter resultados superiores a concentrao de 3,95%.

0
0
0
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
6
6
6
6
6
7
7
7
7
7
8
8
8
8
8
9
9
9
9
9
10
10
10
10
10
11
11
11
11
11
12
12
12
12
12
13
13
13
13
13
14
14
14
14
14
15
15
15
15
15
16
16
16
16
16
17
17
17
17
17
18
18
18
18
18
19
19
19
19
19
20
20
20
20
20
21
21
21
21
21
22
22
22
22
22
23
23
23
23
23
24
24
24
24
24
25
25
25

y=chi2(x;10)

4 a)
Descriptive Statistics (Spreadsheet30)
Mean
Median
Mode Frequen Minimu Maximu Lower
Upper Std.Dev. Coef.Var Standar
cy
m
m
Quartile Quartile
.
d
of Mode
Error
Var
A
B
C
D

75,00000

73,00000

Multiple

62,00000

86,00000

70,00000

82,50000

7,247188

9,662918

1,479326

78,95833

82,00000

83,00000

62,00000

90,00000

73,00000

84,50000

7,782249

9,856147

1,588545

77,04167

78,00000

83,00000

65,00000

88,00000

71,00000

82,00000

6,746846

8,757398

1,377194

74,62500

75,00000

81,00000

61,00000

87,00000

70,00000

80,50000

6,658192

8,922200

1,359098

b)
Box Plot of B
Spreadsheet30 4v*24c

Box Plot of A
Spreadsheet30 4v*24c
95

100

90

95

85

90

80

85

75

80

70

75

65

Mean = 75
MeanSE
= (73,5207, 76,4793)
Mean2*SD
= (60,5056, 89,4944)
Outliers
Extremes

60

55
A

70

Mean = 78,9583
MeanSE
= (77,3698, 80,5469)
Mean2*SD
= (63,3938, 94,5228)
Outliers
Extremes

65

60
B

Box Plot of C
Spreadsheet30 4v*24c

Box Plot of D
Spreadsheet30 4v*24c

95

90

90

85

85

80

80

75

75

70

70

65
Mean = 77,0417
MeanSE
= (75,6645, 78,4189)
Mean2*SD
= (63,548, 90,5354)
Outliers
Extremes

65

60

Mean = 74,625
MeanSE
= (73,2659, 75,9841)
Mean2*SD
= (61,3086, 87,9414)
Outliers
Extremes

60

55

Normal P-Plot: B

Normal P-Plot: A
2,5

2,5

2,0

2,0
1,5

1,0

Expected Normal Value

Expected Normal Value

1,5

0,5
0,0
-0,5
-1,0

0,5
0,0
-0,5
-1,0

-1,5

-1,5

-2,0
-2,5
60

1,0

62

64

66

68

70

72

74

76

78

80

82

84

86

-2,0
60

88

65

70

75

Value

80

85

90

95

Value

Normal P-Plot: D

Normal P-Plot: C

2,5

2,0

2,0
1,5

1,5

Expected Normal Value

Expected Normal Value

1,0

0,5

0,0

-0,5

1,0
0,5
0,0
-0,5
-1,0

-1,0

-1,5
-1,5

-2,0
64

-2,0

66

68

70

72

74

76

78

Value

80

82

84

86

88

90

-2,5
58

60

62

64

66

68

70

72

74
Value

76

78

80

82

84

86

88

90

Histogram: A
K-S d=,16055, p> .20; Lilliefors p<,15
Expected Normal

Histogram: B
K-S d=,19371, p> .20; Lilliefors p<,05
Expected Normal

10

9
8

7
6

No. of obs.

No. of obs.

6
5
4

5
4

0
55

60

65

70

75

80

85

90

55

60

65

X <= Category Boundary

70

75

80

85

90

X <= Category Boundary

Histogram: C
K-S d=,14698, p> .20; Lilliefors p> .20
Expected Normal

Histogram: D
K-S d=,12358, p> .20; Lilliefors p> .20
Expected Normal

10

8
6
5

No. of obs.

No. of obs.

5
4

4
3

3
2

2
1

0
60

65

70

75

80

85

90

55

60

65

70

75

80

85

90

X <= Category Boundary

X <= Category Boundary

Existem outliers, pois os indivduos apresentam respostas diferentes as drogas. Mas no so dados to discrepantes
assim. Conforme a anlise que pode ser feita nos histogramas e nos grficos de probabilidade normal.
c)
Descriptive Statistics (Spreadsheet30)
Valid N Trimmed Winsorized Grubbs Test
mean
mean
Statistic
Variable
5,0000% 5,0000%
A
24
75,09091 75,08333
1,793799
B
24
79,22727 78,87500
2,179104
C
24
77,09091 77,04167
1,784785
D
24
74,68182 74,58333
2,046351

p-value

1,000000
1,000000
1,000000
1,000000

Box Plot of A
Spreadsheet30 4v*24c

Box Plot of B
Spreadsheet30 4v*24c

90

95

88
86

90

84
82

85

80
78

80

76
74
75

72
70

70

68

Mean = 75,0909
MeanSE
= (73,6814, 76,5004)
Mean2*SD
= (61,8689, 88,313)
Outliers
Extremes

66
64
62
60

Mean = 79,2273
MeanSE
= (77,7695, 80,6851)
Mean2*SD
= (65,5517, 92,9029)
Outliers
Extremes

65

60

B
Box Plot of D
Spreadsheet30 4v*24c

Box Plot of C
Spreadsheet30 4v*24c
92

90

90

88

88

86

86

84
82

84

80

82

78

80

76

78

74

76

72

74

70

72

68

70

Mean = 77,0909
MeanSE
= (75,79, 78,3918)
Mean2*SD
= (64,8877, 89,2941)
Outliers
Extremes

68
66
64
62

66

Mean = 74,6818
MeanSE
= (73,4679, 75,8957)
Mean2*SD
= (63,2945, 86,0691)
Outliers
Extremes

64
62
60
58

Os outliers aumente perante esse tratamento de dados e aparecem outliers extremos.


d)

n=24
72
78
71
72
66
74
62
69
85
82
71
83
86
85
79
83
69

d = distancia da media d/desvio padro


-3,000
-0,414
3,000
0,414
-4,000
-0,552
-3,000
-0,414
-9,000
-1,242
-1,000
-0,138
-13,000
-1,794
-6,000
-0,828
10,000
1,380
7,000
0,966
-4,000
-0,552
8,000
1,104
11,000
1,518
10,000
1,380
4,000
0,552
8,000
1,104
-6,000
-0,828

probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,339
0,021
0,661
0,021
0,290
0,021
0,339
0,021
0,107
0,021
0,445
0,021
0,036
0,021
0,204
0,021
0,916
0,021
0,833
0,021
0,290
0,021
0,865
0,021
0,935
0,021
0,916
0,021
0,710
0,021
0,865
0,021
0,204
0,021

66
84
80
72
65
75
71

media
desvio padro

-1,242
1,242
0,690
-0,414
-1,380
0,000
-0,552

d = distancia da media d/desvio padro


86
7,042
0,905
83
4,042
0,519
82
3,042
0,391
83
4,042
0,519
79
0,042
0,005
83
4,042
0,519
73
-5,958
-0,766
75
-3,958
-0,509
86
7,042
0,905
86
7,042
0,905
78
-0,958
-0,123
88
9,042
1,162
85
6,042
0,776
82
3,042
0,391
83
4,042
0,519
84
5,042
0,648
73
-5,958
-0,766
62
-16,958
-2,179
90
11,042
1,419
81
2,042
0,262
72
-6,958
-0,894
62
-16,958
-2,179
69
-9,958
-1,280
70
-8,958
-1,151
media
78,958
desvio padro
7,782

n=24

-9,000
9,000
5,000
-3,000
-10,000
0,000
-4,000
75,000
7,247

n=24
81

0,107
0,893
0,755
0,339
0,084
0,500
0,290

0,021
0,021
0,021
0,021
0,021
0,021
0,021

probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,817
0,021
0,698
0,021
0,652
0,021
0,698
0,021
0,502
0,021
0,698
0,021
0,222
0,021
0,306
0,021
0,817
0,021
0,817
0,021
0,451
0,021
0,877
0,021
0,781
0,021
0,652
0,021
0,698
0,021
0,741
0,021
0,222
0,021
0,015
0,021
0,922
0,021
0,603
0,021
0,186
0,021
0,015
0,021
0,100
0,021
0,125
0,021

probabilidade de
obter um desvio
d = distancia da media d/desvio padro maior
rejeio 1/(2*n)
3,958
0,587
0,721
0,021

88
81
83
77
84
78
76
83
80
70
79
76
83
80
78
72
67
88
77
69
65
69
65

media
desvio padro

D n=24
77
81
75
69
66
77
70
70
80
84
75
81
76
80
81

10,958
3,958
5,958
-0,042
6,958
0,958
-1,042
5,958
2,958
-7,042
1,958
-1,042
5,958
2,958
0,958
-5,042
-10,042
10,958
-0,042
-8,042
-12,042
-8,042
-12,042
77,042
6,747

1,624
0,587
0,883
-0,006
1,031
0,142
-0,154
0,883
0,438
-1,044
0,290
-0,154
0,883
0,438
0,142
-0,747
-1,488
1,624
-0,006
-1,192
-1,785
-1,192
-1,785

d = distancia da media d/desvio padro


2,375
0,357
6,375
0,957
0,375
0,056
-5,625
-0,845
-8,625
-1,295
2,375
0,357
-4,625
-0,695
-4,625
-0,695
5,375
0,807
9,375
1,408
0,375
0,056
6,375
0,957
1,375
0,207
5,375
0,807
6,375
0,957

0,948
0,721
0,811
0,498
0,849
0,556
0,439
0,811
0,669
0,148
0,614
0,439
0,811
0,669
0,556
0,227
0,068
0,948
0,498
0,117
0,037
0,117
0,037

0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021

probabilidade de
obter um desvio
maior
rejeio 1/(2*n)
0,639
0,021
0,831
0,021
0,522
0,021
0,199
0,021
0,098
0,021
0,639
0,021
0,244
0,021
0,244
0,021
0,790
0,021
0,920
0,021
0,522
0,021
0,831
0,021
0,582
0,021
0,790
0,021
0,831
0,021

6,375
-0,625
-1,625
12,375
-2,625
-4,625
-13,625
-6,625
-11,625
74,625
6,658

81
74
73
87
72
70
61
68
63

media
desvio padro

0,957
-0,094
-0,244
1,859
-0,394
-0,695
-2,046
-0,995
-1,746

0,831
0,463
0,404
0,968
0,347
0,244
0,020
0,160
0,040

0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021
0,021

e)
Descriptive Statistics (Spreadsheet30)
Confidence
Confidence
Variable
-95,000%
95,000
A
71,93978
78,06022
B
75,67218
82,24449
C
74,19272
79,89061
D
71,81349
77,43651
Box Plot of A
Spreadsheet30 4v*24c

Box Plot of B
Spreadsheet30 4v*24c

86

90
88

84

86
82

84
82

80

80

78

78
76

76

74

74
72

72

70

70

Mean = 75,0909
Mean0,95 Conf. Interval
= (72,1597, 78,0221)
Non-Outlier Range
= (65, 85)
Outliers
Extremes

68
66
64

68

Mean = 79,2273
Mean0,95 Conf. Interval
= (76,1956, 82,259)
Non-Outlier Range
= (69, 88)
Outliers
Extremes

66
64
62
60

Box Plot of C
Spreadsheet30 4v*24c

Box Plot of D
Spreadsheet30 4v*24c

90

86

88

84

86

82

84

80

82

78

80

76

78

74

76

72

74

70

72

68
Mean = 77,0909
Mean0,95 Conf. Interval
= (74,3856, 79,7962)
Non-Outlier Range
= (65, 88)
Outliers
Extremes

70
68
66
64
C

Mean = 74,6818
Mean0,95 Conf. Interval
= (72,1574, 77,2062)
Non-Outlier Range
= (63, 84)
Outliers
Extremes

66
64
62
60
D

Com este tipo de tratamento o nmero de outliers em relao aos outros tratamentos de dados diminuram os
extremos sumiram e aparecem apenas 2 outliers em B um e em D 1.

5 a)
Descriptive Statistics (Spreadsheet53)
Confidence
Confidence
Variable
-95,000%
95,000
cm
39,92814
41,70325

b)
Descriptive Statistics (Spreadsheet53)
Confidence
Confidence
Variable
-99,000%
99,000
cm
39,63751
41,99388

Sim, pois so vrios dados coletados e muito poucos se encontram foram da taxa de confiana de 99%.
c)
Descriptive Statistics (Spreadsheet53)
Mean
Standard
Variable
Error
cm
40,81569
0,445126

6 a)
O valor da tendncia central de presso oscila entre 179,81 e mdia de 179,9323 psi. A variao de
disperso total da presso de 159,13 a 207,13 psi, com desvio padro de 9,4095 psi, que representa
5,23% da mdia. A assimetria vale 0,1351, mdia e mediana de 179,9323 e 179,81 psi, e a diferena entre
quartil superior e mediana de 6,72 psi, entre mediana e quartil inferior 5,155 psi. Tudo isso aponta para uma
distribuio simtrica. A distribuio deve ser mesocrtica, pois o valor de curtose de 0,2079 est prximo
de zero. Existncia de valores menores do que 156,8425 psi seriam discrepantes. Como o valor mnimo de
159,13 psi, no h discrepantes inferiores. Valores maiores do que 204,3425 psi seriam discrepantes
superiores. Como o valor mximo 207,13 psi, portanto maior do que 204,3425 psi, pode-se afirmar que h
no mnimo um valor discrepante superior de presso.
b)
Sim, porque as condies necessrias para isso poder ser considerada normal, so duas variveis
de acordo em todas as 3 linhas de produo. Medida de assimetria precisa ser prxima de zero, a medida
de curtose tambm. Isso ocorre nas trs linhas: na linha A, assimetria -0,2809 e curtose 0,2262; na linha B,
assimetria 0,1300 e curtose 0,4853; na linha C, assimetria -0,0750 e curtose -0,8526.
c)
Com as mdias e medianas so semelhantes nas trs linhas de produo podemos realizar a
anlise comparando medianas e quartis. Os quartis e mediana da linha B so 176,17, 189,95 e 184 psi, da
linha C so 169,94,183,13 e 177,3 psi, e os da linha A so 174,07, 184,25 e 180,72 psi. As mdias so
184,142 psi na B, 176,6884 psi na C e 178,9664 psi na A.
7

com 99%

Usando a tabela de t de student t=2,797


Linha A

I.C.= 178,96644,6027 psi


Linha B
I.C.= 184,14205,6249 psi
Linha C
I.C.= 176,68844,8054 psi
Para N=250 corrigindo os valores e multiplicando o erro por
Fica:
Linha A
I.C.= 178,96644,6027x0,9506 = 178,96644,3753 psi
Linha B
I.C.= 184,14205,6249x0,9506 = 184,1425,3470 psi
Linha C
I.C.= 176,68844,8054x0,9506 = 176,68844,5679 psi
Na linha A, h 99% de probabilidade de que a mdia populacional da resistncia esteja entre 174,5911 e
183,3417 psi.
Na linha B, h 99% de probabilidade de que a mdia populacional da resistncia esteja entre 178,795 e
189,489 psi.
Na linha C, h 99% de probabilidade de que a mdia populacional da resistncia esteja entre 172,1205 e
181,2563 psi.

Potrebbero piacerti anche