Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Departamento de Estatstica
Disciplina: EST 631 Mtodos Estatsticos II
Apostila
Viosa, MG
2011
ii
Sumrio
1.
Introduo.................................................................................................................. 1
2.
3.
3.2.
3.3.
3.4.
4.
5.
6.
7.
8.
9.
iii
1. Introduo
No contexto da estatstica experimental h constante interesse em caracterizar a
possvel relao entre uma ou mais variveis resposta e um conjunto de fatores de
interesse. Isso pode ser executado atravs da construo de um modelo que descreva a
varivel resposta em funo dos nveis aplicveis desses fatores.
Certos tipos de problemas cientficos envolvem a expresso de uma varivel
resposta, tal como o rendimento de um produto, como uma funo emprica de um ou
mais fatores quantitativos, tais como a temperatura de reao e a presso. Isso pode ser
efetuado utilizando-se uma metodologia que permita modelar a relao: Rendimento em
funo de temperatura de reao e presso. O conhecimento da forma funcional de f,
frequentemente obtida com a modelagem de dados provenientes de experimentos
planejados, permite tanto sumarizar os resultados do experimento quanto predizer a
resposta para nveis dos fatores quantitativos. Assim, a funo f define a superfcie de
resposta, que em sua essncia, consiste em estimar coeficientes da regresso polinomial
para a gerao de um modelo emprico, por meio do qual possvel aproximar uma
relao (inicialmente desconhecida ou conhecida) entre os fatores e as respostas do
processo.
Podemos ento definir a Superfcie de Resposta como sendo a representao
geomtrica obtida quando uma varivel resposta plotada como uma funo de dois ou
mais fatores quantitativos. A funo pode ser assim definida:
Y = f (X1 , X 2 ,..., X k ) +
ento,
= f (X1 , X 2 , , X k )
dos
nveis
de
temperatura
concentrao
de
alimentao,
como
i.
ii.
iii.
iv.
v.
i.
ii.
iii.
A regio de timo pode no ser determinada devido ao uso de uma faixa muito
estreita ou ampla;
iv.
v.
Y = 0 + i X i +
i =1
= E(Y) = 0 + i X i
i =1
e tido como erro experimental. Se, entretanto, o modelo descrito inadequado para
representar a verdadeira resposta mdia, ento contm, adicionalmente ao erro
experimental, um erro no aleatrio (sistemtico). Este ltimo erro atribudo a omisso
de termos em X1 , X 2 ,..., X k de grau superior a um que podem ser entendidas como
outras variveis as quais tem alguma influncia sobre a varivel resposta. Este erro
adicional (excluindo o erro experimental) chamado falta de ajuste.
Escrevendo o modelo em notao matricial, considerando N observaes, temos:
Y = X +
= ( X`X) 1 X`Y
E a matriz de varincias e covarincias de dada por:
V( ) = ( X`X) 1 2
Na maioria dos casos, os clculos para estimao dos parmetros podem ser
simplificados codificando os nveis das k variveis independentes Xi por meio de:
x iu =
2(Xiu Xi )
Ri
i = 1,2,...,k e u = 1,2,..., N
x
u =1
iu
=0
i = 1,2,...,k
Droga (X1)
Dosagem (mg kg-1)
0,3
0,3
0,7
0,7
0,3
0,3
0,7
0,7
0,3
0,3
0,7
0,7
Tempo (X2)
Peso observado
1
1
1
1
5
5
5
5
9
9
9
9
5,63
6,42
1,38
1,94
11,57
12,16
5,72
4,69
12,68
13,31
8,28
7,73
x1u =
2 ( X1u X1 )
x 2u =
R1
2 ( X 2u X 2 )
R2
2 ( X 2u 5 ) X 2u 5
=
9 1
4
5,63
1
6, 42
1
1,38
1
1,94
1
11,57
1
12,16 = 1
5,72
1
4,64
1
12,68
1
13,31
1
8, 28
1
7,73 1 12 1
12
11
1
1
12
21
1
1
22
0
31
0
0
32
+
1
0
41
3 2 1
42
0
1
51
52
1 1
1 1
61
1 1 3
12 62 1
1
1
1
1
1
1
1
1
1
= ( X' X) 1 X' Y
n
n
X' X = x 1u
u =1
n
x 1u
u =1
u =1
12 0 0
n
x1u x 2u = 0 12 0
u =1
n
0 0 8
2
x 2u
u =1
x1u
x 2u
u =1
n
x1u2
u =1
x1u x 2u
u =1
Yu
u =1
X'Y = Yu x1u
u =1
Yu x 2u
u =1
1
12 0
= 0 1
12
0 0
0
91,46 7,62166
0 32,08 = 2,67333
1 26,63 3,32875
8
Equao ajustada:
2u
Hipteses:
H 0 : 1 = 2 = 0
H1 : pelo menos um dos difere de zero
FV
GL
SQ
QM
Regresso
174,1380
87,0690
84,28**
Resduo
9,2980
1,0331
Total
11
183,4360
R2 =
174,1380
= 0,9493
183,4360
H 0 : 1 = 0
H 1 : 1 0
t=
- 2,67333 - 0
= 9,10**
1
(1,0331)
12
H0 : 2 = 0
H1 : 2 0
t=
3,32875 0
= 9,26**
1
(1,0331)
8
**
3. Delineamentos Experimentais
Experimentais para Ajuste de
Modelos de Primeira Ordem
3.1. Fatorial Completo
Caracteriza-se
se pela Combinao de todos os nveis de todos os fatores
escolhidos pelo pesquisador apresentando como desvantagem um nmero muito grande
de ensaios. Deste modo, um fatorial completo com p(nveis) e k(fatores) apresenta pk
combinaes distintas,
s, se p = k.
k
Exemplo 1: Em
m um ensaio onde se deseja contrastar temperatura (30, 35, 40), tempo (3,
5, 7) e pH (5, 6, 7) tentando otimizar uma determinada reao qumica, temos um
fatorial 33, onde k=3 fatores e p=3 nveis.. Ao todo sero 27 tratamentos,
tratamentos conforme a
representao grfica:
3.2. Delineamento
lineamento Composto Central (DCC)
Caracteriza-se
se pela Combinao de um fatorial 2K (k fatores) mais o ponto
central. Sua vantagem a de reduzir o nmero de ensaios, todavia sua utilizao
restringe-se ao ajuste de modelos de primeira ordem.
Tomando-se
se como ilustrao o exemplo da seo 3.1,, o nmero de tratamentos
ficaria: 23+1 = 9, uma reduo de 18 ensaios em relao ao fatorial completo.
10
Exemplo 3.
11
X`X = X`Y
pode-se obter as somas de quadrados relativas a cada fonte de variao da ANOVA:
N
SQRe g = `X`Y
C
em que C o termo de correo, dado por:
N
Yj
j =1
C=
N
H 0 : 1 = 2 = ... = k
H1 : pelo menos um dos difere de zero
H 0 : i = 0
H1 : i 0
12
t=
=
)
cii 2
V(
i
R2 =
SQRegresso
SQResduo
= 1
SQTotal
SQTotal
[0 R 2 1]
R2 =
R 2 (n 1) p
n p 1
SQRe s = SQ EP + SQ F.Aj.
Admitindo-se que existam ni observaes de uma dada resposta Y de interesse
no i-simo nvel dos regressores x i (i = 1,2,...,k) . Considere que Yij denote a j-sima
observao da resposta no nvel x i , com j = 1,2,...,n i e
n
i =1
= N , o total de
= (Y Y ) + (Y Y
)
Yij Y
ij
ij
i
i
ni
ni
)2 =
)2
(Yij Y
(Yij Yi ) 2 + n i (Yi Y
i
i
i =1 j =1
i =1 j =1
i =1
SQ Re s
SQ EP
14
SQ F.Aj.
15
Codificao:
x1 =
X1 35
5
x2 =
X 2 155
5
Variveis codificadas
x1
x2
30
30
40
40
35
35
35
35
35
-1
-1
1
1
0
0
0
0
0
150
160
150
160
155
155
155
155
155
-1
1
-1
1
0
0
0
0
0
Resposta
Y
39,3
40,0
40,9
41,5
40,3
40,5
40,7
40,2
40,6
16
GL
2
6
8
SQ
2,8250
0,1773
3,0023
QM
1,4125
0,0295
F
47,8010
Valor p
0,0002
R Ajustado = 0,9212
Estimativas
40,4444
Desvio
Valor p
0,7750
0,0859
9,0169
0,0002
Temperatura ( x 2 )
0,3249
0,0859
3,7811
0,0093
Equao ajustada:
y = 40, 440 + 0,775x1 + 0,325x 2
42.0
41.5
41.0
40.5
40.0
39.5
1.0
39.0
0.5
0.5
0.0
0.0
-0.5
-0.5
x2
-1.0
x1
-1.0
17
2 =
A interao entre os fatores pode ser obtida adicionando o termo x1x2 e medida
pelo coeficiente 12. A estimativa obtida (considerando as variveis codificadas) por:
12 =
1
(x1y1 + x1y2 + x 2 y3 + x 2 y 4 )
n trat
o
SQInt =
YMeio
n trat
Extremos
o
F=
SQ Int
0,0025
=
= 0,058
QM Erro
0,043
18
unidades na direo de x2. Assim, a direo da inclinao ascendente passa pelo ponto
central (x1=0 e x2=0) e tem inclinao 0,325/0,775=0,42.
O engenheiro decide usar um tempo de reao de 5 minutos como tamanho do
passo inicial. Usando a relao entre X1 e x1, vimos que 5 minutos no tempo de reao
corresponde a um intervalo (passo), na varivel codificada x1, de x1=1. Os passos no
caminho da inclinao ascendente so:
x1=1
x2=(0,325/0,775) x1=0,42
Os pontos experimentais so obtidos e a produo para estes pontos observados
at que se perceba um decrscimo na produo. Os resultados so mostrados na tabela a
seguir:
Origem +
Origem + 2
Origem +3
Origem +4
Origem +5
Origem +6
Origem + 7
Origem + 8
Origem + 9
Origem + 10
Origem + 11
Origem + 12
Variveis codificadas
x1
x2
0
1,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
11,00
12,00
0
0,42
0,42
0,84
1,26
1,68
2,10
2,52
2,94
3,36
3,78
4,20
4,62
5,04
Variveis originais
X1
X2
35
5
40
45
50
55
60
65
70
75
80
85
90
95
155
2
157
159
161
163
165
167
169
171
173
175
179
181
Resposta Y
No faz
41,0
42,9
47,1
49,7
53,8
59,9
65,0
70,4
77,6
80,3
76,2
75,1
x2
Variveis originais
X1
X2
-1
-1
1
1
0
0
0
0
0
-1
1
-1
1
0
0
0
0
0
80
80
90
90
85
85
85
85
85
x1 =
X1 85
5
e x2 =
170
180
170
180
175
175
175
175
175
Resposta Y
76,5
77,0
78,0
79,5
79,9
80,3
80,0
79,7
79,8
X 2 175
5
GL
2
6
1
1
4
8
SQ
5,0000
11,1200
0,2500
10,6580
0,2120
16,1200
20
QM
2,5000
F
47,17*
0,2500
10,62580
0,0530
4,72
201,09*
k 1 k
Y = 0 + i Xi + iiX + ijXiXj +
i =1
2
i
i =1
i =1 j=2
i<j
u = 1, 2,...., N
i = 1, 2,..., k
X iu X i
s Xi
N
mdia dos valores Xiu , s Xi = u =1 (X iu X i ) 2 / N
1/ 2
o desvio padro, e N o
21
varivel resposta obtidos com as variveis codificadas podem, ento, ser representados
como
k
k 1 k
Yu = 0 + i xiu + x + ijxiu x ju + u
i =1
i =1
2
ii iu
i =1 j=2
i<j
= ( X`X)1 X`Y
A matriz de varincias e covarincias de
V( ) = ( X`X) 1 2
22
Trat.
Bloco
x 1i
x 2i
x 12i x 1
x 22i x 2
x 1i x 2i
1
1
1
2
2
2
3
3
3
4
4
4
5
5
5
6
6
6
7
7
7
8
8
8
9
9
9
0
0
0
0
0
0
0
0
0
50
50
50
50
50
50
50
50
50
100
100
100
100
100
100
100
100
100
20
20
20
40
40
40
60
60
60
20
20
20
40
40
40
60
60
60
20
20
20
40
40
40
60
60
60
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
-1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
-2/3
-2/3
-2/3
-2/3
-2/3
-2/3
-2/3
-2/3
-2/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
1/3
-2/3
-2/3
-2/3
1/3
1/3
1/3
1/3
1/3
1/3
-2/3
-2/3
-2/3
1/3
1/3
1/3
1/3
1/3
1/3
-2/3
-2/3
-2/3
1/3
1/3
1/3
1
1
1
0
0
0
-1
-1
-1
0
0
0
0
0
0
0
0
0
-1
-1
-1
0
0
0
1
1
1
47
40
44
60
62
66
38
40
36
42
44
46
70
69
64
45
44
46
45
46
44
80
70
65
35
36
39
x1i =
x 2i =
X1i (0 +2100)
(100 0)
2
X 2i (20 +2 60)
(60 20)
2
P2i = x i2
X1i 50
x1i {1, 0,1}
50
X1i 40
x 2i {1, 0,1}
20
2
i
n
(1) 2 + (0) 2 + (1) 2
2
2
= xi
= X i2
3
3
23
2
3
x1 =
27
0
0
X`X =
0
0
0
6
0 0 0 0 0
18 0 0 0 0
0 18 0 0 0
0 0 6 0 0
0 0 0 6 0
0 0 0 0 12 6
1363
27
39
X`Y =
47 / 3
455 / 3
8
1
6
1363 / 27
27 / 18
39 / 18
=
47 / 18
455 /18
8
/
12
1
6
X1i 50 2 2
X
50
X
40
1363
27
39
47
1i
2i
=
+
Y
i
27 18 50 18 20 18 50 3
2
455 X 2i 40 2 8 X1i 50 X 2i 40
18 20 3 12 50 20
2
= 1363 27 + 78 + 27X1i 39X 2i 47 X1i 2X1i + 1 + 2
Y
i
27 18 18
900
360 18 2500 50
3
2X 2i X 2i
455 X 22i 4X 2i
2 8 X X
+ 4 1i 2i
+ 2
18 400
20
3 12 1000
50
20
+
+
900
600
360
360
240 45000 7200
12000
= 34,8148 + 0,161111X + 4, 98055X 0, 0010444X 2
Y
i
1i
2i
0, 0631944X 0, 0006666X1i X 2i
2
2i
24
1i
SQ Re g = X`Y
C
1363
27
(1363) 2
39
1363 27 39 47 455 8
=
18 12 47 / 3
27
27 18 18 18
455 / 3
8
= 72811, 2963 68806, 2593
= 4005, 0370
GL
SQ
QM
Blocos
(Tratamentos)
Regresso
Falta de ajuste
Resduo puro
2
(8)
5
3
16
9,8518
(4163,407)
4005,037
158,370
199,4815
--801,0074
52,7900
12,4675
Total
26
4372,7403
F5% (3,16) = 3, 24
F1% (3,16) = 5, 29
SQ Re g 4005, 037
=
= 0, 9159
SQTotal 4372, 7403
SQ Re g 4005, 037
R2 =
=
= 0,9619
SQTrat. 4163, 407
R2 =
H 0 : 1 = 0
H1 : 1 0
t=
27
18
1
18
(12, 4675)
t1% (16) = 2, 92
= 1,8023
t 5% (16) = 2,12
t10% (16) = 1, 75
25
64,24**
4,23*
QM Re s = 18,8342
GL Re s = 19
Utilizando :
t=
27
18
1
18
(18,8342)
= 1, 4664
t 5% (19) = 2, 09
t10% (16) = 1, 73
B I = 0
Y
= 0,161111 0, 0020888X1 0, 0006666X 2 = 0
X1
Y
= 4, 98055 0,126388X 2 0, 0006666X1 = 0
X 2
0, 0020888X1 = 0, 0006666X 2 0,161111
X1 =
0,161111 0, 0006666X 2
0, 0020888
0,161111 0, 0006666X 2
4, 98055 0,126388X 2 0, 0006666
0, 0020888
2Y
= 0, 0020888
X12
2Y
= 0,126388
X 22
2Y
= 0, 0006666
X1X 2
26
=0
B I = 0
1 2
2Y
2 Y
X 2 X X
1
1
2
B=
2
2
12 Y
Y
2
X1X 2 X 2
1
I=
0
0
1
Suponha que o ponto estacionrio esteja dentro da regio de estudo na qual foi ajustado
o modelo de segunda ordem.
Concluso:
i)
ii)
iii)
0, 0020888 0, 0003333
B=
, ento:
0, 0003333 0,126388
0, 0020888 0, 0003333 0
B I =
=0
0, 0003333 0,126388 0
0, 0020888 0, 0003333
=0
0, 0003333 0,126388
(0, 0020888 )(0,126388 ) (0, 0003333) 2 = 0
0,126388 2 + 0,1284768 + 0, 000263787 = 0
0,1284768 0, 016506288 0, 000133358
2(0,126388)
1 = 1, 0144
2 = 0, 00205
=
27
Y
Y
Y
=
= ... =
=0
x1 x 2
x k
Este ponto chamado de ponto estacionrio e pode representar um ponto de
mximo, de mnimo ou um ponto de sela.
Para obteno de uma soluo matemtica geral para localizao do ponto
estacionrio, escrevemos o modelo de segunda ordem na seguinte notao matricial
= + x`b + x`Bx
Y
0
onde
x1
x
x = 2
xk
1
b = 2
11 12 / 2 1k / 2
22 2k / 2
B=
sim.
kk
Y
= b + 2Bx = 0
x
O ponto estacionrio a soluo das equaes, ou seja,
1
x s = B 1 b
2
28
= + 1 x` b
Y
s
0
s
2
x2
w1
x1,S
w
x1,S
x1
29
ii.
iii.
170
180
170
180
175
175
175
175
175
175
175
182.07
167.93
Variveis codificadas
Resposta
x1
x2
Y (produo)
-1
-1
1
1
0
0
0
0
0
1.414
-1.414
0
0
-1
1
-1
1
0
0
0
0
0
0
0
1.414
-1.414
76.5
77
78
79.5
79.9
80.3
80
79.7
79.8
78.4
75.6
78.5
77
30
GL
SQ
QM
Valor p
Intercepto
31951.98
31951.98
450595.9
0.000000*
Tempo
7.92
7.92
111.7
0.000015*
Tempo
13.17
13.17
185.8
0.000003*
Temperatura
2.12
2.12
29.9
0.000934*
Temperatura
6.97
6.97
98.3
0.000023*
Tempo x Temperatura
0.25
0.25
3.5
0.102519
Resduo
0.50
0.07
Estimativas
Valor p
Intercepto
79.93995
0.000000
Tempo
0.99505
0.000015
Tempo
-1.37645
0.000003
Temperatura
0.51520
0.000934
Temperatura
-1.00134
0.000023
Tempo x Temperatura
0.25000
0.102519
31
GL
SQ
QM
Valor p
Falta de ajuste
0.2843
0.0947
1.7885
0.2885
Erro puro
0.2120
0.0530
(Resduo)
(7)
(0.4963)
0.0709
81
80
79
78
77
76
75
1.0
0.5
74
1.0
0.5
0.0
x2
-0.5
0.0
-0.5
-1.0
x1
-1.0
32
1.0
x2
0.5
0.0
-0.5
75
76
77
78
79
80
-1.0
-1.0
-0.5
0.0
0.5
1.0
x1
0,12500 1,00134
0,99505
b=
0,51520
1
x s = B 1 b
2
1 0,73972 0,09234 0,99505 0,78364
=
=
2 0,09234 1,01018 0,51520 0,61233
X1 85
X1 = 81,0818
5
X 175
0,61233 = 2
X 2 = 171,9383
5
0,78364 =
33
= + 1 x' b
Y
s
0
s
2
= 79,94 + 1 [ 0,78364 0,61233] 0,99505 79,39
Y
s
0,51520
2
Anlise cannica
Resolvendo a equao:
2 + 2,3777 + 1,3626 = 0
Temos:
1 = 0,9635 e 2 = 1, 4143
34
Referncias
BOX, G. E. P.; DRAPER, N. R. Empirical model buiding and response surfaces.
New York: John Wiley & Sons, 1987.
KHURI, A. I.; CORNELL, J. A. Response Surfaces: designs and analysis. New York:
Marcel Dekker Inc., 1987.
35