Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Departamento de Estatística
Disciplina: EST 631 – Métodos Estatísticos II
Apostila
Viçosa, MG
2011
Introdução à Metodologia de Superfícies de Resposta
ii
Sumário
1. Introdução.................................................................................................................. 1
2. Modelo de Primeira Ordem ....................................................................................... 4
3. Delineamentos Experimentais para Ajuste de Modelos de Primeira Ordem ............ 9
3.1. Fatorial Completo .............................................................................................. 9
3.2. Delineamento Composto Central (DCC) ........................................................... 9
3.3. Delineamento Composto Central Rotacionado (DCCR) ................................. 10
3.4. Delineamento de Box-Behnken (DBB) ........................................................... 10
4. Teste de Significância do Modelo ........................................................................... 12
5. Medidas e Adequação de Modelos.......................................................................... 13
6. Teste para Falta de Ajuste ....................................................................................... 14
7. Método da Inclinação Ascendente .......................................................................... 15
8. Exemplo de Aplicação para o Modelo de Primeira Ordem .................................... 15
9. Modelo de Segunda Ordem ..................................................................................... 21
10. Localização do Ponto Estacionário ......................................................................... 28
11. Caracterizando a Superfície de Resposta ................................................................ 29
Referências ..................................................................................................................... 35
iii
1. Introdução
Y = f (X1 , X 2 ,..., X k ) + ε
E(Y) = f (X1 , X 2 ,… , X k ) = η
então,
η = f (X1 , X 2 ,… , X k )
1
é chamada de superfície de resposta.
2
b) A técnica também apresenta algumas limitações que devem ser consideradas:
3
Após o ajuste do modelo aos dados, é possível estimar a sensibilidade da
resposta aos fatores, além de determinar os níveis dos fatores nos quais a resposta é
ótima (por exemplo, máxima ou mínima).
e ε é tido como erro experimental. Se, entretanto, o modelo descrito é inadequado para
representar a verdadeira resposta média, então ε contém, adicionalmente ao erro
experimental, um erro não aleatório (sistemático). Este último erro é atribuído a omissão
de termos em X1 , X 2 ,..., X k de grau superior a um que podem ser entendidas como
outras variáveis as quais tem alguma influência sobre a variável resposta. Este erro
adicional (excluindo o erro experimental) é chamado falta de ajuste.
Escrevendo o modelo em notação matricial, considerando N observações, temos:
Y = Xβ + ε
4
Em que Y é um vetor de N (N ≥ k+1) observações, β`= [β0 β1 ... βk ] é um vetor (k+1)
uma matriz N x (k+1) de coeficientes dos parâmetros que compreende os níveis das
variáveis independentes. Assume-se que os erros aleatórios são NID(0, σ 2 ) , isto é,
independentemente distribuídos com distribuição Normal de média zero e variância
comum. Quando a matriz X é de posto coluna completo, então o estimador de mínimos
quadrados ordinários de β pode ser obtido por:
βˆ = ( X`X) −1 X`Y
V(βˆ ) = ( X`X) −1 σ 2
Na maioria dos casos, os cálculos para estimação dos parâmetros podem ser
simplificados codificando os níveis das k variáveis independentes Xi por meio de:
2(Xiu − Xi )
x iu = i = 1,2,...,k e u = 1,2,..., N
Ri
∑x
u =1
iu =0 i = 1,2,...,k
5
Droga (X1)
Tempo (X2) Peso observado
Dosagem (mg kg-1)
0,3 1 5,63
0,3 1 6,42
0,7 1 1,38
0,7 1 1,94
0,3 5 11,57
0,3 5 12,16
0,7 5 5,72
0,7 5 4,69
0,3 9 12,68
0,3 9 13,31
0,7 9 8,28
0,7 9 7,73
2 ( X 2u − X 2 ) 2 ( X 2u − 5 ) X 2u − 5
x 2u = = =
R2 9 −1 4
6
βˆ = ( X' X) −1 X' Y
n n
n ∑ x1u ∑ x 2u
n u =1
n n
u =1
12 0 0
X' X = ∑ x 1u
u =1 ∑ x1u2 ∑ x1u x 2u = 0 12 0
u =1 u =1
n n n 0 0 8
∑ x 1u ∑ x1u x 2u ∑ x 2u
2
u =1 u =1 u =1
n
∑ Yu
u =1
n
X'Y = ∑ Yu x1u
u =1
n
∑ Yu x 2u
u =1
1
12 0 0
91,46 7,62166
0 − 32,08 = − 2,67333
1
β̂ = 0
12
0 0 1 26,63 3,32875
8
Equação ajustada:
Hipóteses:
H 0 : β1 = β 2 = 0
H1 : pelo menos um dos β difere de zero
7
Quadro da análise de variância:
FV GL SQ QM F
Regressão 2 174,1380 87,0690 84,28**
Resíduo 9 9,2980 1,0331
Total 11 183,4360
174,1380
R2 = = 0,9493
183,4360
H 0 : β1 = 0
H 1 : β1 ≠ 0
- 2,67333 - 0
t= = −9,10**
1
(1,0331)
12
H0 : β2 = 0
H1 : β 2 ≠ 0
3,32875 − 0
t= = 9,26**
1
(1,0331)
8
**
significativo pelo teste t a 5% de probabilidade.
8
3. Delineamentos Experimentais
Experimentais para Ajuste de
Modelos de Primeira Ordem
Caracteriza-se
se pela Combinação de todos os níveis de todos os fatores
escolhidos pelo pesquisador apresentando como desvantagem um número muito grande
de ensaios. Deste modo, um fatorial completo com p(níveis) e k(fatores) apresenta pk
combinações distintas,
s, se p = k.
k
Exemplo 1: Em
m um ensaio onde se deseja contrastar temperatura (30, 35, 40), tempo (3,
5, 7) e pH (5, 6, 7) tentando otimizar uma determinada reação química, temos um
fatorial 33, onde k=3 fatores e p=3 níveis.. Ao todo serão 27 tratamentos,
tratamentos conforme a
representação gráfica:
3.2. Delineamento
lineamento Composto Central (DCC)
Tomando-se
se como ilustração o exemplo da seção 3.1,, o número de tratamentos
ficaria: 23+1 = 9, uma redução de 18 ensaios em relação ao fatorial completo.
9
3.3. Delineamento Composto Central Rotacionado (DCCR)
10
Exemplo 3.
11
4. Teste de Significância do Modelo
SQRe g = β`X`Y
ˆ −C
12
O teste utilizado para realizar esse teste é:
βˆ ï βˆ ï
t= =
ˆ βˆ )
V( i
ciiσˆ 2
13
R 2 (n − 1) − p
R2 =
n − p −1
Yij − Y
ˆ = (Y − Y ) + (Y − Y
ij ij i i
ˆ)
ï
∑∑
i =1 j =1
(Yij − Y
ˆ )2 =
i ∑∑
i =1 j =1
(Yij − Yi ) 2 + ∑ n i (Yi − Y
i =1
ˆ )2
i
SQ Re s SQ EP SQ F.Aj.
14
7. Método da Inclinação Ascendente
15
Como esta região provavelmente não contém o ótimo, um modelo de primeira
ordem será ajustado e aplicado o Método da Máxima Inclinação Ascendente. As
variáveis independentes serão codificadas para (-1, 1) para simplificar os cálculos.
Serão incluídos também cinco pontos centrais entre os valores máximos e mínimos do
tempo e temperatura. As repetições no ponto central são utilizadas para estimar o erro
experimental e para checar o ajuste do modelo de primeira ordem. Os pontos centrais do
delineamento são os correspondentes às condições de operação atual (35 min e 155 ºF).
Codificação:
X1 − 35 X 2 − 155
x1 = x2 =
5 5
16
Tabela 2. Análise de variância do modelo de primeira ordem.
FV GL SQ QM F Valor p
Regressão 2 2,8250 1,4125 47,8010 0,0002
Desvios 6 0,1773 0,0295
Total 8 3,0023
R² = 0,9409 R² Ajustado = 0,9212
Equação ajustada:
ŷ = 40, 440 + 0,775x1 + 0,325x 2
42.0
41.5
41.0
Y
40.5
40.0
39.5
1.0
39.0 0.5
0.5 0.0
0.0 -0.5
x1
-0.5
-1.0
x2 -1.0
17
(40,3² + 40,5² + 40,7² + 40, 2² + 40,6²) − (202,3)² 5
σˆ 2 = = 0,0430
5 −1
A interação entre os fatores pode ser obtida adicionando o termo x1x2 e é medida
pelo coeficiente β12. A estimativa é obtida (considerando as variáveis codificadas) por:
1
βˆ 12 = o
(x1y1 + x1y2 + x 2 y3 + x 2 y 4 )
n trat
SQInt = ∑Y − ∑ YMeio
Extremos
o
n trat
1
βˆ 12 = (1* 39,3 + (−1* 40) + (−1* 40,9) + 1* 41,55 ) = −0,025
4
SQ Int 0,0025
F= = = 0,058
QM Erro 0,043
Assim, não existe nenhuma razão para questionar o modelo de primeira ordem.
Os próximos passos da (MIA) devem seguir.
Para andar (mover-se) do centro do delineamento (x1=0 e x2=0) no caminho da
inclinação ascendente, deveríamos mover 0,775 unidades na direção x1 para cada 0,325
18
unidades na direção de x2. Assim, a direção da inclinação ascendente passa pelo ponto
central (x1=0 e x2=0) e tem inclinação 0,325/0,775=0,42.
O engenheiro decide usar um tempo de reação de 5 minutos como tamanho do
passo inicial. Usando a relação entre X1 e x1, vimos que 5 minutos no tempo de reação
19
Assim repete-se todo o processo e os resultados são analisados a seguir:
A região de X1 é [80, 90] e para X2 é [170, 180]. O delineamento experimental
e os resultados são apresentados na tabela a seguir. Novamente usou-se um fatorial 22
completo com cinco pontos centrais.
X1 − 85 X 2 − 175
x1 = e x2 =
5 5
20
Pela tabela de ANOVA, o componente do termo quadrático puro foi
significativo, isso implica que o modelo de 1ª Ordem não é uma aproximação adequada.
A curvatura na real superfície pode indicar que se está próximo do ótimo; assim,
análises adicionais devem ser feitas para localizar o ótimo com mais precisão. Nesse
ponto, uma análise adicional deve ser feita para localizar o ótimo com mais precisão.
Em que X1,X2 ,...,Xk são as variáveis independentes que tem influência na resposta Y;
aleatório.
Utilizando variáveis codificadas, x i ,obtidas por:
X iu − X i u = 1, 2,...., N
x iu =
s Xi i = 1, 2,..., k
1/ 2
média dos valores Xiu , s Xi = ∑ u =1 (X iu − X i ) 2 / N
N
é o desvio padrão, e N é o
número de observações. Sem perda de generalidade podemos considerar os valores de
Xi sendo substituídos pelos correspondentes valores de x i (i = 1,2,...,k) . Os valores da
21
variável resposta obtidos com as variáveis codificadas podem, então, ser representados
como
k k k −1 k
Yu = β0 + ∑βi xiu + ∑β x + ∑∑βijxiu x ju + εu
2
ii iu
i =1 i =1 i =1 j=2
i<j
βˆ = ( X`X)−1 X`Y
V(βˆ ) = ( X`X) −1 σ 2
22
Trat. N P Bloco x 1i x 2i x 12i − x 1 x 22i − x 2 x 1i x 2i Y
1 0 20 1 -1 -1 1/3 1/3 1 47
1 0 20 2 -1 -1 1/3 1/3 1 40
1 0 20 3 -1 -1 1/3 1/3 1 44
2 0 40 1 -1 0 1/3 -2/3 0 60
2 0 40 2 -1 0 1/3 -2/3 0 62
2 0 40 3 -1 0 1/3 -2/3 0 66
3 0 60 1 -1 1 1/3 1/3 -1 38
3 0 60 2 -1 1 1/3 1/3 -1 40
3 0 60 3 -1 1 1/3 1/3 -1 36
4 50 20 1 0 -1 -2/3 1/3 0 42
4 50 20 2 0 -1 -2/3 1/3 0 44
4 50 20 3 0 -1 -2/3 1/3 0 46
5 50 40 1 0 0 -2/3 -2/3 0 70
5 50 40 2 0 0 -2/3 -2/3 0 69
5 50 40 3 0 0 -2/3 -2/3 0 64
6 50 60 1 0 1 -2/3 1/3 0 45
6 50 60 2 0 1 -2/3 1/3 0 44
6 50 60 3 0 1 -2/3 1/3 0 46
7 100 20 1 1 -1 1/3 1/3 -1 45
7 100 20 2 1 -1 1/3 1/3 -1 46
7 100 20 3 1 -1 1/3 1/3 -1 44
8 100 40 1 1 0 1/3 -2/3 0 80
8 100 40 2 1 0 1/3 -2/3 0 70
8 100 40 3 1 0 1/3 -2/3 0 65
9 100 60 1 1 1 1/3 1/3 1 35
9 100 60 2 1 1 1/3 1/3 1 36
9 100 60 3 1 1 1/3 1/3 1 39
∑x 2
i
P2i = x i2 − i
n
(−1) 2 + (0) 2 + (1) 2 2
= xi −
2
= X i2 −
3 3
23
2
x1 =
3
27 0 0 0 0 0 1363 1363 / 27
0 18 0 0 0 0 27 27 / 18
0 0 18 0 0 0 −39 −39 / 18
X`X = X`Y = βˆ =
0 0 0 6 0 0 −47 / 3 −47 / 18
0 0 0 0 6 0 −455 / 3 −455 /18
6
0 0 0 0 0 12 6 6
− 8 1 6
−8 / 12 1
Ŷi = + − − −
27 18 50 18 20 18 50 3
455 X 2i − 40 2 8 X1i − 50 X 2i − 40
2
− − −
18 20 3 12 50 20
24
SQ Re g = βX`Y
ˆ −C
1363
27
1363 27 39 47 455 8 −39 (1363) 2
= − − − − −
27 18 18 18 18 12 −47 / 3 27
−455 / 3
−8
= 72811, 2963 − 68806, 2593
= 4005, 0370
Quadro da ANOVA
FV GL SQ QM F
Blocos 2 9,8518 --
(Tratamentos) (8) (4163,407) --
Regressão 5 4005,037 801,0074 64,24**
Falta de ajuste 3 158,370 52,7900 4,23*
Resíduo puro 16 199,4815 12,4675
Total 26 4372,7403
F5% (3,16) = 3, 24 F1% (3,16) = 5, 29
SQ Re g 4005, 037
R2 = = = 0, 9159
SQTotal 4372, 7403
SQ Re g 4005, 037
R2 = = = 0,9619
SQTrat. 4163, 407
27
−0
t= 18
= 1,8023
1
18 (12, 4675)
25
QM Re s = 18,8342
Utilizando :
GL Re s = 19
27
−0
t= 18
= 1, 4664
1
18 (18,8342)
B − λI = 0
∂Y
= 0,161111 − 0, 0020888X1 − 0, 0006666X 2 = 0
∂X1
∂Y
= 4, 98055 − 0,126388X 2 − 0, 0006666X1 = 0
∂X 2
−0, 0020888X1 = 0, 0006666X 2 − 0,161111
0,161111 − 0, 0006666X 2
X1 =
0, 0020888
0,161111 − 0, 0006666X 2
4, 98055 − 0,126388X 2 − 0, 0006666 =0
0, 0020888
4, 98055 − 0,126388X 2 − 0, 0514154 + 0, 000212732X 2 = 0
−0,126175X 2 = −4,9291346
X 2 = 39, 06
∂2Y ∂2Y
= −0, 0020888 = −0,126388
∂X12 ∂X 22
∂2Y
= −0, 0006666
∂X1∂X 2
26
Estudo da natureza da superfície de resposta: este pode ser realizado considerando o
ponto estacionário e os sinais e magnitudes dos λ i .
B − λI = 0
2∂ Y
∂2Y 1 2
∂X 2 ∂X ∂X
1 0
B= 1 1 2
I=
12 ∂ Y
2
∂Y
2
0 1
∂X1∂X 2 ∂X 2
2
Suponha que o ponto estacionário esteja dentro da região de estudo na qual foi ajustado
o modelo de segunda ordem.
Conclusão:
27
11. Localização do Ponto Estacionário
Suponha que nosso interesse é encontrar os níveis x1, x 2 ,..., x k , que otimize a
resposta predita. Este ponto, se existir, será dado pelo conjunto x1, x 2 ,..., x k para o qual
as derivadas parciais são iguais são iguais à zero, isto é
∂Y
ˆ ∂Y
ˆ ∂Yˆ
= = ... = =0
∂x1 ∂x 2 ∂x k
Este ponto é chamado de ponto estacionário e pode representar um ponto de
máximo, de mínimo ou um ponto de sela.
Para obtenção de uma solução matemática geral para localização do ponto
estacionário, escrevemos o modelo de segunda ordem na seguinte notação matricial
ˆ = βˆ + x`b + x`Bx
Y 0
onde
x1 βˆ 1 βˆ 11 βˆ 12 / 2 … βˆ 1k / 2
x
βˆ βˆ 22 … βˆ 2k / 2
x = 2 b = 2 B=
⋮
⋮ ⋱ ⋮
xk βˆ sim. βˆ kk
k
∂Ŷ
= b + 2Bx = 0
∂x
O ponto estacionário é a solução das equações, ou seja,
1
x s = − B −1 b
2
O valor predito da variável resposta no ponto estacionário é:
28
1
Ŷs = βˆ 0 + x`s b
2
x2
w1
x1,S
w
x1,S x1
29
onde w i são as variáveis independentes transformadas e os λ i são constantes. A
λ i é maior.
30
Tabela 8. Análise da variância de dados referentes à produção no delineamento
composto central.
FV GL SQ QM F Valor p
Intercepto 1 31951.98 31951.98 450595.9 0.000000*
Tempo 1 7.92 7.92 111.7 0.000015*
Tempo² 1 13.17 13.17 185.8 0.000003*
Temperatura 1 2.12 2.12 29.9 0.000934*
Temperatura² 1 6.97 6.97 98.3 0.000023*
Tempo x Temperatura 1 0.25 0.25 3.5 0.102519
Resíduo 7 0.50 0.07
31
Tabela 10. Análise de variância para falta de ajuste.
FV GL SQ QM F Valor p
Falta de ajuste 3 0.2843 0.0947 1.7885 0.2885
Erro puro 4 0.2120 0.0530
(Resíduo) (7) (0.4963) 0.0709
residual.
As figuras 4 e 5 representam a superfície de resposta e o gráfico de contorno,
respectivamente, para a resposta (produção) em função da temperatura e do tempo. É
relativamente fácil ver por estas figuras que a resposta é realmente o máximo global.
81
80
79
78
Y
77
76
75 1.0
74 0.5
0.0
1.0 -0.5 x1
0.5
0.0 -1.0
-0.5
-1.0
x2
32
1.0
0.5
x2
0.0
-0.5
75
76
-1.0 77
78
79
80
-1.0 -0.5 0.0 0.5 1.0
x1
1
x s = − B −1 b
2
1 −0,73972 −0,09234 0,99505 −0,78364
=− =
2 −0,09234 −1,01018 0,51520 −0,61233
X1 − 85
−0,78364 = ∴ X1 = 81,0818
5
X − 175
−0,61233 = 2 ∴ X 2 = 171,9383
5
33
1
Ŷs = βˆ 0 + x'sb
2
1 0,99505
Ŷs = 79,94 + [ −0,78364 −0,61233] ≅ 79,39
2 0,51520
Análise canônica
Resolvendo a equação:
λ 2 + 2,3777λ + 1,3626 = 0
Temos:
λ1 = −0,9635 e λ 2 = −1, 4143
Visto que as raízes λ i são todas negativas, conclui-se então que x s é um ponto de
resposta máxima.
34
Referências
KHURI, A. I.; CORNELL, J. A. Response Surfaces: designs and analysis. New York:
Marcel Dekker Inc., 1987.
35