Sei sulla pagina 1di 29

191

UNIVERSIDADE FEDERAL DE VIOSA


UNIVERSIDADE FEDERAL DO CEAR
DEPARTAMENTOS DE TECNOLOGIA DE ALIMENTOS
TAL 795 Problemas especiais: Planejamento e anlise de experimentos
2011 Jos Bencio Paes Chaves DTA/UFV

7 - Metodologia de superfcies de respostas


7.1 - Introduo - Conceitos Gerais
Em experimentao com alimentos e outros produtos de consumo h considervel interesse em delineamentos visando o ajustamento de superfcies de respostas
e posterior determinao de condies timas de operao. Os delineamentos de
superfcies de resposta so usados para definir combinaes de nveis de fatores experimentais que levam otimizao da resposta - que pode ser um mximo ou um
mnimo da funo (equao), dependendo da natureza da(s) varivel(eis) resposta(s). So normalmente experimentos exploratrios em que se realiza uma primeira
fase em faixas mais amplas dos nveis dos fatores e depois se realizam novos experimentos com faixas de valores das variveis independentes mais prximas da regio de otimizao. Aps definida a combinao tima dos nveis das variveis independentes realiza-se um ultimo ensaio com estas condies com a finalidade de se
comparara com os valores estimados da varivel resposta.
Considere Y = f(X1, X2, ...,Xn) + E, em que
Y => Varivel resposta ou varivel medida no experimento;
Xi => Representam variveis quantitativas (variveis preditoras,
ou independentes), estudadas no experimento, isto , das
quais se quer testar o efeito sobre a resposta;
E => Representa o erro experimental NID(0, 2).
OBS. Na anlise de regresso E = Erro puro + Fajustamento da regresso.
A forma exata da funo resposta desconhecida, mas ela pode ser
aproximada por uma funo linear ou quadrtica das variveis independentes. O modelo de primeira ordem representado por
Y = 0 + 1X1 + 2X2 + ... + nXn + E

192

O modelo de segunda ordem representado por


Y = 0 + 1X1 + 2X2 + ... + nXn + 11X12 + 22X22... + nnXn2 +

12X1X2 + ... + n-1,n Xn-1Xn + E


Os parmetros da regresso, isto , os s, so desconhecidos, mas podem
ser estimados, ou seja representados, por estimativas a partir de resultados experimentais.
O erro E (Resduo da Regresso) considerado como distribudo normalmente, com mdia zero e varincia constante 2.
A variao

na distribuio das respostas se deve essenciamente diferen-

as nos pontos experimentais (tratamentos) - o erro exprimental (variao entre


respostas do mesmo tratamento).
A variao na resposta devida aos pontos experimentais poderia ser explicada
(descrita) pela funo resposta, se ela fosse conhecida. Como a verdadeira funo
resposta raramente conhecida, sendo portanto estimada, a contribuio para a variao do erro (SQRRegresso) no devida apenas ao erro experimental (Erro Puro), mas tambm falta (deficincia) de ajustamento (lack of fit) do modelo estimado. Se o modelo estimado adequado para predizer a resposta, ento a SQE
(SQRReg) essencialmente devida ao erro experimental (O F para falta de ajuste
no significativo).
Para julgar a adequacidade do modelo estimado a SQE (SQRReg) decomposta em SQ devida ao erro experimental (SQEpuro) e SQFajustamento do modelo
proposto. Para que seja possvel testar a falta de ajuste do modelo emprico proposto h necessidade de se realizar repeties genunas de pelo menos um dos pontos
experimentais.
Quando os parmetros da funo resposta verdadeira so substitudos pelas
suas estimativas, obtm-se a chamada funo ajustada da resposta
^Y = b0 + b1X1 + b2X2 + ... + bnXn
A partir desta funo ajustada da resposta pode-se construir a superfcie de
resposta, onde se pode examinar as variaes que ocorrem na varivel medida
(resposta). Para aplicaes prticas busca-se observar regies (valores) das variveis independentes que correspondem resposta tima, o que pode ser observado

193

na superfcie de resposta (um grfico) ou calculado a partir da funo ajustada, utilizando o conceito de derivada.

Se Y(X) a funo em X, ento fazendo-se

Y(X)/ (X) = 0, a soluo X0 desta equao em Y(X0) pode ser um mximo


ou um mnimo, na regio de X0. Se a segunda derivada 2Y(X)/ 2(X) em X0
for positiva, tem-se um ponto de mnimo em Y(X0); se 2Y(X)/ 2(X) for
negativa, tem-se um ponto de mximo em Y(X0). Se a segunda derivada for
zero, ento Y(X0) um ponto de sela, nem mximo, nem mnimo.
Para duas ou mais variveis independentes utiliza-se o conceito
de derivada parcial. Para o modelo quadrtico de duas variveis

^Y = b0 + b1X1 + b2X2 + b11X12 + b22X22 + b12X1X2, se X2 fixado e fazendo-se a primeira derivada em relao a X1 igual a zero:

^Y/ X1 = b1 + 2b11X1 + b12X2 = 0


Da mesma forma, se fixar X1 e igualar a primeira derivada de ^Y em
relao X2 zero:

^Y/ X2 = b2 + 2b22X2 + b12X1 = 0

A soluo destas equaes chamada de ponto estacionrio.


b1 + 2b11X1 + b12X2 = 0
b2 + 2b22X2 + b12X1 = 0
Se (X1,0) e (X2,0) representarem as coordenadas X1 e X2 do ponto
estacionrio e se ^Y0 representar a resposta neste ponto, pode-se demonstrar que

^Y0 = b0 + (b1X1,0 + b2X2,0),

194

sendo que ^Y0 pode ser a resposta mxima ou mnima ou estar na regio de sela.
O ponto estacionrio que resulta em ^Y0 pode estar dentro ou fora da faixa experimental das variveis independentes.
Para se visualizar a natureza da superfcie de resposta comum express-la
na chamada forma cannica. A determinao do ponto estacionrio o primeiro
passo para escrever a equao de resposta de segunda ordem na forma cannica.
O segundo passo envolve a alterao do centro das coordenadas X1 e X2 para
o ponto estacionrio, fazendo-se
U1 = X1 - X1,0

U2 = X2 - X2,0

Essa transformao leva ^Y -^Y0

para

^Y -^Y0 = b11U12 + b22U22 + b12U1U2


Na seqncia (soluo) o produto interno removido e novos coeficientes so obtidos para novas variveis derivadas V1 e V2 tais que
^Y -^Y0 = 1V12 + 2V22 (equao em forma cannica), em
que, 1 e 2 so as chamadas razes caractersticas de um matriz simtrica B:
b11 b12
B = |
b12 b22
As razes caractersticas de B so obtidas fazendo-se o
determinante
b11 -
b12

b12
b22 -

= 0
e resolvendo a equao

resultante em . Ou seja h que se resolver


(b11 - )(b22 - ) - b122 = 0, ou ainda

195

2 - (b11+ b22) + b11b22 - b122 = 0, para .

Esta equao uma forma quadrtica do tipo aX2 + bX + C = 0, em

, com a=1, b = -(b11+ b22) e c = b11b22 - b122. Assim, pode-se encontrar


as suas razes 1 e 2 pela frmula clssica de soluo de uma equao
de segundo grau:

________
-b +

b2 - 4ac

1 = ----------------2a

________
-b -

b2 - 4ac

e 2 = -----------------2a

Com base nos sinais e no tamanho (magnitude) dos s pode-se chegar s


seguintes concluses:

a) Se 1 e 2 so negativos, a superfcie de resposta passa por um valor mximo


^Y0, correspondente ao ponto estacionrio (X1,0; X2,0);

b) Se 1 e 2 so positivos, tem-se um ponto de mnimo;


Nos casos a e b, o pesquisador poder conduzir experimentos adicionais confirmatrios, com nveis das variveis independentes prximos do ponto estacionrio,
visando uma melhoria na estimativa das condies timas.

c) Se 1 e 2 tm sinais opostos, a superfcie de resposta registra um ponto de


sela. H necessidade de experimentos adicionais para se obter a otimizao;

d) Um grande (ou pequeno) valor de 1 indica uma rpida (lenta) alterao na


resposta com a variao em X1. Concluso semelhante se aplica para 2.

Se o ponto estacionrio estiver muito fora da faixa de valores das variveis


independentes testadas no experimento, ento a equao ajustada no adequada
para prever respostas prximas do ponto estacionrio. Experimentos adicionais prximos ao ponto estacionrio so necessrios.

196

7.2 - Ajustamento do modelo e anlise da regresso


O ajustamento (clculo) da equao de regresso para a superfcie de respostas de um dado experimento feito por meio de metodologia da anlise de regresso linear, pelo mtodo de mnimos quadrados, utilizando procedimentos de um
programa de computador como o SASR ou o SAEG ou outro disponvel. Apenas com
o intuito ilustrativo sero apresentados a seguir alguns exemplos, utilizando o recurso da lgebra de matriz (sem preocupao com os detalhes dos clculos).

Seja o modelo de segunda ordem, para duas variveis X1 e X2, com i=1, 2, ...,9;
Yi = 0 + 1X1i + 2X2i + 11X1i2 + 22X2i2 + 12X1iX2i + Ei
A estimativa ^Yi de Yi representada por
^Yi = b0 + b1X1i + b2X2i + b11X1i2 + b22X2i2 + b12X1iX2i
Um dos mtodos para estimativas dos bj (b0, b1, b2, b11, b22, b12), que definem a equao de regresso o denominado de mtodo de mnimos quadrados,
uma vez que ele tal que torna mnimo o valor de

(Yi-^Yi)2, a SQRReg.

Sem os detalhes matemticos, a soluo para as estimativas de mnimos


quadrados dos bs necessita das chamadas equaes normais. Em forma matricial
tem-se a seguinte representao para o caso:

Y1
Y2
Y3
Y4
Y = Y5
Y6
Y7
Y8
Y9

B =

b0
b1
b2
b11
b22
b12

1 X11 X21
1 X12 X22
1 X13 X23
1 X14 X24
X = 1 X15 X25
1 X16 X26
1 X17 X27
1 X18 X28
1 X19 X29

X112
X122
X132
X142
X152
X162
X172
X182
X192

X212
X222
X232
X242
X2i5
X262
X272
X282
X292

X11X21
X12x22
X13X23
X14X24
X15X25
X16X26
X17X27
X18X28
X19X29

evidente que X uma matriz de 9 (N) linhas. A i-sima linha da matriz X


corresponde ao i-simo ponto experimental. O vetor Y representa as respostas (va-

197

lores da varivel medida) e o vetor B representa as estimativas dos coeficientes da


regresso.
Para que seja um vetor (soluo) de estimativas de mnimos quadrados, a
equao normal

(XX) = XY

tem que ser satisfeita, em

que a matriz X a chamada transposta de X, na linguagem da lgebra de matriz. A


matriz X tem as linhas de X transformadas em suas colunas e as colunas de X so
suas linhas. A matriz XX o produto de X por X, normalmente representada por S
(S = XX). A matriz inversa (inversa generalizada, se necessrio) de XX representada por (XX)-1. Nesta notao matricial a soluo de mnimos quadrados de B
expressa como
B = (XX)-1 XY

ou S-1 XY

A matriz vetor XY tambm representada como matriz vetor G.


g0
g1
G = g2
g3
...
A varincia de bj, representada por V(bj), pode ser obtida da seguinte forma
V(bj)= (j-simo elemento de S-1)* 2, para i = 1, 2, 3, ..., n.
Assim, a varincia de qualquer coeficiente de regresso igual ao produto de

multiplicado pelo elemento correspondente da matriz (XX)-1. A estimativa da va2

rincia da estimativa do coeficiente da regresso ^V(bj) utilizada para realizao


do teste da hiptese

H0: j = 0, pois
bj/[^V(bj)]1/2 = t.

198

Se o experimento for realizado com repeties nos pontos experimentais, por


exemplo r = 3), ento Yij representa a observao j do ponto experimental i (j = 1,
2, 3). Para i=1, 2, 3, ..., 9 e um modelo de primeiro grau tem-se

Y =

Y11
Y12
Y13
y21
.
.
.
Y93

X =

1
1
1
1
.
.
.
1

X11
X11
X11
X12
.
.
.
X13

X22
X22
X22
X23
.
.
.
X23

Como se sabe h programas estatsticos disponveis como o SAEG (Sistema


de Anlises Estatsticas e Genticas), o SAS (Statistical Analysis System), o BMDP
(Biomedical Statistical Package), o SPSS (Statistical Package for Social Sciences)
que dispem de procedimentos para a realizao do ajustamento e da anlise da regresso. Desta forma o pesquisador no necessita se preocupar com a montagem
da matriz XX, invert-la, obter XY e da calcular B = (XX)-1 XY. O computador se
encarrega do trabalho braal de realizao dos clculos.
O pesquisador dever sim planejar seu experimento, obter e preparar os dados para leitura pelo sistema escolhido ou disponvel, mantendo controle para se
conhecer a correspondncia entre o Yi e o seu elemento na matriz X.
Aps a obteno do modelo resposta ^Y, se ele adequado (Falta de Ajuste
no significativo e os coeficientes da regresso significativos), ento ele poder ser
usado para estudar a superfcie de respostas e determinao por exemplo, do ponto
experimental de resposta tima.
Como visto anteriormente (teste de falta de ajustamento da regresso) o
ajuste do modelo proposto medido pela proximidade (diferena) entre os valores
observados Yij e os valores estimados ^Yij pela equao de regresso. A medida estatstica desta diferena (resduo da regresso) dada pela expresso
SQRReg = (Yij-^Yij)2.
Esta SQRReg tende a ser pequena se as diferenas Yij-^Yij so pequenas, bom
ajustamento. Se as respostas estimadas ^Yij so muito diferentes das observadas, o

199

pesquisador estar interessado em verificar se esta diferena se deve a apenas o


erro experimental (Erro Puro) ou a uma combinao de erro experimental com a
inadequacidade (Falta de Ajuste) do modelo proposto.
A contribuio do Erro Puro (erro experimental) para o Resduo da Regresso
obtida das variaes observadas na resposta entre repeties do mesmo ponto
experimental (mesmo tratamento), dada pela seguinte frmula
SQEpuro = [ (Yij-ri.Yi)2].

A SQFAjuste = SQRReg - SQEpuro, sendo os graus de liberdade tambm obtidos por


diferena. Se a falta de ajuste significativa

(FFAjuste = QMFajuste/QMEpuro

significativo a um determinado nvel de significncia) ento deve se procurar ajustar outro modelo, caso contrrio, o modelo ajustado poder ser utilizado para os objetivos definidos pelo pesquisador.

EXEMPLO 01- Um estudo exploratrio foi conduzido para testar o efeito de CaCl2
(X1) e de MgCl2 (X2) sobre a estabilidade (capacidade de reteno) da gua em
emulso crnea. Os valores codificados e originais das variveis testadas so:

Codificados :
-1
Nveis experimentais de CaCl2 (X1): 50
Nveis experimentais de MgCl2 (X2): 50

0
1
125 200 ppm
125 200 ppm

O modelo de regresso proposto (em forma de estimativa)


^Y = b0 + b1 X1 + b2 X2

200

Quadro 1-Pontos experimentais e respostas para o exemplo em discusso.


Ponto
Experimental 0
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Yij2 = 588,55;

x1i

x2i

-1
-1
-1
1
1
1
-1
-1
-1
1
1
1
0
0
0
0
0

-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
0
0
0
0
0

Yij

Yi.

6,4
6,2
5,5
5,7
4,6
4,9
6,6
6,6
5,8
7,1
6,6
7,7
4,8
5,1
5,0
5,4
4,9

Yij = Y.. = 98,90

Yi.

18,1

6,03

15,2

5,07

19,0

6,33

21,4

25,2

7,13

5,04

e Y = 5,82

Os quatro primeiros pontos experimentais, como mostrados no Quadro 1, so


do fatorial 22. O quinto (0,0) o ponto central do delineamento. Neste experimento,
o fatorial 22 foi repetido trs vezes e o ponto central foi repetido cinco vezes. Estas
repeties produzem 12 graus de liberdade para o resduo, erro puro.

A matriz X :

X =

1 1 1 1 1 1 1 1 1
-1 -1 -1 1 1 1 -1 -1 -1
-1 -1 -1 -1 -1 -1 1 1 1

1
1
1

1
1
1

1
1
1

1
0
0

1
0
0

1
0
0

1
0
0

1
0
0

201

A matriz do delineamento X, e o vetor resposta Y so representados a


seguir:
-1
-1
-1
1
1
1
-1
-1
-1
1
1
1
0
0
0
0
0

-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
0
0
0
0
0

XX =

17 0
0 12
0 0

0
0
12

XY =

98,9000
-0,5000
7,1000

X =

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Y =

6,4
6,2
5,5
5,7
4,6
4,9
6,6
6,6
5,8
7,1
6,6
7,7
4,8
5,1
5,0
5,4
4,9

(XX)

g0
g1 = G
g2

-1

-1

= S

1/17
0
0
1/12
0
0

-1

S (XY) = B =

Assim, a equao de regresso ajustada ser


^Y = 5,8176 - 0,0417 x1 + 0,5917 x2.
Para os testes de hiptese tem-se:
V(b0) = 2/17; V(b1) = 2/12

e V(b2) = 2/12

b0
b1
b2

0
0
1/12

5,8176
-0,0417
0,5917

202

Uma vez que

desconhecido, utiliza-se sua estimativa o QMRRegresso

se a falta de ajuste no significativa ou o QMEpuro, se o modelo no se ajusta


bem.
Para testar o a Falta de Ajuste e para Anlise de Varincia da Regresso obtm-se as Somas de Quadrados:

SQTotal = (Yij2 - 17Y)2 = 588.55 - 17(5,82)2 = 13,1847 com 16 GL.


SQReg = bigi , (para i=1,2) =
(-0,0417)(-0,5000) + (0,5917)(7,1000) = 4,2220 com 2 GL.
SQRReg = SQTotal - SQReg = 13,1847 - 4,2220 = 8,9627 com 14 GL.

SQEpuro = (6,4)2 + (6,2)2 + (5,5)2 - (18,1)2/3


+ (5,7)2 + (4,6)2 + (4,9)2 - (15,2)2/3
+ (6,6)2 + (6,6)2 + (5,8)2 - (19,0)2/3
+ (7,1)2 + (6,6)2 + (7,7)2 - (21,4)2/3
+ (4,8)2 + (5,1)2 + (5,0)2 + (5,4)2 + (4,9)2 - (25,2)2/5
= 2,3388 com 12 GL.

SQFajuste = SQRReg - SQEpuro = 8,9627 - 2,3388 = 6,6239 com 2 GL.

O quadro da anlise de varincia ser:

Quadro 2 - Analise de varincia da regresso linear (modelo de primeira


ordem) com teste da falta de ajuste
FV

GL

SQ

Regresso
RRegresso
Falta de Ajuste
Erro puro

2
14
2
12

4,2220
8,9627
6,6239
2,3388

QM
2,1110
0,6402
3,3119
0,1949

Fc

F0,01

16,99*

6,93

* Significativo ao nvel de 1% de probabilidade (p < 0,01).

Como se observa a falta de ajuste significativa, mostrando que o modelo de


primeira ordem no se ajusta bem, sendo portanto inadequado para descrever a va-

203

riao na estabilidade da gua da emulso crnea em funo dos nveis de CaCl2 e


de MgCl2.
Mesmo sabendo disso, mas apenas para ilustrar, examina-se o contorno correspondente a ^Y = 5,0; um valor dentro do intervalo observado para Y. Para

^Y

= 5,0 a linha de contorno dada pelo modelo

0,04217 x1 - 0,5917 x2 = 0,8176

Se x2 = -1 observa-se que x1 ser 33,80; uma coordenada muito fora do intervalo experimental de -1 a +1. Isto vem confirmar a falta de ajuste do modelo.
Desta forma, para uma melhor descrio da resposta, o modelo dever incluir
os efeitos quadrticos e de interao dos dois fatores. A estimativa dos efeitos
quadrticos e de interao requer delineamentos com trs ou mais nveis
experimentais de cada fator. Como se observa este experimento tem 4 GL para
os tratamentos e o modelo de segundo grau tem cinco GL, ou seja, no h como
testar o modelo de segundo grau. Este foi um exemplo apenas para ajustamento de
modelo.

EXEMPLO 02 - Os dados so de um experimento tambm para testar o efeito de


duas substncias, A(CaCl2) e B(MgCl2), cada uma em trs nveis, sobre a capacidade
de reteno de gua em emulso crnea. O fator A foi aplicado com 62, 64 e 66
ppm e o fator B com 7, 9 e 11 ppm. O experimento foi realizado com duas repeties. Os fatores A e B esto apresentados na matriz X em forma codificada (-1, 0,
1). Como o experimento tem duas repeties, a matriz X (do delineamento) tem
duas linhas idnticas. A forma ortogonalizada da matriz X e o vetor de resposta Y,
para o modelo de segunda ordem
(^Yij = b0 + b1X1ij + b2X2ij + b11X1ij2 + b22X2ij2 + b12X1ijX2ij), so apresentados no
Quadro 3.

204

Quadro 3 - Matrizes X e Y do exemplo em discusso


Ponto Constante
Exper.
b0
X1ij
1
2
3
4
5
6
7
8
9

1
1
1
1
1
1
1
1
1
X = 1
1
1
1
1
1
1
1
1

X2ij

-1
-1
0
0
1
1
-1
-1
0
0
1
1
-1
-1
0
0
1
1

-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
1
1
1
1
1
1

X1ij2
1/3
1/3
-2/3
-2/3
1/3
1/3
1/3
1/3
-2/3
-2/3
1/3
1/3
1/3
1/3
-2/3
-2/3
1/3
1/3

X2ij2

X1ijX2ij

1/3
1
1/3
1
1/3
0
1/3
0
1/3
-1
1/3
-1
-2/3
0
-2/3
0
-2/3
0
-2/3
0
-2/3
0
-2/3
0
1/3
-1
1/3
-1
1/3
0
1/3
0
1/3
1
1/3
1

Yij
1,14
1,05
1,87
1,60
1,70
1,80
2,23
2,30
3,13
Y = 3,00
2,80
1,95
0,74
0,50
1,43
1,00
0,10
0,05

A matriz

18
0
0
XX = 0
0
0

0
12
0
0
0
0

0
0
12
0
0
0

28,3900
0,4400
-5,3400
XY = -2,5676
-5,9475
-2,4000

0
0
0
4
0
0

0
0
0
0
4
0

0
0
0
0
0
8

g0
g1
g2
= g11 = G
g22
g12

e (XX)-1

1/18 0
0
0
0
0
0 1/12 0
0
0
0
0
0 1/12 0
0
0
= 0
0
0 1/4 0
0
0
0
0
0 1/4 0
0
0
0
0
0 1/8

Y
Y11
Y12
Y21
Y22
Y31
Y32
Y41
Y42
Y51
= Y52
Y61
Y62
Y71
Y72
Y81
Y82
Y91
Y92

205

A soluo B = S-1 XY ser:

B =

b0
b1
b2
b11
b22
b12

1,5772
0,0367
-0,4450
-0,6417
-1,4867
-0,3000

Na soluo de B pode-se observar que b0 = Y. Assim, o modelo de


segunda ordem ajustado, utilizando a forma ortogonalizada da matriz do
delineamento,
^Y = 1,5772 + 0,0367 x1 - 0,4450 x2 - 0,6417 x12 - 1,48767 x22
- 0,3000 x1x2

Para obter a equao de regresso de segunda ordem correspondente matriz do delineamento na forma no ortogonalizada, basta incorporar o ajustamento
feito para a ortogonalizao, dado por

b0 = Y - c(b11) - c(b22), neste caso


b0 = 1,5772 - 2/3(-0,6417) - 2/3(-1,4867) = 2,9962
Desta forma o modelo de segunda ordem, ajustado para as variveis
codificadas, ser:
^Y = 2,9962 + 0,0367 x1 - 0,4450 x2 - 0,6417 X12 - 1,48767 x22 - 0,3000 x1x2

A partir da matriz (XX)-1 tem-se:


V(Y) = 2/18
V(b1) = 2 /12
V(b2) = 2/12

V(b11) = 2/4
V(b22) = 2/4
V(b12) = 2/8

206

O valor de

estimado (representado) pelo QMRReg se o modelo apresen-

tar bom ajustamento, ou pelo QMEpuro, se o modelo apresentar falta de ajustamento significativa.
Os clculos das Somas de Quadrados, para a anlise de varincia da regresso, incluindo os testes dos efeitos lineares e quadrticos, separadamente, esto
descritos a seguir:
SQTotal = Yij2 - C = 14,3690

com 17 GL.

SQReg = bigi = b1g1 + b2g2 + b11g11 + b22g22 + b12g12


= 13,6021 com 5 GL.

Esta SQReg pode ser decomposta em seus efeitos lineares, quadrticos e de interao.
SQRLinear = b1g1 + b2g2 = 0,0161 + 2,3763 = 2,3924 com 2 GL.
SQRQuad = b11g11 + b22g22 = 1,6476 + 8,8421 = 10,4897 com 2 GL.
SQInter = b12g12 = 0,72000
SQRReg = SQTotal - SQReg = 14,3690 - 13,6021 = 0,7669 com 12 GL.
SQEpuro = 0,5405

com 9 GL.

SQFajuste = SQRReg - SQEpuro = 0,7669 - 0,5405 = 0,2264 com 3 GL.

A anlise de varincia poderia ter a forma mostrada no Quadro 4. Como se


observa na anlise de varincia o efeito da falta de ajustamento no significativa.
Assim o modelo de segunda ordem pode ser utilizado para descrever a variao da
capacidade de reteno de gua em funo dos nveis de CaCl2 e de MgCl2.
Uma vez que o modelo tem bom ajustamento ele pode ser utilizado para se
determinar nveis timos. Considerando ^Y ajustado como uma funo de x1 e de
x2, e igualando as derivadas parciais zero, tem-se:

^Y/ x1 = 0,0367 - 1,2834 x1 - 0,3000 x2 = 0


^Y/ x2 = -0,4450 - 2,9734 x2 - 0,3000 x1 = 0

207

Quadro 4 - Anlise de varincia da regresso testando efeitos individuais.


FV

GL

Regresso
Reg Linear
b1
b2
Reg Quad e Inter
b11
b22
b12
RRegresso
Falta Ajuste
Epuro

5
2
1
1
3
1
1
1
12
3
9

SQ
13,6021
2,3924
0,0161
2,3763
11,2097
1,6476
8,8421
0,7200
0,7669
0,2264
0,5404

QM

Fc

F0,05

1,1962

18,72*

3,89

3,7366

58,48*

3,49

0,0639
0,0755
0,0600

1,26ns

3,86

* - Significativo ao nvel de 5% de probabilidade (p<0,05).


ns - No significativo ao nvel de 5% de probabilidade (p>0,05).

Da soluo das duas equaes para x1 e x2 obtm-se o ponto estacionrio (x1,0 x2,0) = (0,0651, -0,1562). Assim, a resposta tima, se existir, corresponder a este ponto estacionrio. A resposta esperada neste ponto estacionrio :
^Y = 2,9962 + (0,0367)(0,0651) + (-0,4450)(-0.1562) - (0,6417)(0,0042)
+
(-1,4867)(0,0244) + (-0,3000)(-0,0102)
^Y = 3,04

Como se observa, o ponto estacionrio (0,0651, -0,1562) se localiza prximo


ao centro da regio experimental. Para se saber se este ponto de resposta mnima
ou mxima, deve-se calcular as razes caractersticas da matriz simtrica B dada
a seguir, fazendo seu determinante igual a zero:
-0,6417-
(-0,3000)

(-0,3000)
-1,4867-

= 0

(-0,6417- )(-1,4867- ) - [(-0,3000)]2 = 0

2 + 2,1284 + 0,9315 = 0.

208

As duas razes da equao de segundo grau com a=1, b=2,184 e c = 0,9315


so:

1 = -0,6159 e 2 = -1,5126.
[Como uma verificao dos clculos pode-se testar a igualdade

1+ 2= b11 + b22]
Uma vez que as duas razes caractersticas so negativas, a superfcie de resposta tem um mximo em ^Y = 3,04, correspondendo ao ponto estacionrio.

7.3 - Delineamentos para Superfcie de Resposta


Para um desenho simples, com dois fatores A e B, cada um em dois nveis,
tem-se um fatorial 22, com as combinaes:
(1), a, b, ab, que representam a0b0, a1b0, a0b1, a1b1. O modelo seria
Yij = 0 + 1X1i + 2X2i + 12X1iX2i + Eij para i = 1, 2, 3, 4 e
j = 1, 2,... r, sendo X1 = A e X2 = B.
Os nveis de X1 e de X2 podem ser codificados, +1 para o maior e 1 para o menor, por exemplo x1 =(X1-c)/I
Sejam

X1 = 50, 125, 200

x1 =(50-125)/75 = -1,
(125-125)/75 = 0
(200-125)/75 = 1

e x2 =(X2-c)/I.

X2 = 20, 40, 60

x2 =(20-40)/20 = -1
x2 =(40-40)/20 = 0
x2 =(60-40)/20 = 1

ento

209

Delineamentos Compostos
Em estudos envolvendo mais de duas variveis independentes (fatores), o
uso de fatoriais 3n resultaria em nmero excessivo de pontos experimentais ou de
tratamentos a serem testados. Este aumento no nmero de tratamentos, no s
poderia tornar o experimento muito caro, quanto em alguns casos, praticamente
impossvel de ser realizado, em razo da necessidade de grande quantidade de material experimental, para atender a um determinado delineamento. Por exemplo,
Dois fatores, cada um em trs nveis { A => 1, 2, 3 e

B => 1, 2, 3; resul-

taria em 32 = 9 tratamentos.

Para 3 fatores (A, B, C) cada um em 3 nveis => 33 = 27 tratamentos. Para 4 fatores (A, B, C, D) cada um em 3 nveis
=> 34 = 81 tratamentos.

O delineamento composto foi idealizado e sugerido para reduzir o nmero de


pontos experimentais a ser testado e ainda assim permitir o ajustamento e testes de
modelos de regresso. Para formar um delineamento composto pode-se partir de
um fatorial 2n e adicionar pontos experimentais extras, at que seja possvel ajustar
modelos de segunda ordem. Em fatorial 2n no se pode testar modelos de segunda
ordem, uma vez que h apenas 2 nveis de cada fator. Para se testar modelos de
segunda ordem a partir de experimentos fatoriais eles devem ser pelo menos 3n.
No delineamento composto, ao fatorial 2n, por exemplo, adicionado 2n+1
pontos experimentais, o que ir permitir ajustamento de modelos de segunda ordem.
Para n=3 fatores, seriam 23 +(2.3 + 1) = 15 pontos experimentais (tratamentos), em lugar de 33 = 27 tratamentos (pontos experimentais) em fatorial clssico de trs fatores, cada um em trs nveis, que seriam necessrios para ajustar
um modelo de segunda ordem para os trs fatores estudados.
Aos 2n pontos do fatorial com dois nveis, so adicionados (2n+1) pontos extras, sendo um deles na origem (central) e os restantes 2n distantes unidades
(codificadas) da origem, igualmente espalhados (espaados), aos pares ao longo
dos n eixos do desenho (delineamento). Para n = 3 fatores, a representao tridimensional dos 15 pontos de desenho composto pode ser mostrada graficamente,
Figura 1, como a seguir:

210

Notao geomtrica

2 + 2.3 + 1 = 15 Pontos
Experimentais

Figura 1 - Representao grfica dos 15 pontos experimentais de


um delineamento composto com trs variveis (fatores).

A distncia , em valores codificados de uma escala padronizada,


dado por:

= (pm/4r2)1/4, em que p = (

M -

m)2, sendo:

m = nmero de observaes do delineamento bsico 2n;


r = nmero de repeties de cada um dos 2n+1 tratamentos extra;
M = nmero total de observaes do experimento (M = m + r(2n+1).

Como mencionado anteriormente, a distncia dada pela frmula est na


escala padronizada (valor codificado). O nvel experimental correspondente (valor
da varivel na escala original) pode ser obtido pela transformao inversa da codificao.
Como exemplo, para um delineamento composto de segunda ordem, seja n =
3 fatores (variveis independentes). Sugerindo apenas uma observao (uma repetio) para os 15 tratamentos, isto , para o fatorial bsico 23 = 8 e para os 2.3+1
pontos experimentais extra = 7 tratamentos: ento tem-se m=8. Assim, h apenas
M = 8+7 = 15 observaes, uma para cada ponto do delineamento.

211

Desenhos Rotativos
O poder de predio de um modelo ajustado de resposta em vrios pontos da
regio experimental depende do delineamento utilizado. So desejveis os delineamentos capazes de predizer de forma homognea em todas as distncias constantes, em relao ao ponto central. Estes so denominados delineamentos rotativos.
Para delineamentos rotativos as varincias e as covarincias dos coeficientes estimados no modelo ajustado permanecem inalterados quando os pontos experimentais so girados (rotacionados) em torno do seu centro. O delineamento de primeira
ordem para estimar um modelo correspondente, com um ponto central, pode ser
representado como na Figura 2 a seguir. Este um desenho rotativo.

Representao geomtrica
Fatorial 2k+1
B
-

+ b

ab +

(0,0)
A

- (1)
-

a +

Figura 2 - Pontos experimentais de um fatorial 2 com os fatores X1 e


X2, cada um em dois nveis (-1 e +1) codificados, mais um ponto central.

Os delineamentos rotativos de segunda ordem mais simples, para estimar os


modelos correspondentes, em duas variveis, so fornecidos pelos vrtices de um
pentgono, hexgono, ou em um octgono, cada um com um ponto central, como
ilustrado na Figura 3, a seguir.

212

X2
|
| .2
.3
|
|.6
-----------.1-- X1
|
.4
|
|.5
|
Pentgono

X2

|
| .2
.3 |
|.7
--.4-------.1--- X1
|
|
.5 | .6
|
Hexgono

X2

|.7
|
.3 |
.4
|.9
--.6--------.5-- X1
|
.1 | .2
|
|.8
Octgono

Figura 3 - Representao esquemtica de trs delineamentos rotativos de


dois fatores.

Para se obter uma boa preditibilidade na direo do centro do delineamento,


o ponto experimental central repetido um maior nmero de vezes do que os pontos perifricos. O Quadro 5 (delineamento) a seguir apresenta as coordenadas dos
pontos (codificados) para um pentgono, hexgono e um octgono. Como se observa no Quadro 5, os pontos perifricos so eqidistantes do centro, para satisfazer a
rotabilidade. Deve-se observar tambm que o nmero de nveis das variveis independentes fixado pelo delineamento, no pelo pesquisador. Por exemplo, o hexgono exige cinco nveis da varivel X1 e trs nveis da varivel X2.
A vantagem desses delineamentos o fato de possibilitarem o trabalho com
um nmero de pontos experimentais relativamente pequeno e que ainda permite
ajustar modelo de segunda ordem, fornecendo uma medida (estimativa) do erro experimental. Para possibilitar o ajustamento do modelo de segunda ordem, o delineamento tem que ser ortogonal, ou seja, todos os elementos fora da diagonal principal da matriz XX tem que ser zero. A ortogonalidade na matriz X possibilita o clculo da Soma de Quadrados correspondente a efeitos quadrticos. Assim, h necessidade de ajustamento para o efeito linear no modelo.
A ortogonalizao da matriz X (do delineamento) pode ser realizada subtraindo o valor c de cada elemento de x1i2 e de x2i2,
sendo c = 1/M x1i2

ou c = 1/M x2i2 em que M = nmero de

213

observaes do experimento. O Quadro 6 apresenta um exemplo desta ortogonalizao.

Da tem-se
c = 1/M X1i2 = 1/M X2i2 = 6/9 = 2/3
Quadro 5 - Pontos experimentais (codificados) de alguns delineamentos
rotativos de segunda ordem, para dois fatores.
Ponto
Pentgono
1
2
3
4
5
6
Hexgono
1
2
3
4
5
6
7

Octgono
1
2
3
4
5
6
7
8
9

x1

x2

1,000
0,309
-0,809
-0,809
0,309
0

0
0,951
0,588
-0,588
-0,951
0

1,000
0,500
-0,500
-1,000
-0,500
0,500
0

0
0,866
0,866
0
-0,866
-0,866
0

-1
1
-1
1
1,4142
-1,4142
0
0
0

-1
-1
1
1
0
0
1,4142
-1,4142
0

Cinco nveis de cada varivel

Cinco nveis de X1
e trs nveis de X2

Cinco nveis de cada


varivel

214

Quadro 6 - Matriz do delineamento para experimento fatorial 32


sem repetio, para ajustar um modelo de segunda ordem.
Ponto
Experimental

constante
regresso

X1i

1
2
3
4
5
6
7
8
9

1
1
1
1
1
1
1
1
1

-1
0
1
-1
0
1
-1
0
1

variveis do modelo de
regresso
X2i
X1i2
X2i2
-1
-1
-1
0
0
0
1
1
1

1
0
1
1
0
1
1
0
1

1
1
1
0
0
0
1
1
1

X1iX2i
1
0
-1
0
0
0
-1
0
1

Assim, a forma ortogonalizada da matriz anterior (Quadro 6) pode


ser escrita como mostrado no Quadro 7.
Quadro 7 - Matriz ortogonalizada do delineamento para experimento
fatorial 32 sem repetio, para ajustar um modelo de segunda ordem.
Ponto
Experimental

constante
regresso

x1i

1
2
3
4
5
6
7
8
9

1
1
1
1
1
1
1
1
1

-1
0
1
-1
0
1
-1
0
1

variveis do modelo de
regresso
x2i
x1i2 -c
x2i2-c
-1
-1
-1
0
0
0
1
1
1

1/3
-2/3
1/3
1/3
-2/3
1/3
1/3
-2/3
1/3

1/3
1/3
1/3
-2/3
-2/3
-2/3
1/3
1/3
1/3

x1ix2i
1
0
-1
0
0
0
-1
0
1

215

7.4 Estimao de parmetros e anlise de varincia da regresso


7.4.1 Estimao da equao
A primeira parte da anlise da superfcie resposta testar o ajustamento do
modelo proposto por meio da anlise de varincia, testar as estimativas dos coeficientes e estimar os parmetros da regresso. Isto realizado pelo mtodo de mnimos quadrados. O programa SAS (Statistical Analysis System) tem um procedimento especifico para anlise da superfcie de resposta;
PROC RSREG;
MODEL Y= X1 X2; RUN;
a seqncia anterior ajusta o modelo de segundo grau em X1 e X2 representado por
^Y = b0 + b1X1 + b2X2 + b11X12 + b22X22 + b12X1X2 que responde as seguintes questes:
a) Qual a contribuio de cada um dos tipos de efeito do modelo? Linear, quadrtico e de interao;
b) Quanto da SQRReg se deve falta de ajuste do modelo? Isto , o modelo
quadrtico representa bem a verdadeira superfcie de resposta?
c) Qual a contribuio de cada varivel (fator) para a resposta? Algum fator
pode ser removido?
d) Quais seriam as respostas esperadas para diversos valores da varivel independente?
7.4.2 Codificao das variveis
Os valores das variveis independentes precisam ser comparveis para que
se possa realizar a anlise da regresso ajustada para a superfcie de resposta. Isto
se deve ao fato de as anlises cannica e de cumieira da superfcie de resposta serem sensveis s diferenas de escala e de localizao dos nveis dos fatores. A anlise de varincia em se no afetada por estas mudanas de escala. Embora a forma da superfcie no seja alterada pela codificao os parmetros da regresso o
so. A codificao mais freqente transformar os valores da escala original dos fatores (variveis) para o intervalo de -1 a +1, realizando as anlises com os valores
codificados. Esta prtica tem a vantagem adicional de tornar unitrio o raio geomtrico do delineamento experimental para a anlise de cumieira. O PROC RSREG
calcula esta transformao linear e realiza a codificao por default ao ler os dados, fazendo ento as anlises cannica e de cumieira do modelo ajustado nos dados codificados. A formula geral da transformao linear

216

Valor codificado = (valor original M)/S, em que


M = mdia dos valores extremos e,
S = metade da diferena entre os valores extremos da varivel independente.

EXEMPLO X Dados de um experimento para testar efeitos do tempo e da temperatura em um processo de sntese que maximize o rendimento de uma substncia
qumica (mercaptobenzotiazol). um exemplo para um modelo de dois fatores em
que a superfcie estimada no apresenta um nico mximo. A anlise de cumieira
ser usada para determinar a regio em que se localiza o rendimento timo esperado. O job SAS (que ajusta o modelo de segundo grau em tempo e temperatura)
com os dados experimentais e variveis na escala original para ajustar o modelo de
segundo grau apresentado a seguir:
OPTIONS LS = 75 PS = 75;
DATA B;
INPUT TEMP TEMPER RESP;
LABEL TEMP = "TEMPO DE RAO (HORAS)"
TEMPER = "TEMPERATURA (CELCIUS)"
RESP = "RENDIMENTO (%)";
CARDS;
4
250 83.8
20
250 81.7
12
250 82.4
12
250 82.9
12
220 84.7
12
280 57.9
12
250 81.2
6.3
229 81.3
6.3
271 83.1
17.7 229 85.3
17.7 271 72.7
4
250 82.0
;
PROC SORT; BY TEMP TEMPER; RUN;
*;
PROC RSREG;
MODEL RESP = TEMP TEMPER/LACKFIT;
RIDGE MAX; RUN;

Sada do SAS Resultados das anlises


Nota: A afirmativa PROC SORT; BY TEMP TEMPER; RUN; para garantir que os dados estejam ordenados de acordo com os valores de TEMP e TEMPER, uma exigncia do
PROC RSREG.

217

Os dados de tempo e temperatura entraram com os valores na escala original. O PROC RSREG apresenta ento a formula geral para os valores codificados na
escala de -1 a +1, x1 = (X1 -12)/8, para tempo e x2 = (X2 250)/30, para temperatura. Desta forma a correspondncia seria:
-1
4

Tempo
Temperatura

-0,7125
6,3

-1
220

-0,7
229

0
12
0
250

0,7125
17,7
+0,7
271

+1
20
+1
280

The RSREG Procedure


Coding Coefficients for the Independent Variables
Factor
Subtracted off
Divided by
TEMP
TEMPER

12.000000
250.000000

8.000000
30.000000

Response Surface for Variable RESP: RENDIMENTO (%)


Response Mean
Root MSE
R-Square
Coefficient of Variation

79.916667
4.615964
0.8003
5.7760

Root MSE a raiz quadrada do erro, neste caso o RRegressao (assume falta de
ajuste no significativa).
R-Square o R2 , neste caso igual a SQModelo/SQTotal

R2 = 512,193947/640,03667 = 0,800257
O Coefficient of Variation coeficiente de variao a raiz quadrada do quadrado
mdio do erro dividida pela mdia de Y, expresso em percentagem, ou seja,
100*4,615964/79,916667 =5,7759.

Anlise de varincia da regresso


Regression
Linear
Quadratic
Crossproduct
Total Model

DF
2
2
1
5

Type I Sum
of Squares
313.585803
146.768144
51.840000
512.193947

R-Square
0.4899
0.2293
0.0810
0.8003

F Value
7.36
3.44
2.43
4.81

Pr > F
0.0243
0.1009
0.1698
0.0410

218

Na anlise de varincia acima os 2 GL (DF) para Linear so os de X1 e X2. Os


2 GL para Quadratic so os de X12 e X22 e, o 1 GL para Crossproduct o da interao
X1X2, da mesma maneira as somas de quadrados tambm foram agrupadas. Os valores de F Value do Quadro acima foram obtidos com base no QMRRegresso, portanto, assumindo falta de ajuste no significativa.

Teste da falta de ajuste da superfcie de resposta


Residual
Lack of Fit
Pure Error
Total Error

DF

Sum of
Squares

Mean Square

F Value

Pr > F

3
3
6

124.696053
3.146667
127.842720

41.565351
1.048889
21.307120

39.63

0.0065

Como se observa na anlise acima, a falta de ajuste significativa, com uma


probabilidade de F de 0,65%. Assim, conclui-se que o modelo de segundo grau,
mesmo com um R2 prximo de 80,0%, no se ajusta bem, devendo, ser testado outro modelo.
O PROC RSREG segue analisando o modelo de segundo grau. O Quadro a
seguir realiza o teste t para os coeficientes da regresso. O Standard Error da estimativa dos coeficientes estimado com base no QMRRegresso. Isto estaria correto
se a falta de ajuste fosse no significativa. O teste t mostra que os coeficientes de
TEMP, TEMP*TEMP e TEMPER*TEMP so no significativos. Esta anlise seria plena,
satisfatria, se o a falta de ajuste no fosse significativa.

Parameter
Intercept
TEMP
TEMPER
TEMP*TEMP
TEMPER*TEMP
TEMPER*TEMPER

DF

Estimate

1
1
1
1
1
1

-545.867976
6.872863
4.989743
0.021631
-0.030075
-0.009836

Standard
Error t Value Pr > |t|
277.145373
5.004928
2.165839
0.056784
0.019281
0.004304

-1.97
1.37
2.30
0.38
-1.56
-2.29

0.0964
0.2188
0.0608
0.7164
0.1698
0.0623

Parameter
Estimate
from Coded
Data
82.173110
-1.014287
-8.676768
1.384394
-7.218045
-8.852519

A anlise do Quadro a seguir mostraria a importncia relativa de cada fator.


Os dados resumem a contribuio de cada fator TEMP E TEMPER, agrupados.

Factor
TEMP
TEMPER

DF
3
3

Sum of
Squares
61.290957
461.250925

Mean Square F Value


20.430319
0.96
153.750308
7.22

Pr > F Label
0.4704 TEMPO DE RAO (HORAS)
0.0205 TEMPERATURA (CELCIUS)

219

Referncias Bibliogrficas
.BETHEA, R.M.; DURAN, B.S. & BOULLION, T.L. Statistical Methods for Engineers
and Scientists. 2a. Ed. Marcel Dekker, Inc., New York. 698p.
.DRAPER, N.R. & SMITH, H. Applied regression analysis. 2nd. Edition. John Wiley &
Sons. New York. 1981. 709p.
.GACULA, Jr., M.C. & SINGH, J. 1984. Statistical Methods in Food and Consumer
Research. Academic Press, Inc., Orlando, FL. 505p.
.SAS Institute, Inc., SAS/STAT Users Guide, Version 6, Fourth Edition, Volume 2,
Cary, NC: SAS Insitute Inc., 1989. 846p.
.SOKAL, R.R. & ROHLF, F.J. Biometry: The principles and practice of statistics in
biological research. 2. Ed. W.H Freeman and Company. New York. 859p.