Sei sulla pagina 1di 28

Metodologa de Superficie de Respuesta

Introduccin a la metodologa de respuesta


En este captulo se discutir la metodologa de superficie de respuesta su representacin grfica, el
procedimiento a seguir hasta encontrar el ptimo y los diseos experimentales que se pueden utilizar.
La metodologa de superficie de respuesta puede definirse como un conjunto tcnicas estadsticas
utilizadas para modelar y analizar un proceso en donde una variable respuesta es influenciada por otras
variables o factores. El propsito inicial de estas tcnicas es disear un experimento que proporcione
valores razonables de la variable respuesta y, a continuacin, determinar el modelo matemtico que
mejor se ajusta a los datos obtenidos. El objetivo final es establecer los valores de los factores que
optimizan el valor de la variable respuesta.
Superficie de respuesta
Dado los niveles x1, , xk de k factores 1, , k , una variable respuesta Y y una funcin f ,
generalmente del tipo polinomial, que relaciona la media de la variable respuesta con los niveles de los
factores mediante:

E Y x1,

, xk f x1,

, xk

De modo que la variable respuesta puede ser expresada mediante el siguiente modelo:

Y
Y f x1, , xk
donde es el error observado en la respuesta.
La relacin f x1, , xk existente entre y los niveles de los k factores puede representarse a travs
de una hipersuperficie (subconjunto de un espacio eucldeano (k+1)-dimensional) a la que llamaremos
superficie de respuesta
Grfica de Superficie de Respuesta y de Contorno
Una tcnica utilizada para ayudar a visualizar la forma que puede tener una superficie de respuesta
tridimensional consiste en representar la grfica de contornos de la superficie, en la que se trazan las
denominadas lneas de contorno, que son curvas correspondientes a valores constantes de la respuesta
sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por los niveles x1 y x2 de los factores).
Geomtricamente, cada lnea de contorno es una proyeccin sobre el plano X1X2 de una seccin de la
superficie de respuesta al intersecar con un plano paralelo al X1X2. La grfica de contornos resulta til
para estudiar los niveles de los factores en los que se da un cambio en la forma o altura de la superficie
de respuesta.

La existencia de grficas de contorno no est limitada a 3 dimensiones a pesar de que en el caso en que
haya ms de 3 factores de influencia no es posible la representacin geomtrica. No obstante, el hecho
de poder representar grficas de contorno para problemas en que haya 2 o 3 factores permite visualizar
ms fcilmente la situacin general.
Ejemplo N 1: Un agricultor desea maximizar su produccin de almendras (medida en Kg./Ha) en
funcin de las cantidades (medidas en Kg./Ha) de dos tipos de fertilizantes: A y B, que utiliza. Una
superficie de respuesta para la produccin de almendra viene dada por la siguiente grfica

Fig. N 1: Superficie de respuesta tridimensional que representa la produccin esperada de almendra ()


en funcin de las cantidades de fertilizante A (X1) y fertilizante B (X2)
Para realizar la grfica de contornos correspondiente se secciona la superficie de respuesta usando
planos paralelos al X1X2 en ciertos valores de respuesta considerados, por ejemplo

Fig. N 2: Seccin de la superficie de respuesta por planos paralelos al plano X1 X2 en los valores
esperados de produccin: 11.5, 12.1, 12.7, 13.3, 13.9
Cada lnea de contorno representa un nmero infinito de combinaciones de las cantidades de los dos
fertilizantes, para las producciones de almendras esperadas consideradas. La produccin mxima, que es
de 14.12 Kg./Ha. se localiza en el centro de la elipse ms pequea y corresponde a los niveles X1=170.06
del fertilizante A y X2=246.65 del fertilizante B.

Fig. N 3: Grfica de contorno de la superficie de respuesta con lneas de contorno correspondiente a los
valores esperados de produccin: 11.5, 12.1, 12.7, 13.3, 13.9
La grfica de contornos correspondiente a la superficie de respuesta del ejemplo considerado indicara
que tiene la forma de lomo o colina.
Al planificar el experimento que permitir llevar a cabo el estudio acerca del efecto de los factores sobre
la variable respuesta, el primer paso es la eleccin de los factores que se usarn en este experimento.
Una vez determinado, el siguiente paso es seleccionar los rangos de los valores de cada factor que se
considerarn, pero aunque en el experimento es posible explorar la regin correspondiente al espacio
completo de los factores de influencia o regin operativa, lo ms frecuente consiste en explorar
nicamente una regin de inters limitada, la regin experimental, contenida en la regin general. De
este modo, durante la ejecucin del experimento, slo se utilizarn niveles de los factores
correspondientes a valores que caigan en esta regin, a menos que se descubran, durante el conjunto
inicial del experimento, que pueda ser necesario explorar niveles que estn mas all de los lmites de la
regin considerada.
Superficie de respuestas polinmicas. Modelos de primer y segundo orden
El objetivo principal de la metodologa de superficie de respuesta es determinar aproximadamente una
funcin f., con tal objetivo se propone generalmente un modelo polinmico con k factores 1, , k .
Luego, comnmente se emplea un polinomio de orden inferior en alguna regin de las variables

independientes. Si la respuesta est bien modelada por una funcin lineal de las variables
independientes, entonces la funcin de aproximacin es el modelo de primer orden

y 0 1x1

k xk

(1)

Si se encuentra que existe curvatura en el sitema, entonces debe usarse un polinomio de orden superior,
tal como el modelo de segundo orden
k

i 1

i 1

y 0 i xi ii xi2 i j ij xi x j

(2)

En casi todos los problemas de metodologa de superficie de respuesta usa uno de estos modelos, o
ambos. Desde luego, es probable que un modelo polinomial sea una aproximacin razonable de las
variables independientes, pero para una regin relativamente pequea suelen funcionar bastante bien.
El mtodo de los mnimos cuadrados, se usa para estimar los parmetros de los polinomios de
aproximacin. Despus se realiza el anlisis de la superficie de respuesta utilizando la superficie
ajustada. Los parmetros del modelo pueden ser estimarse de manera ms eficiente cuando se emplean
los diseos experimentos adecuados para la recoleccin de datos, a estos diseo se le denominan diseos
de superficie de respuesta.
La metodologa de superficie de respuesta es un procedimiento secuencial. Por ejemplo, cuando se est
en un punto de la superficie que est apartado del ptimo, sobretodo cuando la superficie presenta una
curvatura moderada como el caso dado en la Fig. N 3, en caso el modelo de primer orden es adecuado y
el objetivo en este caso es llevar al experimentador de manera rpida y eficiente por la trayectoria del
mejoramiento hasta la vencidad general del ptimo. Una vez que se ha encontrado la regin del ptimo
se puede emplearse modelo mas elaborado como el de segundo orden y llevarse a cabo para localizar el
ptimo.

Fig. N 3: El carcter secuencial de la Metodologa de superficie de respuesta

Mtodo de ascenso mas pronunciado


El mtodo de ascenso rpido es un procedimiento para moverse secuencialmente por la trayectoria de
ascenso rpido, o sea, en la direccin del mximo incremento de la respuesta. Por supuesto, si lo que se
busca es la minimizacin, entonces se utiliza el mtodo de descenso rpido. El modelo ajustado de
primer orden es:
k

y 0 i xi
i 1

Para este modelo de superficie de respuesta de primer orden, los contornos de y son una serie de lneas
rectas paralelas como se muestra en la siguiente figura:

Fig. N 4: Superficie de respuesta de primer orden y trayectoria de ascenso rpido


La direccin de ascenso rpido es la direccin en la cual y se incrementa ms rpido, esta
direccin es normal a los contornos de la superficie de respuesta ajustada y se toma como trayectoria
de ascenso rpido, la lnea que pasa al centro de la regin de inters y normal a los contornos de la
superficie ajustada. De esta forma, los pasos a lo largo de la trayectoria son proporcionales a los
coeficientes de regresin . El experimentador determina la cantidad real de movimiento a lo largo

de esta trayectoria en base a su conocimiento del proceso u otras consideraciones prcticas.


Los experimentos se realizan a lo largo de la trayectoria de ascenso rpido hasta que ya no
se observa incremento en la respuesta o hasta que la regin de la respuesta deseada se alcanza.
Entonces se usa un nuevo modelo de primer orden, se determina la direccin de una nueva trayectoria de

ascenso rpido y de ser necesario, se realizan experimentos adicionales en esa direccin hasta que el
experimentador sienta que est cerca del ptimo.
Ejemplo N 1: Un ingeniero qumico est interesado en determinar las condiciones de operacin que maximizan
el rendimiento de un proceso. Hay dos variables de control que influyen Tiempo de reaccin y temperatura de
reaccin, el punto de operacin actual es 35 minutos y 155F que da un rendimiento del 40% aproximadamente.
Se hace un diseo experimental variando el tiempo (30 a 40 minutos) y la temperatura (150 a 160F). Por
simplicidad se codifican las variables en el intervalo (-1, 1), mediante el siguiente procedimiento: Sea el factor
con niveles bajo y alto entonces

bajo alto
2

alto bajo

1 si =bajo
1 si = alto

, de esta forma x

2
Si las variables codificadas son x1 y x2 y las variables naturales son 1 y 2 se tiene:

x1

1 35

5
155
x2 2
5
El arreglo y los datos experimentales son:

Corrida
1
2
3
4
5
6
7
8
9

Variables
del Proceso
Tiempo (min.) Temp.(F)
30
150
30
160
40
150
40
160
35
155
35
155
155
35
155
35
155
35

Variables
codificadas
X1
-1
-1
1
1
0
0
0
0
0

X2
-1
1
-1
1
0
0
0
0
0

Rendimiento
Y
39.3
40.0
40.9
41.5
40.3
40.5
40.7
40.2
40.6

Los cinco puntos centrales se usan como rplicas para verificar la adecuacin del modelo de primer orden (con
Pure error).
>
>
>
>

proceso<-read.table("proceso1.txt",T)
library(rsm)
proc1<-coded.data(proceso, x1 ~ (Tiempo - 35)/5, x2 ~ (Temp - 155)/5)
as.data.frame(proc1)
x1 x2
Y
1 -1 -1 39.3
2 -1 1 40.0
3 1 -1 40.9

4
5
6
7
8
9

1
0
0
0
0
0

1
0
0
0
0
0

41.5
40.3
40.5
40.7
40.2
40.6

> proc.rsm<-rsm(Y~FO(x1,x2),data=proc1)
> summary(proc.rsm)
Call:
rsm(formula = Y ~ FO(x1, x2), data = proc1)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 40.444444
0.057288 705.9869 5.451e-16 ***
x1
0.775000
0.085932
9.0188 0.000104 ***
x2
0.325000
0.085932
3.7821 0.009158 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Analysis of Variance Table
Response: Y
FO(x1, x2)
Residuals
Lack of fit
Pure error

Df
2
6
2
4

Sum Sq
2.82500
0.17722
0.00522
0.17200

Mean Sq F value
Pr(>F)
1.41250 47.8213 0.0002057
0.02954
0.00261 0.0607 0.9419341
0.04300

Direction of steepest ascent (at radius 1):


x1
x2
0.9221944 0.3867267
Corresponding increment in original units:
Tiempo
Temp
4.610972 1.933633
> mod2<-lm(Y~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc1)
> summary(aov(mod2))
Df Sum Sq Mean Sq F value Pr(>F)
I(x1)
1 2.4025 2.4025 55.872 0.00171 **
I(x2)
1 0.4225 0.4225
9.826 0.03503 *
I(x1^2)
1 0.0027 0.0027
0.063 0.81374
I(x1):I(x2) 1 0.0025 0.0025
0.058 0.82132
Residuals
4 0.1720 0.0430
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Calculo de los estimados de los coeficientes de regresin:


b0 0 Y 39.3+40.0+40.9+41.5+40.3+40.5+40.7+40.2+40.6 40.44
9
ab b a (1) 41.5-40+40.9-39.3
b1 1

0.775
2k
22

ab b a (1) 41.5 40 40.9 39.3


b2 2

0.325
2k
22

Luego la ecuacin de regresin estimada est dado por:

y 40.44 0.775x1 0.325x2


La suma de cuadrado de regresin se calcula mediante la siguiente frmula:

SCReg SCFO x1 , x2 SCA SCB

ab b a (1)

ab b a (1)

41.5 40 40.9 39.3 41.5 40 40.9 39.3


=
2

4
=2.4025 0.4225

=2.825
CM Reg

SCReg
GLReg

2.825
1.4125
2

Para calcular el cuadrado medio del error puro se calcula de la manera siguiente:

SCError puro

yi y

Puntos Centrales
5

yi 40.46

i 1

0.1720
CM Error puro

SCError puro
GLError puro

0.172
0.043
4

Para calcular la suma de cuadrado de la interaccin AB:


ab a b 1
41.5 40.0 40.9 39.3

4
4
= 0.00.25
2

SC AB

CM AB

SC AB 0.0025

0.0025
GLAB
1

Para calcular la suma de cuadrados de falta de ajuste o curvatura se utiliza el siguiente


procedimiento:

SCFalta de ajuste SCCurvatura pura


nF nC YF YC

nF nC

4 5 0.035

45
0.00272
CM Curvatura pura

SCCurvatura pura
GLCurvatura pura

0.0027
0.0027
1

La suma de cuadrado de los residuos:


SCResiduos SCFalta de ajuste SC AB SCError puro
0.1720 0.0025 0.0272
0.17722
CM Residuos

SCResiduos 0.17722

0.02954
GLResiduos
6

Para probar sobre la contribucin lineal delos factores se considera el siguiente modelo de regresin:

y 0 1x1 2 x2
Luego se prueba la siguiente hiptesis:

H 0 : 1 2 0 contra H1 : 1 0 y/o 2 0
FcReg

CM Reg
CM Residuos

1.4125
47.81652
0.02954

> Fcr<-1.4125/0.02954
> Fcr
[1] 47.81652
> pvalue<-1-pf(Fcr,2,6)
> pvalue
[1] 0.0002057543
Se rechaza H 0 , al menos uno de los factores tiempo de reaccin y temperatura de reaccin contribuyen
a un nivel de significacin del 1% sobre el rendimiento del proceso.

Para probar sobre la contribucin de la interaccin de los factores tiempo de reaccin y temperatura de
reaccin y el efecto de curvatura se considera el siguiente modelo:
2

Y 0 1x1 2 x2 12 x1x2 ii xi2


i 1

Sobre el efecto de interaccin:

H 0 : 12 0 contra H1 : 12 0
FcAB

CM AB
0.0025

0.058
CM Error puro 0.043

> Fcab<-0.0025/0.043
> Fcab
[1] 0.05813953
> pvalue<-1-pf(Fcab,1,4)
> pvalue
[1] 0.8213164

Se acepta H 0 , a un nivel de significacin del 10% no se ha encontrado evidencia estadstica suficiente


para afirmar que de la interaccin de los factores tiempo de reaccin y temperatura de reaccin contribuya
sobre el rendimiento del proceso.
Sobre la curvatura
2

i 1

i 1

H 0 : ii 0 contra H1 : ii 0

FcCurvatura

CM Curvatura pura

> Fccurv<-0.00272/0.043
> Fccurv
[1] 0.06325581
> pvalue<-1-pf(Fccurv,1,4)
> pvalue
[1] 0.8138149

CM Error puro

0.00272
0.063
0.043

Se acepta H 0 , a un nivel de significacin del 10% no se ha encontrado evidencia estadstica suficiente


para afirmar que la suma de los efectos cuadrticos de los factores tiempo de reaccin y temperatura de
reaccin contribuya sobre el rendimiento del proceso.

Para la trayectoria de ascenso ms rpido, se siguen los pasos siguientes:


a) Se elige el tamao de paso de una de las variables del proceso x j . La variable que tiene el
coeficiente en valor absoluto ms alto. En este caso se elige x1 1 .
i
....i 1, 2,.., k ; para..i j
b) El tamao del paso para las otras variables es xi
j / x j
En este caso
2
0.325
x2

0.42

1 / x1 (0.775) /1.0
Para convertir los tamaos de los pasos codificados ( x1 1 y x2 0.42 ) a las unidades naturales de
tiempo y temperatura se tiene:

1
5
2
x2
5
1 x1 (5) 1* 5 5mi.
x1

2 x2 (5) 0.42 * 5 2 F
Tomando el punto correspondiente a (0,0) se realizan experimentos individuales adicionales,
incrementando las variables en los pasos indicados arriba resultando en:

Pasos
Origen

Orig.+
Orig.+2
Orig.+3
Orig.+4
Orig.+5
Orig.+6
Orig.+7
Orig.+8
Orig.+9

Variables Codificadas
X1
X2
0
0
1
0.42
1
0.42
2
0.84
3
1.26
4
1.68
5
2.10
6
2.52
7
2.94
8
3.36
9
3.78

Variables naturales
1
2
35
155
5
2
40
157
45
159
50
161
55
163
60
165
65
169
70
171
75
173
80
175

Respuesta
y

41.0
42.9
47.1
49.7
53.8
59.9
65.0
70.4
77.6

10
11
12

Orig.+10
Orig.+11
Orig.+12

4.20
4.62
5.04

85
90
95

177
179
181

80.3
76.2
75.1

Se observa que el punto dcimo representa el valor mximo de la trayectoria de experimentacin por lo
que ahora se tomar como nuevo punto central (0,0) el punto (85, 175) y la regin de experimentacin
para 1 es (80,90) y para 2 es (170,180), con las variables codificadas X1 y X2 como sigue:
x1
x2

1 85
5

2 175
5

90
80
70
60
50
40
0

6 7

9 10 11 12 Pasos

Fig. N4: Grfica de rendimiento contra pasos en la trayectoria de ascenso ms pronunciado


Haciendo nuevos experimentos alrededor del nuevo punto (0,0) se tiene:
Variables
Variables
del Proceso
codificadas
Corrida Tiempo (min.) Temp.(F)
X1
1
80
170
-1
2
80
180
-1
3
90
170
1
4
90
180
1
5
85
175
0
6
85
175
0

X2
-1
1
-1
1
0
0

Rendimiento
Y1
76.5
77.0
78.0
79.5
79.9
80.3

7
8
9
>
>
>
>
>

85
85
85

175
175
175

0
0
0

0
0
0

80.0
79.7
79.8

proceso2<-read.table("proceso2.txt",T)
library(rsm)
proc2<-coded.data(proceso2, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc2)
summary(mod3)

Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc2)
Residuals:
1
2
3
0.000e+00 -6.939e-18 -7.254e-18
8
9
-2.400e-01 -1.400e-01

4
5
4.889e-18 -4.000e-02

Coefficients: (1 not defined because of


Estimate Std. Error t value
(Intercept) 79.9400
0.1030 776.446
I(x1)
1.0000
0.1151
8.687
I(x2)
0.5000
0.1151
4.344
I(x1^2)
-2.1900
0.1544 -14.181
I(x2^2)
NA
NA
NA
I(x1):I(x2)
0.2500
0.1151
2.172
--Signif. codes: 0 *** 0.001 ** 0.01

6
3.600e-01

7
6.000e-02

singularities)
Pr(>|t|)
1.65e-11 ***
0.000966 ***
0.012217 *
0.000144 ***
NA
0.095611 .
* 0.05 . 0.1 1

Residual standard error: 0.2302 on 4 degrees of freedom


Multiple R-squared: 0.9868,
Adjusted R-squared: 0.9737
F-statistic: 75.04 on 4 and 4 DF, p-value: 0.0005143

El ajuste del modelo de primer orden est dado por:

y 79.94 1.00 x1 0.50 x2


A continuacin se presenta el anlisis de variancia de este modelo incluyendo las verificaciones de la
interaccin y del trmino cuadrtico puro.
> summary(aov(mod3))
Df Sum Sq Mean Sq F value
Pr(>F)
I(x1)
1 4.000
4.000 75.472 0.000966 ***
I(x2)
1 1.000
1.000 18.868 0.012217 *
I(x1^2)
1 10.658 10.658 201.094 0.000144 ***
I(x1):I(x2) 1 0.250
0.250
4.717 0.095611 .
Residuals
4 0.212
0.053
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Para verificar la interaccin de los factores tiempo de reaccin y temperatura de reaccin y el efecto de
curvatura pura contribuye sobre el rendimiento del proceso se considera el siguiente modelo:
2

Y 0 1x1 2 x2 12 x1x2 ii xi2


i 1

Sobre el efecto de interaccin:

H 0 : 12 0 contra H1 : 12 0
Como el Fc = 4.717 y el pvalue =0.095611
La interaccin de los factores tiempo de reaccin y temperatura de reaccin contribuye sobre el rendimiento del
proceso a un nivel de significacin del 10%.

Sobre la curvatura
2

i 1

i 1

H 0 : ii 0 contra H1 : ii 0
Debido a que Fc = 201.094 y el pvalue = 0.000144

Se puede concluir que el efecto de la curvatura contribuye significativamente a un nivel del 0.1% sobre
el rendimiento del proceso.

Anlisis de una superficie de respuesta de segundo orden


En la mayora de los casos, el modelo de segundo orden:

i 1

i 1

y 0 i xi ii xi2 i j ij xi x j

(3)

Es adecuado. En esta seccin se indicar como usar este modelo ajustado para encontrar el conjunto
ptimo de condiciones de operacin para las x, as como para caracterizar la naturaleza de la superficie
de respuesta.
Localizacin del punto estacionario
Suponga que quieren encontrarse los niveles de x1,

, xk que optimizan la respuesta predicha. Este


punto, en caso de existir, ser el conjunto de las x1, , xk para que las derivadas parciales
y x1 y xk 0 . A este punto, por ejemplo x1,s , x2,s , , xk ,s , se le llama punto estacionario. El
punto estacionario podra representar: 1) un punto de respuesta mxima, 2) un punto de respuesta
mnima, o 3) un punto silla.

Fig. N 5: Superficie de respuesta y grfico de contorno que ilustra una superficie con un mximo

Fig. N 6: Superficie de respuesta y grfico de contorno que ilustra una superficie con un mnimo

Fig. N 7: Superficie de respuesta y grfico de contorno que ilustra una superficie con un punto silla (o
minimax).

La grfica de contorno desempea un papel muy importante en el estudio de la superficie de respuesta.


Mediante la generacin de grficas de contornos utilizando software de computadora para el anlisis de
superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la superficie y
localizar el ptimo con precisin razonable.
Es posible obtener una solucin matemtica general para la localizacin del punto estacionario. Al
escribir el modelo de segundo orden en notacin matricial, se tiene

y 0 xb xBx

(4)

donde

1
11 ,
12 2,
x1

x
22 ,

x 2 b 2 B

k
simtrica
k

1k 2

, 2 k 2

kk

Es decir, b es un vector k 1 de los coeficientes de regresin estimados de primer orden y B es una


matriz de la simtrica k k cuyos elementos de la diagonal principal son los coeficientes cuadrticos
puros estimados


ii

y cuyos elementos fuera de la diagonal

son la mitad de los coeficientes

cuadrticos mixtos estimados ij , i j . La derivada de y con respecto a los elementos del vector x
igualada con 0 es
y
b 2Bx 0
x

El punto estacionario es la solucin de la ecuacin, o


1
x s B-1b
2

(5)

Luego, la respuesta predicha se obtiene al sustituir este valor en la ecuacin dada para y :
1
1
1

y s 0 xsb xs Bx s 0 bB 1b bB 1 B B 1b
2
2
2

1 1
1

0 bB 1 b 0 xsb
2 2
2

1
y s 0 xsb
2

(6)

Caracterizacin de la superficie de respuesta


Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la
superficie de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si
el punto estacionario es un punto de una respuesta mxima, mnima o un punto silla. Por lo general
tambin se desea estudiar la sensibilidad relativa de la respuesta a las variables x1, x2 , , xk .
Como ya se seal, la forma ms directa de hacer esto es examinando una grfica de contorno
del modelo ajustado. Si slo hay dos o tres variables en el proceso (las x), la construccin e
interpretacin de esta grfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un
nmero relativamente reducido de variables, un anlisis ms formal, llamado anlisis cannico, puede
ser til.
Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen
en el punto estacionario x, y despus hacer la rotacin de los ejes de este sistema hasta que sean
paralelos a los ejes principales de la superficie de respuesta ajustada. Esta transformacin se ilustra la
Fig. N 8. Puede demostrarse que se obtiene as el modelo ajustado.

y y s 1w12 2 w22
Donde las

wi son

k wk2

(7)

las variables independientes transformadas y las

son constantes. A esta

ecuacin se le llama forma cannica del modelo. Adems, las i son solo los eigemvalores o races
caractersticas de la matriz B .

Fig. N 8: Forma cannica del modelo de segundo orden


La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y
de los signos y magnitudes de las i . Primero suponga que el punto estacionario est dentro de la

regin de exploracin para ajustar el modelo de segundo orden. Si todas las i son positivas, x s es un
punto de respuesta mnima; si todas las i son positivas, x s es un punto de respuesta mxima; y si las

i tienen signos diferentes,

x s es un punto silla. Adems, la superficie presenta una inclinacin mayor

en la direccin wi para la que x s es un mximo. Por ejemplo, la Fig. N 9 describe un sistema para el
que x s es un mximo ( 1 y 2 son negativas) con 1 2 .
Ejemplo N 2
Con los datos del ejemplo del proceso qumico no posible ajustar un modelo de segundo orden en
trminos de las variables x1 y x2 , por esta razn el experimentador decide aumentar este diseo con
puntos suficientes para ajustar un modelo de segundo orden. Obtiene cuatro observaciones en ( x1 0 ,

x2 1.414 ) y ( x1 1.414 , x2 0 ). El experimento completo se muestra en la siguiente tabla:


Variables
Variables
del Proceso
codificadas
Corrida Tiempo (min.) Temp.(F)
X1
1
80
170
-1
2
80
180
-1
3
90
170
1
4
90
180
1
5
85
175
0
6
85
175
0
175
7
85
0
8
85
175
0
9
85
175
0
10
92.07
175
1.414
11
77.93
175
-1.414
12
85
182.07
0
13
85
167.93
0

X2
-1
1
-1
1
0
0
0
0
0
0
0
1.414
-1.414

Rendimiento
Y2
76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0

El diseo del experimento se ilustra en la Fig. N 9. A este diseo se le llama diseo central compuesto
(o DCC), el cual se estudiar con mayor detalle ms adelante.

Fig. N 9: Diseo Central Compuesto en las variables codificadas del ejemplo


Para realizar el anlisis se asume el siguiente modelo:
y 0 1 x1 2 x2 11 x12 22 x22 12 x1 x2
> proceso3<-read.table("proceso3.txt",T)
> library(rsm)
> proc3<-coded.data(proceso3, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
> proc3
Tiempo
1
80.00
2
80.00
3
90.00
4
90.00
5
85.00
6
85.00
7
85.00
8
85.00
9
85.00
10 92.07
11 77.93
12 85.00
13 85.00

Temp
170.00
180.00
170.00
180.00
175.00
175.00
175.00
175.00
175.00
175.00
175.00
182.07
167.93

Y1
76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0

Data are stored in coded form using these coding formulas ...
x1 ~ (Tiempo - 85)/5
x2 ~ (Temp - 175)/5
> proc3.rsm<-rsm(Y1~SO(x1,x2),data=proc3)
> summary(proc3.rsm)

Call:
rsm(formula = Y1 ~ SO(x1, x2), data = proc3)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.939955
0.119089 671.2644 < 2.2e-16 ***
x1
0.995050
0.094155 10.5682 1.484e-05 ***
x2
0.515203
0.094155
5.4719 0.000934 ***
x1:x2
0.250000
0.133145
1.8777 0.102519
x1^2
-1.376449
0.100984 -13.6303 2.693e-06 ***
x2^2
-1.001336
0.100984 -9.9158 2.262e-05 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Analysis of Variance Table
Response: Y1
FO(x1, x2)
TWI(x1, x2)
PQ(x1, x2)
Residuals
Lack of fit
Pure error

Df Sum Sq Mean Sq F value


Pr(>F)
2 10.0430 5.0215 70.8143 2.267e-05
1 0.2500 0.2500
3.5256
0.1025
2 17.9537 8.9769 126.5944 3.194e-06
7 0.4964 0.0709
3 0.2844 0.0948
1.7885
0.2886
4 0.2120 0.0530

Stationary point of response surface:


x1
x2
0.3892304 0.3058466
Stationary point in original units:
Tiempo
Temp
86.94615 176.52923
Eigenanalysis:
$values
[1] -0.9634986 -1.4142867
$vectors
[,1]
[,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174 [1] -0.9634986 -1.4142867
$vectors
[,1]
[,2]
x1 -0.2897174 -0.9571122
x2 -0.9571122 0.2897174
> mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc3)
> summary(mod3)
Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc3)
Residuals:
Min
1Q
Median
-0.23995 -0.18089 -0.03995

3Q
0.17758

Max
0.36005

Coefficients:
Estimate Std. Error t value
(Intercept) 79.93995
0.11909 671.264
I(x1)
0.99505
0.09415 10.568
I(x2)
0.51520
0.09415
5.472
I(x1^2)
-1.37645
0.10098 -13.630
I(x2^2)
-1.00134
0.10098 -9.916
I(x1):I(x2) 0.25000
0.13315
1.878
--Signif. codes: 0 *** 0.001 ** 0.01

Pr(>|t|)
< 2e-16
1.48e-05
0.000934
2.69e-06
2.26e-05
0.102519

***
***
***
***
***

* 0.05 . 0.1 1

Residual standard error: 0.2663 on 7 degrees of freedom


Multiple R-squared: 0.9827,
Adjusted R-squared: 0.9704
F-statistic: 79.67 on 5 and 7 DF, p-value: 5.147e-06

Por lo tanto, la ecuacin de regresin estimada queda como:

y 79.93995 0.99505x1 0.51520 x2 1.3764 x12 1.00134 x22 0.25x1x2


La localizacin del punto estacionario tambin podra encontrarse utilizando la solucin general dada en
la ecuacin (5). Observe que

0.995
1.376 0.1250
, B
b

0.515
0.1250 1.001
1

1 1.376 0.125 0.995


1 0.73508299 0.09179358 0.995
xs

2 0.125 1.001 0.515


2 0.09179358 1.01046373 0.515
0.3893406
xs

0.3058617
Es decir x1,s 0.3893406 y xs ,2 0.3893406 , en trmino de las variables naturales, se tiene:
0.3893406=

1 85
5

y 0.3893406=

2 175
5

, luego 1 86.9467 y 2 176.5293

Fig N 10: Grfica de contorno y superficie de respuesta de la variable respuesta rendimiento

Este valor est muy cerca del punto estacionario que se encontr por examen visual de la grfica de
contorno presentada en la figura 10 a). Al utilizar la ecuacin (6), la respuesta predicha en el punto
estacionario puede encontrarse que
0.995
1
1
y s 0 xs b 79.93995 0.3893406 0.3058617
80.48
2
2
0.515

Diseos experimentales para ajustar superficies de respuesta.


El ajuste y anlisis de una superficie de respuesta se facilita con la eleccin apropiada de un diseo
experimental.
Un diseo es el conjunto especfico de combinaciones de los niveles de las k variables que se utilizar al
llevar a cabo el experimento.

2.7.1 Diseos para ajustar modelos de primer orden.


Una clase nica de diseos que minimizan la varianza de los coeficientes de regresin i

son los

diseos ortogonales de primer orden. Por ortogonal se entiende que los elementos fuera de la diagonal
de la matriz xx son iguales a cero, lo cual implica que los productos cruzados de las columnas de la
matriz x es igual a cero.
En esta clase de diseos ortogonales de primer orden se incluyen:
1. Diseos factoriales 2k
2. Fracciones de la serie 2k
3. Diseos simplex
4. Diseos Placket-Burman
Diseos factoriales 2k
En este diseo los k factores se codifican a los niveles estandarizados 1. El diseo no permite la
estimacin del error experimental a menos que se repitan los experimentos, para lograr esto se aumenta
el diseo con observaciones en el centro. La adicin de los puntos centrales no tiene influencia sobre las
para i I , pero la estimacin de es el promedio general de todas las observaciones.

Fracciones de la serie 2k
En programas experimentales se tienen dos razones para no llevar a cabo las 2k combinaciones de un
arreglo factorial completo:

1. A medida que el nmero k de factores incrementa crece rpidamente el nmero de


combinaciones de niveles, hacindose muy grande.
2. Slo los primeros k+1 trminos del modelo definen la ecuacin de un hiperplano. Los restantes
2k (k+1) trminos, consistentes en productos cruzados son una medida de la distorsin del
hiperplano.
Como el nombre de este diseo lo indica es una fraccin de un diseo 2k. La fraccin se denota
como 2k-1 y contiene la mitad de las combinaciones de un 2 k mientras que la fraccin se denota como
2-1-2 y contiene la cuarta parte de las combinaciones de un 2k. Las fracciones deben tener suficientes
puntos para estimar los k+1 coeficientes.
Cabe sealar que al usar un diseo 2k-1 no podemos medir la posible falta de ajuste del modelo, a menos
que se cuente con una estimacin de la varianza del error haciendo rplicas del punto central; adems, si
el trmino xixjxl realmente existe sesga la estimacin del efecto principal asociado con xk.

Diseo simplex
En este diseo los puntos se localizan en los vrtices de una figura regular, sta tiene k+1 vrtices y est
en k dimensiones. Para k=2 la figura geomtrica es un tringulo equiltero y para k=3 es un tetraedro.
Como el nmero de puntos es igual al nmero de coeficientes del modelo se recomienda adicionar
rplicas en el punto central para que sea posible obtener la varianza del error y/o llevar a cabo la prueba
de falta de ajuste.
Diseos de Plakett-Burman
Caractersticas
Son diseos factoriales fraccionados de 2 niveles de resolucin III, que se utilizan frecuentemente para
estudiar efectos principales.
Este modelo no tiene completa la confusin de losefectos, en su lugar cada efecto principal se confunde
parcialmente con todas las interacciones
Sirven para estudiar k=N-1 variables en N corridas, donde N es un mltiplo de 4.
Puesto que estos diseos no pueden representarse como cubos, en ocasiones se les llama diseos no
geomtricos.

Tabla 2.7 Comparacin de los diseos ortogonales de primer orden


DISEO
Factoriales 2k

N DE PUNTOS
n=2k

VENTAJA

DESVENTAJA
Requiere observaciones
en el centro

Fracciones de la Serie n= 1 2 de 2k
2k
n= 1 4 de 2k

simplex
Plackett-Burman

Contiene menos
combinaciones que un
2k

La estimacin de 0 es
el promedio general de
todas las observaciones.
Requiere observaciones
en el centro
Si el trmino xixjxl existe
sesga la estimacin del
efecto principal
asociado con xk.

n=k+1
n=k+1, n es un mltiplo Los coeficientes se
de 4.
estiman con mxima
precisin.

Diseos para ajustar modelos de segundo orden.


Un diseo experimental para ajustar un modelo de segundo orden debe tener al menos tres niveles de
cada factor (-1, 0, +1). As como en el diseo de primer orden se desea la ortogonalidad, en ste se desea
que sea un diseo rotable. Se dice que un diseo es rotable cuando la varianza de la respuesta predicha
en algn punto es funcin slo de la distancia del punto al centro y no es una funcin de la direccin.
La rotabilidad es una propiedad importante, dado que la finalidad de la Metodologa de Superficies de
Respuesta es optimizar y desconocemos la localizacin del ptimo, tiene sentido utilizar un diseo que
proporcione estimaciones precisas en todas direcciones.
Dentro de los diseos rotables de segundo orden se incluyen:
1. Diseo central compuesto
2. Diseo equirradial
3. Diseos Box-Behnken

Diseo central compuesto


Este diseo consiste en un factorial o factorial fraccionado 2k, donde los factores son codificados de tal
manera que el centro sea (0,0,...,0), aumentado por 2k puntos axiales (,0, 0,..., 0), (0, ,0,..., 0),
(0, 0, y nc puntos centrales (0,0,...,0). De acuerdo a Montgomery [6] 1991 este
diseo es probablemente el ms usado.
Este diseo se convierte en rotable mediante la eleccin de , sta se calcula de la siguiente manera
(Montgomery [6] 1991):

nf

Donde nf es el nmero de puntos usados en la porcin factorial del diseo. Por ejemplo el diseo central
compuesto dado en el ejemplo 2 donde nf=4, entonces n f 4 4 1.414
1

Otra propiedad til del diseo es que puede crecer a partir de un diseo 2k de primer orden, agregando
puntos axiales y quiz algunos puntos centrales (Montgomery [6] (1991)). Con la eleccin del nmero
de puntos centrales (n0), el diseo puede hacerse ortogonal o se puede transformar en uno de precisin
uniforme.
En un diseo de precisin, la varianza de la respuesta predicha en el origen es igual a la predicha a una
distancia unitaria del origen. Este proporciona mayor proteccin que el ortogonal contra el sesgo de los
coeficientes, debido a la presencia de trminos de tercer y mayor orden.
Diseo equirradial.
Este diseo consiste en puntos igualmente espaciados sobre una circunferencia o una esfera. Para k=2, el
diseo se obtiene combinando n2 5 puntos igualmente espaciados sobre una circunferencia con n1 1
puntos en su centro. El pentgono y el hexgono son tiles en este caso. Para k=3, los nicos arreglos
que cuentan con puntos suficientes para estimar todos los parmetros son el icosaedro y el dodecaedro.
Segn Montgomery [6] (1991), este diseo es ocasionalmente til en problemas con dos o tres variables.
Diseo Box-Behnken.
Estos diseos se forman combinando factoriales 2k con diseos de bloques incompletos. Los diseos
resultantes suelen ser ms eficientes en trminos del nmero de corridas requerido. Adems, son rotables
(o casi rotables) y hace la estimacin de los coeficientes de primer y segundo orden ms eficiente.

Potrebbero piacerti anche