Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
E Y x1,
, xk f x1,
, xk
De modo que la variable respuesta puede ser expresada mediante el siguiente modelo:
Y
Y f x1, , xk
donde es el error observado en la respuesta.
La relacin f x1, , xk existente entre y los niveles de los k factores puede representarse a travs
de una hipersuperficie (subconjunto de un espacio eucldeano (k+1)-dimensional) a la que llamaremos
superficie de respuesta
Grfica de Superficie de Respuesta y de Contorno
Una tcnica utilizada para ayudar a visualizar la forma que puede tener una superficie de respuesta
tridimensional consiste en representar la grfica de contornos de la superficie, en la que se trazan las
denominadas lneas de contorno, que son curvas correspondientes a valores constantes de la respuesta
sobre el plano X1X2 (plano cuyos ejes coordenados vienen dados por los niveles x1 y x2 de los factores).
Geomtricamente, cada lnea de contorno es una proyeccin sobre el plano X1X2 de una seccin de la
superficie de respuesta al intersecar con un plano paralelo al X1X2. La grfica de contornos resulta til
para estudiar los niveles de los factores en los que se da un cambio en la forma o altura de la superficie
de respuesta.
La existencia de grficas de contorno no est limitada a 3 dimensiones a pesar de que en el caso en que
haya ms de 3 factores de influencia no es posible la representacin geomtrica. No obstante, el hecho
de poder representar grficas de contorno para problemas en que haya 2 o 3 factores permite visualizar
ms fcilmente la situacin general.
Ejemplo N 1: Un agricultor desea maximizar su produccin de almendras (medida en Kg./Ha) en
funcin de las cantidades (medidas en Kg./Ha) de dos tipos de fertilizantes: A y B, que utiliza. Una
superficie de respuesta para la produccin de almendra viene dada por la siguiente grfica
Fig. N 2: Seccin de la superficie de respuesta por planos paralelos al plano X1 X2 en los valores
esperados de produccin: 11.5, 12.1, 12.7, 13.3, 13.9
Cada lnea de contorno representa un nmero infinito de combinaciones de las cantidades de los dos
fertilizantes, para las producciones de almendras esperadas consideradas. La produccin mxima, que es
de 14.12 Kg./Ha. se localiza en el centro de la elipse ms pequea y corresponde a los niveles X1=170.06
del fertilizante A y X2=246.65 del fertilizante B.
Fig. N 3: Grfica de contorno de la superficie de respuesta con lneas de contorno correspondiente a los
valores esperados de produccin: 11.5, 12.1, 12.7, 13.3, 13.9
La grfica de contornos correspondiente a la superficie de respuesta del ejemplo considerado indicara
que tiene la forma de lomo o colina.
Al planificar el experimento que permitir llevar a cabo el estudio acerca del efecto de los factores sobre
la variable respuesta, el primer paso es la eleccin de los factores que se usarn en este experimento.
Una vez determinado, el siguiente paso es seleccionar los rangos de los valores de cada factor que se
considerarn, pero aunque en el experimento es posible explorar la regin correspondiente al espacio
completo de los factores de influencia o regin operativa, lo ms frecuente consiste en explorar
nicamente una regin de inters limitada, la regin experimental, contenida en la regin general. De
este modo, durante la ejecucin del experimento, slo se utilizarn niveles de los factores
correspondientes a valores que caigan en esta regin, a menos que se descubran, durante el conjunto
inicial del experimento, que pueda ser necesario explorar niveles que estn mas all de los lmites de la
regin considerada.
Superficie de respuestas polinmicas. Modelos de primer y segundo orden
El objetivo principal de la metodologa de superficie de respuesta es determinar aproximadamente una
funcin f., con tal objetivo se propone generalmente un modelo polinmico con k factores 1, , k .
Luego, comnmente se emplea un polinomio de orden inferior en alguna regin de las variables
independientes. Si la respuesta est bien modelada por una funcin lineal de las variables
independientes, entonces la funcin de aproximacin es el modelo de primer orden
y 0 1x1
k xk
(1)
Si se encuentra que existe curvatura en el sitema, entonces debe usarse un polinomio de orden superior,
tal como el modelo de segundo orden
k
i 1
i 1
y 0 i xi ii xi2 i j ij xi x j
(2)
En casi todos los problemas de metodologa de superficie de respuesta usa uno de estos modelos, o
ambos. Desde luego, es probable que un modelo polinomial sea una aproximacin razonable de las
variables independientes, pero para una regin relativamente pequea suelen funcionar bastante bien.
El mtodo de los mnimos cuadrados, se usa para estimar los parmetros de los polinomios de
aproximacin. Despus se realiza el anlisis de la superficie de respuesta utilizando la superficie
ajustada. Los parmetros del modelo pueden ser estimarse de manera ms eficiente cuando se emplean
los diseos experimentos adecuados para la recoleccin de datos, a estos diseo se le denominan diseos
de superficie de respuesta.
La metodologa de superficie de respuesta es un procedimiento secuencial. Por ejemplo, cuando se est
en un punto de la superficie que est apartado del ptimo, sobretodo cuando la superficie presenta una
curvatura moderada como el caso dado en la Fig. N 3, en caso el modelo de primer orden es adecuado y
el objetivo en este caso es llevar al experimentador de manera rpida y eficiente por la trayectoria del
mejoramiento hasta la vencidad general del ptimo. Una vez que se ha encontrado la regin del ptimo
se puede emplearse modelo mas elaborado como el de segundo orden y llevarse a cabo para localizar el
ptimo.
y 0 i xi
i 1
Para este modelo de superficie de respuesta de primer orden, los contornos de y son una serie de lneas
rectas paralelas como se muestra en la siguiente figura:
ascenso rpido y de ser necesario, se realizan experimentos adicionales en esa direccin hasta que el
experimentador sienta que est cerca del ptimo.
Ejemplo N 1: Un ingeniero qumico est interesado en determinar las condiciones de operacin que maximizan
el rendimiento de un proceso. Hay dos variables de control que influyen Tiempo de reaccin y temperatura de
reaccin, el punto de operacin actual es 35 minutos y 155F que da un rendimiento del 40% aproximadamente.
Se hace un diseo experimental variando el tiempo (30 a 40 minutos) y la temperatura (150 a 160F). Por
simplicidad se codifican las variables en el intervalo (-1, 1), mediante el siguiente procedimiento: Sea el factor
con niveles bajo y alto entonces
bajo alto
2
alto bajo
1 si =bajo
1 si = alto
, de esta forma x
2
Si las variables codificadas son x1 y x2 y las variables naturales son 1 y 2 se tiene:
x1
1 35
5
155
x2 2
5
El arreglo y los datos experimentales son:
Corrida
1
2
3
4
5
6
7
8
9
Variables
del Proceso
Tiempo (min.) Temp.(F)
30
150
30
160
40
150
40
160
35
155
35
155
155
35
155
35
155
35
Variables
codificadas
X1
-1
-1
1
1
0
0
0
0
0
X2
-1
1
-1
1
0
0
0
0
0
Rendimiento
Y
39.3
40.0
40.9
41.5
40.3
40.5
40.7
40.2
40.6
Los cinco puntos centrales se usan como rplicas para verificar la adecuacin del modelo de primer orden (con
Pure error).
>
>
>
>
proceso<-read.table("proceso1.txt",T)
library(rsm)
proc1<-coded.data(proceso, x1 ~ (Tiempo - 35)/5, x2 ~ (Temp - 155)/5)
as.data.frame(proc1)
x1 x2
Y
1 -1 -1 39.3
2 -1 1 40.0
3 1 -1 40.9
4
5
6
7
8
9
1
0
0
0
0
0
1
0
0
0
0
0
41.5
40.3
40.5
40.7
40.2
40.6
> proc.rsm<-rsm(Y~FO(x1,x2),data=proc1)
> summary(proc.rsm)
Call:
rsm(formula = Y ~ FO(x1, x2), data = proc1)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 40.444444
0.057288 705.9869 5.451e-16 ***
x1
0.775000
0.085932
9.0188 0.000104 ***
x2
0.325000
0.085932
3.7821 0.009158 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Analysis of Variance Table
Response: Y
FO(x1, x2)
Residuals
Lack of fit
Pure error
Df
2
6
2
4
Sum Sq
2.82500
0.17722
0.00522
0.17200
Mean Sq F value
Pr(>F)
1.41250 47.8213 0.0002057
0.02954
0.00261 0.0607 0.9419341
0.04300
0.775
2k
22
0.325
2k
22
ab b a (1)
ab b a (1)
4
=2.4025 0.4225
=2.825
CM Reg
SCReg
GLReg
2.825
1.4125
2
Para calcular el cuadrado medio del error puro se calcula de la manera siguiente:
SCError puro
yi y
Puntos Centrales
5
yi 40.46
i 1
0.1720
CM Error puro
SCError puro
GLError puro
0.172
0.043
4
4
4
= 0.00.25
2
SC AB
CM AB
SC AB 0.0025
0.0025
GLAB
1
nF nC
4 5 0.035
45
0.00272
CM Curvatura pura
SCCurvatura pura
GLCurvatura pura
0.0027
0.0027
1
SCResiduos 0.17722
0.02954
GLResiduos
6
Para probar sobre la contribucin lineal delos factores se considera el siguiente modelo de regresin:
y 0 1x1 2 x2
Luego se prueba la siguiente hiptesis:
H 0 : 1 2 0 contra H1 : 1 0 y/o 2 0
FcReg
CM Reg
CM Residuos
1.4125
47.81652
0.02954
> Fcr<-1.4125/0.02954
> Fcr
[1] 47.81652
> pvalue<-1-pf(Fcr,2,6)
> pvalue
[1] 0.0002057543
Se rechaza H 0 , al menos uno de los factores tiempo de reaccin y temperatura de reaccin contribuyen
a un nivel de significacin del 1% sobre el rendimiento del proceso.
Para probar sobre la contribucin de la interaccin de los factores tiempo de reaccin y temperatura de
reaccin y el efecto de curvatura se considera el siguiente modelo:
2
H 0 : 12 0 contra H1 : 12 0
FcAB
CM AB
0.0025
0.058
CM Error puro 0.043
> Fcab<-0.0025/0.043
> Fcab
[1] 0.05813953
> pvalue<-1-pf(Fcab,1,4)
> pvalue
[1] 0.8213164
i 1
i 1
H 0 : ii 0 contra H1 : ii 0
FcCurvatura
CM Curvatura pura
> Fccurv<-0.00272/0.043
> Fccurv
[1] 0.06325581
> pvalue<-1-pf(Fccurv,1,4)
> pvalue
[1] 0.8138149
CM Error puro
0.00272
0.063
0.043
0.42
1 / x1 (0.775) /1.0
Para convertir los tamaos de los pasos codificados ( x1 1 y x2 0.42 ) a las unidades naturales de
tiempo y temperatura se tiene:
1
5
2
x2
5
1 x1 (5) 1* 5 5mi.
x1
2 x2 (5) 0.42 * 5 2 F
Tomando el punto correspondiente a (0,0) se realizan experimentos individuales adicionales,
incrementando las variables en los pasos indicados arriba resultando en:
Pasos
Origen
Orig.+
Orig.+2
Orig.+3
Orig.+4
Orig.+5
Orig.+6
Orig.+7
Orig.+8
Orig.+9
Variables Codificadas
X1
X2
0
0
1
0.42
1
0.42
2
0.84
3
1.26
4
1.68
5
2.10
6
2.52
7
2.94
8
3.36
9
3.78
Variables naturales
1
2
35
155
5
2
40
157
45
159
50
161
55
163
60
165
65
169
70
171
75
173
80
175
Respuesta
y
41.0
42.9
47.1
49.7
53.8
59.9
65.0
70.4
77.6
10
11
12
Orig.+10
Orig.+11
Orig.+12
4.20
4.62
5.04
85
90
95
177
179
181
80.3
76.2
75.1
Se observa que el punto dcimo representa el valor mximo de la trayectoria de experimentacin por lo
que ahora se tomar como nuevo punto central (0,0) el punto (85, 175) y la regin de experimentacin
para 1 es (80,90) y para 2 es (170,180), con las variables codificadas X1 y X2 como sigue:
x1
x2
1 85
5
2 175
5
90
80
70
60
50
40
0
6 7
9 10 11 12 Pasos
X2
-1
1
-1
1
0
0
Rendimiento
Y1
76.5
77.0
78.0
79.5
79.9
80.3
7
8
9
>
>
>
>
>
85
85
85
175
175
175
0
0
0
0
0
0
80.0
79.7
79.8
proceso2<-read.table("proceso2.txt",T)
library(rsm)
proc2<-coded.data(proceso2, x1 ~ (Tiempo - 85)/5, x2 ~ (Temp - 175)/5)
mod3<-lm(Y1~I(x1)+I(x2)+I(x1^2)+I(x2^2)+I(x1)*I(x2),proc2)
summary(mod3)
Call:
lm(formula = Y1 ~ I(x1) + I(x2) + I(x1^2) + I(x2^2) + I(x1) *
I(x2), data = proc2)
Residuals:
1
2
3
0.000e+00 -6.939e-18 -7.254e-18
8
9
-2.400e-01 -1.400e-01
4
5
4.889e-18 -4.000e-02
6
3.600e-01
7
6.000e-02
singularities)
Pr(>|t|)
1.65e-11 ***
0.000966 ***
0.012217 *
0.000144 ***
NA
0.095611 .
* 0.05 . 0.1 1
Para verificar la interaccin de los factores tiempo de reaccin y temperatura de reaccin y el efecto de
curvatura pura contribuye sobre el rendimiento del proceso se considera el siguiente modelo:
2
H 0 : 12 0 contra H1 : 12 0
Como el Fc = 4.717 y el pvalue =0.095611
La interaccin de los factores tiempo de reaccin y temperatura de reaccin contribuye sobre el rendimiento del
proceso a un nivel de significacin del 10%.
Sobre la curvatura
2
i 1
i 1
H 0 : ii 0 contra H1 : ii 0
Debido a que Fc = 201.094 y el pvalue = 0.000144
Se puede concluir que el efecto de la curvatura contribuye significativamente a un nivel del 0.1% sobre
el rendimiento del proceso.
i 1
i 1
y 0 i xi ii xi2 i j ij xi x j
(3)
Es adecuado. En esta seccin se indicar como usar este modelo ajustado para encontrar el conjunto
ptimo de condiciones de operacin para las x, as como para caracterizar la naturaleza de la superficie
de respuesta.
Localizacin del punto estacionario
Suponga que quieren encontrarse los niveles de x1,
Fig. N 5: Superficie de respuesta y grfico de contorno que ilustra una superficie con un mximo
Fig. N 6: Superficie de respuesta y grfico de contorno que ilustra una superficie con un mnimo
Fig. N 7: Superficie de respuesta y grfico de contorno que ilustra una superficie con un punto silla (o
minimax).
y 0 xb xBx
(4)
donde
1
11 ,
12 2,
x1
x
22 ,
x 2 b 2 B
k
simtrica
k
1k 2
, 2 k 2
kk
ii
cuadrticos mixtos estimados ij , i j . La derivada de y con respecto a los elementos del vector x
igualada con 0 es
y
b 2Bx 0
x
(5)
Luego, la respuesta predicha se obtiene al sustituir este valor en la ecuacin dada para y :
1
1
1
y s 0 xsb xs Bx s 0 bB 1b bB 1 B B 1b
2
2
2
1 1
1
0 bB 1 b 0 xsb
2 2
2
1
y s 0 xsb
2
(6)
y y s 1w12 2 w22
Donde las
wi son
k wk2
(7)
ecuacin se le llama forma cannica del modelo. Adems, las i son solo los eigemvalores o races
caractersticas de la matriz B .
regin de exploracin para ajustar el modelo de segundo orden. Si todas las i son positivas, x s es un
punto de respuesta mnima; si todas las i son positivas, x s es un punto de respuesta mxima; y si las
en la direccin wi para la que x s es un mximo. Por ejemplo, la Fig. N 9 describe un sistema para el
que x s es un mximo ( 1 y 2 son negativas) con 1 2 .
Ejemplo N 2
Con los datos del ejemplo del proceso qumico no posible ajustar un modelo de segundo orden en
trminos de las variables x1 y x2 , por esta razn el experimentador decide aumentar este diseo con
puntos suficientes para ajustar un modelo de segundo orden. Obtiene cuatro observaciones en ( x1 0 ,
X2
-1
1
-1
1
0
0
0
0
0
0
0
1.414
-1.414
Rendimiento
Y2
76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0
El diseo del experimento se ilustra en la Fig. N 9. A este diseo se le llama diseo central compuesto
(o DCC), el cual se estudiar con mayor detalle ms adelante.
Temp
170.00
180.00
170.00
180.00
175.00
175.00
175.00
175.00
175.00
175.00
175.00
182.07
167.93
Y1
76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0
Data are stored in coded form using these coding formulas ...
x1 ~ (Tiempo - 85)/5
x2 ~ (Temp - 175)/5
> proc3.rsm<-rsm(Y1~SO(x1,x2),data=proc3)
> summary(proc3.rsm)
Call:
rsm(formula = Y1 ~ SO(x1, x2), data = proc3)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 79.939955
0.119089 671.2644 < 2.2e-16 ***
x1
0.995050
0.094155 10.5682 1.484e-05 ***
x2
0.515203
0.094155
5.4719 0.000934 ***
x1:x2
0.250000
0.133145
1.8777 0.102519
x1^2
-1.376449
0.100984 -13.6303 2.693e-06 ***
x2^2
-1.001336
0.100984 -9.9158 2.262e-05 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Analysis of Variance Table
Response: Y1
FO(x1, x2)
TWI(x1, x2)
PQ(x1, x2)
Residuals
Lack of fit
Pure error
3Q
0.17758
Max
0.36005
Coefficients:
Estimate Std. Error t value
(Intercept) 79.93995
0.11909 671.264
I(x1)
0.99505
0.09415 10.568
I(x2)
0.51520
0.09415
5.472
I(x1^2)
-1.37645
0.10098 -13.630
I(x2^2)
-1.00134
0.10098 -9.916
I(x1):I(x2) 0.25000
0.13315
1.878
--Signif. codes: 0 *** 0.001 ** 0.01
Pr(>|t|)
< 2e-16
1.48e-05
0.000934
2.69e-06
2.26e-05
0.102519
***
***
***
***
***
* 0.05 . 0.1 1
0.995
1.376 0.1250
, B
b
0.515
0.1250 1.001
1
0.3058617
Es decir x1,s 0.3893406 y xs ,2 0.3893406 , en trmino de las variables naturales, se tiene:
0.3893406=
1 85
5
y 0.3893406=
2 175
5
Este valor est muy cerca del punto estacionario que se encontr por examen visual de la grfica de
contorno presentada en la figura 10 a). Al utilizar la ecuacin (6), la respuesta predicha en el punto
estacionario puede encontrarse que
0.995
1
1
y s 0 xs b 79.93995 0.3893406 0.3058617
80.48
2
2
0.515
son los
diseos ortogonales de primer orden. Por ortogonal se entiende que los elementos fuera de la diagonal
de la matriz xx son iguales a cero, lo cual implica que los productos cruzados de las columnas de la
matriz x es igual a cero.
En esta clase de diseos ortogonales de primer orden se incluyen:
1. Diseos factoriales 2k
2. Fracciones de la serie 2k
3. Diseos simplex
4. Diseos Placket-Burman
Diseos factoriales 2k
En este diseo los k factores se codifican a los niveles estandarizados 1. El diseo no permite la
estimacin del error experimental a menos que se repitan los experimentos, para lograr esto se aumenta
el diseo con observaciones en el centro. La adicin de los puntos centrales no tiene influencia sobre las
para i I , pero la estimacin de es el promedio general de todas las observaciones.
Fracciones de la serie 2k
En programas experimentales se tienen dos razones para no llevar a cabo las 2k combinaciones de un
arreglo factorial completo:
Diseo simplex
En este diseo los puntos se localizan en los vrtices de una figura regular, sta tiene k+1 vrtices y est
en k dimensiones. Para k=2 la figura geomtrica es un tringulo equiltero y para k=3 es un tetraedro.
Como el nmero de puntos es igual al nmero de coeficientes del modelo se recomienda adicionar
rplicas en el punto central para que sea posible obtener la varianza del error y/o llevar a cabo la prueba
de falta de ajuste.
Diseos de Plakett-Burman
Caractersticas
Son diseos factoriales fraccionados de 2 niveles de resolucin III, que se utilizan frecuentemente para
estudiar efectos principales.
Este modelo no tiene completa la confusin de losefectos, en su lugar cada efecto principal se confunde
parcialmente con todas las interacciones
Sirven para estudiar k=N-1 variables en N corridas, donde N es un mltiplo de 4.
Puesto que estos diseos no pueden representarse como cubos, en ocasiones se les llama diseos no
geomtricos.
N DE PUNTOS
n=2k
VENTAJA
DESVENTAJA
Requiere observaciones
en el centro
Fracciones de la Serie n= 1 2 de 2k
2k
n= 1 4 de 2k
simplex
Plackett-Burman
Contiene menos
combinaciones que un
2k
La estimacin de 0 es
el promedio general de
todas las observaciones.
Requiere observaciones
en el centro
Si el trmino xixjxl existe
sesga la estimacin del
efecto principal
asociado con xk.
n=k+1
n=k+1, n es un mltiplo Los coeficientes se
de 4.
estiman con mxima
precisin.
nf
Donde nf es el nmero de puntos usados en la porcin factorial del diseo. Por ejemplo el diseo central
compuesto dado en el ejemplo 2 donde nf=4, entonces n f 4 4 1.414
1
Otra propiedad til del diseo es que puede crecer a partir de un diseo 2k de primer orden, agregando
puntos axiales y quiz algunos puntos centrales (Montgomery [6] (1991)). Con la eleccin del nmero
de puntos centrales (n0), el diseo puede hacerse ortogonal o se puede transformar en uno de precisin
uniforme.
En un diseo de precisin, la varianza de la respuesta predicha en el origen es igual a la predicha a una
distancia unitaria del origen. Este proporciona mayor proteccin que el ortogonal contra el sesgo de los
coeficientes, debido a la presencia de trminos de tercer y mayor orden.
Diseo equirradial.
Este diseo consiste en puntos igualmente espaciados sobre una circunferencia o una esfera. Para k=2, el
diseo se obtiene combinando n2 5 puntos igualmente espaciados sobre una circunferencia con n1 1
puntos en su centro. El pentgono y el hexgono son tiles en este caso. Para k=3, los nicos arreglos
que cuentan con puntos suficientes para estimar todos los parmetros son el icosaedro y el dodecaedro.
Segn Montgomery [6] (1991), este diseo es ocasionalmente til en problemas con dos o tres variables.
Diseo Box-Behnken.
Estos diseos se forman combinando factoriales 2k con diseos de bloques incompletos. Los diseos
resultantes suelen ser ms eficientes en trminos del nmero de corridas requerido. Adems, son rotables
(o casi rotables) y hace la estimacin de los coeficientes de primer y segundo orden ms eficiente.