Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
3.1 Introducción
Cuando se desea estudiar un proceso, a dos niveles por cada uno de k factores,
la experimentación debe incluir la combinación de todas las 2k combinaciones. Para
este propósito, los diseños factoriales son los más eficientes. Este diseño también nos
permite explorar una zona escogida del dominio experimental y encontrar una
dirección prometedora para la optimización posterior
53
principales significativos, y no interacciones, siendo éstas útimas asumidas como de
magnitud menos importante.
Donde:
N 2k .r
k= número de variables;
N= número total de experimentos.
r= número de repeticiones
54
Ejemplo 1:
2
R(%) 100 20 pH 0,5R 12 4,52 R 2 3 ALEATORIO () 1
A. Estimación de efectos
Con dos factores fijados a dos niveles, (-1 y +1), se decide utilizar un diseño
factorial completo, en donde N = 2k = 22 = 4 experimentos. Los valores de las variables
a experimentar se codifican con valores -1 y +1, como se indica en la Tabla 3.2.
55
Valores actuales Valores codificados
Prueba Dosificación pH x1 x2
# g/l
1 0,2 2,5 -1 -1
2 0,3 2,5 +1 -1
3 0,2 3,0 -1 +1
4 0,3 3,0 +1 +1
Con los recursos que se dispone, se decide efectuar 3 pruebas con cada una de
las 4 combinaciones, determinando la extracción del As como la variable respuesta.
En lo posible, estas repeticiones se efectúan aleatoriamente; es decir, no repitiendo la
misma combinación 3 veces continuadas. Los resultados obtenidos por la
experimentación se resumen en la Tabla 3.4.
56
El procedimiento de evaluación se continúa determinando el promedio de los
valores altos y el promedio de los valores bajos para cada variable luego, se calcula
el efecto , que representa la diferencia entre los valores altos y bajos:
Promedio dosifica pH
ción
gr/l
(+) 71,30 54,10 Promedio de extracción para valores
altos
(-) 66,19 83,39 Promedio de extracción para valores
bajos
+5,11 -29,29 Efecto
Promedio general = 68,75
Tabla 3.5: Cálculo de los efectos del quitosano y del pH
57
Para cuantificar los efectos de interacción, se elabora una Tabla con las variables
codificadas y adicionando una columna de interacción AB. Esta columna se obtiene
multiplicando los valores codificados correspondientes a los dos factores. Esto se
observa en la Tabla 3.6.
Prueba # A B AB Promedio
1 -1 -1 +1 81,39
2 +1 -1 -1 85,39
3 -1 +1 -1 50,99
4 +1 +1 +1 57,21
Tabla 3.6: Matriz codificada con la columna de interacción
El valor bajo del efecto para la interacción AB, indica que no existe entre esos
dos factores. Esto se puede visualizar en el siguiente gráfico. Cuando la interacción
no existe, las rectas del gráfico son paralelas.
58
El siguiente paso es calcular los " efectos medios " para cada columna. Estos "
efectos medios " serán usados en la ecuación de predicción a definirse posteriormente
y también en el gráfico de Pareto que se presenta a continuación.
Resina 14 C x pH
/2 5,11 / 2 = 2,55 -29,29 / 2 =-14,61 1,11 / 2 = 0,55
Tabla 3.8: Efectos medios para el gráfico de Pareto
Figura 3.3: Gráfico de Pareto que visualiza la importancia relativa de los factores
sobre la extracción de As
B. Análisis de la varianza
59
la interacción y al error experimental y luego comparar dichas varianzas con la del
error.
En el ejemplo:
4*3
La suma de los cuadrados de los efectos e interacciones se da por la
(824,95) 2
SSTotal 59375,39 2663,51
12
siguiente relación:
60
2
N
X ijY j
SS Efecto i 1
Nr
En el ejemplo:
SS X1
256,18 171,63 244,17 152,97 2 78,39
4*3
SS X 2
152,97 171,63 244,17 256,18
2
2574,01
4*3
SS X1 X 2
244,17 171,63 256,18 152,97
3,68
2
4*3
De la ecuación SSTotal = SSEfectos + SSError, se obtienen SSError: de la siguiente
forma;
A través del cálculo del efecto se observa que la variable X2,(pH) tiene
incidencia importante en el proceso. La manera precisa y estadística de medir la
importancia de esa variable es por el Teorema de Cochran, que se resume en la
siguiente expresión:
Donde:
MS Efectos
Fo
MS Error
MSEfectos = SSEfectos / glT
MSError = SSError / glE
De aquí:
glT = grados de libertad de los efectos e interacciones, igual a 1 en los diseños
factoriales a dos niveles (2-1=1).
glE = grados de libertad de la suma de cuadrados del error, igual a:
61
nr
n
i 1
ri 1
Fo F (a; glT , gl E )
62
Extracción_As = 247.55 - 70.8*Dosificacion - 69.67*pH + 44.3*Dosificacion*pH
R 2 99,72
D. Superficie Respuesta
63
Figura 3.4: Superficie respuesta para la recuperación de mineral valioso
64
3.3 Diseño factorial 2k con réplica en el punto central del diseño
El diseño factorial 2k con réplicas en todos los puntos asume una relación lineal
entre las variables y la respuesta. De ser cierta la linealidad, el modelo debe predecir
adecuadamente todos los puntos del diseño, inclusive el punto central. Aunque no se
verifica linealidad perfecta, el modelo funcionará bastante bien si la linealidad se
cumple de manera aproximada. El número de ensayos en un diseño factorial con
repeticiones en el centro está dado por:
𝑁 = 2𝑘 + 𝑟
Figura 3.6: Modelo lineal fijado a nivel bajo y alto, con probable curvatura en el
centro.
Ejemplo 2:
65
quitosano y el pH. Supongamos que la extracción del As está dado por la siguiente
ecuación matemática que simulará los experimentos en el laboratorio:
R(%) 100 20 pH 0,5R 1
2 2
4,52 R 3 ALEATORIO () 1
2
66
Prueba quitosano pH Extracción
# g/l %
1 0,2 (-1) 2,5 (-1) 81,90
2 0,3 (+1) 2,5 (-1) 85,03
3 0,2 (-1) 3,0 (+1) 51,53
4 0,3 (+1) 3,0 (+1) 57,22
5 0,25 (0) 2,75 (0) 69,62
5 0,25 (0) 2,75 (0) 70,90
5 0,25 (0) 2,75 (0) 70,23
A. Estimación de Efectos
Promedio quitosano PH
g/l
(+) 71,375 54,625 Promedio de extracción para valores
altos
(-) 66,715 83,465 Promedio de extracción para valores
bajos
+4,66 -28,84 Efecto
Tabla 3.12: Cálculo de los efectos principales
67
extracción de As. A continuación, se elaboran gráficos con los valores promedios
obtenidos, donde se puede ver la tendencia de los efectos de cada factor sobre la
extracción. En el caso del quitosano se observa que la pendiente es positiva, lo que
significa que a mayor quitosano mayor extraccción, todo lo contrario con el efecto del
pH, donde la pendiente es negativa pero mayor.
9400
8400
Extraccion_As
7400
6400
5400
0.2 0.3 2.5 3
dosificacion pH
Para cuantificar los efectos de interacción, se elabora una Tabla con las variables
codificadas adicionando una columna de interacción AB. Esta columna se obtiene
multiplicando los valores codificados correspondientes a los dos factores. Esto se
observa en la Tabla 3.13.
Prueba # A B AB Promedio
1 -1 -1 +1 81,90
2 +1 -1 -1 85,03
3 -1 +1 -1 51,53
4 +1 +1 +1 57,22
68
Se puede determinar matemáticamente el efecto de interacción entre los dos
factores, utilizando la columna AB y la respuesta obtenida por cada combinación:
Valores Interacción AB
(+) 81,90 57,72 Promedio de interacción para valores
69,81 altos
2
El valor relativamente bajo del efecto para la interacción AB, indica que no
existe interacción entre esos dos factores. Esto se puede visualizar en el siguiente
gráfico. Cuando la interacción no existe, las rectas del gráfico son paralelas.
El siguiente paso es calcular los "efectos medios " para cada columna. Estos
"efectos medios " serán usados en la ecuación de predicción a definirse
posteriormente y también en el gráfico de Pareto que se presenta a continuación.
69
quitosano pH R x pH
/ 2 4,66 / 2 =2,33 -28,84 / 2 =-14,42 1,53 / 2 = 0,765
Figura 3.10: Gráfico de Pareto que visualiza la importancia relativa de los factores
sobre la recuperación.
Los factores principales quitosano y pH, muestran tener una gran influencia en
el proceso de extracción de As del agua. Sin embargo, a pesar de que vía el diagrama
de Pareto, podemos deducir que la variable más importante es el pH, no podemos
afirmar en base a evidencia estadística si realmente estos efectos son significativos,
al compararlos con el error experimental. Esto solamente puede hacerse mediante el
Análisis de Varianza.
B. Análisis de la varianza
70
La suma de los cuadrados de los efectos e interacciones se da por la siguiente
relación:
2
N
X ijY j
SS Efecto i 1
Nr
SS Error Yi 0 Y 0
nO
2
i 1
Donde:
Yi 0 = réplicas en el punto central del diseño.
no = número de réplicas en el centro.
SS Curvatura
Nn0 Y Y 0
2
N n0
Donde:
Y
= promedio de puntos exteriores del diseño.
SS C
85.03 57.72 81.90 51.532 21,72
(4)(1)
SS pH
51.53 57.72 81.90 85.032 831,75
(4)(1)
SS C pH
81,90 57,72 85,03 51,53
2
2,34
(4)(1)
71
La suma de cuadrados del error:
Y 0 = 70,25
(4)(3)(69,045 70,25) 2
SS Curvatura 2,49
43
72
C. Modelo Matemático
R 2 99,61
D. Superficie Respuesta
73
rangos de dosificación de resina y de pH adecuados para obtener una determinada
extracción.
74
En la figura podemos ver claramente que para obtener extracciones mayores a
83% debemos operar a una dosificación de quitosano >0,22 g/l y a un pH de 2,5.
75
distribución de probabilidad normal de los efectos. Los efectos que son insignificantes
son distribuidos normalmente con media cero y varianza σ2 y tienden a caer a lo largo
de esta línea recta (gráfico), mientras que los efectos significativos se alejan de la
línea recta.
Ejemplo
Un producto químico se produce en un depósito a presión en una planta piloto para
estudiar el efecto de 4 factores:
76
En primer lugar, estimamos los efectos principales y todas las interacciones
de los cuatro factores estudiados. La tabla siguiente nos muestra dichos efectos.
77
tabla 3.19 no podemos concluir nada, pues al no haber grados de libertad para estimar
el error no se pueda calcular su varianza y compararla con la de los demás efectos.
Del gráfico anterior, podemos concluir efectivamente que los únicos efectos
significativos son A(Temperatura), C(formaldehido), D(agitación) y las interacciones
de segundo orden AC y AD. Los demás efectos podemos excluirlos y hacer que sea
parte del error experimental. Entonces tendremos el siguiente diagrama de Pareto
antes y después de la exclusión.
78
Gráfico 3.15: Gráfico de Pareto considerando solamente efectos principales e
interacciones de segundo orden
79
Gráfico 3.16: Gráfico de efectos principales y su influencia sobre la velocidad de
filtración
80
sobre la velocidad de filtración, sin embargo cuando el nivel del formaldehido es bajo,
el efecto de la temperatura es alto. Entonces concluimos que para que la velocidad de
filtración sea más grande debemos operar a mayor temperatura y a menor
concentración de formaldehido. (Conclusión opuesta a solo considerar efectos
principales).
Por otro lado, considerando la interacción AD, podemos concluir que el efecto
de la temperatura sobre la velocidad de filtración es bajo cuando la agitación está al
más bajo nivel, por el contrario, el efecto de la temperatura sobre la velocidad de
filtración es alto, cuando la agitación está al más alto nivel. Por lo tanto, para que la
velocidad de filtración sea mayor debemos operar a mayor temperatura y mayor
agitación.
81
Se observa que el mejor ensayo se consigue con una temperatura de 80 oC y
una concentración de fomaldehido de 10 g/l.
82
Nuevamente, concluimos que las mejores condiciones se obtienen con una
velocidad de agitación de 100 rpm y una concentración de formaldehido de 10 g/l.
Condición A B C
1 -1 -1 -1
a +1 -1 -1
b -1 +1 -1
ab +1 +1 -1
c -1 -1 +1
ac +1 -1 +1
bc -1 +1 +1
abc +1 +1 +1
Bloque 1: a ab ac abc
Bloque 2: 1 b c bc
83
El efecto de bloques estará dado por la siguiente diferencia:
(a + ab + ac + abc) - (1 + b + c + bc)
Ejemplo
Un experimento factorial 24 se va a realizarlo en cuatro días diferentes
confundiendo los efectos ABD y ACD. Se desea saber cual es el programa de
experimentación para los cuatro días. Como 2p=4, entonces p=2. Existirán en total 2p-
84
1=3 efectos mezclados. Estos son ABD, ACD y BC que es la interacción generalizada
de los anteriores. Luego se listan las 16 condiciones experimentales del factorial 2 4.
1 a b ab c ac bc abc
d ad bd abd cd acd bcd abcd
a b ac bc d abd cd abcd
1 ab c abc ad bd acd bcd
Finalmente se coge el efecto ACD y se vuelve a mezclar con los dos bloques
anteriores utilizando la misma regla, obteniéndose el plan de experimentación para
los cuatro días:
85
Como una alternativa a la posibilidad de obtener gran cantidad de variables,
se presentan los diseños factoriales fraccionados, en los que se ejecutan solo una
fracción del total de experimentos que se requieren, 1/2, 1/4, 1/8, etc. Lo negativo
del método es que parte de la información sobre interacciones se llega a perder.
86
del mismo con el contraste de definición. Al conjunto de todos los alias se
denomina estructura alias.
2k-p
donde:
k = número de factores a estudiar;
p = número de factores que se mezclarán entre sí.
El concepto de resolución del diseño es una manera útil de catalogar los diseños
factoriales fraccionados de acuerdo con los patrones alias que producen. Los diseños
de resolución III, IV y V son de particular importancia. A continuación aparecen las
definiciones de estos términos y un ejemplo de cada caso.
Diseños de resolución III. Son diseños en los que ninguno de los efectos
principales es el alias de cualquier otro efecto principal, pero los efectos
principales tienen alias con interacciones entre dos factores, y algunas de éstas
pueden tener alias con otras. El Diseño 2 3-1 con I=ABC es un diseño con
resolución III.
Diseños de resolución IV. Son diseños en los que ningún efecto principal tiene
alias con cualquier otro efecto principal o con interacciones entre dos factores,
pero estas pueden tener alias entre si. El diseño 2 4-1 con I=ABCD es un
ejemplo.
Diseños de resolución V. Son diseños en los que ningún efecto principal o
interacción entre dos factores tiene alias con cualquier otro efecto principal o
interacción entre dos factores. Un diseño 25-1 con I=ABCDE es un ejemplo.
87
Sons, 1978). Y también se publicó en el libro Design and Analysis of Experiments, 5th
edition by Douglas C. Montgomery (New York, John Wiley & Sons, 2000).
88
TABLA 3.23 Resumen de Diseños Factoriales Fraccionados
Número de Factores, k Diseño Pruebas N
3 2III3-1 4
4 2IV4-1 8
5 2V5-1 16
5 2III5-2 8
6 2VI6-1 32
6 2IV6-2 16
6 2III6-3 8
7 2VII7-1 64
7 2IV7-2 32
7 2IV7-3 16
7 2III7-4 8
8 2VIII8-1 128
8 2V8-2 64
8 2IV8-3 32
8 2IV8-4 16
9 2VI9-2 128
9 2IV9-3 64
9 2IV9-4 32
9 2III9-5 16
10 2V10-3 128
10 2IV10-4 64
10 2IV10-5 32
10 2III10-6 16
11 2V11-4 128
11 2IV11-5 64
11 2IV11-6 32
11 2III11-7 16
15 2III15-11 16
31 2III31-26 32
89
Ejemplo 3:
Se desea realizar una investigación para maximizar la extracción de un
metal pesado de un efluente mediante un proceso de extracción por solventes a nivel
de laboratorio, considerando los siguientes factores:
1 x x x 2j 2 * aleatorio () 1
k
1 2
E (%)
2
j j 1
100 j 1, 3, 5
E (%)
1
100
1 x1 2 ( x2 x12 2 1 x3 2 x4 x32 2 1 x5 2 x6 x52 2 * aleatorio () 1
2
90
Contraste Efectos
1 A
2 B
3 C
4 D
5 E
6 F
7 AB+CE
8 AC+BE
9 AD+EF
10 AE+BC+DF
11 AF+DE
12 BD+CF
13 BF+CD
La tabla de la estructura alias, nos indica que los 6 factores principales pueden
estimarse independientemente, no así las interacciones de segundo y mayor orden.
Si seleccionamos 1/8 de réplica la estructura alias sería la siguiente:
Contraste Efectos
1 A+BD+CE
2 B+AD+CF
3 C+AE+BF
4 D+AB+EF
5 E+AC+DF
6 F+BC+DE
7 AF+BE+CD
En este caso al considerar 1/8 de réplica observamos que todos los efectos
principales se encuentran mezclados con interacciones de segundo orden, por lo que
no podríamos realizar este fraccionamiento. A continuación se muestra la matriz
diseño correspondiente. Es posible aplicar este diseño siempre y cuando sepamos
de antemano que las interacciones de segundo orden son poco significativas en el
proceso o investigación que vamos a realizar.
91
t pH A/O agitación T Flujo Extraccion
0.5 1 1 5 5 1 6.50
1 1 1 5 10 1 99.70
0.5 2 1 5 10 5 92.15
1 2 1 5 5 5 3.82
0.5 1 3 5 10 5 91.40
1 1 3 5 5 5 3.86
0.5 2 3 5 5 1 6.88
1 2 3 5 10 1 99.14
0.5 1 1 10 5 5 4.81
1 1 1 10 10 5 91.55
0.5 2 1 10 10 1 98.97
1 2 1 10 5 1 6.05
0.5 1 3 10 10 1 98.72
1 1 3 10 5 1 5.75
0.5 2 3 10 5 5 3.85
1 2 3 10 10 5 90.53
0.75 1.5 2 7.5 7.5 3 28.69
0.75 1.5 2 7.5 7.5 3 29.74
0.75 1.5 2 7.5 7.5 3 28.89
Tabla 3.27: Matriz del diseño factorial fraccionado con réplica en el centro y
respuestas.
Con los datos obtenidos se calcula el efecto para cada una de las
variables e interacciones como sigue:
92
Gráfico 3.21: Estimación de los efectos mediante Pareto
n0
SS Error Yi 0 Y 0
2
i 1
SS Curvatura
Nn0 Y Y 0
N n0
93
De la tabla podemos observar que los efectos realmente significativos son la
Temperatura, el flujo y la falta de ajuste, lo que significa que la curvatura es
significativa dentro de la región investigada, por lo que existe un valor óptimo que
puede determinarse utilizando un modelo no lineal.
A
E (%) 82,76 0,72 t 0,11 pH 0,21 0,08 Agitación 18 T 1,24 Flujo
O
94
Gráfico 3.23: Representación mediante curvas de isovalores de la superficie
respuesta
En 1946, R.L. Plackett and J.P. Burman publicaron su famoso artículo "The
Design of Optimal Multifactorial Experiments" en Biometrika (vol. 33). Este
artículo describe la construcción de diseños muy económicos con un número de
corridas múltiplo de 4 (más que potencia de 2). Los diseños de Plackett-Burman
son diseños de selección muy eficientes cuando solamente son de interés los
efectos principales en un proceso.
95
en N pruebas experimentales, donde N > k y otorga la posibilidad de
experimentar con N-1 variables.
Los vectores generados para los diversos diseños P-B son como sigue:
n=8 + + + - + - -
n=12 + + - + + + - - - + -
n=16 + + + + - + - + + - - + - - -
n=20 + + - - + + + + - + - + - - - - + + -
n=24 + + + + + - + - + + - - + + - - + - + - - - -
Tabla 3.30: Vectores generadores para diferentes plantillas
96
Obsérvese que los valores de n son múltiplos de 4 y el total de variables a
experimentar (inclusive las variables ficticias) es igual a n-1.
Tabla 3.31: Diseño P-B con 4 variables reales, 3 variables ficticias y 8 pruebas.
N X1 X2 X3 X4 X5 X6 X7 X8 F1 F2 F3
1 + + - + + + - - - + -
2 + - + + + - - - + - +
3 - + + + - - - + - + +
4 + + + - - - + - + + -
5 + + - - - + - + + - +
6 + - - - + - + + - + +
7 - - - + - + + - + + +
8 - - + - + + - + + + -
9 - + - + + - + + + - -
10 + - + + - + + + - - -
11 - + + - + + + - - - +
12 - - - - - - - - - - -
Tabla 3.32: Diseño P-B con 8 variables reales, 3 variables ficticias y 12 pruebas.
97
Tabla 3.33: Diseño P-B con 12 variables reales, 3 variables ficticias y 16 pruebas.
98
Tabla 3.34: Diseño P-B con 16 variables reales, 3 variables ficticias y 20 pruebas
99
Tabla 3.35: Diseño P-B con 20 variables reales, 3 variables ficticias y 24 pruebas
100
Tabla 3.36: Diseño P-B con 28 variables reales, 3 variables ficticias y 32 pruebas
101
Ejemplo 4:
Consideremos el mismo ejemplo anterior, donde se desea realizar una
investigación para maximizar la extracción de metal pesado de un efluente mediante
un proceso de extracción por solventes a nivel de laboratorio, considerando los
siguientes factores:
1 x x x 2j 2 * aleatorio () 1
k
1 2
E (%)
2
j j 1
100 j 1, 3, 5
E (%)
1
100
1 x1 2 ( x2 x12 2 1 x3 2 x4 x32 2 1 x5 2 x6 x52 2 * aleatorio () 1
2
En este caso el proceso de cálculo para determinar los efectos es el mismo que
los anteriores:
102
2
N
X ij Y j
i 1
SS Efecto
Nr
n0
SS Error EF
2
i 1
SS Error
MS Error
nF
Con los datos obtenidos se calcula el efecto para cada una de las
variables e interacciones como sigue:
103
Efecto t pH A/O agitación T Flujo
-0,87 -0,82 -0,47 -0,72 90,16 -4,56
104
De la tabla podemos observar que los efectos realmente significativos son la
Temperatura y el flujo, resultados idénticos a los obtenidos utilizando un diseño
factorial fraccionado con mayor número de pruebas y repeticiones en el centro. El
modelo matemático obtenido por regresión múltiple lineal es :
A
E (%) 83,23 0,87 t 0,82 pH 0,24 0,14 agitación 18 ,03T 1,14 Flujo
O
105
3.8 Diseños Supersaturados
La idea de usar diseños sobresaturados fue propuesta por primera vez por
Satterthwaite (1959). El propuso generar estos diseños al azar. Posteriormente, hubo
una amplia discusión de esta propuesta, y algunas de las principales autoridades en
diseño actual, incluidos Jack Youden, George Box, J. Stuart Hunter, William Cochran,
John Tukey, Oscar Kempthorne y Frank Anscombe criticaron estos diseños aleatorios
equilibrados. Como resultado, los diseños supersaturados recibieron poca atención
durante los siguientes 30 años. Un notable La excepción es el diseño sobresaturado
sistemático desarrollado por Booth y Cox (1962). Sus diseños no se generaron
aleatoriamente, lo cual fue una desviación significativa de los diseños propuestos por
Satterthwaite. Generaron sus diseños con métodos elementales de búsqueda por
computadora. Ellos también desarrollaron los criterios básicos por los cuales se juzgan
los diseños sobresaturados.
106
factores en el experimento excede el número de ejecuciones, la matriz de diseño no
puede ser ortogonal En consecuencia, las estimaciones del efecto factorial no son
independientes. Un experimento con un factor dominante puede contaminar y
oscurecer la contribución de otro factor. Los diseños sobresaturados se crean para
minimizar esta cantidad de no polaridad entre factores.
107
Tabla 3.42: Diseño supersaturado obtenido de la tabla anterior (N=6 y k=10)
108
Matriz 12R14F Tabla 3.43: Algunas matrices óptimas para el caso 12R
109
110
2.9 Eficiencia de un diseño
Númerodeefectosestimados
df eficiencia
totalde grados delibertad
0,5k k 1
df eficiencia
n1
Los diseños más eficientes son aquellos para los cuales la fracción anterior es
cercana a 1.0, lo que significa 100 por ciento de eficiencia. Un diseño 25− 1 es 100 por
ciento eficiente puesto que la fracción 15/16 es cercana a la unidad, por eso es común
utilizar diseños factoriales 2k-p que tengan eficiencias cercanas al 100%.
111