Sei sulla pagina 1di 59

CAPITULO III

DISEÑOS EXPERIMENTALES DE SELECCIÓN DE VARIABLES

3.1 Introducción

Al inicio de un trabajo de optimización, cuando todavía no se tiene un buen


conocimiento del comportamiento del proceso a optimizar, la lista de factores o
variables que pueden influir en el proceso es grande.

El objetivo principal de una primera etapa de optimización es la identificar


aquellas variables que tengan gran influencia en el proceso. Para esta fase, los
diseños de selección o screenign son los más recomendados.

Este tipo de diseños proveen la manera de reducir el tiempo y el costo


experimentales. Son apropiados cuando algunas de las variables tienen sus efectos
principales o interacciones poco significativas. Mediante un diseño de selección de
variables podemos obtener la siguiente información:

 Determinar cuanto cambia la respuesta cuando el nivel de un factor se cambia.


 La diferencia entre el cambio individual y el cambio conjunto de los factores
sobre la respuesta.

Cuando se desea estudiar un proceso, a dos niveles por cada uno de k factores,
la experimentación debe incluir la combinación de todas las 2k combinaciones. Para
este propósito, los diseños factoriales son los más eficientes. Este diseño también nos
permite explorar una zona escogida del dominio experimental y encontrar una
dirección prometedora para la optimización posterior

El término, ”Screening Design” o diseños de selección de variables se refiere a


un plan experimental orientado a encontrar unos cuantos factores significativos de una
lista grande de factores potencialmente significativos. Alternativamente, nos referimos
a un diseño como diseño de selección si su propósito primario es idenfificar efectos

53
principales significativos, y no interacciones, siendo éstas útimas asumidas como de
magnitud menos importante.

3.2 Diseño Factorial 2K con réplica total

Un diseño factorial es aquel en el que se investigan todas las posibles


combinaciones de todos los niveles de los factores de cada ensayo completo o réplica
del experimento. Los niveles representan los valores que pueden tomar las variables
o factores. Si consideramos por ejemplo 2 niveles, el diseño se denomina diseño
factorial a dos niveles o diseño factorial 2k. El número total de experimentos a llevarse
a cabo viene dada por la relación:

Donde:
N  2k .r
k= número de variables;
N= número total de experimentos.
r= número de repeticiones

Por su sencillez, una matriz de experimentos factorial completa 2k no requiere


un software especializado para construirla ni para analizar sus resultados. En estos
diseños, cada factor se estudia a sólo dos niveles y sus experimentos contemplan
todas las combinaciones de cada nivel de un factor con todos los niveles de los otros
factores. La tabla siguiente muestra las matrices 22, 23 y 24, para el estudio de 2, 3 y
4 factores o variables respectivamente.

Tabla 3.1: Matriz diseño con niveles codificados para k=2, 3 y 4

54
Ejemplo 1:

Un investigador está interesado en estudiar el efecto que tiene sobre la


extracción de As del agua dos variables o factores independientes: La dosificación de
quitosano y el pH. Supongamos que la extracción del As está dado por la siguiente
ecuación matemática que simulará los experimentos en el laboratorio:

2
R(%)  100  20 pH  0,5R  12   4,52  R 2  3 ALEATORIO ()  1
 

A. Estimación de efectos

A pesar de que son muchos los factores que intervienen en el proceso de


extracción del As, tales como la granulometría, la temperatura, la agitación, etc., para
los propósitos de este ejemplo, se selecciona las variables de dosificación de
quitosano y el pH para la evaluación experimental. Este hecho no invalida la
posibilidad de utilizar la cantidad de variables que se estime necesario. Por lo tanto,
las otras variables del proceso se mantendrán constantes durante la experimentación.

Tanto la dosificación de quitosano como el pH son variables cuantificables, cuyos


valores se fijan a dos niveles según el siguiente cuadro:

FACTOR Nivel bajo (-1) Nivel alto (+1)


Dosificación (g/l) 0,2 0,3
pH 2,5 3,0

Tabla 3.2: Factores y niveles considerados en la investigación

Con dos factores fijados a dos niveles, (-1 y +1), se decide utilizar un diseño
factorial completo, en donde N = 2k = 22 = 4 experimentos. Los valores de las variables
a experimentar se codifican con valores -1 y +1, como se indica en la Tabla 3.2.

55
Valores actuales Valores codificados
Prueba Dosificación pH x1 x2
# g/l
1 0,2 2,5 -1 -1
2 0,3 2,5 +1 -1
3 0,2 3,0 -1 +1
4 0,3 3,0 +1 +1

Tabla 3.3: Matriz de diseño con valores actuales y codificados

En general, los experimentos deben ejecutarse lo más aleatoriamente posible,


sin seguir necesariamente el orden en que la Tabla de diseño dicta, en este caso
particular ambos factores facilitan la aleatorización.

Con los recursos que se dispone, se decide efectuar 3 pruebas con cada una de
las 4 combinaciones, determinando la extracción del As como la variable respuesta.
En lo posible, estas repeticiones se efectúan aleatoriamente; es decir, no repitiendo la
misma combinación 3 veces continuadas. Los resultados obtenidos por la
experimentación se resumen en la Tabla 3.4.

Prueba Resina pH Extracción Promedio


# lib/t %
1 0,2 (-1) 2,5 (-1) 83,20 80,60 80,37 81,39
2 0,3 (+1) 2,5 (-1) 86,09 84,90 85,19 85,39
3 0,2 (-1) 3,0 (+1) 51,90 50,28 50,79 50,99
4 0,3 (+1) 3,0 (+1) 57,62 56,78 57,23 57,21

Tabla 3.4: Datos de evaluación del proceso de extracción.

De la observación de los resultados resulta evidente, que la mejor combinación


de variables corresponde a 0,3 gr/litro de quitosano y 2,5 de pH, la que proporciona la
mejor extracción del As, sin embargo una "elección a ganador" por simple inspección
de los resultados es una actitud altamente negativa. Ello no permite evaluar cual de
las variables tiene mayor efecto y trunca, tanto posibles sub-optimizaciones, como
predecir la respuesta de valores no experimentados con las variables.

56
El procedimiento de evaluación se continúa determinando el promedio de los
valores altos y el promedio de los valores bajos para cada variable luego, se calcula
el efecto , que representa la diferencia entre los valores altos y bajos:

Promedio dosifica pH
ción
gr/l
(+) 71,30 54,10 Promedio de extracción para valores
altos
(-) 66,19 83,39 Promedio de extracción para valores
bajos
+5,11 -29,29 Efecto 
Promedio general = 68,75
Tabla 3.5: Cálculo de los efectos del quitosano y del pH

De esos cálculos se observa el efecto del factor quitosano equivalente a 5,11%.


Esto significa que al aumentar la dosificación del quitosano de 0,2 a 0,3 g/l ocasiona
un aumento en la extracción de 5,11 %. Similarmente, el factor efecto del pH es de –
29,29; es decir el aumento de pH de 2,5 a 3,0 ocasiona una disminución de la
extracción de As en 29,29 %. El factor pH resulta ser 5,73 veces más importante que
el factor quitosano en la extracción de As. A continuación, se elaboran gráficos con
los valores promedios obtenidos, donde se puede ver la tendencia de los efectos de
cada factor sobre la extracción. En el caso del quitosano, se observa que la pendiente
es positiva, lo que significa que a mayor dosificación mayor extracción, todo lo
contrario, con el efecto del pH, donde la pendiente es negativa pero mayor.

Figura 3.1: Comportamiento de los efectos de cada factor sobre la extracción de As

57
Para cuantificar los efectos de interacción, se elabora una Tabla con las variables
codificadas y adicionando una columna de interacción AB. Esta columna se obtiene
multiplicando los valores codificados correspondientes a los dos factores. Esto se
observa en la Tabla 3.6.

Prueba # A B AB Promedio
1 -1 -1 +1 81,39
2 +1 -1 -1 85,39
3 -1 +1 -1 50,99
4 +1 +1 +1 57,21
Tabla 3.6: Matriz codificada con la columna de interacción

Se puede determinar matemáticamente el efecto de interacción entre los dos


factores, utilizando la columna AB y la respuesta obtenida por cada combinación:
Valores Interacción AB
(+) 81,39  57,21 Promedio de interacción para valores altos
 69,30
2

(-) 85,39  50,99 Promedio de interacción para valores bajos


 68,19
2

69,30 – 68,19 =1,11 Efecto 

Tabla 3.7: Cálculo de la interacción quitosano x pH

El valor bajo del efecto  para la interacción AB, indica que no existe entre esos
dos factores. Esto se puede visualizar en el siguiente gráfico. Cuando la interacción
no existe, las rectas del gráfico son paralelas.

Figura 3.2: Comportamiento de la interacción quitosano x pH en la


extracción de As del agua

58
El siguiente paso es calcular los " efectos medios " para cada columna. Estos "
efectos medios " serán usados en la ecuación de predicción a definirse posteriormente
y también en el gráfico de Pareto que se presenta a continuación.
Resina 14 C x pH
/2 5,11 / 2 = 2,55 -29,29 / 2 =-14,61 1,11 / 2 = 0,55
Tabla 3.8: Efectos medios para el gráfico de Pareto

Figura 3.3: Gráfico de Pareto que visualiza la importancia relativa de los factores
sobre la extracción de As

Las variables quitosano y el pH, evidencian tener una gran influencia en el


proceso de extracción de As. Sin embargo, a pesar de que vía el diagrama de Pareto,
podemos deducir que la variable más importante es el pH, no podemos afirmar en
base a evidencia estadística si realmente estos efectos son significativos, al
compararlos con el error experimental. Esto solamente puede hacerse mediante el
Análisis de Varianza.

B. Análisis de la varianza

El análisis gráfico, no-estadístico, se complementa con el estudio de análisis de


la varianza lo cual aporta el criterio objetivo para completar la evaluación. Este análisis
se desarrolla con un ejemplo. El análisis de varianza consiste en dividir la varianza
total de las 12 pruebas (en este caso), en componentes debido al quitosano, al pH, a

59
la interacción y al error experimental y luego comparar dichas varianzas con la del
error.

El análisis de la varianza se inicia planteando la siguiente ecuación que


representa a la variabilidad total de los datos en sus partes componentes:

SS Total  SS Efectos  SS Error


Donde:

SSTotal = Suma total de cuadrados.


SSEfectos = Suma de cuadrados debida a los tratamientos.
SSError = Suma de cuadrados debida al error.

Para el análisis de la varianza de un diseño factorial donde con varias réplicas


en los puntos del diseño, la suma total de cuadrados viene definido por:
Donde:
2 2 r
Y2
SS Total    Y 
2
ijk
i 1 j 1 k 1 Nr
N = número de pruebas experimentales.
r = número de replicas en el diseño.

O sea, SSTotal es igual a la suma de cada una de las respuestas elevadas al


cuadrado, menos la suma de todas las respuestas elevadas al cuadrado dividida por
el número total de experimentos por el número de réplicas efectuadas.

En el ejemplo:

(83,20  86,09  ...  57,23) 2


SSTotal  (83,20  86,09  ...  57,23 ) 
2 2 2

4*3
La suma de los cuadrados de los efectos e interacciones se da por la
(824,95) 2
SSTotal  59375,39   2663,51
12
siguiente relación:

60
2
N 
 X ijY j 
SS Efecto   i 1 
Nr

En el ejemplo:

SS Efectos  SS X1  SS X 2  SS X1 X 2  78,39  2574,01  3,68  2656,08

SS X1 
256,18  171,63  244,17  152,97 2  78,39
4*3

SS X 2 
152,97  171,63  244,17  256,18
2
 2574,01
4*3

SS X1 X 2 
244,17  171,63  256,18  152,97 
 3,68
2

4*3
De la ecuación SSTotal = SSEfectos + SSError, se obtienen SSError: de la siguiente
forma;

SSError = SSTotal - SSEfecto = 2663,51 –2656,08 =7,43

A través del cálculo del efecto  se observa que la variable X2,(pH) tiene
incidencia importante en el proceso. La manera precisa y estadística de medir la
importancia de esa variable es por el Teorema de Cochran, que se resume en la
siguiente expresión:
Donde:
MS Efectos
Fo 
MS Error
MSEfectos = SSEfectos / glT
MSError = SSError / glE

De aquí:
glT = grados de libertad de los efectos e interacciones, igual a 1 en los diseños
factoriales a dos niveles (2-1=1).
glE = grados de libertad de la suma de cuadrados del error, igual a:

61
nr

n
i 1
ri 1

Esto es, la sumatoria del número de réplicas menos 1.

Una variable o interacción es significativa si se cumple la siguiente condición:

Fo  F (a; glT , gl E )

Tabla 3.9: Análisis de la Varianza para el ejemplo.

Para un nivel significativo =0.01; glT =1; glE =8 entonces F(0.01;1,8)=11.26.

La condición Fo > F(;glT,glE ) se cumple para el quitosano y el pH , pero no para


la interacción . Por lo tanto, todos los efectos principales tienen incidencia significativa
en el proceso. Como ahora se utilizan programas de computadora para el análisis,
como el STATGRAPHICS, por ejemplo, basta analizar la columna correspondiente al
P-value (máxima probabilidad de cometer error tipo I). Cuando este valor es < 0,01 se
dice que el efecto es altamente significativo. Cuando este valor 0,01< p< 0,05, se dice
que el efecto es significativo y finalmente cuando 0,05< p <0,1 se dice que el efecto
es probablemente significativo. De la tabla podemos concluir entonces que los efectos
principales son altamente significativos porque sus respectivos p<0,01.
C. Modelo Matemático

En el proceso de extracción, el modelo matemático incluirá los tres


componentes, pues todos tienen incidencia significativa en el proceso. Con estas
consideraciones, el modelo matemático queda definido de la siguiente manera, el cual
se obtiene mediante regresión múltiple lineal:

62
Extracción_As = 247.55 - 70.8*Dosificacion - 69.67*pH + 44.3*Dosificacion*pH

R 2  99,72

El modelo tiene un coeficiente de correlación de 99,72, lo que significa que los


resultados de las extracciones obtenidas en las diferentes pruebas quedan explicadas
en un 99,72% por la dosificación de quitosano y del pH. Por lo tanto, podemos afirmar
que el modelo propuesto es adecuado. A continuación, se muestra en una tabla la
capacidad de pronóstico del modelo propuesto.

Tabla 3.10: Capacidad predictora del modelo propuesto

D. Superficie Respuesta

La representación gráfica del modelo matemático propuesto se denomina


superficie respuesta. En esta representación podemos observar visualmente los
rangos de dosificación de quitosano y de pH adecuados para obtener una determinada
extracción.

63
Figura 3.4: Superficie respuesta para la recuperación de mineral valioso

En esta figura se observa que a medida que se aumenta el quitosano la


extracción aumenta, mientras que a medida que se aumenta el pH la extracción, por
el contrario disminuye. Para observar mejor se proyecta el sólido sobre el plano inferior
obteniéndose las siguientes curvas de isovalores.

Figura 3.5: Curva de isovalores para la extracción de metal contaminante

En la figura podemos ver claramente que para obtener extracciones mayores a


82% debemos operar a una dosificación de quitosano >0,22 gr/l y a un pH entre 2,5 y
2,55.

64
3.3 Diseño factorial 2k con réplica en el punto central del diseño

El diseño factorial 2k con réplicas en todos los puntos asume una relación lineal
entre las variables y la respuesta. De ser cierta la linealidad, el modelo debe predecir
adecuadamente todos los puntos del diseño, inclusive el punto central. Aunque no se
verifica linealidad perfecta, el modelo funcionará bastante bien si la linealidad se
cumple de manera aproximada. El número de ensayos en un diseño factorial con
repeticiones en el centro está dado por:
𝑁 = 2𝑘 + 𝑟

De no predecir adecuadamente el modelo, especialmente en el punto central, se


afirma que el modelo no es suficiente para explicar la respuesta en tal región y es
posible asumir la existencia de curvatura. Se debe realizar pruebas en el punto central
del diseño para dar un estimado del efecto de curvatura.

Figura 3.6: Modelo lineal fijado a nivel bajo y alto, con probable curvatura en el
centro.

Ejemplo 2:

Un investigador está interesado en estudiar el efecto que tiene sobre la


extracción de As del agua dos variables o factores independientes: La dosificación de

65
quitosano y el pH. Supongamos que la extracción del As está dado por la siguiente
ecuación matemática que simulará los experimentos en el laboratorio:


R(%)  100  20 pH  0,5R  1 
2 2
 4,52  R   3 ALEATORIO ()  1
2

Tanto la dosificación de resina como el pH son variables cuantificables, cuyos


valores se fijan a dos niveles según el siguiente cuadro:

FACTOR Nivel bajo (-1) Nivel alto (+1)


quitosano (gr/l) 0,2 0,3
pH 2,5 3,0

Tabla 3.10: Factores y niveles del experimento

Debido a que el investigador duda de la suposición de linealidad, decide utilizar


un diseño 22 , con una sola prueba en cada punto externo del diseño y 3 réplicas en
el punto central.

Figura 3.7: Diseño factorial con réplica en el centro del diseño.

La tabla siguiente muestra los valores actuales y codificados del diseño.

66
Prueba quitosano pH Extracción
# g/l %
1 0,2 (-1) 2,5 (-1) 81,90
2 0,3 (+1) 2,5 (-1) 85,03
3 0,2 (-1) 3,0 (+1) 51,53
4 0,3 (+1) 3,0 (+1) 57,22
5 0,25 (0) 2,75 (0) 69,62
5 0,25 (0) 2,75 (0) 70,90
5 0,25 (0) 2,75 (0) 70,23

Promedio general (exceptúa los puntos en el centro) = 69.045


Tabla 3.11: Matriz del diseño con réplicas en el centro

A. Estimación de Efectos

El procedimiento del cálculo de los efectos es el mismo que en el caso anterior,


excepto que no se toma en cuenta los puntos centrales; es decir, se continúa
determinando el promedio de los valores altos y el promedio de los valores bajos para
cada variable, luego se calcula el efecto , que representa la diferencia entre los
valores altos y bajos:

Promedio quitosano PH
g/l
(+) 71,375 54,625 Promedio de extracción para valores
altos
(-) 66,715 83,465 Promedio de extracción para valores
bajos
+4,66 -28,84 Efecto 
Tabla 3.12: Cálculo de los efectos principales

De esos cálculos se observa el efecto del factor quitosano equivalente a 4,66 %.


Esto significa que el aumento de quitosano de 0,2 a 0,2 g/l ocasiona un aumento en
la extracción de 4,66 %. Similarmente, el efecto del pH es de –28,84; es decir el
aumento de pH de 2,5 a 3,0 ocasiona una disminución de la extracción de As en 28,84
%. El factor pH resulta ser 6,18 veces más importante que el factor quitosano en la

67
extracción de As. A continuación, se elaboran gráficos con los valores promedios
obtenidos, donde se puede ver la tendencia de los efectos de cada factor sobre la
extracción. En el caso del quitosano se observa que la pendiente es positiva, lo que
significa que a mayor quitosano mayor extraccción, todo lo contrario con el efecto del
pH, donde la pendiente es negativa pero mayor.

Gráfica de Efectos Principales para Extraccion_As

9400

8400
Extraccion_As

7400

6400

5400
0.2 0.3 2.5 3
dosificacion pH

Figura 3.8: Comportamiento de los efectos de cada factor sobre la extracción

Para cuantificar los efectos de interacción, se elabora una Tabla con las variables
codificadas adicionando una columna de interacción AB. Esta columna se obtiene
multiplicando los valores codificados correspondientes a los dos factores. Esto se
observa en la Tabla 3.13.

Prueba # A B AB Promedio
1 -1 -1 +1 81,90
2 +1 -1 -1 85,03
3 -1 +1 -1 51,53
4 +1 +1 +1 57,22

Tabla 3.13: Matriz codificada con la columna de interacción

68
Se puede determinar matemáticamente el efecto de interacción entre los dos
factores, utilizando la columna AB y la respuesta obtenida por cada combinación:

Valores Interacción AB
(+) 81,90  57,72 Promedio de interacción para valores
 69,81 altos
2

(-) 85,03  51,53 Promedio de interacción para valores


 68,28 bajos
2

69,81 – 68,28 =1,53 Efecto 

Tabla 3.14: Cálculo de la interacción quitosano x pH

El valor relativamente bajo del efecto  para la interacción AB, indica que no
existe interacción entre esos dos factores. Esto se puede visualizar en el siguiente
gráfico. Cuando la interacción no existe, las rectas del gráfico son paralelas.

Figura 3.9: Comportamiento de la interacción resina x pH sobre la recuperación

El siguiente paso es calcular los "efectos medios " para cada columna. Estos
"efectos medios " serán usados en la ecuación de predicción a definirse
posteriormente y también en el gráfico de Pareto que se presenta a continuación.

69
quitosano pH R x pH
 / 2 4,66 / 2 =2,33 -28,84 / 2 =-14,42 1,53 / 2 = 0,765

Figura 3.10: Gráfico de Pareto que visualiza la importancia relativa de los factores
sobre la recuperación.

Los factores principales quitosano y pH, muestran tener una gran influencia en
el proceso de extracción de As del agua. Sin embargo, a pesar de que vía el diagrama
de Pareto, podemos deducir que la variable más importante es el pH, no podemos
afirmar en base a evidencia estadística si realmente estos efectos son significativos,
al compararlos con el error experimental. Esto solamente puede hacerse mediante el
Análisis de Varianza.

B. Análisis de la varianza

El análisis de la varianza difiere algo del efectuado cuando se realizan réplicas


en cada punto del diseño. Implica el cálculo de :

SSEfectos = Suma de cuadrados debida a los tratamientos.


SSError = Suma de cuadrados debida al error.
SSCurvatura = Suma de cuadrados debida a la curvatura.

70
La suma de los cuadrados de los efectos e interacciones se da por la siguiente
relación:

2
 N 
  X ijY j 
SS Efecto   i 1 
Nr

La suma de cuadrados debida al error se calcula con la siguiente expresión:

SS Error   Yi 0  Y 0 
nO
2

i 1

Donde:
Yi 0 = réplicas en el punto central del diseño.
no = número de réplicas en el centro.

Y 0 = promedio de todas las réplicas.

La suma de cuadrados debida a la curvatura se calcula con la siguiente expresión:

SS Curvatura 

Nn0 Y  Y 0 
2

N  n0

Donde:

Y
= promedio de puntos exteriores del diseño.

En el ejemplo la suma de cuadrados debida a los tratamiento es :

SS C 
85.03  57.72  81.90  51.532  21,72
(4)(1)

SS pH 
51.53  57.72  81.90  85.032  831,75
(4)(1)

SS C pH 
81,90  57,72  85,03  51,53
2
 2,34
(4)(1)

71
La suma de cuadrados del error:

Y 0 = 70,25

SS Error  (69,62  70,25) 2  70,90  70,25  70,23  70,25  0,8198


2 2

glE =(no -1) = 3 - 1 = 2; (grados de libertad del error)

La suma de cuadrados debida a la curvatura:

(4)(3)(69,045  70,25) 2
SS Curvatura   2,49
43

Tabla 3.15: Análisis de varianza para la extracción

Como ahora se utilizan programas de computadora para el análisis, como el


STATGRAPHICS, por ejemplo, basta analizar la columna correspondiente al P-value
(máxima probabilidad de cometer error tipo I). Cuando este valor es < 0,01 se dice
que el efecto es altamente significativo. Cuando este valor 0,01< p< 0,05, se dice que
el efecto es significativo y finalmente cuando 0,05< p <0,1 se dice que el efecto es
probablemente significativo. De la tabla podemos concluir entonces que solamente los
efectos principales son altamente significativos porque sus respectivos p<0,01. No
existe interacción significativa y como la falta de ajuste no es significativa, entonces el
modelo lineal es adecuado.

72
C. Modelo Matemático

En el proceso de flotación, el modelo matemático incluirá los tres componentes,


pues todos tienen incidencia significativa en el proceso. Con estas consideraciones,
el modelo matemático queda definido de la siguiente manera, el cual se obtiene
mediante regresión múltiple lineal:

Extraccion_As = 258.61 - 121.7*Dosificacion - 72.98*pH + 61.2*Dosificacion*pH

R 2  99,61

El modelo tiene un coeficiente de correlación de 99,61, lo que significa que los


resultados de las extracciones obtenidas en las diferentes pruebas quedan explicadas
en un 99,61% por la dosificación de quitosano y del pH. Sin embargo, como la
curvatura no es significativa podemos concluir que el modelo lineal es adecuado para
los datos. A continuación, se muestra en una tabla la capacidad de pronóstico del
modelo propuesto.

Tabla 3.16: Capacidad de pronóstico del modelo propuesto

D. Superficie Respuesta

La representación gráfica del modelo matemático propuesto se denomina


superficie respuesta. En esta representación podemos observar visualmente los

73
rangos de dosificación de resina y de pH adecuados para obtener una determinada
extracción.

Figura 3.11: Superficie respuesta para la extracción de metal

En esta figura se observa que a medida que se aumenta el quitosano la


extracción de As aumenta, mientras que a medida que se aumenta el pH la extracción,
por el contrario, disminuye. Para observar mejor se proyecta el sólido sobre el plano
inferior obteniéndose las siguientes curvas de isovalores.

Figura 3.12: Curva de isovalores para la extracción de metal

74
En la figura podemos ver claramente que para obtener extracciones mayores a
83% debemos operar a una dosificación de quitosano >0,22 g/l y a un pH de 2,5.

3.4 Factoriales 2k sin repetición

La estrategia de factoriales de una sola repetición se utiliza por lo general en


experimentos donde hay un número grande de factores. Debido a que nosotros nunca
podemos estar totalmente seguros en qué casos el error experimental es pequeño,
una buena práctica en este tipo de experimentos es ampliar el intervalo de los niveles
de cada factor para que al calcular su efecto se garantice su influencia en la respuesta.

En un diseño factorial sin repetición, se asume que ciertas interacciones de alto


orden son insignificantes y sus varianzas se suman a la varianza del error. Esto se
denomina el principio de la escasez de efectos; es decir, que la mayoría de los
sistemas son dominados o influidos por algunos efectos principales e interacciones de
bajo orden, y la mayoría de interacciones de alto orden son insignificantes.

El principio de la escasez de efecto (principio de Pareto), ha sido observado por


muchos investigadores durante muchas décadas, sin embargo objetivamente solo
hace unos años. Li, Sudarsanam y Frey (2006) estudiaron 113 variables respuestas
obtenidas de 43 publicaciones hechas en diferentes disciplinas de la ciencia e
ingeniería. Todos los experimentos fueron factoriales completos con más de siete
variables o factores. Ellos determinaron de este estudio que el 40% de los efectos
principales fueron significativos, solamente el 11% de las interacciones de segundo
orden lo fueron y la significancia de las interacciones de tercer orden fue muy rara,
alcanzado apenas un 5%. En el 2011, Bergquist, Vanhatalo y Nordenvaad, analizaron
22 experimentos con 35 respuestas donde se utilizaron diseños factoriales completos
y fraccionados a dos niveles. Sus resultados coincidieron con los de Li, con la
excepción de que las interacciones de tercer orden fueron significativas menos
frecuentemente, alcanzando solamente un 2%.

Para analizar factoriales con un gran número de factores sin repetición se


propone el método de Daniels (1959), el cual sugiere examinar el gráfico de

75
distribución de probabilidad normal de los efectos. Los efectos que son insignificantes
son distribuidos normalmente con media cero y varianza σ2 y tienden a caer a lo largo
de esta línea recta (gráfico), mientras que los efectos significativos se alejan de la
línea recta.
Ejemplo
Un producto químico se produce en un depósito a presión en una planta piloto para
estudiar el efecto de 4 factores:

Tabla 3.17: Factores estudiados con sus respectivos niveles


Factor Nivel
Temperatura (oC) 60 80
Presión (atm) 1 2
Concentración formaldehido (g/L) 10 20
Agitación (rpm) 50 100

La matriz diseño y los resultados obtenidos se muestran en la siguiente tabla.

Tabla 3.18: Matriz diseño y resultados obtenidos

Prueba Temperatura Presión Formaldehico Agitación v_filtración


1 60 1 10 50 45
2 80 1 10 50 71
3 60 2 10 50 48
4 80 2 10 50 65
5 60 1 20 50 68
6 80 1 20 50 60
7 60 2 20 50 80
8 80 2 20 50 65
9 60 1 10 100 43
10 80 1 10 100 100
11 60 2 10 100 45
12 80 2 10 100 104
13 60 1 20 100 75
14 80 1 20 100 86
15 60 2 20 100 70
16 80 2 20 100 96

76
En primer lugar, estimamos los efectos principales y todas las interacciones
de los cuatro factores estudiados. La tabla siguiente nos muestra dichos efectos.

Tabla 3.19: Efectos principales e interacciones hasta de cuarto orden

Tabla 3.20: Análisis de varianza de los efectos principales e interacciones hasta de


cuarto orden

En la tabla 3.18 podemos evidenciar que los efectos principales A, C y D y las


interacciones de segundo orden AC y AD son mayores que todos los demás. Con la

77
tabla 3.19 no podemos concluir nada, pues al no haber grados de libertad para estimar
el error no se pueda calcular su varianza y compararla con la de los demás efectos.

Para averiguar qué efectos realmente son significativos, de acuerdo a Daniels,


presentamos el gráfico de probabilidad de todos los efectos e interacciones.

Gráfico 3.13: Probabilidad normal para velocidad de filtración

Del gráfico anterior, podemos concluir efectivamente que los únicos efectos
significativos son A(Temperatura), C(formaldehido), D(agitación) y las interacciones
de segundo orden AC y AD. Los demás efectos podemos excluirlos y hacer que sea
parte del error experimental. Entonces tendremos el siguiente diagrama de Pareto
antes y después de la exclusión.

Gráfico 3.14: Gráfico de Pareto considerando todos los efectos principales e


interacciones.

78
Gráfico 3.15: Gráfico de Pareto considerando solamente efectos principales e
interacciones de segundo orden

Tabla 3.21: Análisis de varianza de los efectos principales e interacciones de


segundo

Tanto en el gráfico de Pareto y en la tabla de análisis de varianza, por tener los


valores de p, podemos hacer cualquier afirmación con un nivel de confianza
respectivo. Particularmente, del gráfico de Pareto o de la tabla de efectos corregida
podemos afirmar que los efectos de A, C y D son positivos, esto quiere decir que para
tener una mayor velocidad de filtración tenemos que aumentar, la temperatura, la
concentración de formaldehido y la velocidad de agitación. Esto lo podemos
corroborar con el gráfico de efectos principales.

79
Gráfico 3.16: Gráfico de efectos principales y su influencia sobre la velocidad de
filtración

Sin embargo, la clave para interpretar correctamente los resultados del


experimento lo van a proporcionar las interacciones de segundo orden que también
son significativas (menos que A, pero más que C y D). En el gráfico 3.15, podemos
observar que la interacción AC es negativa (antagónica) y la interacción AD es positiva
(sinérgica). Esto se puede observar e interpretar mejor con el siguiente gráfico.

Gráfico 3.17: Gráfico de interacciones de segundo orden y su influencia sobre la


velocidad de filtración

Al observar el gráfico de la interacción AC, podemos concluir que el efecto de


la temperatura (A) cuando el nivel de formaldehido (C) es alto es poco significativo

80
sobre la velocidad de filtración, sin embargo cuando el nivel del formaldehido es bajo,
el efecto de la temperatura es alto. Entonces concluimos que para que la velocidad de
filtración sea más grande debemos operar a mayor temperatura y a menor
concentración de formaldehido. (Conclusión opuesta a solo considerar efectos
principales).

Por otro lado, considerando la interacción AD, podemos concluir que el efecto
de la temperatura sobre la velocidad de filtración es bajo cuando la agitación está al
más bajo nivel, por el contrario, el efecto de la temperatura sobre la velocidad de
filtración es alto, cuando la agitación está al más alto nivel. Por lo tanto, para que la
velocidad de filtración sea mayor debemos operar a mayor temperatura y mayor
agitación.

El modelo matemático obtenido para el proceso estudiado tiene la siguiente forma:


v_filtracion = -57.5625 + 1.2875*T - 3.75*P + 13.3*F - 1.945*A + 0.0125*T*P - 0.18125*T*F +
0.03325*T*A + 0.475*P*F - 0.015*P*A -0.0045*F*A

Con un coeficiente de correlación de 97,77%, lo que significa que la velocidad


de filtración depende en un 97,77% de los factores considerados. La superficie
respuesta generado por este modelo considerando los factores Temperatura y
concentración de formaldehido es la siguiente.

Gráfico 3.18: Gráfico de superficie respuesta para la Temperatura y la


concentración de formaldehido

81
Se observa que el mejor ensayo se consigue con una temperatura de 80 oC y
una concentración de fomaldehido de 10 g/l.

La superficie respuesta que relaciona la temperatura con la agitación está


dada por el siguiente gráfico.

Gráfico 3.19: Gráfico de superficie respuesta para la Temperatura y la agitación

En el gráfico se observa que las mejores condiciones para la velocidad de


filtración se obtienen al operar con una temperatura de 80 oC y una velocidad de
agitación de 100 rpm.

Finalmente, mostramos la superficie respuesta que relaciona la concentración


de formaldehido y la velocidad de agitación. El gráfico es el siguiente.

Gráfico 3.20: Gráfico de superficie respuesta para la concentración de formaldehido


y velocidad de agitación

82
Nuevamente, concluimos que las mejores condiciones se obtienen con una
velocidad de agitación de 100 rpm y una concentración de formaldehido de 10 g/l.

3.5.- El bloqueo o Confundido en el diseño dactorial 2k

Debido al elevado número de pruebas que implica realizar un diseño factorial


completo, resulta casi imposible realizar todas las pruebas simultáneamente. Lo
natural es entonces dividir el diseño en bloques para realizarlo en etapas, en varios
reactores o por diferentes operadores. En este caso, el número total de experimentos
cuando este se divide en “b” bloques está dado por:
2𝑘
𝑁 = ( + 𝑟) 𝑏
𝑏

Al dividir el experimento en bloques uno o más efectos pueden quedar


mezclados o confundidos con posibles efectos de bloques. Así por ejemplo si tenemos
un experimento 23 donde se muestran las 8 corridas.

Condición A B C
1 -1 -1 -1
a +1 -1 -1
b -1 +1 -1
ab +1 +1 -1
c -1 -1 +1
ac +1 -1 +1
bc -1 +1 +1
abc +1 +1 +1

Tabla 3.22: Matriz diseño del experimento 23

Si el experimento de la tabla lo dividimos en los siguientes bloques:

Bloque 1: a ab ac abc
Bloque 2: 1 b c bc

83
El efecto de bloques estará dado por la siguiente diferencia:

(a + ab + ac + abc) - (1 + b + c + bc)

Lo que no es otra cosa que el efecto principal de A (1/4{(a + ab + ac + abc) - (1


+ b + c + bc)}. Cuando esto sucede se afirma que el efecto de A se encuentra
confundido con el efecto de bloques.

Por lo tanto, cuando un experimento factorial por la operatividad es necesario


dividirlo en bloques, hay que hacerlo de tal forma que se confundan efectos poco
significativos, generalmente las interacciones de más alto orden.

El problema de evitar que se confundan efectos principales al dividir un


experimento factorial, consiste en elegir arbitrariamente los efectos que se mezclarán
en base a las siguientes reglas:

 Si se tiene un experimento 2k y se quiere dividirlo en 2p bloques, entonces existirán


2p-1 factores que se mezclarán con los efectos de bloques.
 Existen p efectos que podemos escoger arbitrariamente para mezclarlos y 2 p-1-p
efectos que se mezclarán inevitablemente, sin opción a escogerlos (llamados
interacciones generalizadas de los p efectos anteriores).
 La interacción generalizada de los p efectos es el producto de éstos, sin considerar
las letras comunes. Así por ejemplo la interacción generalizada de AB y CD es
ABxCD=ABCD y la interacción generalizada de ABC y BCD es ABCxBCD=AD.
 Los 2p bloques se forman mezclando los p efectos bajo la modalidad de la regla de
los pares e impares (se escogen los efectos que tienen un número impar de letras
comunes con el efecto que se mezclará).

Ejemplo
Un experimento factorial 24 se va a realizarlo en cuatro días diferentes
confundiendo los efectos ABD y ACD. Se desea saber cual es el programa de
experimentación para los cuatro días. Como 2p=4, entonces p=2. Existirán en total 2p-

84
1=3 efectos mezclados. Estos son ABD, ACD y BC que es la interacción generalizada
de los anteriores. Luego se listan las 16 condiciones experimentales del factorial 2 4.

1 a b ab c ac bc abc
d ad bd abd cd acd bcd abcd

En primer lugar se selecciona el efecto ABD y se mezcla con todos los


anteriores, bajo la regla de los pares e impares, es decir se divide en dos bloques, el
primero que tiene un número impar de letras comunes y el segundo un número par.

a b ac bc d abd cd abcd
1 ab c abc ad bd acd bcd

Finalmente se coge el efecto ACD y se vuelve a mezclar con los dos bloques
anteriores utilizando la misma regla, obteniéndose el plan de experimentación para
los cuatro días:

Primer día : a bc d abcd


Segundo día : b ac abd cd
Tercer día : ab c bd acd
Cuarto día : 1 abc ad bcd

3.6. Diseño Factorial Fraccionado 2k-p

Los diseños factoriales completos son buenos en el sentido que proveen


estimados para los efectos de todos los factores, así como los efectos de posibles
interacciones.

Una desventaja es que estos diseños requieren mayores cantidades de


experimentos cuando más de cuatro factores se necesitan evaluar. Por ejemplo
no es inusual desarrollar un experimento con 10 factores a dos niveles. Un diseño
factorial completo requeriría 210 = 1024 experimentos, cantidad de experimentos
demasiado grande para ejecutarse.

85
Como una alternativa a la posibilidad de obtener gran cantidad de variables,
se presentan los diseños factoriales fraccionados, en los que se ejecutan solo una
fracción del total de experimentos que se requieren, 1/2, 1/4, 1/8, etc. Lo negativo
del método es que parte de la información sobre interacciones se llega a perder.

Los diseños factoriales fraccionados son los comúnmente denominados


“Screening designs”. La mayoría de ellos son de resolución III. La razón es que
los diseños de resolución III p explorar los efectos de muchos factores con un
número mínimo de pruebas.

También se utilizan diseños de resolución IV para propósitos de selección.


En estos diseños, los efectos principales son confundidos, en el peor de los casos
con interacciones de tercer orden. Esto es mejor desde el punto de vista del
cálculo neto de los efectos, pero requieren más pruebas que un diseño de
resolución III. Una selección apropiada para utilizar diseños factoriales
fraccionados a dos niveles es que sean tanto balanceados como ortogonales.

La construcción del diseño factorial fraccionado es muy similar a la de los


bloques confundidos, pues se seleccionan los contrastes de definición (efectos)
que serán sacrificados completamente, procediéndose de la siguiente manera.

 Se seleccionan los efectos que serán sacrificados, llamados contrastes de


definición, luego se construyen los bloques y se coge cualquiera para el plan
experimental. Se sugiere que se tome el bloque que tiene la condición
experimental 1.
 Al tomar solamente un bloque, es decir una fracción del diseño completo, los
efectos se mezclan entre sí y no con los efectos de bloques. A estos factores
cuyos efectos están mezclados entre sí se denominan alias y no se puede
saber, salvo bajo ciertas premisas, cuales de ellos tienen influencia neta
sobre la respuesta.
 Los alias por definición, son aquellos factores que tienen el mismo contraste
de definición. Así el alias de cualquier factor es la interacción generalizada

86
del mismo con el contraste de definición. Al conjunto de todos los alias se
denomina estructura alias.

En general, un diseño factorial fraccionado esta definido por:

2k-p
donde:
k = número de factores a estudiar;
p = número de factores que se mezclarán entre sí.

Resolución del Diseño

El concepto de resolución del diseño es una manera útil de catalogar los diseños
factoriales fraccionados de acuerdo con los patrones alias que producen. Los diseños
de resolución III, IV y V son de particular importancia. A continuación aparecen las
definiciones de estos términos y un ejemplo de cada caso.

 Diseños de resolución III. Son diseños en los que ninguno de los efectos
principales es el alias de cualquier otro efecto principal, pero los efectos
principales tienen alias con interacciones entre dos factores, y algunas de éstas
pueden tener alias con otras. El Diseño 2 3-1 con I=ABC es un diseño con
resolución III.
 Diseños de resolución IV. Son diseños en los que ningún efecto principal tiene
alias con cualquier otro efecto principal o con interacciones entre dos factores,
pero estas pueden tener alias entre si. El diseño 2 4-1 con I=ABCD es un
ejemplo.
 Diseños de resolución V. Son diseños en los que ningún efecto principal o
interacción entre dos factores tiene alias con cualquier otro efecto principal o
interacción entre dos factores. Un diseño 25-1 con I=ABCDE es un ejemplo.

Resulta muy útil presentar un resumen de los diseños factoriales fraccionados a


dos niveles hasta para 11 factores, que originalmente publicó en el libro Statistics for
Experimenters by G.E.P. Box, W.G. Hunter, and J.S. Hunter (New York, John Wiley &

87
Sons, 1978). Y también se publicó en el libro Design and Analysis of Experiments, 5th
edition by Douglas C. Montgomery (New York, John Wiley & Sons, 2000).

Estos diseños difieren en la notación para los contrastes de definición o


generadores. Box, Hunter, y Hunter usan números y Montgomery usa letras
mayúsculas de acuerdo al siguiente esquema:

Notamos la ausencia de la letra I. Esto se reserva usualmente para la columna


donde todos los factores se encuentran en el nivel más bajo 1. Como un ejemplo de
la notación dada por estos autores, notemos aue el generador del diseño "6 = 12345"
es equivalente a "F = ABCDE".

La siguiente tabla muestra un catálogo de los diseños factoriales más utilizados


de acuerdo a la notación descrita previamente. Las letras en romano nos proporcionan
la resolución del diseño.

88
TABLA 3.23 Resumen de Diseños Factoriales Fraccionados
Número de Factores, k Diseño Pruebas N

3 2III3-1 4
4 2IV4-1 8
5 2V5-1 16
5 2III5-2 8
6 2VI6-1 32
6 2IV6-2 16
6 2III6-3 8
7 2VII7-1 64
7 2IV7-2 32
7 2IV7-3 16
7 2III7-4 8
8 2VIII8-1 128
8 2V8-2 64
8 2IV8-3 32
8 2IV8-4 16
9 2VI9-2 128
9 2IV9-3 64
9 2IV9-4 32
9 2III9-5 16
10 2V10-3 128
10 2IV10-4 64
10 2IV10-5 32
10 2III10-6 16
11 2V11-4 128
11 2IV11-5 64
11 2IV11-6 32
11 2III11-7 16
15 2III15-11 16
31 2III31-26 32

89
Ejemplo 3:
Se desea realizar una investigación para maximizar la extracción de un
metal pesado de un efluente mediante un proceso de extracción por solventes a nivel
de laboratorio, considerando los siguientes factores:

Factor Nivel (-1) Nivel (+1)


Tiempo (h) 0,5 1,5
pH 1,0 2,0
A/O 1,0 3,0
Agitación (rpm) 5,0 10,0
Temperatura (oC) 5,0 10,0
Flujo (m3/h) 1,0 5,0
Tabla 3.24: Factores y niveles para el experimento 26-2

Supongamos que el laboratorio de pruebas está simulado por la siguiente


ecuación general, donde k es el número de factores.

 1  x   x  x 2j   2 * aleatorio ()  1
k
1 2
E (%) 
2
j j 1
100 j 1, 3, 5

Desarrollando para k =6 tenemos el siguiente modelo de simulación:

E (%) 
1
100
     
1  x1 2  ( x2 x12 2  1  x3 2  x4  x32 2  1  x5 2  x6  x52   2 * aleatorio ()  1
2

Para las 6 variables (k = 6), se puede utilizar un diseño 2 6-2 = 16


experimentos. Como vamos a tomar un cuarto de réplica significa dividir el diseño en
4 bloques, es decir que 2p=4, es decir que p =2, en otras palabras hay dos factores
que se sacrificarán. Adicionalmente a las 16 pruebas habrá de añadirse 3 pruebas
repetidas en el centro, para evaluar el error experimental.

Antes de realizar el experimento es necesario observar la estructura alias,


la que nos indicará si los efectos principales se pueden estimar independientemente
o no, porque se encuentran mezclados con otros efectos.

90
Contraste Efectos
1 A
2 B
3 C
4 D
5 E
6 F
7 AB+CE
8 AC+BE
9 AD+EF
10 AE+BC+DF
11 AF+DE
12 BD+CF
13 BF+CD

Tabla 3.25: Estructura alias para 1/4 fracción del experimento

La tabla de la estructura alias, nos indica que los 6 factores principales pueden
estimarse independientemente, no así las interacciones de segundo y mayor orden.
Si seleccionamos 1/8 de réplica la estructura alias sería la siguiente:

Contraste Efectos
1 A+BD+CE
2 B+AD+CF
3 C+AE+BF
4 D+AB+EF
5 E+AC+DF
6 F+BC+DE
7 AF+BE+CD

Tabla 3.26: Estructura alias para 1/8 fracción del experimento

En este caso al considerar 1/8 de réplica observamos que todos los efectos
principales se encuentran mezclados con interacciones de segundo orden, por lo que
no podríamos realizar este fraccionamiento. A continuación se muestra la matriz
diseño correspondiente. Es posible aplicar este diseño siempre y cuando sepamos
de antemano que las interacciones de segundo orden son poco significativas en el
proceso o investigación que vamos a realizar.

91
t pH A/O agitación T Flujo Extraccion
0.5 1 1 5 5 1 6.50
1 1 1 5 10 1 99.70
0.5 2 1 5 10 5 92.15
1 2 1 5 5 5 3.82
0.5 1 3 5 10 5 91.40
1 1 3 5 5 5 3.86
0.5 2 3 5 5 1 6.88
1 2 3 5 10 1 99.14
0.5 1 1 10 5 5 4.81
1 1 1 10 10 5 91.55
0.5 2 1 10 10 1 98.97
1 2 1 10 5 1 6.05
0.5 1 3 10 10 1 98.72
1 1 3 10 5 1 5.75
0.5 2 3 10 5 5 3.85
1 2 3 10 10 5 90.53
0.75 1.5 2 7.5 7.5 3 28.69
0.75 1.5 2 7.5 7.5 3 29.74
0.75 1.5 2 7.5 7.5 3 28.89

Tabla 3.27: Matriz del diseño factorial fraccionado con réplica en el centro y
respuestas.

Con los datos obtenidos se calcula el efecto  para cada una de las
variables e interacciones como sigue:

Efecto t pH A/O agitación T Flujo


 -0,36 -0,1125 -0,4275 -0,4025 90,08 -4,9675

Tabla 3.28: Efectos principales de los 6 factores

Representando estos efectos medios mediante el diagrama de Pareto, podemos


evidenciar que los efectos más importantes en este proceso son la Temperatura y en
menor proporción el flujo. La temperatura tiene efecto positivo sobre la extracción del
metal pesado y el flujo efecto negativo respectivamente.

92
Gráfico 3.21: Estimación de los efectos mediante Pareto

Para tener evidencia estadística de que efectivamente estos efectos son


realmente importantes, se elabora la tabla de análisis de varianza (ANAVA), en la cual
se compara la varianza de cada efecto contra la varianza del error calculando las
siguientes sumatorias.
2
 N 
  X ij Y j 
SS Efecto   i 1 
Nr

 
n0
SS Error   Yi 0  Y 0
2

i 1

SS Curvatura 

Nn0 Y  Y 0 
N  n0

Tabla 3.29: Análisis de la Varianza

93
De la tabla podemos observar que los efectos realmente significativos son la
Temperatura, el flujo y la falta de ajuste, lo que significa que la curvatura es
significativa dentro de la región investigada, por lo que existe un valor óptimo que
puede determinarse utilizando un modelo no lineal.

 El modelo matemático obtenido por regresión múltiple lineal es :

A
E (%)  82,76  0,72 t  0,11 pH  0,21  0,08 Agitación  18 T  1,24 Flujo
O

Al representar este modelo en el espacio, obtenemos la superficie respuesta


característica en función de los factores. En este caso se han representado los
factores más significativos del proceso. Podemos observar que la temperatura tiene
un efecto realmente grande sobre la extracción.

Gráfico 3.22: Superficie respuesta del experimento mediante factorial fraccionado

94
Gráfico 3.23: Representación mediante curvas de isovalores de la superficie
respuesta

3.7.- Diseños De Placket-Burmann

En 1946, R.L. Plackett and J.P. Burman publicaron su famoso artículo "The
Design of Optimal Multifactorial Experiments" en Biometrika (vol. 33). Este
artículo describe la construcción de diseños muy económicos con un número de
corridas múltiplo de 4 (más que potencia de 2). Los diseños de Plackett-Burman
son diseños de selección muy eficientes cuando solamente son de interés los
efectos principales en un proceso.

Estos diseños son de Resolución III y se conoce como de Efectos


Principales Saturados debido a que todos los grados de libertad son utilizaddos
para estimar los efectos principales. Sin embargo, estos diseños son muy útiles
económicamente porque detectan grandes efectos principales, asumiendo que
todas las interacciones son despreciables comparadas con estos.

Este diseño desarrollado permite estudiar un gran número de variables,


reduciéndolas luego a un grupo pequeño para posterior experimentación. Es un
tipo especial de diseño factorial fraccionado, donde se puede estudiar k variables

95
en N pruebas experimentales, donde N > k y otorga la posibilidad de
experimentar con N-1 variables.

El modelo contempla el uso de las denominadas variables ficticias (no


representa a ninguna variable experimental) y se utilizan para determinar la
varianza del error experimental. Por esta razón es conveniente introducir en el
diseño por lo menos 3 variables ficticias.

Para construir un diseño P-B, se toma un vector de tamaño n determinado


y con el se generan los restantes vectores. Por ejemplo, si n =8 combinaciones,
el vector generador consiste de n-1 = 7 valores que son : (+ + + - + - -). La matriz
de diseño se contempla como sigue:

1. Utilizar el vector generador como la primera fila, n1 .


2. La segunda fila, n2 , se llena tomando el primer valor de n1 y colocándolo
en el último lugar de la fila n2 y deslizando luego los demás valores de n1
delante de ese primer valor.
3. La tercera fila, n3 ,se construye utilizando el último valor de la fila n2 y
colocando en el último lugar de la fila n3 y deslizando a partir de ese los
restantes valores de n2 .
4. Continuar hasta que todas las (n-1) filas se completen.
5. Completar la fila n con valores negativos (-1).

Los vectores generados para los diversos diseños P-B son como sigue:

n=8 + + + - + - -
n=12 + + - + + + - - - + -
n=16 + + + + - + - + + - - + - - -
n=20 + + - - + + + + - + - + - - - - + + -
n=24 + + + + + - + - + + - - + + - - + - + - - - -
Tabla 3.30: Vectores generadores para diferentes plantillas

96
 Obsérvese que los valores de n son múltiplos de 4 y el total de variables a
experimentar (inclusive las variables ficticias) es igual a n-1.

 Supóngase que se quiere experimentar con 4 variables (k=4), el número de


pruebas es n=8 y el total de variables a considerar es n-1=7, según la tabla anterior.
Obsérvese que si son 4 variable reales y 7 el total de variables a considerar,
entonces 3 variables serán ficticias.
N X1 X2 X3 X4 F1 F2 F3
1 + + + - + - -
2 + + - + - - +
3 + - + - - + +
4 - + - - + + +
5 + - - + + + -
6 - - + + + - +
7 - + + + - + -
8 - - - - - - -

Tabla 3.31: Diseño P-B con 4 variables reales, 3 variables ficticias y 8 pruebas.

 Ahora supóngase que se desea experimentar con 8 variables. Se escoge un


diseño P-B con 12 pruebas y 11 variables. La matriz codificada se da en la Tabla
2.15.

N X1 X2 X3 X4 X5 X6 X7 X8 F1 F2 F3
1 + + - + + + - - - + -
2 + - + + + - - - + - +
3 - + + + - - - + - + +
4 + + + - - - + - + + -
5 + + - - - + - + + - +
6 + - - - + - + + - + +
7 - - - + - + + - + + +
8 - - + - + + - + + + -
9 - + - + + - + + + - -
10 + - + + - + + + - - -
11 - + + - + + + - - - +
12 - - - - - - - - - - -

Tabla 3.32: Diseño P-B con 8 variables reales, 3 variables ficticias y 12 pruebas.

97
Tabla 3.33: Diseño P-B con 12 variables reales, 3 variables ficticias y 16 pruebas.

98
Tabla 3.34: Diseño P-B con 16 variables reales, 3 variables ficticias y 20 pruebas

99
Tabla 3.35: Diseño P-B con 20 variables reales, 3 variables ficticias y 24 pruebas

100
Tabla 3.36: Diseño P-B con 28 variables reales, 3 variables ficticias y 32 pruebas

101
Ejemplo 4:
Consideremos el mismo ejemplo anterior, donde se desea realizar una
investigación para maximizar la extracción de metal pesado de un efluente mediante
un proceso de extracción por solventes a nivel de laboratorio, considerando los
siguientes factores:

Factor Nivel (-1) Nivel (+1)


Tiempo (h) 0,5 1,5
pH 1,0 2,0
A/O 1,0 3,0
Agitación (rpm) 5,0 10,0
Temperatura (oC) 5,0 10,0
Flujo (m3/h) 1,0 5,0

Tabla 3.37: Factores y niveles para el diseño Plackett-Burmann

Supongamos que el laboratorio de pruebas está simulado por la siguiente


ecuación general, donde k es el número de factores.

 1  x   x  x 2j   2 * aleatorio ()  1
k
1 2
E (%) 
2
j j 1
100 j 1, 3, 5

Desarrollando para k =6 tenemos el siguiente modelo de simulación:

E (%) 
1
100
     
1  x1 2  ( x2 x12 2  1  x3 2  x4  x32 2  1  x5 2  x6  x52   2 * aleatorio ()  1
2

En este caso para reducir el número de pruebas considerablemente, utilizamos


la matriz de la tabla 2.15, en la que tenemos 5 grados de libertad para evaluar el error
experimental, por lo que no necesitamos realizar ninguna réplica.

En este caso el proceso de cálculo para determinar los efectos es el mismo que
los anteriores:

102
2
 N 
  X ij Y j 
 i 1 
SS Efecto 
Nr

Lo que cambia en el diseño P-B es la estimación de la varianza del error, la cual


se determina en función de las variables ficticias, de la siguiente manera:

n0
SS Error   EF 
2

i 1

EF = efecto de las variables ficticias.

SS Error
MS Error 
nF

Donde, nF = número de variables ficticias.

Para el ejemplo que estamos desarrollando la matriz diseño correspondiente al


diseño de Placket-Burmann sería la siguiente:

t pH A/O agitación T Flujo Extraccion


1.5 1 3 5 5 1 6.32
1.5 2 1 10 5 1 5.75
0.5 2 3 5 10 1 98.37
1.5 1 3 10 5 5 4.16
1.5 2 1 10 10 1 99.99
1.5 2 3 5 10 5 92.11
0.5 2 3 10 5 5 4.26
0.5 1 3 10 10 1 99.12
0.5 1 1 10 10 5 91.81
1.5 1 1 5 10 5 92.00
0.5 2 1 5 5 5 4.90
0.5 1 1 5 5 1 7.07

Tabla 3.38: Matriz para el diseño de Placket-Burmann

Con los datos obtenidos se calcula el efecto  para cada una de las
variables e interacciones como sigue:

103
Efecto t pH A/O agitación T Flujo
 -0,87 -0,82 -0,47 -0,72 90,16 -4,56

Tabla 3.39: Efectos principales para todos los factores


Representando estos efectos medios mediante el diagrama de Pareto, podemos
evidenciar que los efectos más importantes en este proceso son la Temperatura y en
menor proporción el flujo, muy similar a la utilización del diseño fraccionado, pero con
menos pruebas.

Gráfico 3.24: Representación de los efectos medios mediante Pareto

Para tener evidencia estadística de que efectivamente estos efectos son


realmente importantes, se elabora la tabla de análisis de varianza (ANAVA), en la cual
se compara la varianza de cada efecto contra la varianza del error, utilizando las
fórmulas dadas anteriormente.

Tabla 3.40: Análisis de Varianza de los efectos principales

104
De la tabla podemos observar que los efectos realmente significativos son la
Temperatura y el flujo, resultados idénticos a los obtenidos utilizando un diseño
factorial fraccionado con mayor número de pruebas y repeticiones en el centro. El
modelo matemático obtenido por regresión múltiple lineal es :

A
E (%)  83,23  0,87 t  0,82 pH  0,24  0,14 agitación  18 ,03T  1,14 Flujo
O

Al representar este modelo en el espacio, obtenemos la superficie respuesta


característica en función de los factores.

Gráfico 3.25: Superficie Respuesta utilizando un diseño P-B

Gráfico 3.26: Curvas de Isovalores obtenidas con un diseño P-B

105
3.8 Diseños Supersaturados

Un diseño saturado se define como un factorial fraccionado en el que el número


de factores o variables del diseño variables k= N-1, donde N es el número de ensayos.
En los últimos años, ha habido un interés considerable en el desarrollo y uso de
diseños supersaturados para experimentos de selección de factores. En un diseño
sobresaturado, la cantidad de variables k>N-1, y generalmente estos diseños
contienen muchas más variables que ejecuciones.

La idea de usar diseños sobresaturados fue propuesta por primera vez por
Satterthwaite (1959). El propuso generar estos diseños al azar. Posteriormente, hubo
una amplia discusión de esta propuesta, y algunas de las principales autoridades en
diseño actual, incluidos Jack Youden, George Box, J. Stuart Hunter, William Cochran,
John Tukey, Oscar Kempthorne y Frank Anscombe criticaron estos diseños aleatorios
equilibrados. Como resultado, los diseños supersaturados recibieron poca atención
durante los siguientes 30 años. Un notable La excepción es el diseño sobresaturado
sistemático desarrollado por Booth y Cox (1962). Sus diseños no se generaron
aleatoriamente, lo cual fue una desviación significativa de los diseños propuestos por
Satterthwaite. Generaron sus diseños con métodos elementales de búsqueda por
computadora. Ellos también desarrollaron los criterios básicos por los cuales se juzgan
los diseños sobresaturados.

Lin (1993) revisó el concepto de diseño sobresaturado y estimuló mucho más


investigación sobre el tema. Muchos autores han propuesto métodos para construir
diseños sobresaturados. La mayoría de las técnicas de construcción de diseño son
limitados procedimientos de búsqueda por computadora basados en heurística simple
[véase Lin (1995), Li y Wu (1997), y Holcomb y Carlyle (2002), por ejemplo]. Otros han
propuesto métodos de construcción basados en diseños óptimos.

Otro método de construcción para diseños sobresaturados se basa en la


estructura de diseños ortogonales existentes. Estos incluyen el uso de la media
fracción de las matrices Hadamard [Lin (1993)] y enumerando las interacciones de
dos factores de ciertas matrices Hadamard [Wu (1997)]. Una matriz de Hadamard es
una matriz cuadrada ortogonal cuyos elementos son -1 o +1. Cuando el número de

106
factores en el experimento excede el número de ejecuciones, la matriz de diseño no
puede ser ortogonal En consecuencia, las estimaciones del efecto factorial no son
independientes. Un experimento con un factor dominante puede contaminar y
oscurecer la contribución de otro factor. Los diseños sobresaturados se crean para
minimizar esta cantidad de no polaridad entre factores.

Lin propuso una clase de diseños sobresaturados especiales que se pueden


construir fácilmente a través de medias fracciones de las matrices Hadamard. Estos
diseños pueden analizar k = N - 2 factores con n = N / 2 ejecuciones, donde N es el
orden de la matriz Hadamard. Los diseños de Plackett y Burman se pueden ver como
una clase especial de las matrices de Hadamard que se usan para ilustrar el método
de construcción básico.

La Tabla 3.39 muestra el diseño original de 12 corridas de Plackett y Burman.


Tomaremos la columna 11 como una columna bifurcación, lo que significa que
dividimos las 12 corridas en dos grupos de 6 corridas cada uno, de acuerdo con el
inicio de sesión de la columna 11. Entonces las ejecuciones (filas) se pueden dividir
en dos grupos: grupo I con el signo de +1 en la columna 11 (filas 2, 3, 5, 6, 7 y 11) y
el grupo II con el signo de -1 en la columna 11 (filas 1, 4, 8, 9, 10 y 12). Eliminar la
columna 11 del grupo I causa que las columnas 1-10 formen un diseño sobresaturado
para examinar N - 2 = 10 factores en N / 2 = 6 corridas (corridas 1-6, como se indica
en la Tabla 3.40).

Tabla 3.41: Diseño supersaturado derivado de la matriz Hadamard de orden 12

107
Tabla 3.42: Diseño supersaturado obtenido de la tabla anterior (N=6 y k=10)

Se puede demostrar que si el grupo II se usa, el diseño sobresaturado


resultante es equivalente. En general, una matriz de diseño de Plackett y Burman se
puede dividir en dos medias fracciones de acuerdo con una columna de bifurcación
específica cuyos signos son iguales a +1 o -1. Específicamente, se sugiere tomar solo
las filas que tienen +1 en la columna de bifurcación. Entonces las N - 2 columnas
distintas de la columna de ramificación formarán un diseño sobresaturado para N - 2
factores en N / 2 corridas. A juzgar por E (s2), estos diseños han demostrado ser
óptimos entre todos los demás diseños sobresaturados.

Los diseños sobresaturados se analizan típicamente por métodos de ajuste de


modelo de regresión, como el método de selección hacia adelante. En este
procedimiento, las variables se seleccionan de una en una para incluirlos en el modelo
hasta que no aparezcan otras variables útiles que expliquen la respuesta

A continuación, se muestran algunas matrices óptimas obtenidas mediante un


algoritmo evolutivo, donde el número de corridas es el mismo, pero varía el número
de factores estudiados.

108
Matriz 12R14F Tabla 3.43: Algunas matrices óptimas para el caso 12R

109
110
2.9 Eficiencia de un diseño

Mee (2004), y Daniel (1956) definieron la eficiencia de un diseño experimental


en función de los grados de libertad considerados para estimar los efectos principales
y las interacciones de segundo orden como:

Númerodeefectosestimados
df eficiencia 
totalde grados delibertad

Para k factores existen obviamente, k efectos principales y k(k − 1)/2


interacciones, de modo que el total de efectos es 0.5k(k + 1). Puesto que los grados
de libertad son siempre n − 1, la eficiencia puede definirse como:

0,5k k 1
df eficiencia 
n1
Los diseños más eficientes son aquellos para los cuales la fracción anterior es

cercana a 1.0, lo que significa 100 por ciento de eficiencia. Un diseño 25− 1 es 100 por

ciento eficiente puesto que la fracción 15/16 es cercana a la unidad, por eso es común
utilizar diseños factoriales 2k-p que tengan eficiencias cercanas al 100%.

111

Potrebbero piacerti anche