Sei sulla pagina 1di 12

Introduccin al Diseo de Experimentos

Autor: Ing. Alberto E. Ramperti Rubber Service SRL aramperti@rubberservice.com.ar

Definicin Se entiende por diseo experimental la realizacin de una serie de experimentos previamente diseados donde se varan los valores de las variables de entrada de un proceso o sistema y se miden los valores de la respuesta de salida Imaginemos que en la figura Nro 1 tenemos un proceso de vulcanizacin por x1 x2 x3 x4 e y

z1..zi

Figura Nro 1 inyeccin donde e (entrada) es el compuesto que se introduce en la mquina, x1 a x4 son las variables con las que vamos a trabajar en el diseo de experimentos, que pueden ser por ejemplo: X1 : Temperatura del molde X2 : Temperatura de la cmara de precalentamiento de material X3 : Cantidad de acelerante secundario X4 : Cantidad de reductor de viscosidad agregado en la formulacin Z1...zi son otras variables que intervienen en el proceso y que nosotros intentaremos mantener constantes durante el experimento, como por ejemplo la temperatura a la que entra el compuesto en la inyectora, el ciclo de venteo, etc. Finalmente, y ser la respuesta de salida que deseamos estudiar, por ejemplo, la cantidad porcentual de material defectuoso por la suma de distintos tipos de fallas de llenado. Concretando, intentaremos conocer como vara el porcentaje de material defectuoso en funcin de la temperatura del molde, temperatura de la cmara de calentamiento de material, del porcentaje de acelerante secundario utilizado y del porcentaje de reductor de viscosidad agregado a la formulacin bsica, manteniendo constantes otros valores que

tambin podran actuar como variables, tales como la temperatura de entrada del compuesto a la mquina y sus ciclos de venteo. Generalizando, podemos aplicar el diseo de experimentos para : Determinar que variables tienen mayor influencia en los valores de respuesta y. Determinar el mejor valor de las variables x para tener un valor cercano al valor de respuesta deseado. Determina el mejor valor de las variables para que el valor de la respuesta tenga la menor variabilidad.

El diseo experimental es utilizado ampliamente para la mejora de rendimiento de los procesos industriales como para el desarrollo de nuevos procesos, ahorrando tiempos y costos de desarrollo. Aporta adems el conocimiento profundo de los procesos, generando herramientas eficaces de manejo de los mismos. Dice Douglas Montgomery en el primer captulo de su libro titulado Diseo y Anlisis de Experimentos lo siguiente : Para que un experimento se realice en la forma ms eficiente, es necesario emplear mtodos cientficos en su planeacin. El diseo estadstico de experimentos es el proceso de planear un experimento para obtener datos apropiados que puedan ser analizados mediante mtodos estadsticos, con objeto de producir conclusiones vlidas y objetivas .Se requiere de un enfoque estadstico del diseo de experimentos para obtener conclusiones significativas a partir de los datos. La metodologa estadstica es el nico enfoque objetivo para analizar un problema que involucre datos sujetos a errores experimentales. As que hay dos aspectos en cualquier problema experimental: el diseo del experimento y el anlisis estadstico de los datos A efectos de poder dar un enfoque estadstico al diseo se debern respetar tres principios bsicos en el diseo de experimentos: Replicacin, o repeticin de ensayos Aleatorizacin de experimentos Anlisis por bloques. El problema ms importante para la aplicacin del diseo experimental en la industria es que la enorme mayora de los tcnicos no conoce en profundidad sobre estadstica, y consecuentemente menos sobre su aplicacin al diseo experimental. Sin embargo, esto ha dejado de ser un problema con el acceso generalizado a la computacin, que nos provee de herramientas altamente eficientes en el tema y nos permite dedicarnos prcticamente con exclusividad al anlisis de resultados, como veremos ms adelante, abriendo las puertas masivamente a este tipo de tecnologas. Para poder realizar un programa de experimentos, es necesario previamente comprender el problema que se desea estudiar, elegir las variables ms apropiadas y sus niveles de uso, elegir la o las salidas de respuesta a evaluar, el modelo de diseo

experimental a utilizar, realizar el experimento, analizar los datos y sacar las conclusiones correspondientes. Respecto de las variables a utilizar durante el experimento, juegan un papel de gran importancia la experiencia previa del experimentador como su nivel de conocimientos tecnolgicos especficos. La eleccin inapropiada de los niveles de las variables se traduce en la obtencin de respuestas fuera de los niveles esperados. Por ejemplo, la eleccin de niveles inapropiados de negro de humo en un compuesto determinado dar resultados de tensin de rotura fuera del rango que buscamos. En relacin al modelo de diseo experimental a utilizar, existe una gran variedad desarrollados en base al uso de las tcnicas estadsticas y su aplicacin de clculos en forma manual, o histrica, como pueden verse en la lista siguiente : Diseos por bloques aleatorizados Cuadrados latinos Diseos por bloques incompletos Diseo factorial 2K Diseos fraccionarios de 2 niveles Diseos factoriales 3K Diseos factoriales 3k fraccionarios Diseos Jerrquicos Anlisis de regresin lineal Superficie de Respuesta

Todas estas tcnicas han dado un significativo aporte a la historia de la investigacin. Sin embargo casi todas ellas, salvo el estudio de superficies de respuesta adolecen del error de simplificacin que implica suponer que las variaciones de respuesta son lineales con las de las variables. Esto significa que se supone que las respuestas no tienen curvatura y pueden ser representadas por ecuaciones de primer grado. El esquema de Superficie de Respuesta asume en principio que todas las variables son de segundo grado, lo que implica una mayor complejidad en la resolucin de los temas relacionados al anlisis estadstico. Su principio fundamental es trabajar con el concepto de lnea de regresin, aplicado a una ecuacin de segundo grado, que cuando se usa para dos variables independientes se transforma en una superficie de respuesta, de donde toma su nombre. La ecuacin fundamental para dos variables se representa de la siguiente forma: Y = A11X1^2 + A1X1 + A22X2^2 + A2X2 + A12X1X2 + A0 (1) Donde Y es la respuesta que estudiamos, X1 y X2 las variables que modificamos y los diversos Aij los coeficientes de la ecuacin que definen el proceso. En este tipo de modelo de diseo se requiere realizar un mnimo de 11 ensayos, segn el siguiente esquema.

1,0

1,1

X1

0.5,0.5

0,0

X2 Figura Nro 2

0,1

En el punto central se requieren hacer 3 ensayos como mnimo para poder determinar el error puro de nuestros mtodos de trabajo. Trabajando de esta manera tendremos que determinar los 6 coeficientes Aij de la ecuacin anterior utilizando los resultados de nuestros 11 experimentos y aplicando el concepto de curva de regresin. Sin entrar en desarrollos matemticos, que se encuentran en la literatura especfica, el problema se reduce a resolver la siguiente ecuacin matricial : Aij = X/(XX) Donde Y1 Y2 Y3 .... .... .... .... Yn (X11-X1m) (X21-X2m)....... (X21-X1m) (X22-X2m)....... (X31-X1m) (X31-X2m)....... .............................................. ............................................. .............................................. .............................................. (Xn1-X1m) (Xn1-X2m).......

Y=

Aij=

A11 A1 A22 A2 A12 A0

X=

son las matrices de los resultados, coeficientes y variables.

Es en este punto donde un elevado porcentaje de los tecnlogos de la industria encuentra un freno a sus aspiraciones de aplicacin de este tipo de metodologas por desconocimiento de la resolucin de matrices y de la aplicacin de estadsticas a la metodologa de diseo de desarrollo. Sin embargo, desde la instalacin masiva en los mercados de los computadores personales, y el posterior desarrollo de programas especficos dedicados a la resolucin de este tipo de temas, han permitido el fcil acceso de los tcnicos a este tipo de aplicaciones. Dado que este modelo de anlisis por superficie de respuestas involucra de hecho a la gran mayora de los modelos conocidos, es el que debe tomarse como base de los trabajos a realizar, y para ello existen 2 caminos: 1. Comprando y usando un programa de diseo de experimentos que incluya el modelo de superficies de respuesta 2. Utilizando Excel, que resuelve el clculo matricial Existen varios programas de computacin especficamente desarrollados para este tema, entre los cuales podemos citar los producidos por : Design Expert E-Chip JMP Minitab Statgraphics Statistica Para poder utilizar Excel es necesario conocer los fundamentos estadsticos del diseo de experimentos y plantear sus ecuaciones para determinacin de errores, anlisis de variancia (ver ms adelante) y clculo matricial. A efectos de resolver el clculo matricial arriba presentado, existen en Excel funciones como MDETERM, MINVERSA, MMULT, TENDENCIA, etc. Ya provisto de la herramienta, solo queda seguir las distintas etapas propuestas por el modelo, realizar los ensayos e interpretar los resultados. Vamos a desarrollar un ejemplo para ver desde el punto de vista prctico como se desarrollan las distintas etapas del proceso de investigacin. Ejemplo de aplicacin Supongamos que tenemos un compuesto de caucho natural, al que necesitamos optimizar su tiempo de vulcanizacin, por lo que decidimos minimizar el valor de T90. Luego de evaluaciones previas entendemos que debemos trabajar en 2 variables, que en este caso sern la cantidad de azufre y la cantidad de un agente de dispersin, Maxiflow DAX, y que nuestro criterio nos sugiere trabajar en el siguiente entorno de ensayos: Valor mnimo (phr) Valor Mximo (phr)

Azufre Maxiflow DAX

1.5 0

2.5 6

Las dems variables de la formulacin y las condiciones de temperatura las mantendremos constantes. Introduciendo estos datos en el programa de computacin que hayamos adquirido, o en la tabla Excel que hayamos desarrollado, se obtendr, de acuerdo al modelo sugerido en la figura Nro 2, el siguiente esquema de ensayos a realizar:

variable valor max. valor min. lim.superior fact.superior valor medio fact.inferior lim.inferior

Max.DAX Azufre 6 2.5 0 1.5 6.00 5.12 3.00 0.88 0.00 2.50 2.35 2.00 1.65 1.50

esquema de ensayos a realizar Max.DAX Azufre 1 6.00 2.00 2 0.00 2.00 3 3.00 2.50 4 3.00 1.50 5 5.12 2.35 6 5.12 1.65 7 0.88 2.35 8 0.88 1.65 9 3.00 2.00 10 3.00 2.00 11 3.00 2.00 esquema de ensayos a realizar Esta distribucin de ensayos a realizar se conoce como matriz rotacional de Box Wilson. Existen otros modelos que difieren en su distribucin, pero en su esencia no modifican la tcnica de trabajo ni los resultados a obtener. A partir de este modelo el tecnlogo debe realizar los 11 compuestos correspondientes, obteniendo los valores de T90 para cada uno de ellos, y cuidando de realizar los ensayos en forma aleatoria, a efectos de aleatorizar los errores. Puede

observarse que los ensayos 9, 10 y 11 tienen los mismos valores de las variables, corresponden al punto central de la figura 2, y sirven para determinar el error puro (ver ms adelante). Una vez obtenidos los valores de T90 los introducir en su programa, el que , como resultado de la aplicacin del clculo matricial del que antes hablamos arrojar los siguientes resultados:

Fecha: 19-Ago-02 Evaluacin de : Compuesto NR - 1 Propiedad medida : T90 Coeficientes Anlisis de Variancia Fuente de variacin Regresin Error Modelo Error puro Total R^2= 0.9813 S/Coef. 8.514 10.245 9.346 8.164 8.929 7.981 10.041 9.318 7.900 7.900 7.900 Error 0.086 -0.245 0.154 -0.064 -0.029 0.119 0.059 -0.118 0.100 0.000 -0.100 Suma de Grados de Media de cuadrados Libertad Cuadrados Fo 7.772 0.148 0.128 0.020 7.919 5 5 3 2 10 1.554 0.030 0.043 0.010 6 coef. val. adoptado b11 0.164 b01 -1.425 b22 3.419 b02 -12.72 b12 0.075 bo 22.01

Probab. 52.601 0.00025 4.258 0.19602 99.97 80.40

Ens.Nro T90 Max.DAX Azufre 1 8.6 6.00 2.00 2 10 0.00 2.00 3 9.5 3.00 2.50 4 8.1 3.00 1.50 5 8.9 5.12 2.35 6 8.1 5.12 1.65 7 10.1 0.88 2.35 8 9.2 0.88 1.65 9 8 3.00 2.00 10 7.9 3.00 2.00 11 7.8 3.00 2.00

Resumiendo, usted ha indicado los entornos de trabajo de las variables, el programa le indica que ensayos debe realizar, usted los hace, introduce los resultados para cada

ensayo, pulsa una tecla de su computador, y el programa le devuelve el resultado final del experimento, que usted deber interpretar para poder obtener conclusiones. En las 2 ltimas columnas de la derecha pueden verse los coeficientes Aij de la ecuacin (1) de la pgina 3, que en este caso se expresa en minutos de la siguiente manera: T90 = 0.164xDAX2 1.425x DAX + 3.419xS 2 12.72xS + 0.075xDAXxS + 22.01 (2) Donde DAX es la concentracin de Maxiflow DAX y S es la concentracin de Azufre, ambos expresados en phr en la formulacin. Tanto el programa que usted haya adquirido como Excel, le permitirn graficar la ecuacin (2) o la resolvern matemticamente para determinar el menor valor de T90 obtenible, o el valor de T90 que usted prefiera, obteniendo los valores de DAX y S que le permiten cumplir esa condicin. En el grfico siguiente, de ejes de coordenadas que representan la concentracin

de Azufre y de Maxiflow DAX se grafican curvas de valor de T90 constante, correspondientes a la ecuacin (2) de la pgina anterior. Las flechas indican las direcciones

hacia donde los valores de T90 disminuyen, por lo que el valor mnimo debe encontrarse en las inmediaciones del punto negro de la parte central del grfico. La resolucin matemtica de la ecuacin (2) ratifica lo que el grfico nos deja ver y nos indica que el valor mnimo es T90=7.66 minutos y que corresponde a concentraciones de Maxiflow DAX = 3.92 phr y Azufre = 1.82 phr En la parte inferior de la tabla de la pgina anterior se pueden ver todos los datos de los ensayos, los resultados de T90 obtenidos, y los valores que se obtienen por aplicacin de la ecuacin matemtica obtenida y el error generado entre la ecuacin y los resultados de laboratorio. Anlisis de Variancia El anlisis de variancia nos ofrece un modo objetivo de determinar si el conjunto de resultados obtenidos de los ensayos realizados en el experimento, y sujeto a errores, es vlido. Sin la intencin de introducirnos en un anlisis terico del tema, describimos los distintos items alli mostrados: Grados de libertad total : Nmero total de ensayos realizados 1 Grados de libertad de la regresin: Nmero de coeficientes de la ecuacin matemtica que la describe 1 Grados de libertad del error : Grados de libertad total Grados de libertad de la regresin Grados de libertad del error puro: Nmero de replicaciones 1 Grados de libertad del error del modelo : Grados de libertad del error - Grados de libertad del error puro Suma de Cuadrados Regresin = (Y Ym)2 donde Ym = promedio de los valores de los resultados de todos los experimentos del sistema Error = (Y-Ycalc.) 2 donde Y calc. Es el valor obtenido por la ecuacin para ese ensayo Total = Regresin + Error Error Puro = (Yr Yrm) 2 donde Yr son los valores de Y en las replicaciones del punto central e Yrm es el valor promedio de las replicaciones del punto central Error Modelo = Error - Error Puro Media de Cuadrados Regresin = Suma de cuadrados de la Regresin / Grados de libertad de la regresin Error = Suma de Cuadrados del error / Grados de libertad del error Error del modelo = Suma de Cuadrados del error del modelo/ Grados de libertad del error del modelo Error Puro = Suma de Cuadrados del error puro / Grados de libertad del error puro

De las definiciones se observa que la media de los cuadrados de cada item, es una estimacin del valor de la variancia del mismo, de donde este tipo de anlisis toma su nombre. F0 Regresin = Media de Cuadrados de la Regresin / Media de cuadrados del error total Hemos comparado las variancias de los errores con las variancias de las variaciones de la regresin. La estadstica nos provee de una curva de distribucin F que nos permite comparar esos dos grupos de datos y decirnos que probabilidades tienen de pertenecer a la misma poblacin. Probabilidad = f( F0,GLr,GLe) En este caso el valor es 0.00025, es decir errores y variaciones de T90 no se confunden, y el resultado de nuestro experimento es de confiar

Error del modelo = Media de Cuadrados del error del modelo / Media de cuadrados del error puro Se aplica en este caso el mismo criterio que en el caso anterior. De la ltima tabla vemos que podemos decir que existen 20% de probabilidades de que el error puro se confunda con el error producido por el modelo Como en este caso el modelo y los errores estn muy diferenciados, no debemos preocuparnos.

Conclusiones Actualmente, y gracias a la generalizacin del uso de computadoras personales, ya no es necesario poseer slidos conocimientos estadsticos para acceder a las tcnicas de diseo de experimentos y con adquirir un programa desarrollado para tal fin, es suficiente. Este programa nos guiar a travs de las distintas etapas del diseo, que consisten en: 1. Definir los ensayos a realizar (Lo debe hacer el programa de computacin) 2. Dar orden aleatorio a los ensayos a realizar (Lo debe hacer el programa de computacin) 3. Desarrollar los ensayos y recoger los resultados 4. Introducir los resultados obtenidos en cada ensayos 5. Obtener del programa los coeficientes Aij dela ecuacin matemtica que definen la propiedad del resultado y el anlisis de variancia que nos indica si los resultados obtenidos son confiables o no Una vez obtenida la informacin de los coeficientes Aij trabajaremos la ecuacin matemtica de la forma que mas nos guste a efectos de predecir valores de la propiedad.

Si alguien conoce los fundamentos de la estadstica aplicada al diseo de experimentos, puede desechar la gran mayora de sus tcnicas, y abocarse a la resolucin de respuesta de superficie, que involucra los resultados obtenibles por tcnicas mas sencillas. Esta posibilidad es nueva y debida a la computacin, dado que permite resolver clculos matriciales muy complejos, inaccesibles hasta hace poco tiempo. Hoy, gracias a las computadoras, el diseo de experimentos en sus formas ms complejas, se convierte en una tcnica sencilla y accesible a todos.