Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TESIS DOCTORAL
Universidad de La Rioja
Servicio de Publicaciones
2007
Esta tesis doctoral, dirigida por los doctores D. Joaqun B. Ordieres Mere y D. Eliseo P. Vergara Gonzlez,
fue leda el 31 de julio de 2006, y obtuvo la calificacin de Sobresaliente Cum Laude Unanimidad
ISBN 978-84-690-5501-4
UNIVERSIDAD DE LA RIOJA
Departamento de Ingeniera Mecnica
y por el
Prof. Dr. Eliseo P. Vergara Gonzlez
y desarrollada por
Ana Gonzlez Marcos
a n de optar al grado de
Doctora por la Universidad de La Rioja
en Julio de 2006
Resumen
ii
Desafortunadamente, por las condiciones existentes en las industrias (interferencias electromagnticas, picos de corriente en el arranque de motores,
el factor humano, etc.), los datos errneos son muy probables entre los datos
almacenados. Para minimizar la inuencia perjudicial del ruido presente en los
datos en el entrenamiento de redes neuronales, se ha desarrollado un nuevo
algoritmo de aprendizaje robusto, basado en el estimador
Agradecimientos
En primer lugar me gustara dar las gracias a mis directores de tesis, Joaqun B. Ordieres Mer y Eliseo P. Vergara Gonzlez. A Joaqun por haberme
casa.
Por ltimo, pero no en ltimo lugar, quiero agradecerle a mi familia su apoyo
incondicional, su comprensin, su cario ... Ellos son quienes me soportan da
a da, animndome como nadie.
Esta tesis no habra sido posible sin vuestra ayuda y saber hacer.
A todos,
GRACIAS
ndice general
1. Introduccin
1.1.
Antecedentes
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.
Motivacin y objetivos . . . . . . . . . . . . . . . . . . . . . . .
1.3.
Contribuciones
. . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1.
Publicaciones . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2.
. . . . . . . . . . . . . . . .
1.4.
2.1.
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.
2.3.
. . . . . . . . . . . . .
11
13
no lineal
. . . . . . . . . . .
16
. . . . . . . . . . . . . . . . . . .
16
2.3.1.
Estimador
2.3.2.
. . . . . . . . . . . . . . .
no lineal en el algoritmo
20
23
3.1.
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.2.
24
3.2.1.
. . . . . . . . . . . . . . . . . . .
25
Tratamiento trmico . . . . . . . . . . . . . . . . . . . .
29
3.2.3.
3.3.
Composicin qumica
3.2.2.
Proceso productivo . . . . . . . . . . . . . . . . . . . . .
31
36
NDICE GENERAL
vi
3.4.
. .
4. Resultados y discusin
4.1.
43
4.2.
39
. . . . . . . . . . . . . . . . . .
. .
5. Conclusiones
43
45
49
5.1.
Conclusiones
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.
. . . . . . . . . . . . . . . . . . . . .
49
51
Bibliografa
53
57
Publicaciones
ndice de guras
1.1.
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.
. .
10
3.1.
30
3.2.
32
3.3.
3.4.
3.5.
. . . . . . . . . . . . . . . . .
. . . . . .
recocido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.
34
42
5.1.
45
50
Notacin
f ()
fs ()
h(v)
funcin real
funcin de inuencia
vector de residuos
factor de escala
nmero de poca
tk
estimador de escala
wkj
wji
= 1,..., p)
yk
zj
Captulo
Introduccin
1.1. Antecedentes
Las plantas industriales, ms all de subsistir, buscan ser lderes en un ambiente competitivo, dinmico, diversicado e innovador, siendo precisamente
la innovacin tecnolgica el instrumento con el que cuentan para lograr este
objetivo. Una caracterstica comn de los procesos industriales actuales es el
constante y rpido crecimiento de su capacidad para almacenar datos, es decir,
da a da se dispone de mayores volmenes de histricos que contienen informacin acerca de dichos procesos productivos. Es cierto que la informacin reduce
la incertidumbre y, por tanto, permite tomar mejores decisiones. Sin embargo,
al aumentar la cantidad de datos almacenados, la capacidad para asimilarlos
disminuye, por lo que se hace necesario el uso de herramientas que permitan
extraer conocimiento til a partir de grandes conjuntos de datos. Es aqu donde
tiene cabida la minera de datos (Data Mining ), un rea de investigacin que
pretende dar respuesta a esa necesidad de procesar y analizar 'masas' de datos
con el n ltimo de encontrar y aprovechar el conocimiento til contenido en
ellos.
La minera de datos es, esencialmente, un proceso conducido por un problema: la respuesta a una pregunta o la solucin a un problema se busca analizando
los datos disponibles. El anlisis de los datos forma el ncleo de la minera de
datos, pero el proceso completo abarca tambin temas tales como la denicin
del problema empresarial y el desarrollo de la solucin para resolverlo.
Introduccin
Anlisis del
Anlisis de los
problema
datos
Preparacin
de los datos
Desarrollo
Datos
Modelado
Evaluacin
Figura 1.1:
2000).
1.1 Antecedentes
1 Destacando
Introduccin
Evaluacin. Antes de desarrollar la solucin, es necesario evaluarla desde
el punto de vista del problema de negocio original, para determinar si la
solucin encontrada es lo sucientemente buena como para ser desarrollada. Cabe sealar que, junto con la solucin, el proceso de minera de
datos genera nuevas percepciones, ideas y modelos secundarios, los cuales
tambin son importantes con respecto al problema a resolver.
En la prctica, el proceso de minera de datos es altamente dinmico e iterativo, ya que cualquier fase puede suscitar preguntas o ideas que necesitan ser
investigadas o implementadas en una fase previa, y dependiente del problema
planteado, de la disponibilidad de la fuentes de datos, del conocimiento de las
herramientas necesarias, de la metodologa desarrollada y de los requerimientos
y recursos de la empresa (Martnez de Pisn Ascacbar, 2003).
Una de las aplicaciones ms interesantes del proceso de minera de datos en
2 La
disear leyes de control, de predecir parmetros del proceso productivo de especial inters,
de detectar fallos en algn componente del proceso, etc.
to de datos causa un peor ajuste, en ocasiones lejano del ptimo, del modelo
obtenido, por lo que es muy importante tratarlos de algn modo para que no
perjudiquen los modelos buscados. Una de las estrategias en este sentido, consiste en hacer uso de tcnicas de diagnstico de espurios con las que se detectan
y eliminan los datos errneos antes de proceder a la construccin del modelo
(Castejn Limas et~al., 2004; Rousseeuw and Leroy, 1987). Pero tambin, en
un contexto ms directo, evitando este tipo de preprocesado de datos, existe
la posibilidad de emplear tcnicas de modelado que sean robustas a espurios
(Ahmed and Farag, 2002; Chen and Jain, 1994; Chuang et~al., 2000; Huang
et~al., 1998; Liano, 1996; McDowall and Ham, 1997).
Introduccin
1.3. Contribuciones
1.3.1.
Publicaciones
no lineal y denominado
reducir los efectos de los espurios. Adems, esta aproximacin tambin posee
las importantes propiedades de robustez con un punto de ruptura elevado y
una alta eciencia con errores normalmente distribuidos.
1.3.2.
Todos los trabajos presentados en esta tesis se enmarcan dentro del mbito
de la minera de datos :
Las dos primeras publicaciones citadas en el apartado anterior, estn enfocadas en la aplicacin industrial de la minera de datos. En concreto,
se proponen dos modelos, basados en redes neuronales, con el n de introducir mejoras en una lnea de produccin de acero galvanizado.
La ltima publicacin de la seccin anterior, se centra en el desarrollo de
un nuevo algoritmo cuya nalidad consiste en obtener modelos neuronales
que se ajusten mejor a la informacin contenida en los datos, al utilizar
en su entrenamiento un criterio de error robusto a espurios.
Captulo
media del error cuadrtico (Mean Squared Error, MSE) como medida de error ,
1 Algunas
10
wji
x
i
Capa de
entrada
Figura 2.1:
wkj
zj
Capa
oculta
yk
Capa de
salida
t
k
Objetivo
sta no es adecuada cuando los patrones de entrenamiento estn contaminados, ya que los modelos obtenidos pueden ser muy diferentes de los esperados
(Chuang et~al., 2000; Liano, 1996; Walczak, 1996).
En la literatura se encuentran diferentes tipos de redes neuronales robustas
que pretenden mejorar el aprendizaje cuando los patrones de entrenamiento contienen datos errneos (Ahmed and Farag, 2002; Chen and Jain, 1994;
Chuang et~al., 2000; Huang et~al., 1998; Liano, 1996; McDowall and Ham,
1997). Estas aproximaciones poseen dos propiedades importantes: robustez con
un elevado punto de ruptura y una alta eciencia con errores normalmente distribuidos (Rousseeuw and Leroy, 1987). Sin embargo, en su uso, existen algunas
deciencias. Una de ellas se encuentra en la seleccin del factor de escala que
determina los lmites para reducir los efectos de los espurios: si es demasiado
grande, los espurios pueden no ser detectados; por el contrario, si es demasiado
pequeo, una gran cantidad de datos, incluyendo los buenos, seran discriminados. La seleccin de este factor no es clara, siendo diversas las propuestas que se
encuentran en la literatura. Por ejemplo, (Connor et~al., 1994; Hawkins, 1980;
Huber, 2003; Rousseeuw and Leroy, 1987) proponen seleccionar el estimador
de escala basndose en un estadstico robusto, como la mediana del error o la
desviacin mediana absoluta (Median Absolute Deviation, MAD). Ambos estn
son: ADALINE (ADAptive LInear NEuron), perceptrn, retropropagacin (Rumelhart et~al.,
11
no lineal y el modo
(xi ) a la primera capa de la red y se propaga hacia adelante a travs de los pesos
(W ), capa por capa, hasta que se alcanzan las neuronas de la capa de salida.
Durante esta fase, los pesos de la red permanecen jos. Sin embargo, durante
la pasada hacia atrs, estos pesos se ajustan con una regla de correccin del
E ),
12
mizacin del error mediante el descenso del gradiente, donde los pesos de la
capa de salida y de la capa oculta se modican aplicando una correccin
w,
E(W )
wkj
(2.1)
E(W )
wji
(2.2)
f ()
es la funcin
fs ()
zj = f
= f j ,
wji x i
i
j = 1, 2, ..., l
(2.3)
yk = fs
wkj zj k = fs (vk ) ,
k = 1, 2, ..., q
(2.4)
j
De esta forma, utilizando la regla de la cadena, las actualizaciones de los
pesos de la capa de salida y oculta, respectivamente, se llevan a cabo segn las
siguientes expresiones:
wkj = k zj
wji = j x
i
con k =
con j =
E fs (vk )
yk vk
k wkj
k
f j
(2.5)
(2.6)
2 Las
(F (x)
funciones de activacin de las distintas capas de la red pueden ser de tipo lineal
= x),
sigmoidal (F (x)
1
), tangh (F (x)
1+ex
ex ex
ex +ex
), etc.
x ,
13
Tomando como medida del error la media del error cuadrtico (MSE) , la
actualizacin de los pesos queda de la siguiente manera:
fs (vk )
zj
vk
(2.7)
f j
fs (vk )
wkj
xi
vk
i
(2.8)
wkj = (t yk )
k
wji = (t yk )
k
2.2.1.
3 El
E=
1
2
P (t
yk ) 2
14
tas, indicando aquellas que han sido utilizadas en los trabajos desarrollados y
presentados en esta tesis.
t W =
Et
+ t1 W
W
(2.9)
H = 2 E/W 2 .
H.
15
H,
utilizando una
Wt+1 = Wt + t dt
donde
con dt =
Et
+ t dt1
W
y d0 =
dt
dt1
E0
W
(2.10)
son conjugados.
En concreto, el algoritmo de gradiente conjugado empleado en (Perna Espinoza et~al., 2005a) se denomina actualizacin Fletcher-Reeves (Fletcher, 1987),
dondet se determina segn la relacin de la norma cuadrada del gradiente actual con la norma cuadrada del gradiente previo (ecuacin 2.11).
t =
Et
W
Et1
W
2
2
(2.11)
Capacidad de generalizacin
Aunque es deseable alcanzar el mejor resultado posible durante el entrenamiento, uno de los aspectos fundamentales de una red neuronal es su capacidad
de generalizar, es decir, de ofrecer buenos resultados con patrones de test que
no han sido empleados en su entrenamiento. La generalizacin es importante
no slo para que la red funcione correctamente ante conjuntos de datos que
no han sido vistos con anterioridad, sino tambin porque es posible que haya
datos que contengan ruido, que estn distorsionados o sean incompletos.
La capacidad de generalizacin de una red est determinada por tres factores: el nmero de patrones de entrenamiento, la arquitectura de la red y la
complejidad fsica del problema (Haykin, 1999). Estas tres circunstancias estn
muy relacionadas ya que, cuanto ms complejo sea el problema a modelar, ms
grande deber ser la red, es decir, se debern ajustar ms parmetros y, por
tanto, se necesitarn ms muestras para entrenarla. No teniendo un control
sobre la complejidad del problema y, disponiendo habitualmente de un nmero
limitado de patrones, en muchas ocasiones se corre el peligro de sobreajustar
16
Estimador
El estimador
no lineal
fue introducido por Yohai and Zamar (1988) como una nueva
17
yi = (xi , ) + i , donde
es el
Supuesto 1. Sea h
(i)
h (0) = 0
(ii)
h (v) = h (v)
0v
(iii) Si
(iv)
entonces
h (v) h ()
es continuo.
(v) Sea
(vi) Si
a = sup h(v);
entonces
0<a<
entonces
denotado por
h
i=1
donde
S(v),
como
vi
S(v)
= nE [h(v)]
(2.12)
Rousseeuw and Yohai (1984) denieron al estimador S como el que minimiza la funcin de escala de un estimador M de los residuos. Es decir, es el
estimador que minimiza
S (r ()).
pudiera tener un valor de punto de ruptura alto, pero al coste de tener una baja eciencia en condiciones de normalidad. Para resolver este problema Yohai
and Zamar (1988) denieron una clase de estimador de escala ms amplio,
el estimador
18
al caso
n (v) = S (v)
La estimacin
el vector resultante
1
n
h2
i=1
cumpla con
= Min n (r ())
(2.14)
1
n (r ()) = S (r ())
n
S (r ())
(2.13)
que
n r
1/2
vi
S(v)
h2
i=1
ri ()
S(r ())
1/2
(2.15)
satisface
h1
i=1
ri
S(r ())
= nE (h1 )
(2.16)
e igua-
2
n (r())
=
+
1
n
n
i=1
ri ()
S(r())
ri ()
S(r())
xi
S(r ()) ( ,) ri () S(r())
=0
(2.17)
S(r ())
= i=1
n
ri ()
S(r())
(xi ,)
ri ()
S(r())
ri ()
S(r())
i=1
donde
(2.18)
d
hj (v) ,
dv
j (v) =
19
j = 1, 2
ri ()
S(r ())
w () 1
i=1
ri ()
S(r ())
+ 2
(xi , )
=0
(2.19)
donde
w () =
i=1
ri ()
S(r())
ri ()
S(r())
ri ()
S(r())
(2.20)
1
i=1
2
ri ()
S(r())
ri ()
S(r())
2h1
satisface
w () 0
de inuencia adaptativa:
nando adecuadamente
con (v) =
w () 1 (v) + 2 (v)
(2.21)
2 .
Seleccio-
v 1
(v) =
v2
c2
si |v| < c
y se selecciona
modo, si
c = c2 ,
c = c1 ,
entonces
v2
2
v2
c2
c2
6
(2.22)
si |v| c
h (v) =
v4
3c4
h (v)
si |v| c
si |v| > c
(2.23)
Del mismo
20
c1 = 1,56
c2 = 6,08,
el estimador
tiene un punto de
es acotada (Tabatabai
2.3.2.
no lineal en el al-
2 (r ; S (t))
ET AO =
(2.24)
=1
r = y y
de poca, S (t)
donde
nmero
y
es el error del
-simo
patrn de entrenamiento, t es el
en
2
n (r)) con
E
1
2 (r)
= n =
yk
yk
n
=1
2St
St
St
h2 (v) + 2 (v) St
r
r
r
(2.25)
donde
St
=
r
1 (v)
=1
n
[1 (v) v ]
con v =
r
St
=1
y
h (v)
(v)
(2.26)
21
S t+1 (r) =
=1
2
St h1
nE h1
r
St
r
St
1/2
(2.27)
Captulo
1 Estos
24
fabricacin. De esta forma, sera posible una mejora en los sistemas de control
actuales, la cual repercutira en la calidad del producto nal, siendo ste uno
de los objetivos bsicos de todo proceso industrial.
Un proceso clave para obtener las propiedades de la banda deseadas y una
buena adherencia del recubrimiento de zinc, en el galvanizado por inmersin en
caliente, es el tratamiento trmico al que se someten las bandas de acero antes
de su inmersin en el pote de zinc. Actualmente, la temperatura de la banda
en el horno de proceso se consigue cambiando nicamente la temperatura de
consigna del horno. Sin embargo, con un modelo de velocidad para la banda de
acero dentro del horno, a partir de los datos de proceso, como el propuesto en
Perna Espinoza et~al. (2005a), se podran conseguir temperaturas de salida
ms adecuadas, mediante la regulacin de la velocidad.
En la introduccin de esta tesis se coment, que la primera etapa de todo
proceso de minera de datos consiste en obtener un conocimiento adecuado del
problema que se pretende resolver. Por eso, en la seccin 3.2, se exponen los
factores que inuyen en las propiedades mecnicas de las bobinas de acero galvanizado y se presenta la lnea de fabricacin de acero galvanizado en la que
se ha trabajado para obtener los modelos de propiedades mecnicas y de velocidad en el horno de recocido. Con este conocimiento previo, en las siguientes
secciones, 3.3 y 3.4, se presenta la metodologa empleada en la consecucin de
dichos modelos.
3.2.1.
Composicin qumica
La clave para entender los efectos de la composicin qumica y del tratamiento trmico en la metalurgia y propiedades de los aceros, es reconocer que
stas dependen de los siguientes factores (Burdekin, 1992):
1. microestructura
2. tamao del grano
3. inclusiones no metlicas
4. precipitados entre granos o en sus contornos
5. presencia de gases absorbidos o disueltos
2 %)
y otros elementos
que le proporcionan determinadas propiedades mecnicas. A medida que aumenta la cantidad de carbono aadida, se incrementa la resistencia del material,
disminuyendo su ductilidad y hacindolo ms sensible al tratamiento trmico.
El acero as obtenido, aunque barato y til en algunas aplicaciones (por ejemplo, armaduras para hormign, cables, etc.), presenta problemas cuando el nivel
de carbono es medio-alto y se utiliza en posteriores procesos de fabricacin, particularmente cuando es necesario realizar soldaduras. Sin embargo, es posible
obtener un acero ms verstil manteniendo el contenido de carbono a un nivel
relativamente bajo, si se aaden pequeas cantidades de otros elementos ya
que, combinados con tratamientos trmicos adecuados, pueden producir aceros
resistentes con buena ductilidad, tenacidad y soldabilidad; aceros con mayor
resistencia a la corrosin; aceros con mayor resistencia a altas temperaturas;
etc.
26
Aditivos
Como ya se ha comentado, la adicin de pequeas cantidades de carbono
al hierro incrementa su resistencia y sensibilidad al tratamiento trmico (o
manganeso, el cromo, el molibdeno, el niquel y el cobre actan en la microestructura del acero y permiten obtener la resistencia requerida, manteniendo un
nivel de carbono bajo, si el tratamiento trmico/condiciones de fabricacin son
los adecuados:
2 Templabilidad
0,05 %
en peso:
3 La
fragilidad por revenido, o fragilidad Krupp, se produce al migrar los elementos a los
contornos del grano si el acero alcanza una temperatura entre 500 y 600
o C.
A temperatura
normal, estos aceros tienen muy poca tenacidad y el fallo se produce por fractura intergranular.
28
o C.
Inclusiones no metlicas
La presencia de inclusiones no metlicas debe ser cuidadosamente controlada en aplicaciones particulares. Tales inclusiones se presentan como un residuo
del mineral, de la chatarra o del combustible en el proceso de fabricacin del
acero, por lo que se deben seguir ciertos pasos para reducirlas al nivel requerido.
Las impurezas ms comunes son el azufre y el fsforo : elevadas cantidades de
estos elementos reducen la resistencia, la ductilidad y pueden producir problemas de grietas en uniones soldadas. Otros elementos que pueden aparecer como
impurezas y pueden tener serios efectos negativos en el acero son el antimonio
y el arsnico, ya que pueden promover la fragilidad por revenido. Es particularmente importante asegurar que este grupo de elementos sea eliminado de los
aceros de bajo contenido en carbono.
Los aceros con un alto contenido en gases disueltos, en particular oxgeno
y nitrgeno, pueden comportarse de manera frgil, por lo que su nivel debe ser
controlado. Incluyendo pequeas cantidades de elementos que tengan una especial anidad con ellos, se consiguen combinaciones que escapan del acero lquido
a altas temperaturas o permanecen como inclusiones no metlicas: el silicio y
el aluminio se usan como desoxidantes, aunque el aluminio tambin ayuda a
controlar el nivel de nitrgeno libre ya que ste debe mantenerse a niveles bajos en aquellos casos en los que el fenmeno de fragilidad por envejecimiento es
importante.
3.2.2.
Tratamiento trmico
30
T( C)
850
650
450
60
Figura 3.1:
90
120
t(s)
Recocido. Con este nombre se conocen varios tratamientos donde el enfriamiento del acero, desde una temperatura entre 800 y 950
o C, es lento
y se realiza esencialmente en un horno. Su objetivo principal es ablandar el acero para facilitar su mecanizado posterior. Tambin es utilizado
para regenerar el grano o eliminar las tensiones internas. En un ciclo de
recocido se reconocen las siguientes fases (gura 3.1):
Revenido. Es un tratamiento complementario del temple, que generalmente sigue a ste. Al conjunto de los dos tratamientos tambin se le
denomina bonicado. El tratamiento de revenido consiste en calentar
al acero despus de normalizado o templado, seguido de un enfriamiento controlado que puede ser rpido cuando se pretenden resultados altos
en tenacidad, o lento, para reducir al mximo las tensiones trmicas que
pueden generar deformaciones. Cuando se pretenden los dos objetivos, se
recurre al doble revenido, el primero con enfriamiento rpido y el segundo
3.2.3.
Proceso productivo
El acero se obtiene a partir de dos materias primas fundamentales: mineral de hierro y chatarra frrea. El proceso de fabricacin de acero fundido a
32
Materias
Productos
primas
semiacabados
Mineral
de hierro
Alto
horno
Chatarra
frrea
Horno de
arco
elctrico
Figura 3.2:
Metalurgia
secundaria
Colada
continua
Planchones
(planos)
Palanquillas
(largos)
base de mineral de hierro utiliza un alto horno, mientras que el proceso con
chatarra frrea recurre a un horno de arco elctrico. Ambos procesos son complementados con Metalurgia Secundaria en hornos de cuchara, donde se rena
el acero y se ajusta su composicin qumica para producir calidades especcas.
Posteriormente, el acero lquido pasa a las mquinas de colada continua para
su solidicacin, obtenindose lo que se conoce como productos semiacabados:
desbastes o planchones, si presentan un corte transversal rectangular, para la
fabricacin de productos planos (bandas, bobinas, lminas, etc.); o blooms o
palanquillas, si tienen un corte transversal cuadrado, que se destinan para la
fabricacin de productos largos (barras, alambrn, etc.) (gura 3.2).
Una vez ajustada la composicin qumica del acero en las estaciones de
metalurgia secundaria y antes de ser vertido de la cuchara a la artesa de la
colada continua, se toman muestras del mismo para ser analizadas, de tal forma
que los resultados de este anlisis representan la composicin qumica de toda
la colada.
La transformacin de los planchones y palanquillas en productos acabados
se realiza mediante la laminacin en caliente. En este proceso, los productos
semiacabados se calientan primero en hornos, donde son llevados a temperaturas de laminacin. Este tratamiento metalrgico permite, por medio de la
oxidacin generada, remover pequeos defectos superciales y ablandar el acero para facilitar los procesos de trelado y conformado. A continuacin, el
formato se transforma mecnicamente hasta la forma y tamao desados al pa-
Seccin de entrada que comprende las unidades de debobinado, enderezado, corte y soldadura.
4 En
lnea.
34
Seccin de proceso
Seccin de entrada
Debobinado,
enderezado, corte y
soldadura
Horno de
proceso
Unidad de
recubrimiento
Unidad de
enfriamiento
Tratamiento
qumico
Aplanadora
Skin-pass
Seccin de salida
Bobinado, tijera,
aplanado, inspeccin
y apilado
Figura 3.3:
Zona de Precalentamiento y Limpieza. La misin de esta seccin es limpiar la banda, que procede directamente del Tren Tndem, y calentarla
36
37
et~al. (2004).
Una vez analizado el problema y determinados los objetivos que se pretendan alcanzar, una fase crucial en el proceso de minera de datos iniciado, fue la
seleccin de las variables que intervendran en la generacin del modelo. Tras
consultar con los expertos, se decidi incluir en el estudio quince variables de
composicin qumica de la colada y tres variables de proceso procedentes de la
lnea de galvanizado, para predecir el lmite elstico, la resistencia a la rotura
y el alargamiento de las bobinas (ver cuadro 3.1).
Las fases de anlisis y preparacin del conjunto de datos, como paso previo
al modelado, fueron llevadas a cabo, principalmente, empleando tcnicas de
visualizacin (histogramas, diagramas de dispersin de variables por pares, etc.)
y tcnicas de proyeccin (proyeccin Sammon (Sammon, 1969) y Anlisis de
Componentes Principales, PCA (Dunteman, 1989)). Estas herramientas fueron
tiles para observar la estructura de los datos (asimetras, heterogeneidad, etc.),
las relaciones existentes entre las variables, la ocurrencia de datos errneos, as
como la existencia de diferentes clases de comportamiento.
Tras eliminar los espurios y dividir el conjunto de datos en las clases previamente detectadas, se procedi al entrenamiento de un conjunto de redes
neuronales en aquellas clases con un nmero suciente de patrones, teniendo
en cuenta que la base de datos se dividi en tres subconjuntos (entrenamiento,
validacin y test) para mejorar la capacidad de generalizacin de las redes entrenadas. Con los patrones de entrenamiento (63,3 % de las muestras) se realiz
el ajuste de los pesos de las neuronas, mientras que los de validacin (31,6 %
de los datos disponibles) fueron utilizados para comprobar, cada cierto nmero
de ciclos de entrenamiento (treinta de un total de cien mil), que el error obtenido con los patrones de entrenamiento era coherente con el error que vera la
red neuronal frente a nuevos datos que no hubieran participado en el ajuste.
En cada caso entrenado, la red nal se corresponda con aquella cuyo error
de validacin era mnimo. Por ltimo, los patrones de test (5 % restante), que
no haban sido vistos nunca por la red entrenada, sirvieron para comprobar la
capacidad de generalizacin de la misma.
Adems de la tcnica de parada temprana empleada, para que los resultados
del entrenamiento no dependieran de una determinada seleccin, que al ser
aleatoria pudiera no ser idnea en el contenido de su informacin, se generaron
tres conjuntos de cheros con los que se llev a cabo el entrenamiento, validacin
y test, seleccionando nalmente la red que mejor se adapt a la informacin
38
Variable
Smbolo
Variables de entrada
tmp.avg
vel.avg
skin.A
C
Mn
Si
S
P
Al
Cu
Ni
Cr
Nb
V
Ti
B
N
Ceq
Variables de salida
YIELD
TENSILE
ELONG
Composicin
qumica
.
.
.
.
.
.
Lmite elstico
Resistencia a la
rotura
Temperatura
.
.
.
de la banda
Alargamiento
Velocidad de
la banda
Figura 3.4:
Entradas
(17)
Capa
oculta
Salida
(1)
40
Variable
Variables de entrada
THICKN
WIDTH
TMPP2SP
calentamiento ( C)
de
calentamiento (o C)
dentro de la
calentamiento ( C)
dentro
calentamiento ( C)
dentro
TMPP1
TMPH1SP
de
TMPH3SP
de
TMPH5SP
calentamiento ( C)
Variable de salida
VEL
42
Espesor
.
.
.
Ancho
Velocidad de
la banda
Temperaturas
de la banda y
del horno
.
.
.
Entradas
(7)
Figura 3.5:
.
.
.
Capa oculta
(15 neuronas)
Salida
(1)
Captulo
Resultados y discusin
En este captulo se presentan los resultados obtenidos en la elaboracin de
esta tesis, los cuales pueden dividirse, principalmente, en dos bloques. El primero, incluira la aplicacin de las tcnicas de minera de datos en el modelado
de una lnea de produccin de acero galvanizado por inmersin en caliente;
mientras que en el segundo, tendra cabida el desarrollo de un nuevo mtodo
de entrenamiento neuronal robusto.
44
Resultados y discusin
clase2 ). De todas las redes entrenadas para cada caso, las mejores ofrecieron
resultados bastante buenos, siendo los errores medios relativos de los patrones
de test, es decir, de los nunca vistos por la red durante el entrenamiento, no
superiores al 4,5 %: los modelos con un mejor ajuste correspondan a la resistencia a la rotura, con un error medio relativo inferior al 2 %; en el polo opuesto,
el modelo para el alargamiento de la clase2, posea un error medio relativo en
torno al 4,3 %; y, en un punto intermedio, las estimaciones del lmite elstico
con los patrones de test, no fueron tan buenas como para la resistencia a la
rotura, pero en algunos casos mejoraban las obtenidas para el alargamiento.
A la vista de las buenas estimaciones ofrecidas por los modelos creados, stos fueron utilizados para cuanticar el impacto que los parmetros de proceso
(que son los que se pueden controlar para conseguir modicar las caractersticas
del producto nal) tenan sobre estas propiedades mecnicas. El objeto de este
anlisis no era otro que el de obtener un mayor conocimiento del efecto que
el proceso de recocido tiene sobre las propiedades de las bobinas sometidas al
proceso de galvanizado. Para llevarlo a cabo, se seleccionaron varios conjuntos
de patrones de test; se generaron nuevas muestras, incrementando y disminuyendo las variables del horno de recocido (temperatura primero y velocidad de
la banda despus), y se aplicaron estos nuevos conjuntos de datos a sus correspondientes modelos neuronales para comprobar los cambios producidos o, dicho
de otro modo, para comprobar la sensibilidad de estas propiedades mecnicas
a las variaciones de temperatura y velocidad en el horno de recocido.
nicamente result sorprendente la tendencia del lmite elstico al variar la
velocidad en la clase1, ya que por la propia razn de ser del ciclo de recocido,
Figura 4.1:
46
Resultados y discusin
2/3
= |x|
) a la que se aadieron
diferentes tipos de ruido: ruido gaussiano; ruido gaussiano con adicin de espurios aleatorios de gran valor en cantidades del 10 y 49 %; y ruido gaussiano
en el 51 % de los patrones y ruido de fondo uniformemente distribuido en la
regin de inters en el 49 % restante.
En el primer caso, con datos de buena calidad y un ruido de fondo pequeo,
las respuestas de las tres tipologas de red entrenadas, se aproximaron bastante
al modelo esperado en estas condiciones (ausencia de espurios). Para poder evaluar objetivamente el comportamiento de cada red, se emple un nico criterio
de error: se calcul la raz del error cuadrtico medio (Root Mean Square, RMS)
de cada respuesta con respecto al modelo ideal. En este primer experimento, la
red que present un mejor comportamiento fue la LMLSnet con un error nal
del 0,60 %, seguida de la TAOnet, con un error del 0,75 %, y de la MSE con un
error nal del 1,64 %. En cuanto a su convergencia, la ms rpida fue la MSE,
seguida de la LMLSnet y, por ltimo, la TAOnet.
El siguiente experimento realizado, en el cual se aada el mismo ruido
gaussiano que en el caso anterior, adems de un 10 % de espurios aleatorios
de gran valor, se observ la bondad de las redes robustas al ser sus respuestas
muy prximas a la ideal esperada. En contraposicin, la red no robusta MSE se
vio severamente afectada por los espurios, ofreciendo un modelo errneo. Los
errores nales de entrenamiento fueron muy parecidos para las redes robustas:
un 0,63 % para la LMLSnet y un 0,71 % para la TAOnet ; mientras que la red
Captulo
Conclusiones
5.1. Conclusiones
En este trabajo se ha mostrado la utilidad de las redes neuronales, junto
con otras tcnicas y herramientas procedentes de la minera de datos, en el
modelado de una lnea de produccin de acero galvanizado por inmersin, a
partir de los datos del mismo. Los resultados obtenidos han servido para resaltar las principales ventajas que aportan las redes neuronales en el modelado
de procesos industriales: versatilidad para adaptarse a diversas funciones, efectividad para modelar procesos no lineales, aplicacin intuitiva y facilidad de
implementacin. Pero, tambin, han servido para poner de maniesto la necesidad de tratar los espurios, los cuales, en mayor o menor medida, siempre se
encuentran presentes en los datos recogidos y almacenados, y, en este sentido,
resaltar la ecacia de las redes neuronales robustas sobre las no robustas.
En primer lugar, se modelaron las propiedades mecnicas de las bobinas
de acero galvanizado. Aunque cabra esperar mejores modelos con un mayor
nmero de patrones de entrenamiento, los buenos resultados de prediccin obtenidos demuestran la posibilidad de estimar on-line las caractersticas de las
bobinas fabricadas. Las ventajas de estos modelos son evidentes, si se tiene
en cuenta que la medicin de estas propiedades supone un coste econmico y
temporal: se podran tomar decisiones adecuadas en tiempo real de una forma
ms econmica.
Otra ventaja derivada de esto modelos proviene de su sencillez de imple-
50
Conclusiones
Color Key
290
291
292
293
294
295
296
297
298
299
300
294.27
295.26
295.41
295.4
295.29
295.12
295.23
295.37
294.59
294.06
294.05
294.12
294.08
294.34
294.57
294.63
294.55
294.6
294.61
294.59
294.57
294.82
294.8
294.94
294.78
294.77
294.9
294.71
294.85
294.79
294.91
295.01
295.04
295.05
295.04
295.05
295.1
295.24
295.23
295.18
295.02
295.06
295.11
295.11
295.14
295.2
295.23
295.28
295.44
295.46
295.31
295.43
295.39
295.43
295.43
295.27
295.29
295.29
Width (mm)
YIELD STRENGTH
1000
2000
3000
4000
5000
Length
Figura 5.1:
1 http://www-ra.informatik.uni-tuebingen.de/SNNS/
51
52
Conclusiones
a un problema que se presenta espordicamente, pero cuyas consecuencias pueden llegar a ser graves: el etiquetado incorrecto del grado de acero de una
bobina. Bajo estas circunstancias, una bobina es tratada como si tuviera una
composicin qumica que en realidad no posee y, dado que, generalmente, estas bobinas de acero galvanizado sufren posteriores transformaciones antes de
convertirse en producto nal, si, por error, se enva a un cliente una bobina de
un material ms duro de lo esperado, se pueden ocasionar daos importantes
en la maquinaria del mismo, tales como rotura de prensas, etc.
Hasta ahora, nicamente se ha tratado la problemtica de una lnea de
produccin de acero galvanizado, pero resultara muy interesante, tambin,
vercar la utilidad de las tcnicas de minera de datos en el modelado de otros
procesos industriales.
En cuanto a las redes neuronales, futuros trabajos podran ir dirigidos a
desarrollar un sistema que permita cuanticar el grado de robustez de las mismas.
Bibliografa
Ahmed, M. and A. Farag: 2002, `A neural approach to zoom-lens camera calibration from data with outliers'. Image and Vision Computing
20, 619630.
1, 2, 3.2.3
Bellman, R.: 1961, Adaptive Control Processes: A Guided Tour.
Princeton
University Press. 2
Bishop, C. M.: 1995, Neural Networks for Pattern Recogition. Oxford University
Press. 1
Brachman, R. J. and T. Anand: 1996, The Process of Knowledge Discovery
9, 171187.
54
BIBLIOGRAFA
5, 467479.
1, 2, 3.2.3
Cherkassky, V. and F. Mulier: 1998, Learning From Data: concepts, theory and
11(5),
10671077. 1, 2, 3.2.3
Cios, K., W. Pedrycz, and R. Swiniarski: 1998, Data Mining Methods for Kno-
5,
240254. 2
Dunteman, G.: 1989, Principal components analysis. Sage Publications. 3.2.3
Fahlman, S.: 1988, `An empirical study of learning speed in backpropagation
networks'.
1
Fayyad, U., G. Piatetsky-Shapiro, and P. Smyth: 1996, `Knowledge discovery
and data mining: Towards a unifying framework'.
2, 183192.
BIBLIOGRAFA
55
2(5), 359366.
Huang, B., B. Zhang, and Q. Huang: 1998, `Robust interval regression analysis
using neural network'. Fuzzy Sets Systems pp. 337347. 1, 2, 3.2.3
Huber, P. J.: 1981, Robust Statistics. New York: John Wiley and Sons. 2
Huber, P. J.: 2003, Robust Statistics. New York: John Wiley and Sons. 2
LeCun, Y.: 1993, Ecient learning and second-order methods. A tutorial at
86.
Liano, K.: 1996, `Robust error measure for supervised neural network learning
with outliers'. IEEE Transactions on Neural Networks
7(1), 246250.
1, 2,
3.2.3, 4
Martnez de Pisn Ascacbar, F. J.: 2003, `Optimizacin mediante tcnicas de
minera de datos del ciclo de precocido de una lnea de galvanizado'. Ph.D.
thesis, Universidad de La Rioja. 1, 3.2.3
McDowall, T. and F. Ham: 1997, `Robust partial least-squares regression: A
modular neural network approach'. Proceedings: SPIE
3077, 344355.
1, 2,
3.2.3
Moody, J. and C. Darken: 1989, `Fast learning networks of locally-tuned processing units'. Neural Computation
1, 281294.
31(1), 4350.
1, 2, 3, 3.2.3
Perna Espinoza, A. V., M. Castejn Limas, A. Gonzlez Marcos, and V. Lobato Rubio: 2005a, `Steel annealing furnace robust neural network model.'.
32(5), 418426.
1, 2, 2, 3, 3.2.3
56
BIBLIOGRAFA
18(2), 191204.
Neural Networks
1, 2
ral Computation
3, 213225.
Pyle, D.: 1999, Data Preparation for Data Mining. Morgan Kaufmann Publishers. 1, 1
Ripley, B.: 1996, Pattern Recognition and Neural Networks. Cambridge University Press. 1
Rousseeuw, P. and V. Yohai: 1984, Robust regression by means of S-estimators,
pp. 256272. Springer. 2
Rousseeuw, P. J. and A. Leroy: 1987, Robust Regression and Outlier Detection:
Transactions on Computers
18, 401409.
IEEE
3.2.3
Tabatabai, M. and I. Argyros: 1993, `Robust estimation and testing for general
nonlinear regression models'.
57,
85101. 2, 2, 2, 2
Tollenaere, T.: 1990, `Supersab: Fast adaptive backpropagation with good scaling properties'. Neural Networks
3, 561573.
322, 2129.
Statistical Association
83(402), 406413.
2, 2