Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/200619691
READS
656
1 author:
SEE PROFILE
Facultad de Ingeniera
Escuela de Ingeniera Electrica y Electronica
Santiago de Cali
2008
Estrategias Evolutivas aplicadas a los Algoritmos de Enjambres para el
control de sistemas complejos
Director(es):
Eduardo Francisco Caicedo, Ph.D.
Jesus Alfonso Lopez, Ph.D.
Evaluador(es):
Unknown
I
Abstract
III
A mi familia. Sin su apoyo, consejos y paciencia, no podra haber terminado otra
etapa de mi vida.
A mis amigas, que me brindaron sus odos durante los momentos difciles.
Por los suenos y victorias que vendran...
Indice general
Introduccion 1
Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Contenidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Agradecimientos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
VII
INDICE GENERAL
1.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2. Evolucion de enjambres 25
2.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.4. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
VIII
INDICE GENERAL
A. Tablas de resultados 75
IX
INDICE GENERAL
X
Indice de figuras
XI
INDICE DE FIGURAS
4.4. Resultados obtenidos con el IAC1 con identificacion por BSFO con referencia
constante de 35 C y volumen infinito . . . . . . . . . . . . . . . . . . . . . . 55
4.5. Resultados obtenidos con el IAC3 con identificacion por IWPSO con referencia
constante de 45 C y volumen aislado . . . . . . . . . . . . . . . . . . . . . . 55
4.6. Resultados obtenidos con el IAC1 con identificacion por EvBSFO con
referencia constante de 35 C y volumen aislado . . . . . . . . . . . . . . . . 56
4.7. Resultados obtenidos con el IAC2 con identificacion por EvBSFO con
referencia constante de 40 C y volumen infinito . . . . . . . . . . . . . . . . . 56
4.8. Resultados obtenidos con el IAC3 con identificacion por EvBSFO con
referencia variable y volumen infinito . . . . . . . . . . . . . . . . . . . . . . . 56
4.9. Resultados obtenidos con el IAC1 con identificacion por EvPSO con referencia
constante de 40 C y volumen infinito . . . . . . . . . . . . . . . . . . . . . . 58
4.10.Resultados obtenidos con el IAC2 con identificacion por EvPSO con referencia
constante de 45 C y volumen aislado . . . . . . . . . . . . . . . . . . . . . . 58
4.11.Resultados obtenidos con el IAC3 con identificacion por EvPSO con referencia
variable y volumen aislado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
XII
INDICE DE FIGURAS
XIII
INDICE DE FIGURAS
XIV
Indice de tablas
XV
INDICE DE TABLAS
XVI
Introduccion
Las siguientes decisiones estan relacionadas con la adaptacion del metodo al problema
propuesto. Cuando se trabaja con sistemas inteligentes, esta es una parte crtica debido a
que estos sistemas poseen formas genericas que pueden ser utiles a una gran variedad de
problemas, pero es necesario seleccionar adecuadamente arquitecturas y parametros para
su correcto desempeno. Por lo general la seleccion de parametros se realiza por medio de
una busqueda sistematica hasta encontrar un conjunto de valores que resulten adecuados,
pero se desconoce si estos son los mejores disponibles. Para evitar este inconveniente, se
han establecido estrategias que modifican los parametros del sistema durante la solucion
del problema principal, ya sea por reglas determinsticas sin realimentacion o por metodos
adaptativos o evolutivos (autoadaptativos) que poseen realimentacion.
1
INTRODUCCION
Objetivos
2
Contenidos
pueda ser util para disenar controladores que tiendan a ser optimos aplicables a sistemas
complejos. Con base en este objetivo, se definieron los siguientes objetivos especficos:
Realizar un estudio del estado del arte para conocer las tendencias actuales en la
investigacion de la inteligencia de enjambres, estrategias evolutivas y su aplicacion a
sistemas de control.
Determinar la estrategia de control mas adecuada para ser utilizada con la optimizacion
por inteligencia de enjambres.
Determinar que parametros dentro de la poblacion del enjambre son susceptibles a ser
evolucionados.
Evaluar si la poblacion del enjambre, al aplicar una estrategia evolutiva, tiende a ser
optima.
Contenidos
3
INTRODUCCION
Agradecimientos
4
CAPITULO 1
El ser humano se ha dado a si mismo el nombre cientfico de homo sapiens como una
valoracion de la trascendencia de sus habilidades mentales tanto para su vida cotidiana
como en su propio sentido de identidad, y por lo tanto, la comprension de estas habilidades
ha permitido el nacimiento de ramas cientficas que se encargan, por diferentes metodos,
de analizar, entender y, en un caso particular, emular la inteligencia. A esta rama en
particular se le conoce como Inteligencia Artificial o IA, la cual se enfoca en lograr no solo
la comprension de las entidades inteligentes sino su construccion. La importancia de la IA no
radica unicamente en un esfuerzo de dotar de capacidades mentales a objetos inanimados
sino tambien aprender mas acerca de la humanidad misma.
5
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
inteligencia es muy compleja para ser solucionada de manera formal, por lo tanto involucra
metodos iterativos donde se desarrolla el conocimiento [Wikipedia08d].
Si bien las soluciones logicas propuestas por GOFAI no pueden ser descartadas en varias
aplicaciones, es claro que en algunas circunstancias, el desarrollo del conocimiento es mas
util que su programacion. Las tecnicas de CI tienen cada vez una mayor acogida y a cada
instante se obtienen nuevos descubrimientos en sus tres campos: Las Redes Neuronales
Artificiales (Artificial Neural Networks ANN), los Sistemas Difusos (Fuzzy Systems FS) y
la Computacion Evolutiva (Evolutionary Computation EC) [Wikipedia08b].
En este captulo, se presenta una revision a los conceptos de la EC, en particular la rama
de Inteligencia de Enjambres (Swarm Intelligence SI). En la seccion 1.1 se presentan las
caractersticas principales de la EC y sus dos ramas: los Algoritmos Evolutivos (Evolutionary
Algorithms EA) y la Inteligencia de Enjambres. En la seccion 1.2 se presentan los conceptos
basicos de las estrategias evolutivas (Evolution Strategies ES), un EA cuya principal
caracterstica es la auto adaptacion de sus parametros. En la seccion 1.3 se presentan los
conceptos basicos de SI y sus principales tecnicas. Finalmente en la seccion 1.4 se presentan
algunas conclusiones sobre la teora basica.
Las tecnicas utilizadas para resolver problemas complejos de optimizacion combinatoria han
evolucionado progresivamente de metodos constructivos a metodos de busqueda local y
finalmente a algoritmos basados en poblaciones [Hertz00]. Estos ultimos son muy populares
actualmente puesto que proveen buenas soluciones al utilizar un metodo constructivo para
la obtencion de la poblacion inicial, y una tecnica de busqueda local para mejorar la solucion
de la poblacion. Ademas los metodos basados en poblaciones tienen la ventaja adicional de
ser capaces de combinar buenas soluciones en orden de obtener unas mejores, ya que se
6
1.1 Computacion Evolutiva
considera que las buenas soluciones comparten componentes con las soluciones optimas.
A estos metodos se les conoce como algoritmos de computacion evolutiva (Evolutionary
Computation EC).
Debido a que varios algoritmos pueden ser descritos de esta manera, al considerar el diseno
de un nuevo algoritmo de EC para la solucion de un problema particular de optimizacion, se
debe tener en cuenta las siguientes caractersticas principales:
Una definicion de vecindad que permite conocer el modo en que los individuos
intercambian informacion. Puede ser estructurada si solo un grupo de la poblacion
puede conocer la informacion de un miembro, o por el contrario, todos los individuos
pueden tener acceso a la informacion.
7
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
As, la EC representan un amplio grupo de tecnicas, basicamente dividida en dos ramas cuyas
diferencias fundamentales se encuentran en la aplicacion de los conceptos anteriores: Los
Algoritmos Evolutivos (Evolutionary Algorithms EA) y la Inteligencia de Enjambres (Swarm
Intelligence SI).
Al examinar las diferentes caractersticas de cada rama de la EC, podemos establecer una
serie de diferencias entre las tecnicas, siendo la mas notoria la naturaleza centralizada de los
8
1.2 Las Estrategias Evolutivas
La optimizacion por ES esta basada en la hipotesis que durante la evolucion biologica, las
leyes de la herencia han sido desarrolladas para una rapida adaptacion filogenetica. Las ES
imitan, en contraste a un algoritmo genetico, los efectos de los procedimientos geneticos
sobre el fenotipo1 . La presuncion para codificar las variables en la realizacion de una ES
son fuerte causalidad (pequenos cambios en la causa producen pequenos cambios en el
efecto). El clmax de la teora de ES es el descubrimiento de la ventana de evolucion: Los
procesos evolutivos toman lugar unicamente dentro de una muy pequena banda en el paso
de mutacion. Este hecho induce la necesidad de una regla para el tamano de los pasos de
auto adaptacion (su principal caracterstica) y mutacion [Rechenberg08].
En general, el objetivo tpico de una ES es optimizar (algunos) objetivos dados, o una funcion
o funciones de calidad, F con respecto a un grupo de variables de decision o parametros de
control y = (y1 , y2 , . . .) llamados parametros objetivo, tales que:
9
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
ak = (yk , Sk , Fk ) (1.2)
En un paso generacional de la ES, un grupo de individuos hijos ai son generados a partir del
grupo de individuos padres am , por medio de mecanismos de cruza o mutacion. Usualmente
el tamano de la poblacion individuos hijos Po es diferente al tamano de la poblacion padre
Pp . Los parametros especficos de la estrategia y al igual que (denominado numero de
mezcla y representa el numero de padres involucrados en la creacion de un hijo) son llamados
parametros exogenos de la estrategia, los cuales son mantenidos constantes durante el ciclo
evolutivo.
10
1.3 Inteligencia de enjambres
La seleccion natural tiende a eliminar a las especies con estrategias de busqueda de alimento
poco evolucionadas y favorece la propagacion de aquellas que han sido exitosas en esta
tarea, puesto que es mas probable que disfruten del exito reproductivo. Este principio evolutivo
ha llevado a los cientficos en el campo de la Teora de Foraging a formular una hipotesis
acerca del modelo apropiado para la busqueda de alimento como un proceso de optimizacion:
Un animal buscando alimento toma las medidas necesarias para maximizar la energa
obtenida por unidad de tiempo dedicada a su busqueda, teniendo en cuenta restricciones
presentadas por su propia fisonoma y ambiente. El balance de estas limitaciones permite
obtener una poltica de busqueda de alimento optima, la cual tambien es valida para la
busqueda social donde grupos de animales se comunican para buscar alimento [Liu02].
Existen diversas ventajas de utilizar un mecanismo de comunicacion para realizar una
busqueda cooperativa como lo son [Passino02]:
11
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
Al pensar que un grupo de individuos o enjambre se comporta como una sola criatura viviente
la cual exhibe una Inteligencia Colectiva producto del agrupamiento y la comunicacion,
resultando en una estrategia mas exitosa para todos los individuos del grupo, se pueden
crear modelos de enjambres para ser utilizados como estrategias de optimizacion los cuales
se conocen como Inteligencia de Enjambres. Este termino fue por primera vez utilizado en
[Beni88] para referirse a sistemas roboticos celulares en los cuales un grupo de agentes en
un ambiente, interactuan de acuerdo a una serie de reglas simples.
En esta seccion se describiran los conceptos basicos de estas tecnicas, donde las mas
representativas son la Optimizacion por Enjambres de Partculas (PSO) y la Optimizacion
por Colonia de Hormigas (ACO). Otras tecnicas consideradas de inteligencia de enjambres
son la Optimizacion por Enjambre de Bacterias (BSFO), la Busqueda por Difusion Estocastica
(SDS) y la Colonia Artificial de Abejas (ABC).
vin (t + 1) = w vin (t) + c1 R1 (pin xin (t)) + c2 R2 (pgn xin (t)) (1.3)
12
1.3 Inteligencia de enjambres
donde c1 y c2 son dos constantes positivas, R1 y R2 son dos numeros aleatorios en el rango
de [0 1], y w es el peso inercial. La ecuacion 1.3 es utilizada para calcular la nueva velocidad
de la partcula de acuerdo a su velocidad anterior y las distancias de su posicion actual
a su mejor posicion y la mejor posicion dentro del grupo. Luego la partcula se desplaza
hacia una nueva posicion de acuerdo a la ecuacion 1.4. El peso inercial w, incluido a partir
de [Shi98], es utilizado para controlar el impacto de las velocidades previas en la velocidad
actual, influenciando el cambio entre las habilidades de exploracion global (rango amplio)
o local (rango corto) de las partculas. Un peso inercial mayor facilita la exploracion global
para buscar nuevas areas mientras que un peso inercial menor tiende a facilitar exploracion
local para sintonizar finamente el area de busqueda actual. Una correcta seleccion del peso
inercial puede proveer un balance entre las habilidades de busqueda local y global, por lo
tanto requiriendo menores iteraciones para encontrar el punto optimo. En general el algoritmo
realiza las operaciones mostradas en la tabla 1.2.
13
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
14
1.3 Inteligencia de enjambres
En los algoritmos ACO cada agente construye una solucion o parte de esta, comenzando
de un estado inicial y desplazandose a traves de una secuencia finita de estados vecinos,
cuyo criterio de vecindad es dependiente del problema, haciendo uso de dos fuentes de
informacion: la visibilidad y los rastros de feromona . La probabilidad de que la kesima
hormiga se desplace del nodo i al nodo j esta dado por la ecuacion 1.5.
[i j (t)] [i j ]
, si j Jik
pkij (t) = lJ k [il (t)] [il ]
i
(1.5)
/ Jik
0 si j
siendo los nodos Jik los estados validos. A su vez, los rastros son modificados para cambiar
la representacion del problema, que utilizaran las otras hormigas para tomar sus decisiones
por medio de la ecuacion 1.6.
Otras caractersticas usualmente incluidas dentro de un sistema ACO son el balance entre
las caractersticas aleatorias y la severidad en la toma de decisiones (exploracion/explotacion
del conocimiento); y estrategias de conocimiento global denominadas daemon actions. Las
caractersticas de un algoritmo ACO pueden necesitar alguna clase de sincronizacion,
usualmente obtenida por una programacion secuencial, donde el conocimiento global es
facilmente accesible en cualquier instante. En general, un algoritmo de optimizacion por
colonia de hormigas, realiza las operaciones mostradas en la tabla 1.3.
1
Forma de comunicacion indirecta por medio de la modificacion del ambiente
15
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
Las caractersticas de este grupo de algoritmos hacen que sean utiles en problemas
estocasticos distribuidos donde la presencia de fuentes exogenas produce dinamicas en la
representacion del problema. Por ejemplo, muchos problemas relacionados con redes de
comunicacion y transporte son intrnsecamente distribuidos y dinamicos, y a menudo es
imposible obtener un modelo exacto de la variabilidad subyacente. Por el contrario, el uso
de la estigmergia como unico metodo de comunicacion entre las hormigas, los algoritmos
ACO pueden presentar dificultades en problemas donde cada estado tiene un gran tamano
de vecindad, debido a sus caractersticas locales. De hecho, una hormiga que visita un estado
con un gran tamano de vecindad tiene un enorme numero de posibles movimientos entre los
cuales elegir, siendo la probabilidad de seleccion de cada estado muy pequena, haciendo
poco probable que varias hormigas visiten el mismo estado. Esta situacion hace que la
diferencia entre usar o no el rastro de feromona, en estos casos, sea muy pequena o ninguna.
Los algoritmos ACO tienen una naturaleza discreta, lo cual los hace utiles para la solucion de
problemas de optimizacion combinatoria. De hecho, el primer algoritmo basico de hormigas
desarrollado, el Ant System (AS) [Dorigo91a, Dorigo91b, Colorni91, Colorni92], tuvo su
primera aplicacion en la solucion del problema del viajero (Traveling Salesman Problem
TSP). En estos primeros trabajos ya se proponen variaciones al concepto de feromona,
derivandose tres algoritmos del AS, el Ant Quantity, el Ant Density y el Ant Cycle. Otros
problemas solucionados por medio del AS son la version asimetrica del TSP, el Quadratic
Assigment Problem (QAP) y el Jobshop Scheduling Problem (JSP) [Dorigo96b]. Otros
algoritmos ACO son el ANTQ [Gambardella95, Dorigo96a] basado en aprendizaje por
refuerzo; el Ant Colony System (ACS) [Dorigo97] el cual difiere del AS al proveer una
regla de transicion de estados que balancea la exploracion/explotacion del conocimiento, la
16
1.3 Inteligencia de enjambres
Para su uso sobre espacios continuos se requiere un tratamiento diferente del problema
donde la vecindad no sea un impedimento. En [Bilchev95] se presenta una primera
aproximacion donde se define un nido del cual parten los agentes a explorar el espacio.
En [Yan-jun03] se presenta el Adaptive Ant Colony Algorithm (AACA), un algoritmo que utiliza
un arbol binario para mapear un espacio continuo, obteniendose una cadena binaria que
representa la solucion de manera similar a un algoritmo genetico. En [Tsutsui04] se presenta
el sistema de agregacion de feromona (Aggregation Pheromone System APS) donde la
feromona es una funcion de densidad continua.
17
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
P ( j, k, l) = i ( j, k, l) ki = 1, 2, . . . S (1.7)
i ( j + 1, k, l) = i ( j, k, l) +C (i) ( j) (1.8)
donde C(i) es el tamano del paso a tomar en la direccion especificada por el giro. Si en
i ( j + 1, k, l), el valor de J (i, j + 1, k, l) es menor que el obtenido en i ( j, k, l), entonces un
nuevo paso quimiotactico es tomado hasta un numero maximo Ns.
S
Jcc ( , P (i, j, k)) = Jcci ( , i ( j, k, l)) (1.9)
i=1
S 2 S 2
= hre ewre m=1 (m m ) dat ewat m=1 (m m )
p i p i
i=1 i=1
De acuerdo a la distribucion de los agentes, se puede decir que entre mas lejos se encuentre
entre si, el efecto de las senales sera menor y por lo tanto no intentaran agruparse. Lo
18
1.3 Inteligencia de enjambres
contrario ocurre cuando se encuentran muy cerca y por lo tanto, los agentes se atraen
para formar grupos cooperativos. Debido al movimiento de todas las bacterias, la funcion
Jcc ( , p ( j, k, l)) es variante en el tiempo. Las bacterias, en efecto, no solo intentaran buscar
zonas con buenos nutrientes, evitando sustancias nocivas, sino que ademas intentaran
moverse hacia otras bacterias, sin acercarse tanto entre si. Por lo tanto la funcion Jcc ( , P)
deforma dinamicamente la superficie de busqueda a medida que las bacterias se mueven.
19
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
SDS esta basada en el denominado Juego del Restaurante [De Meyer03], donde un grupo
de personas asisten a una conferencia en una ciudad desconocida y cada noche deben
encontrar un lugar para comer. Puesto que hay una gran variedad de restaurantes y cada uno
ofrece una variedad de platos, el grupo se encuentra ante la dificultad de encontrar el mejor
restaurante, o sea aquel donde el mayor numero de personas esten satisfechas comiendo.
Puesto que una busqueda paralela exhaustiva tomara demasiado tiempo para obtener
informacion valida, se instituye una poltica diferente. Cada individuo propone una hipotesis
correspondiente al mejor restaurante en la ciudad. Cada noche los individuos prueban su
hipotesis al comer en el sitio un plato al azar. A la manana siguiente cada individuo que no
obtuvo una buena experiencia le pregunta a un colega al azar cual fue su experiencia. Si la
informacion recibida es satisfactoria el individuo selecciona al restaurante como su favorito.
De otra manera, selecciona un restaurante al azar. Usando esta estrategia, se ha encontrado
que rapidamente un numero significativo de individuos se congregan alrededor de la mejor
solucion. En terminos generales, el algoritmo se muestra en la tabla 1.5.
La ventaja principal que presenta SDS es su capacidad de salir de mnimos locales. Esto se
logra mediante la salida probabilstica de la evaluacion parcial de hipotesis en combinacion
con la reubicacion de recursos (en este caso los agentes) por medio de mecanismos de
reclutamiento estocastico. La evaluacion parcial de la hipotesis permite al agente formarse
20
1.3 Inteligencia de enjambres
rapidamente su opinion acerca de la calidad de la solucion puesta a prueba sin una busqueda
exhaustiva (e.g. probando todos los platos disponibles en un restaurante).
La tecnica ha sido utilizada en una variedad de problemas de la vida real. La Red Hbrida
de Difusion Estocastica (Hybrid Stochastic Diffusion Network HSDN), una combinacion de
SDS con una red neuronal, fue usada para localizar caractersticas oculares en imagenes
faciales humanas [Bishop92] y para el seguimiento de labios en vdeos [Grech-Cini95]. En
[Beattie98] SDS fue utilizado como metodo de autolocalizacion de una silla de ruedas
autonomas, extendiendo el algoritmo original para proveer soluciones mas rapidas en
espacios de busqueda mayores por medio de la Red Enfocada de Difusion Estocastica
(Focused Stochastic Diffusion Network FSDN). Otros usos son la busqueda de texto
[Bishop89a] y la seleccion de sitios para redes inalambricas [Whitaker02].
21
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
Como ejemplo de los algoritmos de abejas se presenta el algoritmo ABHA. Este algoritmo
permite realizar busquedas sobre espacios continuos, basados en el modelo orientado
al individuo desarrollado en [deVries98], donde se definen una serie de reglas de
comportamiento para cada agente que determinan las acciones a realizarse, incluyendo
algunas adaptaciones no consideradas en el modelo biologico para incrementar el
desempeno en la busqueda de mejores soluciones. En terminos generales, el algoritmo se
muestra en la tabla 1.6.
Pese a ser relativamente recientes, los algoritmos de abejas ya presentan alguna variedad de
aplicaciones, principalmente propuestas por sus creadores. Algunas de estas son la solucion
del problema del viajante [Lucic03], el entrenamiento de redes neuronales [Pham06b], la
sintonizacion de controladores difusos [Pham07b], la optimizacion de maquinas de soporte
vectorial [Pham07d], el diseno de celdas de manufactura [Pham07a], el diseno de uniones
por soldadura [Pham07c] y la regulacion de temperatura sobre una superficie [Alfonso07a].
22
1.4 Conclusiones
Inicialice la poblacion
PARA i = 1 HASTA I HACER
Calcule las probabilidades
SI es experimentada Y su informacion es valida
Incremente la tendencia de abandono
Deje el nido
FIN
SI no hay danzas disponibles
SI puede iniciar una busqueda aleatoria
Ubique las abejas en posiciones aleatorias
Deje el nido
FIN
SI abandono la fuente
Olvide la fuente
Mantengase en el nido
FIN
SI NO
Calcule la duracion de la danza
Si sigue una danza
Seleccione una danza por ruleta
Agregue ruido a la informacion
Deje el nido
SI NO
Incremente la tendencia de abandono
FIN
SI puede iniciar una busqueda aleatoria
Ubique las abejas en posiciones aleatorias
Deje el nido
FIN
FIN
Calcule el costo actual
SI puede seguir buscando
SI la direccion es valida
Incremente la posicion
SINO
Cambie de direccion
Incremente la posicion
FIN
SINO
Determine si la fuente es valida
FIN
Actualice el umbral
Actualice la memoria
END
1.4. Conclusiones
23
1. COMPUTACION EVOLUTIVA: SOCIEDADES PARA SOLUCIONAR PROBLEMAS
Es notoria la diferencia entre la SI y la otra rama dentro de la EC, los EA, siendo las mas
importantes la naturaleza centralizada de los EA frente al comportamiento distribuido en SI;
la interaccion con la funcion objetivo, donde en los EA corresponde al nivel de desempeno y
en la SI por lo general corresponde al ambiente a ser explorado; y la capacidad de modificar
su ambiente de los algoritmos de SI.
Las aplicaciones de SI en la actualidad son muy diversas, desde las redes de comunicacion,
los sistemas de control automatico, la solucion de problemas combinatorios, el enrutamiento
de vehculos, entre otros. En cada momento se encuentran nuevas aplicaciones y se
desarrollan variaciones que mejoran el desempeno de los algoritmos como la hibridizacion
con los EA. Al mismo tiempo se hace necesario el estudio profundo de las cualidades
de estabilidad y convergencia de estos metodos. Ademas, el estudio detallado de algunos
biologos permite encontrar nuevos modelos que pueden llevar a proponer nuevos algoritmos
de SI. En este ultimo caso, el desarrollo de las tecnicas de SI implica el trabajo conjunto de
disciplinas tan diversas como las ciencias biologicas, sociales, computacionales, la ingeniera,
la filosofa, entre otras; siendo un paradigma bastante rico para su exploracion por su mezcla
de naturaleza y computacion [Nunez de Castro07]. Existen aun muchas sociedades naturales
que pueden ser simuladas o emuladas en computadores y los frutos de estas exploraciones
se convierten en nuevas soluciones tecnologicas a problemas clasicos o recientes, y su
completo potencial aun esta por alcanzarse.
24
CAPITULO 2
Evolucion de enjambres
25
2. EVOLUCION DE ENJAMBRES
26
2.1 Implementacion de Enjambres Evolutivos
poblaciones cada una compuesta por individuos. Todos los individuos de una poblacion
codifican el mismo conjunto de parametros del algoritmo que se esta evolucionando, donde
la diferencia entre los individuos de la poblacion corresponde a la posicion inicial la cual se
escoge de manera aleatoria. Cada poblacion es sometida a la modificacion de sus parametros
por medio de operadores evolutivos como la cruza y la mutacion, para obtener poblaciones
hijas, las cuales buscan una nueva solucion al problema principal de optimizacion, al modificar
los valores de por medio de las reglas definidas por enjambre. Para definir el desempeno de
las poblaciones se define una funcion G para la l esima poblacion en el iesimo instante
como el promedio del desempeno del kesimo individuo segun la ecuacion 2.1. Luego de
solucionar tanto el primer como segundo problema de optimizacion, se seleccionan las
poblaciones con mejor desempeno entre las poblaciones hijas que conformaran la proxima
generacion.
k=1 J (l, k, i, )
G (l, i) = (2.1)
Al igual que ES, es necesario modificar los parametros que dominan la mutacion de los
individuos. Para este proceso se hace uso de la regla de 1/5 [Rechenberg73], la cual propone
que si el desempeno general de la generacion actual ha sido mejor que el desempeno general
anterior, la poblacion se ha desplazado a una mejor posicion en el espacio de busqueda, por lo
tanto, se puede disminuir la fuerza de las mutaciones (la desviacion estandar de la distribucion
normal de la mutacion) por un factor de 0,82, de lo contrario, el algoritmo se ha desplazado
a una region menos favorable, por lo tanto, se incrementa la fuerza de las mutaciones por un
factor de 1,22.
27
2. EVOLUCION DE ENJAMBRES
Entonces, para el algoritmo de bacterias en una iteracion i para el kesimo individuo con
el grupo de parametros l se define un valor de segun la ecuacion 2.2 y una funcion de
costo de acuerdo a la ecuacion 2.3, donde Jn corresponde al costo por nutrientes, mar es
la magnitud de los atrayentesrepelentes igualadas para que en la posicion de la bacteria el
costo se deba unicamente a los nutrientes, wr es el ancho de los repelentes y wa el ancho de
los atrayentes, con wr > wa debido a que su tamano es inversamente proporcional.
28
2.1 Implementacion de Enjambres Evolutivos
p p
J (k , i) = Jn (k ) + mlar (i) ewlr (i) m=1 (k m ) ewla (i) m=1 (k m )
2 2
(2.3)
Para construir el algoritmo evolutivo, se hace uso de las ecuaciones 2.1, 2.2 y 2.3,
y del algoritmo generico mostrado en la tabla 2.1 el cual se modifica para incluir los
aspectos especficos de comportamiento del enjambre de bacterias. Los cambios se ubican
fundamentalmente en el calculo y evaluacion de costo de la nueva posicion, dando como
resultado el algoritmo evolutivo de bacterias mostrado en la tabla 2.2.
29
2. EVOLUCION DE ENJAMBRES
kn (i + 1) = wl (i) kn (i) + R1 c1l (i) (pkn kn (i)) + R2 c2l (i) (pgn kn (i)) (2.4)
kn (i + 1) = kn (i) + kn (i + 1) (2.5)
Al igual que con BSFO, para construir el algoritmo evolutivo, se hace uso de las ecuaciones
2.1, 2.4 y 2.5, y del algoritmo generico mostrado en la tabla 2.1 el cual se modifica para incluir
los aspectos especficos de comportamiento del enjambre de partculas. Los cambios se
producen en la actualizacion de la informacion individual y social del individuo representados
por pid y pgd , y el calculo de la nueva posicion, obteniendose el algoritmo evolutivo de
partculas mostrado en la tabla 2.3.
Para probar el desempeno de los algoritmos propuestos, se realiza un estudio por simulacion
usando un grupo de diez funciones y siete algoritmos de inteligencia de enjambres para
30
2.2 Evaluacion de desempeno
Estas funciones son seleccionadas debido a su correlacion con problemas del mundo real,
donde hay funciones de costo unimodales y multimodales, con variables correlacionadas y no
correlacionadas. La funcion de DeJong F1 no contiene mnimos locales y provee un gradiente
suave hacia un optimo global. La funcion de Grienwank introduce interdependencia entre las
31
2. EVOLUCION DE ENJAMBRES
No. Ecuacion
J = 4 2,112 + 31 14 12 + 1 2 + 4 + 422 22
1
i ((1 Xi )2 +(2 Yi )2 )
2 J = 10
i=1 Ai e
A = [5 2 3 2 2 4 2 2 2 2]
= [0,1 0,08 0,08 0,1 0,5 0,1 0,5 0,5 0,5 0,5]
X = [15 20 25 10 5 15 8 21 25 5]
Y = [20 15 10 10 10 5 25 25 16 14]
J = 3 (1 1 )2 e(2 +1) 1 13 e(1 +1) 2 10 51 13 25 e1 2
2 2 2 2
2 2
3
4 J = ni=1 xi2
5
1
J = 4000 i=1 i i=1
n
x xi
2 n cos
i
+1
6 J = ni=1 xi2 10 cos (2 xi ) + 10
7 J = 20e 0,2 30 1
ni=1 xi2 e 30
1
ni=1 cos(2 xi ) + 20 + e
2
J = 100 x2 y + (1 x)2
8
2
sin x2 +y2 0,5
9 J = 0,5 2
p 2 +y2 ))
(1+0,001(x
10 J = i=1 xi sin |xi |
n
Para comparar los diferentes algoritmos, se encontraron los valores mnimo, promedio y
la desviacion estandar de cada experimento. Para tener una mejor visualizacion de los
resultados obtenidos, se utiliza una grafica box and whisker para cada funcion. Las lneas
de la caja se ubican en el cuartil inferior ( ), superior (+ ) y en el promedio de los datos y
representan los datos dentro del 50 % de la distribucion. Las lneas de extension muestran los
datos dentro del 99.3 % de la distribucion (2 ). Los puntos por fuera de estos representan
los datos en el ultimo 0.7 % y son considerados estadsticamente por fuera del rango.
La grafica 2.1 muestra los resultados para la funcion SCB. Se puede observar que todos
los algoritmos son capaces de obtener el valor mnimo dentro del rango de la funcion.
Sin embargo, es notorio un mejor desempeno de los algoritmos PSO con parametros
preestablecidos. Esto se ve representado por una menor desviacion estandar. Se podra
considerar que para este problema el efecto de la busqueda de parametros no incrementa el
desempeno del algoritmo.
32
2.2 Evaluacion de desempeno
La grafica 2.2 muestra los resultados para la funcion PFUNC. Al igual que con la funcion SCB,
todos los algoritmos fueron capaces de obtener valores mnimos durante el experimento. Se
puede notar que los algoritmos basados en PSO tienen una mayor dispersion de los datos,
que no se solventa por la evolucion de los parametros, ya que el algoritmo EvPSO posee
una desviacion estandar similar a la de los otros algoritmos. Comparativamente, el algoritmo
EvBSFO se desempena mejor que su contraparte estatica, al presentar una desviacion
estandar menor.
La grafica 2.3 muestra los resultados para la funcion Peaks. En este caso se puede observar
que todos los algoritmos encuentran el mnimo global de la funcion. Para el caso del algoritmo
BSFO frente al algoritmo evolutivo, existe una disminucion de la media y de la desviacion
estandar, obteniendose un mejor desempeno con la autoadaptacion de parametros. Con
respecto al algoritmo EvPSO presenta mejora frente al algoritmo PSO clasico, sin embargo,
no existe una mejora sustancial frente a los algoritmos estaticos que contengan peso inercial.
La grafica 2.4 muestra los resultados para la funcion DeJong F1. Esta funcion, a pesar de
ser conceptualmente sencilla, presenta una fuerte dificultad debido a la gran cantidad de
dimensiones y a poseer un espacio de busqueda amplio. El experimento realizado muestra
que existe una notoria diferencia entre el resultado obtenido entre el algoritmo de bacterias
estatico y evolutivo, siendo este ultimo capaz de llegar muy cerca del valor optimo. En el
caso del algoritmo EvPSO, este presenta el menor valor mnimo encontrado durante el
experimento, aunque presenta un promedio y desviacion mayor que la obtenida por los
algoritmos estaticos.
La grafica 2.5 muestra los resultados para la funcion Grienwank. En esta funcion, a parte de
la interdependencia de variables, se suma la amplitud del espacio de busqueda. Al igual que
en la funcion anterior se puede observar una mejora sustancial del desempeno del algoritmo
evolutivo de bacterias frente al algoritmo estatico, aunque presenta una desviacion entandar
alta, el 99 % de los datos obtenidos en el experimento son mejores que la media del algoritmo
estatico. Con respecto al algoritmo EvPSO, este obtiene nuevamente el menor valor en el
experimento y su media es similar a los algoritmos estaticos con peso inercial o con factor de
constriccion, sin embargo, su desviacion estandar es mayor.
La grafica 2.6 muestra los resultados para la funcion Rastrigin. En esta funcion multimodal,
existe una alta probabilidad que los algoritmos basados en descenso de gradiente como
BSFO y ABHA se desempenen pobremente. Al ejecutar el experimento, nuevamente la
autoadaptacion de parametros del algoritmo EvBSFO evita que la poblacion se estanque
en un mnimo local, logrando obtener un valor menor en el experimento que el algoritmo
estatico, aunque a costa de una mayor desviacion estandar. En el caso del algoritmo EvPSO,
se obtiene el menor valor dentro del experimento, aunque presenta una desviacion estandar
mayor.
33
2. EVOLUCION DE ENJAMBRES
Jmin Javg
1.005
Values
1.015
T1PSO -1.0316E+00 -1.0316E+00 1.0000E-15
T2PSO -1.0316E+00 -1.0316E+00 1.0000E-15
1.02
CFPSO -1.0316E+00 -1.0316E+00 1.0000E-15
ABHA -1.0316E+00 -1.0316E+00 3.9047E-07
1.025
EvBSFO -1.0316E+00 -1.0316E+00 1.0341E-04
EvPSO -1.0316E+00 -1.0305E+00 4.0878E-03
1.03
Jmin Javg
BSFO -3.9867E+00 -3.9861E+00 4.8005E-04 2.5
PSO -3.9867E+00 -3.9052E+00 4.0109E-01
IWPSO -3.9867E+00 -3.9460E+00 2.8655E-01
Values
34
2.2 Evaluacion de desempeno
4.5
Jmin Javg 4
3.5
BSFO 2.7376E+04 3.8423E+04 3.4068E+03
PSO 1.7871E+00 5.1879E+00 1.6449E+00 3
Values
2.5
T1PSO 1.3445E+02 4.5751E+02 1.6265E+02
2
T2PSO 5.7028E+01 2.6585E+02 1.2221E+02
CFPSO 8.8210E+01 3.3091E+02 1.3658E+02 1.5
ABHA 2.6191E+04 4.4591E+04 6.1249E+03 1
EvBSFO 1.9865E-02 7.9654E+03 8.8747E+03
0.5
EvPSO 0.0000E+00 3.9452E+02 1.3956E+03
0
400
300
BSFO 2.6347E+02 3.4474E+02 2.8947E+01
PSO 8.3443E-01 1.0142E+00 5.1948E-02 250
IWPSO 1.1832E+00 1.9974E+00 5.2106E-01
Values
400
0
BSFO PSO IWPSO T1PSO T2PSO CFPSO ABHA EvBSFOEvPSO
35
2. EVOLUCION DE ENJAMBRES
La grafica 2.7 muestra los resultados para la funcion Ackley. La funcion presenta una dificultad
alta para los algoritmos de bacterias, ya que tanto el esquema estatico como el evolutivo es
incapaz de evitar el estancamiento en un mnimo local aunque el algoritmo evolutivo es capaz
de obtener algunos resultados mejores que el estatico, estos se encuentran por fuera del
99 % de los intentos, por lo cual, es poco probable que la evolucion de parametros para este
problema represente una mejora. Una situacion diferente se observa con el algoritmo EvPSO,
el cual es capaz de obtener el menor valor objetivo en el experimento, con una media muy
similar a los algoritmos estaticos. Al igual que en las pruebas anteriores, la capacidad de
obtener valores menores se ve disminuida por una mayor desviacion estandar.
La grafica 2.8 muestra los resultados para la funcion DeJong F2. Esta funcion de dos
dimensiones refleja un comportamiento de los algoritmos similar a las funciones SCB, PFUNC
y Peaks, donde todos los algoritmos obtienen valores muy cercanos al mnimo global. Con
respecto a los algoritmos de bacterias, el algoritmo evolutivo tiene un valor mnimo menor que
el estatico, pero se presenta un aumento en la media y la desviacion estandar. En cuanto al
algoritmo EvPSO presenta mejora frente al algoritmo PSO clasico al obtener un valor mnimo
similar a los algoritmos con peso inercial. En esta prueba, la diferencia entre la media y la
desviacion es mayor frente a los algoritmos estaticos.
La grafica 2.9 muestra los resultados para la funcion Schaffer F6. Al igual que la funcion
DeJong F2, todos los algoritmos obtienen valores muy cercanos al mnimo global. En este
caso, existe una mejora en la media y la desviacion estandar obtenidas por el algoritmo
EvBSFO frente al algoritmo estatico, proporcionando una mayor repetibilidad. En el caso del
algoritmo EvPSO, si bien consigue un valor mnimo adecuado, su repetibilidad es inferior a la
de los algoritmos estaticos.
La grafica 2.10 muestra los resultados para la funcion Schewefel. En esta funcion, cuyo valor
mnimo es un numero muy negativo, el unico algoritmo que logra obtener el valor global es el
EvPSO, seguido por EvBSFO, cuyo comportamiento es similar al obtenido por los algoritmos
de partculas estaticos. Si bien, estos resultados nuevamente se logran a costa de una menor
repetibilidad de los algoritmos de enjambres evolutivos, existe una buena probabilidad dentro
de un grupo de experimentos de lograr valores mejores con parametros dinamicos.
El siguiente paso en el analisis de los resultados es una comparacion directa entre los
algoritmos, para lo cual se utiliza el ttest con un intervalo de confianza del 95 %. Este
test permite determinar si el resultado es estadsticamente valido y al mismo tiempo si el
resultado obtenido por el algoritmo bajo prueba se puede considerar estadsticamente mejor
que el del algoritmo de control. El ttest calcula una diferencia entre los dos grupos y puede
considerarse una relacion de senal a ruido y es calculado por la ecuacion 2.6, donde T
corresponde al grupo bajo prueba y C al grupo de control, x es la media del grupo,
la desviacion estandar del grupo, n el numero de muestras del grupo y t corresponde a
la probabilidad en una distribucion del tipo tstudent. El valor t sera positivo si la primera
36
2.2 Evaluacion de desempeno
20
Jmin Javg 18
16
BSFO 1.8895E+01 1.9655E+01 1.8369E-01
14
PSO 1.1173E+00 2.2053E+00 4.6178E-01
12
IWPSO 4.8288E+00 6.5895E+00 8.7499E-01
Values
T1PSO 5.1802E+00 7.3854E+00 9.8673E-01 10
2000
1800
Jmin Javg
1600
BSFO 3.1670E-03 6.4332E-01 6.5966E-01 1400
PSO 2.3899E-08 2.3620E-05 3.6345E-05
1200
IWPSO 0.0000E+00 0.0000E+00 0.0000E+00
Values
0.35
Jmin Javg
0.3
BSFO 2.4559E-03 7.3533E-03 6.8864E-03
PSO 2.4559E-03 2.4559E-03 1.5835E-09 0.25
IWPSO 2.4559E-03 2.4559E-03 0.0000E+00
Values
0.2
T1PSO 2.4559E-03 2.4559E-03 0.0000E+00
T2PSO 2.4559E-03 2.4559E-03 0.0000E+00 0.15
CFPSO 2.4559E-03 2.4559E-03 0.0000E+00
ABHA 2.4986E-03 7.8167E-02 6.3309E-02 0.1
37
2. EVOLUCION DE ENJAMBRES
3000
5000
BSFO -6.1375E+03 -4.9426E+03 3.3240E+02
6000
PSO -8.1755E+03 -6.4861E+03 8.4756E+02
IWPSO -8.5951E+03 -6.3647E+03 8.8820E+02 7000
Values
T1PSO -8.4014E+03 -6.0020E+03 7.6415E+02 8000
T2PSO -8.1958E+03 -6.0334E+03 7.9105E+02
9000
CFPSO -8.4473E+03 -6.4722E+03 9.3734E+02
10000
ABHA -6.2105E+03 -4.9768E+03 3.8509E+02
EvBSFO -9.4828E+03 -6.0171E+03 1.0979E+03 11000
EvPSO -1.2569E+04 -5.3917E+03 2.6354E+03 12000
13000
BSFO PSO IWPSO T1PSO T2PSO CFPSO ABHA EvBSFOEvPSO
media es mayor que la segunda y negativo si es menor [Trochim06]. Teniendo en cuenta que
n = 100 para ambos grupos, el lmite del valor t para un intervalo de confianza del 95 % es
1,66055. Por lo tanto, para que el resultado de la prueba sea estadsticamente significativo
y ademas con un mejor desempeno del algoritmo bajo prueba t 1,66055, para que
sean estadsticamente iguales 1,66055 < t < 1,06605, y para que sea estadsticamente
de menor desempeno 1,66055 t .
xT xC
t=r (2.6)
T2 C2
nT + nC
Los resultados del ttest se muestran en la tabla 2.7 para el algoritmo EvBSFO y en la tabla
2.8 para el algoritmo EvPSO, donde los valores en negrilla corresponden a un mejor o igual
desempeno del algoritmo bajo prueba. Los resultados muestran que la version evolutiva del
algoritmo de bacterias se desempena mejor que su contraparte estatica en ocho de diez
pruebas, sin embargo no logra tan buenos resultados frente a los algoritmos de partculas.
En el caso de EvPSO se obtienen resultados satisfactorios en mas de la mitad de las pruebas
realizadas. Las pruebas que no muestran resultados satisfactorios fueron aquellas cuya
media estuvo por encima de la media obtenida por el algoritmo de control.
2.3. Conclusiones
38
2.3 Conclusiones
(1, ), donde el enjambre se considera un individuo con caractersticas definidas por sus
parametros. La ES permite el control de los parametros al seleccionar de un grupo de
mutaciones aquella que en la iteracion presente el mejor desempeno, representado por el
promedio de costo de sus integrantes.
39
2. EVOLUCION DE ENJAMBRES
40
CAPITULO 3
41
3. SINTONIZACION DE UN CONTROL PID POR MEDIO DE ENJAMBRES EVOLUTIVOS
En la actualidad existen varios metodos para sintetizar, sintonizar o disenar un controlador, por
lo tanto se hace necesario poseer un sistema del cual se conozca una solucion suboptima
que permita comparar el desempeno de las diversas contribuciones. Con este objetivo en
mente se propuso una solucion de forma cerrada para obtener un lmite para el tiempo de
movimiento y establecimiento de un sistema estandar de dos masas, mostrado en la figura
3.1 con un modo flexible y un modo rgido [Reynolds99]. El amortiguamiento es incluido para
hacer los resultados lo mas generales posibles. El objetivo de este sistema es mover la masa
no controlada m2 a una distancia xF en un tiempo mnimo sometido a una restriccion del
actuador de FMAX . Sea entonces la frecuencia natural del sistema dada por la ecuacion 3.1 y
el radio de amortiguamiento por la ecuacion 3.2, donde k y b son las constantes del resorte
y el amortiguador respectivamente, tenemos que el sistema en espacio de estado esta dado
por las ecuaciones 3.3 y 3.4 donde Y corresponde a la aceleracion de m2 .
42
3.1 Sistema de dos masas con flexibilidad y amortiguamiento
s
k m1
n = 1+ (3.1)
m1 m2
s
m1
b 1+ m
= 2
(3.2)
2 km1
0 1 0
X = X+ U (3.3)
n 2 n
2 1
1 2
n 2 n X
Y= (3.4)
m2
s
1
q q
ap = p n e n T s |F (s1 )| 2 2 + 2 cos + 2n Ts 1 2 + 2 + 4
2m2 1 + 2
(3.5)
s
4 (m1 + m2 ) xF
Ts = (3.7)
FMAX
43
3. SINTONIZACION DE UN CONTROL PID POR MEDIO DE ENJAMBRES EVOLUTIVOS
1 xF 10.000
2 m1 2.0000
3 m2 2.0000
4 k 1.5000
5 b 0.8000
6 Ts 16.000
7 n 1.2247
8 0.3266
9 d 0.8247
10 FMAX 10.000
11 F (s1 ) -5427.8287-2712.358 j
12 ap 4.7822
13 a 0.1000
14 tset 31.4376
Con el calculo de la aceleracion pico, se define un lmite para la aceleracion donde se presume
el sistema es estable al cual se denomina a y es definido por el usuario. Con estos valores
se obtiene una ecuacion para el tiempo de movimiento y establecimiento para el sistema el
cual es mostrado en la ecuacion 3.8.
ln (a /a p )
tset = n Ts (3.8)
n
Si una estrategia de control en particular tiene un tiempo tset mayor que la forma simple, es
altamente probable que el tiempo y esfuerzo extra empleado es desperdiciado. Esta estrategia
representa valores adecuados para sistemas con moderado ( > 0,1) o fuerte ( > 0,6)
amortiguamiento.
Para hacer uso de esta prueba, es necesario parametrizar el sistema, de tal manera que
presente un amortiguamiento moderado o fuerte, caso en el cual el diseno de interruptor
simple es adecuado. Los parametros seleccionados muestran en la tabla 3.1.
Con estos valores, obtenemos un sistema cuyas ecuaciones de estado corresponden a las
ecuaciones 3.9 y 3.10.
0 1 0
X = X+ U (3.9)
1,50 0,80 1
Y= 0,75 0,40 X (3.10)
44
3.2 Sintonizacion de controladores PID
Dentro de esta ultima categora, se hace uso de una funcion de costo que representa el
objetivo de diseno del sistema, como por ejemplo reducir el error durante la respuesta al
escalon, reducir el tiempo de establecimiento o el sobrepaso maximo; como objetivo del
metodo de optimizacion. En varios trabajos se hace uso de los Algoritmos Geneticos para
sintonizar controladores en sistemas no lineales [Herrero02, Griffin03].
Para obtener una solucion al problema descrito en la seccion 3.1, se utilizaran los algoritmos
EvBSFO y EvPSO, con parametros iniciales descritos en la tabla 3.2, para sintonizar las
ganancias de un controlador PID con la estructura descrita en la ecuacion 3.11 el cual controla
la posicion final xF de la masa no controlada m2 . Teniendo en cuenta que la salida descrita
por el modelo en espacio de estado esta dada como la aceleracion de m2 , se debe integrar
doblemente la salida para obtener la posicion, suponiendo condiciones iniciales iguales a
cero.
de(t)
Z
u (t) = KP e(t) + KI e(t)dt + KD (3.11)
dt
45
3. SINTONIZACION DE UN CONTROL PID POR MEDIO DE ENJAMBRES EVOLUTIVOS
Tabla 3.2: Parametros de los algoritmos para la sintonizacion del control PID
Algoritmo KP KD KI tset ap xp
EvBSFO 0.5976 46.821 -0.0031 31.40 -5.095 17.84
EvPSO 0.4307 48.448 -0.0022 24.60 -2.911 14.89
Tabla 3.3: Parametros del Controlador PID obtenidos por Enjambres Evolutivos
Para el desarrollo de este problema, se elaboro una metodologa a partir del conocimiento
extrado del comportamiento de los algoritmos en el captulo 2. Los resultados en este capitulo
mostraron que los algoritmos evolutivos tienen una probabilidad de encontrar igual o mejor
respuesta en cerca del 50 % de las ocasiones comparado con un algoritmo de enjambres
no evolutivo. Con esto en mente, se realizan dos experimentos para la sintonizacion fuera de
lnea. El primero de ellos toma el espacio de busqueda definido por los lmites 10 KP 10,
10 KI 10 y 100 KD 100 para encontrar una zona del espacio mas prometedora.
Como funcion de costo en este experimento se hace uso del error cuadrado medio sobre
una referencia constante igual a xF , con el objetivo de reducir el error de magnitud mayor a
uno. Luego, se selecciona el espacio de busqueda alrededor del punto obtenido para realizar
una sintonizacion fina al ubicar una mayor cantidad de agentes en este nuevo rango. En este
experimento, se utiliza como funcion de costo el error absoluto medio sobre una referencia
constante igual a xF , con el objetivo de reducir el error de magnitud menor a uno. Con el
primer experimento se determina que las ganancias adecuadas se encuentran en el rango
0 KP 1, 0,05 KI 0,05 y 40 KD 50. Con el segundo experimento se obtienen
los resultados finales que se muestran en la tabla 3.3, teniendo en cuenta que el tiempo de
establecimiento tset se define como el tiempo en el cual la aceleracion de m2 no sobrepasa el
valor de a utilizado.
La tabla muestra que se obtiene un valor de tset de una magnitud similar al obtenido por medio
del interruptor simple, al aplicar el algoritmo EvBSFO sobre el controlador PID, pero se obtiene
un valor inferior al aplicar el algoritmo EvPSO. A continuacion, se realizaron dos pruebas para
determinar el comportamiento del controlador frente a una referencia constante y frente a
cambios de referencia. Los resultados se muestran en las figuras 3.2 y 3.3. Las graficas
superiores muestran la referencia y la posicion de m2 , las intermedias muestran la aceleracion
y los lmites definidos por a y las inferiores muestran la accion de control efectuada.
La figura 3.2 muestra el resultado obtenido al utilizar el PID sintonizado por EvBSFO.
46
3.3 Procedimiento y Resultados
Position
50
10
0
0 50
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
5 10
Acceleration
Acceleration
0
0
5
10 10
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
10 10
Control
Control
0 0
10 10
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
Time Time
Figura 3.2: Resultados obtenidos con el PID sintonizado por EvBSFO: (Izquierda) Referencia Constante (Derecha) Referencia Variable
Position
50
10
0
0 50
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
5 10
Acceleration
Acceleration
0 0
5 10
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
10 10
Control
Control
5
0
0
5 10
0 5 10 15 20 25 30 35 40 0 50 100 150 200 250 300 350 400
Time Time
Figura 3.3: Resultados obtenidos con el PID sintonizado por EvPSO: (Izquierda) Referencia Constante (Derecha) Referencia Variable
Con el experimento con referencia fija, se puede observar que el controlador genera una
senal con un valor inicial igual a FMAX , que inmediatamente decae a un valor de 5.97.
La salida del sistema produce un sobrepaso en la posicion de 17.84 y una aceleracion
pico de -5.095. La figura 3.3 muestra el resultado obtenido al utilizar el PID sintonizado
por EvPSO. Con el experimento con referencia fija, se puede observar que el controlador
genera una senal con un valor inicial igual a FMAX , que inmediatamente decae a un valor
de 4.303, suficientemente inferior a la producida por el controlador sintonizado por EvBSFO.
La salida del sistema produce un sobrepaso en la posicion de 14.89 y una aceleracion pico
de -2.911, lo que implica un menor tiempo de establecimiento. El incremento de la ganancia
KD mejora sustancialmente el amortiguamiento. Los resultados obtenidos en el experimento
de referencia variable son resumidos en la tabla 3.4, donde se observa nuevamente que los
controladores sintonizados poseen un valor de tset similar o inferior en la mayora de los casos
frente a la respuesta obtenida con el interruptor simple (IS).
47
3. SINTONIZACION DE UN CONTROL PID POR MEDIO DE ENJAMBRES EVOLUTIVOS
Escalon 1 2 3 4 5 6 7 8 9
3.4. Conclusiones
Sin embargo, este problema no representa un sistema complejo como lo fue definido
anteriormente. Para examinar el potencial que poseen los algoritmos de enjambres evolutivos
es necesario hacer uso de un sistema cuyo modelo matematico se desconoce y cuyo analisis
determnistico sea de una mayor dificultad. Con esto en mente, se realiza el diseno de un
controlador para la Plataforma de Experimentacion de Temperatura Multizona (MuTEP).
48
CAPITULO 4
49
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
50
4.2 Control Indirecto Adaptativo
La mayora de las tecnicas para disenar sistemas de control estan basadas en un buen
entendimiento de la planta bajo estudio y su entorno. Sin embargo, en algunas ocasiones,
la planta a controlar es muy compleja y sus procesos basicos no son completamente
entendidos. En este caso, las tecnicas de control pueden ser complementadas con tecnicas
de identificacion realizadas de manera recursiva, para obtener progresivamente un mejor
entendimiento de la planta a controlar por medio de un modelo que es actualizado
periodicamente en base a los ultimos datos. Esta tecnica, denominada control adaptativo,
permite utilizar el modelo identificado para disenar un controlador [Sastry89].
51
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
yi (k) = i yi (k 1) + i ui (k 1) (4.1)
yi (k) = i yi (k 1) + i yi (k 2) + i ui (k 1) + i ui (k 2) (4.2)
Haciendo uso del criterio de certeza de equivalencia, se puede extraer una ley de control al
desplazar temporalmente el modelo un periodo de tiempo hacia adelante. En este instante,
la salida deseada ri (k) reemplaza la salida del sistema. Al despejar la salida de control ui (k)
52
4.2 Control Indirecto Adaptativo
obtenemos un controlador inverso de primer (Ecuacion 4.3) y segundo (Ecuacion 4.4) orden.
1
ui (k) = (ri (k) i yi (k)) (4.3)
i
1
ui (k) = ri (k) i yi (k) i yi (k 1) i ui (k 1) (4.4)
i
El siguiente paso en el diseno del controlador adaptativo es formular la funcion de costo para
el algoritmo de enjambres. Teniendo en cuenta el objetivo de obtener un modelo parametrico
de la zona se considera la suma del error absoluto de identificacion en las ultimas n muestras
como la funcion objetivo (Ecuacion 4.5) para la zona, donde y (k n) y y (k n) es la salida
real y estimada de la planta respectivamente en el instante k n.
m
Ji = |yi (k n) yi (k n)| (4.5)
n=0
Finalmente, se definen tres arquitecturas para el IAC: Controlador de primer orden con
acoplamiento (IAC1), Controlador de segundo orden con acoplamiento (IAC2), Controlador
de primer orden sin acoplamiento (IAC3). Se requiere la identificacion de 3 modelos de primer
orden para IAC1 con un total de 6 parametros, 3 modelos de segundo orden para IAC2 con
un total de 12 parametros IAC2, y 16 modelos de primer orden para IAC3 con un total de 32
parametros, cuyos rangos son [0 1,10] para i y i , y [1 20] para i y i . Para los controladores
acoplados, se utiliza el promedio de los valores de Ji de las zonas acopladas para obtener
el mejor individuo. Los algoritmos de optimizacion seleccionados para el experimento son
BSFO, IWPSO, EvBSFO y EvPSO, con los parametros mostrados en la tabla 4.1, donde d
es la diagonal del espacio de busqueda y epoch es el numero de iteraciones del algoritmo
por instante, que para EvBSFO es menor debido a su mayor tiempo de computo. La accion
de control entregada por el estimador es filtrada al promediarla con la ultima accion utilizada,
53
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
con el objetivo de evitar cambios excesivos que producen mediciones ruidosas, segun lo
encontrado en [Alfonso07a].
En las figuras 4.4 y 4.5, se observan resultados tpicos del control con identificacion por
enjambre de bacterias y de partculas no evolutivos, donde se presentan fallas generalizadas
de los controladores debido a la incapacidad del identificador de obtener un modelo adecuado
del sistema. Para el caso del algoritmo BSFO con volumen infinito (Figura 4.4), el sistema
genera una accion de control fuertemente oscilatoria sin convergencia sobre todos los
actuadores. El resultado es una perdida total de la referencia de 35 C en el area central
de la matriz de sensores, alcanzando temperaturas cercanas a los 50 C. Para el caso del
algoritmo IWPSO con volumen aislado (Figura 4.5) se produce un fenomeno diferente, donde
la falla aparece al presentarse un estancamiento del controlador en una accion de control
maxima sobre varios actuadores. Esto conlleva una perdida total de la referencia de 45 C
sobre la mayora de la matriz de sensores, e inclusive elevando la temperatura a cerca de
80 C.
54
4.3 Procedimiento y Resultados
Temperature Signals
60 60 60 60 60
50 50 50 50 50 1 1 1 1
40 40 40 40 40 0.5 0.5 0.5 0.5
30 30 30 30 30
0 100200 0 100200 0 100200 0 100200 0 100200 0 0 0 0
60 60 60 60 60 0 100 200 0 100 200 0 100 200 0 100 200
50 50 50 50 50
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.4: Resultados obtenidos con el IAC1 con identificacion por BSFO con referencia constante de 35 C y volumen infinito: (Izquierda)
Senales de temperatura (Derecha) Acciones de control
Temperature Signals
80 80 80 80 80 1 1 1 1
60 60 60 60 60
40 40 40 40 40 0.5 0.5 0.5 0.5
0 100200 0 100200 0 100200 0 100200 0 100200 0 0 0 0
80 80 80 80 80 0 100 200 0 100 200 0 100 200 0 100 200
60 60 60 60 60 1 1 1 1
40 40 40 40 40
Temperature (C)
Figura 4.5: Resultados obtenidos con el IAC3 con identificacion por IWPSO con referencia constante de 40 C y volumen aislado: (Izquierda)
Senales de temperatura (Derecha) Acciones de control
En las figuras 4.6, 4.7 y 4.8, se observan resultados tpicos del control con identificacion
por enjambre de bacterias evolutivo, donde se presentan algunas mejoras con respecto a lo
obtenido con el algoritmo BSFO (Figura 4.4), en particular la generacion de una accion de
control mas suave. Para el caso del controlador IAC1 con volumen aislado (Figura 4.6), se
produce una accion de control fuerte en los instantes iniciales del experimento que decrece
rapidamente a valores cercanos o iguales a cero en todos los actuadores, aunque se observa
una tendencia a evitar tomar acciones sobre los actuadores centrales. Para el caso del
controlador IAC2 con volumen infinito (Figura 4.7), la exposicion a la temperatura ambiente
hace necesario producir una accion de control mayor, en particular sobre los bordes de
la matriz, nuevamente evitando producir acciones fuertes sobre los actuadores centrales,
aunque se producen algunos picos alrededor del segundo 200 del experimento, los cuales
producen una leve incremento que es rapidamente corregido. Para el caso del controlador
55
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 200 0 200 0 200 0 200 0 200 0 0 0 0
50 50 50 50 50 0 200 0 200 0 200 0 200
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.6: Resultados obtenidos con el IAC1 con identificacion por EvBSFO con referencia constante de 35 C y volumen aislado:
(Izquierda) Senales de temperatura (Derecha) Acciones de control
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 100200 0 100200 0 100200 0 100200 0 100200 0 0 0 0
50 50 50 50 50 0 100 200 0 100 200 0 100 200 0 100 200
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.7: Resultados obtenidos con el IAC2 con identificacion por EvBSFO con referencia variable y volumen infinito: (Izquierda) Senales
de temperatura (Derecha) Acciones de control
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 500 0 500 0 500 0 500 0 500 0 0 0 0
50 50 50 50 50 0 500 0 500 0 500 0 500
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.8: Resultados obtenidos con el IAC3 con identificacion por EvBSFO con referencia variable y volumen infinito: (Izquierda) Senales
de temperatura (Derecha) Acciones de control
56
4.3 Procedimiento y Resultados
IAC3 con volumen infinito y referencia variable (Figura 4.8) el controlador genera una accion
que permite el seguimiento de la referencia de manera adecuada en mayor parte de la
estructura, entre ella la generacion de una accion de control mnima durante el paso de
40 C 35 C. La accion de control es consecuente con lo observado en el IAC2.
En las figuras 4.9, 4.10 y 4.11, se observan resultados tpicos del control con identificacion por
enjambre de partculas evolutivo, donde se presenta un desempeno adecuado del controlador
debido a las mejoras en el esquema de identificacion proporcionadas por la evolucion de los
parametros. A diferencia de los resultados obtenidos con el algoritmo IWPSO (Figura 4.5), el
sistema genera acciones de control inicialmente altas, pero que decrecen rapidamente. Para
el caso del controlador IAC1 con volumen infinito (Figura 4.9), el sistema no produce accion
de control sobre el area central de la matriz de sensores evitando la perdida de la referencia.
Sin embargo existen sensores que no alcanzan la temperatura objetivo, como por ejemplo
el sensor (1,4) el cual alcanza una temperatura estable muy inferior. La observacion de los
sensores vecinos muestra que este resultado es producto de aproximar la salida de la zona
al promedio de sus sensores constituyentes. Para el caso del controlador IAC2 con volumen
aislado (Figura 4.10), el identificador cambia su comportamiento al reducir sustancialmente
su accion de control, para obtener una temperatura superior. Finalmente, para el caso del
controlador IAC3 con volumen aislado y referencia variable (Figura 4.11), el sistema sigue la
referencia de manera adecuada, inclusive realizado una accion de control mnima durante
el paso de 40 C 35 C. La accion de control es consecuente con lo observado en el
IAC2, donde una menor accion de control genera un mayor incremento de temperatura en
el volumen aislado.
Para evaluar el comportamiento del IAC con identificacion por enjambres con y sin evolucion
de tal manera que se pueda realizar una comparacion objetiva entre los algoritmos, se hace
uso de los ndices de desempeno mostrados en la tabla 4.2, donde yi es el promedio de la
temperatura del iesimo sensor de las ultimas 60 muestras, r es el valor de referencia del
experimento, yi (k) corresponde a la temperatura del iesimo sensor en el instante k, ui (k)
57
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 100200 0 100200 0 100200 0 100200 0 100200 0 0 0 0
50 50 50 50 50 0 100 200 0 100 200 0 100 200 0 100 200
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.9: Resultados obtenidos con el IAC1 con identificacion por EvPSO con referencia constante de 40 C y volumen infinito: (Izquierda)
Senales de temperatura (Derecha) Acciones de control
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 100200 0 100200 0 100200 0 100200 0 100200 0 0 0 0
50 50 50 50 50 0 100 200 0 100 200 0 100 200 0 100 200
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.10: Resultados obtenidos con el IAC2 con identificacion por EvPSO con referencia constante de 45 C y volumen aislado:
(Izquierda) Senales de temperatura (Derecha) Acciones de control
Temperature Signals
50 50 50 50 50 1 1 1 1
40 40 40 40 40
30 30 30 30 30 0.5 0.5 0.5 0.5
0 500 0 500 0 500 0 500 0 500 0 0 0 0
50 50 50 50 50 0 500 0 500 0 500 0 500
40 40 40 40 40 1 1 1 1
30 30 30 30 30
Temperature (C)
Figura 4.11: Resultados obtenidos con el IAC3 con identificacion por EvPSO con referencia variable y volumen aislado: (Izquierda) Senales
de temperatura (Derecha) Acciones de control
58
4.3 Procedimiento y Resultados
o o
Temperatura Final Promedio ( C) Temperatura Final Promedio ( C)
60 60
IAC1
IAC1
40 40
20 20
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
60 60
IAC2
IAC2
40 40
20 20
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
60 60
IAC3
IAC3
40 40
20 20
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.12: Temperatura final promedio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
IAC1
20 50
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
40 100
IAC2
IAC2
20 50
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
40 100
IAC3
IAC3
20 50
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.13: Error relativo con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
Los valores obtenidos de los ndices para el experimento con volumen infinito y aislado
y referencia constante se muestran en las figuras 4.124.20, donde se observan algunas
ventajas de los controladores con identificadores evolutivos sobre los no evolutivos, en
particular la capacidad del identificador de adaptarse a nuevas condiciones de funcionamiento
de la planta, debidas a un cambio en su dinamica.
En la figura 4.12 se muestra el resultado para t f . Tanto para el experimento con volumen
infinito como aislado, el mejor desempeno obtenido por los identificadores no evolutivos esta
representado por el IAC2, que es ligeramente inferior al desempeno de los identificadores
evolutivos. Sin embargo, para IAC1 e IAC2 los resultados obtenidos con identificacion
59
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
o o
Dispersin ( C) Dispersin ( C)
10 10
IAC1
IAC1
5 5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
10 10
IAC2
IAC2
5 5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
10 10
IAC3
IAC3
5 5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.14: Dispersion de la superficie con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
IAC1
50 400
200
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
150
30
100
IAC2
IAC2
20
10 50
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
300 1500
200
IAC3
IAC3
1000
100 500
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.15: Error cuadrado medio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
En la figura 4.14 se muestra el resultado para . El experimento con volumen infinito muestra
que los algoritmos evolutivos poseen una superficie mas uniforme, al ser en la mayora
60
4.3 Procedimiento y Resultados
IAC1
4
10
2
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
4 10
IAC2
IAC2
2 5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
30
10
IAC3
IAC3
20
5 10
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.16: Error absoluto medio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
4 Error Cuadrado por el Tiempo Medio 5 Error Cuadrado por el Tiempo Medio
x 10 x 10
3
2
2
IAC1
IAC1
1 1
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
4
10000 x 10
4
IAC2
IAC2
5000
2
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
4 5
x 10 x 10
4
IAC3
IAC3
5
2
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.17: Error cuadrado por el tiempo medio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
de los casos menores que sus contrapartes no evolutivos, a excepcion del IAC2 entre
IWPSO y EvPSO. Para el experimento con volumen aislado muestra errores catastroficos
en los controladores IAC1 e IAC3 para los identificadores no evolutivos. En el caso de
los identificadores evolutivos presentan una superficie con baja distorsion en todos los
controladores.
En las figuras 4.15 y 4.16 se muestran los resultados para MSE y MAE . En el caso de
los errores promedio se observa una tendencia a producirse errores mayores que uno,
al presentarse valores altos de error cuadrado. Se puede pensar que esta tendencia se
corregira, si en lugar de utilizar el error absoluto de identificacion (ecuacion 4.5) se usa el
error cuadrado. Sin embargo, durante la etapa de diseno se encontro que el error cuadrado
de identificacion produca un desempeno inferior al error absoluto. Los resultados muestran
que el menor error cuadrado se obtiene con IAC2 en todos los casos. Los identificadores
61
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
Error Absoluto por el Tiempo Medio Error Absoluto por el Tiempo Medio
2000 8000
6000
IAC1
IAC1
1000 4000
2000
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
3000
1000
IAC2
IAC2
2000
500 1000
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
8000
3000
6000
IAC3
IAC3
2000
4000
1000 2000
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.18: Error absoluto por el tiempo medio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
IAC1
0.05 0.05
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
0.1 0.1
IAC2
IAC2
0.05 0.05
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
0.1 0.1
IAC3
IAC3
0.05 0.05
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.19: Suavidad de la accion de control con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
evolutivos presentan ndices de error cuadrado y absoluto de valores similares en todos los
controladores. Caso contrario ocurre con los identificadores no evolutivos donde su mejor
desempeno se presenta en IAC2. El error absoluto tiene valores similares a los obtenidos con
la dispersion mostrando la existencia de una relacion entre estos dos valores.
En las figuras 4.17 y 4.18 se muestran el resultado para MT SE y MTAE , que permiten
establecer una tendencia del error. Los resultados obtenidos permiten concluir que para los
identificadores no evolutivos, a medida que incrementa la temperatura, el error es menor,
debido a que los errores catastroficos resultan en temperaturas elevadas relativamente
cercanas a la referencia. En cuanto al error en los identificadores evolutivos, se observa
un incremento cercano al proporcional, que indica que el error se mantiene en un rango
constante a pesar de incrementar el tiempo. Nuevamente el controlador IAC2 tiene los
menores ndices con todos los identificadores. IWPSO es altamente inefectivo y presenta
62
4.3 Procedimiento y Resultados
IAC1
0.5 0.5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
1 1
IAC2
IAC2
0.5 0.5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
1 1
IAC3
IAC3
0.5 0.5
0 0
BSFO EvBSFO IWPSO EvPSO BSFO EvBSFO IWPSO EvPSO
Figura 4.20: Accion de control promedio con referencia fija: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
una tendencia de temperatura creciente, lo que implica que durante el experimento, no solo
el error fue alto, sino que la temperatura continua creciendo.
En las figuras 4.19 y 4.20 se muestran los resultados para CAS y CAA. El analisis de estos
ndices permiten concluir que los identificadores por partculas presentan una accion de
control mas uniforme al presentar un menor CAS, mientras que los identificadores evolutivos
poseen un CAA bajo. Los altos valores de CAA presentados por los identificadores no
evolutivos indican una accion de control errada producida por el sistema de identificacion,
generando una perdida de la senal de referencia por sobrepaso. En el caso del controlador
por BSFO, los valores de CAS indican una accion de control oscilante, que produce el efecto
observado en la figura 4.4.
Los valores obtenidos de los ndices para el experimento con volumen infinito y aislado y
referencia variable se muestran en las figuras 4.214.29, donde se comprueban los resultados
obtenidos por los identificadores evolutivos, y ademas se demuestra que el algoritmo no se
estanca sobre una referencia en particular.
63
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
o o
Temperatura Final Promedio ( C) Temperatura Final Promedio ( C)
60 60
40 40
IAC1
IAC1
20 20
0 0
EvBSFO EvPSO EvBSFO EvPSO
60 60
40 40
IAC2
IAC2
20 20
0 0
EvBSFO EvPSO EvBSFO EvPSO
60 60
40 40
IAC3
IAC3
20 20
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.21: Temperatura final promedio con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
IAC1
10 10
0 0
EvBSFO EvPSO EvBSFO EvPSO
20 20
IAC2
IAC2
10 10
0 0
EvBSFO EvPSO EvBSFO EvPSO
20 20
IAC3
IAC3
10 10
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.22: Error relativo con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
En la figura 4.23 se muestra el resultado para . Los valores obtenidos indican un incremento
en la dispersion de la superficie al incrementar la temperatura, un efecto tambien observado
en los experimentos de referencia fija. En algunas situaciones tambien se observa que la
dispersion a 40 C es mayor que la dispersion a 45 C, corroborando la tendencia a disminuir,
no solo el error, sino tambien la dispersion de la superficie a medida que pasa el tiempo del
experimento.
En las figuras 4.24 y 4.25 se muestran el resultado para MSE y MAE respectivamente. Los
resultados obtenidos en estos ndices muestran dos aspectos para considerarse. El primero
64
4.3 Procedimiento y Resultados
o o
Dispersin ( C) Dispersin ( C)
4 4
IAC1
IAC1
2 2
0 0
EvBSFO EvPSO EvBSFO EvPSO
4 4
IAC2
IAC2
2 2
0 0
EvBSFO EvPSO EvBSFO EvPSO
4 4
IAC3
IAC3
2 2
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.23: Dispersion de la superficie con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
IAC1
4
10 2
0 0
EvBSFO EvPSO EvBSFO EvPSO
30
15
20
IAC2
IAC2
10
5 10
0 0
EvBSFO EvPSO EvBSFO EvPSO
15
60
10
IAC3
IAC3
40
5 20
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.24: Error cuadrado medio con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
65
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
IAC1
2 1
0 0
EvBSFO EvPSO EvBSFO EvPSO
4
3
IAC2
IAC2
2 2
1
0 0
EvBSFO EvPSO EvBSFO EvPSO
3
4
IAC3
IAC3
2
2
1
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.25: Error absoluto medio con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
Error Cuadrado por el Tiempo Medio Error Cuadrado por el Tiempo Medio
10000 4000
IAC1
IAC1
5000 2000
0 0
EvBSFO EvPSO EvBSFO EvPSO
15000 8000
6000
10000
IAC2
IAC2
4000
5000
2000
0 0
EvBSFO EvPSO EvBSFO EvPSO
4
x 10
10000 5
IAC3
IAC3
5000
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.26: Error cuadrado por el tiempo medio: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
En las figuras 4.28 y 4.29 se muestra el resultado para CAS y CAA. El analisis de CAS indica
que el mayor esfuerzo de control se produce en los instantes iniciales del control, donde se
pasa de la temperatura ambiente a la temperatura de referencia de 40 C, en particular para
los controladores acoplados con EvBSFO. Esto tambien indica que a media que transcurre
el tiempo, la accion de control es mas uniforme, efecto que influye en el error del sistema.
Igualmente se puede concluir, que el identificador obtiene, a medida que pasa el tiempo una
66
4.4 Conclusiones
Error Absoluto por el Tiempo Medio Error Absoluto por el Tiempo Medio
3000
1500
2000
IAC1
IAC1
1000
1000 500
0 0
EvBSFO EvPSO EvBSFO EvPSO
3000
1500
2000
IAC2
IAC2
1000
1000 500
0 0
EvBSFO EvPSO EvBSFO EvPSO
3000
4000
2000
IAC3
IAC3
2000
1000
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.27: Error absoluto por el tiempo medio con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
0.04 0.04
IAC1
IAC1
0.02 0.02
0 0
EvBSFO EvPSO EvBSFO EvPSO
0.04 0.04
IAC2
IAC2
0.02 0.02
0 0
EvBSFO EvPSO EvBSFO EvPSO
0.04 0.04
IAC3
IAC3
0.02 0.02
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.28: Suavidad de la accion de control con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
mejor aproximacion del sistema. En cuanto al CAA, la accion de control efectuada sobre la
referencia de 35 C es cercana a cero. Esto se debe a que el sistema, luego de mantenerse
en una referencia superior, debe apagar los actuadores para decrecer la temperatura del
sistema. Los resultados indican que en efecto, el controlador efectua esta accion.
4.4. Conclusiones
67
4. REGULACION DE TEMPERATURA EN LA PLATAFORMA DE EXPERIMENTACION DE
TEMPERATURA MULTIZONA
0.4 0.4
IAC1
IAC1
0.2 0.2
0 0
EvBSFO EvPSO EvBSFO EvPSO
0.4 0.4
IAC2
IAC2
0.2 0.2
0 0
EvBSFO EvPSO EvBSFO EvPSO
0.4 0.4
IAC3
IAC3
0.2 0.2
0 0
EvBSFO EvPSO EvBSFO EvPSO
Figura 4.29: Accion de control promedio con referencia variable: (Izquierda) Sobre volumen infinito (Derecha) Sobre volumen aislado
estrategia de identificacion. El primer paso para la solucion de este problema fue establecer
pautas para que el algoritmo de optimizacion, disenado originalmente para una unica funcion
de costo, sea capaz de optimizar varias funciones de costo independientes, lo cual fue posible
al definir una funcion de costo motivadora del enjambre y seleccionar los parametros de cada
modelo utilizando al mejor individuo por funcion de costo.
Los resultados obtenidos en los experimentos permitieron demostrar que la evolucion de los
enjambres permite obtener mejores resultados en el problema de control, que los obtenidos
al utilizar enjambres con parametros generalizados, alcanzando menores ndices de error
y de dispersion, con acciones de control menores y mas suaves. Adicionalmente, se pudo
confirmar la validez de las simplificacion realizada por medio del acoplamiento de los modelos,
ya que en la mayora de los casos, el controlador de segundo orden presenta un mejor
desempeno que el controlador desacoplado de primer orden.
68
CAPITULO 5
69
5. CONCLUSIONES Y TRABAJOS FUTUROS
Los algoritmos de SI, como metodos de optimizacion a su vez resultan de utilidad en los
sistemas de control al ser sustitutos de otras tecnicas ampliamente utilizadas, como lo son
mnimos cuadrados, algoritmos geneticos, programacion lineal, entre otras. En este trabajo se
mostro la utilidad de estos algoritmos en la sintonizacion de controladores fuera de lnea como
lo son los PID y controladores en lnea como es el IAC. En particular, el IAC resulto altamente
beneficiado con los algoritmos de enjambres evolutivos al ser comparado con aquellos que no
poseen autoadaptacion. La combinacion de enjambres evolutivos e IAC permitio obtener un
controlador que se desempena de manera muy satisfactoria frente a un problema complejo
como lo es MuTEP.
70
5.2 Publicaciones resultantes de la investigacion
M.A. Munoz, J.A. Lopez & E.F. Caicedo. An Artificial Bee Hive for Continuous
Optimization. International Journal of Intelligent Systems. Aceptado.
Resumen: In this paper, we present an Artificial BeeHive Algorithm for optimization
in continuous search spaces based on a model aimed at individual bee behavior.
The algorithm defines a series of behavioral rules for each agent to determine what
actions must be carried out. Additionally, our algorithm includes some adaptations
not considered in the biological model to increase the performance in the search for
better solutions. To compare the performance of the algorithm to other swarm-based
algorithms, we conducted statistical analyses by using the so-called t-test. This
comparison is done by using several benchmark functions.
M.A. Munoz, J.A. Lopez & E.F. Caicedo. Control Inteligente usando optimizacion
por colonia de hormigas. En Congreso Internacional de Inteligencia Computacional
CIIC2007. Bogota, 57 Septiembre de 2007.
Resumen: En este artculo se presenta la manera como los algoritmos basados
en colonia de hormigas pueden ser aplicados para resolver problemas en el campo
del control automatico. Los algoritmos basados en colonia de hormigas son una
metodologa perteneciente a la denominada Inteligencia de Enjambres o Colectiva.
En este trabajo se presentan dos aplicaciones de estos algoritmos en el campo del
control de procesos: primero se presenta el control adaptativo indirecto del nivel de un
tanque y, posteriormente, se presenta la asignacion de recursos sobre una grilla de
temperatura. Los resultados obtenidos permiten mostrar que la Inteligencia Colectiva y,
especficamente, los algoritmos basados en colonia de hormigas son una herramienta
prometedora para el desarrollo de controladores inteligentes.
M.A. Munoz, J.A. Lopez & E.F. Caicedo. Optimizacion y Control usando Colonias de
Hormigas. En VII Congreso de la Asociacion Colombiana de Automatica ACA2007.
Santiago de Cali, 2124 de Marzo de 2007.
Resumen: En este artculo se presenta la manera como un algoritmo de optimizacion
en espacios continuos basado en colonia de hormigas puede ser aplicado para resolver
71
5. CONCLUSIONES Y TRABAJOS FUTUROS
M.A. Munoz, E.F. Caicedo. & J.A. Lopez Estudio Comparativo de Esquemas de
Control Inteligente Aplicado a un Tanque con Agitacion Continua. En VII Congreso de la
Asociacion Colombiana de Automatica ACA2007. Santiago de Cali, 2124 de Marzo
de 2007.
Resumen: En este trabajo se estudia la simulacion de controladores neuronales,
difusos y PID sintonizado evolutivamente para un tanque de calentamiento de
agitacion continua; y se presenta un analisis comparativo del desempeno de los
mismos. Los resultados demostraron la factibilidad y el funcionamiento adecuado de
ciertos controles para esta planta y las dificultades que se podran presentar en
la implementacion de uno u otro para este caso. El trabajo pretende demostrar la
utilidad de estos metodos gracias a su flexibilidad y a la posibilidad de implementar
controladores a plantas cuyo modelo matematico exacto se desconoce.
Los resultados obtenidos en este trabajo permiten formular algunas hipotesis cuyo desarrollo
puede ser evaluado en trabajos posteriores. Si bien el estudio de la metodologa de
autoadaptacion se realizo en tres escenarios diferentes, proporcionando una cantidad
suficiente de datos para sustentar las afirmaciones, es necesario realizar un estudio de
estabilidad y convergencia de los algoritmos, en particular sobre los parametros de la
estrategia. El trabajo realizado hasta el momento pudo determinar que la tendencia del
algoritmo es a reducir sus parametros mientras se encuentre en un descenso de gradiente.
De lo contrario el algoritmo incrementara sus parametros.
72
5.3 Trabajos Futuros
desempeno global como costo para la autoadaptacion. Sin embargo, se sugiere continuar la
exploracion de poblaciones de menor tamano, incluyendo poblaciones de un solo individuo,
similar al encontrado en [Miranda02b]. Este trabajo permitira el uso de la cruza de parametros
entre poblaciones. Sin embargo, cuando se consideran poblaciones de mas de un individuo,
se hace necesario el desarrollo de un algebra de poblaciones.
73
5. CONCLUSIONES Y TRABAJOS FUTUROS
74
APENDICE A
Tablas de resultados
75
A. TABLAS DE RESULTADOS
Tabla A.1: Desempeno del Controlador Indirecto Adaptativo con volumen de control infinito y referencia fija
76
IAC r yf ER MSE MAE MT SE MTAE CAS CAA
35 63.8131 82.3232 5.8314 873.6135 28.8131 235856.3260 7765.5773 0.0691 0.3054
1 40 63.4411 58.6027 5.7613 591.9713 23.4411 160044.1594 6322.3337 0.0691 0.3187
45 67.3120 49.5823 5.8833 543.2126 22.3120 146971.0715 6020.2266 0.0702 0.3364
Tabla A.2: Desempeno del Controlador Indirecto Adaptativo con volumen de control aislado y referencia fija
77
A. TABLAS DE RESULTADOS
Tabla A.3: Desempeno del Controlador Indirecto Adaptativo con volumen de control infinito y referencia variable
Tabla A.4: Desempeno del Controlador Indirecto Adaptativo con volumen de control aislado y referencia variable
78
Bibliografa
79
BIBLIOGRAFIA
[Bilchev95] G. Bilchev & I. Parmee. The ant colony metaphor for searching
continuous design spaces. En T. Fogarty, ed., Evolutionary Computing,
Selected Papers AISB Workshop, tomo 993 de Lecture Notes in
Computer Science, pags. 2539. Springer, 1995. 1.3.2
80
BIBLIOGRAFIA
81
BIBLIOGRAFIA
82
BIBLIOGRAFIA
[Hoffmann00] F. Hoffmann. Soft computing techniques for the design of mobile robot
behaviors. Information Sciences, 122(24):241258, 2000. 1.2
83
BIBLIOGRAFIA
[Jin99] Y. Jin & W. von Seelen. Evaluating flexible fuzzy controllers via
evolution strategies. Fuzzy Sets and Systems, 108:243252, 1999. 1.2
84
BIBLIOGRAFIA
[Lvbjerg01] M. Lvbjerg & T. Kink. Hybrid Particle Swarm Optimiser with Breeding
and Subpopulations. En Genetic and Evolutionary Computation
Conference (GECCO). 2001. 1.3.1
85
BIBLIOGRAFIA
[Munoz08] M. Munoz, J. Lopez & E. Caicedo. An Artificial Bee Hive for Continuous
Optimization, 2008. Aceptado en International Journal of Intelligent
Systems. 1.3.5, 2.2
86
BIBLIOGRAFIA
[Pham07a] D. Pham, A. Afify & E. Koc. Manufacturing cell formation using the
Bees Algorithm. En Innovative Production Machines and Systems
Virtual Conference. 2007. 1.3.5
87
BIBLIOGRAFIA
88
BIBLIOGRAFIA
[Stutzle97] T. Stutzle & H. Hoos. The MAXMIN ant system and local search for
the traveling salesman problem. En T. Baeck, Z. Michalewicz & X. Yao,
eds., IEEE International Conference on Evolutionary Computation and
Evolutionary Programming Conference (IEEEICECEPS97), pags.
309314. IEEE Press, 1997. 1.3.2
[Voss02] M. S. Voss & X. Feng. ARMA Model Selection Using Particle Swarm
Optimization and AIC Criteria. En IFAC 15th Triennial World Congress.
2002. 1.3.1
[Whitaker02] R. Whitaker & S. Hurley. An agent based approach to site selection for
wireless networks. En ACM Symposium on Applied Computing, pags.
574577. 2002. 1.3.4
89
BIBLIOGRAFIA
[Zhang03] W. Zhang & X. Xie. DEPSO: Hybrid Particle Swarm with Differential
Evolution Operator. En IEEE International Conference on Systems, Man
and Cybernetics (SMCC), pags. 38163821. 2003. 1.3.1
90