Sei sulla pagina 1di 10

3 Declaração do Problema

Assumimos um sistema N-agente com movimento governado pela equação

onde N m, qi 2 Rm é a posição do i-ésimo agente e ui 2 Rm é a entrada de controle de nível de


velocidade correspondente.

A formação desejada pelos agentes é modelada pela estrutura orientada F = (G; q) em que G =
(V; Ed), dim (V) = N, dim (Ed) = a e q = [q1; ....; qN]. A distância desejada fixada que separa os
agentes i e j-ésésimo é

Assumimos que F é construído para ser minimamente persistente. Com base na discussão na
Seção 2, uma estrutura que satisfaz as seguintes condições é minimamente persistente.

Para satisfazer essas condições, F pode ser construído usando a construção do tipo Henneberg
para gráficos direcionados descritos na Seção 2.2.

A formação real de agentes é modelada por F (t) = (G; q (t)) onde q = [q1; :::; qN].

Observe que F compartilha o mesmo gráfico direcionado que F. Isso significa que o grafo é
fixado e conhecido a priori. O significado físico de (i; j) € Ed na formação real é que o agente i
pode medir sua posição relativa ao agente j, qi - qj, mas não vice-versa.

Este artigo enfocará o problema de aquisição de formação para o sistema multi-agente. O


objetivo do controle para esse problema é projetar ui = ui (qi - qj; dij; t), 8i 2 V e 8j 2 Ni (E d) de
modo que

4 Lei de Controle de Formação


A posição relativa dos agentes i e j é de
enquanto o erro de distância correspondente é

Para simplificar o projeto de controle subsequente e a análise de estabilidade, apresentamos a


seguinte variável de erro alternativa [26]

Usando (14), pode-se verificar que (15) pode ser expresso como:

Dado que k ~ qijk 0, eij é definido apenas em [ijdij; 1) e ij = 0 se e somente se eij = 0. Usando
(15), (14) e (9), podemos calcular a dinâmica de loop aberto para ij como

Agora, considere a função candidata de Lyapunov

é organizado da mesma maneira que (2). A derivada temporal de (18) é dada por

onde (17) foi empregado. Pelo uso de (3), a equação anterior pode ser convenientemente
expressa como

onde u = [u1;................;uN] RmN.

Com base em (21), propomos a seguinte lei de controle:

onde Rd (q) foi definido em (8) e k> 0 é um ganho de controle. Em termos de elementos, (22)
assume a forma;
que é apenas uma função de ~ qij e dij para (i; j) 2 E d. Assim, a lei de controle é distribuída, uma
vez que requer apenas o i-ésimo agente para medir sua posição relativa aos agentes vizinhos
no grafo orientado.

Observação 1 A lei de controle de aquisição de formação com base em um gráfico não


direcionado que geralmente aparece na literatura é dada por [7. 26].

A i-ésima entrada do agente é então:

onde E é o conjunto de arestas do gráfico não direcionado subjacente associado a E d. Ou seja,


a entrada de controle de ambos os agentes i e j depende de ~ qij, ao contrário de (23) onde
apenas o controle para o agente i ou agente j depende de sua posição relativa.

Usando (22) em (21) dá

O desafio agora é provar que (26) é negativo. Observe que, se usar (24), obter-se-á _
que pode ser provado ser localmente negativo definido, mostrando
que a uma matriz simétrica R (q) R | (q) é definitivo positivo para certas condições iniciais
condições [7]. Infelizmente, a análise de estabilidade de (26) não é tão simples, pois R (q) R | d
(q) não é simétrico.

Observação 2 No caso especial em que m = 2, N = 3 e F é o ciclo orientado mostrado na Figura


1, foi demonstrado que (23) garante que a formação desejada seja exponencialmente estável
quando os agentes são inicialmente não colineares [13].

5 Resultados Preliminares
Antes de declarar nosso resultado principal, apresentamos uma série de resultados
relacionados à estabilidade que serão invocados pela análise principal de estabilidade. A
seguinte métrica para a “distância” entre um ponto e um conjunto será usada em todo: dist (;
M): = infx2 M k 􀀀 xk para pontos; x 2 Rm e um conjunto M.

Lema 1 [6] Considere duas estruturas ^ F = (G; ^ q) e F = (G; q) compartilhando o mesmo


gráfico.

Se ^ F é infinitesimalmente rígido e dist (q; Iso (^ F)) "onde" é suficientemente pequeno


positivo constante, então F também é infinitesimalmente rígido.
Corolário 1 Se ^ F = (G; ^ q) com o gráfico direcionado G é minimamente persistente e dist (q;
Iso (^ F)) "onde" é uma constante positiva suficientemente pequena, então F = (G; q) também
é minimamente persistente.

Prova. Do Lema 1, sabemos que F é infinitesimalmente rígido. Como ^ F e F têm o mesmo


gráfico direcionado, as Condições 1 e 3 da Seção 3 são válidas para F. Portanto, F é
minimamente persistente.

Corolário 2 Dadas estruturas ^ F = (G; ^ q) e F = (G; q) com o gráfico G = (V; E) e a função

se ^ F é minimamente persistente e (F; ^ F) para suficientemente pequeno> 0, então F também


é minimamente persistente.

O corolário 1 formaliza a noção intuitiva de que a persistência mínima é preservada sob


pequenos deslocamentos da estrutura, enquanto o corolário 2 relaciona esse resultado aos
conjuntos de níveis do candidato à função Lyapunov (18), pois (F; F) = V.

Lema 2 [25] Considere o sistema x_ = f (x; u) onde x é o estado, u é a entrada de controle ef (x;
u) é localmente Lipschitz em (x; u) em algum bairro de (x) = 0; u = 0). Então, o sistema é estável
no estado de entrada para estado se, e somente se, o sistema não forçado x_ = f (x; 0) tiver um
ponto de equilíbrio local assintoticamente estável na origem.

Lema 3 [27] Considere o sistema interconectado

Se o subsistema 1 com a entrada y for localmente estável no estado da entrada e y = 0 for um


ponto de equilíbrio localmente assintoticamente estável do subsistema 2, então [x; y] = 0 é um
ponto de equilíbrio localmente assíntoticamente estável do sistema interconectado.

Por fim, apresentamos as seguintes notações: o conjunto de pontos não colineares pi; pj; pk 2
Rm é denotado por NC; o conjunto de pontos não coplanares pi; pj; pk; pl 2 R3 é denotado por
NP

6 Análise de estabilidade para formações 2D

O teorema a seguir indica nosso principal resultado para o caso em que m = 2. A extensão do
caso 3D é discutida na próxima seção.

Teorema 1 Considere a formação F (t) = (G; q (t)) com a formação alvo F = (G; q) e os conjuntos

onde a constante > 0 é suficientemente pequena. Se as condições iniciais do sistema


satisfizerem (0) 2 \, o controle (22) com m = 2 torna = 0 assintoticamente estável e garante que
(11) seja satisfeito.
Prova. Começamos observando que, como F é minimamente rígido devido à Condição 3, F
(t) é minimamente rígido para todos os t 0, uma vez que as duas estruturas têm o mesmo
conjunto de arestas. Analogamente, F (t) é consistente com restrições para todos os t 0 devido
à Condição 1.

A análise de (26) será realizada explorando a estabilidade dos sistemas interconectados e o


princípio da indução matemática. Para esse fim, deixamos F0 = (G0; [q1; q2]) F ser a formação
primitiva em que G0 = (V0; E0) é um gráfico direcionado com V0 = f1; 2g e E0 = f (1; 2) g.
Segue-se de (17) que a dinâmica do loop aberto para o erro 12 é dada por

onde (15) foi usado. É fácil ver em (31) que 12 = 0 é assintoticamente estável para q1 (0) 6 = q2
(0) (ou equivalente 12 (0) > )d2 12).

Etapa base: suponha que um vértice adicional seja adicionado à formação primitiva F0
com duas arestas de saída. Seja a formação resultante denominada F1 = (G1; [q1; q2; q3]) F
com gráfico direcionado G1 = (V1; E1) G onde V1 = f1; 2; 3g e E1 = f (1; 2); (3; 1); (3; 2) g. A
dinâmica do erro de malha aberta para as duas novas arestas é
No Apêndice A, mostramos que a matriz simétrica P1 é positiva, quando os três agentes não
são colineares. Uma condição suficiente para (q1; q2; q3) 2 NC para todo o tempo é 1 (t): = [0
(t); E1 (t)] 2 1: = f 1: (F1; F 1) 1g, onde foi definido em (27), F 1 = (G1; [q 1; q 2; q 3]) F, e 1 é
uma constante positiva suficientemente pequena. Portanto, podemos afirmar

A desigualdade (38) indica que _V1 (t) 0 para todos os t 0, o que significa que V1 (t) é
constante ou está diminuindo o tempo todo. Como (F1; F 1) = V1 e os conjuntos de níveis de
V1 estão fechados, F1 (t) é minimamente persistente pelo Corolário 2. Além disso, uma
condição suficiente para (38) é dado por

Portanto, E1 = 0 é um ponto de equilíbrio localmente exponencialmente estável de (35) [25] e


(34a) é localmente estável ao entrar no estado de acordo com o Lema 2. Como a estabilidade
assintótica de 0 = 0 para (34b) (isto é, (31)) foi estabelecido na análise da formação primitiva,
podemos invocar o Lema 3 para afirmar que 1 = 0 é assintoticamente estável para (34) para as
condições iniciais 1 (0) 2 1,6

Etapa indutiva: O processo de adicionar um vértice k com duas arestas de saída a


quaisquer dois vértices distintos, i e j, da formação anterior Fn 􀀀1 para criar uma nova
formação Fn (n = 2; 3;:: :) pode ser seguiu um passo de cada vez7, resultando em cada passo
no sistema interconectado.

onde En = [ki; kj] é o estado da dinâmica do erro de distância das duas arestas adicionadas e
n􀀀1 é o estado de formação Fn􀀀1 e n = [n􀀀1; En] é o estado de Fn. Quando n􀀀1 = 0 in (41a), o
sistema não forçado assumirá a forma
8 Validação de controle
Simulações e experimentos em computador foram realizados para ilustrar o desempenho da
lei de controle de aquisição de formação dirigida em (22). O experimento também foi
conduzido para a lei padrão de controle não direcionado para fins de comparação.

8.1 Simulação 3D
Uma simulação foi realizada no MATLAB, onde oito agentes que se deslocavam em 3D eram
necessários para adquirir a formação desejada na Figura 3. Dezoito arestas direcionadas foram
introduzidas para
garantir que a estrutura fosse minimamente persistente. As condições iniciais qi (0) foram
obtidas perturbando aleatoriamente o valor de cada posição do agente mostrada na Figura 3.
O ganho de controle em (22) foi definido como 1.

A Figura 4 mostra as trajetórias dos agentes ao longo do tempo à medida que adquirem a
formação desejada.

Observe que o agente 3 não se moveu, pois não possui arestas de saída. A Figura 5 mostra os
erros de distância entre agentes eij (t), (i; j) 2 Ed convergindo para zero conforme o esperado.
Os componentes das direções x, y e z das entradas de controle ui (t), i = 1; :::; 8 são
apresentados na Figura 6.

8.2 Experiência 2D
Também realizamos um experimento no sistema Robotarium [34], que é uma plataforma de
testes de robótica que utiliza o GRITSBot como plataforma de robô móvel [33]. A arena do
banco de ensaio possui uma área de 130 180 cm2 na qual vários robôs podem ser
implantados. O GRITSBot é um robô de rodas de baixo custo, equipado com um conjunto de
sensores integrados, comunicação sem fio, bateria e placas de processamento, e tem uma área
útil de aproximadamente 3 3 cm2. Uma câmera no teto e uma etiqueta de identificação
exclusiva no topo do chassi de cada robô fornecem um sistema de rastreamento de posição
para seus movimentos. O Robotarium é ideal para testar leis de controle do tipo cinemático,
uma vez que usa comandos de nível de velocidade como entradas para os robôs com o loop de
controle de velocidade de baixo nível invisível para o usuário.

No experimento, foram necessários cinco robôs para formar o pentágono regular mostrado na
Figura 7. As posições iniciais dos robôs foram escolhidas por perturbar aleatoriamente o valor
de cada posição do robô na Figura 7. Sete arestas direcionadas foram usadas para garantir que
a estrutura fosse minimamente persistente, e o conjunto de arestas direcionadas foi Ed = f (2;
1); (3; 1); (5; 1); (4; 2); (1; 4); (5; 4); (3; 5) g. Além do controle de formação direcionado em
(22), sua versão não direcionada fornecida por (24) foi implementada para fornecer um
desempenho de linha de base para comparação. Para isso No final, ambos os controladores
foram executados com as mesmas condições iniciais e ganho de controle (k = 2). As trajetórias
dos robôs para os dois controladores são mostradas na Figura 8, indicando que os dois
controladores foram bem-sucedidos na convergência para a formação desejada. Desde a
distância

controladores baseados apenas podem garantir que a formação seja adquirida até a rotação e
translação, é esperada a isometria entre a formação final de cada controlador. A Figura 9
mostra os erros de distância entre agentes, eij (t), (i; j) 2 Ed. Observe que os erros do diretório
não direcionado

O controlador de formação possui transientes ligeiramente mais rápidos que os do caso


direcionado. Isso pode ser explicado pelo fato de que, para qualquer borda não direcionada
que conecta dois robôs, ambos trabalham para regular sua distância até o valor desejado. Por
outro lado, os erros de estado estacionário do controlador de formação não direcionada são
um pouco maiores. Conjecturamos que isso seja devido ao fenômeno descrito em [5], onde
erros de medição causam um conflito na regulação da distância desejada entre os dois robôs.
Por fim, a Figura 10 mostra os componentes das direções x e y das entradas de controle ui (t), i
= 1;.........;5, onde não há significante

diferença entre os dois controladores. Um vídeo das duas experiências pode ser encontrado no
link: www.youtube.com/watch?v=J63gDD_9HQE&feature=youtu.be.

9 Conclusões
O objetivo deste artigo foi discutir o problema de controle de formação em espaços
bidimensionais e tridimensionais, com base em grafos orientados. Mostramos que a teoria de
sistemas interconectados pode ser empregada para provar a estabilidade assintótica da
dinâmica do erro de distância entre agentes. de uma versão direcionada da lei de controle do
gradiente de descida quando o grafo é minimamente persistente. Apenas para fins de análise,
a formação foi dividida em sub formações interconectadas, começando de uma formação
primitiva que pode ser cíclica. A estabilidade de entrada para estado foi então usada
recursivamente para mostrar a estabilidade da cascata crescente de dois subsistemas até a
formação final ser atingida. Resultados de simulação e experimentais foram apresentados para
ilustrar o desempenho do controlador da formação orientada. Os trabalhos futuros serão
dedicados a estender a abordagem proposta aos problemas de interceptação e interceptação
de alvo e outros modelos de movimento de agentes

Potrebbero piacerti anche