Luca Furieri Tesi

` di Bologna
Alma Mater Studiorum Universita
SCUOLA DI INGEGNERIA E ARCHITETTURA

Corso di Laurea in Ingegneria dellAutomazione
TEORIA DEL CONSENSO E

APPLICAZIONE AL PROBLEMA DEL
COORDINAMENTO DEL MOTO DI
ROBOT
Tesi di Laurea in Controlli Automatici
Relatore:
Presentata da:
Chiar.mo Prof.
Luca Furieri
Lorenzo Marconi
II Sessione
Anno Accademico 2013-2014
A genuine leader is not a searcher for consensus,

but a molder of consensus.
- Martin Luther King, Jr.
Introduzione
Il sempre crescente numero di applicazioni di reti di sensori, robot cooperanti e formazioni di veicoli, ha fatto s` che le problematiche legate al coordinamento di gruppo
diventassero tra le pi`
u studiate nellambito della teoria dei controlli. La sfida principale in tali applicazioni è quella di raggiungere un comportamento di gruppo prestabilito
utilizzando algoritmi decentralizzati e locali, piuttosto che dei controllori centralizzati
ai quali riferirsi. Molto simile al problema del coordinamento è quello dellagreement,
o consensus: lobiettivo è quello di portare variabili di interesse ad un valore comune.
Risolvendo tale problema, diventa possibile pensare ad un numero estremamente vasto di
applicazioni, spaziando ad esempio dallo studio dei comportamenti di gruppo nei branchi
e negli stormi di organismi viventi alla computazione distribuita o alla sorveglianza di
foreste per prevenire incendi. In questo lavoro, il focus applicativo è posto sul controllo
di formazione di un network di veicoli, le cui traiettorie di riferimento vengono generate
utilizzando algoritmi locali di coordinamento.
La strategia che verrà studiata ha una natura distribuita: non è prevista la presenza
di un leader o di un coordinatore esterno di altra natura. Piuttosto, la formazione raggiunta è ottenuta come conseguenza dellinterazione locale tra i singoli veicoli.
I sistemi dinamici, che possono essere di qualsiasi natura (biologica, fisica, ecc...)
vengono solitamente rappresentati mediante i cosiddetti diagrammi a blocchi: il sistema
è cioè raffigurato come un box che riceve delle variabili in ingresso e ne produce altre in
uscita. Tuttavia, nel momento in cui pensiamo ad un insieme di sistemi dinamici comunicanti ed interagenti tra di loro, si viene a creare una nuova struttura pi`
u complessa,
i
ii
INTRODUZIONE
chiamata rete di sistemi dinamici o semplicemente gruppo, in cui ogni sistema dinamico è rappresentato da un nodo o agente, ed esistono dei collegamenti tra i vari nodi che
permettono ad un agente di interagire con i suoi vicini nella rete. Nellottica di una rete
di tal genere, assumono grande importanza i problemi di consenso e sincronizzazione. In
una rete di agenti, consensus indica il raggiungimento di un agreement relativamente ad
una certa quantità di interesse che dipende dallo stato di tutti gli agenti. Un algoritmo
(o protocollo) di consenso è una legge di interazione che regola lo scambio di informazioni tra un agente ed i suoi vicini nella rete al fine di raggiungere un accordo complessivo.
Struttura e finalit`
a della tesi.
Lo scopo dellelaborato è duplice. Da una parte si vuole fornire una trattazione teorica del problema del consenso e della sincronizzazione su sistemi ad una o pi`
u variabili
di stato. Dallaltra si vogliono utilizzare tali risultati teorici per unattività in ambiente
Matlab/Simulink, con il fine applicativo di generare le traiettorie di riferimento per un
gruppo di quadrirotori in formazione. Alla stesura di questo elaborato è stata affiancata
lattività di laboratorio presso il Center for Research on Complex Automated Systems
(CASY-DEI Università di Bologna).
Il capitolo 1 presenta tutti gli strumenti matematici e teorici che saranno ripresi e
sfruttati nei capitoli seguenti. In particolare, si introducono:
Teoria dei Grafi.
Forma e trasformazione di Jordan.
Il prodotto di Kronecker.
Formalizzazione del problema del Consenso.
Modelli nello spazio degli stati e cambi di variabile.
INTRODUZIONE
Nel capitolo 2, viene mostrato il comportamento di una rete di integratori connessi
tra di loro e viene analizzato sotto quali condizioni il consenso viene raggiunto. Per
verificare i risultati noti in letteratura, sono state svolte simulazioni in ambiente Matlab
Simulink: i casi presi in esame comprendevano sia condizioni di topologie di comunicazioni fisse che casi di topologie tempo varianti.
Il capitolo 3 è dedicato ai sistemi multivariabile e alla metodologia che permette di

ottenere la loro sincronizzazione. Utilizzando gli strumenti matematici introdotti nel
capitolo 1, si sviluppa ulteriormente la teoria mostrando formalmente la validità delle
procedure utilizzate. Il capitolo è concluso dallapplicazione al caso di un network di
oscillatori armonici e da una simulazione dimostrativa su Matlab/Simulink.
Il capitolo 4 entra nel dettaglio del modello simulativo per la generazione di traiettorie, che serviranno come generatori di riferimento per un gruppo di quadrirotori. Sarà
possibile impostare raggio e coordinate del centro della traiettoria target, simulando un
tipico scenario di loitering di un sistema multi-robot. La teoria del consenso sia su sistemi integratori che oscillatori sarà sfruttata per ottenere questo risultato.
Il capitolo 5 descrive brevemente il setup di laboratorio utilizzato per realizzare il

sistema di coordinamento di un gruppo di quadrirotori CrazyFlie, implementando a tale
scopo il modello simulativo ottenuto nel capitolo 4. Verranno mostrati i risultati della
prova sperimentale sotto forma di plot delle grandezze di interesse.
iii
iv
INTRODUZIONE
Indice
Introduzione
1 Teoria e strumenti matematici.
1.1
Teoria dei Grafi: alcune definizioni. . . . . . . . . . . . . . . . . . . . . .
1.1.1
Descrizione tramite matrici rappresentative. . . . . . . . . . . . .
1.1.2
Grafi variabili nel tempo. . . . . . . . . . . . . . . . . . . . . . . .
1.1.3
Componenti indipendenti di un grafo. . . . . . . . . . . . . . . . .
Il prodotto di Kronecker. . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
Proprietà del prodotto di Kronecker . . . . . . . . . . . . . . . . .
1.3
Modelli nello spazio degli stati. . . . . . . . . . . . . . . . . . . . . . . .
1.4
Rappresentazioni equivalenti e cambio di variabile. . . . . . . . . . . . . .
1.4.1
Matrici diagonali e trasformazione di Jordan. . . . . . . . . . . . .
1.4.2
Forma canonica di Jordan. . . . . . . . . . . . . . . . . . . . . . .
10
La definizione di consenso . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.2
1.5
2 Lalgoritmo di consenso e simulazioni su sistemi Integratori.

2.1
13
Il protocollo di consenso. . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.1.1
Analisi spettrale della Laplaciana. . . . . . . . . . . . . . . . . . .
14
Altri modi di analizzare la convergenza degli algoritmi di consenso. . . .
16
2.2.1
Analisi di stabilità tramite funzioni di Lyapunov. . . . . . . . . .
16
2.2.2
La proprietà di contrazione
. . . . . . . . . . . . . . . . . . . . .
19
2.3
Il valore di convergenza: laverage-consensus problem. . . . . . . . . . . .
20
2.4
Simulazioni su sistemi integratori. . . . . . . . . . . . . . . . . . . . . . .
23
2.2
vi
INDICE
2.4.1
Simulazione 1: una prima applicazione. . . . . . . . . . . . . . . .
23
2.4.2
Simulazione 2: Grafi sconnessi variabili nel tempo. . . . . . . . . .
26
2.4.3
Simulazione 3: Grafi complessi con componenti residuali. . . . . .
30
3 Sistemi Multiagente Multivariabile.
33
3.1
Loscillatore lineare come sistema. . . . . . . . . . . . . . . . . . . . . . .
34
3.2
Analisi del problema multivariabile. . . . . . . . . . . . . . . . . . . . . .
35
3.2.1
Loutput consensus . . . . . . . . . . . . . . . . . . . . . . . . . .
36
La convergenza del protocollo di consenso su sistemi multivariabile. . . .
37
3.3.1
Trattazione attraverso una qualunque Trasformazione T su L .
38
3.3.2
Sintesi della matrice K . . . . . . . . . . . . . . . . . . . . . . . .
41
3.4
Trattazione attraverso trasformata di Jordan TJ . . . . . . . . . . . . . . .
43
3.5
Analisi attraverso trasformata di Jordan su un caso specifico. . . . . . . .
44
3.5.1
47
3.3
Simulazione: output consensus su 3 oscillatori armonici. . . . . . .
4 Generazione di traiettorie circolari per il loitering di pi`

u robot.
4.1
49
Consenso degli oscillatori. . . . . . . . . . . . . . . . . . . . . . . . . . .
51
4.1.1
Sfasamento degli agenti. . . . . . . . . . . . . . . . . . . . . . . .
53
4.2
Consenso degli integratori. . . . . . . . . . . . . . . . . . . . . . . . . . .
54
4.3
Simulazione della generazione di traiettorie. . . . . . . . . . . . . . . . .
55
5 Il setup di laboratorio e lo schema della Ground Station.
57
5.1
La Ground Station . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
5.2
I risultati di laboratorio. . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
Conclusioni
65
Bibliografia
67
Elenco delle figure

2.1
Schema Simulink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
2.2
Grafo Connesso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2.3
Grafo Sconnesso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.4
Modello Simulink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
2.5
Risultato della simulazione . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.6
Risultato della simulazione. . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.1
Risultato della simulazione . . . . . . . . . . . . . . . . . . . . . . . . . .
48
4.1
Modello: alto livello. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
4.2
Traiettorie prima dello sfasamento . . . . . . . . . . . . . . . . . . . . . .
54
4.3
Traiettorie dopo lo sfasamento. . . . . . . . . . . . . . . . . . . . . . . .
55
4.4
Traiettorie X e Y con cambio di richiesta sul centro ogni 15 secondi. . . .
56
5.1
Quadrirotori CrazyFlie. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5.2
I 3 marker e la struttura in carbonio. . . . . . . . . . . . . . . . . . . . .
59
5.3
Optitrack. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
5.4
Periferica di trasmissione dati al nano-quad. . . . . . . . . . . . . . . . .
60
5.5
Schema della Ground Station . . . . . . . . . . . . . . . . . . . . . . . .
61
5.6
Riferimento per la X, prima e dopo sfasamento. . . . . . . . . . . . . . .
63
5.7
Riferimento per la Y, prima e dopo sfasamento. . . . . . . . . . . . . . .
63
5.8
Tracking della traiettoria di riferimento per un quadrirotore. . . . . . . .
64
vii
Capitolo 1
Teoria e strumenti matematici.
Nello studio di problemi di coordinamento e sincronizzazione di Sistemi Multiagente
(MAS), la comunicazione tra agenti assume un ruolo fondamentale. Il sistema dinamico
complessivo infatti, è il risultato dellinterconnessione di un certo numero di agenti, che
comunicano tra loro secondo una precisa topologia di comunicazione.
Supponiamo dunque che pi`
u sistemi interagiscano luno con laltro tramite una rete di
comunicazione o una rete di sensing, oppure con una combinazione di entrambe: appare
naturale modellare queste interazioni tra i sistemi mediante grafi diretti o indiretti.
1.1
Teoria dei Grafi: alcune definizioni.
Un grafo non diretto G di ordine n è una coppia (, ), dove = {1, . . . , n} è un

insieme di nodi finito e non vuoto, mentre è un insieme di archi corrispondenti
a coppie non ordinate di nodi. Stabilita la coppia (, ), il grafo non diretto G = (, )
risulta completamente definito. Se (i, j) oppure (j, i) , significa che gli agenti i e
j possono scambiarsi vicendevolmente informazioni. Un esempio di grafo non diretto è
il seguente
1. Teoria e strumenti matematici.
dove = {1, 2, 3, 4} e = {(1, 2), (2, 3), (3, 4)}. Si noti che le coppie di nodi non sono
ordinate.
Si parla invece di grafo diretto nel caso in cui sia formato da coppie ordinate di
nodi. In tal caso, la presenza dellarco (i, j) denota che il sistema i può ricevere
informazioni dal sistema j, ma non viceversa. Quello che segue è un esempio di grafo
diretto.
1
dove = {1, 2, 3, 4} e = {(2, 1), (3, 2), (3, 4)} e le coppie di nodi sono ordinate.
Archi che collegano un nodo con se stesso non sono ammessi, cioè i , (i, i)
/ . Considereremo nel resto della tesi che G sia un grafo diretto, se non esplicitato altrimenti.
In un grafo diretto, è possibile introdurre il concetto di percorso diretto, inteso come

una sequenza ordinata di m archi del tipo [(i1 , i2 ), (i2 , i3 ), ..., (im1 , im )]. Intenderemo
per ciclo un percorso diretto che comincia e termina sullo stesso nodo.
Definizione 1 (Grafo connesso semplicemente e fortemente.). Un grafo diretto si dice

connesso se esiste un nodo dal quale è possibile raggiungere tutti gli altri nodi attraverso
un percorso diretto: tale nodo viene detto centroide. Un grafo i cui nodi sono tutti dei
centroidi viene detto fortemente connesso.
1.1 Teoria dei Grafi: alcune definizioni.

Definizione 2 (Grafo connesso debolmente.). Un grafo diretto si dice debolmente connesso se il grafo non diretto sottostante risulta connesso.
1.1.1
Descrizione tramite matrici rappresentative.
` opportuno trovare una descrizione algebrica univoca per rappresentare i nodi

E
e gli archi di un dato grafo diretto. A tale scopo introduciamo le seguenti matrici
rappresentative:
Matrice di Adiacenza A Rnn . Lelemento aij è una quantità positiva se e

solo se (j, i) , altrimenti ha valore nullo. Considereremo solamente grafi non
pesati, ovvero tale quantità positiva sarà sempre uguale a 1.
P
Definiamo grado in entrata del nodo i come nj=1 aij e grado in uscita del nodo i
P
P
P
come nj=1 aji : il nodo i è bilanciato se nj=1 aij = nj=1 aji .
Matrice Laplaciana diretta L Rnn . Gli elementi presenti sulla diagonale
P
sono definiti come lii = nj=1,j6=i aij , mentre per gli altri elementi vale lij = aij .
La propriet`
a di connessione.
Definite le matrici rappresentative, è possibile stabilire se un grafo diretto è connesso
attraverso lanalisi degli autovalori della matrice Laplaciana associate a tale grafo. Vale
infatti il seguente teorema:
Teorema 1. Supponiamo che G = (, ) sia un grafo diretto tale che ogni elemento
della matrice di adiacenza A associata appartenga allinsieme {0} {, +} per un
certo > 0 . Allora G è connesso se e solo se il secondo autovalore della Laplaciana
associata L ha parte reale positiva, cioè se <(2 (L)) 0, dove per convenzione il secondo
autovalore di L è quello con la seconda parte reale pi`
u piccola.
1.1.2
Grafi variabili nel tempo.
Le definizioni finora date sono facilmente estendibili a grafi con topologia di connessione variabile nel tempo. Anche le matrici rappresentative A(t), L(t) saranno dunque
dipendenti dal tempo: questa osservazione ci porta a considerare la matrice di adiacenza
R t+T
media nel periodo T, definita come A(t)avg = T1 t A( )d .
Definizione 3. Il grafo GT avg (t) indotto da AT (t)avg si dice uniformemente connesso se
t R, {i , i centroide di GT (t)}, cioè se GT avg (t) è connesso per ogni t. Si pu`
o
verificare la connessione di GT avg (t) allistante t sfruttando il Teorema 1 .
1.1.3
Componenti indipendenti di un grafo.
` possibile definire alcune proprietà di interesse sui sottografi di un grafo complessivo

E
G(t); diamo quindi la definizione di sottografo per poi enunciare queste proprietà:
Definizione 4. Un sottografo di G è una coppia (s , s ) tale che s e s (s s ).
Definizione 5 (Componente fortemente connessa di un grafo.). Al tempo t una iSCC
di un grafo diretto G(t) = (, ) è un suo sottografo G(t) = (s , s ) che ha la propriet`
a di
essere massimo, fortemente connesso e tale che i \s , (i, j)
/ (t) con j s .
Ciò significa che non esiste nessun arco con coda in un nodo di \s e testa in un
nodo di s ; ovvero, per quanto ci riguarda, nessun sistema dinamico rappresentato da un
nodo di s è influenzato da qualunque altro sistema dinamico rappresentato da un nodo
allesterno di s . Questo giustifica laggettivo indipendente per un iSCC.
Definizione 6 (Componente indipendente connessa semplicemente). Una componente

indipendente connessa (iCC) di un grafo diretto è un suo sottografo che ha la propriet`
a
di essere massimo e connesso, ed è tale che non esiste un arco di con coda in un
nodo non appartenente a s e testa in s .
Sia adesso c 1 il numero di iCC di un grafo diretto. Possiamo suddividere lintero
grafo in c + 1 sottografi: i primi c sono le iCC stesse, lultimo è il sottografo composto
1.2 Il prodotto di Kronecker.
da quei nodi (se esistono), chiamati residui, che possono avere degli archi entranti provenienti da nodi di qualcuna delle iCC, ma non degli archi uscenti diretti a nodi delle
iCC. Tale grafo viene detto grafo residuo.
Un ulteriore importante risultato di nostro interesse è il seguente:
Teorema 2. Dato un grafo diretto G(t) = (, ), la dimensione dellautospazio relativo

allautovalore 0 della matrice Laplaciana L(t) associata a tale grafo, i.e. dim[Ker(L(t)],
è pari al numero di iSCC (o analogamente iCC) che compongono il grafo.
1.2
Il prodotto di Kronecker.
In matematica, nel campo dellalgebra lineare, il prodotto di Kronecker, indicato con

, è una operazione tra due matrici di dimensioni arbitrarie, sempre applicabile.
Se A è una matrice m n e B una matrice p q, allora il loro prodotto di Kronecker
è una matrice definita a blocchi nel modo seguente:
a B ... a1n B
11
A B = ...
...
...
am1 B ... amn B
cioè, esplicitando ogni termine:
a b
a11 b11
11 11
a11 b21 a11 b22
...
...
a11 bp1 a11 bp2
...
...
AB =
...
...
am1 b11 am1 b11
am1 b21 am1 b22
...
...
am1 bp1 am1 bp2
1.2.1
... a11 b1q
... ... a1n b11
... a11 b2q
... ... a1n b21
...
... ...
...
...
a1n b12
... a1n b1q
a1n b22
...
...
...
a1n bp2
...
... a11 bpq
... ... a1n bp1
...
...
... ...
...
...
...
...
...
... ...
...
...
...
... am1 b1q ... ... amn b11 amn b12 ...
... am1 b2q ... ... amn b21 amn b22 ...
...
...
... ...
...
...
...
... am1 bpq ... ... amn bp1 amn bp2 ...
a1n b2q
...
a1n bpq
...
...
amn b1q
amn b2q
...
amn bpq
Propriet`
a del prodotto di Kronecker
Bilinearit`
a e associativit`
a
Il prodotto di Kronecker è un caso speciale di prodotto tensoriale, dunque è bilineare
e associativo:
A (B + C) = A B + A C.
(A + B) C = A C + B C.
(kA) B = A (kB) = k(A B).
(A B) C = A (B C).
Tuttavia, questo prodotto non è commutativo.
Prodotto misto
Se A, B, C, D sono matrici tali che esiste il prodotto righe per colonne tra A e C e
tra B e D, allora esiste anche (A B)(C D) e vale che:
(A B)(C D) = (AC) (BD)
1.3 Modelli nello spazio degli stati.
Ne segue che (A B) è invertibile se e solo se lo sono A e B e linversa è data da

(A B)1 = A1 B 1
Spettro
Siano A e B matrici quadrate di ordine rispettivamente n e q, e siano 1 , ..., n gli
autovalori di A, 1 , ..., q quelli di B. Allora gli autovalori di A B sono tutti quelli della
forma:
i j ,
i = 1, ..., n; j = 1, ..., q.
Ne seguono le seguenti proprietà su determinante e traccia:

tr(A B) = tr(A)tr(B).
det(A B) = det(A)q det(B)n
1.3
Modelli nello spazio degli stati.
` possibile rappresentare ogni sistema dinamico lineare d-dimensionale tramite il

E
cosiddetto modello nello spazio degli stati.. Esso è costituito dalle equazioni:
x(t)
= Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t)

dove
x(t) = col[x1 (t), ..., xd (t)]
è il vettore contenente le d variabili di stato del sistema,
y(t) = col[y1 (t), ..., ym (t)]

è il vettore contenente le m uscite,
u(t) = col[u1 (t), ..., ud (t)]
(1.1)

è il vettore contenente i d ingressi di controllo, e le matrici A, B, C, D sono chiamate
matrici di sistema.
1.4
Rappresentazioni equivalenti e cambio di variabile.
La scelta del modello che rappresenta il comportamento del nostro sistema non è
affatto univoca. Consideriamo infatti il modello 1.1 : se prendiamo una trasformazione
lineare T Rdd biunivoca e quindi non singolare, possiamo effettuare un cambio di
variabili definendo il vettore di stato z come
z(t) = T x(t).
(1.2)
Visto che T è invertibile, tra x e z risulta una corrispondenza biunivoca:
x(t) = T 1 z(t).
(1.3)
Sostituendo la 1.3 nelle equazioni in 1.1, dopo aver moltiplicato a sinistra per T si
ottiene il modello:
z (t) = A0 z(t) + B 0 u(t)
(1.4)
y(t) = C 0 z(t) + D0 u(t)

con
A0 = T AT 1 ,
B 0 = T B,
C 0 = CT 1 ,
D0 = D.
(1.5)
Questo sistema dinamico è equivalente a quello descritto dalle equazioni 1.1 nel senso
che, per un ingresso u(t), t t0 , e due stati iniziali xt0 e zt0 correlati dalla condizione
zt0 = T xt0 , le traiettorie dello stato in 1.1 e in 1.4 sono effettivamente legati dalla condizione 1.3 e i movimenti delluscita sono identici. Tutto ciò è semplicemente verificabile
per sostituzione. Ne ricaviamo che le quadruple di matrici (A, B, C, D) e (A, B, C,
1.4 Rappresentazioni equivalenti e cambio di variabile.

D) sono due maniere differenti di descrivere un medesimo oggetto fisico.
Nel seguito avremo bisogno di descrivere in forma compatta un cambio di variabili

su un set di n sistemi ognuno dei quali ha d variabili di stato: sfrutteremo quindi lo
strumento del prodotto di Kronecker. Se w = [w1 , ..., wn ] è il vettore dei vettori di stato
d-dimensionali di ogni sistema (wi Rd ) e vogliamo applicare il cambio di coordinate T ,
calcoleremo dunque:
z = (T 1 Id )w
1.4.1
Matrici diagonali e trasformazione di Jordan.
Nel problema del consenso risulta utile effettuare un cambio di variabili sugli stati
per portare la matrice Laplaciana che descrive le connessioni tra i sistemi in una forma
pi`
u comoda. In particolare ci interessa ottenere una matrice diagonale, in modo che le
equazioni che descrivono levoluzione di ogni sistema dipendano soltanto dalle variabili di
stato del sistema stesso e non da quelle dei sistemi suoi vicini nel grafo di comunicazione.
Teorema 3 (Diagonalizzabilità di una matrice). Una matrice A si dice diagonalizzabile
se e solo se V, , = V 1 AV , dove V è una opportuna matrice invertibile formata
da autovettori di A, mentre è una matrice diagonale. In tal caso A e sono matrici
simili, e cioè hanno:
Stesso determinante.
Stessa traccia.
Stesso rango.
Stessi autovalori.
Purtroppo però non tutte le matrici sono diagonalizzabili. Prendiamo ad esempio la
matrice Laplaciana
2 1 1
L= 0
1 1
1 0
1
10
associata al semplice grafo

1
Dal momento che lautospazio relativo al suo autovalore = 2 ha dimensione 1 nonostante la corrispondente molteplicità aritmetica sia pari a 2, non è possibile trovare
una matrice V formata di autovettori di L che abbia rango pari a 3. Non esiste quindi
una matrice diagonale simile ad L.
Introduciamo quindi un nuovo strumento matematico che ci permetta di effettuare

un cambio di variabili efficace anche in presenza di Laplaciane non diagonalizzabili: la
trasformazione in forma canonica di Jordan.
1.4.2
Forma canonica di Jordan.
In algebra lineare, la forma canonica di Jordan di una matrice quadrata A definisce

una matrice triangolare J simile ad A che ha una struttura il pi`
u possibile vicina ad una
matrice diagonale. La matrice è diagonale se e solo se A è diagonalizzabile, altrimenti è
divisa in blocchi detti blocchi di Jordan.
Una matrice in forma di Jordan è una matrice diagonale a blocchi del tipo
J1
0
... ...
J =
0
Jk
dove Ji è il blocco di Jordan relativo allautovalore i , definito come
1.5 La definizione di consenso
11
i 1
Ji =
0
...
...
...
...
...
0 .
Esso contiene cioè sulla diagonale il valore i ed il valore 1 in ogni posizione (i, i + 1).
Notiamo che qualora tutti i blocchi di Jordan abbiano dimensione unitaria, la matrice
in forma canonica di Jordan è diagonale.
Il risultato che ci interessa è il seguente: è sempre possibile trovare una matrice L

in forma canonica di Jordan simile a L tale che TJ le cui colonne sono autovettori o
= T 1 LTJ , come vedremo in 3.4.
autovettori generalizzati di L per cui vale L
J
1.5
La definizione di consenso
Si considera il problema di coordinare tra di loro n sistemi omogenei appartenenti ad

una rete, in grado di scambiarsi informazioni secondo una topologia che può efficacemente
essere descritta da un grafo di comunicazione G(t). Mostreremo nel capitolo 2 che sotto
certe ipotesi sia per quanto riguarda la topologia della rete che linformazione scambiata
tra gli agenti, le variabili di stato dei sistemi convergono asintoticamente ad un valore
comune.
Consideriamo n sistemi lineari, per ognuno dei quali le variabili di stato variano
secondo lequazione
x k = Axk + Buk , k {1, ..., n}

con x k Rp e uk Rm .
(1.6)
12

Si dice che il consenso viene raggiunto se, in presenza di un opportuno ingresso di
controllo, le variabili di stato dei diversi sistemi convergono ad un valore comune, cioè se
i {1, ..., n}, j {1, ..., n} lim (xi (t) xj (t)) = 0.
t>+
(1.7)
Raggiungere il consenso può essere considerato quindi un problema di convergenza,

dove gli stati di equilibrio devono essere tutti valori coincidenti e la stabilità deve essere
di tipo attrattivo.
Ci sono diversi strumenti utilizzabili per lanalisi del problema: quello a cui siamo
pi`
u interessati è lanalisi delle proprietà spettrali delle matrici associate al grafo di comunicazione del sistema. Altri metodi di analisi, come vedremo nel capitolo 2, si basano
sul concetto di funzione di Lyapunov.
Capitolo 2
Lalgoritmo di consenso e
simulazioni su sistemi Integratori.
Abbiamo definito in 1.5 il problema del consenso su sistemi dinamici; siamo adesso
interessati ad illustrare quale protocollo, basato sulla topologia di comunicazione, permetta di generare un ingresso di controllo che porti alla convergenza dei sistemi su un
valore comune.
2.1
Il protocollo di consenso.
Consideriamo il caso di n sistemi integratori connessi tra di loro (matrice di sistema

A = 0 nel modello nello spazio degli stati), la cui topologia di comunicazione è descitta
dal grafo G(t): per semplciità, consideriamo il caso di grafi non pesati in cui akl = 1 se
esiste un arco da l a k, altrimenti akl = 0.
Ciascuno degli n sistemi è descritto dalla dinamica:
x k = uk ,
dove xk è lo stato del sistema e uk è lingresso di controllo.
Se definiamo tale ingresso come:
13
(2.1)
14
2. Lalgoritmo di consenso e simulazioni su sistemi Integratori.
uk =
n
X
aki (xi xk ) =
i=1
n
X
lki xi ,
(2.2)
i=1
dove lki è lelemento ki della matrice Laplaciana associata al grafo G, abbiamo applicato quello che in letteratura è chiamato protocollo di consenso. Tale azione di controllo
dipende dalla differenza relativa tra le variabili di stato (termini del tipo xi xk ) di
agenti che sono effettivamente comunicanti (contributo degli elementi aki oppure lki ).
In definitiva, se applichiamo ad ogni sistema il protocollo di consenso, possiamo

scrivere in forma vettoriale che:
x = Lx
(2.3)
dove
x = col(x1 , x2 , ..., xn ).
La soluzione nel tempo dellequazione 2.3, è data da
x(t) = eLt x0
(2.4)
dove x(0) = x0 Rn è il valore iniziale degli n integratori.
2.1.1
Analisi spettrale della Laplaciana.
Verifichiamo adesso che lalgoritmo di consenso sopra descritto porta alla convergenza
degli stati su valori coincidenti, attraverso lanalisi spettrale della matrice laplaciana L
supposta per il momento indipendente dal tempo. Vale:
0 = 0 `
e autovalore di L. Dal momento che la somma degli elementi su ogni
riga è nulla per definizione, il determinante è sicuramente nullo, cioè rank(L) < n.
Visto che dim(Ker(L)) = n rank(L), ne deriva che la dimensione dellautospazio
relativo allautovalore 0 è non nulla, quindi 0 è autovalore.
Visto che L1n = 0n , ne ricaviamo subito che 1n è autovettore destro di L.
2.1 Il protocollo di consenso.
15
L`
e una matrice con autovalori a parte reale non negativa.
Nel caso di grafo non diretto, si può dimostrare che gli autovalori sono reali non
negativi. Per provarlo, occorre introdurre una definizione:
Definizione 7. Si definisce Laplaciana dellarco (i, j) la matrice L(i,j) che consiste
dei valori non nulli relativi al solo arco (i, j). Se larco è ad esempio (1, 2), allora
1 1 0 ... 0
1 1 0 ... 0
1 1
[zeri]
L(1,2) = 0
0 0 ... 0 =
1 1
... ... ... ... ...
0
0 0 ... 0
dove con si indica la somma di Kronecker. Si può quindi scrivere che
L=
L(i,j)
(i,j)
Notando che

1
1
= 1 1
1 1
1
1
Possiamo dire che
xT L(1,2) x = x1 x2

x1
1 1 = (x1 x2 )2
1
x2
1
ed arrivare alla conclusione che

xT Lx = xT (
(i,j)
L(i,j) )x =
(xi xj )2
(i,j)
dimostrando cos` che xT Lx è una forma quadratica e L è quindi semidefinita positiva per definizione (ricordiamo che una matrice semidefinita positiva ha autovalori
reali non negativi).
16

Nel caso che il grafo sia invece diretto, è necessario sfruttare il teorema dei cerchi di
Greshgorin per dimostrare che tutti gli autovalori, generalmente complessi, hanno
parte reale non negativa.
Se consideriamo lequazione 2.3 e i risultati derivanti dallanalisi spettrale appena
effettuata, ci rendiamo conto che kn = col(k, ..., k)), k R, è uno stato di equilibrio
per ogni k R: se ad un certo istante t si ha che x(t ) = kn vale infatti che:
x(t
) = Lkn = kL1n = 0n .
(2.5)
Dal momento che ogni vettore del tipo kn rappresenta un vettore di stati che hanno
raggiunto il consenso ( tutti gli stati hanno lo stesso valore k), ne deduciamo che tutti
gli stati di consenso sono anche possibili stati di equilibrio.
Resta da capire se gli stati di consenso sono stati di equilibro asintoticamente

stabili. Abbiamo mostrato che la laplaciana L ha autovalori a parte reale non negativa
e ad ogni autovalore di L, corrisponde lautovalore di L. Dunque gli autovalori
della matrice L, che governa levoluzione del sistema, hanno sicuramente parte reale
non positiva e sappiamo dalla teoria dei controlli che ciò corrisponde a stabilità attrattiva.
2.2
Altri modi di analizzare la convergenza degli algoritmi di consenso.
Effettuare unanalisi spettrale della matrice Laplaciana non è lunico approccio che
possiamo seguire per analizzare la convergenza dellequazione 2.3 sugli stati di consenso.
Altri approcci si basano sul trovare opportune funzioni di Lyapunov che ci garantiscano
la stabilità esponenziale, con alcuni vantaggi derivanti quali una descrizione qualitativa
pi`
u comprensibile del comportamento dei sistemi.
2.2.1
Analisi di stabilit`
a tramite funzioni di Lyapunov.
Introduciamo innanzitutto il concetto di funzione di Lyapunov.
2.2 Altri modi di analizzare la convergenza degli algoritmi di consenso.
17
Funzioni di Lyapunov e sistemi dinamici.

Consideriamo il sistema lineare omogeneo tempo continuo
x(t)
= Ax(t),
x Rn
(2.6)
Associamo a questo sistema dinamico la funzione quadratica
V (x) = xT P x
(2.7)
dove P è definita simmetrica e positiva. Questa funzione V è continua ed ha le derivate parziali prime continue. Perciò, dal momento che P è definita positiva, lorigine
è lunico punto di minimo di V . Dunque, una forma quadratica definita positiva come
questa è una possibile candidata funzione di Lyapunov.
Rimane da determinare come V (x) sia influenzato dalle dinamiche del sistema. Si ha
d
V (x) = xT P x
dt
= x T P x + xT P x
T
(2.8)
= x A P x + x P Ax
= xT (AT P + P A)x
Pertanto, definendo la matrice
Q = AT P + P A
(2.9)
V (x) = xT Qx
(2.10)
si ha
La funzione V (x) è nuovamente una forma quadratica e V sarà una funzione di Lyapunov se la matrice Q è semidefinita positiva. Infatti, se Q è semidefinita positiva si può
affermare che il sistema è asintoticamente stabile e converge cioè con velocità esponenziale.
18
Nel caso del protocollo di consenso:
x(t)
= Lx(t), x Rn
la convergenza può essere verificata considerando la funzione candidata di Lyapunov
xT (t)x(t)
=
V (x, t) =
2
Pn
i=1
x2i
(2.11)
Risulta che
x T x + xT x
xT LT x xT Lx
xT (LT + L)x
V (x, t) =
=
=
.
2
2
2
(2.12)
Nel caso in cui il grafo associato ad L sia non diretto, L risulta essere simmetrica
e dunque vale
V (x, t) = xT Lx.
(2.13)
Dal momento che L è semidefinita positiva, le traiettorie degli stati convergono ad

uno dei valori per cui V (x, t) = 0: essendo la somma degli elementi di ogni riga di una
Laplaciana nulla, vale che
{x Rn | V (x, t) = xT Lx = 0} {1n | R}
(2.14)
ovvero, linsieme di stati di consenso corrisponde allinsieme di stati di equilibrio attrattivo, come volevamo mostrare.
Nel caso che il grafo sia invece diretto, continua a valere la 2.12, ma non pi`
u la 2.13.
Daltra parte, sotto lipotesi di un grafo diretto fortemente connesso, oppure debolmente
connesso e bilanciato, vale che
Ker(L + LT ) = Ker(L) = {1n | R}
(2.15)
2.2 Altri modi di analizzare la convergenza degli algoritmi di consenso.
19
e dunque abbiamo ancora che la funzione di Lyapunov 2.11 garantisce la convergenza

allinsieme di consenso.
Nel prossimo paragrafo introduciamo una nuova possibile candidata di Lyapunov.
2.2.2
La propriet`
a di contrazione
Un modo piuttosto intuitivo di catturare le proprietà di convergenza di 2.3, è costruito

su unanalisi dellinterazione elementare, che ricordiamo essere:
x k = akl (xl xk ).
Essa si basa sul fatto che ogni sistema xk varia proporzionalmente alla distanza
che corre tra lo stato di ogni sistema comunicante ed esso stesso, cioè alla quantità
xl xk , l comunicante. In altre parole, ogni stato si muove sempre in direzione degli
altri stati collegati nel grafo di comunicazione. Varrà dunque che min{x1 , ..., xn } non può
decrescere e max{x1 , ..., xn } non può crescere. Possiamo dunque introdurre la funzione
di Lyapunov
V (x) = max{x1 , ..., xn } min{x1 , ..., xn }
(2.16)
che è definita positiva sul set degli stati di consenso {x Rn : x1 = ... = xn }.

Utilizzando questa funzione di Lyapunov, sempre decrescente, siamo in grado di assicurare la convergenza sotto unassunzione piuttosto debole di connessione su intervalli
di tempo, come definito dal seguente teorema (del quale omettiamo la dimostrazione).
Teorema 4. Si consideri il sistema lineare
x = L(t)x
Si assuma che L(t) sia una funzione limitata e quasi-continua nel tempo. Si assuma
inoltre che L(t) sia Metzler con somme di righe nulle. Se esiste un indice k {1, ..., n},
20

un valore di soglia > 0 e un periodo di tempo T > 0 tale che per ogni t R il grafo
medio associato:
Z
t+T
A(s)ds
t
ha la proprietà che tutti i nodi possono essere raggiunti dal nodo k (ed è cioè connesso), allora il set degli stati di consenso è uniformemente ed esponenzialmente stabile.
In particolare, tutte le componenti di ogni soluzione (t) del sistema lineare considerato
convergono a un valore comune per t .
La funzione di Lyapunov di cui si è parlato in questa sottosezione permette di
dimostrare il teorema.
2.3
Il valore di convergenza: laverage-consensus problem.
Abbiamo verificato che il protocollo di consenso garantisce convergenza: ci chiediamo

adesso quale sia il valore di consenso raggiunto dagli agenti. In particolare, apparirebbe
naturale che tutti i sistemi convergessero su
n
k=
1X
xi (0),
n i=1
(2.17)
andando a risolvere quello che viene chiamato in letteratura problema dellaverageconsensus. Purtroppo ciò non è garantito dal semplice fatto che il grafo sia connesso,
come vediamo nel seguito.
Notiamo innanzitutto che il valore finale di convergenza deve essere quel valore k tale
che:
k1n = limt+ x(t) = limt+ (eLt )x0 = Rx0 .
(2.18)
nella quale R = limt+ (eLt ). Dunque, se siamo in grado di conoscere R, sfruttando

la relazione
k1n = Rx0
2.3 Il valore di convergenza: laverage-consensus problem.

è possibile calcolare direttamente il k di convergenza. Vale, in effetti, il seguente
teorema:
Teorema 5. Dato un grafo diretto G fortemente connesso con laplaciano L tale Lwr = 0,
wl T L = 0 e wl T wr = 1 (wl e wr sono quindi due autovettori, rispettivamente sinistro e
destro, associati allautovalore 0 della Laplaciana), si ha che R = wr wl T Rnn .
Affinchè k sia la media dei valori iniziali, è sufficiente che valga una tra 3 condizioni:
la dimostrazione di ciò esula dagli scopi di questa tesi. Riportiamo queste 3 condizioni
nel seguente teorema, il quale afferma che sono in effetti condizioni equivalenti (di tale
fatto riportiamo invece la semplice dimostrazione).
Teorema 6. Sia G un grafo diretto con matrice di adiacenza A. Tutte le seguenti
affermazioni sono equivalenti:
1. G è bilanciato (per ogni nodo, il grado di entrata è uguale a quello di uscita);
2. wl = 1 è lautovettore sinistro del Laplaciano di G associato allautovalore nullo,
cioè 1T L = 0;
3.
Pn
i=1
ui = 0, x Rn ,
Dimostrazione.
La seconda affermazione indica che la somma dei valori per co-
lonna del Laplaciano è nulla. La somma degli elementi della colonna j-esima
corrisponde a:
n
X
lij =
i=1
n
X
aij + ljj = degin (j ) + degout (j ).
i=1,i6=j
e nel caso che venga posta a 0, porta a osservare che il nodo j deve essere bilanciato.
Le stesse osservazioni valgono per ogni altra colonna, dimostrando lequivalenza tra
laffermazione 1 e la 2.
Per quanto riguarda lequivalenza tra la 2 e la 3, vale che:
0=
n
X
i=1
ui = 1T u = 1T Lx,
21
22

se e soltanto se 1T L = 0, e cioè 1T è autovettore sinistro di L associato allautovalore
nullo.
Per verificare la validità di quanto detto su un caso reale, prendiamo come esempio
il seguente grafo:
1
Il grafo risulta connesso, ma il nodo 3 non è bilanciato e vale infatti che:
u1 = (x2 x1 ) + (x3 x1 )
u2 = (x3 x2 )
u3 = x1 x3
da cui segue che
Pn
i=1
ui = x3 x1 6= 0 se i nodi 1 e 3 non partono dallo stesso
valore. Il Laplaciano risultante presenta gli autovalori 0, 2, 2 ed autovettori destro e

sinistro dellautovalore nullo pari a wrT = (1, 1, 1) e wlT = ( 14 , 14 , 12 ). Si ha dunque che:
1
4
1
4
1
4
1
4
R = wr wl T = 14
1
4
1
2
1
2
1
2
e il valore di convergenza sarà Rx0 = 14 (x1 (0) + x2 (0) + 2x3 (0)), diverso dal valor
medio.
Sfruttando i risultati ottenuti, enunciamo il seguente teorema riassuntivo:
Teorema 7. Si consideri una rete di integratori con una topologia costante rappresentata
da un grafo G diretto e fortemente connesso. Il protocollo del consenso è globalmente
asintoticamente stabile e risolve il problema dellaverage-consensus se e soltanto se il
grafo `
e bilanciato e debolmente connesso. Nel caso il grafo non sia bilanciato,
2.4 Simulazioni su sistemi integratori.

ma sia connesso, si risolve il problema del consensus, ma il valore di convergenza sar`
a
P
pari a k = wr wlT x0 6= n1 ni=1 xi (0), con wr e wl autovettori destro e sinistro associati
allautovalore nullo della Laplaciana L(G).
2.4
Simulazioni su sistemi integratori.
Si riporta in questa sezione il risultato di alcune simulazioni effettuate in ambiente

Simulink su sistemi integratori.
Lo scopo delle seguenti simulazioni è, in primis, quello di trovare riscontro delle
proprietà di convergenza dellalgoritmo di consenso descritte nella teoria, mettendo in
evidenza anche i casi meno intuitivi.
La simulazione 1 mostra una prima applicazione dellalgoritmo di consenso su 5

agenti interconnessi da grafi di comunicazione connessi interamente oppure a componenti indipendenti.
La simulazione 2 mostra il comportamento di 5 agenti il cui grafo di comunicazione

non è costante nel tempo, ma viene sostituito ad intervalli costanti con altri grafi appartenenti ad una collezione finita. Verranno fatte alcune considerazioni sulle proprietà
di convergenza dei 5 agenti nel caso in cui i grafi appartenenti alla collezione siano tutti
sconnessi.
La simulazione 3 indaga le proprietà di convergenza delle componenti residuali di

un grafo di comunicazione connesso a blocchi.
2.4.1
Simulazione 1: una prima applicazione.
Per questa simulazione abbiamo utilizzato il modello simulink di figura 2.1, che implementa lequazione differenziale x = Lx. Esso è composto di una matrice Laplaciana
23
24

che agisce sugli stati x1 , x2 , x3 , x4 , x5 il cui valore iniziale è rappresentato dal vettore x0.
1
s
K*u
Scope
Integratore
Laplaciana
1
X
1 x0
Figura 2.1: Schema Simulink

Si è quindi fatto riferimento a diverse matrici Laplaciane (ovvero a diversi grafi di
comunicazione) e si è osservata levoluzione nel tempo degli stati x1 , x2 , x3 , x4 , x5 . Riportiamo nel seguito i risultati della simulazione sia nel caso di un grafo connesso che di
un grafo non connesso.
Grafo connesso
Il grafo di comunicazione a cui si è fatto riferimento è il seguente.
Ad esso corrisponde la matrice laplaciana
1
0
0
0 1
1 1
0
0
0
L = 0 1 1
0
0
0
0 1 1
0
0
0
0 1 1
25
Il risultato della simulazione è riportato in Figura 2.2.

Come previsto dalla teoria, i sistemi raggiungono il consenso, ovvero limt>+ xi (t) xj (t) =
P
0 i, j. Il valore di convergenza sarà inoltre pari a 15 5i=1 xi (0), dal momento che il
grafo è bilanciato e debolmente connesso.
100
x1
x2
x3
x4
x5
50
50
0
4
Time
Figura 2.2: Grafo Connesso
26

Grafo sconnesso
Nel secondo caso si è invece fatto riferimento al seguente grafo:
Ad esso corrisponde la matrice laplaciana
1 0 1 0 0
1 1 0 0 0
L= 0 0 0 0 0
0 0 0 1 1
0 0 0 0 0
.
ll risultato della simulazione è riportato in Figura 2.3.
In questo caso notiamo che i sistemi 1,2,3 e i sistemi 4,5 raggiungono due valori di
consenso differenti: nonostante il grafo complessivo risulti sconnesso, infatti, i sottografi
relativi ai sistemi 1,2,3 e a 4,5 sono connessi.
2.4.2
Simulazione 2: Grafi sconnessi variabili nel tempo.
Fino ad ora si è fatto riferimento a matrici Laplaciane costanti nel tempo ed abbiamo
riscontrato, come previsto dalla teoria, che il consenso tra tutti i sistemi viene raggiunto
se e solo se il grafo di comunicazione è connesso.
27
100
x1
x2
x3
x4
x5
50
50
0
4
Time
Figura 2.3: Grafo Sconnesso

Vogliamo adesso indagare il caso di matrici Laplaciane variabili nel tempo; in partiP
colare, dato un periodo T = m
i=1 Ti ed m matrici Laplaciane L1 , L2 , . . . , Lm , durante
lintervallo t [kTj1 , kTj ], k N il grafo di comunicazione associato al sistema sarà
quello descritto dalla Laplaciana Lj .
Il caso pi`
u interessante dal punto di vista dello studio della convergenza dellalgoritmo di consenso è quello in cui tutte le matrici appartenenti al set L1 , L2 , . . . , Lm sono
associate ad un grafo di comunicazione sconnesso: la seguente simulazione è volta a
studiare proprio questa configurazione. Utilizzeremo, per semplicità, soltanto i seguenti
due grafi sconnessi
28
a cui corrispondono le due laplaciane:
1 1 0
L1 = 0 1 1
0
0 0
0
0 0
0
1 0 0 0 1
0 1 0 1 0
0 0
0 0 L2 = 0 1 1 0
0
0 0
0 0 0 0
0
1 1
0 0 0 0
0
0
e considereremo un periodo T = T1 + T2 = 2 secondi.
Lo schema Simulink che si è utilizzato è riportato in figura 2.4: la parte a destra

dello schema ha lo scopo di passare il controllo allo script Matlab ad ogni secondo di
simulazione, permettendo cos` la sostituzione della Laplaciana corrente con la successiva.
In figura 2.5 riportiamo il risultato della simulazione.
1
Scope
L* u
Laplaciana
1
s
Integrator
To Workspace
x0
Assertion1
20
<= 0
Clock
Compare
To Constant
Chiamata
a sostituzione.
Scope1
Figura 2.4: Modello Simulink

I sistemi raggiungono quindi il consenso, nonostante la Laplaciana che ne governa
linterazione sia istante per istante associata ad un grafo di comunicazione sconnesso.
29
100
x1
x2
x3
x4
x5
50
50
0
10
Time
15
20
Figura 2.5: Risultato della simulazione
30

Per comprendere questo risultato, è possibile fare riferimento al concetto di grafo
indotto dalla matrice di adiacenza media sul periodo T (GT avg (t)), sul quale era possibile
definire la uniforme connessione: tale proprietà è pi`
u debole della connessione in senso
stretto, ma permette di ottenere la convergenza dellalgoritmo di consenso se esiste un
T per cui GT avg (t) risulti uniformemente connesso per ogni t.
Nel nostro particolare caso il grafo GT =2 avg (t), la cui matrice di adiacenza è GT =2 avg (t) =
(A1 +A2 )/2, risulta uniformemente connesso, giustificando cos` il raggiungimento del consenso.
Al fine di verificare algebricamente luniforme connessione della GT =2 avg (t), è stata

inserita nello script .m relativo alla simulazione una procedura che determina se la parte
reale del secondo autovalore di GT =2 avg (t) è positiva: il teorema 1, infatti, ci assicura che
in tal caso GT avg (t) è uniformemente connesso e lalgoritmo di consenso converge.
2.4.3
Simulazione 3: Grafi complessi con componenti residuali.
Si vuole infine studiare il caso di un grafo con pi`

u componenti connesse indipendenti
(iCC) ed alcuni nodi che non appartengono a nessuna componente, chiamati residui,
come spiegato nel capitolo 1.
Nella simulazione, si è fatto riferimento al grafo
10
a cui corrisponde la matrice Laplaciana
31
Lresidui
0
0 0 0
0
0 0 0
0
1 1 0 0
0
0 0 0
0
0 1 1 0
0
0 0 0
0
0
0 0 1 1 0 0 0
0
0
0 0 0
1 1 0 0
0
=
0
0 0 0
0
0 0 0
0
0
0 0 0
0 1 1 0
0
1 0 0 0 1 0 0 2
0
0 1 0 1 0
0 0 0
2
0
0 0 0
0
0 0 1 1
I sistemi 1,2,3 e 4,5,6,7 formano due iCC, mentre i sistemi 8,9,10 sono dei residui e
non fanno parte di una terza iCC. Il risultato della simulazione, in figura 2.6, mostra che
i sistemi 8,9,10 (tratteggiati al fine di metterli in evidenza) riescono a raggiungere un
proprio valore di consenso intermedio tra i valori di consenso dei sistemi 1,2,3 e dei sistemi
4,5,6,7. Ciò è in effetti conforme alla natura dei sistemi residuali, che pur non essendo in
comunicazione tra loro ricevono le informazioni dalle stesse componenti indipendenti del
grafo e finiscono quindi per raggiungere un accordo sul valore da assumere a regime.
80
60
40
20
0
20
40
60
80
100
4
Time
Figura 2.6: Risultato della simulazione.
32
Capitolo 3
Sistemi Multiagente Multivariabile.
Nelle precedenti simulazioni abbiamo considerato sistemi descritti da una sola variabile di stato, la cui risposta libera era costante ed uguale al valore di partenza: tale
scelta, effettuata per una maggiore semplicità concettuale, era giustificata dal fatto che
eravamo in quella sede interessati principalmente a testare lefficacia e il campo di applicazione dellalgoritmo di consenso stesso, piuttosto che alla natura delle traiettorie sulle
quali raggiungere il consenso.
Abbiamo tuttavia introdotto nel primo capitolo gli strumenti matematici che ci servono per gestire sistemi descritti da pi`
u di una variabile di stato. Per questi motivi ci
accingiamo adesso a mostrare in che modo sia possibile ottenere il consenso su particolari
sistemi multivariabile.
Abbiamo visto in 1.3 come rappresentare, tramite modelli nello spazio degli stati,
sistemi con pi`
u variabili di stato. La matrice A, chiamata anche matrice di sistema,
contiene linformazione sullevoluzione libera degli stati del sistema dinamico sotto esame;
in particolare, se i , i = 1, ..., n sono gli autovalori di A, la traiettoria degli stati x(t)
sarà combinazione lineare di tutti i termini del tipo ei t . Ne deduciamo che:
Sistemi dinamici con matrici di stato contenti un autovalore a parte reale positiva hanno stati che divergono nel tempo, ed è pertanto poco sensato pensare al
33
34
3. Sistemi Multiagente Multivariabile.

consenso per raggiungere un accordo su traiettorie che, nonostante la coincidenza,
rimarrebbero divergenti.
Sistemi dinamici con matrici di stato con soltanto autovalori a parte reale strettamente negativa hanno, per loro natura, tutti gli stati che convergono al valore
0. Anche in questo caso, quindi, cercare un accordo sulle traiettorie sfruttando la
teoria del consenso sembra poco significativo.
Sistemi dinamici con matrici di stato con autovalori a parte reale nulla sembrano offrire maggiori prospettive per applicare la teoria del consenso. Essi espongono infatti modi che oscillano indefinitamente nel tempo, e quello di raggiungere
un accordo su una traiettoria sinusoidale comune è un problema che si potrebbe
presentare in molte occasioni.
Per questi motivi considereremo nel seguito il consenso su oscillatori lineari, ed
indicheremo con S la matrice di sistema ad essi associata.
3.1
Loscillatore lineare come sistema.
Interpretando opportunamente gli stati di pi`

u oscillatori armonici, controllati sfruttando un protocollo di consenso, sarà possibile generare delle traiettorie circolari a regime
che potranno fungere da valori di riferimento per il movimento coordinato di pi`
u veicoli,
come vedremo nel capitolo 4.
In fisica, viene chiamato oscillatore armonico qualunque sistema meccanico che reagisce ad una perturbazione dallequilibrio con una accelerazione di richiamo proporzionale
..
allo spostamento subito: esso è quindi descritto dallequazione del moto x = x, dove
x rappresenta la posizione delloscillatore ed > 0 la pulsazione espressa in rad/sec. La
soluzione dellequazione differenziale è data da x(t) = Asin(t + ), dove A rappresenta
lampiezza delloscillazione e la fase: sia A che dipendono dalle condizioni al contorno
x(0) e x(0).
3.2 Analisi del problema multivariabile.
35
Dal momento che siamo interessati ad una descrizione in termini di variabili di stato,
appare naturale effettuare la seguente scelta per il modello:
x 1 = x2
(3.1)
x 2 = x1
nel quale x1 rappresenta la posizione delloscillatore
e x2 la sua velocità.
0 1
: i suoi autovalori sono = i,

La matrice di sistema è dunque S =
0
valori puramente immaginari che daranno quindi luogo ai modi oscillanti con pulsazione
.
Possiamo anche considerare modelli con un numero arbitrario di stati che hanno evoluzione sinusoidale, per questo nella trattazione teorica che segue considereremo matrici
S di sistemi oscillanti d-dimensionali.
3.2
Analisi del problema multivariabile.
Sia xk Rp il vettore degli stati del k-esimo sistema del nostro network (composto
da n sistemi). Come è noto, levoluzione libera di uno dei sistemi oscillatori è descritta
dallequazione differenziale x k = Sxk , dunque considerando un network di n sistemi,
definendo x = [x1 x2 . . . xn ]T vale la seguente equazione di evoluzione libera:
x = (In S)x.
(3.2)
Per quanto riguarda lingresso di controllo, oltre a sfruttare le informazioni relative al grafo di comunicazione tramite la matrice L, sarà necessario definire una matrice di guadagni K Mpp sulla quale potere agire liberamente, ottenendo lequazione
complessiva:
x = [(In S) (L K)]x
(3.3)
36

in cui [(In S) (L K)] deve essere Hurwitz se vogliamo che il protocollo di
consenso converga. Rimarchiamo il fatto che il consensus dovrà necessariamente avvenire
su una traiettoria sinusoidale intermedia in ampiezza e fase tra quelle che esporrebbero
naturalmente gli oscillatori del network: il protocollo di consenso non permette infatti
di cambiare la natura dei sistemi su cui viene applicato, come è chiaro osservando la
3.3.
3.2.1
Loutput consensus
Fino ad ora linformazione scambiata tra i sistemi è sempre corrisposta alla differenza
tra i loro stati interni: pi`
u realisticamente, i sistemi sono in grado di scambiarsi linformazione relativa alla differenza tra le loro uscite, definite come opportune funzioni sugli
stati. Ogni sistema sarà cioè descritto dal seguente set di equazioni:
x k = Sxk + uk
(3.4)
yk = Hxk
con uk ingresso di controllo definito come
uk = K
N
X
j=1
lkj (t)yj =
N
X
lkj (t)KHxj
j=1
(contributo calcolato sulle uscite degli altri stati tramite la Laplaciana) e H la matrice
di uscita
Dunque, in caso di output consensus lequazione del set di sistemi controllati che
consideriamo è:
x = [(In S) (L KH)]x
(3.5)
Con analogia al caso del consensus o sincronizzazione tramite differenza degli stati,
se siamo in grado di scegliere K in modo che [(In S) (L KH)] sia Hurwitz, ci
aspettiamo (come mostrato nel paragrafo 3.3.1) di raggiungere il consenso delle uscite
sulla funzione:
3.3 La convergenza del protocollo di consenso su sistemi multivariabile.
y(t) = HeSt x
37
(3.6)
che espone ancora i modi di S, ma presenta il contributo della matrice H che seleziona
quali stati sono disponibili in uscita per essere misurati.
3.3
La convergenza del protocollo di consenso su

sistemi multivariabile.
Per riuscire a catturare e descrivere le proprietà di convergenza del protocollo di

consenso nel caso multivariabile, è necessario ricondurre la matrice Laplaciana a forme
pi`
u comode ed effettuare, corrispondentemente, un cambio di variabili allinterno del
modello nello spazio degli stati. Definiamo tali trasformazioni:
Definizione 8 (Traformazione T sulla Laplaciana L). Si definisce come trasformazione T sulla Laplaciana L, una qualunque matrice T nella forma
T =
1
1(n1)1
01(n1)
In1
dove In1 è la matrice identità di dimensione N 1 e conseguentemente tale che:
0 L12
= T 1 LT =
L
22
0 L
(3.7)
12 CN 1 vettore riga e L
22 M(N 1)(N 1) .
con L
Un caso specifico di trasformazione T su L, è quello che porta L nella sua forma di
Jordan:
Definizione 9 (Traformazione TJ sulla Laplaciana L). Sia TJ la matrice che porta
cioè tale che L
= T 1 LTJ : dal momento che
L nella sua forma canonica di Jordan L,
J
TJ è formato da autovettori ed autovettori generalizzati di L, e che 1n è autovettore di
L, possiamo scrivere che
38
TJ = (1n TJ )
(3.8)
con TJ matrice N (N 1) composta di autovettori di L. Se consideriamo, senza

perdita di generalità, che 0 sia il primo autovalore di L, possiamo anche scrivere
J =
L
01(N 1)
0(N 1)1
22
L
J
(3.9)
22 matrice (N 1) (N 1) composta di blocchi di Jordan.

con L
J
3.3.1
Trattazione attraverso una qualunque Trasformazione T

su L
Si considera nel seguito un network di N sistemi multivariabile del tipo x k = Sxk +

uk , K = 1, . . . , N con grafo diretto di comunicazione sulle uscite descritto dalla matrice
Laplaciana L. Riprendiamo la notazione introdotta in 3.3.
` possibile catturare la proprietà di convergenza del protocollo ricorrendo ad una
E
generale Trasformazione T su L, come definita in Definizione 8.
Consideriamo il set controllato descritto dallequazione :
x = [(In S) (L KH)]x
(3.10)
.
Se applichiamo adesso il cambio di coordinate z = (T 1 In )x, allora
z = (T 1 In )x
= (T 1 In )[(In S) (L KH)]x
= (T 1 In )[(In S) (L KH)](T In )z.
(3.11)

= T 1 LT
Sfruttando il fatto che (A B)(C D) = (AC BD) e ricordando che L
otteniamo che
z = (T 1 In )[(In S) (L KH)](T In )z
KH)]z
= (T 1 In )[(In S)(T In ) (T L
(3.12)
KH)]z
= (T 1 In )[(T S) (T L
KH)]z
= [(In S) (L
al posto di L.
ovvero unespressione analoga a quella in (3.10) con L
evidenziata in (3.7), il sistema nelle coordinate z
Vista la particolare struttura di L
diventa:
z1 = Sz1 (L12 KH)z2
(3.13)
z 2 = [(In1 S) (L
22 KH)]z2
dove z1 Rp (p rappresenta il numero di stati del singolo sistema) e z2 Rp(n1) .
Dal momento che la prima colonna di T è 1n , vale inoltre che
xk = z1 + Tk z2 , k = 1, . . . , n.
(3.14)
per qualche matrice Tk . Vogliamo adesso mostrare che nel caso

22 KH)]
[(In1 S) (L
sia Hurwitz, gli stati andranno a coincidere a regime con z1 , analogamente al caso della
trasformata di Jordan. Vale il seguente lemma
Lemma 1. Si consideri il sistema triangolare a blocchi
z1 = Sz1 (L12 KH)z2
z 2 = [(In1 S) (L
22 KH)]z2
39
40

con z1 Rp e z2 Rp(n1) . Si supponga che
22 KH)]
[(In1 S) (L
sia Hurwitz. Allora, esistono M > 0, > 0 ed una matrice R2 Mn1 n2 tali che per
ogni coppia z1 (0), z2 (0) vale
||z1 (t) eSt z1 || M et ||z2 (0)||,
dove z1 = z1 (0) + R2 z2
il quale ci assicura che z1 tende esponenzialmente ad una traiettoria dipendente dai
valori iniziali che espone i modi di S. Utilizzando il lemma (1) e considerando la (3.14),
otteniamo subito la seguente conclusione:
Proposizione 1. Si consideri il sistema controllato
x = (In S)x (L KH)x
(3.15)
e si supponga che
22 KH)]
[(In1 S) (L
sia Hurwitz. Allora esistono K > 0, > 0 ed una matrice R Mpnp tale che per ogni
x(0), la k-esima componente dello stato x dellintero set di sistemi controllati soddisfa
||xk (t) eSt x|| Ket ||x(0)||,

ovvero, in tali ipotesi anche gli stati nel primo sistema di coordinate raggiungeranno
il consenso su una particolare soluzione di
x = Sx,
soluzione che dipende da x = f (x1 (0), . . . , xn (0)) dove f è una opportuna funzione
lineare.

Le eventuali uscite dei sistemi, che sono combinazione lineare degli stati tramite la
matrice H, si sincronizzeranno invece lungo la funzione
y(t) = HeSt x
come avevamo spiegato in precedenza.
3.3.2
Sintesi della matrice K
Come menzionato in 3.2.1, siamo interessati a rendere Hurwitz la matrice [(In S)

` opportuno
(L KH)] in modo da ottenere loutput consensus dei nostri sistemi. E
ricondurre il problema della sintesi della matrice K ad uno equivalente pi`
u semplice:
riprendiamo a questo scopo la matrice
0 L12
= T 1 LT =
L
22
0 L
a cui ci eravamo ricondotti tramite T nel paragrafo 3.3.1. Sia poi M M(n1)(n1) una
matrice a valori complessi tale che
22 M 1
= ML
scelta in modo che sia diagonale; in tal caso i valori sulla diagonale di corrispondono agli autovalori non nulli di L. La trasformazione M 1 In porta la matrice 3.5 ad
assumere la forma
(In1 S) ( KH)
(3.16)
ed essendo diagonale, otteniamo subito che la matrice (3.16) è diagonale a blocchi,

con blocchi che hanno la seguente struttura:
S i (L)KH.
dove indichiamo con i li-esimo autovalore di L.
(3.17)
41
42

Tale risultato ci porta immediatamente a formulare la seguente proposizione, grazie
alla quale rendiamo pi`
u semplice il problema della sintesi di K:
Proposizione 2. Gli autovalori della matrice [(In S) (L KH)] hanno tutti parte
reale negativa se e solo se la matrice S-i (L)KH ha tutti gli autovalori a parte reale
negativa, per ogni i.
Utilizziamo adesso un approccio basato sulle funzioni di Lyapunov per rendere Hurwitz le matrici Ai = S i KH: infatti i problemi di trovare delle funzioni di Lyapunov
Vi sugli stati zi tali che V i < 0 e quello di rendere Hurwitz le matrici S i KH sono in
corrispondenza biunivoca.
La condizione da soddisfare seguendo questo approccio è che per ogni i, valga
ziT (P ATi + Ai P )zi a||zi ||2
(3.18)
per un qualche a < 0, avendo definito come candidata funzione di Lyapunov
V = ziT P zi
e chiamando P lunica soluzione simmetrica definita positiva dellequazione algebrica
di Riccati (CARE):
SP + P S T 2P H T HP + aIn = 0.
(3.19)
Tale soluzione P esiste sicuramente nel caso che S sia la matrice di un oscillatore
lineare.
Si può verificare che in questo caso la scelta di K = P H T risolve il problema appena
enunciato. Infatti, chiamando lautovalore non nullo con la parte reale pi`
u piccola,
utilizzando K = P H T nellespressione della matrice Ai e ricordando che P è la soluzione
dellequazione CARE, vale
3.4 Trattazione attraverso trasformata di Jordan TJ .
43
ziT (P ATi + Ai P )zi = ziT (P S T i P H T HP T + SP i P H T HP )

= ziT (SP + P S T i P H T H(P T + P ))zi
(3.20)
= ziT (SP + P S T 2Re(i )P H T HP )zi

ziT (SP + P S T 2P H T HP )zi = a||zi ||2
e dunque abbiamo soddisfatto la (3.18); come abbiamo fatto notare sopra, abbiamo
congiuntamente reso Hurwitz tutte le matrici S i KH e conseguentemente lintera
matrice (In1 S) ( KH).
Riassumiamo questi risultati nella seguente proposizione:
Proposizione 3. Sia dato un set di N sistemi del tipo descritto in equazione (3.4). Si
supponga che (S,H) sia una coppia osservabile. Si supponga che il grafo di comunicazione
(tempo-invariante) sia connesso. Sia lingresso di controllo dato da
uk = P H
N
X
akj (yj yk )
k = 1, . . . , N
(3.21)
j=1
In tal caso, si raggiunge loutput consensus.
3.4
Trattazione attraverso trasformata di Jordan TJ .
Se vogliamo ottenere delle equazioni semplificate rispetto a quelle in 3.13, possiamo

ricorrere alla trasformazione di Jordan TJ .
Esprimiamo ancora le equazioni dei nostri sistemi controllati in forma compatta
x = [(IN S) (L KH)]x
(3.22)
Effettuiamo dunque il seguente cambio di variabili sugli stati sfruttando la trasformazione di Jordan ed il prodotto di Kronecker:
z = (TJ1 Id )x
ed otteniamo
(3.23)
44
KH)]z
z = [(IN S) (L
(3.24)
J rappresenta la forma canonica di Jordan di L. Tenendo predove, ricordiamo, L

J evidenziata in 3.9, chiamando z = col(z1 , z2 ), z2 =
sente la particolare struttura di L
col(z2 , . . . , zN ), zi Rd , possiamo riscrivere la 3.24 nel seguente modo:
z1 = Sz1
(3.25)
z 2 = [(IN 1 S) (L
22 KH)]z2
J
Dunque z1 ha unevoluzione indipendente dalle altre variabili. Inoltre è possibile scegliere K in modo che il sistema con stato z2 sia Hurwitz, cioè che esponga modi che si
annullano asintoticamente per t > +, ovvero che z2 (t) converga esponenzialmente a
0 per ogni z2 (0).
Lultimo passaggio consiste nellosservare che grazie alla particolare struttura di TJ

ed al cambio di variabili effettuato vale
x = (1N 1 Id )z1 + (TJ Id )z2
(3.26)
Dunque, dal momento che z2 tende ad annullarsi, si è dimostrato che tutti i xk

raggiungono il consenso sulla traiettoria di z1 che coincide con x1 , mettendo in evidenza
leffettiva convergenza del protocollo di consenso su una stessa traiettoria finale.
3.5
Analisi attraverso trasformata di Jordan su un

caso specifico.
Consideriamo in questa sezione il caso di 3 sistemi oscillatori descritti dalla matrice

di sistema
S=
1 0
3.5 Analisi attraverso trasformata di Jordan su un caso specifico.

ed interconnessi tramite il grafo di comunicazione ciclico
1
3
la cui matrice Laplaciana è
1
0 1
L = 1 1
0
0 1 1
.
Come visto nella sottosezione 3.4, è opportuno portare L nella sua forma di Jordan
per capire verso cosa convergeranno gli stati di tutti i sistemi una volta applicato il
L
controllo di consenso.
Si ha che la matrice di similitudine è
1 0.5 0.866i 0.5 + 0.866i
TJ = 1 0.5 + 0.866i 0.5 0.866i
1
1
1
e la Laplaciana diventa cos`
22
L
J
0
0
0
= 0 1.5 0.866i
0
0
1.5 + 0.866i
Come mostrato in 3.4, è allora possibile effettuare il cambio di variabili sugli stati
definito da z = (TJ1 I2 )w ed ottenere il seguente modello nello spazio degli stati
z1 = Sz1
z 2 = [(IN 1 S) (L
22 K)]z2
J
come avevamo già osservato in (3.25).
45
46

Se assumiamo che la matrice che descrive levoluzione di z 2 sia Hurwitz (attraverso la
scelta di una opportuna K), possiamo anche osservare, riprendendo il risultato in (3.26),
che
x = (1N 1 Id )z1 + (TJ Id )z2
(3.27)
.
Ciò significa, visto che z 2 tende ad annullarsi, che gli stati x1i , x2i (posizione e velocità) dei 3 oscillatori presi in considerazione andranno a consenso sulla traiettoria di
z1 = col(z1i , z2i ) per qualunque set di valori iniziali.
Infatti, la trasformazione degli stati x verso gli stati z risulta essere:
TJ1 I2
1
3
1
3
1
3
0
0
0
1
1
1
0
0
0
3
3
3
1
0.1667 + 0.2887i
0
0
0.1667 0.2887i
0
3
0
0.1667 + 0.2887i
0
0.1667 0.2887i 0 3
1
0.1667 0.2887i
0
0.1667 + 0.2887i
0
0
3
1
0
0.1667 0.2887i
0
0.1667 + 0.2887i 0 3
e dunque
z1 (t) =
(x1 (t) + x2 (t) + x3 (t))

t R+ .
3
(3.28)
A regime, se il consenso è stato raggiunto (dato per assunto dal momento che la matrice che descrive levoluzione di z 2 è assunta Hurwitz), avremo, ricorrendo ad un piccolo
abuso di notazione, che x1 = x2 = x3 e dunque che 13 (x1 + x2 + x3 ) = x1 =
x2 = x3 = z1 .
Le osservazioni appena effettuate rendono evidente che per ogni sistema k, xk va a

consenso sulla traiettoria di z1 , la cui evoluzione temporale è descritta dallequazione
3.5 Analisi attraverso trasformata di Jordan su un caso specifico.

z1 = Sz1 : tale traiettoria espone i modi corrispondenti agli autovalori della matrice di
sistema S, che nel nostro caso specifico sono modi oscillanti.
3.5.1
Simulazione: output consensus su 3 oscillatori armonici.
Lo scopo della seguente simulazione è verificare lefficacia della procedura di sintesi

della matrice K descritta in 3.3.2, al fine di mandare a consenso i 3 oscillatori di cui
si è parlato in 3.5. Sempre in 3.5, attraverso unanalisi del sistema controllato tramite
trasformata di Jordan, si era arrivati alla conclusione che gli oscillatori sarebbero andati
a consenso su di una traiettoria sinusoidale di pulsazione 1 rad/sec ed ampiezza e fase
dipendenti dai valori iniziali degli oscillatori; cogliamo quindi questa occasione per verificare anche tale risultato.
Il modello Simulink di riferimento è identico a quello presentato in 2.4.1, ad eccezione

del fatto che al posto del blocco di guadagno corrispondente alla Laplaciana è stata posta
la matrice U = [(I3 S) (L KH)], con K = P H T (vedi paragrafo 3.3.2).
I valori iniziali di di posizione e velocità dei 3 oscillitori sono stati posti, a titolo di
esempio, pari a (1, 2), (3, 3) e (5, -5). La matrice H, che come abbiamo
detto
rappresenta
1 1
: ogni sistema
la trasformazione tra stati ed uscite, è stata posta pari a H =
10 10
avrà cioè due uscite, la prima corrispondente alla somma tra posizione e velocità, la
seconda pari a 10 volte la somma tra posizione e velocità.
La procedura per calcolare

K è stata implementata
di Matlab:
in
nel relativo script
0.5016 0.4985
0.0032 0.0317
e dunque K =
,
particolare otteniamo che P =
0.4985 0.5797
0.0812 0.8118
ponendo a = 1 e = 1.5, cioè pari alla parte reale del secondo autovalore di L. Si noti
che la scelta di a influisce sulla velocità di convergenza del protocollo.
47
48
Uscita 1
4
2
0
2
4
5
Time
10
5
Time
10
60
Uscita 2
40
20
0
20
40
Figura 3.1: Risultato della simulazione

In figura 3.1 il risultato della simulazione: nei due plot viene riportato il consenso
rispettivamente sulla prima e sulla seconda uscita.
Come previsto, le due uscite dei tre sistemi vanno a consenso su due traiettorie di
pulsazione 1 rad/sec.
Capitolo 4
Generazione di traiettorie circolari
per il loitering di pi`
u robot.
Il coordinamento di sistemi multi-robot ha come obiettivo quello di ottenere delle
prestazioni migliori rispetto alluso di singoli agenti, garantendo una maggiore robustezza
e performance generale di sistema. Diventa infatti possibile risolvere sotto-problemi in
parallelo, riducendo sia il tempo per il completamento del compito dellintero sistema
che il carico computazionale. Inoltre, lassenza di un singolo master decisionale rende
il sistema distribuito pi`
u robusto e resistente ai guasti (il fallimento di un singolo agente
non implica il fallimento dellintero network).
Tuttavia, nellutilizzo di sistemi multi-agente emergono nuovi problemi e difficoltà:
Coordinare un numero elevato di agenti
Gestire uninformazione locale e non centralizzata
Gestire lelevata necessità di comunicazione
Il consenso fornisce alcuni possibili vantaggi relativamente a questi problemi, rispetto ad altre tecniche comunemente utilizzate in letteratura. In primis è completamente
decentralizzato e leader-less di natura, inoltre si basa su uno scambio di informazioni
semplice e contenuto.
49
50
4. Generazione di traiettorie circolari per il loitering di pi`

u robot.
Lidea di fondo è quella di associare ai nostri agenti fisici dei modelli di sistemi
dinamici chiamati esosistemi, che si comporteranno come generatori di traiettorie decentralizzati per i singoli agenti; sugli esostemi si utilizzano i protocolli di consenso e
mediante lagreement raggiunto si ottiene il comportamento collettivo desiderato.
Come applicazione dei risultati provenienti dalla teoria sviluppata in questo lavoro,
si è dunque pensato al caso del raggiungimento del consenso di pi`
u veicoli su di una traiettoria circolare. In particolare si vuole che tali agenti, qualunque siano le loro posizioni
iniziali nello spazio, vadano a circolare su di una traiettoria di dato raggio e centro con
velocità impostata, facendo inoltre in modo che a regime le loro posizioni rappresentino
i vertici di un poligono regolare. Queste richieste sono quelle tipicamente necessarie in
un contesto di loitering attorno ad un agente/punto dello spazio obiettivo: si richiede
ai droni di pattugliare larea circostante volando in circolo ed eventualmente di seguire
lobiettivo se questi è in moto.
In questo capitolo si vuole descrivere lapproccio seguito per realizzare la simulazione

in ambiente Simulink, simulazione che è poi stata utilizzata per generare le traiettorie di
riferimento di tre quadrirotori per prove sperimentali in laboratorio: i risultati di questi
esperimenti sono riportati nel capitolo 5.
Il problema di controllo in questione si presenta come lunione di due problemi di

consenso, trattati nei precedenti capitoli:
Consenso di pi`
u oscillatori lineari: necessario per il raggiungimento di una
traiettoria circolare comune, interpretando i due stati di ogni oscillatore come posizioni X e Y sul piano. La circonferenza di regime ottenuta mediante il protocollo
` però possibile modificare il
dipenderà dalle condizioni iniziali degli oscillatori. E
protocollo inserendo un oscillatore fittizio che permetta di impostare a piacere
raggio e velocità di regime.
Consenso di pi`
u integratori: necessario per il raggiungimento di un centro
4.1 Consenso degli oscillatori.
51
di traiettoria comune. Il valore di convergenza di questo protocollo di consenso

dipenderà, anche in questo caso, dalle condizioni iniziali degli agenti. Tuttavia, è
possibile modificare tale protocollo (mediante laggiunta di un agente fittizio) per
poter impostare il centro della circonferenza a piacere. Sarà necessario un controllo
di consenso sia per la posizione X che per la posizione Y del centro.
Riportiamo in figura 4.1 il modello di simulazione visto dal livello pi`
u esterno: come
anticipato, al fine di ottenere il comportamento collettivo desiderato si utilizzano due
protocolli di consenso. Un primo protocollo (CONSENSO OSCILLATORI, in arancione) per impostare la traiettoria dinamica da eseguire. Un secondo protocollo di consenso
(CONSENSO INTEGRATORI (CENTRO)) per imporre il centro attorno a cui gli agenti
devono compiere la traiettoria dinamica (o di loitering) desiderata. Nel seguito si descriveranno pi`
u nel dettaglio gli accorgimenti presi per realizzare i due rami del consenso
degli oscillatori e degli integratori.
Scope2
p0
x0
p_rev0
Constant
In1 Out1
K*u
Uniformazione_Inv
Sfaso_inv
K*u
Uniformazione
CONSENSO OSCILLATORI
p_sfasato
Sfaso
Scope3
Out1
CONSENSO INTEGRATORI (CENTRO)
Figura 4.1: Modello: alto livello.
4.1
Consenso degli oscillatori.
Il nostro obiettivo è quello di poter realizzare una traiettoria circolare di raggio e

velocità desiderate: vogliamo inoltre che questi due parametri siano imponibili a piacere,
compatibilmente con i limiti cinematici degli agenti in esame.
52

u robot.
Essendo il protocollo di consenso decentralizzato per natura, i valori/traiettorie che
gli agenti raggiungono dipendono esclusivamente dalle condizioni iniziali. Per superare
questo problema immaginiamo che il centro attorno al quale si compie la traiettoria
circolare di loitering sia in realtà un agente fittizio, che comunica agli altri agenti
raggio e velocità desiderate: in pratica, si aggiunge un agente virtuale al network, si
rende connesso il grafo risultante avendo cura che lagente virtuale risulti un centroide
indipendente, e si estende il protocollo di consenso ad n + 1 agenti (dove n è il numero di
droni che compongono la formazione reale). Il risultato finale sarà che tutti gli oscillatori
reali andranno a consenso sulloscillatore virtuale.
Si noti che questa è una soluzione di comodo che potrebbe essere in realtà ottenuta
mediante altri approcci. Per imporre un raggio arbitrario sarebbe sufficiente modificare
il classico oscillatore lineare, aggiungendo un termine non-lineare che forzi il sistema
sul ciclo limite desiderato. Tale modifica condurrebbe però allanalisi del consenso per
sistemi non-lineari, ambito che esula dagli obiettivi di questa tesi .
Le uscite sono state considerate coincidenti con gli stati degli oscillatori (H è quindi
la matrice identità) che vengono interpretati come le posizioni X e Y degli agenti.
Fatte queste considerazioni preliminari, abbiamo supposto che gli agenti comunicassero tra loro secondo una certa topologia connessa, ed è stato creato uno script Matlab
che si occupa di:
Generare la Laplaciana L connessa associata a tale grafo.
Effettuare la sintesi della matrice K necessaria al raggiungimento del consenso (si
veda 3.3.2)
Creare la matrice U = [(In S) (L KH)] da utilizzare nel modello Simulink.
Allinterno del blocco CONSENSO OSCILLATORI troviamo uno schema chiuso in
retroazione del tutto analogo a quelli utilizzati nelle simulazioni del capitolo 2, eccezion
fatta per la matrice U al posto della matrice L.
4.1 Consenso degli oscillatori.

La matrice
53
U nif ormazione = In
1
w
ha lo scopo di uniformare in ampiezza i due stati di ogni oscillatore. Se infatti la
posizione segue una traiettoria sinusoidale di pulsazione ed ampiezza A, allora la
velocità segue una traiettoria co-sinusoidale di pulsazione ancora , ma di ampiezza
A. Dunque tra i due stati delloscillatore, che vengono interpretati come coordinate
X e Y, corre un fattore moltiplicativo pari a che bisogna eliminare attraverso la

matrice sopra introdotta. Notiamo che senza la matrice di uniformazione le traiettorie
sarebbero delle ellissi anziche delle circonferenze.
4.1.1
Sfasamento degli agenti.
Per il raggiungimento di una formazione, non solo è necessario che gli agenti seguano
la stessa traiettoria circolare a regime, ma si richiede anche che si dispongano secondo
una ben precisa geometria. Con il solo consenso di oscillatori descritto in 4.2, infatti,
gli agenti andrebbero a coincidere nelle posizioni, fatto che in una realizzazione fisica su
veicoli corrisponderebbe ad uno scontro: si impongono dunque degli opportuni sfasamenti
alle traiettorie dei singoli agenti, in modo che vadano a disporsi sulla circonferenza target
secondo i vertici di un poligono regolare. Al fine di raggiungere questo obiettivo, è stato
sufficiente osservare che a regime i due stati degli oscillatori seguono un andamento
temporale del tipo
x1 (t)
sin(t + )
x2 (t)
cos(t + )
(4.1)
e che dunque è possibile combinarli algebricamente secondo le formule di addizione/sottrazione di seno e coseno per imporre un qualunque sfasamento alle traiettorie di
regime (trasformandole cioè in sin(t + + ), cos(t + + ) per qualunque ). Si
è quindi inserita una funzione embedded nel modello con lo scopo di effettuare queste
manipolazioni sia a valle del blocco CONSENSO OSCILLATORI (trasformazione diretta sulle traiettorie) che a monte (trasformazione inversa sulle posizioni iniziali per far s`
54

u robot.
che le traiettorie sfasate partano dalle posizioni iniziali originarie).
Potrebbe sembrare che questi sfasamenti siano realizzati in maniera centralizzata; in

realtà ad ogni agente è associato un proprio sfasamento, e di conseguenza ogni agente
conosce, indipendente da cosa devono fare gli altri, il valore dello sfasamento che deve
imporre alla traiettoria di consenso che sta ottenendo dallo scambio di informazioni.
Nelle figure 4.2 e 4.3 riportiamo il consenso degli oscillatori prima e dopo lapplicazione dello sfasamento.
Posizione X
100
50
0
50
100
5
Time
10
5
Time
10
Posizione Y
100
50
0
50
100
Figura 4.2: Traiettorie prima dello sfasamento
4.2
Consenso degli integratori.
Al fine di fare raggiungere alla traiettoria circolare un centro di formazione diverso

da (0,0), risulta necessario sommare alle traiettorie di tutti gli agenti un contributo che
deriva dal consenso di integratori associati alle loro rispettive posizioni Xcentro e Ycentro
ref
ref
verso due integratori virtuali che contengono le informazioni sui target (Xcentro
, Ycentro
):
come nel caso delloscillatore virtuale, gli integratori virtuali dovranno comportarsi da
centroidi indipendenti nel grafo di comunicazione complessivo, in modo che il loro valore
non venga mai influenzato e che tutti gli altri integratori convergano su di loro a regime.
4.3 Simulazione della generazione di traiettorie.
55
60
Posizione X
40
20
0
20
40
5
Time
10
5
Time
10
Posizione Y
100
50
50
Figura 4.3: Traiettorie dopo lo sfasamento.

Come già è stato fatto nel capitolo 2, nel caso degli integratori è sufficiente implementare un loop algebrico controllato dalla matrice L, in modo da realizzare lequazione
differenziale
.
x
x
x(0) = [0 0 ... xref ]0
= L ,
.
0
y
y
y(0) = [0 0 ... yref ]
4.3
Simulazione della generazione di traiettorie.
Per una maggiore comprensione della simulazione, si riportano in figura 4.4 le traiettorie in X e in Y di sei agenti nelle seguenti ipotesi:
Condizioni iniziali : Tutti e sei gli agenti partono dalle coordinate (50,50).
Raggio della traiettoria 10.
Pulsazione di percorrenza: tutti gli oscillatori hanno = 1rad/sec dentro alla
matrice di sistema.
Richieste sul centro: La richiesta iniziale sulle coordinate è (100,100), per poi
passare ogni 15 secondi al successivo vertice di un quadrato di lato 200. La sequenza
56

u robot.
di richieste sul centro è quindi ciclicamente: (100, 100), (100, -100), (-100, -100),
(-100, 100) ...
Posizione X
200
100
0
100
200
0
10
20
30
Time
40
50
60
10
20
30
Time
40
50
60
Posizione Y
200
100
0
100
200
Figura 4.4: Traiettorie X e Y con cambio di richiesta sul centro ogni 15 secondi.
Capitolo 5
Il setup di laboratorio e lo schema
della Ground Station.
Lobiettivo dellesperienza di laboratorio è stato quello di realizzare il consenso di tre
quadrirotori CrazyFlie su una traiettoria assoluta circolare di raggio impostato e velocità decisa a priori, utilizzando come centro mobile una macchina telecomandata o un
qualunque altro agente in movimento.
Un nano-quad CrazyFlie è composto solamente da un PCB (Printed Circuit Board)

dove sono saldati i quattro motori con rispettive eliche e una batteria per lalimentazione.
CrazyFlie è un sistema open-hardware open-software. La batteria è da 170mAh con un
tempo di ricarica di circa 20 minuti e permette un volo di 5 minuti. Il peso è attorno ai
10 grammi.
Per realizzare larchitettura software necessaria alle prove di laboratorio si è inoltre
utilizzato:
Sistema di acquisizione OptiTrack: Il sistema è composto da diverse telecamere disposte lungo il perimetro del soffitto allinterno del laboratorio di volo.
Utilizzando gli infrarossi emessi da ogni telecamera, Optitrack riesce a stimare
con errori molto piccoli la posizione di un oggetto. Un limite che pone lutilizzo
di questo sistema è dato dal fatto che ogni oggetto deve essere dotato di 3 marker
57
58
5. Il setup di laboratorio e lo schema della Ground Station.
Figura 5.1: Quadrirotori CrazyFlie.

per essere identificato. Nel nostro caso si utilizzano 3 palline tonde rivestite con un
materiale riflettente, fissate ad una struttura di carbonio che viene poi attaccata ai
quadrirotori. Linsieme di marker e struttura sorreggente, arriva a pesare qualche
grammo e va quindi ad aumentare il peso del CrazyFlie del 30-40%. Tale aumentato compromette sensibilmente la dinamicità dei CrazyFlie durante il volo: i motori
non sono molto potenti e la portanza (spinta verticale) che generano viene ridotta
dal fatto che le asticelle della struttura possono bloccare il flusso daria generato
dalle pale. Per questo motivo linseguimento delle traiettorie target risulta efficace,
ma le imprecisioni e gli errori parametrici fanno s` che ci sia sempre e comunque
un errore a regime.
Per passare i dati dal sistema Optitrack a Matlab, una volta lanciato il software
di tracking, si utilizza un programma locale chiamato NatNet, il quale invia i dati
su una porta UDP letta da Matlab: attraverso il modello della Ground Station,
si utilizzano le informazioni cos` ricevute per la generazione di traiettorie ed il
controllo. (Figura 5.3).
Modello Matlab/Simulink della Ground Station: si occupa di generare le
59
Figura 5.2: I 3 marker e la struttura in carbonio.
Figura 5.3: Optitrack.
60

traiettorie di riferimento e di garantire il controllo dei quadrirotori al fine di inseguire il riferimento generato. Verrà descritto in modo pi`
u approfondito nella prossima
sezione.
Antenne: per inviare gli ingressi di controllo generati dalla Ground Station ai
singoli quadrirotori è stato necessario sfruttare delle radio-antenne con porta USB.
Figura 5.4: Periferica di trasmissione dati al nano-quad.
Joypad: dopo averlo collegato ad una porta USB, bisogna lanciare un programma
(chiamato Joypad Parser ) il cui compito è quello di prendere i pacchetti di dati
relativi alla pressione di pulsanti e comunicarli a Matlab mediante pacchetto UDP.
Il joypad verrà sfruttato per cambiare la modalità di funzionamento: si vuole
infatti che i quadrirotori decollino e si portino alla stessa quota prima di entrare in
modalità di inseguimento del consenso.
5.1
La Ground Station
Si è sfruttato un modello Simulink preesistente, chiamato Ground Station, che permette di utilizzare i dati acquisiti dal sistema OptiTrack e da un Joystick per generare
gli ingressi di controllo dei quadrirotori (figura 5.5) . Lo schema prevede la presenza di
una macchina a stati il cui scopo è dare la possibilità allutente di selezionare una mo-
5.1 La Ground Station

dalità di volo tramite la pressione di determinati pulsanti sul Joystick (originariamente
le modalità principali erano: take-off, stop, landing, cruise).
Figura 5.5: Schema della Ground Station

` quindi stato necessario modificare tale schema principalmente per:
E
Prevedere la presenza di tre quadritori invece che uno soltanto.
Utilizzare come traiettorie di riferimento le uscite di un blocco Consensus, che le
generi sulla base delle posizioni iniziali dei quadrirotori e delle richieste di raggi e
centro per la traiettoria.
Modificare la macchina a stati, inserendo la modalità Consensus. Nellistante in
cui si entra in tale stato, OptiTrack memorizza la posizione in cui si trovano i quadrirotori e sulla base di questa informazione il blocco consenso genera le traiettorie
da inseguire. Prima di entrare in questa modalità, è opportuno aspettare che i
quadrirotori si siano portati alla stessa quota e stabilizzati.
Utilizzare Il Joystick per spostare il centro della formazione.
In figura 5.5 lo schema della Ground Station. Possiamo distinguere
61
62

Il blocco Consensus (in rosso), a valle, che genera i riferimenti da inseguire.
I blocchi Controller (in blu), che generano gli effettivi ingressi di controllo.
I blocchi Optitrack (in verde), che forniscono ai blocchi Controller le informazioni
su posizione e velocità dei Crazyflie istante per istante.
I blocchi di uscita (in arancione), che trasmettono linformazione sugli ingressi di
controllo ai CrazyFlie tramite lapposita radio-antenna.
5.2
I risultati di laboratorio.
Riportiamo in questa sezione alcuni grafici che mostrano le traiettorie di riferimento

generate e le traiettorie effettivamente percorse dai Crazyflie.
I riferimenti
Si deve inizialmente attendere che i quadrirotori si portino stabilmente alla stessa
quota (riferimenti per X e Y piatti nei primi secondi). Premendo un pulsante sul Joystick, il sistema entra in modalità consenso e Optitrack comunica a Matlab le posizioni
iniziali degli agenti. Basandosi su questa informazione, Matlab genera le traiettorie che
portano i Crazyflie a regime.
Si riportano nei plot le traiettorie di riferimento per la X e la Y, mettendo in evidenza

il ruolo dello sfasamento che ogni agente impone su se stesso.
5.2 I risultati di laboratorio.
63
1.5
xcons [m]
1
0.5
0
0.5
1
1.5
0
10
10
15
20
25
15
20
25
1.5
1
x* [m]
0.5
0
0.5
1
1.5
0
time [s]
Figura 5.6: Riferimento per la X, prima e dopo sfasamento.
1.5
0
0.5
0.5
1
1.5
0
y* [m]
ycons [m]
1
0.5
0
0.5
1
5
3
10
15
20
25
15
20
25
1.5
1
y* [m]
0.5
0
0.5
1
1.5
0
10
time [s]
Figura 5.7: Riferimento per la Y, prima e dopo sfasamento.
64

Linseguimento dei riferimenti
Come spiegato in precedenza, è impossibile ottenere un errore nullo nellinseguimento
delle traiettorie, a causa degli inevitabili errori parametrici e della presenza della struttura
che sorregge i marker. Il discostamento dalla traiettoria ideale, come vediamo in figura,
risulta però contenuto e la performance è nel complesso soddisfacente. Si riporta la
x [m]
traiettoria effettiva di un singolo quadrirotore ed il suo riferimento ideale.
x
*
x
1
0
1
0
10
15
20
y
y*
y [m]
1
0
1
0
10
15
20
z [m]
25
25
z
z*
0
1
0
10
15
20
time [s]
Figura 5.8: Tracking della traiettoria di riferimento per un quadrirotore.
25
Conclusioni
Abbiamo nel corso di questo lavoro soddisfatto gli obiettivi che ci eravamo posti.
Nei primi tre capitoli si è trattato da un punto di vista prettamente teorico il problema
del consenso e della convergenza del protocollo di consenso nei casi mono e multivariabile, utilizzando un approccio controllistico basato sullanalisi tramite modelli nello spazio
degli stati. Affiancando la spiegazione dellefficacia dei metodi per risolvere i problemi
mono e multivariabile, si sono effettuate varie simulazioni in ambiente Matlab/Simulink
per trovare riscontro delleffettiva realizzabilità di quanto mostrato nella teoria.
Una simulazione, non pi`

u meramente dimostrativa, è stata realizzata anche nel capitolo 4. Si è dovuto pensare ad un modo di sfruttare congiuntamente i modelli di sistemi
oscillatori ed integratori per creare il riferimento di traiettorie circolari di centro impostabile, avendo in mente lapplicazione al caso del loitering di un sistema multi-robot:
laspetto pi`
u originale sta nellaver semplicemente unito sistemi eterogenei per risolvere
un problema che inizialmente sembrava richiedere lintroduzione di un terzo di tipo di
sistema pi`
u complesso (non è stato cioè necessario trattare il consenso di oscillatori nonlineari con un offset, anche se sarebbe stato possibile agire in tal senso per ottenere gli
stessi risultati).
Tale modello è stato inserito in quello della Ground Station (capitolo 5) permettendo
cos`, prendendo opportuni accorgimenti implementativi, di sperimentare fisicamente il
coordinamento di gruppo in laboratorio.
65
66
CONCLUSIONI
Si noti che la parte di computazione dei riferimenti è completamente realizzata dal

calcolatore: sarebbe comunque possibile e semplice, se i quadrirotori avessero sufficiente
potenza di calcolo, distribuire il workload computazionale sui singoli quadrirotori, rendendo quindi effettiva e non simulata la comunicazione tra i vari agenti.
Sviluppi futuri.
Non si è previsto un modo di evitare le eventuali collisioni tra gli agenti durante il
transitorio del consenso: le traiettorie vengono generate garantendo soltanto la convergenza sulla circonferenza desiderata, senza imporre ulteriori vincoli. Per questo motivo,
in laboratorio ci si è curati di posizionare i quadrirotori in posizioni iniziali non rischiose. Tuttavia, per rendere maggiormente implementabile ed affidabile lo schema di
coordinamento proposto, sviluppi futuri dovranno affrontare questo importante problema.
Lapproccio che pi`

u plausibilmente verrà seguito sarà quello di separare completamente il problema di generazione delle traiettorie di consenso da quello di collision avoidance.
Infatti, la potenza della teoria del consenso sta proprio nella semplicità delle informazioni scambiate, e complicare il protocollo per implementare la collision-avoidance avrebbe
come conseguenza la perdita dei principali vantaggi che questa tecnica di coordinamento
offre.
Bibliografia
[1] P. Wieland, From Static to Dynamic Couplings in Consensus and Synchronization
among Identical and Non-Identical Systems, PhD thesis, Universitat Stuttgart,
2010.
[2] L. Moreau, Stability of multi-agent systems with time-dependent communication
link, IEEE Trans. Automat. Contr., 50(2), pp. 169-182, 2005.
[3] C. Godsil, G. Royle, Algebraic Graph Theory, Springer.
[4] M. Arcak. Passivity as a design tool for group coordination, IEEE Trans. Aut.
Contr., 52(8), pp. 1380-1390, 2007.
[5] A. Isidori, L. Marconi, G. Casadei, Robust output synchronization of a network
of heterogeneous nonlinear agents via nonlinear regulation theory, IEEE Trans. on
Aut. Contr.
[6] Dispense del corso di Sistemi Robotici Distribuiti, Università di Pisa, docente:
Dott.ssa Lucia Pallottino.
[7] Bolzern Paolo, Scattolini Riccardo, Schiavoni Nicola, Fondamenti di Controlli
Automatici, McGraw-Hill .
67

Luca Furieri Tesi

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Luca Furieri Tesi

Caricato da

Copyright:

Formati disponibili

` di Bologna

Alma Mater Studiorum Universita

SCUOLA DI INGEGNERIA E ARCHITETTURA

TEORIA DEL CONSENSO E

Tesi di Laurea in Controlli Automatici

A genuine leader is not a searcher for consensus,

Il capitolo 3 `e dedicato ai sistemi multivariabile e alla metodologia che permette di

Il capitolo 5 descrive brevemente il setup di laboratorio utilizzato per realizzare il

1 Teoria e strumenti matematici.

Teoria dei Grafi: alcune definizioni. . . . . . . . . . . . . . . . . . . . . .

Descrizione tramite matrici rappresentative. . . . . . . . . . . . .

Grafi variabili nel tempo. . . . . . . . . . . . . . . . . . . . . . . .

Componenti indipendenti di un grafo. . . . . . . . . . . . . . . . .

Propriet`a del prodotto di Kronecker . . . . . . . . . . . . . . . . .

Modelli nello spazio degli stati. . . . . . . . . . . . . . . . . . . . . . . .

Rappresentazioni equivalenti e cambio di variabile. . . . . . . . . . . . . .

Matrici diagonali e trasformazione di Jordan. . . . . . . . . . . . .

Forma canonica di Jordan. . . . . . . . . . . . . . . . . . . . . . .

2 Lalgoritmo di consenso e simulazioni su sistemi Integratori.

Analisi spettrale della Laplaciana. . . . . . . . . . . . . . . . . . .

Altri modi di analizzare la convergenza degli algoritmi di consenso. . . .

Analisi di stabilit`a tramite funzioni di Lyapunov. . . . . . . . . .

Il valore di convergenza: laverage-consensus problem. . . . . . . . . . . .

Simulazioni su sistemi integratori. . . . . . . . . . . . . . . . . . . . . . .

Simulazione 1: una prima applicazione. . . . . . . . . . . . . . . .

Simulazione 2: Grafi sconnessi variabili nel tempo. . . . . . . . . .

Simulazione 3: Grafi complessi con componenti residuali. . . . . .

3 Sistemi Multiagente Multivariabile.

Loscillatore lineare come sistema. . . . . . . . . . . . . . . . . . . . . . .

Analisi del problema multivariabile. . . . . . . . . . . . . . . . . . . . . .

La convergenza del protocollo di consenso su sistemi multivariabile. . . .

Trattazione attraverso una qualunque Trasformazione T su L .

Sintesi della matrice K . . . . . . . . . . . . . . . . . . . . . . . .

Trattazione attraverso trasformata di Jordan TJ . . . . . . . . . . . . . . .

Analisi attraverso trasformata di Jordan su un caso specifico. . . . . . . .

Simulazione: output consensus su 3 oscillatori armonici. . . . . . .

4 Generazione di traiettorie circolari per il loitering di pi`

Consenso degli oscillatori. . . . . . . . . . . . . . . . . . . . . . . . . . .

Sfasamento degli agenti. . . . . . . . . . . . . . . . . . . . . . . .

Consenso degli integratori. . . . . . . . . . . . . . . . . . . . . . . . . . .

Simulazione della generazione di traiettorie. . . . . . . . . . . . . . . . .

5 Il setup di laboratorio e lo schema della Ground Station.

Elenco delle figure

Risultato della simulazione . . . . . . . . . . . . . . . . . . . . . . . . . .

Risultato della simulazione. . . . . . . . . . . . . . . . . . . . . . . . . .

Risultato della simulazione . . . . . . . . . . . . . . . . . . . . . . . . . .

Modello: alto livello. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Traiettorie prima dello sfasamento . . . . . . . . . . . . . . . . . . . . . .

Traiettorie dopo lo sfasamento. . . . . . . . . . . . . . . . . . . . . . . .

Traiettorie X e Y con cambio di richiesta sul centro ogni 15 secondi. . . .

I 3 marker e la struttura in carbonio. . . . . . . . . . . . . . . . . . . . .

Periferica di trasmissione dati al nano-quad. . . . . . . . . . . . . . . . .

Schema della Ground Station . . . . . . . . . . . . . . . . . . . . . . . .

Riferimento per la X, prima e dopo sfasamento. . . . . . . . . . . . . . .

Riferimento per la Y, prima e dopo sfasamento. . . . . . . . . . . . . . .

Tracking della traiettoria di riferimento per un quadrirotore. . . . . . . .

Teoria dei Grafi: alcune definizioni.

Un grafo non diretto G di ordine n `e una coppia (, ), dove = {1, . . . , n} `e un

1. Teoria e strumenti matematici.

In un grafo diretto, `e possibile introdurre il concetto di percorso diretto, inteso come

Definizione 1 (Grafo connesso semplicemente e fortemente.). Un grafo diretto si dice

1.1 Teoria dei Grafi: alcune definizioni.

Descrizione tramite matrici rappresentative.

` opportuno trovare una descrizione algebrica univoca per rappresentare i nodi

Un grafo non diretto G di ordine n `e una coppia (, ), dove = {1, . . . , n} `e un

Teorema 2. Dato un grafo diretto G(t) = (, ), la dimensione dellautospazio relativo