Sei sulla pagina 1di 29

Laurea magistrale in Ingegneria gestionale e

dell’automazione

UNSCENTED FILTERING
AND NONLINEAR
ESTIMATION
Bisanti, Pompili, Stingi, Zuchegna

1
• Vantaggi KF:
1. Mantenimento di una piccola e costante quantità di
informazioni
2. Quantità linearmente trasformabili.
3. Possono essere utilizzate per caratterizzare funzioni
aggiuntive sulla distribuzione

• Limiti dell’EKF:
1. TL attendibili se la propagazione dell'errore può essere
approssimata da una FL
2. Linearizzazione solo se la esiste matrice Jacobiana
3. Il calcolo dello Jacobiano è difficile e soggetto a errori

2
• Il KF si compone di due fasi: la previsione seguita da aggiornamento.
•  
• Nella fase di previsione,
 

• L'aggiornamento  

• il peso (guadagno) della matrice viene scelto per minimizzare la traccia della
covarianza aggiornata . Il  suo valore è calcolato a partire

in cui è la covarianza tra l'errore nel e l’errore in e è la covarianza di

3
•  Una variabile casuale ha media e covarianza .
Una seconda variabile, , è collegata ad tramite
la trasformazione non lineare

• Considerando lo sviluppo della serie di Taylor

• In cui l’operatore valuta il differenziale totale


quando subisce delle perturbazioni intorno a
un valore nominale da .

4
•  La linearizzazione presuppone che tutti i
termini di secondo grado in poi siano
trascurabili

• Sfruttando il presupposto che l'errore di stima


è a media nulla, la media e la covarianza sono

è lo jacobiano di

5
•  Da (r, θ) a (x, y)

6
• La linearizzazione dell’EKF inadeguata
• Le alternative implicano che si sostengano
costi elevati in termini di complessità
computazionale.
• L’UT colma le necessità di precisione rispetto
alla linearizzazione con costi computazionali
ragionevoli

7
Unscented Transformation
È più facile approssimare una distribuzione di
probabilità che approssimare una funzione non
lineare arbitraria o una trasformazione non
lineare

8
Differenza con il filtro Particle
1. La posizione dei punti di sigma non è casualè;
sono deterministicamente scelti in modo che
essi presentino determinate proprietà
specifiche
2. i punti Sigma possono essere ponderati in
modi che siano in contrasto con
l'interpretazione di distribuzione dei punti di
campionamento di in un filtro particle, pesi
sui punti compresi in (0,1)

9
•• Un
  insieme di punti sigma S consiste in p+1 vettori ed i loro pesi
associati S= (i=0,1, 2, ..., p : xi,Wi).
• Wi possono essere positivi o negativi, ma devono rispettare la
condizione

I punti dati , sono calcolati come segue.


1. Istanziamo ciascun punto attraverso la funzione per accrescere
l'insieme dei punti sigma trasformati
z(i)=h(x(i))
2. La media è data dalla media ponderata dei punti trasformati

3. La covarianza è il prodotto esterno ponderato dei punti


trasformati

10
• Le
  statistiche di qualsiasi altra funzione possono
essere calcolate in modo simile. Una serie di punti
(punti sigma) che soddisfi le condizioni precedenti
consiste di una serie simmetrica di 2Nx punti che
giacciono sul x -esimo contorno della covarianza

• Dove ()i è l’iesima riga o Colonna della radice


quadrata della matrice Nx∑x ed i Wi sono i pesi
associati agli iesimi punti.
11
•  
Nonostante la sua apparente semplicità, la UT ha un
certo numero di importanti proprietà:
1.Poiché l'algoritmo funziona con un numero finito di
punti sigma, si presta naturalmente ad essere
utilizzato come una libreria di filtraggio
2.Il costo computazionale dell'algoritmo è dello stesso
ordine di grandezza del EKF
3.Per ogni insieme di punti sigma che codifica la media e
covarianza in modo corretto sono calcolate le relative
proiezioni fino al secondo ordine
4.L'algoritmo può essere utilizzato con trasformazioni
discontinue
12
La dimostrazione rivisitata

• La serie originale di punti x(i) è stata distribuita simmetricamente


intorno all'origine e la trasformazione non lineare ha cambiato la
distribuzione in un triangolo con un punto al centro.
• La media UT è molto vicina a quella della reale distribuzione
trasformata.

13
• Supponiamo che un insieme di punti è costruito per avere una data
media e covarianza, Se un altro punto pari alla media data viene
aggiunto al set, allora la media del set non avrà alcun effetto, ma i
restanti punti dovrebbero essere scalati per mantenere la covarianza
data
• La ponderazione di questo punto appena aggiunto fornisce un
parametro per controllare aspetti dei momenti superiori della
distribuzione dei punti sigma senza influenzare la media e la covarianza
• Il nuovo punto di distribuzione diventa:

14
Il valore dei W° controlla come verranno riposizionati i nuovi punti
• Se W°>=0, i punti tendono a spostarsi dall'origine.
• Se W°<=0, i punti tendono ad essere più vicini all'origine.

Riprendendo l’esempio della trasformazone da cordinate polari a coordinate


cartesiane si ha che distribuzione prima ipotizzata è gaussiana in coordinate polari
locali e può essere giustificata perché garantisce che alcuni dei momenti di quarto
ordine sono gli stessi nel vero caso di una gaussiana.

15
General Sigma Point Selection Framework
 • La conoscenza delle informazioni di ordine superiore può essere parzialmente
incorporata nel set point sigma.
• Una possibilità è assumere che tutte le distribuzioni sono gaussiane. Ad esempio,
p(x) è una variabile casuale distribuita in modo gaussiano con media e covarianza e
∑ x.
• Questa similitudine può essere scritta in termini di una serie di vincoli non lineari
dalla forma
c(S,px(x))=0
• Ad esempio, l'insieme simmetrico dei sigma point corrisponde alla media e
covarianza di una gaussiana, e in virtù della sua simmetria, corrisponde anche il
terzo momento (skew=0). Queste condizioni possono essere scritte come
C1(S,p(x))=(i)X(i)-
C2(S,p(x))=(i)(X(i)- ) (X(i)- )T-∑x
C3(S,p(x))=(i)(X(i)- )3
• Tali vincoli non sono sempre sufficienti a determinare univocamente il set point
sigma. Pertanto, il set può essere raffinato introducendo una funzione di costo
c(S,px(x)) che penalizza caratteristiche indesiderabili

16
MITIGATING UNMODELED EFFECTS
• In generale, l'espansione di Taylor per un insieme di sigma point trasformati
contiene un numero infinito di termini.
• Tuttavia è possibile far corrispondere l'espansione in serie per una data
distribuzione fino ad un certo ordine; l'accuratezza sarà determinata dai termini
di ordine maggiore.
• Perciò ridurre il numero dei sigma-points significa ridurre la complessità
computazionale. Il numero minimo di sigma-points necessari per catturare
correttamente la media e la varianza `e pari a n + 1, dove n `e la dimensione
dello stato.(Stima media e covarianza), dunque, meno pesante, rispetto ad un
insieme 2Nx.
• Tuttavia si danno i seguenti casi per la deviazione (skew) verso un momento
centrale della distribuzione non nota.
– CASO 1: se la deviazione di una distribuzione è zero, allora l'insieme simmetrico di 2Nx sigma
point sarà più accurato; mentre la deviazione di un insieme semplice di punti, generalmente non
vale zero
– CASO 2: se la deviazione di una distribuzione è diversa da zero, allora la deviazione di un insieme
semplice potrebbe in caso fortuito allinearsi con quella della vera distribuzione, e quindi, essere
più accurata rispetto all'insieme simmetrico
• Dalle considerazioni fatte non è possibile determinare quali tra i due
insiemi sigma point discussi prima sarà più accurato sulla media, dunque è
possibile concludere che l'insieme deviato produrrà risultati peggiori
• Questo può essere dimostrato considerando l'effetto ottenuto ruotando
un insieme di sigma point. La rotazione influisce sullo schema dei momenti
di ordine maggiore e, quindi, può avere un impatto significativo sulle
prestazioni.
Supponiamo che:
1. L’insieme semplice di sigma point sia stato selezionato usando W(0)=0,
questi sigma point giacciono sul triangolo.
2. Viene applicata questa matrice di rotazione R ad ogni punto dell'insieme,
il risultato è l'equivalente di ruotare un triangolo; questo non ha
un'influenza nei primi due momenti, ma influenza il terzo e, quindi, di
ordine maggiore.
Insieme dei sigma point trasformati (z(i))per tre differenti rotazioni.

ϴ=0(line) ,
ϴ=120(punti-tratteggiato) , ϴ=240(tratteggiato)
Il punto zero in (0,1), non è affetto
da rotazione.
• L'insieme delle rotazioni illustrate in figura , dimostra come il valor medio delle
rotazioni non varia, ma la covarianza cambia significativamente.
• Quindi, anche senza una conoscenza esatta a proposito dei termini di ordine
maggiore dell'espansione, è possibile minimizzare gli errori della distribuzione
• La conservazione dei primi due momenti implica un meccanismo per
parametrizzare parzialmente l'effetto dei momenti di ordine maggiore.
• Tale meccanismo consiste nel riformulare il problema, cosi che questo possa
essere riscritto in termini di una trasformazione non lineare:

α è un parametro di scala e μ è un termine di


normalizzazione che scala il punto
trasformato.

• Si può dimostrare, calcolando l’espansione in serie di Taylor e facendo


adeguate considerazioni sui parametri α e μ, che questa formulazione
mantiene l’accuratezza al 2° ordine
SCALED Unscented Transformation
• Assumendo che E[z]=0 e settando µ = α 2

sono corretti fino al 2° ordine

• Un effetto collaterale nell’utilizzare la funzione modificata è che si


eliminano tutti i termini di ordine superiore nella serie di Taylor.
• A differenza dei sigma-point della versione standard dell’UT la Scaled UT
può essere estesa per includere parte dell’informazione legata al termine
superiore al secondo ordine dell’espansione in serie di Taylor.
• Aggiungendo un ulteriore parametro (β) relativamente ai punti di ordine
zero, è possibile incorporare tali effetti di ordine superiore senza costi di
calcolo aggiuntivi.
• Il valore di β è la funzione di kurtosis per una distribuzione gaussiana.
(a)

L'effetto della scaled UT sulla media e


covarianza.
α = 10 -3 ; β = 2 ; µ = 10 -3.
Si noti che la stima UT (linea) è conservativa
rispetto alla vera stima trasformata
(tratteggiata) assumendo una gaussiana.
(a) Senza termine di correzione
(b) con termine di correzione  

(b)
Ulteriori applicazioni della UT
Trasformazioni discontinue: esempio di un proiettile che potrebbe colpire un
muro e rimbalzare, o continuare a muoversi in linea retta

• Posizione = . Il proiettile è inizialmente rilasciato al


momento 1 e viaggia ad una velocità costante e nota v, nella direzione x

• L'obiettivo è quello di stimare la posizione media e la covarianza della


posizione al tempo 2 dove

• Un muro ‘in basso a destra’ rende difficile il problema; Se il proiettile


colpisce la parete, c'è una collisione perfettamente elastica, e il proiettile
torna indietro con la stessa velocità con la quale ha viaggiato in avanti
I risultati sperimentali mostrano l'effetto nell’utilizzare valori iniziali differenti
per y.
(a) scenario del problema.
(b) errore di predizione quadratico medio per valore iniziale di y. Linea non
tratteggiata UT, line tratteggiata EKF
- La UT stima la media molto da vicino, con piccoli picchi, come i punti sigma
dopo il passaggio del muro

- Ulteriori analisi mostrano che la covarianza per il filtro è solo leggermente


più grande della vera covarianza, ma abbastanza conservativa per spiegare il
deviazione della sua media stimata dalla media vera

- Il EKF, tuttavia, basa tutta la sua intera stima sulla media condizionata dalla
proiezione della precedente, quindi le sue stime non hanno alcuna
somiglianza con la vera media, tranne quando la maggior parte della
distribuzione colpisce, o manca, la parete e l'effetto della discontinuità è
trascurabile
Multilevel Sensor Fusion
• La UT può essere utilizzata anche per colmare il divario tra filtri di basso
livello, basati sui sistemi KF, e sistemi ad alto livello, sulla base di intelligenza
artificiale.
• Il problema di base, associato alla fusione multilivello dei dati, è che i diversi
livelli riguardano generalmente parti di informazioni differenti, rappresentate
in modi molto diversi

• Un approccio per risolvere questo problema è quello di combinare i diversi


algoritmi di data fusion, in un unico algoritmo composito, che prende i dati
grezzi dal sensore di rumore/incertezza, e fornisce il dedotto stato di alto
livello
SINTESI E CONCLUSIONI

• In questo lavoro abbiamo presentato e discusso la UT; Abbiamo visto come può
essere usata per convertire le informazioni statistiche attraverso una
trasformazione non lineare

Le differenze principali con il filtro a particelle sono 2:


1. I punti di sigma sono scelti in modo deterministico pertanto, le proprietà di
secondo ordine della distribuzione, possono essere propagate con poche
informazioni statistiche
2. l’approssimazione può risultare più generica, rispetto ad una distribuzione di
probabilità, e abbiamo mostrato come questa generalità possa essere
sfruttata
• Questo lavoro ha preso in considerazione molti aspetti dei vari modi in cui le
UT possano essere personalizzate per affrontare particolari applicazioni.
• L'algoritmo di base è concettualmente molto semplice, e di facile applicazione.
• Rispetto all’EKF fornisce sufficiente precisione, in applicazioni altamente non
lineari, di filtraggi e controlli

Potrebbero piacerti anche