Sei sulla pagina 1di 67

Principi ed applicazioni della visione stereo

Computer Vision Laboratory (CVLAB) DEIS/ARCES - University of Bologna


http://www.vision.deis.unibo.it/
Luigi Di Stefano

Luigi Di Stefano

Sommario
Geometria stereo e ricostruzione 3D Vincoli per il problema della corrispondenza Algoritmi di corrispondenza

Tassonomia
Algoritmi feature-based (cenni) Algoritmi area-based locali Algoritmi area-based globali/ibridi (cenni)

Applicazioni
Luigi Di Stefano

Perch pi immagini?

Analizzando una singola immagine non possibile ricostruire la struttura tridimensionale della scena osservata. Ci dovuto alla perdita di informazione insita nella proiezione prospettica, che mappa i punti dello spazio 3D in uno spazio 2D.

Uso di pi (almeno 2) viste


Luigi Di Stefano

Proiezione Prospettica

f f u=x ; v= y z z

Luigi Di Stefano

Ricostruzione 3D mediante 2 viste

P P L pR pL pR OR R

OL Problema della corrispondenza (stereo matching) !

Luigi Di Stefano

Sistema stereo laterale (standard)


Assi (x,y,z) paralleli Identica focale Piani immagine coplanari z P z

vL = vR = y f/z uL = xL f/z uR = xR f/z

uL pL I s.d.r. solidali con le due camere differiscono per una traslazione (b), e.g. orizzontale: f OL xL b pR

uR f OR xR

uL uR = b f/z uL uR = d (disparit) d = b f/z

xL xR = b yL = yR = y zL = z R = z

z = b f/d

Luigi Di Stefano

Geometria epipolare
Lo spazio di ricerca del problema della corrispondenza stereo sempre 1D ! Le rette epipolari di un immagine passano tutte per un punto detto epipolo (proiezione del centro ottico dellaltra)

P P L pR pL pR OR Retta epipolare (associata a pL in R) R

OL

Ricerca pi complessa rispetto alla geometria stereo standard !


Luigi Di Stefano

Rettificazione
E possibile ottenere una configurazione equivalente a quella standard (rette epipolari coniugate orizzontali e collineari) applicando a ciascuna delle due immagini una trasformazione (omografia) detta rettificazione.

Luigi Di Stefano

Calibrazione e Rettificazione
Per facilitare la ricerca dei punti corrispondenti le immagini acquisite devono essere rettificate (trasformate in maniera da essere equivalenti a quelle ottenibili con un sistema stereo standard). Per ottenere le omografie di rettificazione le due telecamere devono essere calibrate (stima dei parametri estrinseci ed intrinseci). La calibrazione fornisce anche i parametri necessari per la ricostruzione 3D (b, f, pixel size) Esistono strumenti standard per effettuare la calibrazione e la rettificazione (OpenCV, Matlab Camera Calibration Toolbox,).

Luigi Di Stefano

Relazione fra distanza e disparit

Disparity (pixels)

1 m ~ 30 d

10 m ~ 3 d

Range (mm)

f = 6.3 mm, b = 80 mm, pixel size = 14 m

Luigi Di Stefano

Risoluzione al variare della distanza

z=(z2/bf)*d
10 cm res~ 9.6 m dist

Range Resolution (mm)

10 mm res ~ 3 m dist

Distance to object (m)

f = 4.8, 8.0. 12.0 mm, b = 90 mm, pixel size = 7.5 m


Luigi Di Stefano

Corrispondenza fra due viste (matching)


Dato un elemento in una delle due immagini (e.g. L) trovare quello che nellaltra immagine (R) rappresenta la proiezione dello stesso elemento della scena (elementi corrispondenti). Elementi corrispondenti sono simili.

(Tsukuba, vision.middlebury.edu/stereo)
Luigi Di Stefano

Occlusioni
In ciascuna della due immagini sono presenti regioni non visibili nellaltra poich occluse da oggetti pi vicini. Un algoritmo di matching dovrebbe anche individuare gli elementi dellimmagine situati nelle regioni occluse, per i quali non possibile risolvere il problema della corrispondenza.

Luigi Di Stefano

Mappa delle disparit


Le disparit di tutti i punti dellimmagine di riferimento (e.g. L) costituiscono una mappa, detta mappa delle disparit, che pu essere visualizzata come unimmagine a livelli di grigio.

(Tsukuba (L), ground-truth disparity map)

Immagini stereo e mappe di disparit di ground-truth [1]:


http://vision.middlebury.edu/stereo/
Luigi Di Stefano

Vincoli per la ricerca delle corrispondenze


Il problema della corrispondenza intrinsecamente ambiguo: pL potrebbe a-priori essere messo in corrispondenza con qualsiasi punto in R appartenente alla retta epipolare associata pL. Gli algoritmi di matching sfruttano vincoli finalizzati a ridurre il numero dei potenziali elementi corrispondenti. Principali Vincoli: Intervallo di disparit. Vincolo di continuit. Vincolo di unicit. Vincolo di ordinamento. .

Luigi Di Stefano

Intervallo di disparit
E opportuno limitare in pi possibile lintervallo di disparit al fine di considerare solo la porzione di spazio 3D entro cui giacciono gli oggetti di interesse:

Zmax

bf bf z [z min , z max ] d [d min , d max ] = , z max z min


In questo modo si riducono sia lambiguit intrinseca del processo di matching (meno candidati) sia la complessit computazionale:
Zmin dmin pL OL dmax OR d=0

O(d max d min )

Luigi Di Stefano

Vincoli di continuit ed unicit


Continuit: la disparit varia con continuit quasi ovunque (le superfici 3D sono prevalentemente smooth: non vale in corrispondenza dei bordi). Unicit: ciascun punto di unimmagine pu avere al pi un punto corrispondente nellaltra immagine (non vale per oggetti trasparenti).
M P Q

Dato: pL pR : P pL qR : Q (non visibile in L) mL pR : M (non visibile in R)

mL OL

pL

pR

qR OR

Luigi Di Stefano

Vincolo di ordinamento (1)


Q P Q

Q: qL pL Q: pL qL

pR qR pR qR

qL pL qL pR qR qR OL OR

Dato P, si pu dedurre se unaltro punto 3D appartiene (Q) o meno (Q) alla zona tratteggiata associata a P (zona proibita) in base allordinamento dei punti immagine lungo le rette epipolari. Dato il match pL pR che individua P possibile sfruttare lordinamento rispetto a tale match risultante dai match successivi per scartare quelli che individuano punti 3D situati nella zona proibita associata a P.
Luigi Di Stefano

Vincolo di ordinamento (2)


Q Q Q P

pL OL

pR OR OL

pL

pR OR

Se Q e P appartengono alla superficie di uno stesso oggetto opaco e di spessore non nullo e Q appartiene alla zona proibita associata a P allora Q non visibile in entrambe le immagini. Se per Q appartiene alla superficie di un altro oggetto pu essere visto in entrambe le immagini pur appartenendo alla zona proibita di P (caso tipico: oggetti sottili in foreground). E quindi opportuno limitare lapplicazione del vincolo ai soli punti situati in un piccolo intorno di P ([2]).
Luigi Di Stefano

Classificazione degli algoritmi di corrispondenza


Feature-based: effettuano il matching di determinate features dellimmagine (edge-points, segmenti, corners, curve). Il criterio di matching si basa sulla caratterizzazione delle features mediante attributi (e.g. segmenti: lunghezza, orientazione, contrasto medio..). Robustezza e velocit (va per considerato anche lo step di estrazione delle features !) - Mappe di disparit sparse. Area -based: effettuano il matching di tutti i pixel dellimmagine. Mappe di disparit dense Minor robustezza (e.g. regioni uniformi) e costi computazionali elevati (ottimizzazione mediante schemi di calcolo ricorsivi, accelerazione hardware). Tre approcci principali: algoritmi locali, globali, ibridi (o semi globali).

Luigi Di Stefano

Algoritmi Area-based
Algoritmi locali La disparit assegnata ad un pixel dipende solo da informazioni dedotte da pixel spazialmente vicini a quello considerato. Generalmente il criterio di matching costituito dalla similiarit fra finestre (di dimensione prefissata o adattive) centrate nei pixel considerati. Veloci e meno accurati. Algoritmi globali La disparit assegnata ad un pixel dipende da informazioni dedotte da tutta limmagine. Generalmente il problema viene impostato come un problema di minimizzazione di una funzione energia. Computazionalmente onerosi e molto accurati. Algoritmi ibridi (semi globali) Stessa impostazione dei globali, ma utilizzando un sotto-insieme dellintera immagine (e.g. una scanline). Interessante compromesso fra velocit e accuratezza.
Luigi Di Stefano

Un esempio di matching basato su features [2,3]

Segmenti estratti nelle due immagini

Segmenti delle due immagini per i quali stata stabilita la corrispondenza

Luigi Di Stefano

Risultati del matching basato su features

Segmenti per i quali stata stabilita la corrispondenza

Segmenti 3D (vista frontale)

Segmenti 3D (vista laterale)


Luigi Di Stefano

Area-based matching: approccio di base

S
WTA (Winner-Takes-All)

d
Luigi Di Stefano

Area-based matching: approccio di base


j j+dmin j+d j+dmax

i 2W+1

2W+1

Luigi Di Stefano

Scelte per la funzione


NCC (Normalised Cross-Correlation)

SSD (Sum of Squared Differences)

SAD (Sum of Absolute Differences)

Con SSD, SAD:

Luigi Di Stefano

Principali problematiche (1)


Occlusioni: lapproccio WTA assegna un valore di disparit anche ai punti occlusi dellimmagine di riferimento. Distorsioni fotometriche Le superfici reali non sono perfettamente lambertiane: punti corrispondenti avranno brightness differente a causa del differente punto di vista. La consistenza fotometrica fra le due viste tanto maggiore quanto pi la baseline corta rispetto alla distanza degli oggetti. Differenze nei parametri che caratterizzano la risposta delle due telecamere (e pi in generale dellintero processo di acquisizione delle due immagini). Sovente: R = aL + b (con a: gain, b: offset). Rumore. Distorsioni prospettiche: regioni corrispondenti non fronto-parallele appaiono di dimensioni differenti nelle due immagini.

Luigi Di Stefano

Principali problematiche (2)

Distorsioni fotometriche dovute a superficie non lambertiana

Occlusione

Distorsione prospettica

Luigi Di Stefano

Principali problematiche (3)


Regioni con poca texture e pattern periodici Differenti campi visivi delle due telecamere.

Luigi Di Stefano

Compensazione delle distorsioni fotometriche


Lapproccio pi diffuso consiste nel correlare non direttamente le immagini ma una loro opportuna trasformazione. Normalizzazione delle immagini mediante sottrazione del valor medio calcolato nella finestra di correlazione (e.g. [4], [5]). Consente la compensazione delloffset ( : ZNCC, ZSSD, ZSAD). Limpiego di ZNCC consente di compensare anche il gain. Filtraggio passa-banda (sovente operatore LOG): compensa loffset e, pi in generale, migliora la consistenza fotometrica fra le due immagini (e.g. [6], [7], [8]). Uso di misure di similarit basate sul principio dellordinamento Invarianza rispetto a distorsioni fotometriche modellabili come trasformazioni monotone non decrescenti. Trasformata Census [9]: bit-string ottenuta confrontando lintensit del pixel corrente, I(P), con quella di ciascuno dei vicini, I(P) in un intorno prefissato (1/0 se I(P)< / > I(P)). Dissimilarit: somma delle distanze di Hamming (# bit differenti) in una finestra prefissata. Proposte pi recenti sono descritte in [10], [11].
Luigi Di Stefano

Uso di interest-operators
Si selezionano mediante opportuni operatori i punti di interesse su cui effettuare il matching (o validare i match ottenuti). Tali operatori selezionano punti caratterizzati da un grado di tessitura locale stimato come sufficiente a considerare affidabili i match. Operatore di Moravec [12],[13]: considerato un intorno N(P) (5x5..11x11): 8 varianze direzionali, minimo e sogliatura.

1(P) = (I(i,j)-I(i+1,j+1))2
(i,j) N(P)

1 4 7

2 5 8 1 4 7

3 6 9 2 5 8 3 6 9

M(P) = min {1(P)8(P)}

Soglia sulla varianza dei livelli di grigio (e.g. [5], [14]): meno efficace (edge orizzontali) ma molto efficiente computazionalmente.
Luigi Di Stefano

Analisi della curva di correlazione


Landamento della curva di correlazione lungo una retta epipolare fornisce utili informazioni circa laffidabilit e laccuratezza dei match.

Se la curva presenta pi picchi di valore simile aumenta la probabilit di effettuare una scelta errata (e.g. pattern ripetitivi). Si pu allora accettare un match solo se la differenza (o il rapporto) fra i due picchi principali sufficientemente elevata (e.g. [4], [5], [14], [15]). Un picco principale piatto invece tipicamente dovuto a poca tessitura. Si pu allora stimare lo spread del picco (e.g. media delle derivate destra e sinistra) e tenere solo i match corrispondenti a picchi stretti (e.g. [5]). I filtri sul rapporto dei picchi e lo spread si rivelano efficaci anche per eliminare le corrispondenze out-of-range [16].
Luigi Di Stefano

Consistenza Left-Right (1)


Per ogni punto di L si cerca il miglior match in R massimizzando la correlazione L-R. (Fase 1). Quindi, per ogni punto di R si cerca il miglior match in L massimizzando la correlazione R-L (Fase 2). Infine, si accettano solo le corrispondenze che risultano coerenti: se nella Fase 1 pR il miglior match di pL, allora nella Fase 2 pL deve essere il miglior match di pR ([17], [4]). Efficace per scartare gli errori di corrispondenza dovuti alle regioni occluse: se pL non visibile in R, nella Fase 1 sar messo in corrispondenza casualmente con un punto di R che, se visibile in L, avr un proprio elemento corrispondente pL pL e ritorner tale elemento nella Fase 2.

Luigi Di Stefano

Consistenza Left-Right (2)

Left ref.

Right ref.

LR map

RL map

Luigi Di Stefano

Vincolo di unicit
Lapproccio di base area-based sfrutta il vincolo di unicit solo rispetto allimmagine di riferimento (L). E possibile allora sfruttare il vincolo di unicit anche rispetto allaltra immagine (R): se durante il processo di matching L-R pR risulta il miglior match sia per pL sia per pL (conflitto su pR) allora fra i due possibile match si sceglie quello caratterizzato dal valore pi elevato della funzione di correlazione (e.g. [5]). Questo approccio fornisce risultati molto simili al left-right check (che implica lunicit anche rispetto ad R) ma non richiede lesecuzione della correlazione R-L.

Luigi Di Stefano

Variazione della disparit nella finestra di correlazione


Lapproccio standard si basa sullassunzione che la disparit sia costante allinterno della finestra di correlazione (vincolo di continuit, superfici localmente frontoparallele). Tuttavia, tale assunzione facilmente violata nelle scene reali, in particolare in corrispondenza dei bordi fra oggetti situati a distanza differente (occluding boundaries).

Una finestra che copre regioni a differente disparit non ha una finestra esattamente corrispondente nellaltra immagine in quanto le regioni a differente disparit, se visibili, non sono pi contigue oppure possono risultare occluse. Ci implica elevata incertezza nell individuazione dei massimi (minimi) locali e conseguentemente scarsa accuratezza nella localizzazione degli occluding boundaries (border localization/blurring/fattening problem).
Luigi Di Stefano

Algoritmi basati su supporto adattivo


Lidea alla base dellapproccio la seguente: anzich utilizzare una finestra di correlazione di dimensioni fisse per ogni punto dellimmagine di riferimento, si utilizza un supporto (in generale non rettangolare) la cui forma e dimensioni variano adattandosi di volta in volta alle caratteristiche dellimmagine Approccio basato su supporto variabile

Approccio tradizionale

Luigi Di Stefano

Supporto basato su finestre rettangolari (1)


Dato il punto corrente, si considera un insieme di finestre rettangolari di dimensioni differenti e/o centrate su punti differenti. Sulla base di un determinato criterio (es. misura di matching) si seleziono una o pi finestre che rappresenteranno il supporto adattivo su cui sar determinata la disparit per il punto. Ad esempio, in shiftable windows [18]: variazione delloffset della finestra, selezione della finestra migliore che minimizza la misura di similarit.

CSW ( x, y ) =

( i , j )Wxy ( r )

min {C (W (r ))}
ij

Luigi Di Stefano

Supporto basato su finestre rettangolari (2)


Multiple Windows [15]: utilizzo di pi finestre di correlazione (5,9,25). Per ogni corrispondenza si calcola la misura di matching sulla finestra centrale e sulle altre finestre (2,4,8) che la circondano che forniscono il migliore score (best supporting windows).

Aggregazione su 5 finestre
C H ( p, d ) = C ( p, d ) + Cmin1 ( p, d ) + Cmin 2 ( p, d )

Aggregazione su 9 finestre
C H ( p, d ) = C ( p, d ) + Cmin1 ( p, d ) + Cmin 2 ( p, d ) + Cmin 3 ( p, d ) + Cmin 4 ( p, d )

Luigi Di Stefano

Supporto basato su segmentazione


Il supporto non pi costituito da una o pi finestre rettangolari, ma pu avere forma qualsiasi. La determinazione del supporto si basa dalla segmentazione dellimmagine (a colori) di riferimento.
Segmentation-based [20] Segment-support [21]

1 1 1 1

1 1 1 1 1 1 1

1 1 1 1 1 1

1 1 1 1 1 1

1 1 1 1

1 1 1

1.0, pi Sc w(pi, pc) = d (I (p ),Ir(pc) ) exp c r i c

Luigi Di Stefano

Risultati con algoritmi locali

Ground truth

Locale a finestra fissa

Shiftable Windows [18]

Segment support [20]


Luigi Di Stefano

Algoritmi globali ed ibridi


Gli algoritmi globali formulano il problema della ricerca delle corrispondenze come un problema di minimizzazione dellenergia. Pi precisamente, lobiettivo determinare la funzione disparit d(pL) che minimizza unenergia globale:

E (d ( p L )) = Edata (d ( p L )) + Esmooth (d ( pL ))

Edata (d ( pL )) = Esmooth (d ( pL )) =

p L L L

C ( p , d ( p ))
L L L L L

p L L

(d ( p ) d ( p' )) + (d ( p ) d ( p' ' ))

Poich la minimizzazione di tale funzione un problema NP-completo, si usano metodi di inferenza approssimata per determinarne un minimo locale: e.g. simulated annealing [21], graph-cuts [22, 23], belief propagation [24] Negli algoritmi ibridi, viene impostato un problema simile ma su un sottoinsieme dellimmagine (tipicamente, una riga). I metodi di risoluzione pi diffusi sono Dynamic Programming [25] e Scanline Optimization [26].
Luigi Di Stefano

Risultati con algoritmi globali ed ibridi

Ground truth

Belief Propagation

Graph Cuts

Scanline Optimization
Luigi Di Stefano

Accuratezza vs. Efficienza


Accuratezza (% errors)
100% (Ground Truth) 90% 80% 70% 60% Graph Cuts BP
Variable support

SO, DP Local

hours

minutes

Near real-time

Real-time

Efficienza (computation time)

Luigi Di Stefano

Stereo-based 3D people tracking: motivation


Tracking people based on a monocular sequence is very hard due to close and complex interactions as well as quick changes in body appearance.

3D, stereo-based tracking holds the potential for dealing with these problems. In particular, stereo, yielding the 3D position of image points, allows to build an orthographic projection with the projection plane parallel to the ground-plane. In such a projection plane people tend to not overlap and their appearance cannot change quickly.
Luigi Di Stefano

Plane-view statistics
A suitable orthograpic projection is given by plane-view statistics (occupancy map: Beymer [27], occupancy and height maps: Harville [28]).
Left image

Stereo head
X cam Z cam Ycam

H max

H min

Height map
ZW

Occupancy map

YW XW

ground

y plan x plan

Luigi Di Stefano

3D People Tracking

Luigi Di Stefano

People counting

Luigi Di Stefano

Statistiche flussi di visitatori (musei, mostre)


Paestum, Stockholm City Museum, Palazzo Rospigliosi (ROMA) Prof. Tullio Salmon Cinotti.

Luigi Di Stefano

Retail Intelligence
Monitoraggio automatico del comportamento dei clienti allinterno di supermercati, centri commerciali, negozi..

Censys3d (Up to 6m x 8m coverage area) Point Grey Research (www.ptgrey.com)


Continuously optimize shopper-to-cashier ratios by monitoring the number of shoppers in line. Optimize labor scheduling based on accurate minute-by-minute traffic counts rather than standard transaction counts. Determine display effectiveness through analysis of shopper viewing duration. Optimize product placement in high traffic areas.

Trajectory Summary Image

Aziende operanti nel settore della retail intelligence VideoMining - www.videomining.com Vizualize - www.vizualize.net
Luigi Di Stefano

Conteggio Passeggeri
Conteggio automatico di passeggeri che salgono/scendono da mezzi di trasporto quali treni, autobus, tram.

PCN 1001

Neuricam www.neuricam.com & EUROTECH www.eurotech.com Typical installation: 2.25 meters above floor level Minimal detection distance: 0.25 meters - Height Threshold: 1 meter above floor level Count Accuracy: >97% Four integrated high luminosity infrared LEDs (operation in any type of lighting conditions) If the width of a doorway is greater than 120 cm, two or more counters can be interfaced together.
Luigi Di Stefano

Ricostruzione 3D (1)
Ricostruzione 3D da pi viste stereo non calibrate

Luigi Di Stefano

Ricostruzione 3D (2)
Stereo Pairs
Disparity Maps 3D Point Clouds

Luigi Di Stefano

Ricostruzione 3D (3)

Keypoints matching (SIFT) + absolute orientation (LS & RANSAC)


Luigi Di Stefano

Ricostruzione 3D (4)

Luigi Di Stefano

Ricostruzione 3D (5)
Spacetime stereo [29], [16]

Luigi Di Stefano

Ricostruzione 3D (6)

Luigi Di Stefano

Automotive Intelligent Vehicles (1)


Uso di telecamere stereo per la rilevazione di ostacoli in sistemi di ausilio al guidatore o guida automatica

Progetto DIPLODOC Fondazione Bruno Kessler Trento (ex ITC-IRST) Gruppo TeV (Tecnologie per la Visione) http://www.fbk.eu/ Dott. Stefano Messelodi

Luigi Di Stefano

Automotive Intelligent Vehicles (2)


DARPA Grand Challange competizione fra AGVs (Automatic Guided Vehicles) 2004 (150 miglia, nessuno completato, CMU tragitto pi lungo - circa 7 miglia) 2005 (Stanford, 22 su 23 finalisti pi di 7 miglia) 2007 Urban Challange (CMU).

Terramax 2004 Team Terramax Gruppo VISLAB Universit di Parma http://vislab.it/ Prof. Alberto Broggi Terramax 2007
Luigi Di Stefano

AMR (Autonomous Mobile Robots)


Uso di telecamere stereo per la costruzione automatica di una mappa dellambiente e la stima della posizione del robot (visual SLAM: Simultaneous Localization and Mapping).

SRI & Universit La Sapienza L. Iocchi (http://www.dis.uniroma1.it/~iocchi/) SRI International (http://www.sri.com/) K. Konolige

Willow Garage http://www.willowgarage.com/pages/research


Luigi Di Stefano

Planetary Rovers (JPL-NASA)

Sojurner (1997) Spirit & Opportunity (2004) Phoenix (25-05-2008)

Opportunity Stereo panorama (12-05-2008)


Luigi Di Stefano

Guida Robot 3D
Individuazione e localizzazione di un oggetto 3D per la presa da parte di un robot manipolatore.

Halcon - MVTech (http://www.mvtec.com/)


Luigi Di Stefano

Visual Communication and Man-Machine Interface


Utilizzo di una stereo webcam per ottenere forme avanzate di video-comunicazione (3D Avatar, 3D Icons, background substitution) oppure per realizzare interfaccie utenti basate suI riconoscimento di gesti (e.g. video games).

Hidra by nVela (http://www.nvela.com/)

Microsoft Research Cambridge (UK) http://research.microsoft.com/vision/cambridge/i2i

Luigi Di Stefano

Ringraziamenti

Federico Tombari Samuele Salti Giovanni Pellini Alioscia Petrelli

Luigi Di Stefano

Bibliografia (1)
[1] D. Scharstein, R. Szeliski A taxonomy and evaluation of dense two frame stereo correspondence algorithms, Int Journ. of Computer Vision, 2002. [2] N. Ayache, B. Faverjon Efficient registration of stereo images by matching graph descriptions of edge segments, Int. Journ. of Computer Vision, Vol. 1(2), 1987. [3] N. Ayache Artificial vision for mobile robots: stereo vision and multisensory perception, The MIT Press, 1991. [4] O. Faugeras et. al. Real time correlation-based stereo: algorithm, implementations and applications, INRIA Rapport de recherche N. 2013, 1993. [5] L. Di Stefano, M. Marchionni, S. Mattoccia A Fast Area-Based Stereo Matching Algorithm, Image And Vision Computing, Vol. 22, No. 12, Oct. 2004. [6] L. Matthies Stereo vision for planetary rovers: stochastic modeling to near real-time implementation, Int. Journ. of Computer Vision, 1992. [7] T. Kanade et. al. A video-rate stereo machine and its new applications Fast Area-Based Stereo Matching Algorithm, Proc. 27th Int. Symp. on Industrial Robots, 1996. [8] K. Konolige Small Vision Systems: Hardware and Implementation, Proc. 8th Int. Symp. on Robotics Research, 1997. [9] R. Zabih, J. Woodfill Non parametric local transforms for computing visual correspondence, Proc. 3 European Conf. On Computer Vision, 1994. [10] D. Bhat and S. Nayar, Ordinal measures for image correspondence, IEEE Trans. Pattern Recognition and Machine Intelligence, 20(4):415423, April 1998. [11] A. Mittal and V. Ramesh, An intensity-augmented ordinal measure for visual correspondence, Proc. IEEE Conf. on Computer Vision and Pattern Recognition (CVPR), 2006. Luigi Di Stefano

Bibliografia (2)
[12] H.P. Moravec Visual mapping by a robot rover, Proc. of. 6th Int. Joint Conf. on Artificial Intelligence, 1979. [13] M.J. Hanna SRI's Baseline Stereo System, Proc. Image Understanding Workshop, 1985. [14] L. Robert, M. Buffa, M. Hebert Weakly-calibrated stereo perception for rover navigation, Proc. Fifth Int. Conf. on Computer Vision, 1995. [15] H. Hirschmuller, P. Innocent, J. Garibaldi Real-time correlation-based stereo vision with reduced border errors, Int. Journ. of Computer, 2002. [16] F. Tombari Stereo for Robots, Seminario tenuto presso il DEIS il 20-11-2008. [17] P. Fua A parallel stereo algorithm that produces dense depth maps and preserves image features, Machine Vision and Applications, 1993. [18] A. Bobick, S. Intille, Large occlusion stereo, International Journal of Computer Vision, 33(3):181200, 1999. [19] M. Gerrits and P. Bekaert, Local stereo matching with segmentation-based outlier rejection, in Proc. Conf. Computer and Robot Vision, pages 6666, 2006 [20] F. Tombari, S. Mattoccia, L. Di Stefano, Segmentation-based adaptive support for accurate stereo correspondence, IEEE Pacific-Rim Symposium on Image and Video Technology, 2007 [21] S. T Barnard Stochastic stereo matching over scale, Int Journ. of Computer Vision, 1989. [22] Y. Boykov, O. Veksler, and R. Zabih Fast approximate energy minimization via graph cuts, IEEE Trans. on PAMI, 2001. [23] V. Kolmogorov, R. Zabih Computing visual correspondence with occlusions using graph cuts, In Eighth Intern. Conf. on Computer Vision, 2001. Luigi Di Stefano

Bibliografia (3)
[24] A. Klaus, M. Sormann and K. Karner, Segment-based stereo matching using belief propagation and a self-adapting dissimilarity measure, Intl Conf. Pattern Recognition 2006. [25] Birchfield, S. and Tomasi, C., Depth discontinuities by pixel-to-pixel stereo. International Conference on Computer Vision (ICCV98), Bombay. [26] H. Hirschmller,Stereo vision in structured environments by consistent semi-global matching, CVPR 2006. [27] D. Beymer Person counting using stereo, IEEE Work. On Visual Motion, 2000. [28] M. Harville Stereo person tracking with adaptive plan-view templates of height and occupancy statistics, Image and Vision Computing (22), No.2, 2004. [29] J. Davis, D. Nnhab, R. Ramamoorthi, S. Rusinkiewicz, Spacetime stereo: A unifying framework for depth from triangulation, IEEE Trans. on PAMI, 2005.

Luigi Di Stefano