Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Reconhecimento 3D
raquelcesar@netcabo.pt
Instituto Superior Tcnico
Engenharia Informtica e de Computadores
Engenharia Biomdica 2002
consideradas vistas intermdias. O desempenho no
depende linearmente da menor distncia angular em trs
dimenses vista melhor reconhecida mas correlacionase de forma significativa com a distncia entre a vista
apresentada e a melhor vista (menor tempo de
reconhecimento e menor taxa de erro) em termos da
deformao, no plano bidimensional da imagem, de um
conjunto de caractersticas identificativas do objecto [2].
Desta forma, a medio da semelhana entre planos de
imagem e alguns padres de caractersticas parece ser um
modelo apropriado para o processo de reconhecimento
humano de objectos tridimensionais. Experincias com
macacos mostram que a familiarizao com um nmero
limitado de vistas de um novo objecto pode dar origem a
reconhecimento independente do ponto de vista. Vrios
estudos fisiolgicos tambm fornecem evidncia de um
processamento baseado em vistas pelo crebro durante o
reconhecimento de objectos. Resultados de medies em
neurnios no cortex temporal inferior dos macacos, que se
sabe estar relacionado com o reconhecimento de objectos,
suportam os resultados dos estudos comportamentais.
Foram encontradas populaes de neurnios no cortex
inferior temporal que respondem selectivamente a apenas
algumas vistas de um objecto e cuja resposta diminui
medida que o objecto rodado, afastando-se de um ponto
de vista preferencial [7].
Em suma, podemos dizer que a representao de
objectos na forma de vistas nicas ligadas entre si parece
ser suficiente para uma vasta variedade de situaes e
tarefas de percepo.
O trabalho aqui apresentado descreve uma tentativa de
incorporao
de
reconhecimento
de
objectos
tridimensionais a partir de imagens bidimensionais
partindo de trabalho apresentado em [14]. O esquema
considerado baseia-se na projeco ortogrfica de
objectos 3D em imagens 2D e composto por duas fases.
Na primeira fase, a fase de categorizao, a imagem
comparada a objectos prottipo. Para cada prottipo
determina-se a vista que mais se aproxima da imagem e,
se essa vista for semelhante imagem, classifica-se o
objecto na classe representada pelo prottipo. Na segunda
fase, a fase de identificao, o objecto observado
comparado com os modelos individuais da sua classe.
Cada classe agrupa objectos com formas relativamente
prximas. Para cada modelo procura-se uma vista que
coincida com a imagem. No caso de se encontrar uma
vista nestas condies, a identidade especfica do objecto
determinada. O processo de categorizao do objecto
(antes da identificao) oferece duas vantagens essenciais:
RESUMO
O reconhecimento de objectos encontra-se no topo de
uma hierarquia de tarefas visuais. Na sua forma geral,
este um problema computacional muito difcil, que
desempenhar, provavelmente, um papel significativo na
eventual construo de mquinas inteligentes.
Um nmero cada vez maior de resultados de estudos
comportamentais e neurofisiolgicos vem dar suporte
deia de que os seres humanos representam internamente
os objectos tridimensionais na forma de um conjunto
reduzido de imagens bidimensionais. Neste trabalho
apresentamos um esquema para reconhecimento de
objectos 3D a partir de imagens 2D. O esquema proposto
comea por identificar a classe do objecto observado e
s depois procura determinar a sua identidade individual.
Desta forma, diminuem-se os custos computacionais de
uma comparao exaustiva com todos os objectos
conhecidos. Por outro lado, parte do processamento
efectuado na fase de categorizao pode ser reutilizado
na fase de identificao. O sistema desenvolvido no
possui qualquer conhecimento prvio e constri a base de
objectos enquanto vai funcionando.
INTRODUO
Cada objecto tridimensional pode produzir padres de
excitao na retina consideravelmente diferentes,
dependendo da posio do objecto relativamente ao
observador. Apesar disto, somos capazes de perceber que
estes sinais diferentes so produzidos pelo mesmo
objecto. Esta capacidade de reconhecimento constante a
partir de tais sinais de entrada inconstantes -nos
conferida pela capacidade que o nosso crebro possui de
estabelecer representaes internas dos objectos. A
natureza de tais representaes invariveis ao ponto de
vista e a forma como elas podem ser adquiridas ainda
um dos maiores problemas por resolver em neurocincia e
em viso por computador.
Existe um nmero incontvel de estudos
comportamentais com primatas que suportam o modelo
de uma representao dos objectos tridimensionais
baseada em vistas pelo nosso sistema de viso. Se
apresentarmos a um humano um conjunto de vistas de
objectos desconhecidos, o seu tempo de resposta e as
taxas de erro durante o reconhecimento crescem com o
aumento da distncia angular entre o objecto aprendido e
a vista desconhecida [11]. Este efeito diminui se forem
25
Reconhecimento 3D
de escalamento.
r r r r r
X , Y , Z , x , y n os vectores dos
valores X i , Yi , Z i , xi e yi , respectivamente, e
r
n
denotemos 1 = (1,...,1) . Ento, podemos escrever,
Denotemos por
r
r
r
r
r
x = a1 X + a2Y + a3 Z + a4 1,
r
r
r
r
r
y = b1 X + b2Y + b3 Z + b4 1,
(2)
onde
a1 = sr11
a2 = sr12
a3 = sr13
a4 = stx
Ou seja,
b1 = sr21
b2 = sr22
b3 = sr23
b4 = sty
r r r r
r r
x , y span X , Y , Z ,1
( xi , yi )
( X i , Yi , Zi )
( X , Y , Z ) = ( 0, 0, 0 ) ,
i
i =1
( x , y ) = ( 0, 0 ) ,
i =1
( X i , Yi , Zi ) ,1 i n .
caractersticos
(1)
r r
r r
p2 = ( x2 , y2 ) a imagem de O que se obtm aps uma
r r
p3 = ( x3 , y3 ) , obtida por
r
r
r
r
x3 = a1 x1 + a2 y1 + a3 x2 ,
r
r
r
r
y3 = b1 x1 + b2 y1 + b3 x2 ,
(3)
Sob projeco
26
Reconhecimento 3D
(4)
r r
r
r
x = Ma ,
r
r
y = Mb ,
(5)
r
r
x M 0 a
yr = 0 M r
b
r r
min
Pa ' v
r'
(6)
onde P = P P
T
r
r
a = P+v
(7)
CATEGORIZAO
r r
r r
pv
r
D ( P, v ) = r =
v
27
( PP
r
I )v
r
v
(8)
Reconhecimento 3D
r
r
D ( P, v ) = min D ( P, v )
(9)
Cij = ( pi q j )
H ( ) = Cij pi , q (i )
i =1
(10)
IDENTIFICAO
r
r
v = M ib
(11)
r
para um certo vector de transformao b . Ento, pode-se
mostrar sem dificuldade que
r
r
b = Ai a
(12)
r
onde a o vector transformao do prottipo dado por
(7) e Ai
r
D ( P, v ) <
28
Reconhecimento 3D
'
F = M i M iT
r
pela transformao do prottipo a em alinhamento
perfeito com a imagem. De facto, podemos rescrever (11)
sob a forma
r
r
v = M i' a
(13)
IMPLEMENTAO
r
r
a = P + v aplicada aos
transformao do prottipo
'
r r n v
v'= v i
i =1 n
r
onde vi = (xi, yi) um ponto de v e n o nmero de
r
r
pontos em v . Normalizar v ' .
E ( P) =
( PP
i =1 vri =1
r r
I ) vi dvi
(15)
i =1
5 Seja
Determinar
r
d = min D ( Pj , j v ') .
j{ j:Pj P}
6 Se d < , determinar
r
= j : Pj P D ( Pj , j v ') = d
(14)
29
Reconhecimento 3D
0.05
r r
d ' = min min M i Pj+ j v ' v ' ,
6.2 Determinar
{ (
j i j
-0.05
onde j = i : C Pj , M Cl M i M .
6.3 Se d < , determinar
M=
{( j, i ) : P i
j
-0.1
-0.2
{
}
tomar A = {M : i } {M : i A } [ M ]
onde
Aj = {i : ( j , i ) M } e
6.3.3 Se d , fazer
i i A j
[ M i ]iA representa
j
r
A := A { j v '} .
r
A = {M i : i j } { j v '} .
7 Se d
( ( P ')
j
Mi
0.1
0.15
: M i A .
0.05
DISCUSSO
M ' = M i
Cl := Cl ( Pj , M ) ( Pj ', M ') , em
6.3.4 Fazer
-0.05
-0.1
-0.15
REFERNCIAS
RESULTADOS
Para testar a capacidade do sistema reconhecer o mesmo
objectos de vrios pontos de vista, apresentmos-lhe um
conjunto de dez imagens de um modelo 3D de uma casa
(Figura 1) obtidas por rotaes sucessivas em torno do
eixo vertical de 3.6. Desta forma, a primeira e a ltima
imagem apresentadas diferem entre si por uma rotao no
plano horizontal de 36. Todas as imagens foram
reconhecidas como correspondendo a um nico
30
Reconhecimento 3D
0.05
-0.05
Prototype
Object
0.1
-0.1
-0.2
-0.15
-0.1
-0.05
0.05
0.1
0.15
0.05
-0.05
-0.1
-0.15
-0.2
-0.15
-0.1
-0.05
0.05
0.1
31