Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TABLA DE CONTENIDO
INTRODUCCIN
1. ANTECEDENTES
3. OBJETIVOS
4. JUSTIFICACIN
5. MARCO TERICO
28
29
8. METODOLOGA
30
31
32
11. CRONOGRAMA
33
34
13. PRESUPUESTO
35
REFERENCIAS BIBLIOGRFICAS
36
INTRODUCCIN
1. ANTECEDENTES
3. OBJETIVOS
4. JUSTIFICACIN
5. MARCO TERICO
5.1. INTRODUCCIN
La idea de encontrar un modelo de una cmara digital viene del hecho de que cada sistema
de adquisicin de seal realiza una transformacin de las coordenadas de todos los puntos
de una imagen en el mundo real en coordenadas en el plano de la imagen digitalizada en el
computador que la recibe. El modelo presentado a continuacin es el modelo clsico
llamado modelo pin-hole. El modelo de una cmara se puede caracterizar en dos partes[1]:
1. Proyeccin que transforme un punto del espacio 3D en una imagen 2D.
2. Transformacin de la referencia mtrica de la cmara a la referencia de la imagen.
El dibujo de la Figura 1. muestra el modelo geomtrico de una cmara.
Marco de referencia del
plano de la imagen o de
la retina
z
y
y
X
Marco de referencia de
la cmara
Distancia focal
O
(x*, y*, f)
Coordenadas segn el
marco de referencia
del mundo en R3
bu
v
F
Centro de la cmara o
foco
Coordenadas de la
proyeccin del punto B en
el plano imagen (punto b)
con la cmara como marco
de referencia
x
y
z
x*
y*
z*
x
y
z
0
P= 0
1
0
0
1
0 1/ f
0
0
(x,y,z,1)
x ' fx / z
y ' fx / z
z' f
sy '
sz ' = 0
s
0
0
1
0
0
0
1
0 1/ f
0 x
0 y
0 z
0 1
Coordenadas de F: 0 , 0 y 0
v =
w
ku
0
0
0
kv
0
0
0
1 0 0
0 1 0
0 0 1
sx' u 0
sy ' v0
sz ' w
K= 0
0
0
kv
0
x'
su
sv K y '
z'
s
0 u0
0 v0
0 1
u = -ku f
v= kvfy/z
En efecto, el producto de KP es:
x
+ u0
z
+ v0
10
ku
u0 / f
kv u 0 / f
1/ f
0
IC =
0
v
u0
v0
0
0
y
sv
z
v
u = -kuf
v = kvf
uo
vo
Las coordenadas en el plano de la cmara son:
xc =x/z
yc = y/z
zc = 1
La relacin entre las coordenadas de la imagen y las coordenadas de la cmara son:
u=
v=
De forma matricial:
u xc+ u0
vyc+ v0
con
u<0
11
u
xc
v C yc
1
1
C= 0
0
con
u0
v
0
v0
Ic 0
0
0
v
0
u0
v0
1 0 0 0
0 1 0 0
1 0 0 1 0
y
z
r11
r21
r
31
r12
r22
r32
r13
r23
r33
y +
z
r21
=
r
31
0
tx
ty
t
z
Rotacin y Translacin
r12
r22
r32
0
r13
tx
r23 t y R t
=
r33 t z 0 1
0 1
Aqu se observa una transformacin rgida (tres rotaciones y tres translaciones): esos son
los parmetros extrnsecos. La matriz inversa est dada por la siguiente expresin:
R 1
=
0
R 1 t
12
0
0
0
v
u0
v0
r
0 11
r
0 21
r
0 31
0
r12
r22
r13
r23
r32
0
r33
0
t x
u r1 0 r3
ty =
u r2 0 r3
tz
r3
donde los componentes estn dadas por las filas tipo r1= r11
r1
r2
A=
r
3
0
r12
u t x 0t z
v t y v0 t z
tz
r13
tx
ty
tz
sv = m21
s
m
31
m12
m22
m32
m13
m23
m33
m14
m24
m34
Y
Z
X,Y,Z son las coordenadas del punto B del mundo real en el marco de referencia de la mira.
Esta matriz puede ser escrita de forma ms simple:
m1
M= m 2
m
3
r3 = m3
0 = m1. m3
0 = m2 m3
u = -||m1 m3||
v = ||m2 m3||
r 1 1 / u (m 1 0 m 3 )
r2 1 / v ( m2 0 m3 )
t x 1 / u ( m14 0 m34 )
t y 1 / v ( m24 0 m34 )
t z m34
m14
m24
m34
mi =
mi1
mi 2
mi 3
13
Figura 2. Dos conjuntos de puntos coplanares formando parte de una esquina proveen
los puntos requeridos para las entradas de un sistema de calibracin de cmaras digitales.
14
15
16
P3
P2
P1
Cmara
Figura 3. Alineacin entre la imagen del objeto en el mundo real y la imagen adquirida por
la cmara para el mtodo de Luo, Wei y Robert. [25]
Shen y Menq [27] proponen un mtodo basado en las propiedades y el significado fsico de
los parmetros intrnsecos que utiliza tres pasos sin realizar procedimientos no lineales de
optimizacin. Dada la imagen del centro, la matriz rotacional, las matrices de translacin
en los ejes x y y y el factor de escala se pueden obtener analticamente en el primer
estado. Los efectos del factor de escala en la ortonormalidad de la matriz de rotacin
pueden ser revelados desde la formulacin analtica. La distancia focal efectiva, la
translacin z y el coeficiente de distorsin son obtenidos en la segunda etapa. El
desplazamiento del centro de la imagen se estima numricamente en el tercer paso. La
convergencia de la calibracin del centro de la imagen toma slo los pasos dos a tres. A
diferencia de los mtodos de mltiples etapas ya mencionados, el mtodo propuesto por
ellos no requiere un procedimiento de estimacin inicial ni un proceso de minimizacin no
lineal adicionales. La calibracin de los parmetros de la cmara tienen formulaciones
analticas y el coeficiente de distorsin puede ser resuelto en lo que los matemticos llaman
de forma cerrada. La dificultad con este mtodo puede estar en que su algoritmo de
implementacin de tres pasos se desarrollo dentro de un bucle que va obteniendo el valor
del centro de coordenadas y lo evala con una medida de tolerancia y se repite hasta que la
estimacin hecha sea menor a tal nivel de tolerancia, por lo que gasta algn tiempo en esto
y adems el algoritmo corre el riesgo de finalmente no converger, an ms tratndose de
mtodos lineales.
17
18
con su utilizacin en los problemas de visin artificial. Despus de todo, si hacemos una
comparacin entre el ojo y cerebro humanos y un sistema cmara-computador, debemos
esperar que ante las restricciones presentadas por el elemento sensor (la cmara) el
computador sea capaz de hacer aproximaciones y extrapolaciones que le permitan realizar
sus tareas con la informacin captada, tal como hace el cerebro humano en muchsimos
casos. Estas tcnicas de interpretacin y procesamiento de datos digitales provenientes de
los elementos sensores de la visin artificial se han destacado principalmente en la
compresin de imgenes, deteccin de bordes, reconocimiento de caracteres, control de
calidad y deteccin de peligros mediante cmaras y diagnstico mdico visual, entre otros.
En cuanto a la calibracin de cmaras digitales, hay bibliografa interesante que apunta
hacia la solucin de este importante paso de la mayora de aplicaciones en visin artificial.
Sobresalen en este campo los mtodos que utilizan redes neuronales y los que aplican
algoritmos genticos. En cuanto a mtodos que aplican los conceptos de lgica fuzzy o
inteligencia colectiva, no se han observado an aplicaciones en calibracin de cmaras pero
se pueden esperar pronto por la extrapolacin del conocimiento.
Calibracin de cmaras con Algoritmos Genticos [30]
Como ya se toc al principio de la seccin, las tcnicas existentes de calibracin de cmaras
pueden ser ampliamente clasificadas en aproximaciones lineales y aproximaciones no
lineales. La dificultad con los mtodos lineales es su escasa precisin y robustez. La
solucin ideal podra estar en los mtodos no lineales pero stos son costosos
computacionalmente y requieren buenas estimaciones iniciales. Por ejemplo, la clsica
aproximacin fotogramtrica no lineal ([13], [27], [29]) no converge correctamente si las
estimaciones iniciales no estn muy cerca. Por lo tanto, la calidad de una estimacin lineal
es crtica para las aproximaciones no lineales existentes. En la mayora de las situaciones
fotogramtricas, el equipo auxiliar puede proveer estimaciones aproximadas de los
parmetros de la cmara. Por ejemplo, la escala y la distancia son conocidas hasta en un
10% y el ngulo es conocido dentro de 15 grados.
Para los problemas de visin artificial, no obstante, las soluciones aproximadas no son
usualmente conocidas a priori. Como ya vimos, para rodear este problema, una estrategia
comn en la visin artificial es atacar el problema de la calibracin de cmaras usando dos
pasos.
El primer paso que utiliza aproximaciones lineales es clave para el xito de los mtodos de
los dos pasos. La solucin aproximada provista por la tcnica lineal debe ser lo
suficientemente buena para que la subsecuente tcnica no lineal converja correctamente.
Siendo susceptible al ruido en las coordenadas de la imagen, las tcnicas lineales existentes
son, no obstante, notables por su falta de robustez y exactitud. Haralick y otros. [29]
muestran que cuando el nivel de ruido excede un nivel umbral o el nmero de puntos est
por debajo de un nivel umbral, estos mtodos se vuelven extremadamente inestables y los
errores se disparan. El uso de ms puntos puede ayudar a aliviar este problema. No
obstante, la fabricacin de ms puntos de control a menudo es ms dificultoso, costoso y
19
consume mayor tiempo. Para aplicaciones con un nmero limitado de puntos de control,
cerca al mnimo nmero requerido, es cuestionable que los mtodos lineales puedan
proveer consistente y robustamente estimaciones iniciales suficientemente buenas para que
el subsecuente procedimiento no lineal converja correctamente a la solucin ptima.
Otro problema es que casi todas las tcnicas no lineales empleadas en el segundo paso usan
variantes de tcnicas de optimizacin convencional tales como gradiente descendente,
gradiente conjugado o el mtodo de Newton. Todas ellas, por tanto, heredan los bien
conocidos problemas que acosan estos mtodos, nominalmente, como peor convergencia y
susceptibilidad para ser atrapados en un extremo local. Si el punto de inicio del algoritmo
no es bien escogido, la solucin puede divergir o quedar atrapada en un mnimo local. Esto
es especialmente cierto si la curva de la funcin objetivo contiene valles aislados. La
funcin objetivo para la calibracin de cmaras involucra 11 parmetros y conduce a una
superficie de error compleja con el mnimo global deseado escondido entre numerosos
extremos locales finitos. Consecuentemente, el riesgo de optimizacin local ms que
optimizacin local puede ser severo para mtodos convencionales.
Para aliviar los problemas con las tcnicas de calibracin existentes, Ji y Zhang [30]
exploraron un paradigma alternativo basado en Algoritmos Genticos (GAs) para los
mtodos de optimizacin convencionales no lineales. Los Algoritmos Genticos (GAs)
fueron diseados para buscar eficientemente en espacios grandes, no lineales y pobremente
entendidos y han sido ampliamente aplicados para resolver bsquedas dificultosas y
problemas de optimizacin que incluyen calibracin de cmaras, calibracin
espectromtrica y calibracin de modelos e instrumentos. Los Algoritmos Genticos tienen
caractersticas atractivas para los problemas de calibracin de cmaras porque ellos no
requieren modelos especficos o linealidades como en las aproximaciones clsicas y pueden
explorar todas las partes del espacio de los parmetros (probablemente incierto).
Comparado con los mtodos de optimizacin no lineales convencionales, los Algoritmos
Genticos ofrecen las siguientes ventajas claves:
1. Autonoma: los algoritmos genticos no requieren estimaciones iniciales. El conjunto
de parmetros iniciales es generado aleatoriamente en el dominio de parmetros ya
predefinido.
2. Robustez: conceptualmente, los Algoritmos Genticos trabajan con unas poblaciones
ricas y simultneamente suben muchos picos en paralelo durante el proceso de bsqueda.
Esto reduce significativamente la probabilidad de quedar atrapado en un mnimo local.
3. Inmunidad al ruido: los algoritmos genticos buscan un conjunto de parmetros
adecuados y se mueven hacia el ptimo global por la reduccin gradual la posibilidad de
reproducirse de los conjuntos de parmetros no adecuados (o con mal fitness). Esto adems
tiene un potencial de alta exactitud en situaciones de ruido.
Los resultados de este estudio son estimulantes y prometedores. El algoritmo gentico
propuesto puede converger rpidamente a la solucin correcta sin estimaciones iniciales y
20
con el mnimo nmero de puntos. Los autores creen que este estudio es significativo para
la visin artificial y la fotogrametra porque:
La tcnica propuesta no requiere buenas estimaciones iniciales de los parmetros de la
cmara.
La tcnica propuesta es robusta y exacta an con el nmero mnimo de puntos de control en
las situaciones de ruido.
Los Algoritmos Genticos son estocsticos, algoritmos de bsqueda paralelos basados en el
mecanismo natural de seleccin natural y el proceso de evolucin. Los algoritmos
genticos fueron diseados para buscar eficientemente en espacios no lineales y grandes
donde el conocimiento experto es inexacto o difcil de codificar, y donde las tcnicas
tradicionales de optimizacin fallan. Los algoritmos genticos ejecutan una bsqueda
multidireccional manteniendo una poblacin de soluciones potenciales y fomenta la
formacin de conocimiento e intercambia estas soluciones. Una poblacin es modificada
por la aplicacin probabilstica de los operadores genticos desde una generacin hasta la
siguiente. Las tres operaciones bsicas en los Algoritmos Genticos son 1) Evaluacin, 2)
seleccin; y 3) recombinacin, como se muestra en la figura 4. La evaluacin de cada
cadena, la cual codifica una solucin candidata, est basada en una funcin aptitud. Esto
corresponde a la determinacin ambiental de supervivencia en la seleccin natural. La
seleccin est hecha con base en la aptitud relativa y en ella se desecha probabilsticamente
las soluciones que tienen una aptitud relativamente baja. Las dos soluciones candidatas (pi
y pj) con alta aptitud son entonces escogidas para reproducirse.
La seleccin sirve para enfocar la bsqueda dentro de reas de alta aptitud. Por supuesto, si
la seleccin fuera el nico operador gentico, la poblacin no podra tener nunca otros
individuos aparte de los introducidos en la poblacin inicial. La nueva poblacin es
generada por la perturbacin de la solucin actual va recombinacin. La recombinacin, la
cual consiste de mutacin y cruzamiento, imita la reproduccin sexual. El cruzamiento es
un operador estocstico ya estructurado que permite el intercambio de informacin entre
soluciones candidatas. La forma ms simple de ejecutar un cruzamiento es escoger
randmicamente algn punto de cruce y todo aquello que est antes del punto de copia en
un primer padre y luego, todo lo que est despus del punto de cruce del segundo padre tal
como muestra la figura 4.
21
Seleccin
f(p1)=15%
p1
Poblacin
f(p2)=30%
pi
f(p3)=55%
pi
Fitness(f)
p2
Puntos cruce
Padres
ci
Hijos
pj
cj
Recombinacin
Evaluacin
cnew = pi + pj
donde,
pi y pj son los padres de la ltima iteracin o generacin
cnew
y
pi
pj.
Los alelos para las tcnicas computacionales son como una forma alternativa de un gen que
puede existir en una simple posicin de gen.
Despus de un cruzamiento, sigue la mutacin. Esto es para prevenir cadas de todas las
soluciones en poblaciones dentro de un ptimo local de la solucin del problema. El
operador mutacin introduce una nueva estructura gentica en la poblacin por el cambio
randmico de sus bloques constructores, ayudando a que el algoritmo escape de las
trampas de mnimos locales. Es claro, que el cruce y la mutacin constituyen la parte ms
importante de los algoritmos genticos. La eficiencia es influenciada principalmente por
estos dos operadores. En [30]-[32] se puede encontrar ms informacin sobre algoritmos
genticos, mutaciones y cruzamientos.
22
El Algoritmo Gentico puede evitar los mnimos locales sin necesidad de hacer
buenas estimaciones iniciales.
23
calibracin no mejora la exactitud del algoritmo. An ms, el mtodo tiene una alta
capacidad de inmunizacin contra las perturbaciones de la imagen.
En conclusin, se obtuvo una mejora importante al mtodo de Tsai tanto en exactitud y
robustez como en rapidez, porque el algoritmo gentico al no necesitar buenas estimaciones
iniciales y al ser protegido contra el estancamiento en mnimos locales, converge
rpidamente a la solucin final.
Calibracin de cmaras digitales con redes neuronales
Se debe tener en cuenta que las tcnicas basadas en modelos explcitos de sistemas de
visin fsica tienen un par de desventajas prcticas: 1. Las caractersticas pticas de las
cmaras son diferentes entre uno y otro mtodo que es probado para ser efectivo en un
sistema pero puede ser ineficiente para otros. Por ejemplo, ya se report que el mtodo de
Tsai puede ser peor que cualquier mtodo lineal simple si la distorsin de la lente es
relativamente baja [34]. 2. Prcticamente ningn modelo es capaz de describir un sistema
de visin perfectamente. Para obtener resultados exactos se requieren elaborados modelos y
elaborados con ecuaciones matemticas ms complicadas.
Estimulados por el reto de resolver estos problemas algunos investigadores han propuestas
tcnicas que involucren redes neuronales para la calibracin de cmaras digitales. Wen [35]
propone utilizar una red neuronal para describir la parte que permanece fuera del modelo
convencional de la proyeccin explcita. Las redes neuronales pueden ser vistas como otra
forma efectiva para la calibracin de cmaras en sistemas de visin artificial.
Segn Yongtae Do [36], las redes neuronales tienen varias caractersticas significativas para
la calibracin de cmaras. Primero, una red est hecha por una interconexin de neuronas
no lineales. Adems, la red neuronal tiene el potencial de aprender procesamiento de
imgenes no lineal. Segundo, la filosofa bsica detrs del aprendizaje supervisado de las
redes neuronales y de la calibracin de cmaras es similar. Tercero, usar una red neuronal
puede ser considerado como una solucin libre de modelo para el problema, lo cual est en
concordancia con las tcnicas de calibracin implcita.
Es bien conocido que una red neuronal multietapas puede aproximar cualquier funcin
continua a un deseado grado de exactitud [37]. Si consideramos la proyeccin y la
proyeccin hacia atrs como el mapeo entre el mundo y la imagen, la funcin identificada
por el mapeo puede ser aproximada sin complicados modelamientos matemticos.
Las redes neuronales tambin han sido usadas para resolver problemas de visin artificial
[40] tales como aplicaciones en estereosttica, estreo movilidad lateral y longitudinal,
computacin de flujo ptico y restauracin de imagen. La calibracin de cmaras con redes
neuronales es adems tratada en la literatura internacional ([41], [42], [43]).
24
Ahmed, Hemayed y Farag [45] presentan una propuesta de neurocalibracin basados en las
siguientes motivaciones:
Al igual que en las investigaciones con algoritmos genticos una motivacin para
adentrarse en el campo es que los mtodos no lineales tradicionales de calibracin
de cmaras requieren comenzar con una buena estimacin inicial de la solucin del
problema [19],[20],[44], mientras que con redes neuronales esa condicin se vuelve
menos exigente.
As mismo, usar un marco de trabajo basado en redes neuronales .permite hacer
aplicaciones de calibracin de cmaras sobre lentes activos automatizados [46].
Las tcnicas de redes neuronales apuntan en la actualidad a dos estilos de utilizacin:
1. Unas intentan aprender el mapeo desde el mundo 3D hasta la imagen 2D sin especificar
el modelo de la cmara [42].
2. Otras aplican las redes neuronales como un estado adicional para mejorar la eficiencia de
otras tcnicas ya existentes que se implementaran previamente [41], [43].
Los investigadores egipcios Ahmed, Hemayed y Farag, han trabajado intentando superar
estos dos estilos porque conocer los parmetros del modelo de la cmara entrega
informacin muy importante a las tareas de la visin artificial posteriores a la calibracin de
cmaras. Ellos presentaron una tcnica que va ms all de los mtodos existentes porque
implementaron una red neuronal que especifica los parmetros intrnsecos y extrnsecos
de la cmara. Para eso, ellos presentan un modelo de la cmara que considera la proyeccin
perspectiva basado en el clsico modelo pinhole.
De esta manera recordamos que si un punto D tiene coordenadas (X,Y,Z) en el mundo real y
se proyecta en un punto p cuyas coordenadas son (u,v), la operacin puede ser descrita en
coordenadas homogneas por la ecuacin:
su
sv = M
s
donde
m1
M= m 2
m
3
Y
Z
m14
m24
m34
25
u 0 u0 1 0 0 0
donde I c 0 v v0 0 1 0 0
0 0 1 0 0 1 0
= 0 1
E 1 i
u i
i 1 m 3 Di m34
m D m 24
2 i
vi
m 3 Di m34
La red neuronal propuesta no slo busca el mapeo de los puntos 3D a los pxeles 2D lo cual
minimiza el error E sino que tambin extrae la matriz de proyeccin y los parmetros de la
cmara. La red es una red neuronal feedforward de dos capas. La capa de entrada tiene
tres neuronas ms una fijada en 1. Estos son los tres correspondientes coordenadas X,Y,Z
del punto 3D. El nmero de unidades de salida es tres y la capa oculta consiste de cuatro
neuronas. La capa oculta y la capa de salida tienen funcin de activacin unitaria. La
matriz de pesos de la capa oculta se denota como V, y se asume que corresponde a los
parmetros extrnsecos de la matriz A. La matriz de pesos de la capa de salida es denotada
W y corresponde a los parmetros intrnsecos de la matriz Ic. Para cualquier patrn de
entrada i, N i 1, el vector de entrada est formado por Zi=(Xi,Yi,Zi,1)T y las salidas son
oik, con k = 1,2,3. con una nueva interpretacin del criterio de error E, la medida del error
podra tomarse como
o i1
u i
i 1 oi 3
oi 2
vi
oi 3
Esta ltima ecuacin no est en una forma manejable como para ser usada por una red
neuronal de gradiente descendente y error-manejado debido a la presencia de las dos
razones en trminos de las salidas de la red. Para resolver este problema, los investigadores
se inclinan a entrenar la red de tal manera que el valor deseado de oi3 sea 1 para eliminar las
26
fracciones.
mantengan tal igualdad para todo dato Di, resultando en la no convergencia de la red. Una
mejor solucin es entrenar la red dejando que el producto o i3 se aproxime a 1, de tal
manera que E se escribe
N
E ioi1 u i i oi 2 vi i oi 3 1
2
i 1
Cada patrn de entrada tendr su propio i. La pregunta ahora es qu valor debe tomar.
Inicialmente se coloca en 1 para todo i y luego se permite actualizarlo de acuerdo a las
reglas del gradiente descendente para minimizar el error E en la ltima ecuacin. Basado
en esto, el vector deseado para cada patrn (ui,vi,1)T es nombrado como di . Haciendo que
Oi = i oi, la dinmica de la red sigue las siguiente ecuaciones. Dado el patrn de entrada
Zi, la neurona j de la capa oculta produce la salida:
4
Y j V jl Z il
l 1
O ik i Wkj Y j
j 1
1 N
d ik O ik 2
2 i 1
En la anterior ecuacin dik denota la k-sima componente del vector deseado di. Los pesos
de la red Wkj y Vij son inicializados en valores randmicos de -1 a 1. Ya que la cuarta
neurona de la capa de salida es fijada en 1, los correspondientes pesos para la capa de salida
seran Vl4, con l = 1,2,3 y V44 = 1. La red es entrenada con el algoritmo de backpropagation actualizando los pesos Wkj , Vij y i de acuerdo a las siguientes reglas de
gradiente descendente:
Wkj 1 (d ik Oik ) i Y j
3
27
k 1
j 1
i 2 (d ik Oik ) Wkj Y j
donde 1 y 2 son dos constantes de aprendizaje positivas. Para el caso del aprendizaje de
la red, la entrada y los patrones deseados de la red son normalizados. Por lo tanto los dos
conjuntos, las coordenadas 2D de los pxeles y las coordenadas 3D de los puntos del mundo
real, son normalizados por s1 y s2, respectivamente. Despus del entrenamiento, la tan
anhelada matriz de proyeccin M puede igualarse a:
M = S1 W V S2
Donde S1 = diag(s1, s1,1) y S2 = diag( s 21 , s 21 , s 21 ,1)
Con estos dos ltimos mtodos de calibracin de cmaras que utilizan tcnicas de visin
artificial se demuestra que el marco conceptual para la realizacin de este proyecto se
encuentra suficientemente bien sustentado adems de que resalta la importancia de la
implementacin de un mtodo que aplique tales conceptos al tratarse de tecnologa de alto
impacto innovador especialmente en Iberoamrica.
28
29
30
8. METODOLOGA
31
32
INTRODUCCIN GENERAL
1. ESTADO DEL ARTE
INTRODUCCIN
1.1. Modelacin de cmaras
1.2. Calibracin
1.3. Patrones de calibracin
1.4. Tcnicas de modelacin neuronales.
CONCLUSIONES
2. DESCRIPCIN DE LOS MODELOS DE CALIBRACIN A IMPLEMENTAR
INTRODUCCIN
2.1. Descripcin de las cmaras digitales
2.2. Mtodos de modelamiento
2.3. Mtodos lineales
2.4. Mtodos no lineales
2.5. Mtodo Implementado con redes neuronales
CONCLUSIONES
3. DESCRIPCIN DE LA HERRAMIENTA COMPUTACIONAL DESARROLLADA
4. RESULTADOS
INTRODUCCIN
4.1. Especificacin de las cmaras
4.2. Tratamiento de las imgenes
4.3. Patrones de calibracin
4.4. Resultados y Anlisis comparativo de precisin
CONCLUSIONES
5. CONCLUSIONES GENERALES
6. PERSPECTIVAS DE TRABAJO
7. REFERENCIAS BIBLIOGRFICAS
ANEXOS:
Manual del usuario
Teoremas matemticos
Cdigo fuente
33
11. CRONOGRAMA
LISTA DE ACTIVIDADES
1. RECOPILACIN BIBLIOGRFICA
2. IMPLEMENTACIN Y PRUEBA DE ALGORITMOS CLSICOS
3. DEFINICIN DE LA PROPUESTA DEL MTODO DE CALIBRACIN
4. IMPLEMENTACIN Y PRUEBA DEL MTODO
5. MEDICIN COMPARATIVA DE EFICIENCIA DEL NUEVO MTODO
6. OPTIMIZACIN DEL SISTEMA Y PRUEBAS FINALES
7. ELABORACIN DE MANUALES
8. ELABORACIN INFORME FINAL
Tabla esquemtica del Cronograma
Actividad
S E M A N A S
MES 1
1
1
2
3
4
5
6
7
8
MES 2
4
MES 3
8
10
11
MES 4
12
13
14
15
MES 5
16
17
18
19
MES 6
20
21
22
23
MES 7
24
25
26
27
MES 8
28
29
30
31
32
34
En Colombia ser muy importante realizar una divulgacin de los resultados obtenidos
especialmente en universidades y en los congresos de electrnica que se tengan previstos
para los prximos aos; en especial en el Simposio de Tratamiento de Seales, Imgenes y
Visin artificial organizado por la Sociedad Colombiana de Tratamiento de Seales. La
exposicin de esta investigacin podra realizarse en el marco de un seminario de pregrado
o postgrado de la escuela de Ingeniera Elctrica y Electrnica de la Universidad del Valle.
Los avances de la tesis se irn presentando en sesiones programadas al grupo de Percepcin
y Sistemas Inteligentes.
Tambin se prev, escribir un artculo para ser publicado en la revista Energa y
Computacin y se espera proponer otro a un congreso a nivel internacional.
As mismo, como parte del proceso de divulgacin es necesario habilitar un espacio en el
Internet para publicar los aspectos bsicos de la investigacin de tal manera que est
disponible en cualquier parte del mundo, especialmente en Latinoamrica.
35
13. PRESUPUESTO
APORTANTES
RUBROS
Personal
Directores
Estudiante
Equipo
PC Pentium IV
Osciloscopio
Digital 100MHz
Acceso a
Internet
Otros
Materiales
Cmara digital
Tarjeta de
adquisicin
Software
MATLAB 6.0
(Toolboxes y
Blocksets
usados en el
proyecto)
Microsoft
Windows
Paquete
completo
Bibliografa
Viajes (Congreso)
Publicaciones
TOTAL
TOTAL
ESTUDIANTE UNIVERSIDAD
DEL VALLE
8.400.000
7.560.000
1.800.000
1.800.000
3.000.000
15.960.000
3.600.000
3.000.000
300.000
700.000
1.000.000
200.000
200.000
400.000
700.000
400.000
400.000
700.000
9.100.000
300.000
200.000
700.000
50.000
11.310.000
9.100.000
300.000
500.000
24.600
700.000
700.000
50.000
36.110.000
36
REFERENCIAS BIBLIOGRFICAS
Hermes. 2a.
[2] Azar A., Mus P. Calibracin monocular de cmaras. Instituto de Ingeniera Elctrica,
Facultad de Ingeniera. Universidad de la Repblica. Uruguay. 1999
[3] C. Gonzlez, P.E. Woods, Digital Image Processing Third Edition. Addison-Wesley,
1993
[4] A Flexible New Technique for Camera Calibration Zhengyou Zhang
http://research.microsoft.com/zhang
[5] E. R. Davies Machine Vision: Theory, Algorithms, Practicalities.. Academic Press.
Hartcourt Brace et Company Publishers. 1992
[6] S. W. Shih, Y. P. Hung, and W. S. Lin, Accurate linear technique for camera calibration
considering lens distortion by solving an eigenvalue problem, Opt. Eng., vol. 32, no. 1, pp.
138149, 1993. S. A.
[7] Y. I. Abdel-Aziz and H. M. Karara, Direct linear transformation into object space
coordinates in close-range photogrammetry, in Proc. Symp. on Close-Range
Photogrammetry, Urbana, IL, Jan. 1971, pp. 118.
[8] D. C. Brown, Close-range camera calibration, Photogramm. Eng. Remote Sens., vol.
37, pp. 855866, 1971.
[9] K. W. Wong, Mathematical formulation and digital analysis in closerange
photogrammetry, Photogramm. Eng. Remote Sens., vol. 41, no. 11, pp. 13551373, 1975.
[10] W. Faig, Calibration of close-range photogrammetry systems: Mathematical
formulation, Photogramm. Eng. Remote Sens., vol. 41, pp. 14791486, 1975.
[11] D. B. Gennery, Stereo-camera calibration, in Proc. Image Understanding Workshop,
Menlo Park, CA, 1979, pp. 101108.
[12] A. Okamoto, Orientation and construction of modelsPart i: The orientation problem
in close-range photogrammetry, Photogramm. Eng. Remote Sens., vol. 5, pp. 14371454,
1981.
[13] American Society of Photogrammetry, Manual of Photogrammetry, 4th ed., 1980.
37
38
[27] Tzung-Sz Shen and Chia-Hsiang Menq Automatic Camera Calibration for a MultipleSensor Integrated Coordinate Measurement System. IEEE Transactions On Robotics And
Automation, Vol. 17, No. 4, Agosto 2001
[28] Slama, C. C. Manual of photogrammetry American society of Photogrammetry.
Falls Church, VA. 1980
[29] P. R. Wolf, Elements of Photogrammetry. New York: McGraw-Hill, 1974.
[29] R. M. Haralick, H. Joo, C. Lee, X. Zhang, V. Vaidya, and M. Kim, Pose estimation
from corresponding point data, IEEE Trans. Syst., Man, Cybern., vol. 19, pp. 14261446,
June 1989.
[30] Q. Ji, Y. Zhang. Camera Calibration with Genetic Algorithms. IEEE Transactions On
Systems, Man, And CyberneticsPart A: Systems And Humans, Vol. 31, No. 2, March
2001
[31] W. M. Spears, Crossover or mutation, in Proc. Foundations Genetic Algorithms
Workshop, 1992, pp. 221237.
[32] M. Mitchell, An Introduction to Genetic Algorithms. Cambridge, MA: MIT Press,
1996.
[33] Z. Michalewicz, Genetic Algorithms+Data Structure=Evolution Programs. New York:
Springer-Verlag, 1992.
[34] S.-W.Shih, Y.-P.Hung, and W.-S.Lin, When should consider lens distortion in camera
calibration, Pattern Recognition, Vol.28, No.3, pp.447-461, 1995.
[35] J.Wen and G.Schweitzer, "Hybrid calibration of CCD cameras using artificial neural
nets," Int. Joint Conf. Neural Networks, pp.337-342, 1991.
[36] Y. Do, Application of Neural Networks for Stereo-Camera Calibration School of
Computer and Communication Engineering, Taegu University, Kyungsan-City,
Kyungpook, 712-714, Korea
[37] K.-I.Funahashi, "On the approximate realization of continuous mapping by neural
networks," Neural Networks, Vol.2, pp.183-192, 1989.
[38] Y.Do, S.-H.Yoo, and D.-S.Lee, Direct calibration methodology for stereo cameras,
SPIE Conf. Vol. 3521: Machine vision systems for inspection and metrology VII pp.54-65,
1998.
39
[39] A.Cichocki and R.Unbehauen, Simplified neural networks for solving linear least
squares and total least squares problems in real time, IEEE Trans. Neural Networks, Vol.5,
No.6, pp.910-923, 1994.
[40] Y. Zhou and R. Chellappa, Artificial neural networks for computer vision", SpringerVerlag, 1992.
[41] J. Wen and G. Schweitzer, Hybrid calibration of CCD cameras using artificial neural
nets," Proc. Int Joint Conf. Neural Networks (New York), Vol. 1, Nov. 1991.
[42] M. Lynch and C. Dagli, Backpropagation neural net-work for stereoscopic vision
calibration," Proc. SPIE. Int. Soc. Opt. Eng., Vol. 1615, Nov. 1991.
[43] D. Choi, S. Oh, H. Chang and K. Kim, Nonlinear camera calibration using neural
networks," Neural, parallel and scientific computations, Vol. 2, No. 1, March 1994.
[44] Mengxiang Li and Jean-Marc Lavest, Some aspects of zoom lens camera calibration"
IEEE Trans. Patt. Anal. and Machine Intell., Vol. 18, Nov. 1996.
[45] Moumen T. Ahmed, ElSayed E. Hemayed and Aly A. Farag. Neurocalibration: A
Neural Network That Can Tell Camera Calibration Parameters IEEE Trans. Patt. Anal.
And Machine Intell. 1999
[46] R. G. Willson, Modeling and calibration of auto- mated zoom lenses", PhD
dissertation, Dept. Elect. Comp. Eng., Carnegie Mellon Univ., 1994.
[47] Y. Zhou and R. Chellappa, Artificial neural networks for computer vision", SpringerVerlag, 1992.
[48] T. Pajdla, T.Werner, V. Hlavac, Correcting radial lens distortion without knowledge of
3D structure Technical Report, Machine Perception Center, Czech Technical University,
Dec. 1997.
[49] M. Ahmed, A. Farag. A neural optimizacin framework for zoom lens camera
calibration CVIP Lab, ECE Dept. University of Louisville. 1999.
[50] H. Ballard, C.M. Brown, Computer Vision Prentice Hall Inc., 1992
[51] Sing-Tzo Bou, Pattern recognition and Image prepocessing, Dekker. 1985
[52] CROWLEY, J.L., Bobet, P. and Scmid, C. Auto-calibration by direct observation of
objects. Image Vision Comput. V. 11, No. 2, pg. 67-81. 1993
40
[53] Cumani, A. and Guiducci, A. Geometric Camera Calibration the virtual camera
approach Machine Vision and Applications, vol 8, No. 6. pg. 375-384. 1995
[54] O. Duda, P. E. Hart, Pattern recognition and Scene Analysis John Willey. 1973
[55] R.C. Gonzlez y C.S.G. Lee, Robtica, Mc Graw Hill. 1990
[56] Haralick, R. M. Determining camera parameters from the perspective projection of a
rectangle. Pattern Recognition. V. 22. pg. 225-230. 1989
[57] Berthold Klaus P. Horn, Robot Vision MIT Press, 1986
[58] Lenz R.K.,RY. Tsai. Techniques for calibration of the scale factor and image center
for high accuracy 3D machine vision metrology IEEE Transaction on PAMI. Vol. 10. No.
5. September. 1988.
[59] Maravall, Reconocimiento de formas y visin artificial, Rama. 1993.
[60] ROBERT, L. Camera calibration without feature extraction Computer Vision Image
Understanding. Vol. 63,No. 2, pg. 314-325.
[61] Slama, C. C. Manual of photogrammetry American society of Photogrammetry.
Falls Church, VA. 1980
[62] T. Tou, R. C. Gonzlez, Pattern Recognition Principles, Addison-Wesley.1981
[63] Zhang, Z. Motion and structure of four points from one motion of a stereo rig with
unknown extrinsic parameters IEEE. Transaction on Pattern Anal. Mach. Intell. Vol 17,
No. 12, pg. 1222-1227. 1995.
[64] B. Caprile and V. Torre, Using vanishing points for camera calibration International
Journal of Computer vision, vol. 4, pp. 12740, 1990.
.
[65] E. Guillou, D. Meneveaux, E. Maisel, and K. Bouatouch, Using vanishing points for
camera calibration and coarse 3D reconstruction from a single image Visual Computer,
vol. 16, no. 7, pp. 396 410, 2000.