Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCIN:
La superficie de imagen de una cmara generalmente es un rectngulo, sin embargo la forma de la retina
humana es ms cercana a una superficie esfrica, y las cmaras panormicas pueden equiparse con retinas
cilndricas. Los sensores de imgenes tienen otra caracterstica. Pueden grabar una fotografa espacialmente
discreta (como nuestros ojos con sus bastones y conos, cmaras de pelcula, o pixeles)
, o continua (en el caso
de los viejos tubos de rayos catdicos en las antiguas televisiones, por ejemplo)
. La seal que registra un
sensor de imgenes en un punto de su retina puede por si misma ser discreta o continua, y puede constar de un
slo nmero (como en una cmara a blanco y negro)
, unos pocos valores (por ejemplo las intensidades RGB
en una cmara a color, o las respuestas de los tres tipos de conos en el ojo humano)
, muchos nmeros (por
ejemplo las respuestas de los sensores hiperespectrales)
, o an una funcin contnua de longitud de onda (el
cual es esencialmente el caso de los espectrmetros)
.
Estas propiedades son fciles de probar geomtricamente. Sin embargo, algunas veces es ms conveniente
razonar en trminos de marcos de referencia, coordenadas y ecuaciones. Considere, por ejemplo, un sistema de
coordenadas (O, i, j, k)
, asociado a una cmara de agujero de alfiler, cuyo origen O coincide con el agujero de
alfiler, y los vectores i y j forman una base para un plano vectorial paralelo al plano de la imagen , colocado a
su vez a una distancia positiva d del agujero de alfiler a lo largo del vector k. La lnea imaginaria, perpendicular
a que pasa por el agujero de alfiler es llamada el eje ptico, y el punto c en el cual intersecta a es llamado el
centro de la
ima
gen. Este punto puede ser utilizado como el origen de un marco de coordenadas asociado a un
plano de la imagen, y juega un rol importante en los procedimientos de calibracin de cmaras.
Sea P un punto en la escena con coordenadas (X, Y, Z)
y p su imagen con coordenadas (x, y, z)
1. Como p yace
en el plano de la imagen, tenemos que z = d. Como los tres puntos P, O y p son colineales (yacen en la misma
lnea)
, tenemos que Op = OP para algn nmero , as que
{
x = X
y= Y , (1)
z= Z
y por lo tanto
{
X
x =d
Z. (2)
Y
y=d
Z
1 Las letras maysculas denotan puntos en el espacio 3D, mientras que las letras minsculas denotan sus proyecciones en
el plano de la imagen.
1.1.2. Perspectiva Dbil
Como se mostr en la seccin anterior, la perspectiva de agujero de alfiler es slo una aproximacin de la
geometra del proceso de captura de la imagen. Una aproximacin mas burda es la perspectiva dbil, la cual
es til en algunas ocasiones.
Considere el plano frontal paralelo 0, definido por Z = Z0. Para cualquier punto P en 0 es posible re-escribir
la ecuacin (2)
como
x =m X , donde m= d
{y =mY , Z0
(3)
Las restricciones fsicas forzan a que Z0 sea negativa (el plano debe estar frente al agujero de alfiler)
, de
manera que la magnificacin m asociada con el plano 0 sea positiva. Este nombre est justificado por la
siguiente observacin: considere dos puntos P y Q en 0 y sus imgenes p y q;
obviamente los vectores PQ y
pq son paralelos, y tenemos que ||pq|| = m||PQ||. Esta es la dependencia del tamao de la imagen sobre la
distancia que notamos anteriormente.
Cuando el relieve de una escena es pequeo en relacin con su distancia media de la cmara, el aumento
puede ser considerado constante. Este modelo de proyeccin es llamado perspectiva dbil, u ortografa
escalada.
Cuando se conoce de antemano que la cmara siempre estar a una distancia aproximadamente constante de
la escena, podemos llegar ms lejos y normalizar las coordenadas de la imagen de tal manera que m = 1. Esta
es la proyeccin ortogrfica
, definida por
{xy=Y
=X (4)
con los rayos paralelos al eje k y ortogonales al plano de la imagen . Aunque la proyeccin de perspectiva
dbil es un modelo aceptable para muchas condiciones de captura, usualmente no es realista asumir una pura
proyeccin ortogrfica.
Si ignoramos la difraccin, las interferencias y otros fenmenos pticos, el comportamiento de los lentes est
dictado por las leyes de la ptica geomtrica: (1)
la luz viaja en lneas rectas (rayos de luz)
en medios
homogneos;
(2)
cuando un rayo es reflejado por una superficie, este rayo, su refleccin, y la superficie
normal son coplanares, y los ngulos entre la normal y los dos rayos son complementarios;
y (3)
cuando un
rayo pasa de un medio a otro, ste es refractado (su direccin cambia)
. De acuerdo con la ley de Snell, si r1 es
el rayo incidente en la interface entre dos materiales transparentes con ndices de refraccin n1 y n2 , y r2 es un
rayo refractado, entonces r1, r2 y la lnea normal a la interface son coplanares, y los ngulos 1 y 2 entre la
normal y ambos rayos estn relacionados por
Considere un punto P localizado a una profundidad (negativa)
Z del eje ptico, y denotado por (PO)
el rayo
que pasa a travez de este punto y el centro O de la lente. Es fcil seguir, a partir de la forma paraxial de la ley
de Snell, que (PO)
no es refractado, y que todos los dems rayos que pasan a travez de P estn enfocados por
la delgada lente sobre el punto p con profundidad z a lo largo de (PO)
tal que
1 1 1
= , (6)
z Z f
R
donde f = es la longitud focal de la lente.
2 (n1)
Note que las ecuaciones que relacionan las posiciones de P y p son exactamente las mismas que en la
proyeccin perspectiva de agujero de alfiler si tomamos d = z, ya que P y p yacen sobre un rayo que pasa a
travs del centro de la lente. Sin embargo, los puntos localizados a una distancia -Z de O estarn en un
enfoque ntido slo cuando el plano de la imagen est localizado a una distancia z de O al otro lado de la lente
que satisface la Eq. 6, la ecuacin de lente delgado. Si hacemos que Z = -, podemos ver que f es la distancia
entre el centro de la lente y el plano donde se enfocan los objetos tales como estrellas (que efectivamente
estn localizados en Z = -)
. Los dos puntos F y F' localizados a una distancia f del centro de la lente sobre el
eje ptico son llamados los puntos focales de la lente. En la prctica, los objetos dentro de algn rango de
distancias (llamado profundidad de campo o profundidad de enfoque)
tendrn un enfoque aceptable. La
profundidad de campo aumenta con el nmero f de las lentes: la razn entre la longitud focal de las lentes y su
dimetro.
Note que el campo de vista de una cmara (la porcin del espacio de la escena que en realidad se proyecta en
la retina de la cmara, no est definida solamente por la longitud focal, sino que tambin depende del rea de
la retina (el rea de la pelcula que puede ser expuesta en una cmara fotogrfica, o el rea del sensor en una
cmara digital)
.
Un modelo ms realista de un sistema ptico simple es el de lentes gruesas. Las ecuaciones que describen su
comportamiento son fcilmente derivables a partir de las ecuaciones de refraccin paraxial, y son las mismas
que las de perspectiva de agujero de alfiler y de lentes delgados, excepto por una compensacin. Si H y H'
denotan los puntos principales de la lente, entonces la Ecn. 6 se mantiene cuando - Z (y respectivamente z)
es
la distancia entre P (y respectivamente p)
y el plano perpendicular al eje ptico que pasa a travs de H (y
respectivamente H')
. En este caso, el nico rayo que no se desva es el que va a lo largo del eje ptico.
Las lentes simples experimentan cierto nmero de aberraciones. Para entender por qu, recordemos que el
modelo de refraccin paraxial slo es una aproximacin, vlida cuando el ngulo entre cada rayo a lo largo
de la trayectoria ptica y el eje ptico de la longitud es pequeo y se cumple que sin( ) . Esto
corresponde a la expansin de Taylor de primer orden de la funcin seno. Para ngulos mayores, se obtiene
una mejor aproximacin utilizando trminos adicionales, y es fcil mostrar que los rayos que chocan con la
interface ms all del eje ptico se enfocan ms cerca de la interface. El mismo fenmeno ocurre para una
lente, y esta es la fuente de dos tipos de a
berra
ciones esfrica
s: Considere un punto P en el eje ptico y su
imagen paraxial p. La distancia entre p y la interseccin del eje ptico con el rayo proveniente de P y
refractado por la lente es llamada la aberracin esfrica longitudinal de tal rayo. Note que si un plano de la
imagen fuera colocado en P, el rayo intersectara este plano a cierta distancia del eje, llamada la aberracin
esfrica transversa de tal rayo. Todos los rayos que pasan a travs de P y que son refractados por la lente
forman un crculo de confusin centrado en P conforme intersecta a . El crculo con dimetro mnimo es
llamado el crculo de menor confusin, y su centro en general no coincide con p.
Adems de la aberracin esfrica, existen otros cuatro tipos de a
berra
ciones prima
ria
s causadas por las
diferencias entre las pticas de primer y tercer orden, llamadas coma
, a
stigma
tismo, curva
tura
de ca
mpo, y
distorsin. De manera similar que las aberraciones esfricas, las tres primeras degradan la imagen al hacerla
borrosa en cada uno de sus puntos. La distorsin, por otro lado, juega un rol diferente y cambia la forma de la
imagen como un todo. Este efecto se debe al hecho de que diferentes reas de una lente tienen longitudes
focales ligeramente diferentes. Las aberraciones mencionadas anteriormente son monocromticas
(independientes de la respuesta de la lente a diferentes longitudes de onda, y se sigue de las ecuaciones de
lentes delgados que la longitud focal tambin depende de la longitud de onda. Esto causa el fenmeno de
a
berra
ciones cromtica
s: rayos refractados correspondientes a diferentes longitudes de onda intersectarn el
eje ptico en diferentes puntos (aberracin cromtica longitudinal)
y desde diferentes crculos de confusin en
el mismo plano de la imagen (aberracin cromtica transversa)
.
Las aberraciones pueden ser minimizadas al alinear varios lentes simples con formas e ndices de refraccin
bien elegidos, separados por los topes apropiados. Estos lentes compuestos an pueden ser modelados por las
ecuaciones de las lentes gruesas, pero tienen un defecto ms que es relevante a la visin mquina: la luz que
destella emanando desde los puntos de objetos localizados fuera del eje son bloqueados parcialmente por las
diferentes aperturas (incluyendo los componenetes de las lentes individuales por si mismas)
posicionadas
dentro de las lentes para limitar las aberraciones. Este fenmeno, llamado vietea
do, causa una cada en el
brillo de la periferia de la imagen. El vieteado puede suponer algunos problemas a los programas de anlisis
de imgenes, pero no es tan importante en fotografa, gracias a la extraordinaria insensibilidad del ojo
humano a los gradientes de brillo suaves.
EJERCICIOS PROPUESTOS
Dibuja la manera en que los rayos luminosos de la escena llegan al plano de la imagen en el modelo de
cmara obscura de agujero de alfiler (pinhole)
. (Tip. Figura 1.2 del libro de texto 2 a edicin)
.
Explica con tus propias palabras el modelo pinhole (cmara obscura)
.
Define con tus propias palabras el plano de la imagen.
Define con tus propias palabras qu es proyeccin perspectiva.
Dibuja el sistema de coordenadas (O, i, j, k)
asociado a una cmara de agujero de alfiler (pinhole
camera)
.
Desarrolla el procedimiento para llegar a la ecuacin (2)
a partir de la ecuacin (1)
.
Ilustra y explica la perspectiva dbil mediante un esquema que muestre el plano de la imagen, el sistema
de coordenadas con origen en el centro de la cmara, y la ubicacin del mundo real (ejemplo, Figura 1.6
del libro de texto, segunda edicin)
.
Esquematice la reflexin y la refraccin en la interface entre dos medios homogneos (ejemplo, Figura
1.7 del libro de texto, segunda edicin)
Investiga y explica con tus palabras e imgenes, el funcionamiento de los diferentes tipos de retinas:
pelcula, CCD, 3CCD y CMOS. Conoces otra?
Ilustre con un esquema las aberraciones de punto: aberracin esfrica, coma y astigmatismo.
Ilustre con un esquema las aberraciones de forma: distorsin, curvatura de campo.
Explique y esquematice la aberracin cromtica.
Explica e ilustra el funcionamiento del ojo humano, y haz una comparacin con una cmara con lente
gruesa.
REFERENCIAS
[1] Forsyth, D. and Ponce, J. Computer Vision: a
modern a
pproa
ch, Ed. PEARSON, 2011 (2a. ed)