Sei sulla pagina 1di 6

MDULO I

Nombre del mdulo: Introduccin a los Sistemas de Visin


Objetivo Especfico: El estudiante conocer los fundamentos de la Fsica que
subyacen en la captura de imgenes a travs de una cmara.

Propsito de este mdulo: Que el estudiante conozca los principios fsicos


subyacentes en la captura de imgenes a travs de una cmara.

INTRODUCCIN:

Carga Horaria terica: 6


Carga Horaria prctica: 0

Contenido programtico desarrollado:


1.1. La cmara obscura
1.2. Lentes
1.3. Aberracin y distorsin
1.4. Sensores para captura de imgenes: CCD/CMOS
1.5. Funcionamiento del ojo humano

1. Introduccin a los Sistemas de Visin


Existen muchos tipos de dispositivos de captura de imgenes, desde ojos (de animales o humanos) hasta
cmaras de video y radio-telescopios. Estos dispositivos pueden o no estar equipados con lentes. Por ejemplo,
los primeros modelos de la cmara obscura inventados en el siglo XVI no tenan lentes, sino que utilizaban
un pequeo orificio (agujero de alfiler, o en ingls pinhole) para enfocar los rayos luminosos en una pared o
plato translcido, y demostrar de este modo las leyes de la perspectiva descubiertas un siglo antes por
Brunelleschi. Los agujeros de alfiler fueron reemplazados por lentes cada vez ms sofisticados ya en 1550, y
las modernas cmaras digitales o fotogrficas son esencialmente una cmara obscura capaz de grabar la
cantidad de luz que choca contra cada pequea rea de su plano trasero.

La superficie de imagen de una cmara generalmente es un rectngulo, sin embargo la forma de la retina
humana es ms cercana a una superficie esfrica, y las cmaras panormicas pueden equiparse con retinas
cilndricas. Los sensores de imgenes tienen otra caracterstica. Pueden grabar una fotografa espacialmente
discreta (como nuestros ojos con sus bastones y conos, cmaras de pelcula, o pixeles) , o continua (en el caso
de los viejos tubos de rayos catdicos en las antiguas televisiones, por ejemplo) . La seal que registra un
sensor de imgenes en un punto de su retina puede por si misma ser discreta o continua, y puede constar de un
slo nmero (como en una cmara a blanco y negro) , unos pocos valores (por ejemplo las intensidades RGB
en una cmara a color, o las respuestas de los tres tipos de conos en el ojo humano) , muchos nmeros (por
ejemplo las respuestas de los sensores hiperespectrales) , o an una funcin contnua de longitud de onda (el
cual es esencialmente el caso de los espectrmetros) .

1.1. La cmara obscura (Perspectiva agujero de alfiler)


Imagina que tomas una caja, usas un alfiler para hacer un pequeo orificio en el centro de uno de sus lados, y
reemplazas el lado opuesto con un plato translcido. Si sostienes la caja frente a t en una habitacin
tenuemente alumbrada, con el pequeo agujero frente a una fuente luminosa (una vela, por ejemplo) ,
aparecer una imagen invertida de la vela en el plato translcido. Esta imagen seforma por rayos de luz que
parten de la escena frente a la caja. Si redujramos el agujero de alfiler a un punto (lo cual es fsicamente
imposible) , exactamente un rayo de luz pasara a travs de cada punto en el plano del plato (o plano de la
imagen) , el agujero de alfiler y algn punto en la escena.
En realidad, el agujero de alfiler tendr un tamao finito (aunque pequeo) , y cada punto en el plano de la
imagen colectar luz de un cono de rayos con un ngulo finito y slido, as que este modelo ideal y
extremamente simple de la geometra de la captura de imgenes, no aplica de manera estricta. Adems, las
cmaras reales normalmente estn equipadas con lentes, lo cual complica an ms las cosas. De cualquier
manera, el modelo proyectivo de perspectiva de agujero de alfiler (tambin llamada perspectiva central) ,
propuesto inicialmente por Brunelleschi a inicios del siglo quince, es matemticamente conveniente y, a pesar
de su simplicidad, comnmente provee una aproximacin aceptable del proceso de captura de imgenes. La
proyeccin perspectiva crea imgenes invertidas, y algunas veces es conveniente considerar en su lugar una
imagen virtual asociada con un plano que yace frente al agujero de alfiler, a la misma distancia de ste que el
plano de la imagen. Esta imagen virtual no est invertida, pero es estrictamente equivalente a la verdadera.
Dependiendo del contexto,
puede ser ms conveniente pensar en una o en la otra.

Efectos de la proyeccin perspectiva:


1. El tamao aparente de los objetos en la imagen depende de la distancia del agujero de alfiler al objeto en
la escena: los objetos lejanos parecen ms pequeos que los cercanos.
2. Las proyecciones de dos lneas paralelas que yacen en algn plano en la escena, parecen converger en
una lnea h en el horizonte, formada por la interseccin del plano de la imagen con el plano paralelo al
plano que pasa a travs del agujero de alfiler.

Estas propiedades son fciles de probar geomtricamente. Sin embargo, algunas veces es ms conveniente
razonar en trminos de marcos de referencia, coordenadas y ecuaciones. Considere, por ejemplo, un sistema de
coordenadas (O, i, j, k) , asociado a una cmara de agujero de alfiler, cuyo origen O coincide con el agujero de
alfiler, y los vectores i y j forman una base para un plano vectorial paralelo al plano de la imagen , colocado a
su vez a una distancia positiva d del agujero de alfiler a lo largo del vector k. La lnea imaginaria, perpendicular
a que pasa por el agujero de alfiler es llamada el eje ptico, y el punto c en el cual intersecta a es llamado el
centro de la ima gen. Este punto puede ser utilizado como el origen de un marco de coordenadas asociado a un
plano de la imagen, y juega un rol importante en los procedimientos de calibracin de cmaras.

Sea P un punto en la escena con coordenadas (X, Y, Z) y p su imagen con coordenadas (x, y, z) 1. Como p yace
en el plano de la imagen, tenemos que z = d. Como los tres puntos P, O y p son colineales (yacen en la misma
lnea) , tenemos que Op = OP para algn nmero , as que

{
x = X
y= Y , (1)
z= Z

y por lo tanto

{
X
x =d
Z. (2)
Y
y=d
Z

1 Las letras maysculas denotan puntos en el espacio 3D, mientras que las letras minsculas denotan sus proyecciones en
el plano de la imagen.
1.1.2. Perspectiva Dbil

Como se mostr en la seccin anterior, la perspectiva de agujero de alfiler es slo una aproximacin de la
geometra del proceso de captura de la imagen. Una aproximacin mas burda es la perspectiva dbil, la cual
es til en algunas ocasiones.

Considere el plano frontal paralelo 0, definido por Z = Z0. Para cualquier punto P en 0 es posible re-escribir
la ecuacin (2) como

x =m X , donde m= d
{y =mY , Z0
(3)

Las restricciones fsicas forzan a que Z0 sea negativa (el plano debe estar frente al agujero de alfiler) , de
manera que la magnificacin m asociada con el plano 0 sea positiva. Este nombre est justificado por la
siguiente observacin: considere dos puntos P y Q en 0 y sus imgenes p y q; obviamente los vectores PQ y
pq son paralelos, y tenemos que ||pq|| = m||PQ||. Esta es la dependencia del tamao de la imagen sobre la
distancia que notamos anteriormente.

Cuando el relieve de una escena es pequeo en relacin con su distancia media de la cmara, el aumento
puede ser considerado constante. Este modelo de proyeccin es llamado perspectiva dbil, u ortografa
escalada.

Cuando se conoce de antemano que la cmara siempre estar a una distancia aproximadamente constante de
la escena, podemos llegar ms lejos y normalizar las coordenadas de la imagen de tal manera que m = 1. Esta
es la proyeccin ortogrfica , definida por

{xy=Y
=X (4)

con los rayos paralelos al eje k y ortogonales al plano de la imagen . Aunque la proyeccin de perspectiva
dbil es un modelo aceptable para muchas condiciones de captura, usualmente no es realista asumir una pura
proyeccin ortogrfica.

1.1.3. Cmaras con Lentes


La mayora de las cmaras estn equipadas con lentes. Existen principalmente dos razones para esto: La
primera es reunir la luz, ya que de otro modo slo un rayo de luz alcanzara cada punto del plano de la imagen
en una proyeccin de agujero de alfiler (pinhole) ideal. Los agujeros de alfiler tienen un tamao finito, desde
luego, as que cada punto en el plano de la imagen es iluminado por un cono de rayos de luz manteniendo un
ngulo fijo finito. Entre ms grande sea el agujero, el cono ser ms grande y la imagen ms brillante, sin
embargo un gran agujero de alfiler producir imgenes borrosas. Reducir el agujero de alfiler permite obtener
imgenes mas ntidas pero reduce la cantidad de luz que llega al plano de la imagen, y puede introducir
efectos de difra ccin. La segunda razn para usar una lente es el mantener la imagen con un enfoque ntido, y
al mismo tiempo reunir la luz de una gran rea.

Si ignoramos la difraccin, las interferencias y otros fenmenos pticos, el comportamiento de los lentes est
dictado por las leyes de la ptica geomtrica: (1) la luz viaja en lneas rectas (rayos de luz) en medios
homogneos; (2) cuando un rayo es reflejado por una superficie, este rayo, su refleccin, y la superficie
normal son coplanares, y los ngulos entre la normal y los dos rayos son complementarios; y (3) cuando un
rayo pasa de un medio a otro, ste es refractado (su direccin cambia) . De acuerdo con la ley de Snell, si r1 es
el rayo incidente en la interface entre dos materiales transparentes con ndices de refraccin n1 y n2 , y r2 es un
rayo refractado, entonces r1, r2 y la lnea normal a la interface son coplanares, y los ngulos 1 y 2 entre la
normal y ambos rayos estn relacionados por

n1 sin( 1)=n2 sin ( 2) (5)


En lo que resta de esta seccin slo se considerarn los efectos de la refraccin, ignorando los de la reflexin.
En otras palabras, el estudio se concentrar en los lentes, en oposicin a los sistemas pticos catadioptricos
(telescopios) que pueden incluir elementos tanto reflectivos (espejos) como refractivos (lentes) . Rastrear los
rayos luminosos conforme viajan a travs de una lente es ms simple cuando se asume que los ngulos entre
estos rayos y las superficies refractantes son pequeos, lo cual es el dominio de la geometra ptica paraxial
(o de primer orden) , y la ley de Snell se convierte en n1 1n2 2 . Asumamos que la lente es simtrica
rotacional con respecto a una lnea recta, llamada su eje ptico y que todas las superficies refractivas son
esfricas. La simetra de esta configuracin nos permite determinar la geometra de proyeccin al considerar
lentes con lmites circulares que yacen en un plano que contiene el eje ptico. En particular, consideremos una
lente con dos superficies esfricas de radio R e ndice de refraccin n. Asumiremos que esa lente est rodeada
por espacio vaco (o aire como una excelente aproximacin) , con un ndice de refraccin igual a 1, y que es
delgado (un rayo que entra a las lentes y es refractado en su lmite derecho es refractado inmediatamente de
nuevo en el lmite izquierdo) .

Considere un punto P localizado a una profundidad (negativa) Z del eje ptico, y denotado por (PO) el rayo
que pasa a travez de este punto y el centro O de la lente. Es fcil seguir, a partir de la forma paraxial de la ley
de Snell, que (PO) no es refractado, y que todos los dems rayos que pasan a travez de P estn enfocados por
la delgada lente sobre el punto p con profundidad z a lo largo de (PO) tal que

1 1 1
= , (6)
z Z f
R
donde f = es la longitud focal de la lente.
2 (n1)

Note que las ecuaciones que relacionan las posiciones de P y p son exactamente las mismas que en la
proyeccin perspectiva de agujero de alfiler si tomamos d = z, ya que P y p yacen sobre un rayo que pasa a
travs del centro de la lente. Sin embargo, los puntos localizados a una distancia -Z de O estarn en un
enfoque ntido slo cuando el plano de la imagen est localizado a una distancia z de O al otro lado de la lente
que satisface la Eq. 6, la ecuacin de lente delgado. Si hacemos que Z = -, podemos ver que f es la distancia
entre el centro de la lente y el plano donde se enfocan los objetos tales como estrellas (que efectivamente
estn localizados en Z = -) . Los dos puntos F y F' localizados a una distancia f del centro de la lente sobre el
eje ptico son llamados los puntos focales de la lente. En la prctica, los objetos dentro de algn rango de
distancias (llamado profundidad de campo o profundidad de enfoque) tendrn un enfoque aceptable. La
profundidad de campo aumenta con el nmero f de las lentes: la razn entre la longitud focal de las lentes y su
dimetro.

Note que el campo de vista de una cmara (la porcin del espacio de la escena que en realidad se proyecta en
la retina de la cmara, no est definida solamente por la longitud focal, sino que tambin depende del rea de
la retina (el rea de la pelcula que puede ser expuesta en una cmara fotogrfica, o el rea del sensor en una
cmara digital) .

Un modelo ms realista de un sistema ptico simple es el de lentes gruesas. Las ecuaciones que describen su
comportamiento son fcilmente derivables a partir de las ecuaciones de refraccin paraxial, y son las mismas
que las de perspectiva de agujero de alfiler y de lentes delgados, excepto por una compensacin. Si H y H'
denotan los puntos principales de la lente, entonces la Ecn. 6 se mantiene cuando - Z (y respectivamente z) es
la distancia entre P (y respectivamente p) y el plano perpendicular al eje ptico que pasa a travs de H (y
respectivamente H') . En este caso, el nico rayo que no se desva es el que va a lo largo del eje ptico.
Las lentes simples experimentan cierto nmero de aberraciones. Para entender por qu, recordemos que el
modelo de refraccin paraxial slo es una aproximacin, vlida cuando el ngulo entre cada rayo a lo largo
de la trayectoria ptica y el eje ptico de la longitud es pequeo y se cumple que sin( ) . Esto
corresponde a la expansin de Taylor de primer orden de la funcin seno. Para ngulos mayores, se obtiene
una mejor aproximacin utilizando trminos adicionales, y es fcil mostrar que los rayos que chocan con la
interface ms all del eje ptico se enfocan ms cerca de la interface. El mismo fenmeno ocurre para una
lente, y esta es la fuente de dos tipos de a berra ciones esfrica s: Considere un punto P en el eje ptico y su
imagen paraxial p. La distancia entre p y la interseccin del eje ptico con el rayo proveniente de P y
refractado por la lente es llamada la aberracin esfrica longitudinal de tal rayo. Note que si un plano de la
imagen fuera colocado en P, el rayo intersectara este plano a cierta distancia del eje, llamada la aberracin
esfrica transversa de tal rayo. Todos los rayos que pasan a travs de P y que son refractados por la lente
forman un crculo de confusin centrado en P conforme intersecta a . El crculo con dimetro mnimo es
llamado el crculo de menor confusin, y su centro en general no coincide con p.

Adems de la aberracin esfrica, existen otros cuatro tipos de a berra ciones prima ria s causadas por las
diferencias entre las pticas de primer y tercer orden, llamadas coma , a stigma tismo, curva tura de ca mpo, y
distorsin. De manera similar que las aberraciones esfricas, las tres primeras degradan la imagen al hacerla
borrosa en cada uno de sus puntos. La distorsin, por otro lado, juega un rol diferente y cambia la forma de la
imagen como un todo. Este efecto se debe al hecho de que diferentes reas de una lente tienen longitudes
focales ligeramente diferentes. Las aberraciones mencionadas anteriormente son monocromticas
(independientes de la respuesta de la lente a diferentes longitudes de onda, y se sigue de las ecuaciones de
lentes delgados que la longitud focal tambin depende de la longitud de onda. Esto causa el fenmeno de
a berra ciones cromtica s: rayos refractados correspondientes a diferentes longitudes de onda intersectarn el
eje ptico en diferentes puntos (aberracin cromtica longitudinal) y desde diferentes crculos de confusin en
el mismo plano de la imagen (aberracin cromtica transversa) .

Las aberraciones pueden ser minimizadas al alinear varios lentes simples con formas e ndices de refraccin
bien elegidos, separados por los topes apropiados. Estos lentes compuestos an pueden ser modelados por las
ecuaciones de las lentes gruesas, pero tienen un defecto ms que es relevante a la visin mquina: la luz que
destella emanando desde los puntos de objetos localizados fuera del eje son bloqueados parcialmente por las
diferentes aperturas (incluyendo los componenetes de las lentes individuales por si mismas) posicionadas
dentro de las lentes para limitar las aberraciones. Este fenmeno, llamado vietea do, causa una cada en el
brillo de la periferia de la imagen. El vieteado puede suponer algunos problemas a los programas de anlisis
de imgenes, pero no es tan importante en fotografa, gracias a la extraordinaria insensibilidad del ojo
humano a los gradientes de brillo suaves.

EJERCICIOS PROPUESTOS
Dibuja la manera en que los rayos luminosos de la escena llegan al plano de la imagen en el modelo de
cmara obscura de agujero de alfiler (pinhole) . (Tip. Figura 1.2 del libro de texto 2 a edicin) .
Explica con tus propias palabras el modelo pinhole (cmara obscura) .
Define con tus propias palabras el plano de la imagen.
Define con tus propias palabras qu es proyeccin perspectiva.
Dibuja el sistema de coordenadas (O, i, j, k) asociado a una cmara de agujero de alfiler (pinhole
camera) .
Desarrolla el procedimiento para llegar a la ecuacin (2) a partir de la ecuacin (1) .
Ilustra y explica la perspectiva dbil mediante un esquema que muestre el plano de la imagen, el sistema
de coordenadas con origen en el centro de la cmara, y la ubicacin del mundo real (ejemplo, Figura 1.6
del libro de texto, segunda edicin) .
Esquematice la reflexin y la refraccin en la interface entre dos medios homogneos (ejemplo, Figura
1.7 del libro de texto, segunda edicin)
Investiga y explica con tus palabras e imgenes, el funcionamiento de los diferentes tipos de retinas:
pelcula, CCD, 3CCD y CMOS. Conoces otra?
Ilustre con un esquema las aberraciones de punto: aberracin esfrica, coma y astigmatismo.
Ilustre con un esquema las aberraciones de forma: distorsin, curvatura de campo.
Explique y esquematice la aberracin cromtica.
Explica e ilustra el funcionamiento del ojo humano, y haz una comparacin con una cmara con lente
gruesa.

REFERENCIAS
[1] Forsyth, D. and Ponce, J. Computer Vision: a modern a pproa ch, Ed. PEARSON, 2011 (2a. ed)

Potrebbero piacerti anche