Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
w
Mauricio Daz Melo
Ingeniero Electrnico
Magister en Ingeniera Electrnica
Coordinador del Centro de Investigacin de la Escuela de Ingeniera
Corporacin Universitaria Unitec
El procesamiento digital de imgenes es el resultado mente reducidos [1]. Estas herramientas (hardware)
de la interaccin de varias reas de estudio como fueron el resultado de la creacin de los circuitos in-
el anlisis matemtico y el tratamiento de seales tegrados (1953), los cuales, de igual forma, se deben
guiadas por diferentes tcnicas de programacin y a la invencin del diodo (o vlvula de dos terminales)
optimizacin. Este artculo busca mostrar, a aquellas a comienzo del siglo XX (1905), evento con el cual
personas que deseen comenzar a trabajar con im- se da inicio formal a la electrnica como un rea de
genes, un modelo matemtico sencillo que permita estudio particular de las ciencias aplicadas.
visualizarlas como seales bidimensionales y enten-
der su comportamiento de una forma bsica al ser Los circuitos integrados permitieron fabricar a bajo
procesadas por medios digitales. De la misma forma, costo y con una pequea dimensin fsica, herra-
exponer algunas de las nuevas tendencias que se mientas especializadas que se utilizaron, en un co-
trabajan en la actualidad sobre este tema. mienzo, como hardware especfico en los sistemas de
televisin y en las grandes producciones del medio
El principal objetivo del procesamiento digital de im- audiovisual [1, 2]. Sin embargo, el procesamiento de
genes es proponer y visualizar la viabilidad de dife- imgenes ha cobrado un auge inusitado en las lti-
rentes soluciones a un problema especfico, aplicn- mas dcadas; las razones: la aparicin de computa-
dolas sobre una funcin en un espacio bidimensional dores cada vez ms robustos, eficientes y veloces, y
(imgenes) o, en algunos casos, tridimensional (se- la creacin de los dispositivos conocidos como DSP
cuencias de imgenes). Usualmente, encontrar una (procesadores digitales de seales).
solucin ptima implica el planteamiento de un algo-
ritmo; ste, se basa en una teora que debe ser com- Hoy en da, el procesamiento digital de seales supe-
probada haciendo un extenso trabajo experimental a ra ampliamente al procesamiento de seales por me-
travs de un software de simulacin y grandes canti- dios anlogos, por sus bajos costos y reducido tiempo
dades de imgenes de prueba. de procesamiento. Los medios anlogos han pasado
a un segundo plano y el mundo tiende a digitalizarse1:
Introduccin la msica en mp3, las cmaras digitales, la televisin
de alta definicin, etc.
El procesamiento de imgenes
trae consigo un inters, como con-
secuencia del avanzado grado de
desarrollo del sentido de la vista
en los seres humanos y la depen-
dencia casi exclusiva de l para
nuestra supervivencia. Es por esto
que las imgenes juegan un papel
sorprendente desde el punto de
vista de representacin de con-
ceptos en la percepcin humana.
David Marr, matemtico y neuro-
cientfico, public un famoso do-
cumento titulado Visin [4], el cual
servira de punto de referencia a
nivel mundial. En l describe a la
visin como el proceso que produce desde las im- ste recibe como entrada una imagen y genera como
genes del mundo exterior una descripcin que es til salida una imagen; por otra parte, un algoritmo de
para el observador y no es confundida con informa- anlisis de imagen recibe una imagen de entrada y
cin irrelevante. Segn esta definicin, las imgenes produce una salida que es un descriptor (de cualquier
juegan un papel primordial en este proceso. clase) de la imagen de entrada (por ejemplo el va-
lor medio de los niveles de intensidad). Finalmente,
Diversos autores difieren en el rango de alcance del un sistema puede ubicarse dentro del rea de la vi-
procesamiento de imgenes, puesto que no existen sin computarizada si se encarga de simular la forma
fronteras bien definidas con otros tpicos como la vi- como funciona el sistema visual humano para imitarlo
sin computarizada o el anlisis de imgenes. Esto por medio de algoritmos en ejecutados en un hard-
implica, muchas veces, categorizar mal un proyecto ware especfico. Esta rama pertenece, por s misma,
o trabajar en diferentes reas que se encuentran es- a la inteligencia artificial, cuyo objetivo es emular la
trechamente unidas. Una forma de definir un siste- inteligencia del ser humano.
ma que procesa imgenes digitales es diciendo que
11
12
la diagonal entre el vrtice blanco y negro conforman Las transformaciones en escalas de grises
los colores atonales (escala de grises). Existen otros buscan mejorar caractersticas como el contraste y
modelos como el CMYK (cyan, magenta y amarillo) o la luminosidad, alterando los valores de los pxeles
el HSI (tono, saturacin, intensidad). La escogencia mediante la relacin que se describe por S=T(r). La
del determinado espacio de color es una tarea muy transformacin T traslada los valores de los pxeles
importante para el xito del sistema a disear. Para r en valores de pxeles en S. Dado que estos son
efectos prcticos, los algoritmos descritos en este ar- valores digitales, usualmente estas transformaciones
tculo aplicarn para imgenes en tonos de grises, se realizan con tablas predeterminadas, previamente
la cual se encuentra promediando los canales RGB, almacenadas en memoria para ahorrar tiempo de
teniendo en cuenta que sus aplicaciones se pueden cmputo. Algunas de las transformaciones ms
extender fcilmente a imgenes en color. color. comunes se muestran a continuacin:
Negativo
La expresin dominio espacial hace referencia a la
n-sima raz
Niveles de gris en la salida , s
modificacin directa de los pxeles que componen
3L/4
una imagen. Un sistema que hace este tipo de pro-
cesamiento se pude denotar mediante la siguiente Log
expresin: n-sima poetencia
L/2
g(x,y)=T [ f (x,y)],
L/4
donde f (x,y) es la imagen de entrada, g(x,y) es la
Log inverso
imagen procesada y T es un operador en f , definido
como una transformacin NxM NxM dimensiones. 0
0 L/4 L/2 3L/4 L-1
Esta transformacin igualmente involucra un conjunto
definido de pxeles vecinos. Algunas transformaciones Niveles de gris en la salida , r
sobre los niveles de escala de grises pueden servir
para mejorar los detalles en imgenes, por ejemplo, Figura 2. Algunas transformaciones en niveles de gris usadas
en imgenes radiolgicas (figura 1). para mejorar la imagen. Grfica tomada de [1]
13
14
plemente dar informacin estadstica que pueda ser slo involucra una imagen). Las ms usadas son
utilizada en otros procesos. AND, NOT, OR y operaciones como substraccin,
suma, multiplicacin. Por ejemplo, en el campo
de la astrofotografa aficionada, es comn tomar
secuencias de fotos y promediarlas para obtener
mejores resultados. De igual forma, debido a las
caractersticas del ruido producido por los CCD,
es comn restar de la imagen que se quiere una
fotografa tomada al vaco reduciendo el efecto de la
perturbacin. Otro ejemplo comnmente usado es la
(a)
substraccin. La diferencia entre dos imgenes y
f (x,y) y h (x,y) puede expresarse como:
(a)
(c)
(b)
(d)
(c)
Otra de las alternativas utilizadas para el
procesamiento en el dominio espacial consiste en la Figura 4. Operaciones matemticas entre imgenes. (a) Ima-
utilizacin de operaciones matemticas y/o lgicas gen ensima. (b) Imagen ensima+N. (c) Valor absoluto de la
entre imgenes para obtener los resultados deseados. diferencia umbralizada entre la imagen ensima y la imagen
Estas operaciones se realizan entre dos imgenes, ensima+N
pxel a pxel (con excepcin de la operacin NOT que
Tcnicasenelprocesamientodigitaldeimgenes:unaconstanteexploracindenuevoscampos.
15
ubicando los colores en el espectro electromagntico
en frecuencias que van desde 350THz el (violeta)
hasta los 384THz (rojo). Pero en una imagen
(seal bidimensional), qu puede representar la
frecuencia? Para responder esta pregunta, haremos
algunos planteamientos matemticos, a pesar de que
la finalidad de este documento no es profundizar en
estos aspectos. La transformada de Fourier para una
seal unidimensional se define como [1]:
_ j2 ux (a)
8
f (u)= f (x)e dt
8
j2 ux
f (x)= F(u)e du
8
_ j2 (ux+vy)
F(u,v)= f (x,y)e dxdy
8
8
y la transformada inversa,
8
8
(x,y)e
1 _ j2(ux/M+vy/N)
F(u,v)= MN nal. (a) Pulso bidimensional. (b) Magnitud de la transformada
x=0 y=0 de Fourier como imagen. (c) Magnitud de la transformada de
Y su inversa por:
Fourier como un funcin bidimensional
M_1 N_1
F(u,v)e
_ j2(ux/M+vy/N)
(x,y)=
u=0 v=0
Es importante visualizar que el resultado puede La grfica de la figura 6(c) muestra la magnitud de
ser un nmero complejo, por lo tanto, su resultado se la DFT bidimensional de la imagen que representa un
expresa en funcin de la magnitud y de la fase. pulso. Como se podra esperar, sta es una funcin
impulsiva que va decreciendo de acuerdo a la forma
Teniendo esto en cuenta es posible visualizar la definida por la funcin sinc(x)= sin x . Hagamos
x
transformada de una funcin pulso bidimensional, otro experimento; con la misma imagen vamos a
como se muestra a continuacin:
16
Tcnicasenelprocesamientodigitaldeimgenes:unaconstanteexploracindenuevoscampos. 17
(a)
(a)
(b)
M_1 N_1
Notas
1
El verbo que describe correctamente este comportamiento debe ser dis-
mia de la Lengua Espaola. Una funcin discreta slo toma valores espec-
19