Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I. INTRODUCCIN
La finalidad en el anlisis de imgenes es la cuantificacin de las
propiedades de los objetos presentes en stas, para lo cual es necesario
entender los elementos que las componen, su origen y su naturaleza. Los
mtodos de anlisis estn estrechamente relacionados con estos aspectos.
La toma de decisiones en muchas reas del conocimiento se basa en el
resultado de este anlisis.
Introduccin
Hasta aqu se han empleado formas intuitivas para describir los aspectos ms
importantes del anlisis de una imagen; es necesario, por tanto, definir con mayor
formalidad los elementos que la componen y los mtodos de estudio existentes. Sin
recurrir a detalles matemticos, introduciremos estos aspectos en las siguientes dos
secciones de este captulo, donde comenzaremos por explicar la generacin de una
imagen empleando un esquema de carcter general. La caracterizacin matemtica de
una imagen multiespectral la dejaremos para el captulo III.
Figura I.1. Generacin de una imagen digital multiespectral a partir de una escena.
La radiacin emitida por la fuente se hace interaccionar con un elemento fsico de la
escena llamado campo instantneo de vista (CIV). La manera particular en que se
realiza la mecnica de esta interaccin depende de la geometra y detalles tcnicos del
arreglo experimental empleado; no obstante, el presente enfoque es suficientemente
Introduccin
como bandeo y cuya correccin (Crippen, 1989) se realiza por medio de un filtraje
(vase captulo V) de fcil aplicacin.
Figura I.2. Respuesta lineal de un sensor remoto frente a una cierta radiacin incidente.
Para cada intervalo de energa y para cada CIV, y como resultado del proceso de
medida de la radiacin proveniente de ste, se genera un nmero cuyo valor se guarda
en algn medio de almacenamiento masivo (magntico u ptico), en una posicin lgica
que va de acuerdo con el lugar relativo que tiene el CIV correspondiente en la escena
(figura I.1). Para cada CIV se producen por tanto, nmeros que conjuntamente
describen su respuesta espectral, los que, arreglados en forma vectorial se escriben
como
pmn = {b1, b2, . . . b}mn
(I.1)
(I.2)
(I.3)
si bien un orden creciente puede ser empleado tambin. As entonces, las carctersticas
(I.4)
(I.5)
Introduccin
u x i2
i 1
1/ 2
se emplean tonos de rojo, verde y azul para los elementos seleccionados del pixel.
Cuando todos o un subconjunto de pixels de la imagen es enviado a la pantalla, se tiene
Introduccin
1. Tonos de grises Donde se despliega una sola banda (lminas 1 a 6), es decir un
elemento de pixel. Generalmente se asigna un tono negro a un valor cero y uno claro
al 255 y grises a valores intermedios.
2. Pseudocoloracin Donde se despliega una sola banda y los valores de los pixels se
subdividen en intervalos, asignando a cada uno de stos un conjunto de tonos de un
cierto color.
3. Falso color Donde se despliegan tres bandas (lmina 7) asignando a cada una de
ellas tonos de los colores rojo, verde y azul.
En cualquiera de las tres modalidades mencionadas, la asignacin de tonos (gris o
color) se hace por medio de una funcin que no necesariamente es lineal, conocida
como funcin de color y representada generalmente por medio de una tabla.
I.2.4 Patrn y clase de patrones
Para identificar otros aspectos de la imagen es necesario introducir la siguiente
definicion:
Patrn: Arreglo de entes de la misma naturaleza
En esta definicin no se especifica qu tipo de arreglo o qu tipo de entes, nicamente
se impone una restriccin en cuanto a su naturaleza, es decir, no se pueden combinar
entes de diferente tipo. Por ejemplo, el arreglo: ABC23 no es vlido, pero las
secuencias: acegh y 1257 s lo son. En cuanto al arreglo, basta con intercambiar dos
elementos para tener una situacin diferente, as por ejemplo, la secuencia 2157
constituye otro patrn aun cuando se trate de los mismos nmeros anteriormente
considerados. Existen dos posibles clases de arreglos: de orden lgico y de orden fsico;
los ejemplos anteriores pertenecen a la primera clase. Un arreglo de orden fsico se
manifiesta siempre en una dimensin espacial, por lo que es necesario emplear entes
con un cierto tamao o rea. En el caso especfico de una imagen multiespectral, cada
uno de los pixels que la forman es un patrn de orden lgico y como stos representan la
respuesta espectral de los CIV de la escena, decimos que un pixel es un patrn espectral
de orden lgico. Una vez que se han medido las propiedades espectrales de un CIV para
un conjunto de intervalos de energa, el patrn espectral (pixel) correspondiente queda
unvocamente determinado. Sin embargo, qu sucede cuando se desea considerar un
patrn de orden fsico en una imagen digital?, la situacin es mucho ms compleja que
para patrones de orden lgico. En primer lugar es necesario apelar a la relacin CIV
pixel para poder asignarle un tamao o rea a ste. Hay que recordar que la imagen
digital se encuentra alojada en un medio de almacenamiento masivo y que de por s no
tiene dimensin asociada para visualizarla. Para tener una representacin pictrica de
una imagen, ya sea en un monitor de despliegue o en una impresin de papel, es
indispensable asociarle un cierto tamao fsico a los pixels; es decir, la imagen puede
tener una representacin lgica y una visual (fsica). Al hacer esto, es posible considerar
arreglos de pixels con una estructura fsica que forman un patrn espacial de acuerdo
con la definicin ya planteada. En estos trminos, a un pixel le asignamos un tamao
igual para todas las bandas y valores diferentes para cada una de ellas; la sucesin de
stos sigue siendo un patrn espectral de orden lgico. Para ilustrar esto, veamos la
10
figura I.4, donde se encuentra esquematizada una imagen de cuatro bandas y donde se
les ha asignado una cierta rea cuadrada a los pixels; bajo esta asignacin se dice que la
imagen tiene una dimensin espacial.
Introduccin
11
Esta definicin se aplica tanto a patrones espaciales como espectrales; objetos con
una cierta forma o tamao, o pixels con un mismo valor, son ejemplo de una clase de
patrones, en donde por caractersticas similares se entienden aquellas propiedades
morfolgicas o espectrales que son comunes y de inters en un problema. Ntese que
una clase de patrones es finalmente un patrn espacial, pero donde los pixels que lo
componen estn supeditados a cumplir con una o varias propiedades similares que son
dadas de acuerdo con un objetivo particular; esto restringe el universo de patrones
espaciales a uno manejable y que tiene relacin directa a la escena que se intenta
estudiar. La definicin anterior se aplica tambin a patrones espectrales, en cuyo caso
las caractersticas similares se refieren a la manera como responden espectralmente los
CIV de la escena. Dentro de ciertos lmites, cada objeto de la escena tiene una firma o
respuesta espectral que lo distingue de los dems, de tal manera que agrupar pixels con
base en esta propiedad nos permite, en principio, detectar objetos de la escena.
Finalmente lo que importa en la definicin de una clase de patrones, es el modelaje
matemtico que se haga para cuantificar las propiedades similares a que se refiere la
definicin mencionada. Por otro lado, toda vez que se agrupen pixels espectrales, se
tiene un patrn espacial (figura I.4) y viceversa; la interrelacin entre unos y otros es
estrecha dada la naturaleza espacial y espectral de la imagen digital multiespectral. De
acuerdo con lo arriba explicado podran considerarse tambin las clases espectral y
espacial, dependiendo de qu propiedades similares se hayan definido. Sin embargo, en
un patrn espacial importan en primera instancia las relaciones contextuales que guarda
cada pixel con sus vecinos y en segundo lugar el valor que tienen. As, por ejemplo, un
objeto puede contener pixels de diferente valor, pero estar stos agrupados en un patrn
o clase espacial de acuerdo con las caractersticas morfolgicas de dicho objeto. Es
posible tambin que un patrn espacial est compuesto por pixels del mismo o parecido
valor: as, por ejemplo, si los bordes del objeto estn claramente determinados, entonces
los pixels que lo componen tienen respuestas espectrales parecidas. En la clase
espectral, las caractersticas similares estn relacionadas nicamente con las
propiedades espectrales de los pixels, mientras que en la clase espacial se refieren a las
relaciones espaciales que guardan los valores de los pixels entre s. Los diferentes
objetos presentes en una imagen estn caracterizados por patrones espaciales o
espectrales; los objetos del mismo tipo forman una clase.
I.2.5 Ruido y artefactos
En el proceso de captura de una imagen, o en la aplicacin de una transformacin a sta,
es posible que se generen patrones ajenos a la escena respectiva; para describir este
hecho se introduce la siguiente definicin:
Artefacto: Patrn espacial o espectral presente en la imagen, cuya ocurrencia es
azarosa y ajena a la escena respectiva.
Un artefacto es entonces un elemento que se introduce en la imagen digital, sin ninguna
relacin con los objetos del sistema fsico que se desea estudiar. Un artefacto puede
introducirse por algn mal funcionamiento del sistema sensor o por error o limitacin de
una transformacin aplicada a la imagen. Para detectar un artefacto es necesario tener
conocimiento de la escena caracterizada por la imagen. Un artefacto ocurre de manera
12
Introduccin
13
Figura I.5. Segmentacin de una imagen (a) en cuatro regiones: anticlinal (b), red de
drenaje (c), bosque (d), embalse (e) y ciudad (f).
14
Figura I.6. Cadena de Freeman del segmento definido por los unos a partir del
remarcado en negrilla.
En la parte derecha de la figura se observa un arreglo numerado de ocho direcciones:
horizontal a la derecha (0) y a la izquierda (4), vertical hacia arriba (2) y hacia abajo (6)
y las dos diagonales (1, 3, 5 y 7). Esta roseta de ocho principales direcciones se conoce
como el cdigo de Freeman, de tal manera que cualquier otra direccin intersecta
parcialmente a una serie de pixels y no a lo largo de sus centros. Una direccin es
Introduccin
15
16
N 4 ( pij ) pi 1, j
0
pi, j1
0
pi, j1
pi 1, j1
0
pi 1, j y N 8 ( pij ) pi 1, j
pi 1, j1
0
pi, j1
0
pi, j1
pi 1, j1
pi 1, j
pi 1, j1
pi, j1
pi 1, j1
, C5
0
0
0
pi 1, j1
, C6
pi, j
pi 1, j
pi, j1
,
0
0
pi 1, j1
, C8 0
pi, j
pi, j1
0
, C9
pi, j
pi 1, j
pi, j1
,
pi, j
pi 1, j1
C10
pi 1, j
pi, j1
pi, j
I.2.8 Textura
Veamos ahora una representacin diferente de una imagen digital a partir de la cual es
posible deducir un par de conceptos adicionales a los ya planteados. Supongamos que
en un espacio de tres dimensiones se grafica una banda cualquiera de una imagen
multiespectral, colocando en el plano x-y la posicin de cada pixel y en el eje z su valor,
obteniendo de esta manera una superficie (figura I.7) con las siguientes caractersticas
espaciales: suave donde los pixels cambian poco su valor y rugosa donde lo hacen
rpidamente. Si en una zona de la imagen, para una direccin dada, cambian los valores
de los pixels en forma relativamente rpida, la consecuencia en la superficie
Introduccin
17
Figura I.7. Superficie generada por los valores de los pixels de la banda de una imagen.
Textura: Manifestacin espacial organizada de un arreglo local de tonos (pixels) de
la imagen.
Esta es una generalizacin de la idea de textura que se tiene en cuanto al relieve de
una superficie slida. La textura es local, puede cambiar de un lugar a otro de la imagen
y depende de la escala a la cual se le observe; tambin se manifiesta diferente de banda
a banda de la imagen multiespectral. Aunque la textura es un concepto difcil de definir
dada la subjetividad con la cual la psicovisin responde ante sta, es posible establecer
tres caractersticas bsicas
1. Un cierto orden local se repite sobre una regin que es relativamente grande
comparada con el tamao del orden.
2. El orden consiste en un cierto arreglo de partes elementales.
3. Las partes estn compuestas de entidades aproximadamente uniformes, teniendo ms
o menos las mismas dimensiones dentro de la regin de textura, las partes pueden
ocurrir en cualquier direccin.
La textura depende de la escala a la que se observe la escena y es posible que varias
subtexturas compongan una de otra dimensin.
La psicovisin humana no es muy eficiente para distinguir y clasificar texturas;
aquellas que difieren ms all del tercer momento estadstico son confundidas por un ser
18
humano. Para analizar texturas existen bsicamente dos enfoques: el sintctico (por
primitivos) y el estadstico (global), ms detalles de esto se dan en el captulo VII.
I.2.9 Frecuencia espacial
Relacionado con el concepto de textura se encuentra el de Frecuencia Espacial; la
apariencia visual de ambos conceptos se presenta como una alternancia de tonos
(valores) de los pixels de la imagen; existe no obstante una diferencia que se discute a
continuacin. Para manejar con facilidad estas ideas, retomemos la representacin de la
banda de una imagen mostrada como una superficie en la figura I.7. En esta
representacin, cualquier lnea o borde entre las clases de la imagen se traduce en una
especie de escaln en la superficie; en resumidas cuentas, cualquier alternancia de
valores en la imagen digital se refleja en la superficie en un cambio ms o menos
brusco. A partir de esta discusin cualitativa diremos lo siguiente: se tienen frecuencias
espaciales bajas en aquellas regiones de la imagen donde se presente una tonalidad
relativamente uniforme; se tienen frecuencias espaciales altas en aquellas zonas de la
imagen que presentan tonalidades cambiantes. En una primera aproximacin y bajo
condiciones de simetra, es posible asociar frecuencias altas con texturas gruesas y
frecuencias baja con texturas suaves. El concepto de frecuencia espacial se visualiza en
forma cuantitativa empleando la definicin de expansin en series de Fourier.
Considrese un perfil de la imagen, digamos a lo largo de la direccin x, para una y
constante; sea esta funcin g(x), entonces
g( x )
a0
a Cos(mx) b Sen(mx)
m
(I.6)
Donde las am y bm son constantes que se obtienen a partir de la funcin g(x) misma
(Arfken y Weber, 1995), la que debe tener un nmero finito de discontinuidades y un
nmero finito de valores extremos, condiciones que son satisfechas en una imagen
digital. A partir de esta expresin, es posible deducir que si g(x) presenta variaciones
suaves, entonces la sumatoria se restringe a valores pequeos de m; a medida que g(x)
se hace ms compleja, es necesario incrementar el valor de m para una representacin
fiel de esta funcin, y en el caso lmite de un escaln, m tiene que ser infinito. De esta
forma es posible afirmar que el contenido de frecuencias espaciales de g(x) crece a
medida que sus cambios son ms abruptos, es decir, es necesario incluir en el desarrollo
dado por (I.6) a funciones de seno y coseno de frecuencias cada vez ms altas. Otra
manera de entender el concepto de frecuencia espacial es regresando a la figura I.7
donde, adems de la superficie que representa la imagen, se muestra tambin un objeto
slido esfrico llamado elemento estructural, el cual imaginemos, se desplaza por
debajo de todos los puntos de la superficie. A medida que el elemento estructural se
hace ms pequeo, es posible acomodarlo en los resquicios de la superficie; en este caso
se tienen frecuencias espaciales altas, si el elemento es grande para acomodarlo a los
cambios graduales de la superficie, se tienen entonces frecuencias espaciales bajas. Aun
cuando la expresin (I.6) describe un perfil a lo largo de la direccin x, el razonamiento
anterior se aplica a perfiles en cualquier direccin. En cuanto a la superficie de la figura
I.7, es posible esquematizar en primera aproximacin lo siguiente
Introduccin
19
1
(2) 2
(I.7)
(I.8)
La definicin (I.7) expresa por tanto que la tranformada de Fourier F es una expansin
del campo bi-dimensional f empleando como base las funciones Seno y Coseno de
frecuencia variable. Podra decirse por tanto, que la expresin (I.7) presenta
caractersticas similares a la ecuacin (I.6) en el sentido de frecuencia espacial arriba
definido. De esta manera, la transformada de Fourier es una cuantificacin bidimensional del contenido de frecuencias espaciales de la imagen. La transformada de
Fourier es lineal e invertible por lo que
F[f + g] = F[f] + F[g]
y
F 1 [F] f (r )
F f (r )g(r )d F [f g] FG
(I.9)
I.10)
20
pc p
pc p
(I.11)
3 que la rodean. El factor de contraste es una cantidad vectorial que vara de banda a
banda. Con la misma forma de la relacin (I.11) es posible evaluar el contraste de un
objeto con su entorno; en este caso, pc sera el promedio de los valores de los pixels que
componen el objeto y p sera el promedio de los pixels circundantes. Hay que hacer
notar que en imgenes de satlite el contraste aparente se reduce debido a la
interferencia atmosfrica (Song et al., 2001; Lira y Oliver, 1983; Lira y Oliver, 1984).
Otra definicin del contraste es: en una ventana cuadrada, se encuentran los valores
mximo y mnimo y se establece el cociente
Introduccin
fc 2
pmax pmin
pmax pmin
21
(I.12)
Con base en la respuesta logartmica del ojo humano (Pratt, 2001) se define el siguiente
factor de contraste
fc3 = alog{ p pc + 1}
(I.13)
22
imagen digital debe contener un gran nmero de pixels; una discusin cuantitativa de
esto se ver en el captulo III, al tratar sobre el teorema de muestreo. En concreto, entre
ms pixels y niveles tenga una imagen digital para una escena dada, diremos que
esperamos que su calidad sea mayor. Si bien estos dos factores son los ms importantes
en la definicin de la calidad, no son los nicos. Por otro lado, como se apunt arriba,
no es necesario incrementar indefinidamente el nmero de pixels y niveles ms all de
un cierto lmite, adems de que los requerimientos de almacenamiento y computacin
creceran a rdenes inmanejables. Los otros factores de los cuales depende la calidad de
una imagen son los siguientes: el contraste global, la definicin de los bordes y el
contenido de ruido. Si se desea una ptima calidad, es necesario que el contraste sea el
mximo posible, la definicin de los bordes sea precisa y el ruido sea mnimo. De
acuerdo con la definicin de contraste, su manifestacin es local y por tanto su valor
puede variar de un lugar a otro de la imagen, por lo que es necesario asegurarse de que
sea mximo en cualquier lugar de sta. En una representacin visual de una imagen
digital, la definicin de los bordes se plasma como en un efecto de enfoque: cuando
aquellos estn indefinidos, la imagen se ve desenfocada y viceversa. Los sistemas
sensores modernos generan muy poco ruido en la creacin de una imagen digital; no
obstante, en ciertas ocasiones algn medio externo puede introducir una seal que
degrada el resultado de la digitizacin. Lo que finalmente es de importancia en esta
situacin es la relacin de valor del ruido con respecto al del pixel en cualquier banda;
en todo caso se pretende que el cociente ruido/pixel sea mnimo. La calidad de la
imagen depende, de una manera compleja (Rosenfeld y Kak, 1982; Janssen, 2001), de
todos los parmetros arriba discutidos y es una medida que debe determinarse tanto para
la imagen original como para cualquier transformacin de sta.
Introduccin
23
(I.14)
(I.15)
(I.16)
donde r1 y r2 son dos pixels contiguos del permetro y (x1, x2), (y1, y2) son sus
respectivas coordenadas. En la figura I.8a se muestran las distancias, desde el pixel
central hacia la periferia, calculadas con la expresin (I.15) y en la figura I.8b las
distancias calculadas con la ecuacin (I.16). A la distancia da(r1,r2) se le conoce tambin
como d4(r1,r2) y a la distancia dab(r1,r2) se le conoce como d8(r1,r2). A la trayectoria que
corresponde a la distancia ms corta entre dos pixels se le llama una geodsica. Esta
trayectoria depende del esquema de conectividad que se determine en una imagen tal
como se aprecia en la figura I.8c; para la distancia euclidiana solo existe una geodsica,
pero para conectividad 4 u 8 puede haber varias geodsicas.
Es necesario definir una unidad de medida, que en este caso es una distancia patrn
tal como el centmetro o el metro. La aplicacin sucesiva de esta unidad, de acuerdo con
uno de los modelos dados por (I.14) a (I.16) a cada uno de los pixels del permetro,
proporciona un nmero que representa la longitud total del borde del patrn espacial;
este proceso se realiza sobre aquella banda donde se encuentre ms evidente el
24
polgono. Una vez medidas suficienes propiedades de este patrn, de tal manera que
unvocamente se le distinga de otros, se dice entonces que se le ha reconocido, todo esto
contando siempre con la premisa de que previamente se ha determinado lo que se
entiende como polgono, es decir, no se puede reconocer lo que no se ha definido. El
razonamiento anterior se aplica de modo similar a clases de polgonos. Con los modelos
y las unidades de medida adecuadas pueden establecerse diversas propiedades de otros
patrones.
positividad
simetra
desigualdad de Schwarz
(I.17)
Las distancias (I.14) a (I.16) satisfacen lo anterior y son por tanto mtricas; lo mismo
puede afirmarse de las expresiones (VII.159) a (VII.165).
Introduccin
25
26
Introduccin
27
28
[0.001 1.00] nm
[0.001 0.40] m
[0.40 0.45] m
[0.45 0.51] m
[0.51 0.56] m
[0.56 0.59] m
[0.59 0.63] m
[0.63 0.70] m
[0.40 0.70] m
[0.70 3.00] m
[3.00 30.0] m
[30.0 100.0] m
Regin
Microondas
Banda Q
Banda W
Banda V
Banda Ka
Banda K
Banda Ku
Banda X
Banda C
Banda S
Banda L
Banda P
[0.1 100.0] cm
[0.10 0.27] cm
[0.27 0.40] cm
[0.40 0.75] cm
[0.75 1.11] cm
[1.11 1.67] cm
[1.67 2.50] cm
[2.50 3.75] cm
[3.75 7.50] cm
[7.50 15.0] cm
[15.0 30.0] cm
[30.0 100.0] cm
Introduccin
29
La clase (a) de imgenes es generada por medio de sistemas pasivos, las clases (b) a
(f) de imgenes son producidas empleando sistemas activos (Lira, 2003). En los
captulos II y VIII se proporcionan detalles de las clases (a) y (b) respectivamente; de
las clases restantes se dan nicamente algunos detalles generales. En el apendice B se
proporcionan detalles de la dinmica orbital y los aspectos tcnicos de los satlites que
generan regularmente imgenes de las clases (a) y (b).
I.6 Ejercicios
1. Con base en la figura 1.1 haga un diagrama de un sistema de captura de imgenes
empleando un arreglo matricial de detectores para capturar 4 bandas
30
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.