Elementos de Una Imagen Digital - Jorge Lira Chavez

Introduccin
I. INTRODUCCIN
La finalidad en el anlisis de imgenes es la cuantificacin de las
propiedades de los objetos presentes en stas, para lo cual es necesario
entender los elementos que las componen, su origen y su naturaleza. Los
mtodos de anlisis estn estrechamente relacionados con estos aspectos.
La toma de decisiones en muchas reas del conocimiento se basa en el
resultado de este anlisis.
I.1 Aspectos Generales

Todo ser humano se encuentra rodeado de imgenes que percibe a travs del sentido de
la vista; la mayor cantidad de informacin la recibimos en forma de imgenes, de todo
tipo, en todos colores y en blanco y negro. La radiacin electromagntica que proviene
de los objetos circundantes hiere la retina, que a su vez la transforma en pulsos
elctricos, formando la psicovisin la imagen correspondiente a la escena de inters. El
subsistema de formacin de imgenes (Lira, 2003) del ser humano es bastante limitado
en cuanto al tipo y energa de la radiacin perceptible. Su sensibilidad se restringe a una
pequea porcin del espectro electromagntico; es incapaz de percibir imgenes de
cualquier otro tipo de radiacin. Como complemento a esta aparente limitacin, el ser
humano es capaz de analizar e interpretar en forma extremadamente rpida las imgenes
que recibe. Muchas decisiones que una persona toma son inmediatas, sobre la marcha, y
estn fundamentadas en la informacin que extrae de las imgenes que recoge del
mundo que le rodea.
Los colores que percibimos son bsicamente una relacin establecida por la
psicovisin (Del Priore, 1988) para cada longitud de onda o energa de la radiacin
electromagntica. El nmero de tonos en color perceptibles (64) es mucho mayor que el
de grises (16); esta particularidad de la psicovisin le permite interpretar con facilidad
una escena dada. En cuanto a la evaluacin de texturas, la percepcin humana es
relativamente limitada: no puede distinguirlas si difieren ms all del segundo momento
estadstico. Sin profundizar en los mecanismos de operacin de la psicovisin, diremos
que sta es muy eficiente en tareas especializadas que permiten al ser humano tomar
decisiones necesarias para su conduccin en el mundo real.
El desarrollo tecnolgico de las ltimas dcadas ha permitido la generacin de
imgenes empleando radiacin invisible a la visin humana. Imgenes acsticas,
magnticas, gravimtricas, de radar (lmina 10), neutrografas y micrografas, son ahora
comunes en muy diversas aplicaciones. Las imgenes son adquiridas con gran eficiencia
y a resoluciones muy altas: la tecnologa ha permitido extender la psicovisin a nuevas
regiones, como si nuestros ojos se hubiesen vuelto ms poderosos. Esta facilidad para
ver nuevos aspectos del mundo que nos rodea no va equiparado, sin embargo, de la
capacidad para analizar ampliamente la informacin disponible. Las funciones
cerebrales de extraccin de objetos de una escena no estn cabalmente comprendidas y
por lo mismo no han podido ser reproducidas en sistemas automticos de anlisis
digital. El objetivo no es copiar tales funciones cerebrales, sino entenderlas y superarlas
en procesos automticos eficientes. En ciertas tareas muy especficas, el anlisis
Tratamiento Digital de Imgenes Multiespectrales
automtico equipara o supera la funcin cerebral correspondiente, tal es el caso de la

deteccin de bordes en imgenes complejas; sin embargo, el anlisis automtico tiende a
hacerse menos eficiente a medida que se le encargan ms tareas y de mayor
complejidad. En imgenes con poca definicin, con ruido y con grandes contrastes, el
ser humano es capaz de llenar lneas aparentemente faltantes, de extraer informacin
embebida en el ruido y de precisar la presencia de un objeto aun si este se encuentra
parcialmente sombreado o incompleto. Esto se realiza rpidamente aunque se
desconozca la escena bajo estudio; el ser humano no requiere conocimiento previo de
sta, pero s necesita de un amplio banco de datos (con base en la experiencia) sobre los
objetos contenidos en la escena. En la actualidad es posible procesar digitalmente
imgenes en el contexto de estos problemas, pero en un mbito restringido y a un alto
costo computacional. No obstante, el gran avance tecnolgico y los progresos en
computacin, tanto actuales como previsibles, hacen pensar que en un tiempo razonable
se tendrn sistemas digitales que emulen una buena porcin de las funciones de la
psicovisin y desempeen otras ms que sta no puede realizar.
En una funcin cerebral de gran rapidez, el ser humano percibe los objetos que lo
rodean y en un proceso de abstraccin simblica, extrae sus propiedades bsicas. La
abstraccin va unida a una relacin lgica entre las propiedades y la funcin o
naturaleza del objeto; entre ms caractersticas se conozcan ms se entiende la esencia
del mismo. Este conocimiento adquirido se adiciona incesantemente al banco de datos
que un ser humano tiene con relacin a su entorno. La experiencia acumulada para
entender los objetos circundantes constituye la base para el proceso de formacin del
modelo de cada objeto, el que a su vez es incluido en el enorme acervo que un ser
humano es capaz de poseer. Con este conjunto de modelos el anlisis de una escena es
directo, no importando (hasta un cierto lmite) las caractersticas de iluminacin y la
geometra particular de vista. Una gran cantidad de decisiones se toman como producto
del anlisis mencionado, coordinadas desde luego con la actividad psicomotora. En
forma anloga a la agrupacin de fonemas en palabras, frases e ideas, la psicovisin
humana agrupa los puntos de una escena en regiones significativas y stas en objetos
que son reconocidos empleando el banco de modelos previamente creado. Una vez
identificados y reconocidos los objetos de una escena, se dice entonces que sta ha sido
analizada. Es claro que no se puede reconocer objeto alguno a menos que sus
caractersticas bsicas sean conocidas para un sistema de reconocimiento de patrones. El
conocimiento acerca de un objeto se adquiere nicamente a travs de un proceso de
formacin de modelos, y la clasificacin de un objeto presente en una imagen es la
decisin por la cual se determina la categora a la cual pertenece; el reconocimiento de
un objeto implica su clasificacin. En cualquier caso, un conocimiento de alto nivel es
requerido para cualquier tipo de imagen con el propsito de establecer, con adecuada
certidumbre, el significado de las varias componentes de la imagen, esto es,
relacionndolas con estructuras conocidas en el dominio de modelos de objetos. Al
reconocer los objetos de una escena, se le segmenta tambin, ya que la segmentacin es
el agrupamiento de puntos de sta en regiones conectadas que poseen una
correspondencia significativa con los objetos presentes en la escena; sin embargo, la
segmentacin no necesariamente conduce a un reconocimiento de patrones. Al
transformar y operar sobre una imagen, el fin ltimo es siempre el reconocimiento de
los patrones que la componen, en el contexto de un problema, con el objetivo de auxiliar
en el modelado del comportamiento del sistema fsico que representa.
Introduccin
Hasta aqu se han empleado formas intuitivas para describir los aspectos ms
importantes del anlisis de una imagen; es necesario, por tanto, definir con mayor
formalidad los elementos que la componen y los mtodos de estudio existentes. Sin
recurrir a detalles matemticos, introduciremos estos aspectos en las siguientes dos
secciones de este captulo, donde comenzaremos por explicar la generacin de una
imagen empleando un esquema de carcter general. La caracterizacin matemtica de
una imagen multiespectral la dejaremos para el captulo III.
I.2 Elementos de una Imagen Digital

I.2.1 Pixel y bandas
Con el apoyo de la figura I.1 identifiquemos ahora los elementos que componen una
imagen digital. Supngase primero que se tiene una fuente de radiacin de tipo
ondulatoria (electromagntica o acstica) o de tipo corpuscular (neutrones, electrones o
positrones). La figura I.1 muestra a la fuente separada del sistema fsico que se desea
estudiar; sin embargo, para materiales radioactivos, sta se encuentra embebida o dentro
del objeto de inters.
En arreglos experimentales donde se emplean rayos X o haces de neutrones, la
radiacin puede atravesar la escena bajo estudio; estas situaciones seran casos
particulares del esquema mostrado en la figura I.1. La siguiente discusin se aplica a
cualquiera de estos arreglos o a cualquier fuente de radiacin.
Figura I.1. Generacin de una imagen digital multiespectral a partir de una escena.
La radiacin emitida por la fuente se hace interaccionar con un elemento fsico de la
escena llamado campo instantneo de vista (CIV). La manera particular en que se
realiza la mecnica de esta interaccin depende de la geometra y detalles tcnicos del
arreglo experimental empleado; no obstante, el presente enfoque es suficientemente
general y la identificacin de los elementos de la imagen no depende de estos detalles

particulares. Por otro lado, la variedad de arreglos experimentales es muy grande
(Slater, 1980) y no podran estudiarse en el presente captulo. El CIV es una subrea o
subregin de una escena que se encuentra formando parte del sistema fsico (figura I.1);
el resultado de la interaccin de la radiacin con este elemento fsico es tambin
radiacin, cuya energa o longitud de onda no necesariamente es igual a la que incide
originalmente. De acuerdo con la geometra particular: fuente-CIV-detector, una parte
de la radiacin emitida, reflejada o transmitida por el CIV es captada, sobre un cierto
ngulo slido, por unidad de tiempo, en una direccin predeterminada, por un arreglo de
sensores (detectores) que poseen un subsistema de enfoque y conduccin de radiacin.
Este subsistema puede consistir de un arreglo de lentes (telescopio) y fibras de
conduccin de luz, cuando la radiacin empleada es electromagntica para longitudes de
onda de la regin ptica del espectro correspondiente. Entonces, la radiacin es
conducida hasta un grupo de detectores, frente a los cuales se encuentra un conjunto de
filtros o un espectroradimetro, cuya funcin es seleccionar un conjunto de intervalos de
energa {E1, E2, . . . E} o de longitudes de onda {1, 2, . . . }, para los que
cada detector est ptimamente diseado y calibrado. Es decir, el detector i-simo est
adecuado para detectar la radiacin en el intervalo Ei. Es posible tener uno o varios
detectores para cada intervalo dependiendo de si se mide la radiacin de un CIV o un
grupo de ellos al mismo tiempo. As, por ejemplo, si se tienen intervalos de energa y
se miden n CIV para cada uno de stos, entonces se requieren de n detectores para
operar el sistema sensor.
Para cada intervalo de energa, los detectores miden la cantidad de radiacin por
unidad de ngulo slido, por unidad de tiempo; las unidades correspondientes en esta
medida son tpicamente mW/msterad/s. Los detectores generan un voltaje cuya
intensidad es proporcional al resultado de haber integrado la radiacin; los detalles y
consecuencias de este proceso se proporcionan en la seccin III.2. La seal de voltaje
generada por los detectores, a medida que observan un CIV tras otro, se introduce a un
convertidor anlogo/digital, que la discretiza empleando una escala que usualmente va
de 0 a 255, es decir, 256 posibles niveles, si bien otras escalas pueden ser empleadas
tambin. La razn de utilizar 256 niveles es que este nmero es almacenable en un byte
de 8 bits de una computadora digital. Por otro lado, esta resolucin radiomtrica es
suficiente para la mayora de las aplicaciones que existen empleando imgenes digitales.
La generacin de una imagen multi-espectral implica por tanto dos discretizaciones: una
espacial y una radiomtrica. El anlisis cuantitativo de la digitizacin de una escena se
estudia en el captulo III.
Los detectores estn calibrados de tal manera que se genera un 255 para el CIV ms
brillante de la escena y un 0 para el ms oscuro. La respuesta de un detector, en la
mayora de los casos, es lineal, segn se representa en la grfica de la figura I.2. Ntese
que debido a la naturaleza de los detectores empleados (Slater, 1980), siempre hay una
respuesta, aun para una radiacin incidente nula, a esto se le conoce como polarizacin
del detector. La ganancia por otro lado, es la relacin constante entre la radiacin
incidente y la seal de salida producida por ste. Ambos parmetros se ajustan para que
los sensores respondan a escenas ms o menos brillantes (reflectoras o emisoras) de tal
forma que se adecuen a diferentes condiciones de estudio; asmismo, se busca siempre
que el intervalo de operacin sea lo ms lineal posible. En imgenes de satlite la
diferencia en ganancia de los detectores del sistema sensor, produce un efecto conocido
Introduccin
como bandeo y cuya correccin (Crippen, 1989) se realiza por medio de un filtraje
(vase captulo V) de fcil aplicacin.
Figura I.2. Respuesta lineal de un sensor remoto frente a una cierta radiacin incidente.
Para cada intervalo de energa y para cada CIV, y como resultado del proceso de
medida de la radiacin proveniente de ste, se genera un nmero cuyo valor se guarda
en algn medio de almacenamiento masivo (magntico u ptico), en una posicin lgica
que va de acuerdo con el lugar relativo que tiene el CIV correspondiente en la escena
(figura I.1). Para cada CIV se producen por tanto, nmeros que conjuntamente
describen su respuesta espectral, los que, arreglados en forma vectorial se escriben
como
pmn = {b1, b2, . . . b}mn
(I.1)
donde bi es el valor numrico (entero) obtenido para el intervalo de energa Ei. La

coleccin de estos nmeros, arreglados secuencialmente en cuanto a la energa o
longitud de onda de la radiacin empleada, forman lo que se conoce como pixel, el cual
es un elemento lgico de la imagen digital. Los ndices (m,n) representan las
coordenadas (enteras) del pixel en su posicin dentro de la imagen digital y
bi Ei i
(I.2)
Ei+1 Ei, o i+1 i
(I.3)
de tal manera que
si bien un orden creciente puede ser empleado tambin. As entonces, las carctersticas
espectrales de un CIV quedan representadas por el pixel correspondiente, estando

implcitamente registrada la posicin y tamao relativo de ste en una relacin unvoca
CIV pixel
(I.4)
El CIV es un elemento fsico de la escena y el pixel es un elemento lgico de la imagen

digital; ste ltimo, como tal, no tiene dimensin asociada, por lo que la relacin (I.4) es
importante para determinar tamaos de los objetos de la imagen. En la relacin (I.1) los
ndices (m,n) tienen los intervalos de variacin
1mM y 1nN
(I.5)
donde M y N son enteros y representan el nmero de CIVs en los cuales se dividi la

escena en las direcciones x, y respectivamente.
Al terminar de medir todos los CIV pertinentes a una escena, se tiene una coleccin
de matrices de nmeros (figura I.1), una para cada intervalo de energa empleado. El
tamao de estas matrices es de M N y cada una de ellas forma una imagen digital
conocida como banda, ya que representa la distribucin espacial de valores de radiacin
provenientes de la escena para una banda o intervalo de energa. El conjunto de estas
bandas para una escena dada se conoce como imagen digital multiespectral (vanse
las lminas 1 a 6), puesto que caracteriza la distribucin espacial y espectral de la
radiacin proveniente de aquella. Hay que puntualizar que, debido a la dimensionalidad
espectral de la imagen, se requiere de un espacio de dimensiones para representar los
pixels que la componen; es decir, la imagen multiespectral forma un campo vectorial
donde los pixels que la componen son vectores de tantos elementos como bandas se
hayan generado. El campo vectorial asociado a una imagen multiespectral se formaliza
en el apartado I.2.2. As entonces, el pixel es un elemento digital bsico de una imagen
multiespectral.
I.2.2 Modelo de imagen multiespectral
Para condensar las definiciones del apartado anterior, considrese ahora una lattice
(vase seccin III.3) rectangular discreta L {1, . . . M} {1, . . . N}. Centrado en cada
nodo de L, se encuentra localizada una celda de resolucin llamada campo instantneo
de vista (CIV). Por medio de un dispositivo llamado sensor multiespectral, se asocia a
cada CIV un vector de dimensiones pmn = {b1,b2, . . . b}mn. El vector pmn caracteriza
las propiedades espectrales promedio del CIV de la escena. Este vector es llamado un
elemento pictrico (pixel) de la imagen multiespectral. Sea ahora la imagen
multiespectral g = {gi} formada por el grupo de pixels de acuerdo al siguiente conjunto
gi = {bj(m,n)}i, i, donde i es el conjunto {1,2, . . . } que representa la coleccin
de bandas de la imagen multiespectral. Los valores de los pixels pueden asumir valores
enteros de acuerdo con el conjunto (Apendice A)
gi B {bibi , 0 bi 2k - 1}, i
Introduccin
Donde k y, 7 k 12 en imgenes multiespectrales. De aqu entonces una imagen

digital multiespectral g es una funcin tal que, g: L B.
Sea ahora Xi el conjunto
Xi {xixi , 0 xi 2k - 1}, i
de tal manera que el producto cartesiano X = X1 X2 . . . X define el conjunto de las
-tuplas ordenadas (x1,x2, . . . x). Sean (b1,b2, . . . b) los valores de los pixels a travs
de las bandas de la imagen; establecemos ahora la igualdad xi = bi, i, por lo que (b1,b2,
. . . b) es una -tupla en el sistema cartesiano de coordenadas. A cada -tupla (b1,b2, . . .
b), se le asocia un vector u: u(x1,x2, . . . x) (b1,b2, . . . b). Sea E un espacio discreto
euclidiano -dimensional tal que, E . La dimensin de u est dada por le mtrica
euclidiana

u x i2
i 1
1/ 2
El conjunto de vectores {u(x1,x2, . . . x)} es el resultado de proyectar la imagen

multiespectral a un campo vectorial. Hacemos notar que no toda -tupla (x1,x2, . . . x)
del dominio D(X) E, tiene un vector asociado al campo vectorial, y una -tupla
(x1,x2, . . . x) puede tener ms de un vector asociado al campo vectorial. De aqu
entonces, el campo vectorial asociado a la imagen multiespectralr est dado por el
conjunto de vectores U = {u(x1,x2, . . . x)} en el dominio D(X) E. Por tanto, una
imagen digital multiespectral puede ser modelada como un campo vectorial discreto
de una dimensin igual al nmero de bandas de la imagen (figura I.3). Al espacio
determinado por el dominio D(X) se le conoce tambin como el espacio de rasgos.
I.2.3 Despliegue de imgenes
Una vez que la escena ha sido discretizada, la imagen digital multi-espectral
correspondiente queda almacenada en algn dispositivo magntico u ptico. Para poder
visualizar la imagen digital es necesario contar con una tarjeta de video y un monitor de
despliegue a color. Estos dispositivos deben ser capaces de leer (mediante un programa)
el valor de un pixel y poner en la pantalla, en la posicin adecuada, un punto en un tono
de gris o de color de intensidad proporcional a tal valor. Como ya se apunt arriba, un
pixel es un vector de tantos elementos como bandas tenga la imagen, por lo cual es
necesario seleccionar un conjunto de estas para el despliegue. Si el equipo (hardware)
permite manejar los tres caones del monitor (rojo, verde y azul) independientemente,
entonces es posible desplegar tres bandas cualesquiera al mismo tiempo. El proceso de
despliegue es como sigue: se lee el valor de uno o varios pixels en una o varias bandas y
se envan al monitor de color en las mismas coordenadas relativas que ocupan en el
archivo donde estn almacenados. A cada pixel se le asigna una pequea rea en la
pantalla y a cada valor un tono de color o de gris. Si se despliegan tres bandas, entonces
se emplean tonos de rojo, verde y azul para los elementos seleccionados del pixel.
Cuando todos o un subconjunto de pixels de la imagen es enviado a la pantalla, se tiene
Figura I.3. Campo vectorial de una imagen de dos bandas.

una representacin visual de la imagen donde es posible apreciar en diferentes tonos los
patrones espaciales y espectrales de la misma. Esta representacin visual puede tener
tres modalidades
Introduccin
1. Tonos de grises Donde se despliega una sola banda (lminas 1 a 6), es decir un
elemento de pixel. Generalmente se asigna un tono negro a un valor cero y uno claro
al 255 y grises a valores intermedios.
2. Pseudocoloracin Donde se despliega una sola banda y los valores de los pixels se
subdividen en intervalos, asignando a cada uno de stos un conjunto de tonos de un
cierto color.
3. Falso color Donde se despliegan tres bandas (lmina 7) asignando a cada una de
ellas tonos de los colores rojo, verde y azul.
En cualquiera de las tres modalidades mencionadas, la asignacin de tonos (gris o
color) se hace por medio de una funcin que no necesariamente es lineal, conocida
como funcin de color y representada generalmente por medio de una tabla.
I.2.4 Patrn y clase de patrones
Para identificar otros aspectos de la imagen es necesario introducir la siguiente
definicion:
Patrn: Arreglo de entes de la misma naturaleza
En esta definicin no se especifica qu tipo de arreglo o qu tipo de entes, nicamente
se impone una restriccin en cuanto a su naturaleza, es decir, no se pueden combinar
entes de diferente tipo. Por ejemplo, el arreglo: ABC23 no es vlido, pero las
secuencias: acegh y 1257 s lo son. En cuanto al arreglo, basta con intercambiar dos
elementos para tener una situacin diferente, as por ejemplo, la secuencia 2157
constituye otro patrn aun cuando se trate de los mismos nmeros anteriormente
considerados. Existen dos posibles clases de arreglos: de orden lgico y de orden fsico;
los ejemplos anteriores pertenecen a la primera clase. Un arreglo de orden fsico se
manifiesta siempre en una dimensin espacial, por lo que es necesario emplear entes
con un cierto tamao o rea. En el caso especfico de una imagen multiespectral, cada
uno de los pixels que la forman es un patrn de orden lgico y como stos representan la
respuesta espectral de los CIV de la escena, decimos que un pixel es un patrn espectral
de orden lgico. Una vez que se han medido las propiedades espectrales de un CIV para
un conjunto de intervalos de energa, el patrn espectral (pixel) correspondiente queda
unvocamente determinado. Sin embargo, qu sucede cuando se desea considerar un
patrn de orden fsico en una imagen digital?, la situacin es mucho ms compleja que
para patrones de orden lgico. En primer lugar es necesario apelar a la relacin CIV
pixel para poder asignarle un tamao o rea a ste. Hay que recordar que la imagen
digital se encuentra alojada en un medio de almacenamiento masivo y que de por s no
tiene dimensin asociada para visualizarla. Para tener una representacin pictrica de
una imagen, ya sea en un monitor de despliegue o en una impresin de papel, es
indispensable asociarle un cierto tamao fsico a los pixels; es decir, la imagen puede
tener una representacin lgica y una visual (fsica). Al hacer esto, es posible considerar
arreglos de pixels con una estructura fsica que forman un patrn espacial de acuerdo
con la definicin ya planteada. En estos trminos, a un pixel le asignamos un tamao
igual para todas las bandas y valores diferentes para cada una de ellas; la sucesin de
stos sigue siendo un patrn espectral de orden lgico. Para ilustrar esto, veamos la
10
figura I.4, donde se encuentra esquematizada una imagen de cuatro bandas y donde se
les ha asignado una cierta rea cuadrada a los pixels; bajo esta asignacin se dice que la
imagen tiene una dimensin espacial.
Figura I.4. Imagen multiespectral de cuatro bandas.

En esta dimensin espacial, la imagen presenta varios arreglos de pixels cuyos
valores son distintos, si bien variando dentro de un cierto intervalo; stos forman figuras
irregulares llamadas cada una: patrn espacial. Tales patrones tienen una dimensin
(profundidad) espectral, ya que se manifiestan a travs de las cuatro bandas de la
imagen. Cualquier arreglo (fsico) de pixels forma un patrn espacial que puede estar
compuesto desde por uno hasta por todos los pixels que constituyen la imagen, sin
importar su valor o vecindad con otros. As por ejemplo, todos los pixels cuyo valor sea,
digamos, 50 en la banda dos ya sea que formen el borde de un objeto o que estn
contenidos en l forman un patrn espacial. Como puede apreciarse, la variedad de
patrones espaciales es muy grande, si bien la mayora de ellos tal vez no tenga un
significado real para la identificacin de los objetos presentes en la imagen. Dentro de
esta enorme variedad de patrones espaciales existen algunos de ellos que son de
particular inters en el anlisis de imgenes digitales. Para facilitar su identificacin,
introducimos ahora una nueva definicin:
Clase de patrones: Conjunto de patrones con caractersticas similares.
Introduccin
11
Esta definicin se aplica tanto a patrones espaciales como espectrales; objetos con
una cierta forma o tamao, o pixels con un mismo valor, son ejemplo de una clase de
patrones, en donde por caractersticas similares se entienden aquellas propiedades
morfolgicas o espectrales que son comunes y de inters en un problema. Ntese que
una clase de patrones es finalmente un patrn espacial, pero donde los pixels que lo
componen estn supeditados a cumplir con una o varias propiedades similares que son
dadas de acuerdo con un objetivo particular; esto restringe el universo de patrones
espaciales a uno manejable y que tiene relacin directa a la escena que se intenta
estudiar. La definicin anterior se aplica tambin a patrones espectrales, en cuyo caso
las caractersticas similares se refieren a la manera como responden espectralmente los
CIV de la escena. Dentro de ciertos lmites, cada objeto de la escena tiene una firma o
respuesta espectral que lo distingue de los dems, de tal manera que agrupar pixels con
base en esta propiedad nos permite, en principio, detectar objetos de la escena.
Finalmente lo que importa en la definicin de una clase de patrones, es el modelaje
matemtico que se haga para cuantificar las propiedades similares a que se refiere la
definicin mencionada. Por otro lado, toda vez que se agrupen pixels espectrales, se
tiene un patrn espacial (figura I.4) y viceversa; la interrelacin entre unos y otros es
estrecha dada la naturaleza espacial y espectral de la imagen digital multiespectral. De
acuerdo con lo arriba explicado podran considerarse tambin las clases espectral y
espacial, dependiendo de qu propiedades similares se hayan definido. Sin embargo, en
un patrn espacial importan en primera instancia las relaciones contextuales que guarda
cada pixel con sus vecinos y en segundo lugar el valor que tienen. As, por ejemplo, un
objeto puede contener pixels de diferente valor, pero estar stos agrupados en un patrn
o clase espacial de acuerdo con las caractersticas morfolgicas de dicho objeto. Es
posible tambin que un patrn espacial est compuesto por pixels del mismo o parecido
valor: as, por ejemplo, si los bordes del objeto estn claramente determinados, entonces
los pixels que lo componen tienen respuestas espectrales parecidas. En la clase
espectral, las caractersticas similares estn relacionadas nicamente con las
propiedades espectrales de los pixels, mientras que en la clase espacial se refieren a las
relaciones espaciales que guardan los valores de los pixels entre s. Los diferentes
objetos presentes en una imagen estn caracterizados por patrones espaciales o
espectrales; los objetos del mismo tipo forman una clase.
I.2.5 Ruido y artefactos
En el proceso de captura de una imagen, o en la aplicacin de una transformacin a sta,
es posible que se generen patrones ajenos a la escena respectiva; para describir este
hecho se introduce la siguiente definicin:
Artefacto: Patrn espacial o espectral presente en la imagen, cuya ocurrencia es
azarosa y ajena a la escena respectiva.
Un artefacto es entonces un elemento que se introduce en la imagen digital, sin ninguna
relacin con los objetos del sistema fsico que se desea estudiar. Un artefacto puede
introducirse por algn mal funcionamiento del sistema sensor o por error o limitacin de
una transformacin aplicada a la imagen. Para detectar un artefacto es necesario tener
conocimiento de la escena caracterizada por la imagen. Un artefacto ocurre de manera
12
ms bien azarosa o aleatoria, a diferencia del ruido donde el mecanismo fsico es

relativamente bien conocido y generado por un proceso estocstico. Un mal
funcionamiento del sensor o un error del programa de transformacin son de difcil
prediccin y evaluacin, no as el ruido que es predecible y modelable
matemticamente; por lo tanto no debe confundirse el ruido con un artefacto. No
obstante, el ruido es un patrn espacial que tampoco tiene relacin con la escena, si bien
su comportamiento y propiedades estadsticas son obtenibles a partir de la imagen o del
proceso de generacin de sta. El ruido es el resultado de un proceso estocstico con
una funcin de probabilidad conocida y asociada al sistema que genera la imagen
digital. La definicin de ruido es la siguiente
Ruido: Patrn espacial o espectral presente en la imagen, cuya ocurrencia est
determinada por factores externos al proceso de captura de la imagen y que presenta
propiedades estadsticas definidas.
De aqu entonces que slo en contadas ocasiones haya confusin entre ruido y artefacto.
I.2.6 Segmentacin
Una imagen digital contiene una variedad de patrones relacionados directamente con los
objetos de la escena y, de acuerdo con las definiciones arriba planteadas, habr otros
patrones que no tengan esta significado. Para estudiar con mayor facilidad aquellos
patrones de inters, es necesario separarlos del resto de la imagen; este proceso puede
ser real o virtual. Es real si los pixels que se refieren a un patrn son asignados a una
imagen intermedia en donde stos ocupan sus mismas posiciones relativas, siendo tantas
imgenes (figura I.5) como patrones se deseen separar. Es virtual si los pixels del patrn
nicamente se etiquetan como pertenecientes a una clase dada o si sus valores se
cambian todos a uno predefinido, pero sin separarse de la imagen original (lmina 57).
La separacin de un patrn depende bsicamente del modelo que se haya establecido
para l. Con base en estos conceptos introduzcamos ahora la siguiente definicin:
Segmentacin: Particin de una imagen en regiones que pueden o no tener un
significado relativo a la escena respectiva.
Es posible que la particin sea real o virtual y ntese que en cuanto a las regiones, no se
requiere necesariamente que tengan una relacin directa (significado) con los objetos de
la escena. Esta amplitud en la definicin de segmentacin es con el fin de dejar abierta
la posibilidad a transformaciones intermedias que conduzcan en ltima instancia a un
anlisis de la imagen. Por ejemplo, si en una banda dada de una imagen multiespectral
los pixels cuyos valores estn entre 37 y 46, son cambiados de valor, digamos a uno, el
resultado es una regin segmentada de la imagen. Si este intervalo de valores de
radiancia caracteriza adems la respuesta espectral de un objeto de la escena, entonces
la regin tiene una relacin con la escena respectiva. Ejemplos de segmentacin se
proporcionan en las lminas 52, 53 y 57.
Si lo que se segmenta es el contenido del ruido de una imagen, el resultado es una
regin que no tiene relacin alguna con la escena; sin embargo, esto constituira un paso
previo a un anlisis posterior de la imagen.
Introduccin
13
Figura I.5. Segmentacin de una imagen (a) en cuatro regiones: anticlinal (b), red de
drenaje (c), bosque (d), embalse (e) y ciudad (f).
14
En este ltimo ejemplo la segmentacin es ms elaborada ya que el ruido est

sobreimpuesto, aditiva o multiplicativamente a la imagen; la separacin en este caso
requiere por tanto de un modelo estadstico que permita estimar el valor de los pixels en
ausencia de tal fenmeno degradante. La diferencia entre la imagen original con ruido y
la estimacin sin l dara la segmentacin deseada. Las lminas 22 y 25 muestran la
segmentacin del ruido que inicialmente se encontraba distribuido en las bandas
originales de las imgenes multiespectrales mostradas en las lminas 1 6; detalles del
mtodo de segmentacin que separa el ruido se discute en la seccin IV.6. Otro ejemplo
de segmentacin, es aquel donde la imagen se le segmenta en funcin de su contenido
de frecuencias espaciales; detalles de esto se proporcionan en el captulo V y en los
prrafos subsecuentes. Las tcnicas de segmentacin ms importantes se discuten en la
seccin VII.2. En el captulo VIII se discute el ruido asociado a imgenes de radar.
I.2.7 Relaciones de vecindad
La estructura de una imagen digital hace que las direcciones en sta estn discretizadas,
es decir, nicamente ciertas de ellas son dadas de acuerdo con el arreglo matricial de los
pixels. Para ilustrar esto refirmonos a la figura I.6, donde se ilustra una imagen binaria
de 12 12 pixels; aqu se aprecia un contorno no cerrado determinado por aquellos
pixels cuyo valor es uno.
Figura I.6. Cadena de Freeman del segmento definido por los unos a partir del
remarcado en negrilla.
En la parte derecha de la figura se observa un arreglo numerado de ocho direcciones:
horizontal a la derecha (0) y a la izquierda (4), vertical hacia arriba (2) y hacia abajo (6)
y las dos diagonales (1, 3, 5 y 7). Esta roseta de ocho principales direcciones se conoce
como el cdigo de Freeman, de tal manera que cualquier otra direccin intersecta
parcialmente a una serie de pixels y no a lo largo de sus centros. Una direccin es
Introduccin
15
principal nicamente si pasa por el centro de un conjunto de pixels alineados y

contenidos en la imagen, cualquier otra situacin diferente a sta determina una
direccin secundaria no especificada en el cdigo Freeman.
Sea ahora un pixel p con coordenadas (i,j), por lo que sus primeros prximos vecinos
son aquellos con coordenadas: (i + 1,j), (i,j 1), (i 1,j), (i.j + 1), es decir los que se
encuentran en las direcciones horizontales y verticales especificadas por las direcciones
0, 2, 4 y 6 del cdigo de Freeman; denotemos a este grupo de pixels como N4(p). Los
segundos prximos vecinos de p son aquellos localizados en las diagonales principales
especificadas por las direcciones 1, 3, 5 y 7 del cdigo de Freeman; las coordenadas de
estos vecinos son: (i + 1,j 1), (i 1,j 1), (i 1,j + 1), (i + 1,j + 1); sea este grupo de
pixels el denotado como ND(p). La unin de los grupos ND(p) y N4(p) forman los 8
primeros vecinos de p y son designados como N8(p); es decir N8(p) = ND(p) N4(p).
Con base en estas definiciones se introduce ahora el concepto de conectividad que
constituye una relacin de vecindad espacial entre un pixel y sus prximos vecinos. Sea
Ng el conjunto de valores posibles (256 en muchos casos) que puede asumir un pixel en
una banda dada, entonces
Conectividad - 4: Un pixel q con valores en Ng tiene conectividad 4 con p si q
pertenece al grupo N4(p).
Conectividad - 8: Un pixel q con valores en Ng tiene conectividad 8 con p si q
pertenece al grupo N8(p).
Como puede apreciarse de las definiciones anteriores, la conectividad es una
relacin de vecindad entre dos pixels; esta relacin puede ser ampliada a grupos de
pixels tal como se explica en los prrafos subsecuentes. Adems de los aspectos de
conectividad entre un pixel y sus vecinos es posible cuantificar la relacin de vecindad
de un grupo de pixels espacialmente arreglados marcando el contorno o borde un objeto.
As entonces, el contorno definido por los unos en la figura I.6, puede ser codificado
empleando la roseta de ocho direcciones. Comenzando con cualquier extremo, digamos
el superior, se anota la direccin en la cual se encuentra el siguiente pixel, escribiendo el
nmero correspondiente de acuerdo con el cdigo de Freeman; de esta manera se
obtiene la sucesin de dgitos mostrada en la figura I.6. Esta sucesin, llamada cadena
de Freeman, es un modelo de la conectividad de un grupo de pixels. Al codificar un
contorno es necesario adoptar algunas convenciones tales como: dnde se comienza y
en qu sentido se hace el seguimiento.
Con base en las definiciones de vecindad, conectividad-4 y conectividad-8, es
posible ahora introducir el concepto de sistemas de vecindad. Sea N = {r11, r12, . . rMN}
D el conjunto finito de nodos de una lattice (seccin III.3), llamado tambin el
conjunto de sitios de un dominio finito discreto D, donde este dominio es un
subconjunto finito del espacio bidimensional discreto 2: D 2. En una imagen
digital, los nodos rij son vectores de posicin que apuntan a los centros de los pixels. En
terminos generales, el conjunto de sitios define una malla finita y discreta de nodos
(lattice) de acuerdo con un cierto arreglo que puede ser rectangular o hexagonal (figura
VII.28). Asciese ahora a N una familia de sitios de vecindad denotada como V = {v11,
v12, . . . vMN}, tal que vij N, donde rij vij y rlm vst, si y slo si rst vlm. El conjunto
V es llamado un sistema de vecindad para el conjunto de sitios N y los puntos vij son
16
llamados vecinos de rij. La dupla de conjuntos [N,V] denota un conjunto N de sitios

dotados de un sistema de vecindad V. Ahora bien, un subconjunto C N, es llamado
un clique si C es un elemento de N, o bien si cada par de elementos distintos de C son
vecinos entre s, de acuerdo con un esquema de conectividad.
En conectividad-4, el sistema de vecindad podra estar definido de acuerdo con el
grupo N4(p) y en conectividad-8 de acuerdo con el grupo N8(p), es decir, grficamente
0
N 4 ( pij ) pi 1, j
0
pi, j1
0
pi, j1
pi 1, j1
0
pi 1, j y N 8 ( pij ) pi 1, j
pi 1, j1
0
pi, j1
0
pi, j1
pi 1, j1
pi 1, j
pi 1, j1
En conectividad 4, los cliques seran por tanto C1 = {pi,j}, C2 = {pi-1,j pi,j} y C3 =

pi , j1
y el conjunto completo de cliques sera C = C1 C2 C3. Es necesario

pi , j
puntualizar que el vector de posicin rij N apunta al centro (nodo) del pixel pij y que
en el caso de una imagen multiespectral, los pixels de sta son vectores de tantos
elementos como bandas tenga la imagen. En conectividad-8, adems de C1, C2 y C3, los
cliques seran
0
C4
pi 1, j
pi 1, j1
C7
pi 1, j
pi, j1
pi 1, j1
, C5
0
0
0
pi 1, j1
, C6
pi, j
pi 1, j
pi, j1
,
0
0
pi 1, j1
, C8 0
pi, j
pi, j1
0
, C9
pi, j
pi 1, j
pi, j1
,
pi, j
pi 1, j1
C10
pi 1, j
pi, j1
pi, j
Por tanto, el conjunto completo de cliques para conectividad 8 sera C = C1 C2 C3

. . . C10.
I.2.8 Textura
Veamos ahora una representacin diferente de una imagen digital a partir de la cual es
posible deducir un par de conceptos adicionales a los ya planteados. Supongamos que
en un espacio de tres dimensiones se grafica una banda cualquiera de una imagen
multiespectral, colocando en el plano x-y la posicin de cada pixel y en el eje z su valor,
obteniendo de esta manera una superficie (figura I.7) con las siguientes caractersticas
espaciales: suave donde los pixels cambian poco su valor y rugosa donde lo hacen
rpidamente. Si en una zona de la imagen, para una direccin dada, cambian los valores
de los pixels en forma relativamente rpida, la consecuencia en la superficie
Introduccin
17
mencionada es una sucesin de crestas y valles cuya amplitud y alternancia determinan

la rugosidad del rea. Es posible asociar rugosidades con texturas, si bien es necesario
introducir la siguiente definicin
Figura I.7. Superficie generada por los valores de los pixels de la banda de una imagen.
Textura: Manifestacin espacial organizada de un arreglo local de tonos (pixels) de
la imagen.
Esta es una generalizacin de la idea de textura que se tiene en cuanto al relieve de
una superficie slida. La textura es local, puede cambiar de un lugar a otro de la imagen
y depende de la escala a la cual se le observe; tambin se manifiesta diferente de banda
a banda de la imagen multiespectral. Aunque la textura es un concepto difcil de definir
dada la subjetividad con la cual la psicovisin responde ante sta, es posible establecer
tres caractersticas bsicas
1. Un cierto orden local se repite sobre una regin que es relativamente grande
comparada con el tamao del orden.
2. El orden consiste en un cierto arreglo de partes elementales.
3. Las partes estn compuestas de entidades aproximadamente uniformes, teniendo ms
o menos las mismas dimensiones dentro de la regin de textura, las partes pueden
ocurrir en cualquier direccin.
La textura depende de la escala a la que se observe la escena y es posible que varias
subtexturas compongan una de otra dimensin.
La psicovisin humana no es muy eficiente para distinguir y clasificar texturas;
aquellas que difieren ms all del tercer momento estadstico son confundidas por un ser
18
humano. Para analizar texturas existen bsicamente dos enfoques: el sintctico (por
primitivos) y el estadstico (global), ms detalles de esto se dan en el captulo VII.
I.2.9 Frecuencia espacial
Relacionado con el concepto de textura se encuentra el de Frecuencia Espacial; la
apariencia visual de ambos conceptos se presenta como una alternancia de tonos
(valores) de los pixels de la imagen; existe no obstante una diferencia que se discute a
continuacin. Para manejar con facilidad estas ideas, retomemos la representacin de la
banda de una imagen mostrada como una superficie en la figura I.7. En esta
representacin, cualquier lnea o borde entre las clases de la imagen se traduce en una
especie de escaln en la superficie; en resumidas cuentas, cualquier alternancia de
valores en la imagen digital se refleja en la superficie en un cambio ms o menos
brusco. A partir de esta discusin cualitativa diremos lo siguiente: se tienen frecuencias
espaciales bajas en aquellas regiones de la imagen donde se presente una tonalidad
relativamente uniforme; se tienen frecuencias espaciales altas en aquellas zonas de la
imagen que presentan tonalidades cambiantes. En una primera aproximacin y bajo
condiciones de simetra, es posible asociar frecuencias altas con texturas gruesas y
frecuencias baja con texturas suaves. El concepto de frecuencia espacial se visualiza en
forma cuantitativa empleando la definicin de expansin en series de Fourier.
Considrese un perfil de la imagen, digamos a lo largo de la direccin x, para una y
constante; sea esta funcin g(x), entonces
g( x )
a0
a Cos(mx) b Sen(mx)
m
(I.6)
Donde las am y bm son constantes que se obtienen a partir de la funcin g(x) misma
(Arfken y Weber, 1995), la que debe tener un nmero finito de discontinuidades y un
nmero finito de valores extremos, condiciones que son satisfechas en una imagen
digital. A partir de esta expresin, es posible deducir que si g(x) presenta variaciones
suaves, entonces la sumatoria se restringe a valores pequeos de m; a medida que g(x)
se hace ms compleja, es necesario incrementar el valor de m para una representacin
fiel de esta funcin, y en el caso lmite de un escaln, m tiene que ser infinito. De esta
forma es posible afirmar que el contenido de frecuencias espaciales de g(x) crece a
medida que sus cambios son ms abruptos, es decir, es necesario incluir en el desarrollo
dado por (I.6) a funciones de seno y coseno de frecuencias cada vez ms altas. Otra
manera de entender el concepto de frecuencia espacial es regresando a la figura I.7
donde, adems de la superficie que representa la imagen, se muestra tambin un objeto
slido esfrico llamado elemento estructural, el cual imaginemos, se desplaza por
debajo de todos los puntos de la superficie. A medida que el elemento estructural se
hace ms pequeo, es posible acomodarlo en los resquicios de la superficie; en este caso
se tienen frecuencias espaciales altas, si el elemento es grande para acomodarlo a los
cambios graduales de la superficie, se tienen entonces frecuencias espaciales bajas. Aun
cuando la expresin (I.6) describe un perfil a lo largo de la direccin x, el razonamiento
anterior se aplica a perfiles en cualquier direccin. En cuanto a la superficie de la figura
I.7, es posible esquematizar en primera aproximacin lo siguiente
Introduccin
19
textura gruesa superficie accidentada frecuencia espacial alta

textura suave superficie aplanada frecuencia espacial baja
Estas relaciones son aproximadas ya que para caracterizar adecuadamente la textura se
requieren de modelos ms elaborados (Peddle y Franklin, 1991; Hauta-Kasari et al.,
1999; Lira y Rodriguez, 2006).
Una manera de generalizar el concepto de frecuencia espacial es por medio de la
transformada de Fourier, que en dos dimensiones se define como (Bracewell, 1990;
Bracewell, 2000)
F [f ] F( v)
1
(2) 2
f (r) exp[2jr v]dr
(I.7)
Donde f(r) es una banda de una imagen multiespectral, F(v) es la transformada de

Fourier, r = (x,y), v = (s,t) y j es el nmero complejo (0,1). La funcin F(v) es en
general compleja y de la misma dimensin espacial que f(r). Empleando la frmula de
De Moivre, la exponencial compleja puede ser reescrita como sigue
exp[2jrv] = Cos[2rv] jSen[2rv]
(I.8)
La definicin (I.7) expresa por tanto que la tranformada de Fourier F es una expansin
del campo bi-dimensional f empleando como base las funciones Seno y Coseno de
frecuencia variable. Podra decirse por tanto, que la expresin (I.7) presenta
caractersticas similares a la ecuacin (I.6) en el sentido de frecuencia espacial arriba
definido. De esta manera, la transformada de Fourier es una cuantificacin bidimensional del contenido de frecuencias espaciales de la imagen. La transformada de
Fourier es lineal e invertible por lo que
F[f + g] = F[f] + F[g]
y

F 1 [F] f (r )
F(v) exp[2jr v]dv
Lo cual es fcil de demostrar a partir de la definicin (I.7). Debido a la linealidad de la

transformada de Fourier, se satisfacen los siguientes dos teoremas

F f (r )g(r )d F [f g] FG
(I.9)
LLamado teorema de la convolucin circular y donde = (,). El otro teorema se

escribe como
F[f(r )] = F(v)exp{2jv}
y
I.10)
20
F{exp[2jrv0]f(r)} = F(v v0)

Llamado teorema de Shifting (de traslacin). El teorema de la convolucin est
directamente relacionado con el proceso de generacin de una imagen digital ya que
caracteriza matemticamente la accin de un instrumento de observacin (sensor
remoto) al medir el promedio ponderado (figuras I.1 y III.4) de una observable fsica
sobre un intervalo de medida. Esta accin es precisamente la que se lleva a cabo al
medir las propiedades espectrales promedio de un CIV (figura I.1) para generar un
pixel. Mayores detalles de este proceso se estudian en la secciones III.2 y III.4. El
teorema de Shifting nos dice que la transformada de Fourier es bsicamente
independiente del origen de coordenadas, puesto que un desplazamiento en el espacio de
la imagen produce un cambio de fase en el espacio de Fourier. Inversamente, un
desplazamiento de frecuencias en el espacio de Fourier produce un cambio de fase en el
espacio de la imagen. La versin digital de la transformada de Fourier as como sus
propiedades fundamentales se estudian en detalle en la seccin IV.5.1.
I.2.10 Factores de contraste
Un aspecto que est relacionado con la apariencia visual de una imagen es el contraste
de la misma. Esta cantidad es, en general, una funcin de las coordenadas (x,y) ya que
las condiciones de iluminacin de la escena respectiva pueden cambiar. Por otro lado, la
psicovisin humana es sensible al contraste de la luminancia ms que al valor absoluto
de sta; no obstante, en una imagen digital es necesario introducir una definicin que
sea independiente de este tipo de apreciaciones subjetivas. Como ya se apunt arriba, el
contraste es una propiedad local de la imagen, por lo que se define aqu como la relacin
de valor que tiene uno o varios pixels con los vecinos prximos; veamos varios modelos
para cuantificar esta relacin. Sea pc el valor del pixel central de una ventana de 3 3
pixels y sea p el promedio de sus pixels vecinos en concetividad-8, entonces un factor
de contraste es el siguiente
fc1
pc p
pc p
(I.11)
sta es una cantidad puntual, pero es posible generalizarla a una regin si pc es el

promedio de los pixels de una ventana de 3 3 y p es el promedio de las ventanas de 3
3 que la rodean. El factor de contraste es una cantidad vectorial que vara de banda a
banda. Con la misma forma de la relacin (I.11) es posible evaluar el contraste de un
objeto con su entorno; en este caso, pc sera el promedio de los valores de los pixels que
componen el objeto y p sera el promedio de los pixels circundantes. Hay que hacer
notar que en imgenes de satlite el contraste aparente se reduce debido a la
interferencia atmosfrica (Song et al., 2001; Lira y Oliver, 1983; Lira y Oliver, 1984).
Otra definicin del contraste es: en una ventana cuadrada, se encuentran los valores
mximo y mnimo y se establece el cociente
Introduccin
fc 2
pmax pmin
pmax pmin
21
(I.12)
Con base en la respuesta logartmica del ojo humano (Pratt, 2001) se define el siguiente
factor de contraste
fc3 = alog{ p pc + 1}
(I.13)
donde a es una constante que se determina heursticamente para ajustar la brillantez y

contraste de la imagen resultante. Si la ventana es del mismo tamao que la imagen,
entonces se tiene una medida de su contraste global. El tamao de la ventana se ajusta a
la resolucin o detalle deseado. Igualmente, es posible deslizar la ventana sobre todos
los pixels de la imagen para obtener su distribucin de contraste. En el captulo IV se
ver una coleccin de transformaciones para modificar el contraste de una imagen con
propsitos de realce de una clase dada de patrones. Finalmente es necesario anotar que
el contraste global de una imagen multiespectral cambia de banda a banda.
I.2.11 Calidad de la imagen
Una imagen digital es una representacin de una escena bajo estudio; como tal, su
estructura y aspecto visual son importantes en cuanto a las conclusiones que pudieran
derivarse acerca del comportamiento de la escena. Por otro lado, la fidelidad con la que
la imagen digital caracteriza la escena es un aspecto que es estudiado con detalle en la
seccin III.3 y constituye una premisa bsica en el anlisis cuantitativo de patrones. Sin
embargo, existen limitaciones a dicha fidelidad, provenientes primordialmente del
mecanismo de digitizacin impuesto por el instrumento sensor y por fenmenos de
interferencia que introducen ruido y degradan las medidas que componen la imagen
digital resultante. De acuerdo con esto, es necesario plantear con cierto detalle el
concepto de calidad de la imagen de tal manera que permita cuantificar el resultado de
una transformacin aplicada a sta o a su contenido de informacin con relacin a la
escena que representa (Janssen, 2001). La calidad de una imagen est relacionada
bsicamente con el nmero de pixels y el nmero de niveles de cuantizacin en los
cuales se haya discretizado (espacial y radiomtricamente) la escena correspondiente.
La apariencia visual de la imagen mejora en funcin directa de estos dos parmetros
hasta un cierto lmite, ms all del cual no se aprecia ningn cambio, dada la limitacin
de la psicovisin humana (Barten, 1999; Malacara, 2002). Para una escena dada, de un
cierto tamao, el nmero de pixels determina en primera instancia el detalle ms
pequeo discernible en la imagen digital, siempre y cuando el nmero de niveles sea
mnimo: tpicamente 64 de ellos al menos. Si el nmero de niveles decrece, para un
tamao de imagen dado, los detalles se desvanecen gradualmente hasta el lmite mnimo
permisible de dos niveles, en esta situacin nicamente se apreciaran ciertos contornos
de las clases o patrones. La mayora de los sistemas digitizadores operan en 256 (28)
niveles y algunos de ellos lo hacen hasta en 4096 (212).
En principio, muchas escenas naturales tienen detalles muy finos, es decir, su
contenido de frecuencias espaciales es muy alto, de tal manera que el tamao asociado a
los pixels debe ser muy pequeo: del orden del detalle discernible, lo cual implica que la
22
imagen digital debe contener un gran nmero de pixels; una discusin cuantitativa de
esto se ver en el captulo III, al tratar sobre el teorema de muestreo. En concreto, entre
ms pixels y niveles tenga una imagen digital para una escena dada, diremos que
esperamos que su calidad sea mayor. Si bien estos dos factores son los ms importantes
en la definicin de la calidad, no son los nicos. Por otro lado, como se apunt arriba,
no es necesario incrementar indefinidamente el nmero de pixels y niveles ms all de
un cierto lmite, adems de que los requerimientos de almacenamiento y computacin
creceran a rdenes inmanejables. Los otros factores de los cuales depende la calidad de
una imagen son los siguientes: el contraste global, la definicin de los bordes y el
contenido de ruido. Si se desea una ptima calidad, es necesario que el contraste sea el
mximo posible, la definicin de los bordes sea precisa y el ruido sea mnimo. De
acuerdo con la definicin de contraste, su manifestacin es local y por tanto su valor
puede variar de un lugar a otro de la imagen, por lo que es necesario asegurarse de que
sea mximo en cualquier lugar de sta. En una representacin visual de una imagen
digital, la definicin de los bordes se plasma como en un efecto de enfoque: cuando
aquellos estn indefinidos, la imagen se ve desenfocada y viceversa. Los sistemas
sensores modernos generan muy poco ruido en la creacin de una imagen digital; no
obstante, en ciertas ocasiones algn medio externo puede introducir una seal que
degrada el resultado de la digitizacin. Lo que finalmente es de importancia en esta
situacin es la relacin de valor del ruido con respecto al del pixel en cualquier banda;
en todo caso se pretende que el cociente ruido/pixel sea mnimo. La calidad de la
imagen depende, de una manera compleja (Rosenfeld y Kak, 1982; Janssen, 2001), de
todos los parmetros arriba discutidos y es una medida que debe determinarse tanto para
la imagen original como para cualquier transformacin de sta.
I.3 Elementos de Anlisis

Al analizar una imagen digital se tiene como fin ltimo la cuantificacin de los patrones
que la componen, si bien rara vez se requiere de un estudio exhaustivo de stos; ms
bien en la mayora de los casos nicamente es necesario cuantificar un subconjunto de
ellos en el marco de un problema dado. Por cuantificar un patrn se entiende la
evaluacin de sus propiedades morfolgicas, espectrales y estadsticas. Para entender
esto es necesario primero introducir la siguiente definicin
Reconocimiento de Patrones: es la bsqueda de estructuras (clases) en la imagen,
donde sta se encuentra formada por todos los datos (pixels) generados por el
sistema sensor.
En esta definicin identificamos tres elementos
Bsqueda: tcnicas para procesamiento de datos; depende de stos, de los modelos
que se empleen para representarlos y de las estructuras que esperamos encontrar. La
bsqueda se refiere a los mtodos de anlisis de imgenes.
Datos: salidas del sistema sensor; contienen informacin sobre el proceso que los
gener. Los datos se refieren al conjunto de pixels que forman la imagen.
Estructura: es la manera en que dicha informacin puede ser organizada de tal manera
que las relaciones entre las variables del proceso son identificadas. Las estructuras se
Introduccin
23
refieren a los patrones y las clases de stos.

Una imagen digital multiespectral contiene cierta riqueza de informacin sobre la
escena observada; el objeto del reconocimiento de patrones consiste en sintetizar y
presentar dicha informacin de una manera que sirva como alimento al modelaje de la
escena y al comportamiento del sistema fsico correspondiente. En cuanto a la
informacin de la imagen, y en forma inversa a lo arriba explicado, es posible plantear
el siguiente esquema
los datos la contienen
Informacin la bsqueda la reconoce

la estructura la representa
En trminos de las definiciones manejadas en este captulo, podemos decir de modo ms

especfico que el reconocimiento de patrones es el resultado de haber aplicado una o
varias mtricas a las propiedades que caracterizan los patrones o clases de patrones
presentes en una imagen; es decir, el reconocimiento de patrones es bsicamente un
proceso de medida aplicado a la imagen. Las propiedades y las mtricas deben ser
previamente definidas por medio de modelos matemticos pertinentes. Por ejemplo,
supongamos que se desea medir el permetro de un patrn espacial que tiene forma de
polgono cerrado, para esto es necesario un modelo matemtico de distancia entre pixels
tal como la euclidiana
de(r1,r2) = [(x1 - x2)2 + (y1 - y2)2]1/2
(I.14)
o bien el valor absoluto de la diferencia

da(r1,r2) = x1 - x2 + y1 - y2
(I.15)
o el mximo del valor absoluto de la diferencia

dab(r1,r2) = max[x1 - x2, y1 - y2]
(I.16)
donde r1 y r2 son dos pixels contiguos del permetro y (x1, x2), (y1, y2) son sus
respectivas coordenadas. En la figura I.8a se muestran las distancias, desde el pixel
central hacia la periferia, calculadas con la expresin (I.15) y en la figura I.8b las
distancias calculadas con la ecuacin (I.16). A la distancia da(r1,r2) se le conoce tambin
como d4(r1,r2) y a la distancia dab(r1,r2) se le conoce como d8(r1,r2). A la trayectoria que
corresponde a la distancia ms corta entre dos pixels se le llama una geodsica. Esta
trayectoria depende del esquema de conectividad que se determine en una imagen tal
como se aprecia en la figura I.8c; para la distancia euclidiana solo existe una geodsica,
pero para conectividad 4 u 8 puede haber varias geodsicas.
Es necesario definir una unidad de medida, que en este caso es una distancia patrn
tal como el centmetro o el metro. La aplicacin sucesiva de esta unidad, de acuerdo con
uno de los modelos dados por (I.14) a (I.16) a cada uno de los pixels del permetro,
proporciona un nmero que representa la longitud total del borde del patrn espacial;
este proceso se realiza sobre aquella banda donde se encuentre ms evidente el
24
polgono. Una vez medidas suficienes propiedades de este patrn, de tal manera que
unvocamente se le distinga de otros, se dice entonces que se le ha reconocido, todo esto
contando siempre con la premisa de que previamente se ha determinado lo que se
entiende como polgono, es decir, no se puede reconocer lo que no se ha definido. El
razonamiento anterior se aplica de modo similar a clases de polgonos. Con los modelos
y las unidades de medida adecuadas pueden establecerse diversas propiedades de otros
patrones.
Figura I.8. Funcin de distancia para conectividad 4 (a) y conectividad 8 (b).

Geodsicas para distancia euclidiana, conectivdad 4 y conectividad 8.
Las definiciones de distancias, tales como las expresadas en las ecuaciones (I.14),
(I.15) y (I.16), convenie disearlas de tal manera que constituyan una mtrica. Una
mtrica es una distancia que satisface las siguientes condiciones
d(r1,r2) 0,
d(r1,r2) = d(r2,r1),
d(r1,r3) d(r1,r2) + d(r2,r3),
positividad
simetra
desigualdad de Schwarz
(I.17)
Las distancias (I.14) a (I.16) satisfacen lo anterior y son por tanto mtricas; lo mismo
puede afirmarse de las expresiones (VII.159) a (VII.165).
Introduccin
25
Es comn que una imagen no presente el estado geomtrico y radiomtrico adecuado

para una tarea de reconocimiento de patrones, en esta situacin es pertinente aplicar a la
imagen una transformacin que ponga en evidencia uno o varios patrones. De esta
manera introducimos ahora la definicin de realce
Realce: transformacin sobre la imagen diseada para incrementar la distancia entre
un conjunto de patrones. La distancia est determinada por una mtrica que resulta
de un modelo matemtico que caracteriza la tarea de realce; esta distancia es una
medida de la separabilidad entre los patrones en el espacio de rasgos.
Una vez aplicado el realce a una imagen es posible proceder a tareas de segmentacin y
reconocimiento de patrones.
En una imagen puede estar presente una variedad de objetos (patrones espaciales)
cuya estructura geomtrica es necesario estudiar y cuantificar, de aqu entonces que sea
conveniente el considerar la morfologa de stos. Desde el punto de vista etimolgico la
morfologa es el estudio de la forma y la estructura de un objeto, incluyendo su textura.
Se dice, por tanto, que la morfologa es la descripcin cuantitativa de la organizacin
espacial de los objetos inmersos en la imagen. De aqu, las propiedades morfolgicas de
los patrones espaciales se dividen en dos grandes grupos
Regionales rea, centroide, compactacin, excentricidad, forma, permetro,
rugosidad del permetro y textura.
Globales contraste, definicin, textura, calidad.
Las propiedades regionales se refieren a caractersticas locales y las globales a las de
toda la imagen. La textura se encuentra en ambos grupos ya que es posible evaluarla
tanto para un objeto como para toda la imagen. Si bien el contraste puede calcularse
localmente, se ha clasificado como global, ya que en general es de inters el conocerlo
en el total de la imagen. A las propiedades morfolgicas arriba listadas, se les conoce
tambin como descriptores y ms detalles se vern a lo largo del libro, en particular en
el captulo VII.
En cuanto a las propiedades estadsticas es necesario distinguir las relacionadas con
los patrones mismos y con grupos de ellos. Para patrones espectrales (uno o varios
pixels) es posible evaluar la media y la desviacin estndar; para clases espectrales, las
matrices de covarianza y correlacin proporcionan detalles sobre su compacidad o
dispersin espectral y sobre su redundancia a travs de las bandas que componen una
imagen multiespectral. La distancia de tales clases en un espacio espectral est
cuantificada por la divergencia o la distancia de Jeffries-Matusita (Richards y Jia, 1999),
las cuales miden la separacin espectral que hay entre una coleccin de grupos de pixels
con caractersticas similares entre ellos. Esta separacin es necesaria para validar la
calidad de una segmentacin hecha con base en las propiedades espectrales de los
patrones de la imagen.
En la generalidad de los casos, los patrones o clases de inters no se encuentran en la
imagen en el aspecto adecuado para su reconocimiento. En ocasiones los patrones estn
inmersos en ruido o su definicin espacial no es clara; en otras, su aspecto geomtrico
no es el deseado. Es posible tambin que la imagen presente una degradacin (como
borrosidad) que haga confusa la presencia de un patrn o clase. En la mayora de los
26
casos es necesario realzar o poner en evidencia un patrn antes de proceder a su

reconocimiento; en general puede resumirse este procedimiento en el siguiente esquema
Imagen Realce Segmentacin Reconocimiento de Patrones.
Se parte, por tanto, de una imagen y se le aplican todos los procesos de realce necesarios
para poner en evidencia los patrones de inters, esto puede incluir restauraciones,
cambios en el aspecto geomtrico, pseudocoloracin o filtros; en los captulos IV a VIII
se estudian todas estas tcnicas y otras comnmente empleadas. Una vez hecho el
realce, se procede a separar o a segmentar los patrones para finalmente aplicarles las
operaciones necesarias que conduzcan a la cuantificacin de sus propiedades
morfolgicas, espectrales y estadsticas; los mtodos ms importantes para tal
cuantificacin se detallan en el captulo VII.
Una de las grandes reas del reconocimiento de patrones es la que se refiere a la
clasificacin de los mismos; sta se divide en dos grandes grupos: clasificacin no
supervisada y clasificacin supervisada, si bien es necesario hacer una aclaracin con
respecto a esta terminologa. La clasificacin no supervisada es un trmino que ha sido
tradicionalmente aplicado al anlisis de cmulos, que ms bien es un mtodo de
segmentacin; no obstante, esta segmentacin seguida de una etiquetacin
(identificacin) de cada cmulo, de acuerdo con los objetos de la imagen, s constituye
una clasificacin y sta es la manera como se maneja en la prctica. Para ahondar en
esto, consideremos ahora lo siguiente: Sea R = {p1, p2, . . . pMN} el conjunto de pixels de
una imagen multiespectral cualquiera, donde MN es el nmero total de pixels que la
conforman, entonces
Anlisis de cmulos en R significa la determinacin de un entero c (nmero de
cmulos), tal que 2 c MN, y la definicin de una particin (segmentacin) de R
en c subconjuntos (cmulos) de R mutuamente exclusivos y colectivamente
exhaustivos.
Se parte del supuesto de que los pixels de cada cmulo son espectralmente ms
similares que aquellos de cmulos diferentes; es necesario en consecuencia el
proporcionar una medida de similitud antes de iniciar el anlisis de cmulos. El
resultado de este proceso revela una cierta estructura en los pixels de la imagen, la que a
su vez puede indicar una asociacin entre stos. Los pixels que presentan una asociacin
estn relacionados presumiblemente con regiones de la escena que presentan
propiedades espectrales parecidas. Si un determinado patrn o clase est asociado con
un objeto cuyos pixels son cercanos en valor, entonces la identificacin del cmulo
correspondiente es directa, es decir, este anlisis es vlido nicamente cuando se supone
que los objetos de la escena estn caracterizados por clases espectrales bien definidas.
En otras palabras, al segmentar una imagen en cmulos, se espera que la misma
subestructura exista en el proceso que genera los pixels (la imagen). Asociada al anlisis
de cmulos se encuentra el problema de determinar el nmero c, es decir, el nmero
ms apropiado de cmulos en R, a esto se le conoce como el problema de la validez de
cmulos y est directamente relacionado con la complejidad o heterogeneidad de la
imagen. Hay que hacer notar que el anlisis de cmulos est basado en la identificacin
de grupos de pixels con valores similares. Los pixels, como se defini con anterioridad,
Introduccin
27
constituyen patrones espectrales; por este motivo al anlisis de cmulos se le conoce

tambin como clasificacin espectral no-supervisada.
Otro ejemplo relevante en el mbito del reconocimiento de patrones es lo que se
conoce como clasificacin espectral supervisada. Sea ahora S el espacio de datos a
partir del cual R ha sido extrado, es decir, R S, entonces
Una Clasificacin Supervisada para S es un dispositivo (operacin) por medio del
cual S mismo es particionado en c regiones de decisin. La representacin explcita
de estas regiones depende de la naturaleza de S, de la manera en que se formen y del
modelo que se escoja para ello. El papel que juegan los datos del subespacio R en el
diseo del clasificador depende tambin de estos factores.
Los pixels contenidos en R son considerados como los datos (pixels) prototipo y se
emplean para calibar al clasificador, es decir, para determinar el valor explcito de las
regiones de decisin a partir de las cuales se segmentan y clasifican los pixels de la
imagen. En algunas realizaciones particulares de este tipo de clasificacin se define una
coleccin de subespacios R1, R2, . . . Rc, uno para cada objeto o clase espectral en que
se desee particionar la imagen. Se considera que las Ri contienen los pixels prototipo de
cada clase y que son identificados explcitamente por algn mecanismo externo al
clasificador. En la clasificacin supervisada las clases espectrales se identifican de
antemano, mientras que en la clasificacin no supervisada se hace posteriormente. De
acuerdo con el planteamiento hecho, las Ri pueden provenir de un anlisis de cmulos
previo, seguida de una identificacin de las clases con las que estn relacionadas, para
finalmente alimentar al clasificador supervisado. El anlisis de cmulos y la
clasificacin supervisada se revisan en detalle en el captulo VII.
En general, es posible afirmar que si la segmentacin en cmulos o la determinacin
de los pixels prototipo se basan nicamente en el valor de cada uno de stos por
separado, se tiene entonces una clasificacin espectral puntual. Si el proceso incluye
informacin espacial, se tiene un clasificador espectral contextual; un ejemplo de ste es
el crecimiento de regiones (Wahl, 1987; Kai y Muller, 1991; Woodcock y Harward,
1992; Lira y Frulla, 1998; Fan et al., 2005), que se estudia en el captulo VII, si bien hay
otros mtodos contextuales reportados en la literatura (Gong y Howarth, 1992; Arai,
1993; Kontoes y Rokos, 1996; Lira y Malleti, 2002) que incluyen propiedades
espectrales y algunos aspectos espaciales de los pixels modelados, ya sea en forma
determinista o probabilstica por medio de conjuntos borrosos (Bezdek, 1987; Foody,
1996), siendo este esquema hbrido el que ha ocupado la atencin de los investigadores
en los ltimos aos y el que ha producido los mejores resultados en cuanto a
segmentacin espectral. Una compilacin detallada de mtodos de clasificacin se
proporciona en Lu y Weng (2007).
Existe una clase de imgenes donde los patrones presentes muestran una estructura
regular tal que un objeto puede representarse por un conjunto de elementos estructurales
o primitivos. Al incorporar una sintaxis que define la organizacin de estos elementos
es factible derivar una representacin sintctica (Gonzalez y Thomason, 1978; Jain,
1989) de los patrones. En la representacin sintctica se tiene una cadena de smbolos o
primitivos arreglados de acuerdo con un modelo determinado por la sintaxis, de tal
manera que slo se permite una representacin: un objeto o patrn especfico. Cuando
un patrn o clase de patrones se reconoce en funcin de la organizacin de los
28
primitivos que lo componen se dice que se hace reconocimiento sintctico de patrones.

En una imagen de una escena real, y en particular las imgenes de satlite, rara vez se
presenta la posibilidad de realizar una representacin sintctica de los patrones de
inters, de aqu que este tema no sea ms tratado en este libro. No obstante, el
reconocimiento sintctico es un rea de inters en imgenes con estructuras regulares
tales como subclases de neutrografas, radiografas y tomografas o en aquellas donde se
presentan texturas homogneas como las imgenes de huellas digitales.
I.4 Clase de imgenes

Las imgenes digitales generadas por sensores remotos se dividen en cinco grupos de
acuerdo al esquema de observacin y al sensor empleado, a saber
a) pticas Llamadas de esta manera porque las bandas que las componen se
encuentran en la regin ptica del espectro electromagntico (apartado II.1.1,
Cuadro I.1), estas imgenes son generalmente multi-espectrales.
b) Radar Producidas en la regin de microondas del espectro electromagntico
(cuadro I.1), estas imgenes son generalmente mono-espectrales, si bien el
desarrollo tecnolgico permite actualmente contar con imgenes en diferentes
longitudes de onda y polarizaciones.
c) Acsticas Generadas empleando seales acsticas coherentes, llamadas tambin
ecografas, estas imgenes son generalmente mono-espectrales.
d) Micrografas Obtenidas empleando un haz de electrones generado y controlado por
un microscopio electrnico, estas imgenes son generalmente mono-espectrales.
e) Tomografas Obtenidas ya sea por medio de un haz de positrones o por medio de
un tren de pulsos de radiacin electromagntica controlados por un tomgrafo, estas
imgenes son generalmente mono-espectrales.
f) Radiografas Generadas empleando rayos X, estas imgenes son generalmente
mono-espectrales.
Cuadro I.1.- Regiones del espectro electromagntico.
Regin
Rayos X
Ultravioleta
Violeta
Azul
Verde
Amarillo
Anaranjado
Rojo
Visible
Infrarrojo cercano
Infrarrojo medio
Infrarrojo lejano
[0.001 1.00] nm
[0.001 0.40] m
[0.40 0.45] m
[0.45 0.51] m
[0.51 0.56] m
[0.56 0.59] m
[0.59 0.63] m
[0.63 0.70] m
[0.40 0.70] m
[0.70 3.00] m
[3.00 30.0] m
[30.0 100.0] m
Regin
Microondas
Banda Q
Banda W
Banda V
Banda Ka
Banda K
Banda Ku
Banda X
Banda C
Banda S
Banda L
Banda P
[0.1 100.0] cm
[0.10 0.27] cm
[0.27 0.40] cm
[0.40 0.75] cm
[0.75 1.11] cm
[1.11 1.67] cm
[1.67 2.50] cm
[2.50 3.75] cm
[3.75 7.50] cm
[7.50 15.0] cm
[15.0 30.0] cm
[30.0 100.0] cm
Introduccin
29
La clase (a) de imgenes es generada por medio de sistemas pasivos, las clases (b) a
(f) de imgenes son producidas empleando sistemas activos (Lira, 2003). En los
captulos II y VIII se proporcionan detalles de las clases (a) y (b) respectivamente; de
las clases restantes se dan nicamente algunos detalles generales. En el apendice B se
proporcionan detalles de la dinmica orbital y los aspectos tcnicos de los satlites que
generan regularmente imgenes de las clases (a) y (b).
I.5 Consideraciones en Cuanto a Mtodos Computacionales

La dimensin espacial y espectral de las imgenes digitales puede variar ampliamente:
desde imgenes monoespectrales de laboratorio de 256 x 256 pixels, hasta imgenes
multiespectrales de satlite de 8000 x 8000 pixels con siete bandas. Algunas
transformaciones de realce a la imagen, y en general los procesos de reconocimento de
patrones, demandan de un cmputo intensivo: tanto en capacidad de almacenamiento
como en rapidez de clculo. Una imagen de satlite ocupa un espacio del orden de 450
MB y una clasificacin espectral de la misma requiere, desde varias decenas de minutos,
hasta varias horas en una PC de buena capacidad. De aqu la necesidad de contar con
mtodos eficientes de almacenamiento y procesamiento de imgenes; al respecto existe
una gran variedad de mtodos y procedimientos. En cuanto a compresin de imgenes
para su almacenamiento y transmisin se encuentran publicadas en la literatura
metodologas de carcter general (Rabbani y Jones, 1991) y de tipo especfico tal como
la compresin por fractales (Barnsley y Hurd, 1993). En cuanto a transformaciones a la
imagen y tcnicas de reconocimiento de patrones es posible encontrar rutinas de
carcter general en lenguajes como Pascal (Press et al., 1992) o en C (Myler y Weeks,
1993; OGorman et al., 2008). En lenguaje cdigo existen colecciones de algoritmos
(Pavlidis, 1982; Jhne, 1993) que pueden ser implantados en el lenguaje de mayor
conveniencia al usuario.
Es posible encontrar paquetes o sistemas computacionales para analizar imgenes,
de entre los cuales pueden mencionarse los ms importantes: los paquetes comerciales
(PCI, ENVI, IPLIB, MIPS, ITEX, Visilog, Image Pro, ERDAS, e IDRISI) cuyos precios
van desde quinientos hasta varias decenas de miles de dlares y que trabajan en varias
plataformas y medios computacionales. Algunos otros publicados en la literatura con
diferentes capacidades y medios de operacin (Bernstein y Ferneyhough, 1975;
Wharton y Turner, 1981; Landy et al., 1984; Harrington et al., 1986; Bryant, 1990;
Sader y Winne, 1991; Lira y Landgrave, 1992). Algunos de ellos estn especializados
hacia una tarea especfica (Wharton y Turner, 1981; Bryant, 1990) y otros hacia un
campo definido, como la Percepcin Remota (Bernstein y Ferneyhough, 1975; Landy et
al., 1984), un sistema experto (Schowengerdt y Wang, 1989), o para educacin (Sader y
Winne, 1991). Para imgenes de radar, se encuentran disponibles los paquetes de
software libre: RAT, Idiot, PolSarPro y Nest.
I.6 Ejercicios
1. Con base en la figura 1.1 haga un diagrama de un sistema de captura de imgenes
empleando un arreglo matricial de detectores para capturar 4 bandas
30
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
simultneamente. Defina los cuatro intervalos del espectro electromagntico, as

como el tamao del pixel, que mejor se acomoden para una aplicacin especfica
tal como geologa, silvicultura, urbanismo, aguas superficiales, o desertificacin.
La cuantizacin radiomtrica se hace generalmente a 256 niveles, plantee en cules
casos se requerira de un nmero mayor de niveles.
Explique cules son las tres caractersticas de un pixel.
Si en una imagen de satlite un pixel representa la reflectividad promedio del CIV
correspondiente, en una radiografa y en una tomografa computada que
representara?.
La definicin de patrn proporcionada en este captulo es de caracter general; d
una definicin especfica para imgenes digitales multiespectrales.
En la figura I.4 defina un patrn espectral y uno espacial.
En una malla digital defina el polgono de una figura irregular, escriba la cadena de
Freeman para conectividad 4 y para conectividad 8.
Proporcione un ejemplo donde dos texturas diferentes estn asociadas con la misma
frecuencia espacial, apyese para esto en la figura I.7.
Generalice a dos dimensiones la expresin I.6 y derive conclusiones para una
frecuencia espacial bi-dimensional.
En la definicin de reconocimiento de patrones la bsqueda de estructuras es uno de
sus elementos, para una imagen multiespectral defina una estructura espectral y una
espacial.
Demuestre que son mtricas las expresiones de distancia dadas por (I.14), (I.15) y
(I.16).
Una primera aproximacin para medir la distancia entre clases espectrales sera
calcular la diferencia de los promedios, 1 y 2 respectivamente, de los valores de
los pixels que componen cada clase: 1 - 2. Defina una primera aproximacin
para evaluar la distancia entre dos clases de textura.
D un ejemplo cualitativo de la generacin de una imagen bajo condiciones de
ruido y de borrosidad.
Reescriba la definicin de anlisis de cmulos para incluir el caso de pixels no
clasificados que se encuentren en la frontera entre dos cmulos en relacin a un
criterio de distancia.

Elementos de Una Imagen Digital - Jorge Lira Chavez

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Elementos de Una Imagen Digital - Jorge Lira Chavez

Caricato da

Copyright:

Formati disponibili

Introduccin

I.1 Aspectos Generales

Tratamiento Digital de Imgenes Multiespectrales

automtico equipara o supera la funcin cerebral correspondiente, tal es el caso de la

I.2 Elementos de una Imagen Digital

Tratamiento Digital de Imgenes Multiespectrales

general y la identificacin de los elementos de la imagen no depende de estos detalles

donde bi es el valor numrico (entero) obtenido para el intervalo de energa Ei. La

Ei+1 Ei, o i+1 i

de tal manera que

Tratamiento Digital de Imgenes Multiespectrales

espectrales de un CIV quedan representadas por el pixel correspondiente, estando

El CIV es un elemento fsico de la escena y el pixel es un elemento lgico de la imagen

donde M y N son enteros y representan el nmero de CIVs en los cuales se dividi la

Donde k y, 7 k 12 en imgenes multiespectrales. De aqu entonces una imagen

El conjunto de vectores {u(x1,x2, . . . x)} es el resultado de proyectar la imagen

Tratamiento Digital de Imgenes Multiespectrales

Figura I.3. Campo vectorial de una imagen de dos bandas.

Tratamiento Digital de Imgenes Multiespectrales

Figura I.4. Imagen multiespectral de cuatro bandas.

Tratamiento Digital de Imgenes Multiespectrales

ms bien azarosa o aleatoria, a diferencia del ruido donde el mecanismo fsico es

Tratamiento Digital de Imgenes Multiespectrales

En este ltimo ejemplo la segmentacin es ms elaborada ya que el ruido est

principal nicamente si pasa por el centro de un conjunto de pixels alineados y

Tratamiento Digital de Imgenes Multiespectrales

llamados vecinos de rij. La dupla de conjuntos [N,V] denota un conjunto N de sitios

En conectividad 4, los cliques seran por tanto C1 = {pi,j}, C2 = {pi-1,j pi,j} y C3 =

y el conjunto completo de cliques sera C = C1 C2 C3. Es necesario

Por tanto, el conjunto completo de cliques para conectividad 8 sera C = C1 C2 C3

mencionada es una sucesin de crestas y valles cuya amplitud y alternancia determinan

Tratamiento Digital de Imgenes Multiespectrales

textura gruesa superficie accidentada frecuencia espacial alta

f (r) exp[2jr v]dr

Donde f(r) es una banda de una imagen multiespectral, F(v) es la transformada de

F(v) exp[2jr v]dv

Lo cual es fcil de demostrar a partir de la definicin (I.7). Debido a la linealidad de la

LLamado teorema de la convolucin circular y donde = (,). El otro teorema se

Tratamiento Digital de Imgenes Multiespectrales

F{exp[2jrv0]f(r)} = F(v v0)

sta es una cantidad puntual, pero es posible generalizarla a una regin si pc es el

donde a es una constante que se determina heursticamente para ajustar la brillantez y

Tratamiento Digital de Imgenes Multiespectrales

I.3 Elementos de Anlisis

refieren a los patrones y las clases de stos.

Informacin la bsqueda la reconoce

En trminos de las definiciones manejadas en este captulo, podemos decir de modo ms

o bien el valor absoluto de la diferencia

o el mximo del valor absoluto de la diferencia

Tratamiento Digital de Imgenes Multiespectrales

Figura I.8. Funcin de distancia para conectividad 4 (a) y conectividad 8 (b).

Es comn que una imagen no presente el estado geomtrico y radiomtrico adecuado

Tratamiento Digital de Imgenes Multiespectrales

casos es necesario realzar o poner en evidencia un patrn antes de proceder a su

constituyen patrones espectrales; por este motivo al anlisis de cmulos se le conoce

Tratamiento Digital de Imgenes Multiespectrales

primitivos que lo componen se dice que se hace reconocimiento sintctico de patrones.

I.4 Clase de imgenes

I.5 Consideraciones en Cuanto a Mtodos Computacionales

Tratamiento Digital de Imgenes Multiespectrales

simultneamente. Defina los cuatro intervalos del espectro electromagntico, as

Potrebbero piacerti anche