Sei sulla pagina 1di 42

Conceptos fundamentales de tora de la imagen digital

Conceptos Fundamentales de Teora de la Imagen Digital


1 Nociones elementales sobre teora de la imagen y de las seales........................................... 3
Nocin general de imagen .................................................................................................................... 3 Nocin informtica de imagen ............................................................................................................. 4 La imagen como seal .......................................................................................................................... 4 Muestreo y cuanticacin .................................................................................................................... 5 Rastreo (rastering) ................................................................................................................................ 6 Procesamiento y anlisis de imgenes ................................................................................................ 7 Resolucin ............................................................................................................................................ 9 Nmero de grises .................................................................................................................................. 9 Nmero de colores.............................................................................................................................. 10 Pixelacin ........................................................................................................................................... 11 Contorneado ....................................................................................................................................... 12 Ruido .................................................................................................................................................. 12 Aliasing ............................................................................................................................................. 13 Antialiasing ........................................................................................................................................ 14 Medios de obtencin de una imagen digital ....................................................................................... 16 Escners. Funcionamiento general ..................................................................................................... 17 Tipos de escners ................................................................................................................................ 18 Procedimientos corrientes de digitalizacin ....................................................................................... 20 Cmaras digitales. Otros medios ........................................................................................................ 21 Volumen y equipamiento requerido ................................................................................................... 22 Formatos ............................................................................................................................................. 22 Compresin ........................................................................................................................................ 24 Conversin.......................................................................................................................................... 25 Operaciones geomtricas .................................................................................................................... 26 Operaciones puntuales de transformacin de valores. Mapas de grises. Histogramas ...................... 27 Operaciones locales de transformacin de valores. Filtros ................................................................ 31 Parmetros de control ......................................................................................................................... 33 Resolucin y resoluciones .................................................................................................................. 33 Semitonos, "lineatura" y dithering ..................................................................................................... 34 Color ................................................................................................................................................... 36 Dispositivos ........................................................................................................................................ 39

2 Parmetros de control de la calidad de una imagen ................................................................ 9

3 Perturbaciones caractersticas de las imgenes y mtodos de correccin............................. 10

4 Medios y mtodos de digitalizacin ..................................................................................... 16

5 Almacenamiento ................................................................................................................... 22

6 Operaciones con imgenes .................................................................................................... 26

7 Impresin .............................................................................................................................. 33

8 Aplicaciones arquitectnicas................................................................................................. 40

Aplicaciones informticas en arquitectura

Conceptos Fundamentales de Teora de Imagen Digital


(Esta monografa es una adaptacin del captulo 6 del libro Aplicaciones Informticas en Arquitectura, UPC, 1999, de Javier Monedero)

El tratamiento de imgenes permite actuar directamente sobre los resultados visibles del proceso de computacin, tanto en fases intermedias como en la fase nal de un proyecto. En este captulo se presentan los conceptos fundamentales, las tcnicas y los mtodos de procesamiento de imgenes, que tienen especial incidencia en el diseo arquitectnico, con especial nfasis en las aplicaciones que se valen de procedimientos grcos equivalentes a los de las tcnicas tradicionales de pintura. El tratamiento de imgenes ha conocido un desarrollo espectacular en los ltimos aos y constituye uno de los sectores de investigacin ms activos en los pases desarrollados. Recordaremos brevemente el contexto en que esto se ha llevado a cabo antes de proseguir describiendo las herramientas que pueden relacionarse de modo ms directo con las aplicaciones arquitectnicas. Una de las primeras aplicaciones del tratamiento de imgenes consisti en la mejora de fotografas de peridico enviadas por un cable submarino entre Londres y Nueva York, por medio del sistema Bartlane, inventado en 1921. A travs del cable se transmitan impulsos elctricos codicados en cinco niveles de brillo. Con posterioridad, en 1929, se ampliaron estos niveles a 15 tonos, gracias a los cuales una especie de mquina de escribir imprima la fotografa al otro lado del cable al cabo de tres horas. Aunque las mejoras de los mtodos para la transmisin de imgenes continuaron durante los 35 aos siguientes, no fue hasta la aparicin de los primeros ordenadores digitales que el procesamiento de imgenes se consolid como disciplina cientca. La utilizacin de las tcnicas computacionales procedentes de las misiones es-

paciales, realizadas a partir de 1964 por el JPL (Jet Propulsion Laboratory) en Pasadena, California, se considera el inicio de lo que ahora se denomina procesamiento digital de imgenes. Los primeros trabajos fueron realizados a partir de la imgenes de la Luna, transmitidas por la sonda Ranger 7, que fueron procesadas por un computador para corregir diversos tipos de distorsin inherentes a la cmara utilizada. Aquellas tcnicas sirvieron como base a los mtodos utilizados para la mejora y restauracin de imgenes de los programas Surveyor, Mariner y Apollo. A partir de 1967 estas experiencias se aplicaron al campo de la salud pblica con programas de investigacin realizados por la Escuela de Medicina de UCLA, de las cuales se hizo eco el National Institute of Health que subvencion al JPL en tres lneas de investigacin, las imgenes en microscopa ptica, electrnica y de rayos X, para el estudio de la arteriosclerosis, el cncer cervical, y otras patologas. El procesamiento de imgenes es la base de otras potentes rea de investigacin, el anlisis de imgenes y la visin por computador, de las que se han derivado indirectamente muchas herramientas de uso corriente. Estas se originaron principalmente en las investigaciones del MIT, en Harvard y de la Universidad de Stanford, en California a nales de los sesenta, en el campo de la robtica. En Japn se desarrollaron otros proyectos similares entre los que se puede citar el PIPS (Pattern-Information Procesing System) hacia 1970. En 1976, en Estados Unidos, el ARPA (Advanced Reasearch Project Agency) nanci otra serie de proyectos, que permitieron avances considerables. En este contexto hay que mencionar las notables contri-

Conceptos fundamentales de tora de la imagen digital

buciones tericas de David Marr, en la dcada de los setenta. Por lo que respecta a Europa, los primeros precedentes del procesamiento y el anlisis de imgenes se pueden remontar a los siglos XVIII y XIX, y a autores como Crofton, Euler o Minkowsky, que desarrollaron muchas herramientas matemticas utilizadas actualmente en el tratamiento de imgenes. De 1848 son los primeros trabajos de estereologa en el campo de la geologa, que pueden relacionarse con contribuciones recientes, tales como la geometra fractal de Mandelbrot o la morfologa matemtica de G. Matheron y J. Serra. De todo este conjunto de investigaciones han surgido aplicaciones a muy diversas reas, tales como la geografa o la meteorologa, a partir del procesamiento de fotografas tomadas por satlites; la arqueologa, en donde ha sido posible recuperar pinturas borradas mediante tcnicas de anlisis, en fsica, con aplicaciones al campo de las altas energas. En arquitectura las aplicaciones principales se han dado en fotogrametra y, ms recientemente, en la aplicacin de tcnicas de manipulacin digital al desarrollo de proyectos.

riremos ms adelante. Nocin general de imagen En trminos generales, se entiende por "imagen" la apariencia visible de una forma. Esta denicin se extiende corrientemente hasta aceptar que una imagen es, as, la "representacin" de una forma o de una entidad determinada. La palabra "imagen" tiende a confundirse, por un lado, con la cosa misma, como sera en el caso de un objeto que slo tuviera dos dimensiones, y, por otro lado, con un smbolo de la cosa, como sera en el caso de la planta de una vivienda, entendida como representacin de su espacio interior. Adems de las imgenes fsicas visibles hay tambin imgenes fsicas invisibles, o imgenes que tienen las mismas caractersticas que las visibles pero quedan fuera del rango al que los seres humanos son sensibles, por ejemplo las imgenes infrarrojas o ultravioletas, que pueden ser visualizadas por medio de ltros especiales. Tambin cabe hablar de imgenes abstractas, tal como las imgenes matemticas que son conceptos y, en consecuencia, invisibles, pero que admiten representaciones de diverso tipo. Tambin podemos puntualizar que las imgenes fsicas visibles pueden ser permanentes; por ejemplo un cuadro, un documento impreso, o transistorias tales como las producidas por un monitor CRT. La distincin entre imagen, en su acepcin

1 Nociones elementales sobre teora de la imagen y de las seales


Los apartados que siguen resumen algunas de las principales nociones tericas que estn en la base de las tcnicas de aplicacin a las que nos refere-

Figura 1 La imagen como funcin de valores (tomado de Monet: "La dbcle", 1880, Lille, Muse des Beaux-Arts)

Aplicaciones informticas en arquitectura

general, e imagen en el sentido tcnico que se desarrollar en lo que sigue, es ms que una precisin semntica y debe tenerse en cuenta en las aplicaciones a las que est introduccin va dirigida. Nocin informtica de imagen En trminos informticos, una imagen es, como veremos a continuacin, un caso particular de seal, ms exactamente, una funcin que especica una determinada distribucin de intensidades lumnicas. Dicho de otro modo, una imagen es entendida, desde este punto de vista, como la serie de valores atribuidos a una funcin bidimensional que asigna a todos los puntos de un segmento de un plano un valor visual determinado. En el caso de una imagen monocromtica este valor vendra dado por una funcin simple de dos variables f(x,y), en donde x,y denotan coordenadas espaciales y f un valor en cada punto que es proporcional a la intensidad de iluminacin en ese punto o "nivel de gris", en el caso de una imagen acromtica. Las coordenadas x, y estn referidas a un mbito espacial determinado, por ejemplo, por un extremo inferior x0y0 y un extremo superior xmaxymax. En el caso de una imagen cromtica esta valor vendra dado por tres funciones simples de dos variables, fr(x,y), fg(x,y), fb(x,y), que expresaran la intensidad de iluminacin de un punto x,y, en el mismo mbito, y para los tres componentes cromticos primarios rojo (R), verde (G) y azul (B). La gura 1 ilustra esta denicin. La imagen que se muestra se puede suponer que est captada de un monitor con una resolucin de 1.024 puntos en sentido horizontal y 768 en sentido vertical, una resolucin corriente en los monitores actuales. Internamente, esto se representa en un sistema de coordenadas, el sistema propio del dispositivo de salida, con el origen 0,0 en la parte superior izquierda y el nal, correspondiente a las coordenadas 1.024, 768 en la parte inferior derecha. El punto marcado tiene las coordenadas 850, 545. Vamos a suponer, para simplicar detalles tcnicos que la funcin asociada asigna a este punto el valor 34 sobre un rango de 256 valores posibles, esto es, f(x,y) = 34. Este valor se traduce a la intensidad de los caones que envan electrones hacia la pantalla, con el resultado de que los diminutos

puntos de fsfor son estimulados en una proporcin equivalente para producir este nivel relativo de iluminacin. El valor digital se traduce a un impulso analgico a lo largo de una curva continua, tal como la que se muestra en la gura 2, que recoge todos los valores correspondientes al marco activo en ese momento sobre la pantalla. La imagen como seal En trminos corrientes, se entiende por "seal" una marca que porta un objeto y que proporciona cierta informacin convenida. En trminos informticos, una seal es una funcin asociada a un fenmeno fsico cuya variacin determinada en un dominio dado porta informacin codicada. Las imgenes, tal como las hemos denido en el apartado anterior, son 2D. Las seales son 1D. El mbito en que se mueve una seal se denomina su dominio. El dominio caracterstico de una seal es, en principio, el propio de los sistemas de comunicacin: un dominio lineal, temporal, y basado principalmente en fenmenos elctricos, que traducen fenmenos acsticos o mecnicos. En el caso de sistemas pticos, el dominio es espacial, la funcin es bidimensional y el trmino "seal" tiende a confundirse con el trmino "imagen" que, como hemos visto, es una funcin asociada a una

Figura 2 Fragmento de imagen y seal asociada

Conceptos fundamentales de tora de la imagen digital

distribucin de intensidades de luz en un determinado dominio espacial. Pero una imagen, de hecho, se reduce a una seal lineal que recorre un canal de determinadas caractersticas, en conformidad con la teora de la informacin que especica que, en un canal, todo mensaje se reduce a un forma temporal f (t). Esta reduccin, en el caso de un dispositivo informtico de salida, tal como una impresora o un monitor, viene dada por el hecho de que la salida real se basa en un mecanismo que recorre secuencialmente, uno a uno todos los puntos de todas las lneas que componen un marco (frame), comenzando por el primero y terminando por el ltimo. Si proseguimos, en una imagen, entendida como funcin de intensidades lumnicas, una de las dos dimensiones, el recorrido de una imagen monocromtica a lo largo de una lnea horizontal, a lo largo de la coordenada x, nos ir presentando los valores de la funcin para cada uno de estos puntos. Esto resultar en una distribucin de intensidades que, en principio, ser distinta para todos los puntos de esta lnea. Estas intensidades pueden representarse en un diagrama que nos mostrara la intensidad o la "profundidad" de la seal en cada uno de los puntos de la imagen, graados sobre el eje de ordenadas, a lo largo del tiempo, graado sobre el eje de abscisas. Como toda funcin, una seal puede representarse en un sistema de coordenadas cartesiano. El eje vertical, de ordenadas, se utiliza para representar las amplitudes que corresponden a los valores mximos y mnimos que alcanza la funcin/seal. El eje horizontal, de abscisas, se utiliza para representar el dominio de la seal. Si la seal es peridica, esto es, si se repite cclicamente en un determinado dominio, lo que se representa es su frecuencia. Las seales pueden ser continuas o discretas. Las seales analgicas, denominadas as porque son un reejo directo del fenmeno que las ha originado, son continuas. Las seales digitales, denominadas as porque pueden ser traducidas a dgitos, a nmeros enteros, son discretas. La informatizacin de una seal supone un paso reiterado de lo analgico a digital y viceversa. Es obvio que esto implica una perdida de informacin y la teora de seales trata, en buena medida, de los sistemas y de las tcnicas utilizados para controlar esta perdida de informacin o, incluso, para optimizar esta prdida, de tal modo que resulte en una ganancia, es decir, en una informacin ms ecaz.

Muestreo y cuanticacin El proceso de seleccionar un conjunto de valores nitos, discretos, de una seal continua se denomina muestreo (sampling) y los valores seleccionados se denominan muestras (samples). Las muestras seleccionadas siguen siendo continuas, esto es, tienen un valor real, no acotado en un determinado rango de valores discretos. El proceso de discretizacin de este valor real se denomina cuanticacin (quantication) y es el segundo paso en el proceso de digitalizacin de una seal. El tercero y ltimo paso es la codicacin de los resultados obtenidos lo que supone, en general, en informtica, la traduccin a un cdigo binario. La teora de seales establece ciertas condiciones que deben cumplir los procesos de muestreo y cuanticacin para que la reconstruccin permita obtener una imagen idntica a la original. Esto, como se ver, es imposible en numerosos casos y surgen perturbaciones que deben ser tratadas de diversos modos. La seal se analiza en funcin de dos caractersticas fundamentales: la amplitud, entendida como el registro del rango de energas que conlleva el fenmeno fsico asociado y la forma, entendida como registro de las diversas configuraciones que adopta la seal. El anlisis de estas diversas conguraciones se remite a unos principios fundamentales, establecidos por Fourier, a principios del siglo pasado, y que permiten analizar las diversas conguraciones de una seal en una serie de componentes simples, peridicos y armnicos. Este anlisis lleva a una forma distinta de representacin de las seales, ms abstracta pero ms reveladora, en donde se relacionan amplitudes y frecuencias en un segundo sistema de coordenadas cartesianas que se denomina el espectro de la seal. En el captulo dedicado a redes se volver sobre

Aplicaciones informticas en arquitectura

este tema. All pueden encontrarse algunas guras adicionales que ilustran los parmetros principales de una seal y el modo en que una seal peridica de distribucin irregular puede ser descompuesta en una serie de seales bsicas, regulares por medio del anlisis de Fourier. La teora de seales permite obtener resultados notables mediante una modicacin del marco de referencia y tomando en consideracin no el dominio espacial (spatial domain) sino el dominio de frecuencias (frequency domain). Esto implica contar con algn modo de asimilar una seal que, en principio es singular, esto es, no presenta periodicidad aparente, a una seal que puede ser tratada como una seal cclica caracterizada por una amplitud dada como funcin de una frecuencia. La variedad estadstica de las conguraciones adoptadas por una seal determinada se presenta as mediante su espectro, como relacin encontrada entre la gama de frecuencias y la gama de amplitudes. El anlisis espectral se utiliza como base de los diversos mtodos de correccin de las perturbaciones a las que nos referiremos ms adelante. Rastreo (rastering) Las imgenes utilizadas en informtica estn generadas por una seal que barre sistemticamente todo el dominio espacial mediante lneas horizontales de exploracin (horizontal scan lines) que van recorriendo verticalmente el mbito propio de la imagen que se pretende captar o reconstruir. La amplitud corresponde, en este caso, a un valor que es proporcional a la intensidad luminosa en cada uno de los pixels que constituyan la imagen. El ejemplo ms habitual es el monitor, pero la mayora de los dispositivos de salida se basan en el mismo sistema. La gura 4 muestra un esquema en el que se representa una seal analgica a lo largo de una lnea de rastreo. Al nal de cada lnea hay una interrupcin de la seal que corresponde a un salto al comienzo de la siguiente lnea. Este procedimiento se utiliza tanto para generar la imagen como para reproducirla. En la seccin 3 se describirn los medios y mtodos principales de captacin. Una cmara de vdeo o un escner de sobremesa operan segn un mismo principio que se resume en: 1) la presentacin de la imagen que se quiere captar a un sistema ptico que conduce la imagen a unos sensores capaces de convertir la energa lumnica a seales elctricas. Esta seal es

llevada a un conversor A/D (analgico/digital). La imagen digitalizada puede almacenarse, procesarse o enviarse a otros sistemas pero, en ltima instancia deber ser sometida a un proceso inverso; 2) la modulacin de la seal digital para dirigir un haz de electrones que se proyecta sobre la pantalla de un monitor, convertida de nuevo en seal analgica, y activando en diferentes grados los diminutos puntos que darn lugar a una imagen equivalente a la original. El proceso de barrido supone, de hecho, como ya hemos indicado, la conversin de la seal bidimensional en unidimensional. La seal de barrido lleva incorporada una seal de "intervalo de blanqueo horizontal" (horizontal blanking interval) que indica al haz de rayos que debe cesar de emitir electrones y situarse en la siguiente lnea. Esta seal se produce al nal de cada lnea hasta llegar a la ltima lnea en donde incorpora una seal de "intervalo de blanqueo vertical" que indica al haz de rayos que debe volver a situarse en la lnea 1. Esto es parte de una codicacin lineal que se traduce en movimientos espaciales. En s misma, la seal electrnica sigue siendo una seal lineal, temporal, cuyo dominio completo constituye un marco. El marco debe tener una proporcin normalizada para permitir la utilizacin de diferentes programas y tipos de informacin con un mismo dispositivo. Todos los monitores utilizan una misma relacin de aspecto (aspect ratio) de proporcin 4/3. La

Conceptos fundamentales de tora de la imagen digital

televisin de alta denicin utiliza una relacin de aspecto ms alargada, de 16/9. El proceso de rasterizacin sirve tanto para los dispositivos de entrada como para los de salida. En ambos casos se ha seguido una evolucin similar por razones parecidas. Los primeros monitores no eran de rastreo sino vectoriales. Una lnea, denida por un programa de CAD como una entidad con un principio y un nal, tena unas coordenadas propias que se traducan a las coordenadas propias del dispositivo. En el caso de un monitor de rayos catdicos poda indicarse al dispositivo que enviara un ujo de electrones a lo largo del recorrido especicado por este par de coordenadas, lo que se traduca en una lnea perfecta, sin escalones, y con un gasto de memoria adaptado a la informacin requerida por la entidad. Esto era sin duda una ventaja. Pero tal ventaja empezaba a dejar de serlo cuando lo que se trazaba en pantalla era, no unas pocas, sino un enjambre de lneas. Debido a la necesidad de refrescar la pantalla, unas lneas comenzaban a borrarse mientras otras no haban acabado de dibujarse. Problemas similares se daban con los plotters de plumillas que funcionaban segn el mismo principio. Cuando el nmero de lneas era muy grande, el continuo ir y venir del dispositivo trazador poda provocar desajustes y el tiempo de trazado se incrementaba considerablemente. Un sistema de rastreo tiene dos inconvenientes importantes. En primer lugar que todo el rea a imprimir o visualizar debe quedar representada en memoria. Tanto da si lo que se representa es una simple lnea o una escena compleja; cada punto debe contar con una especicacin. En segundo lugar, si se quieren representar lneas o bordes inclinados con precisin no hay otra opcin que incrementar el nmero de puntos, lo que obliga a aumentar an ms la memoria. Pero tiene la ventaja de que se cuenta con un nico mtodo, preciso, para cualquier caso, lo que permite unicar los procedimientos y sacar el mximo partido de la tecnologa disponible. Estas son las razones principales por las que las pantallas de rastreo sustituyeron a las vectoriales hace ya muchos aos y los plotters electrostticos a los de plumillas hace pocos aos. Procesamiento y anlisis de imgenes La literatura especializada distingue dos reas

principales de aplicacin. El procesamiento de imgenes con la nalidad de mejorar la informacin de modo que sea comprensible por observadores humanos, y el procesamiento y anlisis de imgenes, con la nalidad de hacer que sean reconocidas automticamente por computadores especializados. Ambos grupos se dirigen a una gran variedad de aplicaciones. La medicina, la geografa, la arqueologa, la astronoma, y diversos sectores industriales interesados en automatizar tareas realizadas hasta ahora por seres humanos, son algunas de las reas pioneras en aplicaciones en este campo. La utilizacin de tcnicas de procesamiento de imgenes en cartografa es una de las reas ms directamente relacionadas con la arquitectura en la que se han producido avances notables, as como otras que comentaremos al nal de este captulo. La utilizacin de robots dotados de capacidad de reconocimiento de formas que puedan llevar a cabo tareas peligrosas o difciles en el sector de la construccin es otra de las reas en las que se est investigando con considerable intensidad en los ltimos aos. Por procesamiento se entiende genricamente el conjunto de tcnicas y mtodos encaminados a mejorar una imagen, con cierta independencia de su contenido, con el n de facilitar su posterior interpretacin. Ejemplos caractersticos son: el tratamiento de radiografas para realzar zonas de inters, el procesamiento de fotografas en mal estado para facilitar el reconocimiento de personas, el procesamiento de imgenes tomadas desde aviones o desde satlites para identicar relieves del terreno o edicios signicativos. En todos estos casos las tcnicas van dirigidas a librar a la imagen de ruido provocado por diversas interferencias o a corregir deformaciones de los aparatos pticos con que se han captado las imagenes o a corregir deformaciones secundarias de los propios objetos o de la supercie observada, como ocurre en el caso de la cartografa para generar ortofotoplanos. Por anlisis de imgenes se alude convencionalmente al conjunto de tcnicas y mtodos encaminados a facilitar la extraccin automatizada de la informacin contenida en ellas. La nalidad principal sera llegar a hacer ecaz la visin por computador, esto es, conseguir que una mquina dotada de sensores pueda reconocer fragmentos ms o menos grandes del espacio y los objetos

Aplicaciones informticas en arquitectura

que le rodean y ajustar su conducta de acuerdo con esta informacin. El proceso implica la deteccin, la identicacin y la comprensin de patrones que son relevantes en un contexto o en una aplicacin determinada. Ejemplos en fase de experimentacin que pueden citares son: el uso de robots en cadenas de produccin que pueden reconocer si un producto tiene defectos y debe ser retirado de la cadena; el uso de robots utilizados en procesos de fabricacin asistida por computador para reconocer formas caractersticas, de un rango limitado de objetos, y manipularlas adecuadamente. Otros ejemplos ms elementales pero que estaran en esta misma lnea son los programas de reconocimiento ptico de caracteres y patrones. Los pasos caractersticos en el procesamiento y anlisis de imgenes son los siguientes: a) Adquisicin de la imagen. Esto requiere un conjunto de dispositivos, tales como cmaras fotogrcas tradicionales, cmaras digitales, cmaras de vdeo o escners, capaces de grabar la informacin y digitalizarla para su procesamiento posterior. Se necesitarn por aadidura medios de almacenamiento y medios bsicos de manipulacin, comunicacin y presentacin de la imagen. b) Preprocesamiento. Durante esta fase se llevan a cabo una serie de acciones que tienen por nalidad facilitar el trabajo posterior; acciones tales como eliminar ruidos parsitos o calibrar adecuadamente los rangos monocromticos y cromticos, el contraste o la denicin de las diferentes reas. c) Segmentacin. Bajo este trmino se engloban los procesos destinados a separar una imagen en sus partes constituyentes, con lo que entramos en el dominio del anlisis y, con ello, en el ncleo de los problemas propios del procesamiento de imgenes y nos alejamos de nuestro campo de aplicacin inmediato. Sin embargo hay puntos de inters que merece la pena subrayar y que aparecern de algn modo ms adelante. La segmentacin de una imagen supone en un primer estadio la deteccin de puntos, lneas y bordes. A partir de aqu se busca, por diversos procedimientos, identicar bordes continuos, fronteras y regiones. La segmentacin depende por lo general del contexto de la aplicacin que dicta las propiedades visuales de los elementos de inters cuya deteccin se busca. El mtodo ms general se basa en la deteccin de discontinuidades y el problema ms general deriva del hecho de que, en general (pero no siempre), las discontinuidades

resultan de bordes signicativos. d) Representacin y descripcin. El resultado de la segmentacin es una imagen en la que, en los casos ms corrientes, se habr diferenciado entre pixels correspondientes a bordes y pixels correspondientes a regiones. De nuevo, el que una u otra representacin resulte ms adecuada depender del contexto. Si lo que se busca es diferenciar guras de fondos, como puede ser el caso de edicios sobre un terreno, la segmentacin en bordes resultar ms adecuada. Si lo que se busca es identicar propiedades materiales, texturas caractersticas, ser preferible identicar regiones. Y puede ser que se necesiten ambas cosas. La representacin es la base de la descripcin que consiste fundamentalmente en una seleccin de caractersticas (feature selection) que se realzan y se procesan para obtener datos adicionales dados generalmente en forma numrica o mediante especicaciones acerca de la topologa de la imagen (si contiene agujeros, si hay regiones conectadas de determinado modo, etc.). e) Reconocimiento e interpretacin. A partir de la descripcin de la imagen es posible comparar los datos obtenidos con los datos contenidos en una base de datos adecuada a la aplicacin y asignar etiquetas identicadoras a los distintos elementos. Este proceso de asignacin se denomina "reconocimiento". Por "interpretacin" se alude al paso nal de asignar un signicado determinado a un conjunto de objetos etiquetados. Podemos comparar el proceso con el de reconocer letras y palabras que forman frases con sentido. Esta ltima fase implica por lo general contar con una base de datos del tipo de las que describiremos en el captulo 11 en relacin con los sistemas expertos.

Conceptos fundamentales de tora de la imagen digital

2 Parmetros de control de la calidad de una imagen


La calidad de una imagen se mide fundamentalmente en funcin de dos tipos de parmetros : los relativos a la extensin y los relativos a la intensin o profundidad, entendida como capacidad de distinguir diferencias de intensidad y de color en un mismo punto. Resolucin Se entiende por resolucin la capacidad de un detector para discriminar detalles o, ms exactamente, la capacidad para distinguir ("resolver") dos puntos muy prximos antes de que se fundan en uno solo. Dado que las imgenes digitales estn compuestas de puntos discontinuos que se perciben como un continuo a una determinada distancia, este parmetro tiene una importancia bsica. Segn datos aportados por la psicologa experimental, dos lneas negras de 1 mm sobre un fondo blanco comienzan a fundirse en una mancha continua entre los 4 y los 7 m de distancia por trmino medio. Este dato depende de la capacidad del sujeto, de la iluminacin ambiental y de otros factores, por lo que es considerablemente variable. Si tomamos el segundo valor esto quiere decir que lneas negras de 0.25 mm sobre un fondo blanco comenzaran a confundirse a 1,75 metros de distancia. Para puntos luminosos de intensidad variable esta cifra disminuira apreciablemente debido a la irradiacin lo que permite armar, en relacin con otros experimentos similares, que una trama de puntos luminosos, de unos 0,25 mm de dimetro, equivalentes a una resolucin de 72 dpi (dots per inch) que son precisamente las caractersticas de un monitor ms o menos corriente, son indestinguibles como tales puntos a partir de unos 50 cm de distancia. Ms exactamente, se acepta la cifra de 127 dpi equivalentes a 5 lpm (lineas por milmetro) como resolucin lmite para la distancia de observacin de 25 cms. Un escner de baja calidad digitaliza imgenes a resoluciones comprendidas entre 50 y 300 dpi. Un escner de calidad media/alta llega hasta los 1.200. Una impresora laser de calidad media/ alta imprime a 600 dpi. Las impresoras de mxima calidad, como la Linotronic, llegan hasta ms de 3.000 dpi en algunos modelos. Una lmadora de diapositivas genera imgenes de resolucin an

mayor. Todas estas cifras son muy superiores a las que hemos dado como mnimo para percibir una imagen como continua pese a estar formada de pequeos puntos. La explicacin se da en la siguiente seccin de este captulo y subraya el hecho de que los dos parmetros mencionados al principio de este prrafo, la extensin y la intensin, estn estrechamente relacionados entre s. Nmero de grises La calidad de una imagen depende, como segundo factor principal, del nmero de valores de intensidad que es capaz de representar. Estos valores son diferentes si se trata de una imagen acromtica o cromtica, por lo que abordaremos el primer caso en este apartado y el segundo caso en el siguiente apartado. Entendemos por imagen acromtica aquella compuesta por una escala tonal de grises cuyo rango vara de 2, tal com un dibujo en blanco y negro (1 bpp) hasta 256 (8 bpp). El parmetro bpp (bits per pixel) representa la cantidad de informacin con la que contamos y permite saber el nmero de valores que nos proporcionar una imagen y que ser igual a 2n, donde n es el valor en bpp. As, si el valor en bpp es 2, 4 u 8, el nmero de grises que podremos tener ser respectivamente 4 (22), 16 (24) y 256 (28). En general, se toma este ltimo valor como el apropiado para una imagen que presente una escala completa de grises en la que no se aprecien discontinuidades. El nmero de grises de esta escala es superior al que un observador humano puede percibir pero se relaciona con un fenmeno que permite establecer, no el nmero de grises que un observador medio es capaz de percibir conscientemente en una escena, sino el nmero de grises necesario para que una banda continua aparezca como tal sin que se produzcan efectos de "contorneado". Esto se relaciona con un fenmeno visual detectado por Ernest Mach en 1865 y que se conoce como "bandas de Mach". El fenmeno puede ser analizado con instrumentos de precisin y muestra que el ojo exagera el cambio de intensidad real que se da cuando hay un cambio relativamente abrupto en un fondo continuo. La capacidad de discriminacin de este efecto se sita aproximadamente, segn diversos experimentos, en torno al 0,5% de la luminacia global percibida. Esto permite establecer la cifra de unos 200, como nmero mximo de niveles de gris que

10

Aplicaciones informticas en arquitectura

se detectan, virtualmente, en el caso particular de los degradados continuos y, por consiguiente, como mnimo nmero de grises que un sistema reproductor debera ser capaz de generar para evitar efectos de contorneado tales como los descritos. Como trabajamos con bits hay que escoger entre 128 (7 bpp) que sera suciente para la gran mayora de los casos y 256 (8 bpp). Se escoge este ltimo valor por las razones dadas pero tambin por razones tcnicas, pues resulta ms conveniente empaquetar la informacin en paquetes de 8 bits. Nmero de colores En el caso de las imgenes cromticas los parmetros que se deben considerar son los 256 niveles de gris a travs de tres canales RGB (Red, Green, Blue), rojo, verde y azul. Estos son los tres colores primarios utilizados en mezcla aditiva. Si se enva la imagen a imprimir hay que traducir estos valores al cdigo CMYK (Cyan, Magenta, Yellow, Black), can, magenta, amarillo y negro, basado en los tres colores primarios utilizados en mezcla sustractiva. Cuando se trabaja con imgenes muchos preeren utilizar un tercer cdigo que es intuitivamente ms fcil de comprender, el HLS (Hue, Saturation, Lightness) pues est basado en variables perceptivas. Si cada uno de los ejes que representan los colores primarios Red (rojo), Green (verde) y Blue (azul), tiene una escala ponderada en 256 intervalos, las posibles combinaciones que se pueden obtener se darn en un rango dado por el producto 256 256 256 o lo que es lo mismo 224 (24 bpps, 8 bpp 3 canales). Es decir unos 16,7 millones de colores. Este rango es el propio de lo que se denomina true color (color real) y proporciona una representacin libre de las imperfecciones que mencionabamos en el apartado anterior. No todas las placas grcas proporcionan la misma cantidad de colores. Es posible encontrarse por diversas causas con alguna de estas combinaciones u otras intermedias. bpp: 1 2 4 8 15 16 20 24 colores: 1 4 16 256 32.768 65.536 1.048.576 16.777.216

Tanto la etiqueta "color real", como la cifra de 16,7 millones de colores, deben tomarse con reserva. En primer lugar, para captar el "color real" de una imagen habra que utilizar un nmero de muestras superior a los convencionales 3 colores primarios. Las mediciones ms exactas, llevadas a cabo con espectrofotmetros, toman muestra cromticas cada 5 o 10 nanmetros lo que, para un ancho del espectro visible que podemos situar entre los 400 y 800 nm aproximadamente, dara del orden de 40 muestras requeridas para una reproduccin verdaderamente el. En segundo lugar, los dispositivos utilizados en informtica tienen rangos limitados que les impiden reproducir muchos colores que se encuentran en escenarios reales, rangos que, por aadidura, son diferentes en un monitor o en una impresora de color; sta es una limitacin que hay que tener muy presente cuando se lleva a imprimir una imagen que se ha trabajado en un monitor. Por ltimo, los 256 colores por canal son necesarios para evitar la aparicin de bandas de Mach pero esto no implica que haya una mayor cantidad de colores realmente percibidos. Una escena que no contenga degradados y que se reproduzca con 8 bpp (3, 3 y 2 bpp por canal) esto es, con tan slo 256 colores totales, ser prcticamente indistinguible de la misma escena reproducida con 24 bpp. De los 16,7 millones de colores requeridos por razones tcnicas, una cifra muy inferior al 5% puede ser efectivamente distinguida por una persona normal.

3 Perturbaciones caractersticas de las imgenes y mtodos de correccin


Las perturbaciones ms caractersticas de las seales analgicas son el ruido, las interferencias, las manchas, las franjas, los bordes de colores, las prdidas o alteraciones de tono, intensidad o saturacin. Casi todas estas alteraciones tienen su origen en fallos del dispositivo que impiden una respuesta adecuada. Las perturbaciones ms caractersticas de las seales digitales son el contorneado, la pixelacin y el aliasing. El ruido es una perturbacin caracterstica de las seales analgicas pero que se da tambin en las seales digitales y puede ser inducida ex profeso para conseguir determinados efectos. En los siguientes apartados nos referiremos a las perturbaciones principales que se pueden dar en las imgenes digitales.

Conceptos fundamentales de tora de la imagen digital

11

Pixelacin Tanto la pixelacin como el contorneado son dos perturbaciones caractersticas de las seales digitales que se producen por insuciencia de la resolucin en el primer caso y por insuciencia del rango de intensidades en el segundo. La gura 5 muestra un esquema que correspondera a una imagen determinada (izquierda) de la que se han suprimido la mitad de las muestras (centro) lo que producira un efecto de pixelacin, o la mitad de los valores (derecha) lo que producira un efecto de contorneado. El nmero de pixels de una imagen depende, en ltima instancia, del nmero de puntos fsicos que tenga el dispositivo reproductor y obviamente, no puede superar esta cifra. En el caso de un monitor, que es el ejemplo ms familiar, el dimetro de los puntos terminales (dots) debe ser tal que no puedan distinguirse a cierta distancia. Para un monitor corriente esta distancia es de, aproximadamente, 40-50 cm lo que se corresponde, para una resolucin de 127 dpi, a la distancia normalizada de observacin de 25 cm, segn lo visto ms arriba, con la resolucin media de los monitores que es de unos 72 dpi. Cuando el adaptador grfico es incapaz de gestionar esta resolucin reduce la imagen a un submltiplo de la mxima resolucin agrupando puntos para formar pixels mayores. Una misma imagen puede ser mostrada, sobre un mismo monitor, con una resolucin de 1024 768, 800 600 o 640 480 (VGA). En este ltimo caso, en donde los pixels de la imagen mostrada corresponden a clulas formadas por agrupaciones de varios dots se puede apreciar claramente el efecto conocido como pixelacin (pixellation). Otro tanto ocurre si se imprime una imagen a una resolucin insuciente. La gura 6 muestra un ejemplo de este defecto.

Figura 6 Efecto de pixelacin por reduccin de la resolucin: a) 600 dpi; b) 150; c) 60; d) 20 Figura 5 Prdida de calidad de una imagen (a) por
insuciente muestreo (b) y cuanticacin (c)
(la fotografa corresponde a las Ocinas Centrales Nunotani, Tokio, 1991-92, de Peter Eisenman)

12

Aplicaciones informticas en arquitectura

Contorneado El contorneado (contouring) es otra perturbacin caracterstica de las imagenes digitales producida por un insuciente rango de intensidades. El nmero de grises necesario para mostrar una imagen con suciente delidad estara situado, en principio, y en funcin de diversos estudios, basados tanto en la capacidad de discriminacin como en el control del ruido, en los 5 bpp, lo que equivale a 32 niveles de grises. Sin embargo esta cifra, que es suciente para reproducir la escala de grises de una imagen con buena calidad, es insuciente para mostrar degradados continuos como ya hemos dicho anteriormente; aparecen franjas claramente visibles (bandas de Mach) que muestran la insuciencia del rango utilizado para superar la hipersensibilidad de nuestro sistema receptor a los cambios relativamente bruscos de un degradado continuo. Es por esta razn, como ya hemos dicho, que se requieren 256 niveles de gris. Si no se alcanza esta cifra, en el caso de imgenes con degradados nos y continuos, o la cifra anterior en el caso de imgenes sin degradados notables, aparecen franjas visibles en la imagen que falsean la calidad de la reproduccin. Esto puede apreciarse en un monitor si se modica la conguracin de pantalla para que trabaje en un rango menor y se abre un archivo en el que aparezcan degradados continuos, cielos sin nubes, paredes blancas iluminadas con una luz tenue, etc. Se comprobar cmo este degradado queda fragmentado por leves franjas que rompen su continuidad. La gura 7 muestra una imagen impresa con una rango de valores limitado, que permite apreciar este defecto. Ruido En el caso de seales analgicas se denomina ruido a una seal no deseada que aparece en un sistema de transmisin. Esta seal puede tener diversos orgenes. En general se consideran como "errores de medicin" superpuestos a la imagen. La distincin es ms esquiva de lo que puede parecer pues las seales "con ruido" no son intrnsecamente diferentes a las seales "sin ruido". Y tanto es as que uno de los mtodos de correccin de imgenes por medio de ltros es introducir cierto grado de ruido para igualar y corregir rasgos excesivamente acusados que no se desean mantener. El ruido de fondo, en una seal, es debido a la

Figura 7 Efecto de contorneado por reduccin de los valores de la imagen anterior: a) 8 bpp; b) 4 bpp; c) 3 bpp; d) 2 bpp

Conceptos fundamentales de tora de la imagen digital

13

agitacin de electrones presentes en el canal antes del paso de los electrones propios de la seal. El ruido no puede evitarse sino disminuyendo las frecuencias esto es, la capacidad del canal. La informacin que se gana por un lado se pierde por otro. La medicin del ruido se expresa en decibelios (dB) referidos a nmeros S/N (signal to noise ratio). Aunque el trmino y las unidades se reeren habitualmente a seales auditivas, se utilizan, en general, para expresar prdidas y ganancias en cualquier sistema de comunicacin, especialmente en aquellos basados en distribucin de seales. En general todos los sistemas fsicos reales incorporan cierto grado de ruido a la imagen, tanto si sta se ha generado internamente como si se ha captado por algn dispositivo. Desde un punto de vista ms atento a las aplicaciones prcticas se pueden distinguir dos grandes grupos que se corresponden con dos tipos de distribuicin probabilstica. El ruido determinado o no aleatorio se genera por un sistema concreto y tiene siempre un aspecto similar: franjas o bandas o nubes de puntos de determinadas caractersticas de tamao y orientacin. En muchos casos es posible identicar su patrn de recurrencia, lo que facilita su ltrado y eliminacin. Muchos programas de tratamiento de imgenes llevan incorporados ltros especiales para eliminar ciertos ruidos caractersticos. Un ejemplo corriente es el de una imagen captada de un libro en la que resultan claramente visibles las tramas propias de la impresin en cuatricroma. En muchos programas de tratamiento de imgenes es posible aplicar a este tipo de imgenes un ltro de "destramado" que elimina limpiamente las huellas de la trama. El ruido indeterminado o aleatorio se genera

por causas diversas que no es posible identicar o corregir pues su distribucin es aleatoria y cambia con el tiempo. Para eliminar este tipo de ruido no suele haber otra opcin que probar diferentes ltros que pueden reducir el nivel general de deterioro de la imagen en combinacin con retoques locales. Tambin puede utilizarse y se utiliza con frecuencia de modo constructivo. Puede introducirse deliberadamente ruido en una imagen o en un sector de una imagen para ocultar defectos o, incluso, para generar efectos de textura. Muchas de las texturas generadas por procedimientos algortmicos, tales como las introducidas por Perlin a las que nos hemos referido en el captulo anterior, utilizan funciones matemticas de diversos tipos que introducen ruido en una imagen para generar efectos de textura ms o menos controlados. La gura 8 muestra la misma imagen de las guras anteriores en la que se ha aplicado cierto grado de ruido por medio de ltros especiales a uno de los elementos lo que, en este caso, sirve para simular un efecto de textura rugosa. La distribucin ms utilizada en este tipo de ltros suele ser la gaussiana o variantes de la misma, con alteraciones variables en torno a un valor medio y con correlacin nula entre puntos adyacentes. Aliasing Cuando se trabaja en CAD, tanto en 2D como en 3D, se trabaja en un espacio donde las especicaciones dimensionales se dan con considerable precisin, en trminos cercanos a nmeros reales. Esto es, la resolucin es, a efectos prcticos, innita. Ahora bien, la visualizacin del proceso exige, en todo momento, que este espacio tridimensional de resolucin prcticamente innita se proyecte en un espacio bidimensional de resolucin nita. Esto quiere decir que las coordenadas espaciales, que pueden corresponder a nmeros de varios dgitos con varios decimales, debern ajustarse a coordenadas de pantalla que no admiten ms de, pongamos por caso, 1024 768 pixels. El efecto ms familiar de esta reduccin es que, por ejemplo, una lnea diagonal muestre un escalonamiento perceptible, es decir, que la lnea ya ha dejado de ser tal lnea para convertirse en una yuxtaposicin de segmentos. Este es un fenmeno que entra dentro del mencionado en el apartado anterior, la pixelizacin y que ya hemos mencionado en captulos anteriores. Pero se incluye

Figura 8 Modicacin de un elemento de la imagen anterior por adicin de ruido

14

Aplicaciones informticas en arquitectura

en este apartado por ser una muestra fcilmente comprensible de todo un grupo de fenmenos que reciben tratamientos similares y que responden en general a una falta de correspondencia entre los canales de entrada y los de salida. Hay otros efectos ms graves. En sentido estricto, el trmino aliasing debera reservarse para la aparicin de fenmenos extraos que alteren notablemente el aspecto de la imagen original suprimiendo informacin relevante o alterando la existente hasta volverla equvoca. Estos fenmenos se originan, en el momento de la reconstruccin, por prdida o modicacin, debido a que alguno de los componentes de la seal original estaba comprendido en frecuencias superiores a un determinado lmite (denominado lmite de Nyquist) y ha sido reconstruido en frecuencias ms bajas. Otras manifestaciones tpicas son temporales. Un efecto conocido es el de las ruedas que parece que van hacia atrs en las pelculas del Oeste. Tambin las televisiones parapadeantes que aparecen al fondo de los despachos de redaccin en las secuencias informativas se deben a este efecto; al contemplar una pantalla que se enciende y se apaga a gran velocidad a travs de otra pantalla que tambin se enciende y se apaga, se producen interferencias. Otro tanto ocurre si se quiere obtener una imagen fotograando una pantalla a una velocidad superior al medio o un cuarto de segundo de exposicin: aparecern franjas horizontales o "alias" que echarn a perder la imagen. Antialiasing Se denomina antialiasing al conjunto de tcnicas que se utilizan para prevenir o disimular los defectos comprendidos genricamente bajo la denominacin de aliasing. Es un rea de estudio de considerable complejidad que nos obligara a entrar de lleno en la teora del procesamiento de imgenes por lo que nos limitaremos a exponer los puntos principales. El lector interesado puede encontrar informacin adicional en las obras indicadas en la bibiografa referentes a tcnicas de tratamiento de imgenes tales como las de Marion (1991), Gonzlez (1992) o Glassner (1995). En todos los casos, el sistema de muestreo determina la calidad potencial de la imagen que se est captando y los medios que habr que emplear para corregir los defectos. Bsicamente se trata de escoger el modo ms efectivo para pasar de una

imagen que podemos considerar de "resolucin innita" a una de resolucin nita. Aunque no es necesario, en la mayora de los casos, especicar un tipo de tcnica determinado, un conocimiento sumario de las tcnicas bsicas puede ayudar a comprender mejor las alternativas con que se cuenta corrientemente. El muestreo por punto es el modo ms simple de traducir una imagen a una determinada resolucin (gura 9). Supongamos que tenemos una rejilla que representa la resolucin de la imagen que vamos a generar o derivar, situada sobre la imagen original. Muestrear por punto consiste en seleccionar un punto de la imagen original por cada pixel de la imagen derivada, tomar el valor en ese punto y asignar ese valor a todo el pixel de la imagen derivada. El obvio inconveniente de este mtodo es que pueden perderse detalles importantes. Y, si se modica el punto de vista, como ocurre en una animacin, puede ocurrir que los objetos aparezcan y desaparezcan. Es posible mejorar la calidad de la captura, sin aumentar directamente la resolucin de la imagen derivada, aumentando el nmero de puntos de muestra que se toman de la imagen original. Esto se denomina supermuestreo (supersampling). Equivaldra a tomar varios puntos situados en el entorno correspondiente a un pixel de salida, tal como se muestra en la gura 10 a. Esto no es exactamente as pues lo que se computa es una muestra de la imagen reconstruida en lugar de la imagen original, pero podemos aceptar el esquema como un resumen simplicado del proceso que realmente tiene lugar. Es una tcnica muy utilizada porque consigue buenos resultados y es fcil de aplicar. Su mayor inconveniente es el coste de computacin. Esto puede seguir siendo insuciente en muchos casos. Se seguira produciendo un paso abrupto de pequeos puntos que seran asignados arbitrariamente a uno u otro pixel. El muestreo no ponderado por rea (gura 10 b) intenta mejorar la situacin tomando en cuenta la totalidad de la seal integrada en el rea correspondiente a un pixel de salida y tomando como dato la media de intensidad encontrada para este rea. Esto evita que se pierdan objetos, si bien puede llegar a perderse su conguracin exacta pues la integracin de la intensidad es independiente de la distribucin interna dentro del rea. En el muestreo ponderado por rea se toma en cuenta la cercana a la frontera del rea. Tal como se muestra en la gura 10 c esto

Conceptos fundamentales de tora de la imagen digital

15

es equivalente a utilizar una funcin que puede visualizarse mediante un prisma ortogonal o una pirmide que nos indicaran el modo de distribucin de las intensidades sobre cada muestra. An esta ltima tcnica tiene limitaciones que pueden afectar a la calidad de la imagen resultante en muchos casos, en la medida en que cada muestra slo sirve para determinar la intensidad del pixel con el que est relacionada directamente. Si nos imaginamos un pequeo objeto luminoso que se mueve por el interior de un pixel, la intensidad correspondiente ira decreciendo a medida que se acercara a la frontera con el pixel colindante. Pero este pixel colindante slo aumentara de intensidad en el momento en que el objeto cruzara dicha frontera lo que implica, de nuevo, un cambio abrupto y, en principio, indeseado. El muestreo ponderado por rea extendida (gura 10 d) es una tcnica que cubrira estos casos a costa de una creciente complicacin tcnica que slo puede cubrirse satisfactoriamente mediante procedimientos matemticos complejos, entre los que ocupa un lugar principal la transformada de Fourier y la convolucin, que se desarrollan en lo que se conoce como teora del muestreo (Sampling Theory), una rama de investigacin de la teora del procesamiento de imgenes digitales. Uno de los principios de esta teora es que, para garantizar que la imagen pueda ser reconstruida con delidad, la frecuencia de muestreo debe ser, como mnimo, el doble de la frecuencia ms alta del espectro de la imagen que queremos digitalizar. Este valor crtico fue formulado por Nyquist en un famoso artculo publicado en los aos veinte, al que nos volveremos a referir en el captulo sobre redes y se conoce como la "frecuencia de Nyquist" (Nyquist frequency). Sin embargo, el muestreo a esta frecuencia resulta efectivo en general, dando por supuesto que los valores estarn en torno a los mximos y mnimos de frecuencia de la muestra.

Figura 10 Muestreo mltiple (a), muestreo por rea sin ponderar (b), ponderada (c) y ponderada con solapamiento (d) En casos singulares, determinadas frecuencias caractersticas de la imagen, que pueden no ser relevantes desde un punto de vista probabilstico pero que lo son desde el punto de vista de su signicado, pueden quedar enmascaradas, lo que se traduce, dicho de un modo menos tcnico en que, por ejemplo, determinados puntos pueden desaparecer aleatoriamente o bien en que, como vimos en el captulo anterior, la geometra caracterstica de un pavimento ajedrezado puede distorsionarse bruscamente en los connes de la imagen debido a que diminutas lneas, demasiado pequeas o demasiado juntas, pueden ir cayendo, alternativamente, dentro o fuera del rea muestreada lo que ocasiona que desaparezcan o que se salgan de la alineacin que les corresponde. La solucin para estos defectos es la utilizacin de ltros de diversos tipos. El mecanismo ms corriente es utilizar ltros de correccin de las frecuencias. Las frecuencias bajas corresponden a zonas en las que los valores de luminancia de la imagen varan con suavidad. Las frecuencias altas corresponden a zonas en las que estos valores varan bruscamente y donde, en consecuencia, es ms probable que se produzcan alteraciones. Un ltrado previo de la imagen por un ltro de pasa-bajas (low band ltering) puede eliminar estas distorsiones. Dado que los ltros se utilizan tanto para corregir errores de digitalizacin como para modicar

16

Aplicaciones informticas en arquitectura

a consciencia partes de la imagen volveremos a abordar el tema de un modo ms general en la seccin 6 de este captulo.

4 Medios y mtodos de digitalizacin


En trminos generales ya se ha dicho que una seal analgica es una seal que se asemeja, mediante una correspondencia continua, al fenmeno que la ha producido, mientras que una seal digital es una codicacin de dicha imagen en elementos discretos, discontinuos. Las seales analgicas y digitales utilizan una misma base, la tecnologa electrnica, con procedimientos diferentes que estn asociados, histricamente, a nalidades diferentes. Las seales analgicas se relacionan con la radio y la televisin que buscaron desde un comienzo reproducir el sonido y la imagen por medio de curvas que fueran variando de perl de un modo continuo. Las seales digitales se relacionan con los primeros computadores, utilizados para realizar clculos matemticos complejos con cantidades discretas. Las ventajas de una seal analgica estriban en su capacidad intrnseca para reproducir con delidad el original. Pero una seal analgica, por esta misma razn, siempre incorpora algo ms de lo que interesa y que aparece como "ruido" o "distorsin" de la seal. Las ventajas de una seal digital estn en su exactitud y en la ausencia de errores o seales secundarias que intereran con la imagen o el sonido. Una seal digital slo reconoce un nivel preestablecido. Las investigaciones, como sera de esperar, han ido dirigidas a combinar estas dos ventajas en un nico sistema. La cuestin clave es saber qu grado de digitalizacin soporta una seal en un medio determinado. En trminos generales puede decirse que todo parece estar a favor de la digitalizacin. El principal inconveniente, las grandes cantidades de memoria requeridas para mantener resoluciones equivalentes en calidad a las de las seales analgicas, va desapareciendo a medida que se incrementan las capacidades medias de los ordenadores corrientes. La obtencin de una imagen digital puede llevarse a cabo por medios internos y por medios externos. Todos los sistemas que hemos visto en captulos anteriores no parten, en muchos casos, de una imagen previa sino de unas ideas y de unos datos a partir de los cuales se construyen una serie de objetos virtuales que dan lugar a una imagen proyectada sobre la pantalla del ordenador o im-

presa con un dispositivo adecuado o grabada en un disco magntico u ptico para su utilizacin posterior. Una imagen, as obtenida, tiene las mismas caractersticas que una imagen de un objeto real captada por un aparato adecuado. Aunque no debe perderse de vista que la imgenes creadas en un ordenador tiene las mismas caractersticas que las imgenes captadas del mundo real lo que nos interesa, sin embargo, es conocer la tecnologa con que se cuenta para grabar imgenes reales y qu es lo que se puede esperar de esta tecnologa. Medios de obtencin de una imagen digital Para obtener una imagen digital debe contarse en primer lugar con un sistema adecuado para su captacin, un dispositivo fsico sensible a unas determinadas bandas de energa electromagntica del espectro visible o invisible, el cual produce una seal elctrica proporcional al nivel de energa recibida. Y, en segundo lugar con un dispositivo digitalizador que convierta la anterior seal elctrica en digital. Este proceso vara segn la naturaleza de los objetos que se quieran reproducir. Pero en trminos generales puede decirse que se utilizan principalmente tres tipos de tecnologas: microdensitmetros, cmaras tipo vidicon y matrices de estado slido. En los dispositivos que utilizan micro-densitmetros se requiere que la imagen est dada por medio de una pelcula, preferentemente transparente, que por lo general se ja alrededor de un tambor giratorio. Es el mtodo utilizado en los escners de tambor que se describen ms adelante. Un rayo de luz, generalmente emitido por lser, rastrea la imagen enviando puntos microscpicos a un fotodetector que codica su nivel de gris. Son dispositivos relativamente lentos pero que pueden alcanzar precisiones muy altas. Este tipo de cmara se utiliz por primera vez en los cincuentas para televisin y fue el primer tipo de cmara cuyo funcionamiento se bas en principios de fotoconductividad; era ms pequea y manejable y sustituy en poco tiempo a otro tipo de cmaras. La imagen enfocada sobre la supercie del tubo genera un patrn de conductividad variable a la luz que reproduce el patrn de intensidades luminosas de la imagen. Un rayo de electrones rastrea la supercie y genera un diferencial de potencial que da

Conceptos fundamentales de tora de la imagen digital

17

lugar a una seal proporcional al patrn luminoso. Esta seal se codica en cantidades discretas junto con la posicin correspondiente en la imagen, de modo similar al caso anterior. Los dispositivos que utilizan matrices de estado slido estn basados en mnusculas clulas de silicon, denominadas fotositos (photosites), ordenadas en las y columnas. Estos sensores se suelen disponer bien en forma alineada y sometidos a un desplazamiento horizontal (line scan sensors), como es el caso de los escners de sobremesa, o bien en forma de rea o matriz (area sensors) como en las cmaras de TV. Ambas tecnologas estn basadas en lo que se conoce como CCDS, o charge-coupled devices, (dispositivos de carga acoplada). Un CCD consiste bsicamente en un hilera de fotositos, ciertos mecanismos de transferencia y un amplicador que enva una seal elctrica a un dispositivo de registro, proporcional a la intensidad de la seal luminosa. Los escners basados en sensores de rea suelen contar con resoluciones limitadas que no superan los 1.024 o, excepcionalmente los 1.280. Los escners basados en sensores en lnea, tal como los escners de sobremesa corrientes, pueden alcanzar los 4.096 puntos. Otra ventaja importante de este tipo de dispositivos es su velocidad (pueden llegar a alcanzar los 1/ 10.000 seg) En relacin con el tipo de aplicaciones que nos interesan, nos referiremos principalmente a los escners y cmaras digitales dejando de lado las cmaras de vdeo, ya que stas se usan especialmente para la edicin videogrca. Los principios generales y los prametros que deben tenerse en cuenta son, por otro lado, bsicamente los mismos. Escners. Funcionamiento general Un escner puede denirse genricamente como un instrumento ptico capaz de captar imgenes mediante un sensor que traduzca impulsos lumnicos a impulsos electrnicos y estos a informacin digital. Todos los escners se basan en un mismo proceso que, descrito del modo ms simple posible, consiste bsicamente en lo siguiente. Una fuente de luz ilumina de modo regular la supercie que se pretende capturar. La luz se reeja, en el caso de un original opaco, o atraviesa la imagen, en el caso de un original transparente, y se hace llegar a un sensor capaz de captar la imagen y convertir los

datos analgicos en datos digitales. Los escners incorporan un mecanismo que permite desplazar el sensor sobre la imagen original o que permite a la imagen original moverse bajo el sensor. El dispositivo fundamental queda incorporado en lo que se denomina el cabezal ptico. En el caso de un escner de sobremesa, el cabezal ptico incorpora la fuente de luz, un juego de espejos o prismas, un sistema de ltros de colores y un CCD capaz de registrar la luz que recibe en forma de voltaje elctrico. Un convertidor A/D convierte los impulsos elctricos en nmeros. La resolucin depende directamente de la densidad de CCD. Cuanto mayor sea la cantidad de stos que pueda ser dispuesta sobre el cabezal de lectura, mayor ser el nmero de puntos que puedan ser captados. En un escner con 300 dpi de resolucin mxima, el cabezal se desplaza en cada micromovimiento, 1/300 de pulgada. La profundidad de lectura depende por aadidura de la capacidad del convertidor analgico digital para dividir la seal analgica en particiones discretas. En cada pasada, una fuente de luz ilumina el objeto, la luz reejada se hace pasar por una serie de espejos y prismas y tres ltros de color, hasta llegar al CCD que registra la seal. Otros modelos emiten tres diferentes haces de luz, en lugar de utilizar ltros. Segn los tipos de escner puede registrarse toda la informacin en una sola pasada o en tres pasadas, una para cada color primario. Los primeros escners que se construyeron fueron los inventados por Hardy y Wurzburg y por Murray y Morse (patente de 1941) a principios de los cuarenta. El primero fue desarrollado inicialmente para la Interchemical Corporation y, posteriormente para la Radio Corporation of America. Puede considerarse, con muchas reservas, como el antecesor de los actuales atbed scanners en la medida en que tambien efectuaba lecturas sobre un

18

Aplicaciones informticas en arquitectura

original dispuesto sobre un plano horizontal por medio de un aparato de registro que iba recorriendo lnea por lnea este original y transmitiendo la seal codicada a otro dispositivo. El segundo fue desarrollado inicialmente para la Eastman Kodak Company y subsecuentemente para la Time Incorporated y su lial Printing Development Incorporated (PDI) que dio su nombre a este primer escner. Puede considerarse como el antecesor de los actuales drum scanners. Los primeros escners estaban destinados a la grabacin de clichs tipogrcos por lo que cualquier comparacin con los actuales puede resultar equvoca. Hasta la dcada de los setenta no se pudieron desarrollar la mayora de los dispositivos actuales entre los cuales juega un papel fundamental la exploracin por medio de rayos lser. Con todo, el sistema de registro ptico y conversin en seal electrnica de la seal ptica es similar. Tipos de escners La mayora de los escners pertenecen a cinco tipos bsicos. El escner de sobremesa (atbed), el escner tipo fax o de alimentacin automtica de hojas sueltas (sheetfed o page feed scanner), el de cabezal superior (overhead escner), el manual y el de tambor. Los escners de tipo plano o de sobremesa (atbed) (gura 12) funcionan de modo semejante a una fotocopiadora. Se coloca el original sobre un cristal y el dispositivo CCD al que nos hemos referido anteriormente, se desplaza por debajo del mismo, iluminando alternativa o simultneamente con luces de color de gran intensidad la zona que se quiere digitalizar, que ha sido previamente seleccionada utilizando el software propio del aparato. Existen variantes que aceptan alimentacin automtica de originales, que siempre han de ser de poco grosor, as como adaptadores para captar trasparencias, o atbed slides. En los escner tipo fax, de alimentacin hoja a hoja (sheetfed o page feed) lo que se desplaza es el original. Obviamente las limitaciones por lo que respecta al tipo de originales son mayores que en el tipo anterior, ya que slo se pueden leer imgenes contenidas en una hoja de grueso corriente. Son escners particularmente tiles cuando se quiere escanear varias hojas en sucesin, como ocurre cuando se utiliza un sistema OCR para digitalizar textos, pero que ofrecen escasas ventajas en

el caso de trabajo con imgenes en donde, en la gran mayora de los casos, cada imagen requiere ser ajustada por separado. En 1999 no se comercializan de modo autnomo sino incorporados a dispositivos multiuso como el que se muestra en la gura 13 que combina las funciones de escner, impresora y fax. Un tercer tipo son los escners de cabezal alto (overhead) (gura 14) . En ellos el sensor est dispuesto por encima de una plano que admite la colocacin de cualquier objetos voluminoso, utilizando la iluminacin ambiental para iluminar la muestra lo que implica una considerable prdida de precisin. Se utilizan como proyectores de cuerpos opacos en conferencias. Pueden ser tiles para obtener vistas digitalizadas de un objeto. En este sentido son equivalentes a las cmaras digitales. Los escners de mano (handyscan) (gura 15)

Figura 12 Escner plano

Figura 13 Escner-fax-impresora

Conceptos fundamentales de tora de la imagen digital

19

funcionan igual que los de tipo sheetfed pero sin mecanismo de motorizacin ya que es la mano la que impulsa el sensor sobre el papel, con las obvias ventajas e inconvenientes que esto implica. Sus mayores ventajas son que permiten digitalizar todo tipo de objetos, incluidos libros voluminosos y que son fcilmente transportables. Las versiones actuales son inalmbricas y bastante ms caras (del rden de las 90.000 pts de 1999) que los viejos escners manuales que han desaparecido del mercado El ltimo tipo son los de tambor (drum scaners) . Son los ms precisos ya que en ellos la fuente de luz y el sensor se desplazan muy lentamente en sentido paralelo a un cilindro sobre el que se ha colocado el original que gira a gran velocidad, y estn especialmente indicados para trabajos de gran tamao ya que existen modelos con capacidad de hasta un DinA0. Una limitacin importante es que los originales no pueden ser rgidos. Su coste

Figura 16 Escner de tambor (pseudo-tambor) es muy superior al de cualquiera de los anteriores, superior a los 5 millones de pesetas en la gran mayora de los casos, por lo que se utilizan a travs de algn tipo de empresa de servicios y para trabajos profesionales de edicin o casos especiales. En los ltimos aos han aparecido escners de pseudotambor, semejantes al modelo que se muestra en la gura 16 que ofrecen calidades semejantes a un precio algo inferior, del orden de los 2 millones de pesetas de 1999, y que es previsible que bajen de precio en los prximos aos. En el trabajo profesional de retoque de imgenes prcticamente slo se utilizan los escners de sobremesa y los escners de tambor. Las posibilidades de los tipos descritos varan segn el modelo o fabricante. Las resoluciones pueden ir desde los 75 dpi en blanco y negro pasando por los 256 colores a 400 dpi, hasta 16 millones de colores y 2.400 dpi. Hay que diferenciar muy claramente entre lo que es la resolucin ptica del dispositivo sensor y lo que es la resolucin por interpolacin, obtenida por software. Hay numerosos escners de coste medio que ofrecen una resolucin de 600 o 1.200 dpi aunque la resolucin ptica real no supere los 300 o 400. El ms sosticado y el que proporciona las mayores resoluciones es el escner de tambor. Los mejores ofrecen resoluciones de 3.000 dpi o ms. Esto implica la generacin de imgenes que pueden llegar fcilmente a los 100 Mb. Otro aspecto importante que se debe tener en cuenta es que, por razones tcnicas, los CCD, en que estn basados la gran mayora de los escners de sobremesa, tienen limitaciones importantes al leer los tonos oscuros. Si se va a digitalizar una imagen con bastante detalle en las zonas de sombras debern buscarse alternativas de digitalizacin o bien, si el software del escner lo permite, intentar aclarar la imagen para recuperar el detalle.

Figura 14 Escner de cabezal elevado

Figura 15 Escner de mano inalmbrico

20

Aplicaciones informticas en arquitectura

Procedimientos corrientes de digitalizacin La utilizacin de un escner como instrumento habitual para la captacin de imgenes que se pretenden modicar por medios informticos para volver a convertirlas en imgenes similares a las originales, pasa por una serie de pasos generales que se describen a continuacin. a) Clculo de la resolucion requerida Para calcular la resolucin necesaria hay que partir del tamao de la imagen con que se cuenta, en pulgadas, y del tamao y de la resolucin de la imagen que se quiere obtener, en pixels. Si suponemos que ambas tienen la misma proporcin y que la anchura de la primera es A y la anchura de la segunda es X, la resolucin requerida, en puntos por pulgada, ser r = X / A dpi (dots per inch, puntos por pulgada). Por ejemplo, supongamos que partimos de una fotografa de 15 10 cms que se desea convertir en una imagen de 1024 768 pixels. Esto implica que tendremos que recortar parte de la dimensin horizontal, pues la proporcin de la primera es de 1,5 y la de la segunda 1.333.... A partir de esto el clculo (con las dimensiones en pulgadas: 15 10cm / 2,54 = 5,90" 3,93") ser: resolucin horizontal: resolucin vertical: 1024 / 5.90 = 173 dpi 768 / 3.93 = 195 dpi

1024 760 = 786 432 pixels 786 432 pixels 8 = 6 291 456 bpp 6291456 bpp 3 canales = 18 874 368 bits = 2.25 Mb

Se ha detallado el clculo para resulte ms claro, pero ntese que basta con multiplicar el nmero de pixels por 3 para obtener directamente el tamao en bytes. La gura 17 muestra los volumenes de alamcenamiento requeridos para diferentes tamaos y resoluciones en formatos no comprimidos. c) Proceso El proceso se reduce bsicamente a: 1) jar los parmetros de lectura adecuados, esto es, la resolucin y la profundidad de lectura. En el ejemplo anterior sera 195 dpi y 24 bpp o "color real"; 2) realizar una exploracin preliminar o muestreo previo sobre toda la imagen; 3) seleccionar una parte de esta imagen; 4) activar la orden para que el escner registre la imagen segn los parmetros de lectura especicados; 5) archivar la imagen en un formato determinado; la mayora de los escners presentan unas opciones de conversin o de salida directa normalizadas por la prctica tales como tif, tga, gif, o algunos de los que mencionaremos en la seccin siguiente. El software que controla un escner permite anar el proceso con el n de optimar sus resultados. cm 69 9 12 12 18 18 24 24 36 dpi 300 600 1200 300 600 1200 300 600 1200 300 600 1200 300 600 1200 mb 2,15 8,62 34,47 4,31 17,24 68,96 8,62 34,47 137,92 17,24 68,96 275,79 34,47 137,92 551,66

Se toma la cifra mayor, 195 dpi y sta es la resolucin a la que deberemos digitalizar la imagen para obtener el resultado que buscbamos. b) Clculo del volumen de la imagen En muchos casos, sobre todo cuando se prevea digitalizar varias imgenes a una resolucin alta, puede ser conveniente hacer una estimacin del tamao para prevenir problemas de almacenamiento. Para calcular este tamao basta multiplicar las dos dimensiones de la imagen, en pixels, lo que nos dar el nmero total de pixels y, a continuacin multiplicar este valor por la cantidad de informacin por pixel en bits. En el caso de una imagen monocroma este valor es corrientemente de 8 bpp, y en una imagen en color real 24 bpp o bien, si se preere, 3 canales RGB de 8 bytes cada uno. Y si se trata de una imagen que incorpora un canal adicional (un canal alfa) el valor es 32 bpp. Para el ejemplo anterior tendramos:

Figura 17 Volmenes de informacin para diferentes tamaos y resoluciones

Conceptos fundamentales de tora de la imagen digital

21

Esto puede implicar cierto tipo de pretratamiento de la imagen, ya que es muy diferente digitalizar un dibujo lineal en el que se necesita mucho contraste y precisin, que una fotografa en la que priman los medios tonos. En algunos casos estos ajustes se realizan de modo automtico por el propio programa. Si se quiere un control pleno sobre los resultados es preferible no conar demasiado en estas ayudas automatizadas. Cmaras digitales. Otros medios Una alternativa reciente, desarrollada por Eastman Kodak, que ir cobrando una progresiva importancia en el futuro, son las cmaras digitales. Una cmara digital puede considerarse como un cruce entre un escner y una cmara fotogrca tradicional. Como la primera, utiliza una lente, un mecanismo de apertura y un sistema de enfoque. Pero, como el segundo, en lugar de enfocar la imagen sobre una emulsin sensible a la luz, lo hace sobre un CCD, un dispositivo capaz de transformar seales luminosas en seales elctricas que, a su vez pasa esta informacin a un AD, un dispositivo capaz de transformar seales analgicas en digitales. Esta informacin se graba en un chip o en una tarjeta removible y, de aqu, puede llevarse directamente a un laboratorio para que revelen la imagen o puede cargarse directamente en un PC para modicarla, fundirla con otras imagenes, incorporarla a animaciones, etc. El tiempo de exposicin es algo mayor que el requerido en las cmaras tradicionales aunque esto ha mejorado bastante en los modelos ms recientes. El nmero de tomas depende de la memoria y de la resolucin y puede variar, en los modelos ms sencillos, de poca memoria, entre algo as como 10 imgenes a alta resolucin o 100 imgenes a baja resolucin. La principal limitacin de los modelos actuales es la resolucin y la calidad de la imagen. La mayora de las cmaras de coste bajo no superan los 1024 768 puntos (en 1999) lo que limita su aplicacin a vdeo o tomas en las que no interesa la calidad como factor prioritario. Una diapositiva de 35 mm tiene del orden de 4.000 lneas, esto es, del orden de 5 veces ms resolucin que las obtenidas por este sistema. Sin embargo, es de prever que la evolucin tecnolgica supere con rapidez estas limitaciones. Los modelos de coste medio ya alcanzan, en 2002, resoluciones de 1600

1200 con chips de memoria de hasta diez veces ms capacidad que los modelos sencillos. La resolucin de las cmaras digitales se mide en megapixels, con la convencin de que 1 "megapixel equivale a 1 milln de puntos por imagen. Una versin ms exible de este requisito es que al menos uno de los lados alcance los 1.000 pixels. Una imagen 640 480 impresa a 4" 6" (10 15 cms) supone una resolucin de 160 dpi, lo que proporciona imgenes de calidad notoriamente inferior a las de una fotografa tradicional. A partir de 1280 1024 es posible imprimir imgenes de 5" 7" (algo menos de 13 18 cms), con una resolucin algo inferior a los 200 dpi que puede considerarse "aceptable" sobre todo si la impresora cuenta con sistemas adecuados de dispersin del punto. Debe tenerse en cuenta que cualquier ampliacin en fotografa tradicional disminuye la resolucin lo que justica, hasta cierto punto, estas apreciaciones que son, pese a todo, ms bien generosas. Un ltimo mtodo de digitalizacin que debe mencionarse aunque su uso ha retrocedido bastante son las tabletas digitalizadoras. Una tableta digitalizadora consiste en un tablero por el que discurren internamente una serie de cables. Sobre la supercie de la tableta se hace discurrir un digitalizador: un lpiz electrnico o un ratn de caractersticas especiales que pueden incorporar un pequeo visor de aumento. La tableta se calibra de modo que su supercie se corresponda con la de una supercie equivalente especicada sobre el monitor. La red de cables que discurre por el interior de la tableta permite detectar la posicin del digitalizador. Todo esto permite que cualquier punto marcado sobre la tableta quede registrado en el ordenador con ayuda de los botones con que cuenta el digitalizador, lo que es un modo relativamente ecaz de digitalizar dibujos o datos basados en lneas. Las razones por la que su uso ha retrocedido son el abaratamiento de los escners y la gran variedad de herramientas con que cuentan los programas de CAD actuales para leer imgenes, lo que permite llevar a cabo este mismo operaciones con similar precisin y bastante ms comodidad. La digitalizacin de imgenes puede tambin hacerse a partir de imgenes tomadas con una cmara de vdeo. Esto supone una importante ventaja y un grave inconveniente. La ventaja es que puede sacarse gran partido de la agilidad y de la riqueza de alternativas que proporciona el vdeo. Puede lmarse toda una secuencia en directo y entresacar

22

Aplicaciones informticas en arquitectura

a posteriori, con toda la tranquilidad requerida, las imgenes ms adecuadas para el caso de que se trate. El inconveniente es que la resolucin y la calidad de la imagen quedan limitadas por la resolucin propia del vdeo que es de 625 lneas.

5 Almacenamiento
El trabajo con imgenes implica manejar un volumen de informacin mucho mayor que el que se da con otro tipo de programas. Esto implica varias cosas. En primer lugar, que es necesario plantearse el modo en que se va a a manejar este volumen de informacin. En segundo lugar, que habr que tener presente los muy diversos modos en que esta informacin est empaquetada puesto que no existen normativas universales y hay un nmero considerable de tipos de archivos que usan tcnicas diversas para optimizar este volumen de informacin. Volumen y equipamiento requerido Ya hemos visto en el ejemplo de clculo dado ms arriba que el almacenamiento de una imagen de tan slo 1024 768 pixels a 24 bpp o true-color requiere, sin compresin, ms de 2 mb. Represe en que, por ejemplo, tal como se resumen en la gura 17, una imagen a toda pgina, de 18 por 24 cm, grabada a una resolucin alta, requerira 275 Mb. Esto puede dar una idea de hasta qu punto es importante la gestin y el almacenamiento, tanto temporal como nal, de este tipo de informacin. Esto supone, en primer lugar, que se necesita una memoria principal (memoria RAM) muy superior a lo corriente para otro tipo de aplicaciones. Y, en segundo lugar, un procesador lo sucientemente rpido como para mover los datos a velocidad suciente como para que se pueda trabajar con comodidad. Y, en tercer lugar, un monitor de buen tamao que permita contemplar una parte suciente de la imagen. Para el almacenamiento intermedio o a corto plazo se suelen usar los dispositivos perifricos propios del ordenador, tales como el disco duro o los disquetes. Es obvio que para los volmenes de que estamos hablando, con cheros que superan ampliamente la capacidad corriente de estos ltimos que es 1.44 Mbytes, resultan insucientes y lo recomendable es entonces recurrir a sistemas magnetopticos, (por ejemplo Iomega Zip o Jaz),

con capacidades que oscilan desde 100 Mb hasta ms de un Gigabyte. Debe tambin tenerse en cuenta que la velocidad de transferencia de estos dispositivos es siempre inferior a la del disco duro y bastante variable segn los modelos. La generalizacin de las grabadoras de CDs han simplicado este problema y la opcin ms recomendable y ms utilizada es grabar la informacin en un CD en fases intermedias o una vez que se ha terminado el trabajo. Las grabadoras de CD se han convertido en una herramienta de precio asequible y el coste de los discos es muy inferior al de los magneto-pticos. Formatos El tratamiento de imgenes est lejos de ser un campo donde sea uido el intercambio de informacin. El excesivo tamao de los cheros que se suelen utilizar o la especicidad de sus aplicaciones ha generado varias docenas de tipos de codicacin, muchos de ellos especialmente adaptados a determinadas plataformas de trabajo. Otros han surgido mediatizados por los entornos operativos, como los subsidiarios del Windows, WMF, BMP o de sus primeras aplicaciones como el Paintbrush, PCX. Otro tanto se puede decir del entorno Apple. Algunos han sido concebidos para optimizar la impresin, este es el caso de los cheros tipo EPS o PostScript Encapsulado, etc.; no obstante poco a poco algunos se han ido convirtiendo en formatos de transferencia generalizados. Dentro de esta categora y en el mbito de los ordenadores PC los formatos ms extendido son probablemente el TIF, TGA, GIF o JPEG. Cada formato de almacenamiento de datos presenta unas peculiaridades que lo diferencia de los dems, y utiliza parmetros propios para la codicacin o gestin de la informacin, parmetros sobre los que generalmente no se da una informacin clara por parte de los programas que los usan. Esto, unido a que con frecuencia son revisados por sus creadores, sin previo aviso, para mejorar sus prestaciones, hace que se generen frecuentes conictos en el intercambio de los datos. La mayora de los programas de retoque o edicin de imgenes incorporan conversores que automticamente trasladan la imagen de un formato a otro, pero en muchos casos no avisan de qu informacin se dejan por el camino, ni qu mtodo de conversin emplean, ni si se utilizan algoritmos que compri-

Conceptos fundamentales de tora de la imagen digital

23

men la informacin para luego expandirla, con la posible prdida de datos que eso puede implicar. Para evitar problemas es recomendable la utilizacin de conversores especializados o de un software de probada ecacia y calidad. Dentro de un formato tipo, la informacin se almacena siempre precedida de una cabecera que lo identica, y de una serie de instrucciones que denen el tamao de la imagen y la organizacin de la informacin que sigue a esta cabecera. En algunos formatos esta informacin puede visualizarse, lo que es un modo de hacerse una idea ms cabal de cmo est organizado un mapa de bits. Se da a continuacin, una relacin, en orden alfabtico, que obviamente no puede ser exhaustiva, de los principales formatos que pueden encontrarse al trabajar con imgenes, junto con una breve descripcin de los mismos. BMP (Bit Map). Como su nombre indica son mapas de bits "en crudo", con escasa informacin adicional. Es un formato utilizado corrientemente en Microsoft Windows. Se utiliza principalmente para transferencia de informacin entre programas o para capturas de pantalla. Utiliza un formato independiente del sistema de color utilizado por cualquier dispositivo lo que facilita los intercambios. DCS (Desktop Color Separation). Es una variante de EPS que consta de cinco archivos y que se utiliza en AutoEdicin por Quark Express, que es quien lo propuso inicialmente, y Page Maker. La imagen se separa en cinco componentes, los cuatro colores de impresin ms uno ms de identicacin e informacin adicional. EPS (Encapsulated Postcript). Introducido por Adobe. Es el formato ms utilizado en edicin profesional. Sirve tanto para dibujos, con informacin vectorial, como para textos, como para imgenes. Pueden considerarse ms estables que TIF aunque ocupan an ms espacio en disco. GIF (Graphics Interchange Format). Formato de baja resolucin introducido por Compuserve para minimizar los tiempos de transferencia por las lneas telefnicas. Graba mapas de bits en modo paleta, con 8 bpp (256 colores) y comprensin por LZW (ver el siguiente apartado). Un formato muy popular antes de la aparicin de JPG porque generaba imgenes de poco tamao aptas para ser enviadas por red. Se sigue utilizando corrientemente en pginas Web y en hipertextos. IFF (Amiga Interchange Format). Era el formato usado por los ordenadores Commodore, en la poca

heroica de los primeros ordenadores personales, con capacidad de trabajar en grcos, relacionado directamente con el trabajo en vdeo y que se ha incorporado a algunos programas actuales que funcionan sobre PCs. JPG (Join Photographic Experts Group). Es el formato ms popular para almacenar e intercambiar informacin debido a que reduce el volumen en cantidades que van del 10% al 3% del original; o sea que podemos almacenar de 10 a 30 archivos .jpg en el espacio de uno en formato .tif o .tga. Esto se consigue a costa de una comprensin bastante agresiva que, en algunos casos, sobre todo para informacin que vaya a salir exclusivamente por pantalla, no tiene resultado visibles pero en otros, si se imprime a media o alta resolucin, puede deteriorar apreciablemente algunas zonas de la imagen, sobre todo las que presentan degradados suaves de diferentes matices. PCX. Formato desarrollado por ZSoft Corp. para su PC Paint Brush. Graba imgenes en modo 2, 4, 8 y 24 bpp y utiliza el mtodo de comprensin RLE para alcanzar proporciones mximas de 1,5 a 1. A partir de la versin 5 soporta color real (24 bpp). PDF (Portable Document File). Formato utilizado por Adobe Acrobat, basado en EPS y que, al igual que este, sirve tanto para texto como para vectores como para mapas de bits. Permite incorporar los hipervnculos y tablas propias del lenguaje HTML. PICT. Es el formato utilizado por los programas que funcionan bajo Macintosh para transferir informacin entre aplicaciones. Puede grabar en 16 o 32 en modo rgb o en 2, 4, 8 en modo blanco y negro. PNG. Alternativa al formato GIF para incorporar imgenes a pginas Web que preserva toda la informacin de color y comprime sin prdidas. Es el, por lo que sabemos, el nico formato (en 2001) que permite incorporar canales Alfa a archivos VRML. PXR (Pixar). Es un formato especco para ordenadores tipo Pixar utilizados slo en la gama alta del trabajo con imgenes para animacin y simulaciones de gran volumen y calidad, aunque algunos programas, como Photoshop, incorporan salida en este formato. RAW (literalmente "crudo"). Formato que se limita prcticamente a grabar el valor asociado a cada punto de una imagen, lo que facilita considerablemente su uso por diferentes tipos de programas.

24

Aplicaciones informticas en arquitectura

SCT (Scitex CT). Scitex Continuous Tone es un formato profesional que graba la informacin, por lo general en modo CMYK, con destino a impresin y utiliza un sistema patentado de semitonos que minimiza los efectos de Moir y otras inconsistencias que pueden aparecer durante la impresin en otros formatos. TGA (Targa). Es uno de los formatos ms antiguos y ms ables. Fue introducido por la empresa TrueVision Inc. de Indianpolis que tambin produca tarjetas grcas de alta calidad. Puede grabar mapas de bits en 16, 24 y 32 bpp y es compatible con la gran mayora de programas. TIFF (Tagged Image File Format). Es el formato ms utilizado para imprimir e intercambiar informacin. Puede grabar en formato normal o comprimido. La comprensin se realiza con un algoritmo estndar, el LZW (ver el siguiente apartado) que realiza comprensin sin prdidas y con el que en principio no se deberan encontrar problemas de descompresin. Muchos preeren sin embargo no usar TIFs comprimidos para no encontrarse con desagradables sorpresas. Hay otros formatos, como el PSD de PhotShop o el CDR CorelDraw o el AI de Adobe Illustrator, que son formatos nativos (propios de una aplicacin comercial) aunque pueden encontrarse en otras aplicaciones, si bien la norma no escrita es intercambiar informacin en formatos "no nativos" tales como los que se han relacionado. Compresin Debido al enorme tamao que llegan a alcanzar los cheros de imgenes, se precisa con frecuencia recurrir a mtodos de compresin de la informacin. La comprensin se basa fundamentalmente en detectar las repeticiones o las tendencias que aparezcan en la codicacin de la imagen y en sustituirlas por codicaciones ms compactas que indiquen, por ejemplo, el nmero de veces que aparece un determinado valor en una la en lugar de guardar todas y cada una de sus posiciones. Lo que parece una cuestin meramente prctica se revela pronto como una gran cuestin de gran calado lo que explica el hecho de que, desde hace muchos aos, sea ste uno de los sectores en que ms activamente se ha investigado. La razn es que hay temas de gran importancia terica que estn involucrados en lo que aparentemente no es sino una cuestin meramente tcnica. Estos temas

giran en torno a dos conceptos que pueden parecer similares pero no lo son. Lo que separa a los datos de la informacin es el eje de una reexin que interesa a muy diversos tipos de profesionales. Los datos son el material con el que se elabora la informacin. Pero este material hay que cocinarlo y, como ocurre cuando se cocina, hay mucha materia de relleno que puede tirarse a la basura. Esto que "se tira a la basura" porque no interesa para mantener lo esencial de la informacin es lo que se conoce como datos redundantes. La comprensin puede denirse como una operacin que elimina la redundancia. Ya hemos comentado en el primer captulo, a propsito de la teora de la informacin de Shannon hasta que punto no debe despreciarse la redundancia, una caracterstica esencial del modo en que se comunican los humanos. Pero no es menos cierto que en determinados contextos la redundancia es un estorbo. Similarmente, podramos decir que la retrica puede ser, tal como la deni Aristteles, "el arte de persuadir" o bien, tal como se comprueba a diario, una pesada carga con que nos bombardean desde televisores y peridicos. En informtica, el concepto de redundancia no es, sin embargo, un concepto abstracto sino una cantidad concreta. Se dene por la frmula RD= 1 - 1/CR, donde RD es la redundancia relativa de los datos y CR el factor de comprensin, que se dene a su vez por la frmula CR = n1/n2 en donde n1 y n2 son dos conjuntos de datos que representan la misma informacin. Si los dos son iguales CR es igual a 1 y RD es igual a 0, lo que indicara que el primer conjunto de datos no contiene datos redundantes. Un factor de comprensin tal como 5:1 indicara que el primer conjunto de datos tiene 5 unidades de informacin por cada unidad del segundo, el conjunto comprimido. En la teora relativa a los mtodos de comprensin se utilizan tres tipos de redundancia que merece la pena mencionar. La redundancia de cdigo puede analizarse con facilidad a partir de un histograma de la imagen, tal como los que se mostraran ms adelante. La distribucin de valores, revelada por el histograma, permite encontrar mtodos ms ecaces de representar los valores de la imagen por medio de frmulas ms compactas que resuman esta distribucin. La redundancia espacial tambin denominada redundancia geomtrica o redundancia entre pixels, permite condensar la informacin basndose no en los valores de los puntos de una imagen sino en el modo en que

Conceptos fundamentales de tora de la imagen digital

25

estn distribuidos. Es evidente que una imagen que presente, por ejemplo, una serie de cuadrados grises de iguales tonos, yuxtapuestos, puede tener la misma distribucin general de valores que otra imagen desordenada. Pero si se tiene en cuenta el modo en que estn repartidos geomtricamente estos valores se econtrarn mtodos ecaces de resumir la informacin. En tercer lugar hay sistemas que se basan en lo que se puede denominar redundancia visual. El ojo es ms sensible a determinadas diferencias bruscas de luminosidad en la medida en que reejan cambios signicativos. Las bandas de Mach son un efecto caracterstico; se aprecian transiciones bruscas de luminosidad en degradados cuando en otras condiciones no se veran como grises distintos. Esto limita la efectividad de muchos sistemas de comprensin de imgenes. Pero determinados programas de comprensin pueden captar estos puntos claves de transicin y, manteniendo la proporcin global de comprensin, introducir datos adicionales que proporcionen la cantidad necesaria de informacin como para que el ojo no eche en falta los grados necesarios de transicin entre zonas continuas de diferente luminosidad. En todos estos casos puede hablarse tambin de dos categoras principales de comprensin: con prdida y sin prdida. Algunos de los que se han mencionado en el apartado anterior son formatos que utilizan programas asociados que efectan compresin sin prdida. Ejemplos de programas que efectan comprensin de este tipo son LZW o REL. Tambin son de este mismo tipo programas utilizados externamente por muchos usuarios para comprimir cheros de todo tipo como los PKZIP, WinZip o ARJ. Otros mtodos, ms potentes, permiten encontrar formulaciones que se aproximen de modo suciente a la distribucin probabilstica de los

datos de una imagen. De esta manera se consiguen relaciones de comprensin mucho ms mayores aunque a costa de perder pequeos detalles, datos que no aparecern al recomponer la imagen. En estos casos hablamos de compresin con prdida. El sistema ms ecaz y ms popular de todos ellos es el JPEG que ya hemos mencionado en el apartado anterior y que alcanza porcentajes de comprensin verdaderamente sorprendentes. En imgenes con abundante textura y contempladas en pantalla no se aprecian diferencias entre cheros originales y comprimidos con valores de hasta un 3% del original. Hay que recordar sin embargo que, en imgenes con degradados suaves y que vayan a ser impresas a resolucin media, las diferencias pueden ser notables. Conversin Otra cuestin de gran inters terico y prctico es la conversin de cheros vectoriales a mapas de bits y viceversa. Lo primero es trivial, pues es una operacin que se est llevando a cabo siempre que obtengamos una salida de un chero vectorial por un monitor o una impresora raster. Lo segundo es muy complicado pues se necesita, idealmente, un programa "inteligente" capaz de reconocer qu puntos de la imagen "son" lneas que deben ser separadas del fondo. Sin embargo hay ciertos rasgos que es factible detectar con garanta de xito y existen varios programas, con diversos grados de potencia que permiten procesar imgenes obtenidas, por ejemplo, a base de digitalizar planos tradicionales, con una aproximacin lo sucientemente buena como para que el trabajo, casi siempre inevitable, de revisin del resultado para borrar elementos que el programa ha tomado por lneas de dibujo y no eran sino ruido de fondo, no sea excesivo y resulte menor que el que dara volver a dibujarlo todo desde el principio. La vectorizacin, que es como se denomina este proceso, es una aplicacin especca del procesamiento y anlisis de imgenes que tiene una importancia clara en las aplicaciones arquitectnicas. La efectividad del proceso es muy variable y depende de los casos. Un plano limpio y con abundantes lneas rectas o curvas bien denidas, puede vectorizarse con relativa facilidad. El programa no encuentra grandes dicultades para decidir qu es informacin relevante y qu no lo es. Por otro

Figura 18 Un ejemplo de redundancia geomtrica que facilita la compresin

26

Aplicaciones informticas en arquitectura

lado, un plano complejo y en mal estado confundir al programa que, en principio, no tiene modo de decidir si una mancha o una irregularidad en el trazado debe descartarse o debe convertirse en una entidad de la misma categora que otras lneas que representan pilares, muros o ventanas. En estos casos es, probablemente, ms efectivo el llevar la imagen directamente al programa y dibujar nuevas lneas, en una nueva capa, siguiendo las de la imagen como si estuvieramos calcando el plano a travs de un papel transparente. Tanto AutoCad como Microstation, a partir de sus ltimas versiones, permiten abrir un mapa de bits, incorporarlo al dibujo y mantenerlo estable, acrcandose y alejndose, lo que facilita considerablemente esta labor de calco. Se han producido varios trabajos de investigacin de inters sobre la posibilidad de desarrollar mtodos ms inteligentes de vectorizacin. El referente obvio son los programas denominados genricamente OCR (Optical Character Recognition) que permiten escanear un texto impreso y convertirlo en un chero de texto digital, es decir, convertir las imgenes de las letras en sus correspondientes caracteres codicados. En el caso de un texto estos es posible puesto que hay un nmero limitado de letras y un nmero limitado de familias de tipos con los que se representan estas letras. En el caso de los planos arquitectnicos esto es relativamente posible y, de nuevo, vara considerablemente segn los casos. En el caso de arquitecturas vulgares o muy estandarizadas, los elementos forman parte de un repertorio iconogrco limitado que se puede mantener como referencia de comparacin. Tampoco habra excesiva dicultad para reconocer que una lnea continua, que se cierra sobre s misma, debe representar algn tipo de muro. Parece lgico intentar abordar en primer lugar este tipo de casos antes de plantearse otros ms complejos. Hay investigaciones en curso que parecen prometedoras a corto plazo pero el hecho es que, por el momento, tan slo se cuenta con vectorizadores ms o menos ecaces que no alcanzan a realizar lecturas "inteligentes" de los planos arquitectnicos.

la imagen pero alteran el modo en que esta informacin se distribuye en el plano de la imagen, operaciones que se denominan corrientemente "geomtricas". Las que modican estos valores de varios modos y a las que podemos denominar genricamente "de transformaciones puntual de valores" aunque la diversidad de tcnicas es enorme y los trminos con que se alude a ellas en la literatura especializada muy precisos. Y, por ltimo, las que pueden considerarse en cierto sentido como mixtas, en la medida en que modican los valores de un determinado sector del plano de la imagen. Las operaciones que se describen en lo que sigue pueden llevarse a cabo sobre la totalidad de la imagen o sobre partes de la misma. Para este segundo caso se cuenta habitualmente con diversas herramientas y modos de seleccin que se pueden clasicar con arreglo a los mismos principios utilizados en el prrafo anterior para describir los tipos de operaciones. Es posible seleccionar puntos en el plano de la imagen por medio de especicaciones geomtricas, esto es, trazando sobre partes de la imagen rectngulos, crculos o formas libres que encierren los puntos que queremos transformar. O bien, en segundo lugar, es posible seleccionar puntos de la imagen basndose exclusivamente en sus valores. Y, por ltimo es posible seleccionar puntos de la imagen en funcin de sus valores y de su relacin espacial. Operaciones geomtricas Las operaciones geomtricas con imgenes se reducen bsicamente a la manipulacin de matrices que almacenan la posicin geomtrica de los pixels. Estas matrices pueden ser sometidas a todas las operaciones geomtricas clsicas, lo cual signica que es posible trasladar, girar, invertir y cambiar de escala la totalidad o partes determinadas de una imagen. Tambin es posible deformarlas, total o parcialmente, sea de modo libre, sea mediante transformaciones perspectivas, sea mediante transformaciones matemticas de diversos tipos. Todas estas operaciones bsicas son posibles gracias a la velocidad de clculo que proporcionan los ordenadores actuales pero hubieran sido impensables hasta hace pocos aos en un ordenador casero. An as, hay que advertir que se requieren ciertos mnimos para poder manipular imgenes de suciente resolucin y, por consiguiente, de gran tamao. Al margen de esta limitacin, el manejo

6 Operaciones con imgenes


Las operaciones con imgenes se pueden clasicar en tres grandes grupos. Las que no modican los valores de los diferentes puntos que constituyen

Conceptos fundamentales de tora de la imagen digital

27

de estas herramientas, que estn disponibles en cualquier programa sencillo de tratamiento de imgenes no ofrece mayor dicultad. Estas operaciones implican un problema tcnico que conviene tener presente. Al estar constituidos los mapas de bits por matrices enteras, tramas regulares de puntos yuxtapuestos, cualquier operacin geomtrica que utilice factores tales que la transformada no coincida con la trama primitiva necesitar contar con algn medio de decidir cmo asignar el valor terico de clculo al valor real de los pixels de la imagen. En el caso de una traslacin (gura 19) el ajuste no representa ningn problema pues la desviacin es igual para todos los pixels. En el caso de una rotacin (gura 20) es preciso recurrir a interpolaciones que asignen un valor al pixel en funcin de sus vecinos ms prximos. Hay ms de una solucin que no comentaremos dado que se trata de un proceso complejo y no visible para el usuario. Es preciso tener en cuenta sin embargo esta limitacin que se traduce en problemas tan concretos como que nos resultar imposible rotar una imagen con la misma facilidad con que lo hacemos en un programa de CAD2D. En el caso de un cambio de escala el proceso puede llevar a perder informacin sustancial, tal como se muestra, en un caso extremo, en la gura 21 que representa sucesivas redistribuciones de las muestras con las que el programa intenta responder a una peticin imposible de cumplir. Es necesario tener esto en cuenta en determinados casos en los que puede producirse modicaciones importantes del contenido de una imagen al llevar a cabo una operacin de transformacin geomtrica. El ejemplo de la gura 22 muestra hasta qu punto es posible simular una imagen real por medio de una combinacin de este tipo de transformaciones. Operaciones puntuales de transformacin de valores. Mapas de grises. Histogramas Se denominan operaciones puntuales (point processing) o tambin ltrado en el dominio espacial pixel a pixel a las operaciones ms sencillas de todas las que se realizan en el tratamiento de imgenes y que afectan a la informacin contenida en pixels individuales. Una operacin puntual transforma los pixels de la imagen aplicando la misma funcin sobre cada uno de ellos. Ejemplos de estas

Figura 20 Rotacin de un bloque de pixels

Figura 21 Cambios de escala de un bloque de pixels con prdida de la secuencia original

28

Aplicaciones informticas en arquitectura

Figura 22 Ejemplo de modicacin de una imagen por operaciones de traslacin, rotacin y cambio de escala operaciones puntuales son las modicaciones de contraste y brillo en las que al aumentar el brillo en una imagen monocromtica se suma una cantidad determinada a cada pixel. Las operaciones puntuales se basan en el valor de cada pixel. Las modicaciones introducidas sobre estos valores iniciales se pueden manipular por medio de lo que se denomina un mapa de grises (gray map) o ms exactamente, un mapa de transicin de luminancias. Un diagrama que representa en el eje de abscisas la luminancia de entrada o luminancia del punto, imagen o sector de imagen de que se parte y, en el eje de ordenadas, la luminancia de salida, la luminancia que se obtendr con posterioridad a la operacin que se ha especicado con la ayuda de este mapa. Si no se ha realizado ninguna operacin, el diagrama muestra una recta a 45, lo que equivale a decir que los valores de entrada coinciden exactamente con los valores de salida. El modo ms sencillo de llevar a cabo una modicacin del conjunto de valores representados por un mapa de este tipo es modicar esta recta. Hay toda una serie de operaciones elementales que se pueden realizar de este modo. Las ms corrientes son las que se enumeran a continuacin. La obtencin de un negativo es una operacin tcnicamente trivial que se reduce a invertir la direccin del diagrama de grises. El operador modica el mapa de modo que donde antes haba un

Conceptos fundamentales de tora de la imagen digital

29

Figura 23 Variacin de contraste y luminosidad de una imagen por modicacin del mapa de grises
(tomado de Alvaro Siza Vieira: Centro Gallego de Arte Contemporneo. Santiago de Compostela, 1988-94)

30

Aplicaciones informticas en arquitectura

0 o "negro" el resultado de la funcin imagen pase a ser 255 o "blanco", manteniendo la lnea a 45 pero en direccin contraria. La gura 24 a muestra un ejemplo de esta operacin. La binarizacin es otra tcnica muy sencilla que permite reducir una imagen en gama de grises a una imagen en blanco y negro sin ms que sustituir la recta a 45 del diagrama de grises por una recta vertical en un determinado punto del diagrama; todos los grises situados a la izquierda pasan a ser negros y todos los situados a la derecha pasan a ser blancos. (gura 24 b). El clipping es una operacin similar con la diferencia de hay dos valores en lugar de uno y se preserva una zona central en la que siguen habiendo grises; por debajo del valor inferior slo habr negros y por encima del valor inferior slo habr blancos. La umbralizacin (thresholding) es similar al clipping pero afecta slo a uno de los extremos de la imagen; se igualan todos los valores superiores o inferiores a uno dado y se mantiene la gama de grises en el resto. Ver guras 24 (c, d, e). Para la extensin del contraste de una imagen, es decir para la mejora del contraste en aquellas zonas de una imagen que han sido registradas con poca iluminacin, se puede ampliar el rango dinmico de las mismas, modicando la pendiente en el diagrama de escala de grises, de manera que entre unos valores dados, la recta que reeja la funcin de los nivel de grises de entrada y de salida del proceso, se vuelva ms horizontal, con lo que sus gradientes sern ms largos. Para la compresin del contraste o comprensin del rango dinmico se sigue un proceso inverso, haciendo ms pronunciada la pendiente en aquellas zonas que se quieren fundir. La gura 23 muestra una imagen en la que se ha modicado la disitribucin de valores por medio de una funcin logaritmo que modica con suavidad la pendiente de la curva, haciendo que aumente y se redistribuya el nmero de valores claros, el nmero de valores oscuros o la pendiente de la curva en la zona de valores medios, lo que tiene como consecuencia un aumento del contraste. La gura 24 f muestra tambin este mismo recurso combinado con un recorte de los valores ms obscuros (umbralizacin). Otra herramienta de fundamental importancia para este tipo de operaciones es el histograma. Un histograma (del griego , tejido y , inscripcin grca) es una representacin grca de la distribucin de las frecuencias de ocurrencia de

a) negativo; b) binarizacin; c, d) umbralizacin; e) clipping; f) umbralizacin y modicacin gamma

Figura 24 Variaciones bsicas del mapa de grises de la imagen anterior:

Conceptos fundamentales de tora de la imagen digital

31

un determinado suceso y se utiliza en un gran nmero de aplicaciones estadsticas. En procesamiento de imgenes, un histograma es una grca en la que en el eje de abcisas representa los diferentes niveles de grises de la imagen y el de las ordenadas el nmero de pixels que tienen ese valor particular. El clculo de un histograma se reduce a computar cuntos pixels hay para cada nivel de gris. El histograma es una herramienta valiosa, en primer lugar, porque permite conocer de un modo directo, intuitivo, las caractersticas globales de una imagen. El histograma de la gura 25, la misma gura de las dos ilustraciones anteriores, muestra con precisin lo que puede apreciarse intuitivament, esto es, que es una imagen con abundantes valores medios y escasos valores extremos, lo que contribuye a una impresin que en este caso, dadas las caractersticas arquitectnicas del ejemplo, puede ser adecuada. Los histogramas de las guras 26 y 27 revelan, a cualquiera que cuente con un mnimo de experiencia en el uso de estas tcnicas, que las imagenes correspondientes son imgenes: a) muy oscuras; b) muy luminosas; c) poco contrastadas; d) muy contrastadas. A partir de esta informacin es posible realizar diversas operaciones por modificacin directa del histograma. Es posible, por ejemplo, aclarar

u oscurecer una imagen o una seleccin de una imagen desplazando todos sus pixels a la derecha o a la izquierda de la grca, o bien, por ejemplo, reducir o ampliar el nmero de posibles niveles de gris, con lo que la imagen adquirir ms o menos contraste, etc. Otra operacin caracterstica es la ecualizalizacin que consiste en redistribuir los valores de una imagen, una operacin que se utiliza frecuentemente para mejorar el contraste. Si una imagen presenta un histograma en el que los grises se acumulan en, por ejemplo, la zona central esto indica una ausencia de blancos y negros y de valores cercanos a stos. La ecualizacin permite mejorar el contraste al redistribuir los valores generales. Los histogramas tambin se utilizan para operaciones ms sosticadas que permiten separar partes de una imagen en funcin de sus valores de gris. Estas operaciones que se denominan operaciones de segmentacin y a las que ya hemos aludido anteriormente, se basan en la determinacin automtica de umbrales a partir de los cuales se encuentran los valores que se quiere detectar. Operaciones locales de transformacin de valores. Filtros Denominaremos operaciones locales a las operaciones que afectan a la informacin contenida en el entorno de pixels individuales. Esto requiere la introduccin de un serie de conceptos previos, los principales de los cuales son los de vecindad, contorno y conectividad de un pixel. Se denomina vecindario de un pixel a los pixels que le rodean. Un pixel tiene 4 vecinos horizontales y verticales, uno a su izquierda, otro a su derecha, uno por encima y otro por debajo (que se denotan tcnicamente como "N4"). Adems de estos, tiene 4 vecinos diagonales (denotados como "Nd"). La unin de todos ellos ("N4+Nd") forma lo que se llama los "vecinos de p" (denotados por N8). Los N4 forman un contorno de orden 4 y los N8 un contorno de orden 8 o simplemente contorno. El tipo de conectividad (gura 28) tiene una considerable importancia para delimitar las fronteras entre elementos de una misma imagen. Para ello habr que ver si los dos pixel base tienen algn vecino comn y de qu tipo, pero, sobre todo, si sus niveles de gris respectivos satisfacen determinados criterios. Segn qu premisas se adopten el sistema puede simplicar en mayor o menor grado el muestreo.

Figura 25 Histograma de la imagen anterior

32

Aplicaciones informticas en arquitectura

Figura 26 Histograma de una imagen demasiado oscura y de otra demasiado clara Sobre esta base se desarrollan muy diversos tipos de ltros que sirven para innumerables aplicaciones y que cuentan con una gran cantidad de estudios tcnicos. Las tcnicas pasan por la utilizacin de convoluciones y transformadas de Fourier en la deteccin de los contornos de las zonas a seleccionar de manera automtica, si usamos un modelo espectral o por la edicin de los histogramas, si usamos un modelo matricial. Los ltros espaciales ms habituales son los que siguen: Los ltros de suavizado o alisado (smoothing lters) se utilizan para emborronar o aadir ruido a una imagen en un preproceso que busca eliminar pequeos detalles para que en una operacin inversa posterior la imagen clarique su informacin. Dentro de este tipo, los ms importantes son los de paso bajo (lowpass spatial ltering) que son ltros constituidos por una matriz de, por ejemplo, tres por tres elementos, cuyos valores son 1, los cuales se suman a cada uno de los pixeles de la zona de la imagen a ltrar, dividiendo el resultado de esta operacin por 9; este valor promedio sustituye al existente antes del ltrado. El efecto de un tro de este tipo es que la imagen se emborrona ligeramente, lo que puede convenir en determinados casos por diferentes razones tales como suavizar contornos o eliminar defectos de retoque. Los ejemplos de la gura 22 llevan incorporados este tipo de ltros para suavizar las transiciones despus de haber aplicado operaciones geomtricas o de haber insertado

Figura 27 Histograma de una imagen de bajo contraste y de otra de alto contraste nuevos elementos. Los ltros de endurecido o agudizado (sharpening lters) se utilizan, a la inversa de los anteriores, para destacar los valores ms luminosos de una imagen o aquellos detalles que se ven borrosos. Los ms habituales son los ltros de paso alto (basic highpass spatiallteting) en los que una matriz como la antes citada congura una mscara, la suma de cuyos elementos es cero y cuyo valor central es 8 rodeados de -l. Al operar este ltro sobre una zona de la imagen y dividir los resultados por nueve se obtiene la eliminacin de aquellos valores que no llegan al mnimo valor jado 1, ya que los dems son nmeros menores de cero y en consecuencia son descartados y quedan slo valores positivos. Hay un nmero enorme de ltros de diversos tipos que no tienen cabida en este apartado, tanto por razones de espacio como porque la mayora de ellos tienen escasa aplicacin en el caso de la arquitectura. Quien est interesado en el tema puede comenzar por experimentar con los que estn incluidos en programas de retoque digital de imgenes, como Photoshop, y por revisar la bibliografa sobre este tema para comprender mejor qu es lo que ocurre al aplicar alguno de los ltros ms sosticados lo que, en muchos casos, no resulta fcil desde un punto de vista meramente intuitivo.

Conceptos fundamentales de tora de la imagen digital

33

7 Impresin
Las imgenes que aparecen sobre la pantalla del monitor desaparecen en cuanto las apagamos. Para la mayora de las aplicaciones que nos interesan es preciso contar con copias permanentes sobre algn tipo de soporte, preferentemente papel, que puedan ser consultadas o presentadas independientemente de los complejos dispositivos que requiere un sistema informtico de generacin de imgenes. Las caractersticas de la imagen impresa sobre papel son bastante diferentes de la que aparece sobre el monitor. El control de los parmetros que inciden sobre estas caractersticas, as como el anlisis de la relacin calidad-coste, constituyen un captulo complejo que se relaciona, por un extremo, con los medios tradicionales de pintura e impresin y, por otro, con tecnologas especcas que se han desarrollado en los ltimos aos. Ambos extremos deben ser tomados en consideracin para asegurar un control suciente sobre las imgenes impresas a partir de archivos informticos. Parmetros de control Hay tres factores principales que se deben considerar y que no son sino los mismos que ya hemos visto en apartados anteriores, considerados desde el punto de vista de los dispositivos de salida. Estos son: la resolucin, la reproduccin correcta de gama de intensidades de gris y la reproduccin correcta del color. La resolucin es un parmetro que nos permite calibrar la calidad de la imagen en relacin con la capacidad de discriminacin visual de un sujeto medio. Trminos tales como "desenfocado", "nivel de detalle", "grano", etc., describen una imagen en relacin con esta capacidad de discriminacin. La reproduccin correcta de los valores es un parme-

tro que nos permite calibrar la riqueza de matices de una imagen. Trminos tales como "equilibrado" o "contrastado" aluden a este segundo aspecto que a menudo est estrechamente relacionado con el anterior. Lo dicho hasta aqu vale para imgenes en blanco y negro; en el caso de imgenes en color los trminos descriptivos se multiplican y, con ellos las dicultades de control a travs de todos los pasos que llevan a una imagen nal, impresa sobre papel. Los apartados que siguen ampliarn sumariamente conceptos bsicos que ya han aparecido en otros apartados anteriores. Resolucin y resoluciones Lo primero que hay que subrayar es que no se debe hablar de "resolucin" en singular sino en plural. Cada uno de los estadios por los que hay que pasar en el tratamiento de imgenes implica una serie de controles de la resolucin propios de ese estadio. Por lo general, se parte de una imagen dada en forma de fotografa o captada directamente por una cmara digital y que sufre una serie de manipulaciones hasta convertirse en otra imagen similar. A travs de estos pasos estaremos utilizando la palabra "resolucin" para referirnos a cinco cosas distintas: a) la resolucin de digitalizacin; b) la resolucin de la imagen sobre la que trabajamos; c) la resolucin de la imagen que vemos en el monitor mientras trabajamos; d) la resolucin nominal de la impresora con la que contamos; e) la resolucin de esta impresora en trminos de semitonos. Por consiguiente, las cosas no son tan simples como en el procedimiento general que hemos descrito en la seccin 4 de este captulo bajo el epgrafe "Procedimientos corrientes de digitalizacin". Ciertamente, comenzaremos por una estimacin de la resolucin de salida para saber a qu resolucin debemos digitalizar una imagen. Pero ninguno de estos dos trminos est sucientemente claro en la mayora de los casos. Si queremos darnos un margen de seguridad probablemente utilizaremos una resolucin de digitalizacin algo superior. Esto nos dar mayor margen para las operaciones que vayamos a efectuar sobre la imagen y, al nal, podemos reducir el tamao de la imagen, sin prdida apreciable de calidad. Por otra parte, lo que vemos sobre el monitor puede ser engaoso por muchas razones, la principal de las cuales, tal como veremos ms adelante,

34

Aplicaciones informticas en arquitectura

es la relativa al color. Pero desde el punto de vista de la resolucin tambin es preciso tener en cuenta algunas diferencias notables. La resolucin necesaria para que los puntos discontinuos aparezcan como continuos est en torno a las 5 lpm (lneas por milmetro) equivalentes a 127 dpi (dots per inch, puntos por pulgada) para una distancia de observacin normalizada de 25 cm. Sin embargo, debido a varios factores, la calidad que proporciona esta resolucin resulta insuciente: aunque no se distinguen puntos discontinuos se aprecian subjetivamente faltas de regularidad. Uno de estos factores deriva del modo de impresin de la mayora de los dispositivos: al utilizar matrices de puntos para almacenar la imagen, los puntos de impresin no coinciden siempre con los puntos correspondientes de la imagen, lo que se traduce en irregularidades en el trazo; una misma letra puede aparecer con grosores ligeramente diferente segn la posicin en que haya ido a caer. Un segundo factor es psicofsico; la vista humana detecta fallos de alineacin aunque no los vea propiamente. Esto no se aprecia en un monitor, debido a que los puntos son luminosos e irradian, fundindose con sus vecinos, y a que los puntos tienen diferente intensidad. Por esta razn la resolucin con la que trabajan la mayora de los monitores, que est en torno a los 72 dpi, resulta satisfactoria. Cuando la misma imagen se imprime, en negro sobre blanco (con lo que la irradiacin funciona en sentido inverso), con puntos de igual intensidad, la resolucin necesaria para conseguir resultados similares puede ser ms de 5 veces mayor. Se consideran los 300 dpi como un lmite inferior para imprensin de textos con calidad equivalente a la de un libro corriente y los 600 dpi como un lmite adecuado para una calidad realmente comparable a la de las buenas impresoras tradicionales. Las mejores impresoras, las Linotronic, tienen modelos que alcanzan los 1.270 dpi y los 3.386 dpi por las razones que se vern a continuacin. Esto quiere decir, entre otras cosas, que para controlar los detalles de la imagen en el monitor ser necesario trabajar con la imagen muy ampliada y desplazndose por sus diferentes partes para analizar los detalles. Una resolucin de 600 dpi sigue siendo sin embargo insuciente para imprimir imgenes con una amplia gama de grises y degradados continuos. Una impresora no puede variar la densidad de la tinta para conseguir diferentes niveles de gris tal como ocurre en fotografa o en pintura. Para simular la variacin de intensidad se recurre a una tcnica

mediante la cual se logra un efecto ptico similar al de utilizar diferentes intesidades, a base de crear puntos yuxtapuestos de diferente tamao o de diferente distribucin, que no se aprecian a simple vista. Esta tcnica se denomina convencionalmente de semitono (halftoning). Semitonos, "lineatura" y dithering Hay dos modos principales de obtener semitonos: mediante variacin del tamao de los puntos, tal como se hace en las tcnicas tradicionales de imprensin y mediante la variacin de la distribucin de los puntos, de modo que se obtengan mnusculas reas de diferente densidad tal como se hace por medios informticos. El primer mtodo, el semitono tradicional, del que se muestra un ejemplo en las gura 29 y 30, se consigue fotograando el original a travs de unas planchas de vidrio recorridas por lneas negras en vertical y horizontal. Estas lneas, que tradicionalmente se obtenan haciendo incisiones verticales y horizontales sobre el vidrio que se rellenaban de betn, crean una matriz de pequeos huecos cuadrados que permiten el paso de la luz y que actan como diminutos objetivos fotogrcos. Cada zona correspondiente de la imagen original, as fotograada, proporciona una impresin sobre el negativo que, por efecto de la difraccin, se convierte en un punto ms o menos grande, en proporcin directa con su luminosidad. El nmero de lneas con que se graban estas planchas de vidrio, que se colocaban delante del negativo y dan una medida directa de la calidad de la reproduccin, se denomina lineatura, resolucin de trama o "frecuencia de pantalla" (screen frequency) y se mide en lpc (lneas por centmetro) o lpi (lines per inch). La gura 31 muestra una relacin de las frecuencias caractersticas que se utilizan en todas las imprentas. La calidad "gruesa" se utiliza en folletos, boletines o peridicos de baja calidad. La calidad "media" en libros de calidad variable, desde 40 lpc, relativamente tosco, a 60 lpc, de calidad relativamente buena. La mayora de los peridicos se imprimen a unos 35 lpc (85 lpi). Los valores por encima de los 70 u 80 lpc (180 a 200 lpi) corresponden a libros o revistas de arte, impresos sobre papel brillante con una alta calidad de reproduccin. Estos valores estn directamente relacionados con la calidad del papel y el proceso de impresin.

Conceptos fundamentales de tora de la imagen digital

35

Figura 29 Imagen obtenida de un peridico (semitonos con una lineaturade 50 lpc)

Figura 30 Ampliacin de la imagen anterior en la que se aprecian los diferentes puntos

Si se pretendiera imprimir un peridico, con un proceso adecuado para 35 lpc a resoluciones superiores, se obtendran resultados no homogneos debido a que los puntos resultaran demasiado pequeos para las condiciones de impresin y se perderan, las reas obscuras tenderan a confundirse y, en general, disminuira la calidad de la imprensin, en contra de lo que parece que sera de esperar. Con papeles satinados se puede llegar sin problemas a los 60 lpc (150 lpi) y con papeles de alta calidad hasta 80 lpc (200 lpi). Utilizando tcnicas especiales, como el offset seco, pueden alcanzarse los 120 lpc (300 lpi). Pero, en general, pocas imprentas trabajan bien por encima de los 50 o 60 lpc. En blanco y negro se utilizan valores algo ms altos que en color. En cualquier caso, esta tcnica no puede utilizarse en las impresoras corrientes que slo admiten dos niveles de grises y puntos idnticos. Por esta razn es necesario utilizar tcnicas de semitono digital (digital halftoning) y agrupar puntos para obtener calidad gruesa mediana na lpc 20 -30 40 - 60 70 - 80 lpi 50 - 75 100 - 150 180 - 200

Figura 31 Frecuencias caractersticas utilizadas en impresin tradicional

clulas, pixels de mayor tamao, que permitan obtener diferentes intensidades por combinacin de los puntos que los forman. Cuanto mayor sea el nmero de puntos asociados para formar una clula, mayor ser el nmero de combinaciones posibles de puntos blancos y negros que se vean como diferentes grises a una distancia adecuada y, por consiguiente, mayor ser el nmero de grises aparentes que se pueden crear. El nmero de grises ser n n + 1, donde n es el nmero de elementos de la clula. As, por ejemplo, una clula o spot de 4 4 puntos proporcionar 17 niveles de gris, una cifra insuciente para conseguir imgenes que reproduzcan adecuadamente una amplia gama de grises, y una clula de 8 8 proporcionar 65 niveles de grises lo que puede ser ms que suciente para muchas aplicaciones. Esto se consigue a costa de la resolucin. Si tenemos una impresora que imprime a 300 dpi y utilizamos clulas de 4 4 para imprimir imgenes grises la resolucin real ser un cuarto de la nominal, es decir, estaremos imprimiendo lneas con una resolucin efectiva de 75 dpi. Esta es la razn por lo que los ms potentes modelos de impresora, como la Linotronic, utilizan resoluciones superiores a los 2.000 y 3.000 dpi. La obtencin de semitonos por medio de clulas basadas en combinaciones de puntos tiene el inconveniente de que determinadas distribuciones dan lugar a efectos geomtricos que conguran patrones visibles denominados efectos "de moire". Para evitar efectos extraos se adoptan determi-

36

Aplicaciones informticas en arquitectura

nadas conguraciones geomtricas en las clulas equivalentes de cada nivel de gris. El patrn de base del halftoning puede variar de forma y as existen patrones lineales, romboidales, etc., generados a partir de matrices de diferentes tamaos. Esta tcnica de reorganizacin en patrones que producen diferentes efectos se denomina dithering. La gura 32 muestra los valores principales de un conjunto de 17 niveles obtenidos por agrupaciones aleatorias de puntos sobre clulas de 4 4. Qu resolucin utilizar si queremos obtener una resolucin equivalente a alguna de las que hemos dado ms arriba con referencia a la impresin tradicional? Si supieramos, por ejemplo, que una impresora a 300 dpi utiliza spots de 4 4 esto querra decir que la resolucin efectiva de una imagen sera de 75 dpi (300/4). Si, a la inversa, queremos trabajar con una impresora capaz de generar "lineaturas" de 150 lpi y ser capaz de interpretar 256 niveles de gris quiere decir que necesitaremos una impresora con una resolucin efectiva de 2.400 dpi (256 niveles requieren clulas de 16 16; 16 150 = 2400). El problema est en que, por lo general, no se conoce el tipo de spot utilizado por las impresoras corrientes; los fabricantes no suelen proporcionar este dato. Y con esta observacin, a la que seguiran otras similares, abandonamos el terreno de los nmeros con signicado claro para entrar en el de las estimaciones con signicado brumoso. Suponiendo que conociramos la frecuencia de nuestra impresora cmo relacionar este valor con el de la resolucin adecuada de la imagen? Una regla aceptada corrientemente por los profesionales, y que est basada ms en resultados prcticos que en clculos tericos es que para obtener "buenos resultados" la resolucin de la imagen debera de ser en torno a 2 veces (entre 1,5 y 2,5 segn los ms y los menos optimistas) la resolucin de frecuencia de la impresora. Es decir, si queremos obtener una frecuencia de 150 lpi la resolucin de la imagen Figura 32 Simulacin de semitonos por clulas que agrupan diferentes densidades de puntos

debera ser de 300 dpi. Observse que, segn esta regla, es innecesario, para imgenes cuyo destino es acabar siendo impresas por medios tradicionales, ir ms all de los 400 dpi (200 lpi 2). Y, contrariamente a lo que se piensa, un exceso de resolucin puede llegar a ser contraproducente. Color Por lo que respecta al color los problemas son bastantes ms complejos y los presentaremos muy brevemente en lo que sigue. Trabajar en lo que se denomina "color real" supone utilizar 24 bits por pixel, 8 bits por cada uno de los tres canales RGB. Esto supone 256256256 o 16,7 millones de colores que pueden tener diferentes cdigos. Lo primero que hay que aclarar es que estos famosos "16.7 millones de colores" de que se puede disponer en cualquier ordenador actual no se corresponden con el rango real de diferencias cromticas percibidas; poco ms del 5% de estos colores son percibidos como distintos. Las razones tcnicas por lo que se necesita trabajar con "color real" (true color, 24 bpp o 16,7 millones de colores) se pueden condensar en la siguiente regla prctica: si se trabaja con una escena en al que vayan a aparecer degradados, cielos azules o paredes lisas iluminadas con luces ms o menos rasantes, es preciso trabajar con color real para evitar que aparezcan franjas que rompan la continuidad de este degradado. En escenas en las que no hay degradados y todas las supercies tienen bastante textura y, en general, en modelos simples en las que no se necesite un gran grado de realismo es ms que suciente trabajar con lo que se denomina "color indexado" que utiliza paletas de 256 colores (8 bpp) en lugar de 16,7 millones (24 bpp) lo que reduce considerablemente el volumen de memoria necesario. Pero esta regla tambin depende del dispositivo de salida. Si, en el primer caso, en que aparecen degradados, la salida va a ser por pantalla en donde los puntos son mayores y hay un proceso de irradiacin que hace imperceptibles los defectos en los degradados la regla tambin es es utilizar color indexado o un sistema de comprensin potente como los formatos jpg a que ya nos hemos referido antes. La gura 33 muestra el modo en que un sistema de color indexado utiliza una tabla (look up table) para guardar los valores cromticos economizando memoria. En ambos casos (parte superior e inferior

Conceptos fundamentales de tora de la imagen digital

37

de la gura) se est especicando un color "marrn rojizo". Pero en el primero este color es parte de una preseleccin basada en especicaciones RGB mientras que en el segundo caso la especicacin es directa. Los sistemas de codicacin digital se basan en la mezcla aditiva. Esto quiere decir, entre otras cosas, que quienes tengan experiencia en pintura o fotografa debern olvidarse de que los colores primarios son el amarillo, magenta y cyan, y comenzar a pensar de acuerdo con otros primarios ms genuinos: el rojo, verde y azul. Ambas tradas son, por otra parte, complementarias entre s. Si se yuxtaponen amarillo con azul, magenta con verde o cyan con rojo el resultado ser una combinacin que tiene la curiosa propiedad de que, observada a gran distancia (o reducida a un par de puntos) se convierte en gris mientras que observada de cerca se satura; ambos colores se muestran en todo su esplendor, se realzan mutuamente. Hay dos sistemas principales utilizados para la especicacin del color, el sistema RGB que se corresponde con el propio sistema de generacin del color en un monitor, a partir de tres canales rojo, verde y azul asociados a los caones electrnicos que activan los fsforos de la pantalla, y el sistema HLS (o HBS o HVS), siglas de tono (hue), luminosidad, brillo o valor acromtico (lightness, brightness o value) y saturacin (saturation), que permite especicar un color de acuerdo con varia-

Figura 33. Comparacin entre el rango cromtico natural (a), el de un monitor (b) y el de una impresora de color (c)

Figura 33 Asignacin cromtica por paletas de color indexado (256 colores) o especicacin directa (16,7 millones de colores)

bles perceptivas. Estos sistemas deben ser puestos en correspondencia con sistemas propios de mezcla substractiva por medio de mecanismos de conversin intersistema y de conversin analgica. El principal sistema dirigido a dispositivos de salida es el sistema CYMK (cian, yellow, magenta, black) si bien hay otros, ms ecaces, basados en el dispositivo especco de impresin que se va a utilizar, y que ayudan a prevenir, hasta cierto punto, las desagradables sorpresas con que se encuentra quien pasa a recoger de la imprenta la imagen que haba ido trabajando cuidadosamente en su monitor. Una profundizacin en el uso del color debera considerar que los sistemas de codicacin son muy diversos y que, en determinadas circunstancias, puede ser necesaria una especicacin ms exacta. El referente principal es el diagrama cromtico de la CIE por el que se rigen internamente todas las especicaciones tcnicas de dispositivos. Hay varias versiones de esta especicacin. Las principales son las correspondientes a la normativa de 1931 que especica los colores en base a dos coordenadas imaginarias, x,y y a un porcentaje de Luminancia, L y las correspondientes a la normativa de CIE Lab de 1964 que especica los colores en relacin con dos parmetros que indican el porcentaje relativo de rojo-verde o amarillo-azul. La gura 34 muestra en primero y segundo lugar unos esquemas que se corresponden con los digramas y espacios cromticos de la CIE. El primero (a) corresponde al modelo de 1931 y el segundo al de 1976 (b). Los esquemas siguientes corresponden a: los cubos RGB (c) y CMY (d) que ya hemos descrito; el semicono (e) y el doble cono (f) que corresponden a diferentes variantes de los sistemas HLS; el modelo de Munsell (g) que sigue siendo, desde principio de siglo, un sistema an ampliament utilizado y que conviene tener presente y el modelo NCS (Natural Color System) (h) que comenz a utilizarse en Suecia y posteriormente en varios paises de Europa en los ltimos aos. Por lo que respecta al control de la impresin, en primer lugar hay que subrayar el hecho de que no es posible conseguir una reproduccin sobre papel que reproduzca los mismos colores que aparecen en un monitor. La gura 35 muestra varios diagramas superpuestos. El mayor de todos, etiquetado con la letra "a", representa el diagrama de la CIE que, tericamente, representa el rango de colores que es capaz de percibir una persona "normal", esto es,

38

Aplicaciones informticas en arquitectura

Figura 34 Principales modelos de especicacin cromtica

una persona menor de unos 35 aos y sin ninguno de los defectos en la percepcin de los colores que afectan aproximadamente a un 6% o un 8% de la poblacin (mayoritariamente masculina). Los valores situados en el vrtice inferior derecho de esta especie de suela de zapato que forma el diagrama de la CIE representan rojos puros, los situados arriba de todo, en la punta de la suela, verdes, con amarillos anaranjados hacia la derecha y amarillos verdosos hacia la izquierda, los situados en el vrtice inferior izquierdo del diagrama representan azules puros. El diagrama etiquetado como "b" representa los colores que es capaz de reproducir un monitor. Como se puede apreciar en la gura este rango es muy inferior al rango de colores que podemos realmente apreciar. El diagrama etiquetado como "c" representa los colores que es capaz de reproducir una impresora de color. Este rango es an ms restringido que el de un monitor y, lo que es peor, coincide con el de un monitor tan slo en su zona central pero hay una marcada discrepancia en los extremos, es decir, hay colores que un monitor puede generar pero una impresora de color no y viceversa. En segundo lugar, la especicacin de un color se da en funcin de tres colores primarios que son distintos en mezcla aditiva y en mezcla sustractiva. Pero que tambin son distintos entre s pues dependen en gran medida del dispositivo concreto que estemos utilizando. Una misma imagen, presentada en monitores de diferentes marcas, mostrar diferencias apreciables. Pero incluso puede aparecer como distinta en el mismo monitor si no se ha cuidado de calibrar este monitor adecuadamente en funcin de una determinada iluminacin ambiental. No hay ni que decir que algo similar ocurre con las impresoras. Prubese a imprimir una imagen, con suciente variedad de colores saturados de todas las gamas, en diferentes impresoras. Los verdes pueden hacerse amarillentos o azulados, los azules verdes o violetas, los rojos anaranjados o carmines y los tonos neutros desequilibrarse en todas las direcciones posibles. Lo primero que se necesita para intentar controlar los colores es ser consciente de que este problema es, por ahora, irresoluble. Lo siguiente, saber que el nico medio de alcanzar cierto control es trabajar con un monitor perfectamente regulado, en condiciones ambientales idnticas e imprimir

Conceptos fundamentales de tora de la imagen digital

39

Figura 35. Rangos cromticos de un monitor y una impresora de color

siempre con una misma impresora con la que se hayan hecho sucientes pruebas para saber cmo responde a las diferentes gamas del espectro cromtico. Y, a partir de ah, armarse de paciencia y anotar el tipo de correccin que es necesario hacer en cada canal, en funcin de un monitor determinado y una impresora determinada para reducir al mnimo el impacto de estas inconsistencias. Dispositivos Ya se han comentado las diferencias principales en el captulo sobre recursos bsicos. Rercordaremos brevemente lo dicho ah insistiendo en otros aspectos y con referencias especiales a la imprensin en color. a) Un plotter de color puede considerarse, por lo que respecta a su funcionamiento tcnico, como una gran impresora por lo que, segn su tipo, valdr lo dicho para alguno de los tipos de impresoras que se mencionan en lo que sigue. b) Las impresoras de chorro de tinta (ink jet printers) rocan el papel con minsculas gotas de densidad cuidadosamente calibrada que atraviesan una matriz de puntos perforados sobre una plancha metlica. La velocidad del papel debe estar tambin cuidadosamente calibrada pues aunque el secado es muy rpido ligeras diferencias en la velocidad se traducen en zonas emborronadas. La impresin a color es, por esta razn, muy lenta. Utilizan cuatro colores (cyan, magenta, amarillo y negro) en lugar de uno solo y, con un poco de suerte, la ligera dispersin de las tintas favorece la mezcla. Las resoluciones nominales se dan (2000) en tres categoras bsicas: baja, en torno a los 300 dpi;

media/ alta, en torno a los 600/700 dpi; y "muy alta", en torno a los 1200/ 1400. c) Las impresoras electrostticas, al igual que los plotters electroestticos cuentan con un dispositivo que coloca una carga negativa en los puntos del papel que van a ser impresos; el toner, cargado, se adhiere a estas partes. Tambin pueden utilizar los cuatro colores de la cuatricroma sustractiva. d) Las impresoras lser funcionan en base a un principio similar pero ms sosticado. Un rayo lser rastrea un tambor cargado postivamente y recubierto de una capa de selenio. Las reas alcanzadas por el rayo lser pierden su carga. El toner est cargado negativamente y se adhiere a las partes que han permanecido cargadas. El principo es el mismo en impresin a color con la diferencia de que el rastreo se repite cuatro veces. Debido al tipo de tecnologa, a igualdad de resolucin la calidad es bastante superior a la de las impresoras de chorro de tinta. La velocidad tambin es mayor. Y el precio tambin. e) Las impresoras de transferencia trmica (thermal transfer printers) se basan en diminutas puntas calefactoras que se agrupan en densidades del orden de unas 200 por pulgada. Transeren pigmentos desde un papel recubierto con cera de color al papel de imprimir. Estas puntas calefactoras se calientan selectivamente en funcin de la informacin recibida que, como antes, se corresponde de un modo directo con la matriz de puntos que conguran estas puntas. Se utilizan principalmente en impresin a color y el papel de transferencia es un rollo continuo en el que se alternan 4 franjas de cyan, magenta, amarillo y negro, de longitud igual al tamao del papel de imprimir. A pesar de lo sosticado del proceso, la impresin puede durar menos de 1 minuto debido a que las puntas calefactoas se calientan y enfran con gran rapidez. f) Las impresoras de transferencia de colorante por sublimacin trmica (thermal sublimation dye transfer) son relativamente similares a la anterior en su funcionamiento general. El trmino "sublimacin" se reere a que, en teora, hay una transicin del estado gaseoso al slido sin pasar por el lquido algo que parece discutible que ocurra exactamente as. En cualquier caso, hay una diferencia realmente importante y es que esta tcnica de transferencia permite alcanzar ms de 200 intensidades de gris por cada uno de los 4 canales. Esto, unido a una resolucin suciente, que est siempre por encima de los 200 dpi y a que se produce un cierto efecto

40

Aplicaciones informticas en arquitectura

de fusin entre las tintas, hacen que la calidad que se alcance sea casi fotogrca, claramente superior a la de las anteriores. Son algo ms lentas pero proporcionan la mxima calidad para imprensin a color sobre papel. g) Otro mtodo de obtencin de copias permanentes es por medio de una lmadora. Se denomina lmadora a un dispositivo que consiste en un tubo de rayos catdicos en cuyo extremo se sita, en lugar de una pantalla recubierta de fsforo, una cmara con la pelcula abierta hacia el interior del tubo. La imagen se enva desde la CPU a travs de un puerto paralelo, igual que se enviara a un monitor. El rayo de electrones va recorriendo muy lentamente la pelcula (puede tardar alrededor de 3 minutos en lmar una imagen de 4 Mb) efectuando una pasada por cada uno de los tres canales rojo, verde y azul, a una resolucin que puede alcanzar las 4.000 lneas y hasta las 8.000 lneas en las lmadoras de mejor calidad. Muchas de estas tcnicas comienzan a resultar obsoletas debido a la creciente difusin de la presentacin de resultados por medios directos a travs de monitores, o proyectores conectados al ordenador. Las enormes ventajas que esto presenta, sobre todo en la media en que permite obviar todos los problemas tcnicos de conversin, control de la resolucin o el color, etc., no necesitan ser subrayadas.

En el campo especco de la arquitectura el tratamiento de imgenes implica a una enorme variedad de tcnicas de las que mencionaremos tan slo las principales: 1. La preparacin de imgenes de proyecto. Esto implica: a) la generacin y ajuste de imgenes a partir de procesos previos de modelado y simulacin (rendering); b) la generacin de texturas materiales que puedan incorporarse a una simulacin; c) la composicin de los resultados en un nico panel que integre diferentes formatos (dibujos, textos, imgenes); 2. La generacin directa de imgenes por procedimientos directos de pintura electrnica o por collage electrnico a partir de fotografas de escenarios reales o por fusin de imgenes, obtenidas a partir de modelos virtuales, con imgenes obtenidas por fotografa de escenarios reales; 3. La recuperacin y restauracin de imgenes. Esto puede aplicarse a: a) la recuperacin de dibujos o imgenes de otros proyectos, sea con nes de catalogacin, sea para utilizarlos en otros proyectos; b) la vectorizacin de dibujos tradicionales y el retoque de los resultados para obtener modelos de CAD2D sobre los que se pueda seguir operando. 4. El control de la impresin y la lmacin de los resultados obtenidos en los procedimientos anteriores; 5. La fotogrametra automatizada o la obtencin de modelos por escner 3D. 6. La conversin de textos por medio de OCR para integrarlos en memorias de proyecto o en otro tipo de documentos. En el ltimo apartado de esta seccin daremos algunas referencias adicionales sobre el uso de programas de pintura digital en arquitectura. Por lo que respecta a otras tcnicas que hemos mencionado y que apenas se han tratado en secciones anteriores insistiremos brevemente en alguna de ellas. La vectorizacin permite, a partir de un mapa de bits (una imagen obtenida por diversos medios,

8 Aplicaciones arquitectnicas
Como ya hemos dicho anteriormente, dentro del procesamiento de imgenes se incluyen muchas tcnicas y mtodos que pueden agruparse bajo dos grandes grupos de aplicaciones; por un lado la restauracin o mejora de imgenes, lo que puede llevar de hecho hasta la creacin de imgenes originales y, por otro lado, el anlisis o la interpretacin de imgenes. En el primer caso se trata de corregir desde pequeas deciencias que entorpecen la visin hasta anomalas muy grandes que las hacen casi inservibles. El segundo caso abarca desde tcnicas relativamente sencillas como la vectorizacin, hasta tcnicas propias de robtica y visin articial. Estos grandes grupos tienen tambin su paralelo en el campo de la arquitectura.

Conceptos fundamentales de tora de la imagen digital

41

bsicamente un escner), generar representaciones vectoriales por medio de rutinas capaces de detectar contornos e interpretarlos como lneas. Aunque por el momento en las aplicaciones comerciales ms a mano su rendimiento es bajo y se necesita invertir una considerable cantidad de tiempo en retocar manualmente el resultado, es de esperar que acabe resultando una herramienta potente de trabajo. Entre otras cosas, puede permitir integrar con facilidad bocetos hechos a mano en el proceso informtico. Los programas de OCR (Optical Chracter Recognition) permiten la identicacin automtica de los caracteres de un texto de una imagen y su conversin a fuentes de un programa de tratamiento de textos. Esto tiene un valor considerable para muy diveras aplicaciones como es fcil imaginar. Y puede extenderse a otros campos. En la actualidad ya existen diversas aplicaciones experimentales que hacen lo mismo pero detectando simbologas especializadas, como las usadas en arquitectura para representar aparatos sanitarios, muebles, instalaciones, etc. Por lo que respecta a la fotogrametra automatizada, existen en el mercado diversas aplicaciones pero por el momento sus limitaciones an son muchas y su coste excesivo al estar optimizadas para equipos de alto nivel tecnolgico. Recientemente han aparecido aplicaciones en Windows, que salvo por el hecho de que precisan un apoyo taquimtrico tradicional y sus resultados no son tan precisos como los habituales en topografa, es probable que se acaben incorporando al trabajo profesional. Los mtodos fotogramtricos sin embargo estn siendo superados rpidamente con la aparicin de escners laser 3D. Estos escners permiten la generacin semiautomtica de modelos 3D por medio de un escner que enviar un rayo lser sobre la supercie que se quiere modelar. La incidencia del rayo es leda por el mismo aparato desde otra posicin lo que permite obtener la posicin del punto en el espacio. La velocidad y la precisin con que se generan estas nubes de puntos son tan superioreres a los mtodos de restitucin que hacen que el elevado coste se pueda amortizar con relativa facilidad debido a la drstica reduccin en horas de trabajo.

42

Aplicaciones informticas en arquitectura

Potrebbero piacerti anche