en el desarrollo de nuevas tecnolo- gas para su procesamiento y ges- tin, ha llevado a la necesidad de crear procedimientos y/o tcnicas apoyados en hardware y software que permitan gestionar y procesar la informacin. La informacin se presenta como datos textuales o imgenes; la dife- rencia fundamental radica en su interpretacin, es decir, en el signi- ficado de la informacin que est representada visualmente. interpretacin o para extraer algn tipo de informacin til de ella. El formato digital es el obtenido por dispositivos electrnicos, compo- nentes hardware y software, que hacen posible la interpretacin de una imagen (la cual puede conte- ner texto) en formato entendible por stos, as como para su visuali- zacin, una vez codificada la ima- gen, se le da el atributo de digital. Las imgenes digitales son fotos electrnicas tomadas de una esce- na o escaneadas de documentos, fotografas, manuscritos, textos impresos e ilustraciones. Se realiza una muestra de la imagen digital y se confecciona un mapa de ella en forma de cuadrcula de puntos o elementos de la figura (pxeles). A cada pxel se le asigna un valor El procesamiento de la informacin considera que unas pocas operacio- nes simblicas, relativamente bsi- cas, tales como codificar, comparar, localizar, almacenar y gestionar, pue- den crear conocimiento a travs de la interpretacin de imgenes (las cuales pueden contener texto en si). El procesamiento de la informacin contempla que los datos pueden ser codificados interpretados en diferentes modos o formatos. Este procesamiento es el trmino usado para denominar las operaciones desarrolladas sobre un conjunto de datos de imagen para mejorarlas de alguna forma, para ayudar a su 144 Procesamiento y gestin digital de la informacin Marcos Ren lvarez Moreno* BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2, P. 144-151 Resumen Se describen los elementos bsicos de los formatos de imgenes digitales, as como sus procesos de captura, almacenamiento y gestin. (frre) Palabras clave: imgenes digitales, formatos digitales, procesamiento de imgenes, gestin de imgenes elec- trnicas, escneres, hardware, software. Abstract The basic elements of digital images formats, capture processes, storage and management are described along the document. (frre) Keywords: Digital Images, Digital Formats, Image Processing, Digital Images Management, Scanners, Hardware, Software. * Departamento de Produccin, Direccin General de Bibliotecas (DGB), Universidad Nacional Autnoma de Mxico (UNAM), Edificio de la Biblioteca Central, Circuito Interior, Ciudad Universitaria, 04510 Mxico, D. F. Mxico. Correo electrnico: marcos@dgb.unam.mx tonal (negro, blanco, matices de gris o color), el cual est represen- tado en un cdigo binario (ceros y unos), como se muestra en la figu- ra 1. Los dgitos binarios ("bits") para cada pxel son almacenados por una computadora en una secuencia, y con frecuencia se los reduce a una representacin mate- mtica (comprimida). Luego la com- putadora interpreta y lee los bits para producir una versin analgica para su visualizacin o impresin. Indudablemente el hecho de man- tener y gestionar los contenidos en formato digital es ventajoso para el mantenimiento, actualizacin, alma- cenamiento y acceso a los mismos, lo cual plantea aspectos de calidad y utilidad de quien lo requiera, esperando una recuperacin rpida, calidad aceptable, y visualizacin completa de las imgenes digitales. procesamiento apliquemos, no se podr obtener informacin. El equipo utilizado y su rendimiento afectarn la calidad de la imagen; diferentes sistemas con las mismas caractersticas declaradas (por ejem- plo: dpi, profundidad de bits y rango dinmico) pueden producir resulta- dos radicalmente diferentes. El rendi- miento del sistema se determina por medio de pruebas que verifican la resolucin, reproduccin de tonos, calidad de colores, ruido y artefactos. Los sistemas adquieren los datos pixel a pxel, la imagen es guardada como una gradilla de pixeles. La radiancia (sensores visibles) de cada uno de esos pixeles es regis- trada por el detector y entonces es digitalizada para permitir su mani- pulacin por parte del computador. Las radiancias podrn tomar cual- quier valor entre 0 y Rmax, que es el nmero de intervalos digitales que estn disponibles y dependen del nmero de bits del convertidor anlogo-digital Rmax=2n-1, donde n es el nmero de bits. Hasta aqu los datos han sido gra- bados, digitalizados y guardados en la forma de una gradilla de pixeles, si los datos fueron adquiridos por algn sensor capaz de producir imgenes, los datos pueden mos- trarse en un monitor como se Procesamiento de imgenes La captura de imgenes digitales debe tomar en cuenta los procesos tcnicos comprendidos al convertir una representacin analgica en digital, as como tambin los atribu- tos de los documentos fuente en s mismos: dimensiones fsicas y pre- sentacin, nivel de detalles, rango tonal, y presencia de color. El procesamiento digital tiene como objetivo mejorar el aspecto de las imgenes y hacer ms evidentes en ellas ciertos detalles que se desean hacer notar. La imagen puede haber sido generada de muchas maneras, por ejemplo, de forma manual, mecnica, fotogrficamente repre- sentada por una cuadrcula con un esquema de puntos o lneas de dife- rente tamao como por ejemplo microfilms, o electrnicamente, por medio de un escner* y/o una computadora. Las clases generales de procesamiento incluyen la edi- cin de la imagen (escalarla, compri- mirla, otorgarle nitidez, etc.). El procesamiento de imgenes no puede producir informacin a partir de nada; si en el conjunto de datos no existe informacin concerniente a una aplicacin o interpretacin en particular, entonces no importa qu cantidad de complicadas rutinas de 145 Marcos Ren lvarez Moreno BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Figura 1. Valores de pxel: 0 para el negro y 1 para el blanco * Se utiliza el trmino escner para referirse a todos los dispositivos de captura de imgenes, incluyendo las cmaras digitales. tible en todas las plataformas de hardware-software conocidas. A pesar de la existencia de otros formatos como PNG, SPIFF, GIF y JPEG, la mayora confiamos en el formato TIFF para guardar imgenes originales, ya que ste es compati- ble en cualquier plataforma de soft- ware para su visualizacin. Para acceder a los grficos se pueden crear imgenes derivadas en otros formatos. Los formatos ms comu- nes se muestran en la tabla 1. Las operaciones que se realizan en el procesamiento de imgenes pueden ser: Edicin, retoque, mejora; en algu- nos casos el software de escanea- do de las imgenes realiza estos pasos, en otros, se utilizan herra- mientas comerciales de edicin de imgenes separadas, por ejemplo: muestra en la figura 2. Para que los datos sean mostra- dos en pantalla, el compu- tador asigna a cada valor entero (o rango de ellos) un color en particular, de forma tal que pueda ser distinguido visualmente. El formato de archivo para las imgenes originales deber aceptar la resolu- cin, profundidad de bits, informacin de color que se requieran. Por ejemplo, tiene poco sentido crear una ima- gen a todo color slo para guardarla en un formato que no acepta ms de 8 bits (por ejemplo: GIF (Graphics Interchange Format)). El formato tambin deber ser abierto y bien documentado, ampliamente soportado y compa- 146 Procesamiento y gestin digital de la informacin BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Nombre y TIFF (Tagged GIF (Graphics JPEG (Joint Image Pac, PNG 1.2 PDF 1.3 versin actual Image File Interchange Photographic Expert Photo CD (Portable (Portable Format) Format) Group) /JFIF (JPEG Network Document File Interchange Graphics) Format) Format) Extensiones .tif, .tiff .gif .jpeg, jpg, .jif, .jfif .pcd .png .pdf Profundidad (es) Bitonal a 1 bit; Bitonal, escala Escala de grises a 8 Color a 24 bits 1-48 bits; color Escala de grises de bits escala de grises de grises o bits; color a 24 bits a 8 bits, escala a 4 bits; color a o color de paleta color entre de grises a 16 8 bits; soporta de 4 u 8 bits; 1 y 8 bits bits, color a 48 hasta 64 bits hasta color de para color 64 bits Figura 2. Imagen digital Tabla 1. Formatos comunes de archivo de imgenes Adobe Photoshop, Adobe Illus- trator, Corel Photo Paint, Corel- draw X3, Paint Shop PRO, Macromedia Fireworks y herra- mientas libres como XnView, NConvert, GFL SDK y GFLAx. Compresin, (en ocasiones las imgenes pueden ser muy gran- des lo que puede ocasionar pro- blemas en el procesamiento de las mismas) algunas veces lleva- da a cabo por firmware (hardwa- re-software) del escner o hard- ware de la computadora. La compresin tambin puede ser una operacin slo de software, a pesar de que el hardware dedica- do es ms rpido y se lo debera considerar cuando se crean archivos muy grandes o grandes cantidades de archivos. Conversin de formato de archivo, el escaneado original de la imagen puede no estar en un formato ade- cuado para todos los usos previs- tos, por lo que requiere conversin. Escala, es probable que los esca- neados capturados a alta resolu- cin no sean adecuados para la visualizacin en la pantalla. Con fre- cuencia se necesita aplicar escala (es decir, reduccin de resolucin a travs de eliminacin de bits) para poder crear imgenes y presentar- las en cualquier aplicacin como por ejemplo en la web a travs de un visualizador (Internet Explorer, Netscape, Mozilla, Opera, etc.). principalmente de hardware y soft- ware como ya se ha mencionado anteriormente. Una perspectiva integral de la infraestructura tcni- ca tambin incluye protocolos y normas, polticas y procedimientos. Las decisiones en lo que respecta a la infraestructura tcnica requieren una planificacin cuidadosa debido a que la tecnologa de la digitalizacin de imgenes cambia rpidamente. Si los equipos y materiales elegidos son los indicados para los usos previstos y los resultados esperados, el rendi- miento, presentacin y visualizacin de la informacin se maximizar en todos los aspectos. Gestin digital de la informacin Una vez digitalizadas las imgenes, viene la parte de la gestin; la ges- tin de archivos que contienen la informacin digitalizada consiste en una serie de pasos interrelaciona- dos, diseados para asegurar la fcil identificacin, organizacin, acceso y mantenimiento de los archivos dependiendo de los fines de la informacin. Comprende el proceso de hacer llegar las imge- nes al usuario y abarca redes, soft- ware, dispositivos de visualizacin, impresoras, escner, etc. La gestin digital de la informacin incluye: OCR (reconocimiento ptico de caracteres), conversin de texto escaneado a texto legible por medio de una mquina, que se puede buscar o indexar y ser interpretado como una imagen. La digitalizacin deja los datos con un formato adecuado para su manipula- cin por parte del computador. Cada sistema de procesamiento de imge- nes tiene su propio software asocia- do, cada uno para una tarea diferente. La utilidad de las imgenes digita- les queda garantizada cuando se definen claramente las necesida- des, se conocen los atributos de los documentos, la infraestructura tc- nica de apoyo del procesamiento y posterior gestin, y entrega del contenido sea la apropiada para las necesidades del proyecto. La infraestructura tcnica se refiere en forma general a los componen- tes que hacen posible la digitaliza- cin de imgenes. Con frecuencia, el proceso completo se lleva a cabo mediante tcnicas de digitalizacin, sugiriendo as una serie de pasos lgicamente ordenados. En la prc- tica real, estas tcnicas de digitali- zacin pueden ser simples o com- plejas dependiendo de las herramientas que se tengan para llevarlas a cabo. La tecnologa necesaria para nave- gar desde un extremo de las tcni- cas de digitalizacin al otro consta 147 BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Marcos Ren lvarez Moreno Soluciones de gestin de imgenes (software especial para organizar archivos de imgenes); como por ejemplo, a partir de impresin en papel de imgenes (que pueden tener texto) contenidos en materia- les plsticos llamados microfilms (ver figura 3) capaces de proyectar- se a travs de un lente y un haz de luz luminoso contenidos en un tipo escner, como por ejemplo en un PC printer (ver figura 4). Almacenamiento (dispositivos y medios); como por ejemplo, sopor- tes accesibles a una computadora Las formas bsicas son dos, aun- que ambas puedan subdividirse en algunas ms: 1. En lnea (online) o va telemtica, que a su vez puede adoptar las siguientes variaciones: a. En formato web o html, que es la forma mayoritaria. b. En formato ASCII puro. 2. Fuera de lnea o en soporte material a. CD-ROM (ver figura 5). (CD-ROM, ver figura 5) de modo que pueda ser de fcil edicin y acceso. La innovacin tecnolgica ha permi- tido crear dispositivos llamados escner de quinta generacin capa- ces de procesar imgenes (inclu- yendo texto) y almacenarlo en un formato definido por el usuario. Escner como el Canon DR5020 (ver figura 6), Fujitsu fi 5750C (ver figura 7) el ms reciente microfilm esc- ner 350 de Canon que permite a tra- vs de la visualizacin de un cuerpo opaco (microfilm) la digitalizacin directa en computadora en determi- nado formato (ver figura 8 y 9). Esta tecnologa permite la rpida recuperacin en formato electrni- co de imgenes; que son fuente de informacin digital (una base de datos, una publicacin electrnica, etc.), esta a su vez puede ser distri- buida de diversas formas sin nece- sidad de cambiar sus contenidos ni estructura internas. 148 BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Procesamiento y gestin digital de la informacin Figura 3. Microfilms Figura 4. PC Printer 80 Figura 5. Almacenamiento en CD-ROM de la informacin Figura 6. Scanner Canon DR5020 Figura 7. Scanner Fujitsu 5750C Como ejemplo de aplicacin de estas formas bsicas para la ges- tin digital de la informacin se tie- nen: interfaces grficas en web que apoyadas de un lenguaje de pro- gramacin permiten realizar la bs- queda y visualizacin de la informa- cin en diferentes formatos, como PDF (ver figura 10 y 11). Para la distribucin fuera de lnea, se manejan soportes en medios pticos (CD-ROM, ver figura 5) de la informa- En la figura 12 se puede apreciar de forma general como se da la digita- lizacin y de que forma se puede gestionar la informacin para que el usuario final pueda visualizarla. cin, que solo pueden ser de consul- ta y no distribuidas para su reproduc- cin, por los derechos de autor. 149 BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Figura 8. Scanner 350 de Canon Figura 9. Digitalizacin desde microfilm Figura 10. Bsqueda en lnea de la informacin Figura 11. Consulta electrnica de la informacin Marcos Ren lvarez Moreno Estos soportes informticos para el procesamiento de la informacin son mucho ms rpidos y eficientes para la organizacin y la creacin de mtodos de acceso a las imgenes cuya finalidad es apoyar en proyec- tos enfocados a la edicin electrni- ca as como a la gestin digital. El procesamiento de imgenes no pretende "copiar" la produccin impresa, sino que debe generar una nueva estructura de la informacin. El uso de documentos de hipertexto hacen que una imagen ya no sea lineal, como ocurre con la confeccin en papel, sino que la imagen ahora tambin posee "profundidad". El usuario tiene acceso a la informacin cas digitales, sitios de Internet que permitan consultar artculos, libros, etc., cuyos elementos base, son de carcter electrnico. Conclusiones En el procesamiento y gestin digi- tal de la informacin se debe llevar a cabo un anlisis funcional y de operacin que contemple los dife- rentes elementos lgicos y fsicos as como de su relacin entre estos; lenguajes de alto nivel, pro- gramas comerciales, software libre, y una arquitectura de cmputo que permita la accesibilidad de la infor- macin en medios electrnicos. de formas muy variadas, cuenta con la posibilidad de proveer vnculos a documentos de modo instantneo, lo cual permite explicar dichos conteni- dos de formas diversas. El procesamiento y gestin digital de la informacin cambia la forma tradi- cional de hacer las cosas, mediante el uso de equipo de cmputo, len- guajes de programacin, las teleco- municaciones y las bases de datos; se ha constituido el primer producto de informacin electrnica. Utilizando eficientemente el procesa- miento de la informacin as como su gestin, se pueden obtener ventajas como la implementacin de bibliote- 150 BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Procesamiento y gestin digital de la informacin Figura 12. Gestin y digitalizacin de la informacin 151 BIBL. UNIV., NUEVA POCA, JULIO-DICIEMBRE 2006, VOL. 9, No 2 Obras consultadas ABADAL FALGUERAS, Ernest. Sistemas y servicios de informacin digital. Gijn : Trea, 2001. 147 p. BOLOGNA, Jack, WALSH, Anthony M. The Accountants Handbook of Information Technology. New York : Wiley, c1997. 368 p. BORGMAN, Christine L. From Gutenberg to the Global Information Infrastructure : access to information in the networ- ked world. Cambridge, Massachusetts : MIT, 2003. 324 p. MORRIS, Tim. Computer Vision and Image Processing. Basingstoke, Hampshire : Palgrave Macmillan, 2004. 300 p. PADOVA, Ted. Adobe Acrobat 7 PDF Bible. Indianapolis, Indiana : Wiley, c2005. 896 p. PEA Rosala. Gestin digital de la informacin : de bits a bibliotecas digitales y la web. Mxico : Alfaomega, 2003. 440 p. RUSS, John C. The Image Processing Handbook. Boca Raton : CRC, 2004. 732p. WITTEN Ian H., BAINBRIDGE David. How to Build a Digital Library. Amsterdam : M. Kaufmann, c2003. 518 p. Marcos Ren lvarez Moreno