Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Índice
Objetivo
Evolución
Clases y tipos
Características técnicas
Imagen digital
Resolución digital
Profundidad de bits o resolución cromática
Tamaño del fichero
Compresión
Formatos de ficheros
Proceso
Fases del proceso
Reunir toda la información a procesar
Consideraciones de la descripción
Preparación de los orígenes
Condiciones de visualización y calibración del monitor
Obtención de las imágenes
Control de calidad de la imagen
Tratamiento de las imágenes
Creación de los ficheros de consulta y ficheros de divulgación
Marca de agua
Almacenamiento y soportes de conservación
Ventajas e inconvenientes
Ventajas
Inconvenientes
Véase también
Referencias
Objetivo
El objetivo básico de la digitalización de documentos es la transferencia de la información a otro soporte distinto del original. El
documento pasa de un estado analógico a uno digital o informático.1 Los documentos en formato informático, es aquella
digitalizada con almacenamiento en soporte magnético u óptico.2 La información queda registrada por señales binarias; la
calidad de las copias siempre es idéntica. La digitalización de documentos permite:
Preservar los documentos originales del deterioro por su uso y generar copias de seguridad.
Preservar sólo el contenido informativo.
La tecnología digital permite capturar los valores de cualquier imagen al margen de su soporte, polaridad, dimensiones, etc.
Cualquier imagen o conjunto de ellas puede ser estructurada en bases de datos y ser recuperada en nuevos formatos.
Evolución
El comienzo de la digitalización se dio debido a la necesidad del ser humano por almacenar y transmitir la información necesaria
en distintos soportes. Antes de realizarse la digitalización tal y como la conocemos hoy en día, se crearon una serie de
instrumentos modificados con el paso del tiempo explicados a continuación.
En 1895 el instrumento utilizado se denominaba Telediágrafo, permitía transmitir las imágenes al formato digital por medio de
métodos eléctricos. Su uso consistía en dibujar la imagen en una lámina de estaño empleando una tinta no conductora de goma-
laca con alcohol, para posteriormente ser fijada en un rodillo que trabajaba como transmisor. Entretanto el receptor utilizaba un
lápiz óptico sincronizado con el Telediágrafo, por lo que enviaba y recibía línea a línea la imagen que pretendía digitalizarse. Este
proceso de digitalización podía costar hasta media hora.3
Posteriormente, con la llegada del Belinógrafo en 1913 la técnica utilizada mejoró notablemente, ya que se utilizaba una
fotocelda para traspasar la imagen a través de la línea telefónico conocido como FAX. En los años 40 al construirse las primeras
computadoras, simplemente se agregaban números para realizar múltiples cálculos. Ya en la década de los 80 se realizaban los
primeros escáneres digitales, lo que en lugar de enviarse la imagen a fax se almacenaba en un PC.3
Estos primeros aparatos mencionados al capturar los documentos que pretendían digitalizarse contenían una deficiente resolución,
pero con el avance de la tecnología y el paso del tiempo han mejorado notablemente hasta la actualidad, utilizando para el
proceso de digitalización sistemas mucho más innovadores y eficaces.
Clases y tipos
Los diferentes tipos de documentos que podemos encontrar son materiales de soporte magnético y de soporte óptico de
caracteres.
Soporte óptico de caracteres (Optical Character Recognition) significa Reconocimiento Óptico de Caracteres (OCR). Es la
tecnología que permite convertir imágenes de caracteres en letra de máquina, en caracteres capaces de ser interpretados o
reconocidos por un ordenador.2 Obtiene como resultado final un archivo en un formato de texto editable, cuyos formatos de
salida en los que se presentan estos archivos pueden ser variados (pdf, txt, etc.).
Este procedimiento es utilizado en la informática como procedimiento para digitalizar un texto a través de un escáner.
Para poder realizar un reconocimiento de los caracteres, el software debe inspeccionar la imagen pixel a pixel buscando formas
que coincidan con los rasgos de los caracteres.4
El soporte óptico permite analizar elementos del documento como (imágenes, tablas, texto, etc.) para su posterior digitalización.
Este sistema revolucionó en su momento el mundo digital pudiendo evitar la introducción manual de los datos a un ordenador y
reconociéndolos automáticamente. Con el paso del tiempo la técnica se ha ido perfeccionando con la evolución y mejora de su
efectividad. En la actualidad el soporte óptico además de permitir mantener la estructura de los documentos originales en el
archivo de salida, reconoce caracteres contenidos en documentos manuscritos, diagramas, partituras, etc. A pesar de ello,
debemos destacar que dispone de una efectividad limitada, debido a que deben realizarse posteriores revisiones y correcciones
manualmente del texto escaneado.4
En la actualidad existe un sistema de reconocimiento óptico más avanzado denominado de ABBYY FineReader, basado en tres
principios fundamentales IPA (Integridad, Intencionalidad y Adaptabilidad). 5
Respecto a la utilización del OCR es aplicable en diversos ámbitos y sectores (Actividad Jurisdiccional, Centros de
Documentación, etc.) para la digitalización de formularios, informes, documentos administrativos, etc. En el sector cultural, en la
preservación del patrimonio el OCR digitaliza principalmente documentos históricos en soporte microfilm o papel.4
Soporte magnético. Esta categoría hace referencia los materiales audiovisuales, entre los materiales que pueden digitalizarse
encontramos (Cintas de vídeo VHS, Beta, Vinilos, Casetes, etc.). El proceso de digitalización consiste en la transcripción de
señales analógicas en señales digitales cuyo objetivo es facilitar su procesamiento (comprensión, codificación, etc.), haciendo la
señal derivada (digital) con menos ruidos e interferencias a las señales analógicas.6
Muestreo (sampling). Consiste en tomar muestras periódicas de la amplitud de la señal. La velocidad con que
se toma esta muestra (el número de muestras por segundo), conocido como frecuencia de muestreo. Cuanto
menor es el valor del periodo de muestreo mejor constituida queda la señal analógica. 6
Retención (hold). Las muestras tomadas han de ser retenidas (retención) por un circuito de retención (hold), el
tiempo suficiente para permitir evaluar su nivel (cuantificación). Desde el punto de vista matemático este proceso
no se contempla, ya que se trata de un recurso técnico debido a limitaciones prácticas, y carece, por tanto, de
modelo matemático. 6
Cuantificación. Mide el nivel de voltaje de cada una de las muestras. Consiste en asignar un margen de valor
de una señal analizada a un único nivel de salida. Incluso en su versión ideal, añade, como resultado, una señal
indeseada a la señal de entrada: el ruido de cuantificación. 6
Codificación.Consiste en traducir los valores obtenidos durante la cuantificación al código binario. Hay que
tener presente que el código binario es el más utilizado, pero también existen otros tipos de códigos que también
son utilizados. 6
Entre las ventajas que presenta el soporte magnético encontramos: 6
Al presentar la señal leves alteraciones puede ser reparada y amplificada a través de sistemas de regeneración
de señales.
Dispone de sistemas de detección y modificación de errores.
Facilidad para el procesamiento de la señal.
La señal digital permite la multigeneración infinita sin pérdidas de calidad.
Los inconvenientes que muestra son los siguientes: 6
Características técnicas
La digitalización de documentos es un proceso el cual está muy normalizado y el cual debe hacerse bajo unas condiciones
determinados y unos requerimientos básicos para una correcta digitalización, es por eso que necesita unas características técnicas
determinadas, las cuales pueden depender del formato de origen del documento y la finalidad que se le vaya a dar a la copia
digitalizada.7 8 Principalmente las características técnicas de los documentos digitalizados son:
Imagen digital
A diferencia de las fotografías ordinarias, las digitales están formadas por cadenas de bits, interpretadas por un ordenador, y que
presenta una reproducción de la imagen en pantalla.7
La imagen digital, es dividida en una matriz de puntos a modo de cuadrícula. Cada uno de estos puntos recibe el nombre de píxel,
que toma el valor binario 1 o 0 dependiendo de la luminosidad y el tono lumínico leído por el escáner. A cada píxel se le asigna
un valor tonal que está representado por un código binario.8
Resolución digital
La resolución de la imagen viene dada por el número de pixeles que tiene la imagen. Cuanto mayor sea este número mayor será la
resolución. La medida de la resolución se determina por el número de píxeles leídos en una distancia lineal de una pulgada (2,54
cm) en el documento digitalizado.8
Las resoluciones de escaneado más frecuentemente utilizadas en documentos blanco y negro son 200, 300 y 400 puntos por
pulgada. En la digitalización de imágenes color de alta calidad, son típicas resoluciones de 1200 a 2400 puntos por pulgada.
Las imágenes digitales se pueden digitalizar en blanco y negro, a escala de grises o a color.
Para la digitalización en blanco y negro, a cada pixel un bit, bien de valor 0 bien de valor 1, correspondiendo al
blanco y al negro.
Para una escala de grises se aplican 8 bits a cada píxel, de modo que la imagen digital resultante sea capaz de
representar 256 valores o tonos de grises.
En el caso de las imágenes en color, utilizando 24 bits se obtendrán 16,7 millones de colores.
Compresión
La compresión se utiliza para reducir el tamaño del fichero de imagen para su almacenamiento, su procesamiento y transmisión.
El tamaño del fichero para las imágenes digitales puede ser muy grande, lo que requiere mayores recursos informáticos para su
almacenamiento, procesamiento y transmisión.7
Existen dos sistemas de compresión: los sistemas de compresión sin pérdidas y los sistemas de compresión con pérdidas. Los
sistemas de compresión sin pérdidas, reducen el código binario pero sin desechar o suprimir ninguna información, los sistemas de
compresión con pérdidas sacrifican parte de la información original con el objetivo de conseguir una mayor compresión y, por
tanto, un archivo final de tamaño más reducido.8
Formatos de ficheros
Existen diferentes formatos de ficheros de imágenes en el mercado. Cada uno con sus características específicas, sus ventajas e
inconvenientes,8 algunos ejemplos son:
Proceso
La clave del proceso de digitalización es el compromiso entre el dispositivo de captura y el reproductor para que el resultado
represente la fuente original con la mayor fidelidad posible.
La digitalización suele ocurrir en dos partes: Discretización y Cuantificación, estos pueden ocurrir al mismo tiempo, aunque son
conceptualmente distintos.[cita requerida] Todo proyecto de digitalización, en general, debe contemplar tres aspectos
fundamentales:
En el proceso de digitalización de documentos se deben de tener en cuenta ciertas pautas para normalizar dicho proceso en los
archivos:
Consideraciones de la descripción
Seguidamente a la selección de los documentos y previamente a la digitalización, se deben comparar y actualizar las
descripciones archivísticas del material objeto de la digitalización. Para poder identificar la documentación digitalizada se deberá
registrar como mínimo la información de los elementos obligatorios de ISAD (G). Sin embargo, si se observa algún deterioro
físico en el documento original, se hará constar en el área, no obligatoria de “Condiciones de acceso y uso”. Igualmente se hará
constar las cuestiones relativas a las restricciones de acceso cuando sea preciso.8 A los elementos obligarios, se le suman, para su
inclusión como metadatos, los elementos:11
Una vez realizada la digitalización se revisará cada una de las imágenes de cada fichero, subsanando las deficiencias
detectadas.Una vez revisado se deberá conservar un “fichero maestro” o Copia de conservación (Son reproducciones digitales de
alta calidad realizadas con fines de preservación, en formatos RAW o TIFF sin compresión agresiva que afecte a la calidad de la
imagen) de todos los documentos digitales y una copia de consulta.8
Marca de agua
Las copias digitales obtenidas deberán ir convenientemente provistas de una marca de agua visible, que identifique el Archivo de
procedencia/la institución que custodia los documentos originales.11 Los ficheros maestros (TIFF/PDF) no llevarán inserta en
ningún caso marca de agua.
Se debe tener en cuenta que, la marca de agua es un elemento inserto en la imagen que puede ser fácilmente eliminado si se
dispone de los medios necesarios. Por tanto, más confiable resulta, la información registrada en el metadato “responsable de la
digitalización” ya que en dicho elemento se consignará la persona e institución responsables de dicha digitalización.8
Los responsables de la custodia de las copias comprobarán periódicamente la legibilidad de todos los soportes en los que se han
alojado las copias digitales.
Ventajas e inconvenientes
Ventajas
Rápido acceso a múltiples usuarios en todo el mundo
Las imágenes pueden rehacerse y mejorarse electrónicamente
Se pueden obtener copias de alta calidad
La recuperación automatizada facilita la búsqueda de la información
Las imágenes pueden reproducirse muchas veces sin pérdida de calidad
Las imágenes digitales no se deterioran con el uso.
Inconvenientes
Gran inversión para sustentar las tecnologías de conversión y recuperación de registros
Faltan estándares en muchas áreas
El almacenamiento digital no ofrece características de permanencia: necesita revisión continúa y una
transferencia periódica
Los sistemas de recuperación se vuelven obsoletos
Aunque en disminución progresiva, los costos de producción y almacenamiento son altos
El tiempo y los costos para capturar y almacenar imágenes de alta resolución aumentan a medida que aumenta
su calidad. Reproducir en color es más costoso.
Véase también
Digitalización
Preservación digital
Referencias
1. González Mesa, Elda (2006). «La digitalización de documentos, ¿amiga o enemiga?». La Habana, Cuba.
2. Sociedad informática del Gobierno Vaco (2008). «Metodología de Digitalización de Documentos» (http://www.zuz
enean.euskadi.eus/s68-contay/es/contenidos/informacion/modelo_gestion_documental/es_modgesdo/adjuntos/M
etodolog%C3%ADa%20de%20Digitalizaci%C3%B3n%20de%20Documentos.pdf). Vitoria-Gasteiz. Consultado el
14 de diciembre de 2017.
3. Imaging Center. «Origen y concepto de Digitalizacion» (http://www.imaging.mx/origen-y-concepto-de-digitalizacio
n/). Consultado el 16 de diciembre de 2017.
4. Observatorio Vasco de la Cultura (2011). OCR: tecnología para el reconocimiento óptico de caracteres en una
imagen (http://www.kultura.ejgv.euskadi.eus/contenidos/informacion/kultura2_0_prestakuntza/es_k20_form/adjunt
os/pildora-OCR-2.pdf). País Vasco. Consultado el 16 de diciembre de 2017.
5. ABBYY (2017). «Que es Reconocimiento óptico de caracteres (OCR)» (https://www.abbyy.com/es-la/finereader/w
hat-is-ocr/). Consultado el 16 de diciembre de 2017.
6. El rincón de Alex. «PROCESO DE DIGITALIZACIÓN DE LA SEÑAL ANALÓGICA.» (https://alexdl8.wordpress.co
m/2009/03/27/proceso-de-digitalizacion-de-la-senal-analogica/). Consultado el 16 de diciembre de 2017.
7. IFLA (2002). «Directrices para proyectos de Digitalización de colecciones y fondos de dominio público, en
particular para aquellos custodiados en bibliotecas y archivos» (https://www.ifla.org/files/assets/preservation-and-
conservation/publications/digitization-projects-guidelines-es.pdf). La Haya, Holanda. Consultado el 14 de
diciembre de 2017.
8. Junta de Castilla y León (2011). «Recomendaciones para la digitalizacion de documentos en Archivos» (http://w
ww.aefp.org.es/NS/Documentos/Guias-Manuales/JCYLRecomendaciones_Digitalizacion_Archivos2011.pdf).
Castilla y León. Consultado el 14 de diciembre de 2017.
9. Bermúdez Muñoz, María Teresa. «Guía para la digitalización de documentos» (http://www.informacionpublicapgr.
gob.sv/descargables/sia/academia-de-archivo/guia_digitalizar_documentos.pdf). Consultado el 10 de diciembre
de 1017.
10. «Que es digitalizar un documento. Proceso de digitalización de documentos.» (http://www.tbs-telecon.es/que-es-
digitalizar-un-documento-proceso-digitalizacion-documentos). 2015. Consultado el 10 de diciembre de 2017.
11. Archivos de Andalucía. Consejería de cultura. (2 de julio de 2010). «Recomendaciones técnicas digitalizacion» (h
ttp://www.ceice.gva.es/documents/161634402/163458806/ANDRecom.digit.pdf/ecf1e150-92af-4db1-be41-9b603
566cd0b). Consultado el 9 de diciembre de 2017.
12. [1] (https://glosarios.servidor-alicante.com/archivistica/unidad-documental-compuesta)
13. [2] (https://www.xatakafoto.com/tutoriales/que-es-la-calibracion-de-un-monitor-y-que-metodos-hay-disponibles-pa
ra-realizarla)
Obtenido de «https://es.wikipedia.org/w/index.php?title=Digitalización_de_documentos&oldid=115254153»
Esta página se editó por última vez el 14 abr 2019 a las 09:14.
El texto está disponible bajo la Licencia Creative Commons Atribución Compartir Igual 3.0; pueden aplicarse
cláusulas adicionales. Al usar este sitio, usted acepta nuestros términos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de la Fundación Wikimedia, Inc., una organización sin ánimo de lucro.