Sei sulla pagina 1di 6

1. La documentacin omnipresente.

Seguramente, en ms de una ocasin se habr preguntado como es posible que los periodistas y los medios de comunicacin dispongan de informacin actualizada sobre cualquier cuestin candente, y sean capaces de rememorar, en un momento dado, una larga lista de milagros y pecados de algo y/o alguien. O cmo es posible que Hacienda (u otro ente pblico) recuerde, cuando menos le interesa a vd., aquellos datos que ahora le hacen dar mil vueltas para justificar. Fcilmente puede imaginar que esto es posible gracias a la disponibilidad, en el momento adecuado, de la informacin necesaria. Esta informacin existi, y fue til, en un momento dado, y cuando pareca olvidada, reaparece. Para que esto sea posible, no basta con la existencia de esa informacin. Tiene que haber sido tratada, procesada, mediante un conjunto de normas, que permitan su utilizacin posterior con una finalidad dada. Esta tarea, tan grata cuando se recuerdan los archivos de Ebla, y tan ingrata cuando se trata de algo ms escabroso, est encomendada a las Ciencias de la Documentacin. Normalmente se acepta que la Documentacin, en su formulacin cientfica, es fruto del trabajo del estudioso belga Paul Marie Ghislain Otlet, que a comienzos de este siglo traz, en su Trait de Documentation (1934) los principios bsicos de la moderna Documentacin. 2. La cadena documental. Como pequea introduccin, por supuesto, baste decir que toda informacin, para que sea susceptible de tratamiento, debe recogerse en un soporte documental. Actualmente, la Documentacin hace frente a documentos sonoros, grficos de diversos tipos, escritos, numricos, etc, etc. Sobre estos documentos se procede a aplicar una serie de operaciones, cuyo conjunto se denomina "cadena documental", y que consiste, en resumen, en describir el documento en sus aspectos formales y de contenido, estableciendo los mecanismos necesarios para poder acceder a la informacin recogida en el documento desde diversas vas. E.n la cadena documental se pueden establecer, a grandes rasgos, las siguientes fases: 1. Recopilacin, seleccin y adquisicin de documents: en la que se trata de establecer que documentos son, o pueden ser, de inters para los usuarios reales y potenciales, y disponer de ellos de algn modo. 2. Anlisis documental: puede dividirse en anlisis formal (encargado de establecer las caractersticas fsicas del documento y de su soporte), y en anlisis de contenido (que suele dividirse en clasificacin, indizacin y resumen). Se trata de una fase crucial, en la que el documento debe ser incluido en un marco intelectual previamente definido, y tiene que ser transformado en una nueva creacin, plasmada en lo que se llama documento secundario, precisamente a travs del cual se acceder, normalmente, a los documentos originales o primarios.

3. Bsqueda, recuperacin o investigacin documental: en el cual se ejecutan un conjunto de acciones encaminadas a recuperar los documentos pertinentes a una necesidad de informacin dada .En esta fase se utilizan los instrumentos establecidos en el anlisis documental, como el resumen y los lenguajes documentales. 4. Difusin: se trata de facilitar al usuario el producto documental, es decir, la informacin contenida en un conjunto de documentos que satisfacen las necesidades de aqul. Este es el proceso que, por supuesto mas perfeccionado y completo, se sigue en una biblioteca: se analizan las necesidades y peticiones de los usuarios y se adquieren los fondos pertinentes, o se provee de otros accesos a esos fondos. Una vez recibidos, se registran, catalogan y analizan, dando lugar a un conjunto de fichas y catlogos, a travs de los cuales los usuarios realizan bsquedas, y de acuerdo con el resultado de stas solicitan la bibliografa adecuada. Un factor decisivo en todo el proceso resulta la utilizacin de los llamados "lenguajes documentales". En resumen, un lenguaje documental es un conjunto de trminos, relaciones entre los trminos y reglas en la aplicacin de esos trminos, que permiten describir el contenido de un documento, de la forma ms breve y exhaustiva posible. Los especialistas utilizan diferentes lenguajes documentales, adecuados a los contenidos informativos de los documentos, tanto como mecanismo de control en la caracterizacin de los documentos, como mecanismo de recuperacin de los documentos que contengan determinada informacin. Un ejemplo, muy simple, de estos lenguajes documentales son los llamados descriptores o palabras clave, que cada vez se encuentran en mayor cantidad de recursos informativos, y cuya finalidad es facilitar el acceso al documento pertinente por parte del usuario. Cuanta mayor sea la calidad y precisin de un lenguaje documental, y por supuesto de su aplicacin, mayor ser el aprovechamiento y la satisfaccin del usuario. Como puede imaginarse, el aumento exponencial de la informacin en la sociedad actual implica la necesidad de lenguajes documentales avanzados, y para todo tipo de universos de discurso. La emergente disciplina llamada "Organizacin del Conocimiento" se encarga, entre otras cuestiones, de la investigacin en mecanismos de clasificacin y ordenacin que cubran cualquier campo de la actividad humana 3. Documentacin e informtica: la "informtica documental". Tras esta breve explicacin, es el momento de plantearse el objetivo y el contenido de lo que puede encontrarse definido como "documentacin automatizada" o "informtica documental". La informtica documental es el conjunto de normas, aplicaciones y recursos, basados en un soporte informtico, cuya finalidad es dar soporte a la cadena documental, as como a las actividades derivadas. Dentro de esta definicin, que por fuerza debe considerarse amplia, caben desde la informatizacin del proceso de catalogacin, hasta la recuperacin de informacin en un OPAC (Online Public Access Catalog, o Catlogo Pblico de Acceso en Lnea) de una biblioteca.

Normalmente, se suele diferenciar un poco ms, indicando que el objeto de la informtica documental no es un registro, en el sentido en que pueda entenderse en un modelo relacional, sino un documento, con todo lo que conlleva la raz latina del trmino. Sirva un ejemplo para aclarar lo anterior. Si un usuario desarrolla una base de datos sobre artculos de prensa, las caractersticas del objeto, aunque pueden ser perfectamente definidas en el modelado conceptual, lo hacen de difcil tratamiento en el momento de pasar a un modelo lgico, por ejemplo relacional. La primera dificultad es la gran cantidad de texto que debe tratar el SGBD, y la segunda la gran cantidad de entidades relacionadas existentes dentro del propio documento. Para hacer frente a estas limitaciones, principalmente tcnicas, se han desarrollado sistemas de gestin de bases de datos documentales, una especializacin de los SGBD tradicionales, que ofrecen todas las funcionalidades de stos, pero que orientan su objeto de trabajo a documentos con formato variable, con una estructura de campos o pargrafos flexible, y con mecanismos de control terminolgico, que aseguran la correcta utilizacin de lenguajes documentales, as como herramientas que permiten crear relaciones entre entidades, normalmente muy limitadas. Sin embargo, debe sealarse que esta especificidad desaparecer pronto, ya que la rpida evolucin de las tecnologas de bases de datos est haciendo aparecer en el mercado productos hbridos entre relacional y documental, incluyendo capacidades multimedia y de distribucin, lo que esta modificando el concepto y las tcnicas de modelado de las bases de datos documentales. 4. El fichero inverso y las ecuaciones de bsqueda. La orientacin al documento que demandan las bases de datos documentales hace necesario emplear una tcnica informtica particular, a la que se llama tecnologa del fichero inverso. Se trata de indizar, individualmente, cada una de las palabras significativas que se encuentran en un campo, creando un fichero nuevo, el fichero inverso, que contiene todas las entradas de cada una de las palabras, incorporando, y en ello reside su potencial, la posicin de los trminos. De esta forma, el fichero inverso contiene una entrada para cada una de las palabras que aparecen en la base de datos, y esa entrada incluye su posicin absoluta, indicando el campo, subcampo, prrafo, lnea, frase y posicin dentro de la frase. Como puede comprenderse, esto facilita enormemente la seguridad y velocidad de respuesta cuando se ejecuta una consulta, ya que, en realidad, no se consulta el fichero que contiene los documentos, lo que dara como resultado una bsqueda secuencial exasperantemente lenta, sino el fichero inverso, sobre el cual pueden aplicarse todo tipo de tcnicas mejoradas de indexacin y recuperacin. Una vez se obtiene la respuesta a la consulta, el propio sistema se encarga de acceder al fichero que contiene los documentos, y seleccionar y ofrecer al usuario los pertinentes. Esta organizacin del contenido de los documentos permite a los usuarios de una base de datos documental formular consultas, que en el mbito documental son llamadas ecuaciones, en las que se relacionan los trminos que describen las necesidades informativas. Segn esto, una ecuacin de bsqueda para consultar una base de datos documental estar formada por

trminos, o palabras significativas, y por elementos, a los que se llama operadores, encargados de definir cuales son las relaciones que mantienen los trminos entre s. De forma general, los trmino pueden mantener relaciones de presencia/ausencia y de posicin absoluta/relativa, dentro de los documentos. Por ejemplo, si quisiese recuperar documentos que versasen sobre "informtica documental", lo ms sencillo sera ejecutar una ecuacin de la forma "INFORMTICA AND DOCUMENTAL", utilizando uno de los operadores booleanos clsicos, que se encuentran presentes en todos los sistemas de recuperacin de informacin. No sera necesario indicar ningn campo, ya que el sistema buscara automticamente en todos los campos indizados existentes. Se puede avanzar un paso ms si el usuario utiliza la estructura de la base de datos, y sabe que existe un campo llamado "descriptores". Puede deducirse que en ese campo, cuyo contenido ser un lenguaje documental casi con toda seguridad, se encontrarn estos descriptores, por lo que se podra ejecutar una ecuacin en la que se utilizase un operador de posicin absoluta, de la forma "(INFORMTICA AND DOCUMENTAL).DESC.". En esta ecuacin, escrita para el sistema de gestin de bases documentales BRS/Search, le estaramos diciendo al sistema que recuperase todos aquellos documentos que contengan los trminos deseados, y luego seleccione aquellos en los cuales aparezcan en el campo o pargrafo DESC (descriptores). Como puede apreciarse, los operadores pueden combinarse con suma facilidad, siempre y cuando se respeten una reglas lgicas tomadas de la teora de conjuntos. De hecho, los sistemas ms avanzados permiten especificar incluso la posicin relativa, o distancia, de los trminos dentro de una frase, combinaciones con otras ecuaciones, diferentes niveles de anidamiento, y llegan a ofrecer trminos similares a los utilizados para ampliar o restringir las bsquedas. A pesar de lo simple que pueda parecer este tipo de recuperacin de informacin, nada ms lejano de la realidad, ya que en toda recuperacin de documentos aparecen distorsiones. Cuando se recuperan documentos que contienen los trminos y la relaciones indicadas en la ecuacin, pero que no son pertinentes para las necesidades del usuario, se dice que se trata de "ruido"; cuando el resultado es el contrario, y quedan sin recuperar documentos pertinentes, se habla de "silencio". Ambos requieren que las ecuaciones sean formuladas nuevamente, y se ajusten ms cuidadosamente los trminos y sus relaciones. La experiencia del documentalista suele ser el mejor mecanismo de ajuste en estos casos, no cual no es bice para que sta sea una de las ms importantes reas de investigacin en informtica documental. 5. Las aplicaciones especficas. La recuperacin de documentos a travs de ecuaciones de bsqueda es posible gracias a que existen unas aplicaciones que no slo las ejecutan, sino que son capaces de gestionar, en el sentido ms amplio, las bases de datos documentales. El proceso de especializacin que di lugar a la informtica documental ha producido, a su vez, aplicaciones especializadas en diferentes aspectos, que en muchas ocasiones entrecruzan sus caractersticas:

Sistemas de gestin de bases de datos documentales: son sistemas que incorporan todas las caractersticas de los SGBD tradicionales, incluyendo la creacin y mantenimiento de bases de datos documentales, usuarios, controles de seguridad, e incluso lenguajes propios de programacin. Debe citarse BRS/Search, de BRS Information Technologies, como uno de los ms completos. Sistemas de indexacin: son aquellos que crean ficheros de ndice, los cuales contienen los trminos existentes en diferentes tipos de ficheros, como por ejemplo ASCII o cualquier procesador de textos, y permiten una limitada recuperacin a travs de aqullos. Sistemas de gestin bibliogrficas: sistema especializado para la gestin y mantenimiento de bibliografas especializadas, es una aplicacin especfica de los sistemas de gestin de bases documentales, que permiten no slo el almacenamiento y la recuperacin de referencias bibliogrficas, sino tambin la exportacin de estas referencias en diferentes formatos de cita bibliogrfica a diferentes procesadores de textos. Sistemas de recuperacin de informacin: son aplicaciones que se encargan exclusivamente de recuperar informacin de bases de datos documentales no modificables. Ponen a disposicin del usuario potentes herramientas de bsqueda y de apoyo a la bsqueda, pero su funcionalidad queda reducida a la consulta y exportacin de documentos. Las bases de datos que vienen en soporte CD-ROM utilizan este tipo de sistemas, de los que debe citarse SPIRS (Silver Platter Information Retrieval System). Sistemas hipertextuales: en su origen, los hipertextos e hipermedias son una forma de organizar, acceder y navegar a documentos de diferentes tipos, que posteriormente se ha popularizado como motor y parte de tutoriales y juegos. Sistemas de informacin personal (Personal Information Systems): son aquellos que integran, en un nico entorno, todos los documentos, ficheros y relaciones entre ellos que son de inters para el trabajo de un usuario. Un desarrollo muy avanzado, ya que supera el entorno personal, es la aplicacin Lotus Notes. Sistemas compuestos: se denomina as a aquellos que dan soporte a todas las tareas que se realizan en una unidad informativa, sea sta un archivo, biblioteca o centro de documentacin. Esto significa que cubren tanto la cadena documental como la gestin administrativa. Sirvan como ejemplo las aplicaciones de automatizacin de bibliotecas, como Absys o Libertas, o las aplicaciones de automatizacin de archivos, como la desarrollada para el Archivo de Indias de Sevilla. Normalmente, integran un motor documental, encargado de gestionar las bases de datos documentales que cubren los catlogos, y un motor relacional, que cubre las tareas administrativas.

6. Cuando los documentos ahogan: la teledocumentacin. Resulta de gran utilidad disponer de una base de datos documental que cubran las posibles necesidades de informacin y documentacin, pero resulta evidente que, dependiendo de sus caractersticas, el mantenimiento de sta puede llegar a resultar irrealizable. Las bases de datos documentales crecen, como la informacin, de forma exponencial, y se necesita que esa informacin sea completa y est actualizada en muchos campos de actividad, como la economa. En un primer momento, se pens que la capacidad de almacenamiento del CD-ROM sera la respuesta a este crecimiento. Sin embargo, se ha demostrado que no ha sido as, y adems el CD- ROM debe luchar con el problema de la actualizacin de la informacin, ya que sta se realiza, como plazo breve en estos soportes, cada tres meses. En determinadas facetas de la investigacin cientfica y econmica, este perodo es un mundo, y puede llegar a resultar inaceptable. La teledocumentacin ha sido definida, en ocasiones, como la fusin de informtica, documentacin y redes de comunicaciones. Presente en el mercado de la informacin desde la dcada de 1960, en resumen puede decirse que los usuarios acceden, a travs de una terminal informtica conectada a una red de telecomunicaciones, a un servidor remoto, al que se suele llamar en este mbito "host", en el que puede encontrar numerosas bases de datos de todo tipo, permanentemente actualizadas, y consultables por el usuario mediante un lenguaje de recuperacin establecido. Eso s. previo y posterior pago de todo tipo de cuotas y cargos. Nombres famosos en el mundo documental resultan ser el gigante norteamericano Dialog, o el suizo Data-Star, o la agencia Reuters, especializada en informacin, actualizada en minutos, sobre economa y noticias. No debe dejar de percibirse que Internet, con todo el auge que est alcanzando, es heredera de la teledocumentacin en cierto modo, y que la mayor parte de los recursos que ofrece es informacin documental. De hecho, aplicaciones como WAIS, Veronica o Jughead, e incluso los Robots, Wanderers y Spiders de los servidores World Wide Web, son sistemas de recuperacin de informacin en su ms exacto sentido, basados en la teora de la bsqueda documental. Nos atreveramos incluso a ir ms all, y sealar la Internet como una gigantesca base de datos documental distribuida, en la cual los futuros, y ms necesarios, desarrollos de aplicaciones se centrarn en la localizacin y acceso a los documentos. La investigacin en el acceso a catlogos de bibliotecas y el auge del protocolo Z.39-50 son indicadores de este inters.

Potrebbero piacerti anche