Sei sulla pagina 1di 8

Niveles de anlisis documental de contenido

Blanca GIL URDRiAiN


Profesora de la EU BD Complutense

RESUN

Anlisis de las caractersticas y funciones que desempean las operaciones de Anlisis documental de contenido en el proceso de normalizacin y tratamiento de la informacin. En relacin con la indizacin, se tienen en cuenta los sistemas tradicionales: en cuanto al segundo nivel de analsis, el resumen, se apunta la imprecisin terminologica existente en lo que a su categorizacin se refiere. Palabras clave: Anlisis documental 1 Indizacin 1 Resumen.

INTRODt.JCCION
El anlisis constituye una fase fundamental del proceso documental. Se trata de una operacin o conjunto de operaciones destinadas a presentar el contenido de un documento de una forma distinta de la original, a fin de facilitar su consulta o su referencia en fase posterior. Las operaciones de entrada y salida de informacin en un sistema documental. estrechamente relacionadas, se articulan en base al Anlisis de contenido de la documentacin, que constituye una de las etapas claves de su proceso de normalizacin y tratamiento. Como medio de evitar solapamentos con otras disciplinas, me parece conveniente adoptar la denominacin de Anlisis [)ocumental de Contenido (ADC) para describir las operaciones mediante las que, tras la lectura del documento o tras la inspeccin
CHALMIER. 1. Les leeniques documentaires. Pars: PUF. 1979, p. 13.

Ih,eo,t,ci,in te feo C.ench,s eh ie Jn/Ar,,,cir$h. ir [7ECli ce-ial coi,ipi,iicnsc. Xledrd 1994

78

Bcu ecl Gil Iirelic icc>

de su titulo, indice, introduccin, conclusiones y otras partes fundamentales, se determina el significado general del texto y se identifican y aislan los conceptos representativos del contenido. Hablar de anlisis de contenido puede generar falsas interpretaciones por su posible acepcin a otros anlisis de este tipo, tales como el anlisis semitico o el anlisis de conten ido entendido como tcnica de i nvest iga cin. El anlisis al que aqu nos referimos, se limita al mbito documental. con las caractersticas que le son propias. El ADC tropieza con una dificultad debido a que cada analista se vale de sus propios medios intelectuales para desarrollar la tarea, y dentro del mareo de referencia constituido por su cultura, experiencias e intereses,
factores que impiden la concordancia total entre los analistas. Acerca de este problema de la uniformidad escribe Courrier dos indizadores elegi-

rn para el mismo documento muy pocos descriptores idnticos, a veces menos del cincuenta por ciento. Eso ocurrir tambin en el mismo indizador al operar en dos perodos diferentes 2.

1-II lenguaje documental desempea un rol mediador y normalizador que evita, en muchos casos, la arbitrariedad del indizador y, como consecuencia, facilita la tarea de recuperacin, ya que proporciona puntos de acceso a la informacin de inters para el usuario. Me parece oportuno apuntar la imprecisin terminolgica que afecta al ADC, ya que bajo esta denominacin se incluyen tanto tareas de anliss nroniam ente dicho, como de sin I.esi s. F.l A_DC compren eIe en efecto u no primera fase analtica, que corresponde a la captacin dc informacin, y una segunda, en la que se sintetizan los datos analizados. 1a terminologa utilizada por la escuela sovitica para clescri bi r el proceso: an I isi s-snte ss refleja sin ambigledades los dos estadios que lo componen. Izquierdo Arroyo3 propone la denominacin Tratamiento documental dc Contenido (TDC) para evitar centrar todo el proceso ce tratamiento en la Ofld= racin de anlisis. LII ADC puede llevarse a cabo en niveles de menor o mayor profundidad, en respuesta a las necesidades informativas del usuario. El primer nivel, la indizacin, atiende a la necesidad de identificar y localizar el documento, el segundo, el resumen, cumple con los anteriores objetivos y representa adems, deforma abreviada, al documento original. Para real izar las tareas de indizacin y resumen con xito es necesario examinar el conten ido e ide nt i ficar las estructuras del texto origin al; cescribir esas estructuras en mayor o menor profundidad dependiendo del niCO L~R Rl EH. Y. A n aiyse et la ogage documeni aires. Doe>iceuiteilts-/e, y. 13. n. 5-6 ti 976), p. 182. /0 Lii ERIJO ARROYO. J .M. De la semitica del texto a la semilica docuniental. tEn More iro ([Ciii-, u le,, J .A - Ap/fr-a e.-jcie> ele 1cm cien (jets e/el eexec> cd renl iii en e/c>ci ciii cii icl. Madrid: Universidad Carlos II i/B.O.E.. 1993. p~v 199-216.

.Viveles ce anlisis ciocimn en tal de een/enielo

79

vel de anlisis a que sometamos al texto (descripcin caracterstica y descrpcin sustancial) y, por fin, representarias mediante un lenguaje documental en el caso de llevar a cabo una descripcin caracterstica del texto, o, en el segundo caso, mediante la redaccin de un nuevo texto condensando al original. La importancia de la lectura en ambos casos, es indiscutible ya que proporciona la nica va de acceso a la informacin contenida en el documento. La anticipacin o conocimientos previos sobre la materia, el dominio de las formas bsicas de expresin del pensamiento, la capacidad de reconocer el significado de determinadas palabras seales del texto y el control de posibles defectos en la percepcin debidos a hbitos, tales como las regresiones o la subvocalizacin, son, entre muchos otros, factores que benefician el eficaz dilogo autor-lector, necesario para la captacin de las estructuras u organizacin interna del texto.

LA INDIZACION La indizacin hace posible la entrada de documentos en el sistema documental. desempea una funcin determinante en el momento de la recuperacin, y uno de sus productos resultantes, el indizado, constituye la base para la creacin de los lenguajes documentales. Se trata de la fase de identificacin de los conceptos que de forma explcita o implcita estn presentes en el contenido del documento. Es una operacin compleja, comprendida por varias fases:la norma 150.5963-1985> prescribe las siguientes: examen del documento y determinacin de su contenido identificacin y seleccin de los conceptos principales del contenido. seleccin de los trminos de indizacin Rowle< cree necesario seguir los siguientes pasos para determinar el perfil del texto familiarzacion con el contenido del documento. anlisis y seleccin de las materias representativas del tema principal. eleccin de trminos representativos del documento que expresen sin ambigedad su contenido. Chaumier< por su parte identifica las fases de reconocimiento y extraccin de los conceptos informativos y traduccin de estos conceptos al lenguaje documental.

150 5963 1 985. 1) o e:cnhen teitio rl. Al eeh e) cies p omm r le ncm lvve eles e/oc u ~ en es, la d>c<rm in a ejem ele Icor ce>ntenu et la slectie>n eles termes cl jnc/exe>tjc>n. Genve: 150, 1985. ROWLEY, J. Abs/ra cting unc inelexng. London: Ctive Bingey, [988, p. St). (Si-JA U MIR, J. Anlisis ji le>gucjes ele,eumenta/es: El tra/uenieeite> lingtis/ice> ele la in.fornc>cjn cle)eumentc>l. Barcelona: Mitre, 1986. p. 28.

80

Blan ce> Gil Ureliciaie,

La seleccin de trminos de indizacin se hace en funcin dedos parmetros: exhaustividad y especificidad, tambin denominados profundidad y precisin, respectivamente. La exhaustividad est relacionada con el nmero de conceptos que se tienen en cuenta y que caracterizan el contenido de un documento. La especificidad est relacionada con la exactitud con que un concepto particular que aparece en un documento est representado por un trmino de indizacin.. es decir, mide la proporcin de trminos extrados de un documento que son realmente relevantes. Los dos parmetros estn inversamente relacionados, de modo que el indizador habr de establecer el equilibrio entre ambos; la balanza se inclinar en favor de uno u otro en funcin de las necesidades de profundidad o precisin determinadas por el usuario. Se pueden hallar los indices de exhaustividad y especificidad de la siguiente forma: Exhaustividad de documentos recuperados y relevantes N0 de N documentos relevantes de la coleccin

Especificidad

N de documentos recuperados y relevantes Nc de documentos recuperados

La mayora de los especialistas dan por supuesta la necesidad de utilizar en todo sistema un lenguaje documental que garantice la extraccin de los conceptos contenidos en el documento, ya sea de forma explcita o implcita. Una pgina ms arriba mencionamos la referencia de Chaumier a este respecto. Van Slype& por su parte, define la indizacin humana como la operacin que consiste en enumerar los conceptos sobre los que trata un documento y representarlos por medio de un lenguaje combinato rio. Incluso Salton5, defensor del tratamiento de la informacin en lenguaje libre, escribe sobre la utilidad del lenguaje documental en el proceso de indizacin Para obtener un alto nivel de exhaustividad en la indizacin, es probada la utilidad del lenguaje de indizacin. que provee una variedad de enfoques para cubrir un rea temtica dada. Para asegurar la precisin. debe utilizarse un sumamente especfico lengtaje de indizacin y los trminos deben llevar indicaciones adicionales de contenido, tales como ponderaciones del trmino e indicadores de relacin con otros trminos.
5LY PE. G. van. Leis lenguajes ele jnclzce.ic5: Ccnccspc:in. (2OnStruCcie,li ji utiliac<joii en
bis .s,seenus .ioeocencole.s. Madrid: Fundacin Germn Snchez Ruiprez, t99i , ji. 1 tS. SALiON, (1. Introcice.eic,n le> noclern infornction. retrietal. New York. etc.: Mc(i rawHill Pubisbing Conipaoy. 1983. p. 160.

Niveles ce cncilisis ele>cunen eal ele can tejuelo

81

SISTEMAS DE INDIZACION Existen tres mtodos tradicionales de indizacin: por unitrminos, por descriptores y por materias, que se basan en la lectura lineal del texto y en la representacin formal del contenido. Estos tres sistemas responden al anlisis del texto a nivel de palabras, conceptos o temas, respectivamente. La indizacin por temas fue la primera en utilizarse; realiza la normalizacin de los documentos en base a listas de encabezamientos de materas que permiten la caracterizacin a un nivel muy general. La recuperacin por medio de este sistema se hace particularmente compleja cuando la informacin se presenta en soportes no tradicionales. El procedimiento de unitrminos consiste en la consideracin de las palabras, no de las materias componentes del texto. Este mtodo, ideado por Taube, ofrece la posibilidad de profundizar en el anlisis del texto, aunque al excluir del mismo tan slo los trminos vacos. genera un alto nivel de exhaustividad que provoca distorsiones en la comunicacin. El sistema de unitrminos presenta otro inconveniente de carcter sintctico en el momento de la recuperacin, ya que al utilizar trminos simples. pueden producirse falsas combinaciones entre ellos, provocando la recuperacin de innumerables documentos no pertinentes. A este tipo de indizacin sigui el procedimiento de caracterizacin por medio de descriptores, que la norma ISO define como trmino usado para representar un concepto dado, conocido tambin como trmino preferente><. Mooers fue el primero en referirse al descriptor en relacin con la indizacin de documentos, abandonando la descomposicin morfolgica estricta y la indizacin a nivel de palabra. Este sistema, al posibilitar la utilizacin de ms de un trmino en la descripcin, elimina la ambiguedad y alteraciones de sentido. Se basa en los conceptos, lo que dota de mayor flexibilidad a la tarea de indizar y permite hacer frente a cuestiones especificas formuladas por el usuario. Con estos mtodos tradicionales, tanto si se trata de indizacin manual como automtica, el procedimiento se realiza mediante la segmentacin del texto en trminos significativos del contenido. Ni semntica ni sintaxis son suficientes para llevar a cabo el anlisis del texto con exactitud, lo hacen por aproximacin; bien es cierto que eliminan ambiguedad, pero para profundizar en el contenido del documento se precisa trabajar a nivel de contexto. Algunas lneas de investigacin, representadas en Espaa por Garca Gutirrez, proponen mtodos de anlisis basados en la significacin, en
ORGANIZACION INTERNACIONAL DE NORMALIZACION: 150 5963-1985:
Dc>e:,enceutatje>n. M/hoelen pour 1 analyse e1e~ ele>cunene,s, la eieeern.,cten ce leur e:e>ntenu ce le nlee:tjon ele cerches el unelexatie>n. Cii enve: 150. 1985 p. 3. GARCA GUTIERREZ. A. Anlisis documental del djscurso periodi?stieo. Madrid: 136-154. CTD. 1992. pp

82

Blanca Gil Ureliccun

los que el significante es considerado como simple medio de acceso al significado. Se trata de mtodos experimentales que subrayan la importancia del contexto en el anlisis y que, aunque son tiles para la interrogacin del texto, an no han demostrado su validez para la representacin formal de los resultados del anlisis. LA OPERACION DE RESUMIR Esta tarea, que tiene analogas con la indizacin, constituye el segundo nivel del anlisis documental de contenido. En nuestro idioma se utiliza el trmino resumen tanto para denominar a la operacin como al producto resultante, lo que puede generar falsas interpretaciones. Otros idiomas, como el ingls, tienen recursos gramaticales que obvian esta dificultad. En Espaa, algunos tericos recurren al uso del verbo para referirse a la operacin y al sustantivo cuando hacen alusin al producto de la misma. Tambin se habla de condensacin y de descripcin sustancial para hacer mencin a la operacin de resumir. Por resumen se entiende la representacin condensada del contenido dc un documento, presentado preferentemente en un nico prrafo de longitud determinada, y no incluyendo elementos crticos personales de quien lo redacta. -Entre-los -fines-que-st- persiguen-con-la-ope-ra-cin-dc csumi-sun-des~ tacables los siguientes: Su objetivo primordial es el de permitir la rpida y precisa identificacin de los puntos esenciales del texto original, de manera que el usuario pueda decidir, sin prdida de tiempo, si le interesa o no su lectura comple[a. Sirve adems el resumen para superar barreras lingisticas, ya que. cono recomienda Unesco. se redacta en la lengua utilizada en el servicio o centro de documentacin donde es elaborado y se traduce a uno de los idiomas de ms generalizada difusin, Gran cantidad de resmenes ofrecen de este modo la oportunidad de conocer al menos la informacin esencial presente en los documentos primarios. Destacaremos tambin aqu el papel que desempea este producto documental como auxiliar de indizacin. tanto manual como automtica. Dado que en su seno figuran los temas esenciales descritos en el texto original, indizar en base al resumen supone la garanta de dar con los trminos pertinentes bien sea extrados de forma manual, como por los mtodos linguistcos de los qu se ~irV&la indi~acin autointica. Ahora bien, el resumen slo cumplir con los fines sealados anteriormente si en el momento de su redaccin se tienen presentes principios como la entropa, pertinencia y relevancia, es decir, si transmitimos la mayor informacin posible utilizando el menor nmero posible de signos, si trasladamos convenientemente la informacin que contiene el documen-

Nivelen de anlisis clocumenteil ele ce> ttenjel e>

83

to original y si expresamos sin ambigiledades el mensaje del documento primario.

CATEGORIZACION DEL RESUMEN El resumen puede ser llevado a cabo por un documentalista o analista o por el propio autor del documento original. Uno y otro tipo de resumen tienen ventajas e inconvenientes. La ventaja del resumen escrito por el autor reside en su perfecto conocimiento de los temas abordados. Como inconveniente, se le puede achacar el exceso de subjetividad al caracterizar su propia obra. La ventaja de los resmenes escritos por documentalistas reside en su experiencia prctica y su conocimiento de las necesidades del usuario. Presenta como inconveniente su desconocimiento o conocimiento parcial de materias especializadas. Aparte de esta tipificacin en funcin del sujeto ejecutor del resumen, existe otra en base a la carga informativa. La escuela de pensamiento ms generalizada distingue, segn este criterio, dos tipos de resmenes: informativo e indicativo. Rowley y Pinto), entre otros, identifican adems el indicativo-informativo, que seria aquel que se redacta en parte en un estilo informativo. tratando en estilo indicativo los aspectos menos relevantes del texto. El resumen informativo presenta la mayor cantidad posible de informacin cuantitativa o cualitativa aportada por el autor del documento. Est indicado especialmente para la condensacin del contenido de doenmentos cientficos y tcnicos. El resumen informativo debe indicar la estructura del contenido significativo del documento y presentar informacin relativa a los objetivos, la metodologa experimental propuesta, los resultados obtenidos y las conclusiones del autor. El resumen indicativo se imita a sealar el tema de estudio. Puede ser de gran utilidad en el tratamiento de material audiovisual y de documentacin presentada en soportes informticos, o en microformas, ya que permite la descripcin de esos documentos, cuyo tratamiento no puede limitarse a la cumplimentacin del tradicional asiento bibliogrfico. En cuanto a la extensin del resumen, considero que su longitud no depende ni de las dimensiones del documento a analizar ni del carcter mdicativo o informativo dcl resumen, sino que responder a la exhaustividad del anlisis.
ROWI.EY. J. iypes ol abstracis. Epigr. 2.3. de A bstraeting cnel unclexing. London: Clive Bingey. 1988. Pp. 14-15. 2 Pi NTO MOLINA. M. El resmenec cle>ccenental. Pr~ncipon y mte>eion. Madrid: Fundacin Germn Snchez Ruiprez. 1992. pp. 249-251,

84

Blan ea Gil Urelicaun

No voy a tratar aqu del estilo, metodologa, normalizacin y otros aspectos relativos a la descripcin sustancial de documentos. dada la extensin que ello conllevara; solamente sealar, para terminar, la gran importancia que tiene el cuidado del estilo y contenido de los resumenes especialmente cuando se incluyen en una base de datos, en donde, en muchos casos, las palabras que lo componen son utilizadas para realizar bsquedas en texto libre, pasando a convertirse en una importante herramienta de recuperacin. Apuntar, por ltimo, un hecho que se da demasiado a menudo en las pruebas selectivas para el ingreso en la Escala de Ayudantes de Archivos y Bibliotecas. La imprecisin en cuanto a la categorizacin del resumen documental genera conflictos a las personas que pretenden pasar determinadas pruebas de oposicin, ya que en las bases de las convocatorias se pide la redaccin de un resumen analtico, adems de uno informativo y otro indicativo. Consultadas las fuentes queme ha sido posible. todas coinciden en identificar el resumen analtico con aquel, de carcter informativo, redactado por el propio autor del texto original. Dado que son muchos los CtflO5 en que se vienen convocando plazas para el mencionado cuerpo para las que se exigen este tipo de pruebas, me gustara desde aqu urgir la necesidad de normalizacin en la denominacin de los resmenes documentales para evitar tanto la falta de rigor cientfico, como los malos ratos de los opositores que no saben qu hacer cuando se les pide llevar a cabo un resumen que, por principio, no pueden redactar. BIBLIOGRAFA CLEVELAND. D.B. & CLEVELAN[). AD. lctraduction fo indexing and abslraeting. 2th cd. Engiewood. Col.: Libraries Unlimited. 1990. pp. 163-167. NlO RE 1RO. J . A. Aplcc>c de leis ciencias del teste> al resumen doc>> titen/cH. Nla drid: Universidad Carlo lli/B.O.E.. 1993, pp. 162-167.

N E ET. HE. A la reclerche clii mot cI: Anaijise docum entcire et inclexation alphal)/iqlle. Genve: Les Editions lES. 1989. p. 95. PINTO MOLINA. Nl. El resemnen elocuine,iel. prin cipie)s y nte>dos. Madrid: Fun dacin Germn Snchez Ruiprez, 1992. p. 253.

ROWLEY, J. Abstruceing and iudexung. 2th ed. London: Clive Bingley. 1990. pp. 14-18. UN ESCO Oit/a /)e>rel le rede,ce:ein ele ur/culas cien tficos eestie>acle>s u la pu blie:e cin. Paris: Unesco-Programa General de Informacin y UNISIST, 1983.

recc>ni tite>n e/a>je)i>2< cm ccx ame i rers- cen nm cn: NI Z 44-004, Paris: 1984.

AFNOR (ASSOCiAFiON FRANQAi5E DE NORMALISATION). Dc>e,c,ientaeion: er/ieles se-jenuf >e/icen ci tee-lin d lles pe> u r le it ele>eje)n ele<s r

Potrebbero piacerti anche