Sei sulla pagina 1di 6

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO

FACULTAD DE FILOSOFÍA Y LETRAS


CENTRO UNIVERSITARIO DE INVESTIGACIONES
BIBLIOTECOLÓGICAS

PROGRAMA DE POSGRADO EN BIBLIOTECOLOGÍA Y


ESTUDIOS DE LA INFORMACIÓN

ENSAYO

EL USO DE LENGUAJES LIBRES Y CONTROLADOS PARA LA


REPRESENTACIÓN DEL CONTENIDO DE DOCUMENTOS

Elaborado por:
Aarón Elías May Palma
María De Jesús Iracheta Carrasco
Perla Alejandra Orozco Rodríguez.
Olegario Márquez Bonilla

PROFESOR: MTRO. JORGE GÓMEZ BRISEÑO

Marzo de 2010
Análisis temático de los documentos
El tema de una obra se encuentra en todo el texto y su representación y uso con
fines de organización y recuperación documental implica la necesidad de sinterizarlo a
la brevedad de códigos de clasificación, o palabras que se emplearán como términos de
indización, o puntos de acceso en catálogos, bibliografías e índices.
La falta de objetividad que lleva a descripciones inexactas o incompletas en las
representaciones temáticas dificulta, si no es que impiden completamente, la re-
cuperación documental.
Lancaster (1996) afirma que la extensión del registro es el factor de mayor
importancia y no el tipo de vocabulario al momento de la recuperación de un ítem. Esto
es que en una búsqueda en un resumen expandido será probablemente más eficiente
en la recuperación del ítem que la indización exhaustiva, la cual será mejor que el
resumen breve. Esto no concierne la diferencia entre el uso de un tipo de vocabulario.
La especificidad con que se puede describir el contenido temático de un
documento también es un factor importante en el desempeño final de un sistema de
recuperación. A pesar de que Lancaster (1996) considera que el texto libre ofrece una
mayor especificidad por abarcar los conceptos propiamente vertidos en el documento,
esto puede ser objeto de debate, ya que una correcta aplicación del lenguaje controlado
ofrece un mejor nivel de precisión en los resultados.
Claro está que los puntos de acceso también juegan un papel importante en la
estrategia de recuperación. Cuanta mayor cantidad de ellos exista, habrá una mayor
probabilidad de recuperación, pero también aumenta la posibilidad de tener resultados
no relevantes al aumentar el horizonte de temas.
Las falsas asociaciones y las relaciones incorrectas entre términos también se
cuentan entre los posibles problemas de precisión que aparejan los sistemas de
recuperación mediante lenguaje libre, ya sea porque los términos que causan la
recuperación no guardan la relación esperada.
También hay que recordar que la indización realizada por los seres humanos
posee una cuota de subjetividad inherente al proceso intelectual de éstos, lo cual
también es un factor de distorsión al momento de representar el contenido de los
documentos.
Lancaster (1996) comenta que en el caso de los nuevos términos que aparecen
en títulos y resúmenes; el lenguaje natural es el preferido por el usuario especialista en
el tema o materia, en tanto que el lenguaje controlado lo será para el especialista en
información, pues domina las reglas que lo conforman. En medio de esta polémica,
intentaremos esquematizar las ventajas y desventajas de cada uno de los lenguajes a
fin de comprender mejor sus cualidades y limitantes.

Ventajas y desventajas del lenguaje controlado


El lenguaje controlado es técnicamente una lista de términos autorizados que
incluyen una estructura semántica destinada al control de sinónimos, con ella se logra
diferenciar homógrafos y reunir o vincular términos cuyo significado presenten una
relación más estrecha entre si y son utilizados por los profesionales de la información
para reunir bajo un mismo término paquetes de información con similitud de
información.
Taylor (2004) identifica tres tipos de lenguaje controlado:
 Esquemas de clasificación bibliográfica
 Listas de encabezamientos de materia
 Tesauros.

Algunas ventajas que presenta el lenguaje controlado.


Es un proceso intelectual subjetivo que permite representar un tema con el mejor
término posible, reduciendo la diversidad de terminología y ayudando al usuario a
identificar todos los términos necesarios para realizar una búsqueda con mayor
precisión, ya que impone consistencia en la representación del contenido temático por
medio de una estructura jerárquica y de referencias de los documentos con una
reducción de tiempo favorable al usuario en la identificación de términos de búsqueda
apropiados. Se emplea el lenguaje controlado en las bibliotecas con la intención de
proporcionar mayor precisión y ahorro de tiempo a los usuarios.
Para ejemplificar el tema: se buscó el término “Biblia” en la “base de datos” de
Google y se encontraron aproximadamente 16, 900,000 paquetes de información
relacionados al término, de los cuales un alto porcentaje simplemente se reduce a
hacer mención de la palabra “biblia” en alguna parte del cuerpo del documento arrojado
sin tener relación propiamente con el tema.
Por otra parte el catálogo de la Biblioteca del Congreso de los Estados Unidos a
través de su sistema de encabezamientos LCSH arrojó la siguiente información acerca
del mismo término:

[ 8 ] 1 Bible. Manuscripts, Latin. Velislai Biblia picta. [from old LC subject headings
catalog]
[ 9 ] 1 Bible. N.T. Spa -- -- LC subject headings
[ 10 ] 1 Bible. O.T. Hebrew. Biblia Hebraica quinta. LC subject headings
[ 11 ] 9 Bible. O.T. Hebrew--Versions--Biblia Hebraica Stuttgartensia. LC subject headings
Bible. O.T. Hebrew--Versions--Biblia Hebraica Stuttgartensia--
[ 12 ] 1 LC subject headings
Indexes.
[ 13 ] 1 P Pł ck --Illustrations. LC subject headings
[ 14 ] 1 Bible. Polish--Versions-- Pł ck LC subject headings
[ 15 ] 1 -- c c LC subject headings
Biblia de San Luis
LC subject headings
16
[ 17 ] 8 Biblia pauperum LC subject headings
[ 18 ] 5 Biblia pauperum. [from old catalog] LC subject headings
Biblia rica
LC subject headings
19
[ 20 ] 1 Biblia Sancti Petri Rodensis. [from old catalog] LC subject headings

Vemos como el porcentaje de información arrojada en ambas búsquedas es


impresionantemente diferente en relación a la cantidad de entradas que proporcionan y
el ahorro de tiempo que debería invertir el usuario en la valoración de los paquetes que
son los adecuados para su búsqueda específica.

Desventajas de lenguaje controlado.


La aparición de nuevos términos que aparecen en un vocabulario generalmente
tardan en adaptarse como lenguaje controlado; los costos por el procesamiento
intelectual utilizando términos controlados hecho por el profesional de la información
tiende a ser mas costoso; y, la preferencia de los usuarios a utilizar términos de
lenguaje no controlado debido a su falta de manejo de los términos controlados son
algunas desventajas que representa el uso de lenguaje controlado.

Ventajas y desventajas del uso de los lenguajes libres.


Cuando hablamos de procesamiento del lenguaje natural (NLP) nos referimos a
los vocablos extraídos del mismo documento que se está analizando, de ahí se toman
los términos para elaborar el registro del paquete de información que permitirá al
usuario su recuperación.
Estos lenguajes ayudan a interpretar la información de las necesidades de
información que los usuarios buscan, representan una gama completa de los
significados transmitidos en el documento y unifica todos los documentos según el
criterio de búsqueda del interesado. Utilizan palabras claves de los documentos que en
realidad ayudan a encontrar una cantidad considerable de referencias, muchas más que
si la búsqueda se realiza con vocabulario controlado.
La siguiente tabla nos muestra las ventajas y desventajas de este tipo de
lenguajes.
VENTAJAS DESVENTAJAS
Gran cantidad de palabras clave que permiten Con las palabras clave, no toda la información que
hacer búsquedas más extensas. se recupera es de importancia.
Resúmenes expandidos que proporcionan mayor Dificultad de elegir las palabras clave debido a la
número de puntos de acceso. utilización de términos que significan lo mismo.
En la medida que se agrega más texto, el ítem se Menor precisión en la recuperación.
vuelve más recuperable.
Proporciona mayor especificidad al posibilitar la El tiempo empleado para seleccionar lo que
recuperación a partir de nombres. realmente es importante para los usuarios es
mayor.
Los nuevos términos aparecen antes que en los Falsas asociaciones, relaciones incorrectas entre
vocabularios controlados, por lo cual puede ser de términos.
mayor actualidad.
El usuario no tiene que "adivinar" qué términos se Tiende a ser más redundante.
emplearon para llegar a la información.
Cuenta con la preferencia del usuario especialista Las búsquedas producen malos resultados en las
en la materia. búsquedas de conceptos genéricos.
Las búsquedas producen buenos resultados en el
caso de conceptos particulares.
Es más barato que los lenguajes controlados.

Definitivamente, optar por este tipo de lenguaje dependerá de la decisión de las


unidades de información para ayudar a los usuarios a localizar los materiales que
necesitan ser recuperados por ellos.

Conclusiones.
El Usuario resulta ser el elemento fundamental para las bibliotecas, centros de
información, y por ende, de los profesionales en el campo de la bibliotecología y de la
información; porque alrededor de él han girado las polémicas en cuanto al uso de los
términos adecuados, (uso del lenguaje natural o controlado) para la indización o el
análisis temático que se debe realizar para la elaboración de una base de datos o el
catálogo que permita recuperar los diferentes paquetes de información que existen, los
cuales son demandados por los usuarios como necesarios.
Para ello se deben considerar los cuatro propósitos esenciales que nos plantea
Taylor (2004). Uno de esos propósitos es ahorrarle tiempo al usuario. Para lograrlo se
debe proporcionar una localización lógica de los paquetes de información; los cuales
deben estar colocados de acuerdo a la naturaleza similar; lo que finalmente
proporcionará el acceso a temas significativos de los paquetes de información.
La finalidad del uso de los lenguajes naturales, lenguajes controlados, o un
sistema híbrido, (en el que se consideren ambos como complementarios), es que el
usuario pueda encontrar todas las obras que la biblioteca puede ofrecer y recuperar la
información de un tema en particular que necesite o le interese. Por eso cobra
relevancia el estudio de estos temas.

Bibliografía:

Taylor, Arlene G. (2004),The Organization of Information / Arlene G. Taylor. Englewood,


Colorado : Libraries Unlimited, 2nd, 2004, 417 p. (Library and Information Science Text
Series). Capítulos 9 y 10.

Lancaster, Frederick Wilfrid. (1996), Indización y resúmenes : teoría y práctica / F. W.


Lancaster ; traducción de Elsa E. Barber. Buenos Aires : EB Publicaciones, 1996. xii,
337 p. Capítulos: 1-4; 10 y 13.

Soto, Susana. Los conflictos de la Clasificación. (En: Boletín Bibliotecológico de La


Plata, 1981/82, (2) pp. 7-9)

Potrebbero piacerti anche