Sei sulla pagina 1di 48

Baeza-Yates, R.-Ribeiro-Neto, B. Modern information retrieval. Addison Press: New York, 1999.

Captulo 10:
Interfaces de usuario y visualizacin
Trad. de Ana Sanllorenti
10.1

Introduccin

Este captulo discute las interfaces de usuario para la comunicacin entre usuarios humanos que
buscan informacin y los SRI. La bsqueda de informacin es un proceso impreciso. Cuando los
usuarios se acercan a un sistema de acceso a informacin, tienen a menudo slo una comprensin
difusa acerca de cmo pueden lograr su propsito. Por lo tanto, la interfaz de usuario debera
ayudarlo a comprender y expresar su necesidad de informacin. Tambin debera ayudarlo a
formular sus consultas, seleccionar entre las distintas fuentes de informacin disponible,
comprender los resultados de la bsqueda, y seguir el progreso de su bsqueda.
La interfaz hombre-computadora es menos comprendida que otros aspectos del la RI, en parte
porque los seres humanos son ms complejos que las computadoras, y sus motivaciones y
conductas son ms difciles de medir y caracterizar. Como el rea est cambiando rpidamente, la
discusin en este captulo enfatizar desarrollos recientes ms que conocimientos ya establecidos.
Primero se delinear el lado humano del proceso de bsqueda de informacin y luego se focalizarn
los aspectos de este proceso que puede ser mejor soportados por la interfaz de usuario. La discusin
se encaminar hacia la prctica y tecnologa actuales, las propuestas recientes de ideas innovadoras
y las sugerencias para futuras reas de desarrollo.
La seccin 10.2 presenta los principios del diseo para la interaccin hombre-computadora e
introduce nociones relacionadas con la visualizacin de informacin. La seccin 10.3 describe los
modelos de bsqueda de informacin pasados y presente. Las siguientes cuatro secciones describen
el soporte de la interfaz de usuario para comenzar el proceso de bsqueda, para la especificacin de
la consulta, para ver los resultados recuperados en contexto y para la retroalimentacin interactivo
por relevancia. La seccin 10.8 describe las tcnicas de interfaz de usuario que apoyan el proceso de
acceso a la informacin como un todo. La seccin 10.9 especula sobre futuros desarrollo y la
seccin 10.10 provee sugerencias para otras lecturas. La figura 10.1 presenta el flujo de los
contenidos de los captulos.
Introduccin
Bases de la interaccin
Hombre-computadora
El proceso de acceso a la
informacin
Los puntos de partida
La especificacin de la
consulta
Contexto

Juicios de relevancia
Soporte de la interfaz
Conclusiones
Figura 10.1 Contenidos de este captulo

10.2

Interaccin Hombre Computadora

Qu es lo que hace efectiva la interfaz hombre .- computadora? Ben Schneiderman, un experto,


escribe [725, p.10]:
Bien diseados, los sistemas de computadora efectivos generan sensaciones positivas de xito,
competencia, dominio y claridad en la comunidad usuaria. Cuando un istema interactivo est bien
diseado, la interfaz casi desaparece, permitiendo al usuario concentrarse en su trabajo, exploracin
o placer.
Como pasos hacia el logro de esas metas, Schneiderman lista los principios para el diseo de
interfaces de usuario. Los particularmente importantes para el acceso a la informacin, incluyen:
proveer retroalimentacin informativa, permitir acciones inversas sencillas, soportar control interno
(internal locus of control) , reducir la carga de la memoria de trabajo, y proveer interfaces
alternativas para usuarios iniciales y expertos. Cada uno de estos principios debera ser instanciado
de forma diferente en cada aplicacin particular de la interfaz. En adelante discutimos estos
principios que son de especial inters para los sistemas de acceso a la informacin.
10.2.1 Principios del Diseo
Ofrecer retroalimentacin informativa: Este principio es especialmente importante para las
interfaces de acceso a la informacin. En este captulo veremos las ideas actuales acerca de cmo
proveer a los usuarios con retroalimentacin acerca de las relaciones entre la especificacin de su
consulta y los documentos recuperados, acerca de las relaciones entre los documentos recuperados,
y acerca de las relaciones entre los documentos recuperados y los metadatos que describen las
colecciones. Si el usuario tiene control sobre cmo y cundo se provee la retroalimentacin,
entonces el sistema provee un control interno (internal locus of control)
Reducir la carga de memoria de trabajo: El acceso a la informacin es un proceso iterativo, cuyas
metas cambian a medida que la informacin es encontrada. Una manera clave en que las interfaces
de acceso a la informacin pueden ayudar en mantener la memoria, es proveer mecanismos para
guardar rastros de las elecciones realizadas durante el proceso de bsqueda, permitiendo a los
usuarios retornar a las estrategias abandonadas temporariamente, saltar de una estrategia a la
siguiente, y retener informacin y contexto a lo largo de las sesiones de bsqueda. Otro dispositivo
para ayudar a la memoria es proveer informacin revisable que sea relevante en la etapa corriente
del proceso de acceso a la informacin. Esto incluye sugerencias de trminos relacionados o de
metadatos, y puntos de partida de bsquedas que incluyan listas de fuentes y listas de temas.
Proveer interfaces alternativas para usuarios iniciales y expertos: Un punto de tensin importante
en el diseo de interfaces de usuarios es el de la simplicidad versus potencia. Las interfaces simples
son fciles de aprender, a expensas de menor flexibilidad y a veces uso menos eficiente. Las
interfaces poderosas permiten a un usuario conocedor hacer ms y tener ms control sobre la
2

operacin de la interfaz, pero pueden consumir ms tiempo para ser aprendidas e imponen un
esfuerzo de memoria para las personas que usan el sistema de forma intermitente. Una solucin
comn es usar una tcnica con un andamio de apoyo (scaffolding). Se presenta al usuario inicial
una interfaz simple que puede ser aprendida rpidamente y que provee la funcionalidad bsica de la
aplicacin, pero que es restringida en cuanto a potencia y flexibilidad. Se ofrecen interfaces
alternativas para usuarios ms experimentados, permitiendo ms control, ms opciones y ms
caractersticas, o eventualmente modelos de interaccin completamente diferentes. Los buenos
diseos de interfaces proveen puentes intuitivos entre las interfaces simples y las avanzadas.
Las interfaces de acceso a la informacin deben enfrentar la dificultad del equilibrio entre la
simplicidad y la potencia. Una de esas dificultades es la cantidad de informacin que se muestra
acerca de los trabajos del sistema de bsqueda. Los usuarios nuevos de un sistema o de una
coleccin pueden no saber demasiado acerca del sistema o del dominio asociado con la coleccin,
como para hacer elecciones entre caractersticas complejas. Pueden no saber cmo pesar o valorar
los trminos, o, en el caso de retroalimentacin por relevancia, no saber cules seran los efectos de
la revaloracin de los trminos. Por otra parte, los usuarios que han trabajado con un sistema
probablemente sean capaces de elegir entre trminos sugeridos para agregar a su consulta mayor
informacin. Determinar cunta informacin se debe mostrar al usuario es una de las decisiones
principales en el diseo de interfaces de acceso a la informacin.
10.2.2 El rol de la visualizacin
Las herramientas del diseo de interfaces de computadora son familiares para la mayora de los
usuarios de hoy: ventanas, menes, conos, cajas de dilogos, etc. Estos recursos hacen uso de
despliegue de mapas de bits y grficos para proveer una interfaz ms accesible que las
visualizaciones basadas en comandos. Un rea menos familiar pero en crecimiento es la de la
visualizacin de la informacin, que intenta proveer representaciones visuales de espacios de
informacin muy grandes.
Los seres humanos estn acostumbrados a las imgenes y a la informacin visual. Los cuadros y los
grficos puede ser cautivantes si estn bien diseados. Una representacin visual puede comunicar
algunas clases de informacin mucho ms rpida y efectivamente que cualquier otro mtodo.
Consideremos la diferencia entre la descripcin escrita de la cara de una persona y su fotografa, o
la diferencia entre una tabla de nmeros que contienen una correlacin y un grfico que representa
la misma informacin.
La aparicin creciente de rpidos procesadores de grficos y de monitores de color de alta
resolucin incrementa el inters en la visualizacin de informacin. La visualizacin cientfica, una
rama en rpido avance, mapea fenmenos fsicos en representaciones de dos o tres dimensiones. Un
ejemplo de este tipo de visualizacin es la imagen color de patrones de picos y valles en el suelo del
ocano; esto provee una vista de fenmenos fsicos que actualmente la fotografa no puede cubrir.
La imagen se construye a partir de datos que representan los fenmenos subyacentes.
La visualizacin de informacin abstracta es ms difcil y la visualizacin de informacin
representada textualmente constituye un desafo. El lenguaje es nuestro principal medio de
comunicacin para las ideas abstractas, para las cuales no hay manifestaciones fsicas obvias.
Cmo lucira un cuadro que describiera negociaciones en las que una parte demandara concesiones
en polticas ambientales mientras que otra parte requiriera su refuerzo?
A pesar de las dificultades, los investigadores estn intentando representar aspectos del proceso de
acceso a la informacin utilizando tcnicas de visualizacin de la informacin. Adems de usar
3

iconos y resaltadores de color, las principales tcnicas de visualizacin de informacin incluyen


pintado (brushing) y linking, paneo y zoom, foco ms contexto, lentes mgicos, y el uso de
animacin para retener el contexto y ayudar a hacer visible la informacin oculta. Estas tcnicas
soportan uso dinmico e interactivo. La interactividad parece ser una propiedad especialmente
importante para visualizar informacin abstracta, a pesar de que no ha tenido un rol destacado en la
visualizacin de informacin cientfica.
El pintado (brushing) y linking refieren a la conexin de dos o ms vistas de los mismos datos, de
modo tal que un cambio en la representacin de una vista afecta la representacin en las dems. Por
ejemplo, imaginemos un vista que consiste en dos partes: un histograma y una lista de ttulos. El
histograma muestra, para un conjunto de documentos, cuntos documentos fueron publicados cada
ao. La lista de ttulos muestra los ttulos de los documentos correspondientes. El pintado
(brushing) y linking permitira al usuario asignar un color, por ejemplo rojo, a una barra del
histograma, lo que causara que tambin se pintaran de rojo los ttulos de la lista correspondientes al
ao pintado en el histograma.
El paneo y el zoom refieren a acciones de una cmara mvil que puede barrer de lado a lado una
escena (paneo) o acercarse y alejarse para conseguir una vista ms amplia o ms focalizada (zoom).
Por ejemplo, el agrupamiento de textos puede ser usado para mostrar una vista de los principales
temas en una coleccin de documentos (Figures 10.7 y 10.8). El zoom puede ser usado para
acercarse, y mostrar los documentos individuales como conos, y an ms cerca para ver el texto
asociado con un documento individual.
En la utilizacin del zoom, cuanto ms visibles son los detalles de un tem en particular, menos
puede verse sobre los tems que lo rodean. Foco ms contexto se usa para aliviar en parte este
efecto. La idea es agrandar una porcin de la vista el foco de la atencin- mientras se encogen los
objetos circundantes. Cuanto ms lejos est un objeto del foco de atencin, aparece de modo ms
pequeo, como el efecto que produce un lente ojo de pescado.
Los lentes mgicos son ventanas transparentes directamente manipulables que, cuando se
superponen sobre otros tipos de datos, causan una transformacin a ser aplicada a los datos
subyacentes que entonces cambian su apariencia (ver Figura 10.13). Una aplicacin de los lentes
mgicos es para el dibujo de tareas. La mano izquierda puede usarse para posicionar un lente de
color sobre un objeto. La mano derecha se utiliza para cliquear sobre el lente, lo que causa la
transformacin del color del objeto subyacente al especificado por el lente.
Adicionalmente, hay un gran nmero de mtodos grficos para representar rboles y jerarquas,
algunos de los cuales usan animacin para desplegar nodos que tambin pueden ser ocultados.
A veces es til combinar estas tcnicas en un nivel de la interfaz que denominamos vista general
ms detalles. En una ventana se muestra una vista general, como una tabla de contenido de un
manual grande. Un clik en en un captulo, en una accin de linking produce la aparicin del texto
del captulo en otra ventana (Ver Fig. 10.19). El paneo y el zoom o el foco ms contexto pueden ser
usados para cambiar la vista del contenido en la ventana general.
10.2.3 Evaluacin de sistemas interactivos
Desde el punto de vista del diseo de la interfaz de usuario, las personas tienen muy diferentes
habilidades, preferencias y predilecciones. Las diferencias importantes incluyen habilidad espacial
relativa y memoria, habilidades de razonamiento, aptitud verbal y diferencias de personalidad. La
edad y las diferencias culturales pueden contribuir a aceptar o rechazar tcnicas de interfaz. Una
4

innovacin de la interfaz puede ser til y plancentera para algunos usuarios, y extraa para otros.
Por tanto, el diseo de software debera permitir flexibilidad en el estilo de interaccin, y considerar
que las nuevas caractersticas no sern igualmente tiles para todos los usuarios.
Un importante aspecto de la interaccin hombre computadora es la metodologa de evaluacin de
las tcnicas de interfaz de usuario. Las medidas de acierto y precisin han sido ampliamente
utilizadas para comparar los resultados de sistemas no interactivos, pero son menos apropiadas para
evaluar sistemas interactivos. Las evaluaciones estndares enfatizan altos niveles de acierto; en
TREC (Text Retrieval Conferences, foros destinados a promover la investigacin en Recuperacin
de Informacin para grandes colecciones de texto) los sistemas de tareas son comparados para ver
cmo retornan los principales 1000 documentos (Cap.3). Sin embargo, en muchos sistemas
interactivos los usuarios requieren slo unos pocos documentos relevantes y no les importa el
acierto alto. La mtrica til sobre acierto y precisin incluye: tiempo requerido para aprender el
sistema, tiempo requerido para conseguir las metas de cada tarea, tasas de error, y retencin del uso
del la interfaz en el tiempo. En este captulo se muestran resultados empricos de estudios de
usuarios.
Los datos empricos que implican a los usuarios son el tiempo consumido y la dificultad para
extraer conclusiones. Esto se debe en parte a la variacin de las caractersticas de los usuarios y sus
motivaciones, y enparte al amplio alcance de las actividades de acceso a la informacin. Los
estudios psicolgicos formales slo han cubierto conclusiones especficas en contextos muy
restringidos. Por ejemplo, cantidades tales como el tiempo que toma al usuario seleccionar un tem
de un men en varias condiciones. Pero en cambio es difcil cuantificar las variaciones en el
comportamiento de la interaccin para tareas complejas de acceso a informacin. Nielsen [605]
invoca un enfoque de evaluacin ms informal (llamada evaluacin heurstica).
10.3

El proceso de acceso a la informacin

Una persona involucrada en un proceso de bsqueda de informacin tiene una o ms metas en su


mente y utiliza un sistema de bsqueda como herramienta para lograrlas. Las metas requeridas para
el acceso a informacin pueden ser muy variadas, desde encontrar un plomero hasta encontrar
informacin sobre un competidor comercial, desde escribir un artculo acadmico hasta realizar una
investigacin para realizar una demanda por fraude.
Para lograr esas metas se llevan a cabo las tareas de acceso a la informacin. Estas tareas abarcan
un amplio espectro que va desde hacer preguntas especficas hasta investigar un tpico de forma
exhaustiva. En un estudio llevado a cabo por analistas de negocios [614] se encontraron tres tipos
principales de tareas de bsqueda: monitoreo de un tpico conocido a lo largo de un tiempo (tal
como investigar las actividades de la competencia cada cierto tiempo); seguir un plan de series
especficas de bsqueda para lograr una meta en particular (tal como mantenerse actualizado sobre
prcticas de negocios exitosas), y explorar un tpico de un modo indirecto (tal como cuando se
logra saber acerca de una industria no conocida). A pesar de que las metas difieren, hay un ncleo
comn de componentes alrededor de la bsqueda de informacin.
10.3.1 Modelos de interaccin
En general se asume que en el proceso de acceso a la informacin se da un ciclo de interaccin que
consiste en la especificacin de la consulta, la recepcin y el anlisis de los resultados; luego se
finaliza el proceso o se reformula la consulta y se repite el proceso hasta que se encuentra un
conjunto considerado perfecto [700,726]. Ms detalladamente, el proceso puede ser descripto de
acuerdo a la siguiente secuencia de pasos (ver Figura 10.2):
5

1)
2)
3)
4)
5)
6)
7)
8)

Comienzo con una necesidad de informacin


Seleccin de un sistema y de una coleccin en los que buscar
Formular la consulta
Enviar la consulta al sistema
Recibir los resultados en forma de tems de informacin
Revisar, evaluar e interpretar los resultados
Finalizar o
Reformular la consulta e ir al paso 4

Este modelo simple de interaccin (utilizado por los motores de bsqueda en la Web) es el que
utilizan la mayora de los que buscan informacin en la actualidad. Este modelo no toma en
consideracin que muchos usuarios se disgustan ante una gran lista de resultados desorganizados
que no refieren directamente a sus necesidades de informacin. Tambin incluye un supuesto: la
necesidad de informacin del usuario es esttica y el proceso de bsqueda de informacin es una
sucesin de refinamientos de una consulta hasta que se recupera todos y slo los documentos
relevantes a la necesidad de informacin original.
Necesidad
de
informacin
Consulta

Enviar al
sistema

Recibir los
resultados

Reformular
Evaluar los
resultados
S
i
No
Satisfacci
n?

Fin

Figura 10.2 Diagrama simplificado del modelo estndar del proceso de acceso a la informacin

En realidad, los usuarios aprenden durante el proceso de bsqueda. Ellos revisan la informacin,
leen los ttulos en los resultados, leen los documentos recuperados, ven las listas de tpicos
relacionados con los trminos de bsqueda, y navegan por los sitios Webs relacionados por
hipervnculos. El advenimiento de los hipervnculos como parte central del proceso de bsqueda de
informacin, hace imposible ignorar el rol de la revisin (scanning) y de la navegacin como partes
del mismo proceso. En particular, y mucho ms que en las bsquedas bibliogrficas hoy es muy
comn que se intenten aproximaciones utilizando los hipervnculos de la Web, en la espera de
encontrar una pgina til luego de algunos saltos por diferentes sitios o pginas.
Ese modelo tambin subestima la interaccin que tiene lugar cuando el usuario revisa trminos
sugeridos como resultado de un proceso de retroalimentacin por relevancia, revisa una estructura
de tesauro, o visualiza esquemas temticos de una coleccin de documentos. Ese modelo tampoco
valora suficientemente el rol de la seleccin de fuentes que est adquiriendo creciente importancia
desde que hay disponibles miles de colecciones de informacin.
Por estas razones, a pesar de que es til para describir las bases del proceso de acceso a la
informacin, est siendo muy criticado [65,614,105,365,192]. Bates [65]propone el modelo
recoger granos (berry-picking), que contiene dos puntos principales. El primero es que, como
resultado de la lectura y aprendizaje a partir de la informacin encontrada en el proceso de
bsqueda, continuamente cambian tanto la necesidad de informacin del usuario como la
formulacin de las consultas. La informacin encontrada en un punto de la bsqueda puede
producir un cambio no previsto de direccin de la misma. La meta original puede lograrse de forma
parcial y cambiar la prioridad de una meta en relacin con otra. Esto contradice el supuesto de que
la necesidad de informacin del usuario permanece inamovible durante el proceso de bsqueda. El
segundo punto de este modelo es que las necesidades de informacin del usuario no son satisfechas
por un nico conjunto final de documentos recuperados, sino por una serie de selecciones y bits de
informacin encontrados a lo largo del proceso. Esto contradice el supuesto de que la principal meta
de un proceso de bsqueda es encontrar el conjunto perfecto de documentos que satisfacen la
necesidad original de informacin.
El modelo berry-picking est respaldado por una cantidad de estudios observacionales [236,105]
incluyendo los de ODay y Jeffries [614]. Ellos encuentran que el proceso de bsqueda de
informacin consiste en una serie de bsquedas interconectadas pero diversas sobre un tema base.
Tambin encuentran que los resultados de una bsqueda tienden a plantear nuevas metas y producen
cambios de direccin de la bsqueda, pero esto se va produciendo en etapas. Tambin plantean que
el principal valor de una bsqueda reside en el aprendizaje acumulado y en la adquisicin de
informacin que se produce durante el proceso, ms que en el conjunto de resultados finales.
En consecuencia, una interfaz de usuario para el acceso a la informacin debera permitir a los
usuarios cambiar sus metas y ajustar sus estrategias de acuerdo con estos cambios. Puede ocurrir
que un usuario encuentre un disparador que produzca un cambio temporario de estrategia, quizs
para retornar ms tarde a la actividad inicial. Una consecuencia de estas observaciones es que la
interfaz debera permitir dejar y seguir rastros de las actividades realizadas. Esto puede lograrse en
parte mediante recursos para grabar el progreso de la estrategia y almacenar, encontrar y volver a
cargar los resultados intermedios. Tambin debera permitir el seguimiento de varias estrategias de
forma simultnea.
La interfaz de usuario debera contener formas de monitorear el estado de la estrategia en relacin
con las tareas que est realizando el usuario y con las metas que se ha propuesto. Una de las
maneras puede ser a travs de un anlisis de costo / beneficio. Estos anlisis suponen que en
7

cualquier punto del proceso de bsqueda, el usuario persigue la estrategia que tiene la mayor
expectativa de utilidad. Si, como consecuencia de alguna eleccin tctica, otra estrategia se presenta
como de mayor utilidad, la anterior ser temporaria o permanentemente abandonada a favor de la
nueva.
Hay algunas teoras que contrastan el browsing, el realizar consultas, el navegar y el revisar
(browsing, querying, navigating y scanning). Nosotros asumimos que el usuario revisa una
estructura de informacin, sea en ttulos, trminos de tesauros, hipervnculos, categoras, o el
resultado de clustering (agrupamiento automtico), y entonces o selecciona un tem para algn
propsito (lectura en detalle, para usarlo como input de otra consulta, para navegar a otra pgina), o
formula una consulta (utilizando algunas palabras o seleccionando categoras). En ambos casos, se
hace visible para su revisin un nuevo conjunto de informacin. Las consultas tienden a producir
colecciones de informacin que no haban sido reunidas con anterioridad, mientras que la seleccin
de categoras recupera informacin que haba sido previamente compuesta u organizada. La
navegacin se refiere al seguimiento de una cadena de links, con alguna meta en particular, en una
secuencia de operaciones de revisin y seleccin. El browsing se refiere a una exploracin no
dirigida y casual, de estructuras de informacin. Usualmente es realizada en forma conjunta con
selecciones, a pesar de que pueden realizarse consultas para crear subcolecciones sobre las que
realizar un posterior browsing. Un aspecto importante del proceso de interaccin es que la salida
producto de una accin debera poder ser utilizada fcilmente como entrada en el paso siguiente.
10.3.2 Las partes no-bsqueda en el proceso de acceso a la informacin
El estudio ODay y Jeffries [614] hall que la bsqueda de informacin es slo una parte del
proceso de trabajo completo que realizan las personas. Durante las sesiones de bsqueda se realizan
diferentes clases de trabajo con la informacin recuperada, por ejemplo leer, anotar y analizar. Esos
autores analizaron los pasos de anlisis en mayor detalle, encontrando que el 80 % del trabajo puede
clasificarse en seis tipos principales: encontrar tendencias, hacer comparaciones, agregar
informacin, identificar conjuntos crticos, valorar, e interpretar. El 20 % restante consiste en
realizar referencias cruzadas, sumarizar, encontrar visualizaciones evocativas para los informes, y
otras actividades miscelneas. El trabajo de Russell et al [690] Sensemaking (construccin de
sentido) presenta el trabajo de informacin como un proceso en el que la recuperacin de
informacin es slo una pequea parte. Ellos observan que la mayor parte del esfuerzo realizado en
Sensemaking se encuentra en la sntesis de una buena representacin, o en las vas de pensamiento
acerca de algo. Describen el proceso de formular y cristalizar los conceptos importantes para una
tarea dada.
A partir de estas observaciones es conveniente dividir el proceso completo de acceso a la
informacin en dos componentes principales: bsqueda y recuperacin, y anlisis y sntesis de los
resultados. Las interfaces de usuario deberan permitir combinar ambos tipos de actividad. Sin
embargo, el anlisis / sntesis son actividades que pueden ser hechas con independencia de la
bsqueda de informacin, y nos parece til hacer una distincin entre ambos tipos de actividades.
10.3.3

Primeros Estudios de Interfaces

La mayor parte de la literatura sobre el comportamiento de la bsqueda de informacin hombre


computadora, se relaciona con los intermediarios de informacin que usan sistemas en lnea que
consisten en registros bibliogrficos [546,707,104], a veces con costos valorados por unidad de
tiempo. Desafortunadamente, muchos de los supuestos de estos estudios no reflejan las condiciones
del acceso moderno a la informacin [335,222] Las diferencias son:
8

Actualmente el texto buscado es a menudo texto completo y no citas bibliogrficas. Como los
usuarios tienen acceso al texto completo, ms que a sustitutos de los documentos, es ms
probable que las bsquedas simples encuentren respuestas relevantes como parte del procesos
de bsqueda.
Los sistemas modernos usan ranking estadstico (que son ms efectivos cuando se dispone de
texto completo y de abstracts, que cuando se trata de citas), mientras que la mayora de estos
estudios se realizaron sobre sistemas booleanos.
La mayora de las bsquedas actuales son realizadas por usuarios finales, ms que por
profesionales intermediarios, que era el foco de los tempranos estudios.
Hoy hay disponibles decenas de miles de fuentes en lnea y en red, y muchos estn relacionados
por hipervnculos, a diferencia de las colecciones separadas pertenecientes a diferentes
servicios. Los primeros estudios generalmente usaron sistemas en los que cambiarse de una
coleccin a otra requera un conocimiento y tiempo considerable.
Finalmente, muchos usuarios tienen acceso a muestras de mapas de bits que permiten la
manipulacin directa, o pueden llenar formularios. La mayora de los estudios tempranos y de
los sistemas bibliogrficos se implementaron con comandos en lnea, que requeran una sintaxis
y no tenan formas para mostrar el contexto.

A pesar de estas diferencias significativas, algunas estrategias generales de bsqueda de


informacin parecen mantener su valor a travs de los diferentes sistemas. Por otra parte, si bien los
sistemas modernos ha resuelto muchos de los problemas de los primeros OPACs, tambin han
introducido nuevos problemas.
10.4

Puntos de partida

Las interfaces de usuario deben proveer a los usuarios con buenas formas para iniciar su trabajo.
Una pantalla vaca o un formulario en blanco no ayudan al usuario a decidir cmo iniciar el proceso
de bsqueda. Por lo general un usuario no comienza con una detallada expresin de su necesidad de
informacin. Los estudios muestran que los usuarios tienden a comenzar con consultas muy breves,
analizan el resultado, y luego modifican las consultas en un ciclo de retroalimentacin incremental.
La consulta inicial puede ser vista como una prueba para ver los resultados y a partir de all hacerse
una idea de cmo reformular la consulta. En consecuencia, una tarea de la interfaz de acceso a la
informacin, es ayudar a los usuarios a seleccionar las fuentes y colecciones en las que buscar
informacin.
Por ejemplo, hay muchas fuentes de informacin asociadas con el tema cncer, y son muchas las
clases de informacin que un usuario podra querer conocer acerca del tema. Mediante una correcta
gua al usuario, este podra resolver el problema inicial de la formulacin. La bsquedas
bibliogrficas tradicionales suponen que el usuario comienza mirando una lista de nombres de
fuentes y elige en cules colecciones buscar; en cambio los motores de bsqueda en la Web
eliminan las diferencias entre fuentes y arrojan al usuario en medio de un sitio Web con poca
informacin acerca de la relacin entre ese acierto de la bsqueda y el resto de la coleccin. En
ninguno de los dos casos la interfaz disponible es demasiado til.
En esta seccin presentaremos cuatro tipos de puntos de partida: listas, vistas generales (overviews),
ejemplos, y seleccin automtica de fuentes.
10.4.1

Listas de colecciones

Los sistemas en lnea tpicos, como LEXIS-NEXIS requieren que los usuarios comiencen una
bsqueda con una revisin de una larga lista de nombres de fuentes y supongan cules sern de
inters. Generalmente se provee poca informacin en lnea sobre el contenido de estas fuentes (ver
Figura 10.3). Si el usuario no es satisfecho con los resultados de una coleccin, tiene que
redireccionar su bsqueda en otra direccin (coleccin).
Los usuarios habituales aprenden qu conjuntos de fuentes les son tiles para sus dominios de
inters, ya sea a travs de la experiencia, la capacitacin formal, o por recomendaciones de sus
colegas. Las fuentes ms utilizadas pueden registrarse en listas de favoritos en la Web. Existen
investigaciones que exploran el mantenimiento de perfiles de informacin personalizados para
usuarios o grupos de trabajo, basados en las clases de informacin que han utilizado anteriormente.
[277]

Figura 10.3 Pantalla de seleccin de LEXIS-NEXIS

Sin embargo, cuando los usuarios quieren buscar fuera de sus dominios de especialidad, no es
suficiente una lista de fuentes familiares. Los buscadores de informacin profesionales, como los
bibliotecarios, aprenden a travs de la experiencia y aos de entrenamiento, cules fuentes son
apropiadas para diferentes necesidades de informacin. La naturaleza restrictiva de las interfaces
tradicionales desalienta la exploracin y descubrimiento de nuevas fuentes. Recientes
investigaciones han ideado diferentes mecanismos para ayudar a la comprensin del contenido de
las colecciones como forma de iniciar una bsqueda.
10.4.2

Vistas generales

10

Como puede comenzar un usuario que se enfrenta con un conjunto grande de colecciones de
texto?. Una posibilidad es analizar una vista general del contenido de las colecciones. Tal vista
general puede mostrar los dominios temticos representados en la coleccin, para ayudar al usuario
a seleccionar o eliminar fuentes. Una vista general puede ayudar a los usuarios a comenzar,
dirigindolos hacia barrios temticos generales, despus de lo cual pueden recorrer usando
descripciones ms detalladas. Shneiderman [724] propone un modelo de interaccin en el cual el
usuario comienza con una vista general de la informacin con la que va a trabajar, luego panea
(recorre panormicamente) y realiza zooms para encontrar reas de inters potencial, y entonces
mira los detalles. El proceso se repite tantas veces como sea necesario.
En esta subseccin se presentan tres tipos de vistas generales. La primera es la muestra y
navegacin de una jerarqua de categoras temticas asociada con los documentos de una coleccin.
El segundo tipo lo constituyen las vistas generales construidas de forma automtica, generalmente
elaboradas mediante tcnicas de clustering sobre los textos de los documentos. El tercer tipo de
vista general es el que se crea mediante la aplicacin de variantes del anlisis de co-citacin sobre
conexiones o vnculos entre diferentes entidades en una coleccin. Otra clase de vistas generales
son las que, por ejemplo, muestran representaciones grficas de estanteras o pilas de libros [681,
46]
Vistas generales de categoras o directorios
Hoy existen grandes colecciones en lnea de colecciones de textos a los que se les han asignado
etiquetas con categoras temticas. Los sistemas bibliogrficos tradicionales han asignado por
dcadas encabezamientos de materia a los libros y otros documentos [752]. MEDLINE, una
coleccin de artculos biomdicos utiliza el Medical Subjects Headings, que contiene
aproximadamente 18.000 categoras [523]. Las Association for Computing Machinery (ACM)
desarroll una jerarqua de aproximadamente 1.200 categoras
(palabras clave) (http://
www.acm.org/class/). Yahoo [839] organiza las pginas Web en una jerarqua de miles de
categoras.
La popularidad de Yahoo y de otros directorios Web sugiere que las categoras organizadas
jerrquicamente son puntos de partida tiles para los usuarios que buscan en a Web. Esta
popularidad puede reflejar una preferencia respecto de comenzar con un inicio lgico, o puede
tambin denotar el deseo de evitar tener que pensar qu palabras debera ser utilizadas para
recuperar la informacin deseada. (Tambin puede reflejar el hecho de que los servicios con
directorios intentan mejorar la calidad de algunos sitios Web).
El significado de las etiquetas de categoras difiere entre las distintas colecciones. La mayora estn
diseadas para ayudar a organizar los documentos y en la especificacin de las consultas.
Desafortunadamente, los usuarios de los catlogos bibliogrficos en lnea raramente utilizan los
encabezamientos de materia disponibles [335, 222]. Hancock-Beaulieu y Drabenstott y Weller,
entre otros, han planteado la pobreza de las interfaces basadas en comandos, para proveer ayuda en
la seleccin de etiquetas temticas y requerir de los mismos la revisin de largas listas alfabticas.
An en las interfaces grficas de la Web, encontrar el lugar adecuado con una jerarqua de
categoras puede ser una tarea que insuma mucho tiempo, y una vez que ha sido encontrada la
coleccin usando ese tipo de representacin, se requiere un medio alternativo para buscar en el sitio
mismo.
La mayora de las interfaces que presentan de modo grfico categoras jerrquicas lo hacen
asociando los documentos a la categora a la que han sido asignados. Por ejemplo, al clikear en una
categora en Yahoo, se despliega la lista de documentos que han sido asignados a esa etiqueta de
11

categora. Conceptualmente, el documento es almacenado con esa etiqueta. Para utilizar la lista de
categoras para realizar bsquedas en Yahoo, el usuario debe elegir la que considere ms apropiada
para contener referencias de su inters temtico. Una eleccin incorrecta requiere que vuelva atrs y
trate nuevamente, recordando qu pginas contienen qu informacin. Si la informacin deseada se
encuentra en un nivel muy especfico de la jerarqua, o no est disponible, esto se convierte en un
proceso muy largo y probablemente frustrante. Como conceptualmente los documentos estn
almacenados dentro de las categoras, los usuarios no pueden crear consultas basadas en la
combinacin de categoras.

Figura 10.4

La interfaz MesHBrowse para ver jerrquicamente las etiquetas de categoras

Es difcil disear una buena interfaz que integre la seleccin de categoras dentro de la
especificacin de la consulta, en parte porque la visualizacin de jerarquas de categoras ocupa
gran cantidad de espacio en la pantalla. Por ejemplo, Internet Gratefull Med
(http://igm.nlm.nih.gov:80/) es un servicio Web que permite una integracin de las bsquedas con
visualizacin y seleccin de categoras MeSH. Despus que el usuario tipea el nombre de una
categora, se despliega una larga lista de opciones en una pgina. Para ver ms informacin acerca
de una categora, el usuario selecciona un link (por ejemplo Radiation Injuries, Lesiones por
Radiacin). Esto produce que desaparezca el contexto de la consulta y que aparezca una nueva
pgina Web que muestra los ancestros del trmino y sus descendientes inmediatos. Si el usuario
intenta ver los hermanos del trmino padre (Wound and Injuries, Heridas y Lesiones), aparece una
nueva pgina que cambia otra vez el contexto. Al volver a la consulta, desaparece la ilustracin de
las categoras.
El sistema MeSHBrowse [453] permite entonces que slo se muestre el subconjunto relevante de la
jerarqua, haciendo ms fcil el browsing de una jerarqua total muy extensa. La interfaz tiene las
limitaciones de espacio inherentes a las visualizaciones de jerarquas bidimensionales y no provee
mecanismos para buscar en una coleccin de documentos subyacente. Ver Figura 10.4.
El sistema HiBrowse [646] representa metadatos de categoras de un modo ms eficiente,
permitiendo a los suarios desplegar varios subconjuntos diferentes de metadatos de categoras
simultneamente. El usuario primero selecciona qu tipo de atributos (o facetas, como se llaman los

12

atributos en este sistema) va a visualizar. Por ejemplo, el usuario puede elegir primero physical
disease (enfermedad fsica) como valor para la faceta Disease (Enfermedad). Las categoras que
aparecen un nivel por debajo se muestran junto con el nmero de documentos que contiene cada
categora. El usuario puede entonces seleccionar otro tipo de atributos Therapy and Groups (by
age), Terapia y grupos (por edad). Se muestran los nmeros de documentos que contienen atributos
de los tres tipos. Si ahora el usuario selecciona un refinamiento de una de las categoras, tal como el
valor child (nio) del atributo Grupos, entonces se muestra el nmero de documentos que
contienen los tres tipos de facetas seleccionadas. Al mismo tiempo, se actualiza el nmero de
documentos que contienen las subcategoras que se encuentran bajo physical desease,
(enfermedad fsica) y therapy (general), (terapia (general)) para reflejar esta especificacin. Ver
Figura 10.5. Un problema con el sistema HiBrowse es que requiere que el usuario navegue a travs
de la jerarqua de categoras, ms que la especificacin directa de las consultas. En otras palabras, la
especificacin de la consulta no est estrechamente asociada con la visualizacin de las categoras.
Como solucin a alguno de estos problemas, se describe la interfaz Cat-a-Cone en la seccin 10.8

Figura 10.5

La interfaz HiBrowse para la visualizacin de etiquetas de categoras jerrquicamente


y de acuerdo con facetas

Vistas generales de colecciones, construidas automticamente


Muchos intentos de mostrar vistas generales de informacin se han focalizado en la extraccin
automtica de los temas ms generales comunes que aparecen en la coleccin. Estos temas se
derivan a travs del uso de mtodos de anlisis automtico, generalmente variantes del clustering de
documentos. El clustering organiza documentos en grupos basados en algn criterio de similaridad;
los centroides de los clusters determinan los temas en la coleccin.

13

El paradigma de browsing Scatter/Gather (dispersar, reunir)[203,202] agrupa documentos en grupos


temticamente coherentes, y presenta al usuario sumarios textuales descriptivos. Los sumarios
consisten en trminos temticos que caracterizan cada cluster, y un conjunto de ttulos tpicos que
aluden al contenido del cluster. Informado a travs de los sumarios, el usuario puede seleccionar un
subconjunto de clusters que le parecen de inters, y volver a hacer un cluster con su contenido
(reclustering). De este modo el usuario puede examinar el contenido de cada subcoleccin refinando
los detalles. El reclustering se efecta en el momento; diferentes temas se producen dependiendo de
los contenidos en la subcoleccin en la que se aplica el clustering. La eleccin del algoritmo de
clustering influye en qu cluster se obtiene, pero ningn algoritmo se ha mostrado particularmente
mejor que otro cuando se produce el mismo nmero de clusters. [816]
Un estudio de usuarios [640] mostr que el uso de Scatter/Gather en una coleccin grande de textos
expresa algo del contenido y estructura del corpus. Sin embargo, este estudio tambin mostr que el
uso de Scatter/Gather sin una facilidad de bsqueda era menos efectivo que una bsqueda por
similaridad estndar. Esto es, las personas que podan navegar solamento (no buscar), en una
estructura jerrquica de clasters que cubra la coleccin completa, encontraban menos documentos
relevantes que las personas que podan escribir una consulta y revisar a travs de los resultados
recuperados.
Es posible integrar Scatter/Gather con tecnologa de bsquedas convencionales aplicando clustering
a los resultados de una consulta para organizar los documentos recuperados (ver Figura 10.6). Una
experiencia offline [359] mostr que el clustering puede ser ms efectivo si se utiliza de esta
manera. El estudio encontr que los documentos relevantes a la consulta tendan a estar
principalmente en uno o dos de los cinco clusters, si los clusters eran generados a partir de los
documentos recuperados rankeados al principio. El estudio tambin mostr que el acierto y la
precisin eran ms altos en el mejor cluster que en todos los resultados como un todo. La
consecuencia es que un usuario puede emplear tiempo mirando el contenido de un cluster con la
ms alta proporcin de documentos relevantes, y al mismo tiempo evitar aquellos clusters que
contienen muchos documentos no relevantes.
Es probable que los temas generales puedan extraerse mediante el clustering, pero la naturaleza
automtica del clustering puede resultar en una visualizacin de tpicos de diferentes niveles de
descripcin. Por ejemplo, con un clustering en una coleccin de documentos sobre computacin,
pueden resultar clusters que contengan documentos acerca de inteligencia artificial, teora de la
computacin, grfica computacional, arquitectura computacional, lenguajes de programacin,
gobierno, aspectos legales. Los ltimos dos temas son ms generales que los dems ya que son
tpicos que estn fuera del alcance de las ciencias de la computacin.

14

Figura 10.6

Visualizacin de los resultados de la recuperacin con clustering en Scatter / Gather

Scatter / Gather muestra una representacin textual de los cluster de documentos. Los
investigadores han desarrollado varios enfoques para mapear documentos en un espacio documental
que puede ser en dos dimensiones en la que cada documento es representado como un icono o un
glifo (glyph), o en un espacio abstracto de dos dimensiones. Las funciones para transformar los
datos en el espacio dimensional ms bajo (o inferior) difieren, pero el efecto red consiste en que
cada documento es ubicado en un punto representado en el espacio . Los usuarios pueden detectar
temas o clusters en los grupos de signos o glifos. Entre los sistemas que utilizan este tipo de
visualizacin grfica se incluye a BEAD [156], Galaxy of News [671], y ThemeScapes [821]. La
visualizacin de ThemeScapes presenta una representacin tridimensional en el resultado del
clustering (ver Figura 10.7). El sistema hace uso de un espacio negativo para enfatizar las reas
de concentracin donde aparecen los clusters. Otros sistemas muestran de modo jerrquico la
similaridad inter-documental [529,14], mientras que otros muestran los documentos recuperados en
redes basadas en similaridad inter-documental [262,761].
El algoritmo de mapa de caractersticas de Kohonen ha sido utilizado para la creacin de mapas que
caracterizan grficamente el contenido total de una coleccin de documentos [520,163] (ver Figura
10.8). Las regiones del mapa en dos dimensiones varan en medida y forma de acuerdo con la
frecuencia de los documentos asignados a los temas correspondientes que aparecen en la coleccin.
Las regiones se caracterizan por palabras simples o frases y la adyacencia de regiones refleja
relaciones semnticas de los temas de la coleccin. Al mover el cursor sobre una regin, parecen en
una ventana de tipo pop-up los ttulos de los documentos que se asocian ms cercanamente con la
regin marcada. Los documentos pueden ser asociados con ms de una regin.

15

Figura 10.7

Vista general en tres dimensiones basada en clustering de documentos [821]

Evaluacin de Vistas generales Grficas


A pesar de su apariencia intuitiva, las vistas generales de grandes espacios documentales deben
todava demostrar que son tiles y comprensibles para los usuarios. De hecho, hay evaluaciones que
proveen evidencias negativas al respecto. Un estudio encontr que para usuarios no expertos el
resultado del clustering era difcil de usar, y que las presentaciones grficas (por ejemplo,
representar cluster con crculos y lneas que conectan los documentos, eran ms difciles que las
representaciones textuales (por ejemplo, mostrar ttulos y palabras temticas como en Scatter /
Gather), porque el contenido de los documentos es difcil de representar sin la lectura de algn
texto. [443]
Otro estudio reciente compara el mapa Kohonen con una tarea de browsing en Yahoo [163]. En una
de las tareas se les pidi a los usuarios que encontraran una pgina Web interesante en la categora
Entretenimientos de Yahoo y una organizacin de la mismas pginas Web en un mapa Kohonen. El
experimento vari segn los usuarios comenzaban en Yahooo o en el mapa grfico. Despus de
completar las tareas de browsing, los usuarios deban intentar repetir el browsing utilizando la otra
herramienta. En las personas que comenzaron con el mapa Kohonen, 11 de 15 encontraron un
pgina interesante en diez minutos. Ocho de ellas fueron capaces de encontrar la misma pgina
usando Yahoo. En los usuarios que comenzaron con Yahoo, 14 de 16 encontraron pginas
interesantes. Sin embargo, slo dos de 14 pudieron encontrar la pgina en la visualizacin grfica.
Esto constituye una fuerte evidencia contra la navegabilidad de esta ltima y sugiere que la simple
vista de etiquetas de Yahoo es ms til. Sin embargo, el mapa puede ser ms til si el sistema es
modificado para integrar el browsing con la formulacin de la bsqueda.

16

Figura 10.8
Vista general en dos dimensiones creada utilizando el algoritmo de mapeo de
caractersticas Kohonen, sobre pginas Web, sobre el tema Entretenimiento [163

Las personas prefirieron algunos aspectos de la representacin en mapa. En particular algunos


mencionaron la facilidad de saltar de un rea a la otra sin tener que ir hacia atrs o hacia delante
como se requiere en Yahoo; otros mencionaron el hecho de que los mapas tienen viarios niveles de
granularidad. Las personas que participaron tambin expresaron su disconformidad con algunos
aspectos de las visualizaciones. Algunos usuarios mencionaron el deseo de una organizacin
jerrquica visible, otros la funcin de realizar zoom en un rea para obtener ms detalles, y otros
manifestaron su disgusto por tener que mirar en el mapa completo para encontrar un tema, deseando
en cambio una lista alfabtica. Muchos encontraron que las etiquetas de una nica palabra eran
confusas o ambiguas. Por ejemplo BILL poda interpretarse como el nombre de una persona,
adems de cmo Cuenta en idioma ingls.
Los autores concluyen que esta interfaz es ms apropiada para un browsing casual ms que para una
bsqueda. En general, las vistas generales producidas de modo automtico son ms tiles para dar
al usuario una idea general de la clase de informacin que puede ser encontrada en una coleccin de
documentos, pero generalmente no es tan til en un proceso de acceso a la informacin.

17

Clustering de co-citaciones para Vistas Generales


El anlisis de citas ha sido largamente reconocido como forma de mostrar una vista general de los
contenidos de una coleccin [812]. La principal idea es determinar la localizacin de documentos
basndose en patrones de co-citacin. Hay diferentes modos de determinar patrones de citacin: un
mtodo es medir la frecuencia en la que dos artculos son citados conjuntamente por un tercero.
Otra alternativa es reunir dos artculos que citan el mismo tercer artculo. En ambos casos existe el
supuesto de que los artculos apareados comparten algunos elementos. Despus de construir una
matriz de co-citaciones, los documentos son reunidos (clustered) en base a la similaridad de sus
patrones de co-citacin. Los clusters resultantes son interpretados para indicar los temas dominantes
en la coleccin. El clustering puede focalizarse en los autores de los documentos ms que en su
contenido, para identificar autores centrales en un campo. Esta idea ha sido implantada
recientemente en documentos Web en el Referral Web Project [432]. La idea tambin fue aplicada a
pginas Web usando una estructura de vnculos Web para identificar los principales tpicos
temticos en pginas Web [485, 639]. Una idea similar se utiliz para identificar pginas que
funcionaban como buenos puntos de partida en tpicos particulares (llamadas pginas autoridad,
authority pages, por Kleinberg [444].
10.4.3 Ejemplos, Dilogos y Expertos (Wizards)
Otra forma de ayudar a los usuarios a comenzar es con un ejemplo de interaccin con el sistema.
Esta tcnica tambin se conoce como recuperacin por reformulacin. Una versin de esta idea se
encuentra en el sistema Rabbit [818] que provee representaciones grficas para ejemplos de
consultas en bases de datos. Se muestra un marco general para una consulta y el usuario lo modifica
para describir lo que quiere. El sistema muestra un ejemplo de la clase de informacin disponible
que se corresponde con esta descripcin. Por ejemplo, si un usuario busca en una base de datos de
productos de computacin e indica su inters en discos, se recupera un ejemplo de un tem con los
descriptores correspondientes a discos en su lugar. El usuario puede usar o modificar los
descriptores visualizados e iterar el procedimiento.
La idea de recuperacin por reformulacin se ha extendido al dominio del desarrollo de las
interfaces de usuario [581] y de la ingeniera de software [669]. El sistema Helgon [255] es una
variante moderna de esta idea aplicada la las bases de datos bibliogrficos. En Helgon, el usuario
entra navegando una jerarqua de tpicos desde los cuales selecciona ejemplos estructurados, de
acuerdo con su inters. Pero los usuarios tuvieron problemas con la organizacin de la jerarqua y
encontraron tedioso el uso de los ejemplos. Este resultado subraya una dificultad con los ejemplos y
dilogos: conseguir que el usuario inicie con el dilogo correcto o el ejemplo correcto es un
problema de bsqueda en s mismo [492,449].
Una variante ms dinmica de este tema es el dilogo interactivo. Las interfaces basadas en el
dilogo has sido exploradas desde hace mucho tiempo, en un intento de imitar la interfaz humana de
un intermediario, por ejemplo un bibliotecario referencista. Oddy trabaj tempranamente en el
sistema THOMAS, que provea una sesin de preguntas y respuestas con una interfaz de comandos
[615]. Ms recientemente, Belkin et al. Definieron modelos de interaccin ms elaborados [75], a
pesar de que no han sido probados empricamente.
La interfaz del sistema DLITE usa un dilogo de contexto-ms-foco (focus-plus-context) como
forma de familiarizar a los usuarios con las secuencias normalizadas de operaciones con el sistema.
Al comienzo se muestra una vista de todos los pasos del dilogo en una lista. El usuario puede
expandir la explicacin de cualquier paso individual mediante un click en su descripcin. Tambin

18

puede expandir el dilogo completo para ver qu preguntas son las que siguen, y cerrarlo para
focalizarse en la tarea corriente.
Una forma ms restrictiva del dilogo que se ha difundido bastante en los productos comerciales es
el del Experto (Wizard). Esta herramienta ayuda a los usuarios en tareas de tiempo limitado, pero no
intenta ensear todo el proceso requerido para completar las tareas. El Experto presenta un camino
paso a paso, que el usuario puede seguir para realizar un trabajo [636]. Un estudio reciente [145]
encontr que los expertos son tiles para metas que requieren muchos pasos, para usuarios que
carecen de conocimiento suficiente (por ejemplo un propietario de un restaurante instalando un
software para la contabilidad de su negocio), y cuando los pasos deben ser completados en una
secuencia fija. Las propiedades de los Expertos incluyen el permitir a los usuarios volver a correr el
Experto y modificar su trabajo anterior, mostrar una vista general de las funciones, y proveer
descripciones comprensibles para hacer las elecciones correctas. Los Expertos no son tiles cuando
la interfaz no resuelve un problema de forma efectiva, cuando la meta es ensear al usuario cmo
usar la interfaz y cuando el Experto no ha sido probado.
Una visita guiada (guided tour) conduce al usuario a travs de una secuencia de elecciones de
navegacin a travs de vnculos de hipertexto, presentando los nodos en un orden lgico. En un tour
dinmico, slo se muestran los nodos relevantes [329]. Una aplicacin reciente de es el proyecto
Walden Paths que permite a docentes definir caminos tiles para el entrenamiento, a travs de
pginas Web [289]. Este enfoque no ha sido utilizado demasiado en el proceso de acceso a la
informacin, pero puede ser una direccin interesante para familiarizar al usuario con estrategias de
bsqueda en grandes sistemas de hipervnculos.
10.4.4 Seleccin automtica de fuentes
Las interfaces que ayudan al usuario a elegir las fuentes de informacin ms apropiadas son una
amplia rea de investigacin. Requiere extraer la necesidad de informacin de los usuarios y
comprender cuales necesidades pueden ser satisfechas por cules fuentes. Un ambicioso proyecto es
construir un modelo de la fuente y de la necesidad de iinformacin del usuario y tratar de
determinar cmo se corresponden mejor. Esto se intenta con el uso de sistemas de modelado
(modelling systems) y sistemas de tutoreo inteligente, aplicado a dominios generales [204,814] y a
sistemas de ayuda en lnea [378].
Una alternativa simple es crear una representacin del contenido de las fuentes de informacin y
corresponder esta representacin contra la especificacin de la consulta. Esta aproximacin es la
que se utiliza en GIOSS, un sistema que intenta determinar la mejor base de datos bibliogrfica para
enviar un pedido de bsqueda, basada en los trminos de la consulta [765]. El sistema usa un
anlisis simple de las frecuencias combinadas de las palabras de la consulta en las colecciones
disponibles. El sistema SavySearch [383]lleva esta idea un paso ms all, usando acciones que
realizan los usuarios despus de una consulta para decidir cmo incrementar o disminuir el ranking
de un motor de bsqueda para una consulta en particular (ver tambin Captulo 13).
Otra posibilidad para la seleccin automtica de fuentes es enviar una consulta a mltiples fuentes y
combinar los resultados de alguna manera. Esto es lo que realizan muchos metabuscadores en la
Web. Un rea activa de investigacin actual es cmo combinar los resultados de forma efectiva, y se
conoce en algunos casos como fusin de la coleccin [63,767,388].
10.5

La especificacin de la consulta

19

Para formular una consulta el usuario debe seleccionar una coleccin, metadatos o conjuntos de
informacin, contra los que debe ser equiparada la consulta. Y debe especificar palabras, frases,
descriptores u otra clase de informacin que pueda ser comparada con la informacin en las
colecciones. Como resultado, el sistema crea un conjunto de documentos, metadatos u otro tipo de
informacin que se corresponden con la especificacin de la consulta en alguna forma y muestra los
resultados al usuario.
Shneiderman [725] identifica cinco estilos primarios de interaccin hombre computadora. Son:
lenguaje de comandos, llenado de formularios, seleccin de menes, manipulacin directa y
lenguaje natural. (Esta lista omite modalidades no visuales como el audio). Cada tcnica ha sido
usada en la especificacin de interfaces y tienen ventajas y desventajas, que se describen ms
adelante en el contexto del la especificacin de las consultas booleanas.
10.5 1

Bsquedas booleanas

En los sistemas modernos de acceso a la informacin el proceso de correspondencia generalmente


emplea un algoritmo de ranking estadstico. Sin embargo, hasta los ms recientes sistemas
comerciales de texto completo y la mayora de los sistemas bibliogrficos soportan solamente
consultas booleanas. Por lo tanto, el foco de muchos estudios de acceso a la informacin se refieren
a los problemas que tienen los usuarios para especificar las consultas booleanas.
Desafortunadamente, los estudios han mostrado que los usuarios tienen enormes dificultades para
especificar este tipo de bsquedas y que generalmente tienen expectativas incorrectas acerca de los
resultados [111,322,841].
Las bsquedas booleanas son problemticas por varias razones. Una de ellas es que la mayora de
las personas encuentran la sintaxis bsica poco intuitiva. Las personas de habla inglesa suponen que
la semntica cotidiana est asociada con los operadores booleanos AND y OR. Para usuarios
inexpertos, usar el AND implica ampliar el alcance de una consulta, porque se estn pidiendo varias
clases de informacin. Por ejemplo perros y gatos puede ser interpretado como un pedido de
documentos acerca de perros y de documentos acerca de gatos, ms que documentos acerca de los
dos tpicos a la vez, que es lo que corresponde al operador AND. T o caf puede implicar una
eleccin mutuamente excluyente en el lenguaje cotidiano. Y no es as en el operador lgico OR.
Esta clase de problemas conceptuales est bien documentada [111,322,558,841]. Adems, la
mayora de los lenguajes de consulta que incorporan operadores booleanos tambin requieren el uso
de sintaxis compleja para otra clase de conectores y para metadatos descriptivos. La mayora de los
usuarios no estn familiarizados con el uso de parntesis ni con las nociones de la precedencia de
operadores.
Para servir a una audiencia masiva que posee poca experiencia de especificacin de consultas, los
diseadores de los motores de bsqueda de la Web han tenido en cuenta aproximaciones ms
intuitivas para la especificacin de las consultas. Ms que forzar a los usuarios a especificar
combinaciones complejas de ANDs y Ors, permiten la selccin de maneras simples de combinar
trminos de consulta, incluyendo expresiones como todas las palabras (lo que ubica todos los
trminos en una conjuncin, AND) y cualquiera de las palabras (lo que las ubica en una
disyuncin, OR).
Otra solucin basada en la Web es permitir especificacin de consultas basadas en la sintaxis para
proveer una sintaxis ms simple o intuitiva. El prefijo / operador + gan un uso muy amplio como
especificador de la obligatoriedad de una palabra en el motor de Altavista. Desafortunadamente, los
usuarios pueden pensar errneamente que funciona como el operador AND y entonces suponer que

20

gatos + perros recuperar solamente los artculos que contienen ambos trminos, cuando en
realidad la consulta requiere perro y deja a gato como opcional.
Otro problema con los sistemas puramente booleanos es que no rankean los documentos
recuperados de acuerdo con su grado de correspondencia con la consulta. En un marco booleano un
documento satisface o no satisface la consulta. Los sistemas comerciales realizan un orden con los
documentos de acuerdo con algn tipo de metadato, por ejemplo, el orden cronolgico. Los
sistemas basados en la Web generalmente ordenan los resultado de las consultas booleanas
utilizando algoritmos estadsticas y heurstica especfica de la Web.
10.5.2

Desde las lneas de comandos a los formularios y los menes

Junto con las confusiones acerca del significado lgico del AND y del OR, otra parte del problema
con la especificacin de las consultas en sistemas booleanos bibliogrficos es la arbirtrariedad de la
sintaxis y la falta de contexto de las interfaces. Tpicamente, debe tipearse algo como lo siguiente:
COMANDO ATRIBUTO valor { OPERADOR BOOLEANO ATRIBUTO valor}*
Ejemplos:
FIND PA darwin AND TW species OR TW descent
(ENCUENTRE en autor el valor darwin AND en el ttulo el valor especies OR en el ttulo el valor
descendencia)
FIND TW Mt St. Helens AND DATE 1981
(ENCUENTRE en el ttulo el valor Mt St. Helens AND en fecha el valor 1981)
(estos ejemplos fueron extrados de la sintaxis de la interfaz telnet del sistema Melvyl de la
Universidad de California [526]). El usuario debe recordar los comandos y los nombres de los
atributos, que son fcilmente olvidables entre usos del sistema. Y este problema se hace ms grave
porque comandos y nombres de atributos cambian entre diferentes sistemas.
La nueva versin Web del sistema Melvyl provee formularios y menes de modo que el usuario ya
no tiene que recordar los nombres y tipos de atributos disponibles (http://www.melvyl.ucop.edu/).
Los usuarios seleccionan tipos de metadatos de listas y se muestran de modo explcito los atributos,
permitiendo su seleccin como una alternativa de especificacin. Por ejemplo, el campo tipo de
bsqueda se encuentra junto a un formulario de entrada en el cual los usuarios pueden ingresar
palabras clave y la eleccin entre los operadores AND y NOT se encuentra junto a la lista de tipos
de documentos disponibles. Slo los metadatos asociados a una coleccin en particular se muestran
en el contexto de esa bsqueda. Desafortunadamente, el sistema puede hacer bsquedas en una base
de datos por vez. Sin embargo, provee una facilidad para aplicar una bsqueda ejecutada
previamente a una nueva base de datos. Ver Figura 10.9.
Este sistema tambin permite la retencin del contexto entre bsquedas, almacenando los resultados
anteriores en tablas y realizando hipervnculos de estos resultados con las listas que contienen la
informacin bibliogrfica recuperada. Los usuarios pueden modificar cualquiera de las consultas
anteriores marcando un cuadro que se encuentra junto al registro de la consulta. La visualizacin
grfica hace explcitas e inmediatas muchas de las opciones del sistema que seran difciles de
retener en la versin con comandos.

21

Estas visualizaciones son una mejora sobre las interfaces de comandos, pero no resuelven todos los
problemas. Por ejemplo, un formulario en blanco no es mucho mejor porque no provee al usuario
con ayudas sobre que clase de trminos podra ingresar.

Figura 10.9

10.5.3

Vista de una especificacin de consulta en la versin Web del catlogo bibliogrfico


Melvyl.

Consultas facetadas

Otro problema con las consultas booleanas es que tienden a dar resultados o demasiados grandes
(porque los usuarios incluyen muchos trminos en una disjuncin, o vacos (porque los usuarios
utilizan muchos trminos en interseccin). Este problemas sucede porque no se conocen los
contenidos de la coleccin o el rol de los trminos en esa coleccin.
Una estrategia comn para enfrentar este problema, empleado en sistemas con interfaces de
comandos como DIALOG, es hacer una serie de consultas cortas, ver el nmero de documentos que
se recupera en cada una de ellas, y combinar esas consultas, lo que produce un nmero razonable de
resultados. Por ejemplo, en DIALOG cada consulta produce un conjunto de documentos que se
identifica por un nmero. Antes que ver los ttulos mismos, DIALOG muestra cada nmero de
conjunto con la cantidad de documentos resultantes en cada uno. Luego pueden verse los ttulos de
los documentos solicitndolos con el nmero de conjunto. A su vez, la combinacin entre conjuntos
tambin puede hacerse utilizando ese nmero de conjunto.
Este tipo de formulacin de consultas se denomina consulta facetada, para indicar que la consulta
se divide en tpicos o facetas [553,348]. Por ejemplo, una consulta sobre drogas para la prevencin
de la osteoporosis puede consistir en tres facetas:
(osteoporosis OR prdida sea)
(drogas OR productos farmacolgicos)
(prevencin OR cura)
En este caso el usuario quiere encontrar documentos que contengan a la vez los tres tpicos, con lo
que se uniran en AND.
Una tcnica para dar un orden a los resultados de consultas booleanas es lo que se llama ranking
post-coordinado o nivel de quorum [700]. Segn este enfoque los documentos se rankean de

22

acuerdo con el subconjunto de trminos de consulta que contienen. Dada una consulta sobre
gatos, perros, peces y ratones, el sistema debera rankear primero un documento con al
menos una ocurrencia de perros, gatos y peces, antes que un documento que contenga 30
ocurrencias de gatos y ninguna de los otros trminos.
Una combinacin de las consultas facetadas y el ranking de quorum podra mostrar una lista de
lneas de entrada. Los usuarios entran un tpico por lnea, en el que se escriben una lista de trminos
relacionados semnticamente, que tienen valor equivalente y que son combinado en una disjuncin
(OR). Como resultado, los documentos que contienen por lo menos un trmino de cada faceta son
rankeados antes que los documentos que contienen slo trminos de una de las facetas.
Esta idea puede ser extendida un poco ms all, permitiendo a los usuarios asignarle un peso a cada
faceta, o asignndolo por defecto: la faceta que el usuario list primero tendr el peso ms alto, la
segunda menos peso y as sucesivamente.
10.5.4 Aproximaciones grficas para la especificacin de las consultas
Las interfaces de manipulacin directa constituyen una alternativa a la sintaxis de comando. Las
propiedades de la manipulacin directa son [725]: 1) representacin continua del objeto de inters;
2) acciones fsicas o presin de botones en lugar de una sintaxis compleja; 3) operaciones
incrementales, rpidas y reversibles cuyo impacto sobre el objeto de inters se ve inmediatamente.
Estas interfaces generalmente provocan el entusiasmo de los usuarios y por esta razn vale explorar
su utilizacin. A pesar de que tienen inconvenientes, son ms fciles de usar que otros mtodos, en
muchos contextos.

23

Figura 10.10

Sistema VQuery para visualizacin de Diagramas de Venn, y especificacin de


consultas booleanas

Para simplificar la especificacin de la sintaxis booleana se han desarrollado muchas variaciones de


interfaces grficas, estticas o directamente manipulables. Los estudios de usuarios han revelado
que estas interfaces son ms efectivas que las de comandos. Ejemplos son el Sistema VQuery para
visualizacin de Diagramas de Venn, y especificacin de consultas booleanas, por el que aparecen
crculos representando a cada trmino de bsqueda y la interseccin de crculos indica el operador
AND con los trminos. Este sistema tiene el inconveniente de que es limitado en la complejidad de
la consulta. (Figura 10.10).
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.5.5

Frases y proximidad

En general la proximidad de la informacin puede ser bastante efectiva para mejorar la precisin de
las bsquedas. En la Web, la diferencia entre una consulta de palabra nica y otra de una frase
exacta de dos palabras puede significar la diferencia entre una cantidad inmanejable de documentos
y una lista corta de documentos relevantes.

24

Se han desarrollado un gran nmero de mtodos para especificar frases. En la sintaxis del sistema
LEXIS/NEXIS, para indicar la proximidad entre dos trminos se requiere indicar el rango de
proximidad con un operador en el medio. Por ejemplo, casa w/3 blanca significa: casa y blanca
con tres palabras en el medio, con independencia de su orden. La proximidad exacta de frases se
especifica escribiendo una palabra junto a la otra, separadas de un espacio. Un mtodo comn en
algunos motores de bsqueda de la Web para este mismo propsito es encerrar las palabras entre
comillas.
La desventaja de estos mtodos que requieren la correspondencia exacta de la frase, es que puede
ser comn el caso de que entre las palabras buscadas puede haber otras, aunque sean pocas. Por
ejemplo, en la mayora de los casos el usuario quiera presidente y Lincoln como palabras
adyacentes, pero tambin quiere recuperar Presidente Abraham Lincoln. Otro aspecto a
considerar es si el sistema utiliza algn tipo de stemming para los trminos incluidos en la frase. La
mejor solucin es permitir al usuario que especifique una frase exacta, pero tratarla como si hubiera
solicitado esas palabras con un pequeo rango de proximidad [174]. Tambin se ha demostrado que
una combinacin de ranking de quorum de consultas facetadas, con la restriccin de que las facetas
aparezcan en un pequeo rango de proximidad, puede mejorar en mucho la precisin de los
resultados [356,566].
10.5.6 Lenguaje Natural y Consultas en Texto Libre
Los algoritmos de ranking estadstico tienen la ventaja de permitir a los usuarios la especificacin
de consultas de un modo natural, sin tener que pensar acerca de operadores booleanos u otros
operadores. Pero tienen el inconveniente de brindar al usuario menos retroalimentacin y control
acerca de los resultados. Generalmente el resultado de un ranking estadstico es la lista de
documentos asociados a un puntaje, probabilidad o porcentaje al lado de cada ttulo. A los usuarios
se les da poca informacin acerca de cul es la razn del ranking y que rol juegan los trminos de
consulta en el ranking.
Una estrategia de bsqueda que puede ayudar con este particular problema es la especificacin de la
mandatoriedad de algunos trminos de la consulta en lenguaje natural. Esto permite al usuario
controlar que trminos son considerados importantes, ms que delegar en el algoritmo de ranking la
ponderacin de los trminos. Pero para especificar esta caracterstica para los trminos de bsqueda
es necesario conocer el modo de uso de comandos particulares.
La discusin anterior supone que una consulta en lenguaje natural escrita por el usuario es tratada
como una bolsa de palabras, con las palabras vacas removidas con el propsito de buscar la
correspondencia con los documentos. Sin embargo, algunos sistemas intentan analizar
sintcticamente las consultas en lenguaje natural para extraer conceptos y hacerlos corresponder con
los conceptos en la coleccin de textos. [399,552,748].
De modo alternativo, puede usarse la sintaxis de una pregunta en lenguaje natural para intentar
responder a la pregunta. Un ejemplo es el sistema Murax [463] determina a partir de la sintaxis de
una pregunta si el usuario est preguntando por una persona, lugar o fecha. Luego intenta encontrar
oraciones en artculos de una enciclopedia, que contengan las frases nominales que aparecen en la
pregunta. Esto se realiza ya que es probable que esas oraciones contengan la respuesta a la pregunta.
Por ejemplo, hecha la pregunta Quin fue el ganador novelista del Premio Pulitzer, que se postul
como alcalde de la Ciudad de Nueva York?, el sistema extrae las frases nominales: Premio
Pulitzer, novelista ganador, Alcalde, Ciudad de Nueva York. Luego busca nombres propios
que representen a personas (Ya que Quin indica a una persona), y encuentra, entre otras, las
siguientes oraciones:
25

Los ejrcitos de la noche (1968), narracin personal sobre la marcha de la paz en el


Pentgono, en 1967, Mailer gan el Premio Pulitzer y el Premio Nacional del Libro.
En 1969 Mailer se postul sin xito como candidato independiente como alcalde de la
Ciudad de Nueva York.
Estas dos oraciones vinculan y renen las frases nominales relevantes, y el sistema deduce del ttulo
del artculo que contiene las dos oraciones, que Norman Mailer es la respuesta.
Otra aproximacin a la respuesta automtica de preguntas es el sistema que encuentra FAQ
(Frequently Asked Questions), buscando la correspondencia de preguntas en varios tpicos [130].
El sistema utiliza una bsqueda standard para encontrar archivos FAQ para las preguntas realizadas.
Un enfoque menos automtico para responder a preguntas puede ser encontrado en al sistema
AskJeeves [34]. Este sistema hace uso de sitios Web y los hace corresponder con un conjunto
predefinido de tipos de preguntas. La consulta del usuario es primero equiparada respecto de los
tipos de preguntas. El usuario selecciona la frase ms apropiada que se ajuste a su pregunta esta
nueva frase el linkeada para sugerir sitios Web. Por ejemplo, la pregunta Quin es el lder en
Sudan? se mapea con el tipo de pregunta Quin es el jefe del Estado de X?, donde la variable es
reemplazada, a travs de una lista de elecciones posibles, por Sudan en este caso. Esto es linkeado a
una pgina Web que tiene los actuales jefes de Estado. La pregunta tambin se enva a motores de
bsqueda estndar.
10.6

Contexto

Esta seccin presenta las tcnicas de algunas interfaces para ubicar un conjunto corriente de
documentos en el contexto de otro tipo de informacin, con el objetivo de hacerlo ms
comprensible. Estas tcnicas incluyen la muestra de relaciones entre los documentos y los trminos
de consulta, vistas generales de la coleccin, metadatos descriptivos, estructura de hipervnculos,
estructura de los documentos, y otros documentos en el conjunto.
10.6.1

Sustitutos de los documentos

La forma ms comn de mostrar los resultados de una consulta es listar informacin acerca de los
documentos en un orden de relevancia en relacin con la consulta. Alternativamente, en un ranking
puro booleano, los documentos se listan de acuerdo con atributos de metadatos, como or ejemplo, la
fecha. Tpicamente, una lista de documentos consiste en los ttulos de los documentos y un
subconjunto de metadatos importantes como la fecha, fuente y largo del artculo. En un sistema con
ranking estadstico, puede mostrarse un puntaje o porcentaje junto al ttulo, que indica un grado de
correspondencia o probabilidad de relevancia. Esta clase de informacin es llamada sustituto del
documento. Ver Figura 10.14 [824].
Algunos sistemas permiten al usuario la eleccin entre una visualizacin breve y otra detallada de
los documentos. La vista detallada contiene generalmente un sumario o resumen. En los sistemas
bibliogrficos, se ve el autor o el servicio de resmenes. Los motores de bsqueda de la Web
generan extractos automticos, a partir de las primeras lneas del texto en la pgina Web.
En muchas interfaces, clikear el ttulo del documento o su representacin en un icono, produce una
vista del documento mismo, ya sea en una nueva ventana o en reemplazo de la lista de resultados.

26

(En los sistemas bibliogrficos tradicionales, el texto completo no se encontraba disponible en lnea
y slo poda verse el registro bibliogrfico).

Figura 10.14

10.6.2

Un ejemplo de una lista rankeada de ttulos y otros sustitutos de documentos [824]

Aciertos de los trminos de la consulta, dentro del contenido del documento

En los sistemas en los que el usuario puede ver el texto completo de un documento recuperado, es
til resaltar las apariciones de los trminos o descriptores que se corresponden con aqullos que se
utilizaron en la consulta. Esto se realiza a travs de la utilizacin de otro color para destacar esas
palabras y tiene por finalidad ayudar al usuario a ubicar las partes del texto ms relevantes para su
consulta. [481,542, 52].
KWIC
Una facilidad relacionada con el resaltar son los sustitutos de documentos del tipo palabras clave en
contexto (keyword-in-context, KWIC). Se extraen del texto del documento fragmentos de
oraciones, oraciones completas, o grupos de oraciones que contienen los trminos de consulta, que
se presentan junto con otras partes de los sustitutos de los documentos como el ttulo o el resumen.
Debe notarse que una lista KWIC es diferente de un resumen. Un resumen sumariza los principales
temas del documento pero puede no contener referencias a los trminos de la consulta. Un extracto
KWIC muestra las oraciones que sumarizan las formas en que los trminos de bsqueda son
utilizados en el documento. Esta muestra puede mostrar no slo qu subconjuntos de los trminos
de consulta aparecen en los documentos recuperados, sino tambin el contexto en el que aparecen.
Al respecto deben tomarse decisiones sobre cuntas y cules lneas de texto deben mostrarse.
Algunos estudios han mostrado que los mejores fragmentos a mostrar son los primeros bajo el ttulo
inicial y aqullos que contienen el mayor conjunto de trminos de bsqueda [464]. Si los usuarios
han especificado cules trminos son ms importantes respecto de otros, entonces los fragmentos

27

que contengan trminos importantes deberan ser mostrados antes que los que contienen los menos
importantes. Sin embargo, con el fin de mantener la coherencia de los extractos, las oraciones
seleccionadas deberan mostrarse en el orden original del documento que los contiene.
La facilidad de tipo KWIC no suele utilizarse en la muestra de resultados en la Web, lo ms
probablemente porque para ello el sistema debe tener una copia del documento original de la cual
extraer las oraciones que contienen los trminos de bsqueda. Los motores de bsqueda Web en
general slo retienen los ndices sin la informacin de la posicin de los trminos.
TileBars (Barras de baldosas)
En estas interfaces los usuarios ingresan una consulta en formato facetado, un tpico por lnea.
Despus que el sistema recupera documentos (utilizando un algoritmo de ranking estadstico o por
quorum), se muestra un grfico de barras por cada ttulo de documento recuperado, en el que puede
verse el grado de correspondencia para cada faceta. Las Tile Bars ilustran en un vistazo qu pasajes
de cada artculo contienen qu tpicos y la frecuencia con que es mencionado ese tpico (los
cuadrados ms oscuros representan una correspondencia ms frecuente).
Cada documento se representa por una barra rectangular. La Figura 10.15 muestra un ejemplo. La
barra se subdivide en filas que se corresponden con la facetas de la consulta. En el ejemplo, la fila
superior de cada TileBar corresponde a osteoporosis, la segunda fila a prevencin y la tercera a
investigacin. La barra tambin se subdivide en columnas, y cada columna representa un pasaje
del documento. Los aciertos que se superponen en la misma pgina probablemente indican un
documento relevante, ms que los aciertos dispersos a travs del documento [356].
La oscuridad de cada cuadrado corresponde al nmero de veces que los trminos de la consulta
aparecen en ese segmento del texto, por lo que cuanto ms oscuro es un cuadrado, indica que tiene
mayor nmero de aciertos.

Figura 10.15

Ejemplo de visualizacin de resultados recuperados en una interfaz TileBar

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.3

Aciertos de los trminos de la consulta, entre los documentos

28

Se han desarrollado otras ideas de visualizacin para mostrar informacin de tipo diferente acerca
de las relaciones entre los trminos de consulta y los documentos recuperados. Ms que mostrar
cmo aparecen los trminos de bsqueda en los documentos individuales (como lo hacen las
interfaces KWIC y la TileBars), estos sistemas muestran una vista general o sumario de los
documentos recuperados de acuerdo con los diferentes subconjuntos de trminos de bsqueda que
contienen. Las siguientes subsecciones describen variaciones de esta idea.

Figura 10.17

Muestra de resultados en el sistema InfoCrystal

InfoCrystal
El sistema InfoCrystal muestra cuntos documentos contiene cada subconjunto de trminos de
consulta [738]. Esto libera al usuario de la necesidad de especificar los operadores AND y NOT, ya
que muestra las posibles combinaciones entre los trminos que aparecen en los documentos. El
sistema InfoCrystal permite la visualizacin de todas las posibles relaciones entre N conceptos
especificados por el usuario (aunque una indicacin de ms de cuatro trminos de bsqueda produce
un resultado grfico difcil de comprender). En una extensin del paradigma de los diagramas de
Venn, este sistema muestra el nmero de documentos recuperados que tienen cada posible
subconjunto de los N conceptos. La Figura 10.17 muestra los resultados de una consulta de cuatro
trminos llamados A, B, C, y D. El diamante central indica que slo un documento contiene los
cuatro trminos de bsqueda. El tringulo marcado con 12 indica que se encontraron 12
documentos que contienen los atributos A, B y D, etc.

29

Figura 10.18

Ejemplo de la visualizacin de resultados en VIBE

VIBE y Lyberworld
VIBE [452] y Lyberworld [363] son presentaciones grficas que operan sobre principios similares.
En ellos los trminos de consulta se ubican en un espacio grfico abstracto. Despus de la bsqueda,
se crean iconos que indican cuntos documentos contiene cada subconjunto de trminos de
consulta. El estado del subconjunto de cada grupo de documentos se indica a travs de la ubicacin
del icono. Por ejemplo, en el sistema VIBE un conjunto de documentos que contiene tres de los
cinco trminos de bsqueda se muestra en un eje que conecta esos tres trminos, en un punto a
mitad de camino entre las representaciones de los tres trminos en cuestin (Ver Figura 10.18).
Lyberworld presenta esta idea en tres dimensiones.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.4

Superbook: Contexto va Tabla de Contenidos

El sistema Superbook [481, 229, 230] utiliza la estructura de un gran documento para mostrar los
aciertos de trminos de bsqueda en su contexto. Para un libro o un manual, se muestra la Tabla de
Contenido en la parte izquierda de la pantalla, y a la derecha se ve el texto completo de la pgina o
seccin. El usuario puede manipular la tabla de contenido para expandir o contraer la vista de las
secciones y subsecciones. Se utiliza un mecanismo foco-ms-contexto para expandir el rea de las
secciones que se estn viendo y comprimir las anteriores.

30

Figura 10.19

La interfaz SuperBook para mostrar los resultados en un manual en contexto

Despus de que el usuario especifica una consulta en el libro, se muestran los resultados en el
contexto de la jerarqua de la Tabla de Contenidos. (Ver Figura 10.19). Las secciones que contienen
aciertos se agrandan y las dems se achican. Los trminos de bsqueda que aparecen en los ttulos
de captulos o secciones se resaltan. Cuando el usuario selecciona una pgina desde la Tabla de
contenido, aparece la pgina misma en la parte derecha de la pantalla, con los trminos de consulta
resaltados.
10.6.5

Categoras para dar contexto al conjunto de resultados

En la seccin 10.4 vimos el uso de categoras o directorios para proveer vistas generales del
contenido de la coleccin de textos. Tambin pueden utilizarse metadatos referidos a categoras para
ubicar los resultados de una consulta en contexto.
Por ejemplo, en su versin original el SuperBook permita la navegacin en un documento
altamente estructurado, como un manual. El proyecto CORE extendi esta idea principal a una
coleccin de 1000 artculos a texto completo sobre qumica. Un estudio demostr su superioridad
respecto de un sistema de bsqueda estndar, en varios tipos de tareas [228]. Como no hay
disponible una tabla de contenidos para toda la coleccin, el contexto se logra ubicando a los
documentos en una jerarqua de categoras que contiene los trminos relevantes de la qumica.
Cuando se selecciona una categora, se listan los documentos asignados a la misma, para ver
mayores detalles. Todas las categoras se organizan en una jerarqua, proveyendo una vista
jerrquica de la coleccin.
Otro proyecto que usa categoras predefinidas para dar contexto a los resultados es el sistema
DynaCat [650]. Este sistema organiza los documentos recuperados de acuerdo con tipos de
categoras, seleccionadas de la taxonoma MESH. DynaCats comienza con un conjunto de tipos de
consultas que se conocen como tiles una poblacin de usuarios y una coleccin dada. Un tipo de
consulta puede comprender a varias consultas. Por ejemplo, el tipo de consulta Efectos adversos
del tratamiento cubre consultas como Cules son las complicaciones de una mastectoma?, o
Cules son los efectos colaterales de la aspirina?. Los documentos estn organizados de acuerdo
con un conjunto de criterios asociados con cada tipo de consulta. Estos criterios especifican qu

31

tipos de categoras son aceptables para organizar los documentos y cules deben ser omitidas de la
visualizacin. Una vez que las categoras han sido asignadas a los documentos recuperados, se
forma una jerarqua basada en el lugar que las categoras tienen en el MeSH.

Figura 10.20

La interfaz DynaCat para visualizar categoras que se corresponden con los tipos de
consultas

La Figura 10.20 muestra los resultados de una consulta sobre prevencin del cncer de mama. La
interfaz se distribuye en tres ventanas. La ventana superior muestra la consulta del usuario y el
nmero de documentos encontrados. La ventana de la izquierda muestra los dos primeros niveles de
las categoras, proveyendo una vista organizada de los resultados. La ventana derecha muestra todas
las categoras de la jerarqua y los ttulos de los documentos que pertenecen a esas categoras.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.6

Uso de hipervnculos para organizar resultados de la recuperacin

A pesar de que los autores del SuperBook lo describen como un sistema de hipertexto, es mejor
pensar en l como un medio de mostrar los resultados de una bsqueda en el contexto de una
estructura que los usuarios pueden ver y comprender de una vez. El componente hipertextual no es
mencionado como la parte ms exitosa de su diseo. De hecho, parece ser la causa de uno de los
principales problemas de la versin revisada del sistema: los usuarios tienden a extraviarse de las
pginas que estn leyendo, lo que causa una prdida de tiempo.
Esta especie de extravo puede ocurrir en parte porque SuperBook usa una clase de hipertexto no
estndar, en el cual cualquier palabra es vinculada automticamente a las ocurrencias de la misma
palabra en otras partes del documento. Hoy, los sistemas de hipervnculos y el hipertexto en la Web
discriminan mucho ms el uso de las conexiones de hipervnculos (en parte porque son generadas
por autores ms que automticamente). En un estudio se mostr que los usuarios forman mejores
modelos mentales en un sistema de hipertexto pequeo organizado jerrquicamente, que en sistemas

32

que permiten un acceso ms flexible [226]. Se han investigado abundantemente los problemas
relacionados con la navegacin en hipertexto [181, 551, 440, 334].
Ms recientemente se ha utilizado informacin hipertextual para dar contexto a los resultados de las
bsquedas. A continuacin se describen algunos de estos trabajos.
Cha-Cha: SuperBook en la Web
El sistema de bsqueda intranet Cha-Cha [164] extiende la idea de SuperBook a una gran y
heterogneo sitio Web. La Figura 10.21 muestra un ejemplo. Este sistema difiere del SuperBook en
varios aspectos. En la mayora de los sitios Web no existe una verdadera tabla de contenidos o
estructura de categoras, y una intranet como las que podemos encontrar en grandes universidades o
corporaciones generalmente no estn organizadas por una unidad central. El Cha-Cha utiliza la
estructura de vnculos presente en el sitio para crear lo que se intenta como una organizacin
significativa sobre el caos subyacente. Despus que el usuario ha ingresado una consulta, se
registran los caminos ms cortos desde la pgina raz a cada uno de los aciertos de bsqueda. Se
selecciona un subconjunto de estos atajos para mostrarlos como una jerarqua, de modo que cada
acierto se muestra una sola vez. Si el usuario utiliza el trmino centro mdico en lugar de centro
de salud, y mdico aparece como trmino en un documento en la pgina Web del centro de
salud, aparecer la home page de este centro, as como aciertos ms especficos. La organizacin
que produce este mtodo es sorprendentemente comprensible en el sitio de la UC Berkeley.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.21

La interfaz Cha-Cha mostrando los resultados de una bsqueda intranet, ante la


consulta por medical center [164

Mapuccino: Presentacin grfica de una estructura de vnculos


El sistema Mappucino (anteriormente WebCutter) [527] permite pedir una consulta sobre un
particular sitio Web. El sistema recorre el sitio en tiempo real, chequeando cada pgina encontrada
para verificar su relevancia con la consulta. El subconjunto del sistio Web que ha sido recorrido se
presenta grficamente en una vista de nodos y links (ver Figura 10.22). Este tipo de vista no provee
al usuario informacin acerca del contenido de las pginas, pero muestra su estructura de vnculos.

33

Figura 10.22

10.6.7

Ejemplo de un subconjunto Web visualizado por el sistema Mapuccino

Tablas

La visualizacin tabular es otra forma de mostrar las relaciones entre los documentos recuperados.
un ejemplo de este enfoque es el sistema Envision [273]: permite al usuario organizar los
resultados de acuerdo con algunos metadatos como autor o fecha, y utiliza grficos para mostrar en
cada celda los valores de los atributos asociados con los documentos (ver Figura 10.23). El color, la
forma y el tamao de los iconos se utilizan para mostrar el grado de relevancia, el tipo de
documento y otros atributos.

34

Figura 10.23

10.7

La visualizacin tabular Envision para organizar grficamente documentos


recuperados [270]

Utilizacin de Juicios de Relevancia

Una parte importante del proceso de acceso a la informacin es la reformulacin de las consultas, y
una tcnica efectiva para esta reformulacin es la retroalimentacin por relevancia. En su forma
original, la retroalimentacin por relevancia se refiere al ciclo de interaccin en el que el usuario
selecciona un pequeo conjunto de documentos que aparece como relevante para una consulta, y el
sistema entonces utiliza caractersticas derivadas de esos documentos relevantes seleccionados para
revisar la consulta original. Esta consulta revisada se ejecuta y se recupera un nuevo conjunto de
documentos. Los documentos del conjunto original pueden aparecer en los nuevos resultados,
aunque probablemente en otro orden de ranking. La retroalimentacin por relevancia en su forma
original ha sido mostrado como efectivo mecanismo para mejorar los resultados en muchos estudios
[702, 343, 127].
La retroalimentacin por relevancia plantea decisiones de diseo importantes, incluyendo cules
operaciones deben ser realizadas automticamente por el sistema y cules por el usuario. Bates
discute ese punto en detalle [66], afirmando que a pesar del nfasis de los sistemas modernos en
tratar de automatizar el proceso completo, es preferible un enfoque intermedio en el que el sistema
ayuda a automatizar la bsqueda a un nivel estratgico. Bates sugiere una analoga con las cmaras
fotogrficas automticas versus las manuales. En algunas ocasiones es apropiado un mtodo rpido

35

que requiere poco entrenamiento. En otras ocasiones, el usuario requiere tener ms control sobre la
mquina.
10.7.1

Interfaces estndar para retroalimentacin por relevancia

Una interfaz estndar para retroalimentacin por relevancia consiste en una lista de ttulos con un
lugar junto a cada titulo para que el usuario pueda marcar los documentos relevantes. Dependiendo
del sistema los documentos no marcados pueden entenderse como no relevantes o como que no se
ha emitido opinin sobre ellos. Otra opcin es proveer la eleccin entre opciones: relevante o no
relevante. En algunos casos los usuarios pueden indicar un valor en una escala de relevancia [73].
Despus de que el usuario ha realizado sus juicios de relevancia sobre un conjunto y emite una
nueva bsqueda el sistema puede revalorar automticamente la consulta y re-ejecutar la bsqueda, o
generar una lista de trminos para que el usuario seleccione y mejorar la consulta original. (Ver
Figura 10.25, en el original en ingls).
Despus de que la consulta es re-ejecutada, se muestra una nueva lista de ttulos. Puede ser til
retener las marcas en los documentos que el usuario ya juzg. Una difcil decisin de diseo
consiste en si deben mostrarse o no los documentos que el usuario ya revis, al principio de la lista.
Mostrar repetidamente el mismo conjunto de documentos al principio puede molestar al usuario que
est intentando crear un conjunto mayor de documentos relevantes. Pero, al mismo tiempo, esto
puede servir como retroalimentacin indicando que la consulta revisada no baja de categora a estos
documentos que ya han sido encontrados especialmente relevantes. Una solucin es mantener una
ventana separada que muestra los rankings de aquellos documentos que no han sido recuperados o
rankeados previamente. Otra solucin es utilizar letras ms pequeas o de otro color para los ttulos
de los documentos que ya fueron vistos.
Los motores de bsqueda en la Web han adoptado la terminologa more like this (ms
documentos como stos), como forma simple de indicar que el usuario est solicitando documentos
similares a uno que ha seleccionado. Esta interaccin de un click es ms simple que el dilogo
estndar de retroalimentacin por relevancia, que requiere que el usuario evale y marque un
pequeo conjunto de documentos y que luego vuelva a pedir un ranking. Desafortunadamente, en la
mayora de los casos se requieren muchos juicios de relevancia para que la retroalimentacin por
relevancia funcione bien. Aalbersberg propone un retroalimentacin por relevancia incremental que
trabaja con slo un documento relevante por vez.
10.7.2

Estudios de Interaccin de Usuario, en los sistemas con retroalimentacin por


relevancia

La retroalimentacin por relevancia estndar supone que el usuario se involucra en la interaccin


especificando los documentos relevantes. En algunas interfaces los usuarios tambin pueden
seleccionar trminos para agregar a la consulta. Sin embargo, esto complica la revaloracin y el reranking de los documentos.
Un estudio reciente estudia en qu medida es beneficioso que el usuario controle el proceso de
retroalimentacin. Koneman y Belkin [448] testearon cuatro casos diferentes enel proceso de
retroalimentacin por relevancia [772]:
Control: No hay retroalimentacin por relevancia; las personas slo podan reformular la bsqueda
por s mismos.

36

Opaco: Las personas simplemente seleccionan documentos relevantes y luego ven los rankings
revisados.
Transparente: Las personas podan ver cmo el sistema reformulaba las consultas (esto es, ver qu
trminos eran agregados) y los rankings revisados.
Penetrable: El sistema es detenido a mitad de camino en el proceso de re-ranking. Se muestra a las
personas los trminos que el sistema habra usado para la reformulacin opaca y la transparente. Las
personas entonces seleccionan cules trminos desean agregar a la bsqueda. Luego el sistema
presenta los rankings revisados.
Las 64 personas que participaron fueron mucho ms efectivas (midiendo la precisin en los
primeros 5, primeros 10, primeros 30 y primeros 100 documentos) con retroalimentacin por
relevancia que sin l. El grupo Penetrable logr resultados significativamente mejores que el de
Control, mientras que Opaco y Transparente se situaron en el medio. Los tiempos de bsqueda no
difirieron significativamente, pero s hubo diferencias en el nmero de iteraciones de la
retroalimentacin. Las personas del grupo Penetrable requirieron mucho menos iteraciones para
lograr mejores resultados (un promedio de 5.8 ciclos en el grupo Penetrable, 8.2 ciclos en el grupo
Control, 7.7 ciclos en el Opaco y sorprendentemente, el grupo Transparente requiri 8.8 ciclos de
promedio). El nmero promedio de documentos marcados como relevantes oscil entre 11 y 14 para
las tres condiciones. Todas las personas prefirieron la retroalimentacin por relevancia sobre los
sistemas que no lo tienen, y varios sealaron que preferan una aproximacin laxa en la que se les
sugiriera trminos, antes que pensarlos por s mismos.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.7.3

Extrayendo Informacin Relevante del Trasfondo

El retroalimentacin por relevancia estndar se propone para mejorar las consultas o construir un
perfil de los pasos en una consulta. Investigaciones recientes ha comenzado el desarrollo de
sistemas que monitorean los progresos y la conducta de los usuarios a lo largo de perodos de
interaccin con la intencin de predecir qu documentos o acciones probablemente querr el
usuario en el futuro. Estos sistemas se llaman asistentes semiautomticos o agentes, y a menudo
utilizan tcnicas de aprendizaje por mquina [565]. Algunos de estos sistemas requieren input
explcito del usuario en forma de declaracin de metas [406] o juicios de relevancia [629], mientras
que otros intentan hacer inferencias a partir de las acciones realizadas por los usuarios.
Un sistema desarrollado por Kozierok y Maes [460, 536] hace predicciones sobre cmo
manipularn los usuarios mensajes de correo electrnico (en qu orden los leern, dnde los
archivarn) y sobre cmo organizarn encuentros en un administrador de calendario. El sistema
registra en una base de datos lo que los usuarios van haciendo y considera relevante. Despus de
una acumulacin suficiente de datos, el sistema usa el mtodo del vecino ms prximo [743] para
predecir las acciones del usuario basndose en la similaridad de la situacin corriente con respecto a
situaciones anteriores. Por ejemplo, si el usuario casi siempre guarda los mensajes de una persona
en particular en un determinado archivo, el sistema ofrece automticamente repetir la accin frente
a la misma situacin [536]. El sistema integra el aprendizaje del retroalimentacin implcito y
explcito del usuario. Si el usuario ignora la sugerencia del sistema, el sistema trata esto como
retroalimentacin negativo y lo incorpora. Despus de algunas predicciones incorrectas el sistema
pregunta al usuario de modo de ajustar las predicciones. Finalmente, el usuario puede entrenar
explcitamente al sistema presentando ejemplos hipotticos de pares de acciones que podra realizar.
Otro sistema, Syskill y Webert [629] intenta aprender a utilizar perfiles de usuario basados en
juicios de relevancia explcitos sobre pginas exploradas mientras se realiza browsing en la Web. En
37

cierto sentido, esto se parece al retroalimentacin por relevancia estndar, excepto que los juicios
del usuario son retenidos a lo largo de las sesiones y tambin difiere el modelo de interaccin:
cuando el usuario revisa una nueva pgina Web los vnculos sobre la pgina son anotados
automticamente, sean o no sean relevantes para el inters del usuario.
Letizia [518] es un sistema relacionado, trae a la atencin del usuario un porcentaje de los prximos
movimientos disponibles que ms probablemente sean de su inters, dadas las acciones anteriores
del usuario. Bajo pedido, Letizia provee recomendaciones para acciones ulteriores por parte del
usuario, generalmente en forma de sugerencias de vnculos a seguir. El sistema monitorea el
comportamiento del usuario mientras navega y lee pginas Web, y en forma paralela evala los
vnculos alcanzables desde la pgina corriente. De ese modo, el grabar una pgina como favorito se
toma como una evidencia positiva en relacin con la pgina marcada, y los vnculos dejados de lado
se toma como acciones negativas para la informacin alcanzable a travs de esos vnculos. Los links
seleccionados pueden indicar evidencia positiva o negativa, dependiendo del tiempo que el usuario
utiliza en su revisin y si la decisin de dejar rpidamente una pgina no es revisada ms tarde.
Adicionalmente, la evidencia del inters del usuario debe persistir durante la sesin de browsing. El
sistema utiliza una estrategia de bsqueda y heurstica para determinar cules pginas recomendar.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.7.4

Juicios de relevancia grupal

En forma reciente se ha manifestado mucho inters en usar juicios de relevancia de un nmero


importante de diferentes usuarios para rankear informacin de inters general [672]. Algunas
variantes de este enfoque de recomendacin social utilizan la similaridad de juicios de relevancia
exclusivos de personas con similares intereses. Esto se ha encontrado como altamente efectivo para
evaluar informacin en la que el gusto juega un rol importante, tal como recomendaciones de
pelculas y de msica. Ms recientemente se ha combinado juicios de relevancia grupales con
informacin de contenido [64]10.8

Ayuda para el proceso de bsqueda desde la Interfaz

El diseador de la interfaz debe tomar decisiones acerca de cmo organizar varias clases de
informacin en la pantalla y cmo estructurar las posibles secuencias de interacciones. Este es un
problema serio en una actividad compleja como el acceso a la informacin. En esta seccin
presentamos las opciones de diseo para el despliegue de informacin en sistemas de informacin
complejos, e ilustramos las ideas con ejemplos de interfaces existentes. Comenzamos con la
discusin de interfaces muy simples, aquellas utilizadas para bsquedas de cadenas de caracteres y
progresamos hacia interfaces multiventanas y espacios sofisticados de trabajo. Luego contina una
discusin de la integracin de la exploracin, seleccin y realizacin de consultas en interfaces de
acceso a la informacin, y concluimos con las ayudas de interfaces para retener la historia del
proceso de bsqueda.
10.8.1

Interfaces para correspondencia de cadenas de caracteres (string matching)

Una necesidad comn y simple de bsqueda necesita una operacin encontrar, generalmente
ejecutada sobre el contenido de un documento que se est viendo. Generalmente esta funcin no
produce una salida rankeada, ni permite combinaciones booleanas de trminos: la principal
operacin es una correspondencia simple de caracteres (sin capacidad para expresiones regulares).
En forma tpica, se crea una ventana para ese propsito especial, que contiene pocos y simples
controles (por ej. Coincidir maysculas y minsculas, y bsquedas hacia delante y hacia atrs) El
38

usuario tipea la cadena buscada en un formulario de entrada y las cadenas que se corresponden se
resaltan en el texto del documento (ver Figura 10.26).

Figura 10.26

Ejemplo de una interfaz simple para correspondencia de cadenas de caracteres, del


Netscape Communicator 4.05

El grado siguiente de complejidad es la funcin encontrar aplicada a pequeas colecciones, como


archivos en el disco rgido de una computadora personal, o en la lista histrica de un navegador
Web. Este tipo de funcin tambin se implementa como correspondencia simple de cadenas de
caracteres. Como en el caso anterior, los controles y configuraciones de parmetros se muestran
arriba de una ventana especial de bsqueda y las opciones se establecen a travs de marcado y de
formularios de entrada. La diferencia en estos casos es que se muestra una lista de resultados (ver
Figura 10.27/.

Figura 10.27
Ejemplo de correspondencia de cadenas de caracteres con una lista de resultados, en
este caso, la historia de las pginas Web recientemente visitadas, del Netscape Communicator 4.05

Estas interfaces simples pueden ser mejoradas aumentando su funcionalidad para ayudar a formular
la consulta inicial. Los errores de tipeo son la principal causa de resultados vacos. Puede ser til
una funcin de control de ortografa que sugiera alternativas para los trminos de consulta que
tienen baja frecuencia en la coleccin. Otra opcin es sugerir trminos de un tesauro asociados con
los trminos de consulta. Generalmente esta clase de informacin se muestra despus de que ha sido
entrada la consulta y han sido recuperados los documentos, pero una alternativa es proveer esta
informacin cuando el usuario entra la consulta, en forma de una vista previa de la misma.
10.8.2

Administracin de Ventanas

39

Para las tareas de bsqueda ms complejas que la de correspondencia de caracteres, el diseador de


la interfaz debe decidir cmo desplegar las varias opciones y tipos de informacin.
Como se discuti ms arriba, los sistemas bibliogrficos tradicionales utilizan interfaces basadas en
comandos o menes. Cuando el sistema responde a un comando el resultado nuevo oculta lo
anterior, exigiendo que el usuario recuerde el contexto. Por ejemplo, el usuario puede ver solamente
un nivel de una jerarqua temtica por vez, y debe dejar de ver esta presentacin temtica para ver la
consulta o ver los documentos.
En las interfaces grficas modernas el sistema de ventanas puede utilizarse para dividir
funcionalmente las diferentes vistas, que pueden observarse de modo simultneo [582]. En los
sistemas de acceso a la informacin, a menudo es til vincular la informacin de una ventana con la
informacin de la otra, por ejemplo, vincular documentos con su posicin en la Tabla de
Contenidos, como el SuperBook. Los usuarios pueden tambin usar la seleccin para cortar y pegar
informacin de una ventana en la otra, por ejemplo, copiar una palabra de una vista del tesauro y
pegarla en el formulario de especificacin de la consulta.
Cuando se ordena informacin en ventanas, el diseador debe elegir entre una vista monoltica, en
la que todas las ventanas estn dispuestas en posiciones predefinidas y son vistas simultneamente,
ventanas armables, y ventanas superpuestas.
Las interfaces de tipo monoltico tienen varias ventajas. Permiten al diseador controlar la
organizacin de las varias opciones, hacen que toda la informacin sea vista simultneamente, y
ubica las caractersticas en posiciones familiares, haciendo que sean fciles de encontrar. Pero
tambin tienen desventajas. Generalmente trabajan mejor si ocupan la pantalla completa, y esto se
encuentra limitado por la cantidad de espacio disponible en la pantalla [644].
Un problema comn en cualquier tipo de interfaz de acceso a la informacin es el de cuntas clases
de informacin puede mostrarse de una vez. Los sistemas de acceso a la informacin siempre deben
reservar espacio para el rea de visualizacin del texto, y esto lleva una proporcin importante del
espacio de la pantalla para que el texto sea legible. Una buena disposicin, grficos y el tamao de
las letras pueden mejorar estas situaciones.
Las ventanas superpuestas brindan flexibilidad en la organizacin, pero rpidamente pueden
convertirse en una visualizacin abigarrada y desorganizada. Los investigadores han observado que
parte importante de la actividad del usuario consiste en el movimiento entre una ventana y otra.
Bannon et al. [54] define la nocin de espacio de trabajo el agrupamiento de conjuntos de
ventanas funcionalmente referidas a alguna actividad o meta- con el fundamento de que esta clase
de organizacin se corresponde ms cercanamente con la estructura de metas del usuario que con
ventanas individuales [96]. Card et al. [140] encontraron que el uso de ventanas debera ser
categorizado de acuerdo con un modelo de conjunto de trabajo. Revisaron las relaciones entre las
demandas de la tarea y el nmero de ventanas en uso, y encontraron que el mayor nmero de
ventanas en uso se produca cuando los usuarios transitaban de una tarea a otra.
Basados en estas y otras observaciones, Henderson y Card [420] construyeron un sistema que
intenta facilitar a los usuarios moverse entre mltiples espacios de trabajo virtuales [96]. El sistema
usa una metfora espacial de tres dimensiones, donde cada espacio de trabajo es una habitacin, y
la transicin entre uno y otro se realiza mediante puertas virtuales. En este cambio los usuario
pueden cambiar de un contexto al otro. En cada contexto de trabajo, los programas de aplicacin y
los archivos de datos que estn asociados con ese contexto se hacen visibles y disponibles para su
apertura y uso. La nocin de espacio de trabajo de este modo enfatiza la importancia de que las
40

sesiones de trabajo persisten a travs del tiempo. Los usuarios deberan poder dejar una habitacin
dedicada a una tarea, trabajar en otra tarea, y tres das despus volver a la primera habitacin y ver
todas las aplicaciones en el mismo estado que las dejaron. Esta nocin de vincular aplicaciones y
datos para cada tarea ha sido ampliamente adoptado en los programas operativos que utilizan
ventanas.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.3

Ejemplos de Sistemas

Las siguientes secciones describen el despliegue de informacin y los enfoques empleados en varias
interfaces de modernas de acceso a la informacin.
InfoGrid
Es un ejemplo de despliegue monoltico ,[667]. En l se asume que la visualizacin se divide en un
lado izquierdo y uno derecho (ver Figura 10.28). El lado izquierdo a su vez se subdivide en un rea
superior que contiene formularios de entrada estructurados para especificar las propiedades de la
consulta, una columna de controles con iconos limitando el lado izquierdo, y un rea para retener
documentos de inters en la parte inferior. El rea central principal se utiliza para ver los resultados
recuperados, o representaciones reducidas de los documentos originales, o organizaciones derivadas
de los documentos, tales como clusters Scatter / Gather. Los usuarios pueden seleccionar
documentos desde esta rea y almacenarlos en el rea inferior, o verlos en el lado derecho. La
mayor parte del lado derecho es utilizada para ver documentos seleccionados. El rea inferior a la
visualizacin del documento se destina a mostrar grficamente la historia de las interacciones
anteriores.
Parmetros

de bsqueda

Hoja de
propiedades

Panel

Panel
de
control

Imgenes

Texto
del
documento

Tabla
de
Contenidos
(TOC)
Parmetros de
bsqueda

Area
Figura 10.28

reducidas
de

retencin

Pasos
bsqueda

de

de

control
Subconjunto
de la TOC
Texto
del
documento

Diagramas de distribucin monoltica para interfaces de acceso a la informacin

Los diseadores deben decidir qu tipos de informacin mostrar en la vista primaria. Si InfoGrid
fuera usada en una visualizacin pequea, o el rea de visualizacin de documentos o el rea de los
resultados deberan ser mostrados en una ventana pop-up superpuesta; de otro modo el usuario
tendra que moverse entre dos vistas. Si el sistema sugiriera trminos para retroalimentacin por
relevancia, una de las vistas existentes debera ser suplantada con esta informacin o debera usarse
una ventana pop-up para mostrar los trminos candidatos. El sistema no provee informacin
detallada para la seleccin de fuentes, a pesar de que esto podra conseguirse fcilmente con un
men pop-up en el panel de control.
SuperBook

41

La disposicin de InfoGrid es similar a la de SuperBook (ver seccin 10.6). La principal diferencia


es que SuperBook retiene la vista tipo Tabla de Contenido en el panel principal izquierdo, junto con
la indicacin de cuntos documentos que contienen aciertos de bsqueda aparecen en cada nivel de
la Tabla. El principal panel del lado derecho, como en InfoGrid, se utiliza para ver los documentos
seleccionados. La formulacin de la consulta se realiza justo debajo de la vista de la Tabla de
Contenido. Los trminos relacionados con la consulta del usuario tambin se muestran en esta
ventana. Las imgenes grandes aparecen en ventanas pop-up superpuestas.
La disposicin SuperBook es el resultado de varios ciclos de diseo iterativo [481]. Las versiones
anteriores usaban ventanas superpuestas en lugar de una vista monoltica. La nueva caja de texto
tiene su propio conjunto de botones que permiten a los usuarios saltar a las ocurrencias de palabras
resaltadas en otros documentos o a la Tabla de Contenidos. SuperBook fue rediseado despus de
varios estudios experimentales [530, 532] que mostraron que los usuarios eran ms eficientes si se
les daba pocos pero bien elegidos pasos de interaccin. Un estudio reciente encontr que a pesar de
que los usuarios son ms eficientes con una interfaz flexible, prefieren sin embargo una interfaz ms
rgida pero ms predecible [801]. Los diseadores tambin consideraron lo registrado en los logs de
interacciones de los usuarios. Antes del rediseo, los usuarios tenan que elegir ver la frecuencia
total de un acierto, mover el mouse a la ventana de la Tabla de Contenidos, clickear el botn y
esperar la actualizacin de los resultados. Como se observ que este patrn ocurra con frecuencia,
el nuevo sistema ejecuta automticamente esta secuencia de acciones inmediatamente despus que
es ejecutada una bsqueda.
Los diseadores de SuperBook tambin intentaron que la intefaz corriera en pantallas ms
pequeas. El rediseo hace uso de ventanas pequeas y superpuestas.
DLITE
El sistema [193, 192] divide la funcionalidad en dos partes: control del proceso de bsqueda y
muestra de los resultados. La parte de control es una vista de manipulacin directa grfica con
animacin (ver Figura 10.29). Las consultas, fuentes, documentos y grupos de documentos
recuperados se representan como objetos grficos. El usuario crea una consulta llenando los campos
editables en un objeto constructor de consultas. El sistema manufactura un objeto de consulta, que
es representado por un pequeo icono que puede ser arrastrado hasta una representacin icnica de
un conjunto de servicios de bsqueda. Si el servicio esta activo, responde creando un objeto
conjunto vaco de resultados al que le agrega la consulta. El conjunto de resultados recuperados se
representa con un crculo y los documentos recuperados se representan con iconos distribuidos en el
interior del permetro del crculo. Los documentos pueden ser arrastrados desde este crculo y
llevados hacia otros servicios, como un sumarizador de documentos o un traductor. Mientras tanto,
el usuario puede hacer una copia del icono de la consulta y arrastrarla a otro servicio de bsqueda.
Las consultas pueden ser almacenadas y reutilizadas ms tarde.

42

Figura 10.29

La interfaz DLITE [193]

Una arquitectura de interfaz flexible libera al usuario de la restriccin de los comandos. Por otra
parte, provee guas para ayuda al usuario a comenzar, brinda orientaciones para los procedimientos
vlidosy previene de los errores. La parte grfica de DLITE hace uso de la animacin para guiar al
usuario.
DLITE usa una ventana Web separada para mostrar informacin detallada sobre los documentos
recuperados, como las citas bibliogrficas y el texto completo. Esta ventana tambin se utiliza para
mostrar resultados clusters Scatter / Gather y permitir a los usuarios seleccionar los documentos
para un retroalimentacin por relevancia. De ese modo DLITE separa la parte de control del
proceso de acceso a la informacin de la parte de revisin y lectura. Esta separacin permite una
construccin reutilizable de las consultas, y al mismo tiempo permite una vista legible de los
documentos y las relaciones entre los mismos. La seleccin que se realice en la vista, se vincula con
la parte grfica de control, de modo que un documentos revisado en la vista puede ser utilizado
como parte de una consulta en el constructor de consultas.
DLITE tambin incorpora la nocin de espacio de trabajo, o centro de trabajo, como se lo
denomina en ese sistema. Se crean diferentes espacios de trabajo para diferentes tipos de tareas. Por
ejemplo, un espacio de trabajo para comprar software puede ser equipado con iconos que
representen fuentes de revisin de software y buenos sitios Web para buscar informacin sobre
precios.
SketchTrieve
El principio subyacente a esta interfaz [365] es la concepcin del acceso a la informacin como un
proceso informal, en el que ideas a medio terminar y caminos parcialmente explorados pueden
retenerse para un uso posterior. Los resultados pueden ser combinados mediante operaciones sobre
objetos grficos. Como se observ que los usuarios utilizan la disposicin fsica de la informacin
en una hoja para organizar esa informacin [584, 722]. Esto motiv a los diseadores del

43

SketchTrieve para permitir a los usuarios que organicen los resultados de las bsquedas de modo de
facilitar su comparacin y recombinacin (Ver Figura 10.30).
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.30

La interfaz SketchTrieve [365]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.4

Retencin de la historia de la bsqueda

La seccin 10.3 present las estrategias de bsqueda de informacin y los comportamientos que han
sido observados por los investigadores en este campo. Esta discusin sugiere que la interfaz del
usuario debera mostrar cules son las opciones disponibles en un punto dado, tanto como qu
movimientos se han realizado anteriormente, tcticas de corto y de largo plazo respecto de
estrategias para el uso de los trminos, y permitir al usuario anotar las decisiones tomadas y la
informacin encontrada durante todo el proceso. Los usuarios deberan ser capaces de reunir
diferentes sesiones de bsqueda, grabar partes de una sesin, acceder y modificar flexiblemente
todas ellas. Tambin hay un inters creciente por incorporar la informacin sobre el uso y las
preferencias personales tanto en la formulacin de las consultas como en el uso de los resultados de
una bsqueda [277].
En general estas estrategias no estn bien aplicadas en las interfaces actuales; sin embargo se han
introducido algunos mecanismos en ese sentido. En particular son tiles los mecanismos para
retener la historia de las bsquedas. Usualmente estos mecanismos consisten en ver una lista de
comandos que fueron ejecutados anteriormente, En desarrollos ms recientes, se ha introducido la
historia de la bsqueda en forma grfica, grabando tanto las secuencias de comandos como los
resultados obtenidos. Kim y Hirtle [440] presentan un sumario de los mecanismos de presentacin
de historia de la bsqueda en forma grfica. En forma reciente, una interfaz grfica que muestra la
historia del acceso a pginas Web en una estructura jerrquica, permite ahorrar tiempo cuando se
vuelve a visitar los pginas accedidas anteriormente. [370].
44

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.5

Integracin de la revisin, la seleccin y la realizacin de las consultas

En general, las interfaces de usuario para el acceso a la informacin no son buenas en soportar las
secuencias de movimientos desde una operacin a la otra. An algo tan simple como tomar la salida
de los resultado de una consulta y usarlos como entrada para otra consulta no est bien resulto.
Hertzum y Frkjaer [368] encontraron que los usuarios prefieren una integracin de la revisin y la
especificacin de las consultas en las interfaces. Sin embargo, no observaron mejores resultados en
tales interacciones. La hiptesis de estos autores es que si la interaccin es demasiado libre se
producen acciones errneas, y que la interaccin entre dos modos diferentes requiere ms gua.
Sugieren que se necesita ms flexibilidad pero tambin lmites.
Hay excepciones. La nueva versin Web del sistema Melvyl provee formas de tomar la salida de
una consulta y modificarlas ms tarde para su re-ejecucin (ver Figura 10.32). El sistema DLITE y
su concepto de habitaciones permite el almacenamiento y reutilizacin de estados previos. Sin
embargo, estos sistemas no integran bien el proceso general con la revisin y la seleccin de
informacin desde estructuras auxiliares.

Figura 10.32

Vista de la revisin de la historia de la bsqueda en la versin Web del catlogo


bibliogrfico Melvyl

La interfaz Cat-a-Cone integra la consulta y el browsing de una extensa jerarqua de categoras y


sus colecciones de texto asociadas. El sistema prototipo utiliza la animacin en tres dimensiones del
Information Visualizer [144] (ver Figura 10.33). Un componente clave de la interfaz es la
separacin de la representacin grfica de la jerarqua de categoras de la representacin grfica de
los documentos. Esta separacin permite una interaccin flexible y fluida entre el browsing y la
bsqueda, y entre las categoras y los documentos. Tambin provee un mecanismo por el que un
conjunto de categoras asociadas a un documento puede ser visto junto con su contexto jerrquico.
Otra componente clave del diseo es la asignacin de un estatus muy importante a la representacin
del contenido de texto. Los documentos recuperados son almacenados en una representacin
animada de un libro en tres dimensiones [144] que permite una visualizacin compacta de un
nmero moderado de documentos. Asociado a cada documento recuperado hay una pgina de
45

vnculos a la jerarqua de categoras y una pgina de texto que muestra los contenidos del
documento.
El sistema permite diferentes puntos de partida. Los usuarios pueden comenzar tipeando el nombre
de una categora y mirar qu partes de la jerarqua de categoras se corresponde. Por ejemplo, la
Figura 10.34 muestra el resultado de una bsqueda sobre Radiacin en los trminos del MeSH.
La palabra aparece bajo cuatro encabezamientos principales (Ciencias fsicas, Enfermedades,
Diagnstico y Ciencias Biolgicas). Se muestra entonces por qu Radiacin aparece bajo
Enfermedades (como parte de una rama sobre accidentes ocupacionales). Ahora el usuario puede
seleccionar uno o ms de estas categoras como entradas de la especificacin de la consulta.

Figura 10.33
La interfaz Cat-a-Cone que integra la revisin de categoras y de documentos con la
bsqueda [358]

Otra forma en que el usuario puede comenzar es tipeando una consulta en texto libre. Esta consulta
es equiparada con la coleccin. Los documentos relevantes son recuperados y ubicados en un
formato de libro. Cuando el usuario abre el libro de un documento recuperado, se muestran las
partes de la jerarqua de categoras en la representacin jerrquica. De ese modo, se muestran varias
categoras simultneamente, en su contexto. Esta interfaz combina la manipulacin de extensos y
complejos metadatos, puntos de partida, revisin y realizacin de consultas en una misma interfaz.
Tambin permite una retroalimentacin por relevancia mediante la sugerencia de categoras
adicionales que estn relacionadas con los documentos que han sido recuperados.

46

Figura 10.34

Interfaz Cat-a-Cone: puntos de partida para buscar en las categoras [358]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.9

Tendencias y temas de investigacin

La importancia de la interaccin hombre computadora est recibiendo un creciente reconocimiento


en el campo de la informtica [587]. Como debera ser evidente a partir de los contenidos de este
captulo, el rol de la interfaz del usuario en el acceso a la informacin ha recibido muy
recientemente la atencin que merece. Se espera que la investigacin en esta rea crezca
rpidamente, especialmente por la expansin de la Web. La Web ha hecho repentinamente
disponibles en forma global a grandes cantidades de informacin, produciendo un inters creciente
por el problema del acceso a la informacin. Esto ha llevado a la creacin de nuevos paradigmas de
acceso a la informacin., tales como el uso innovador de la retroalimentacin por relevancia tal
como se ve en la interfaz Amazon.com. Como la Web provee una interfaz independiente de
cualquier plataforma, se espera que las inversiones en el diseo de mejores interfaces tengan un
gran impacto a nivel de la poblacin.
Otra tendencia que puede preverse es un inters creciente en la organizacin y bsqueda en
colecciones de informacin personal. Muchos investigadores estn proponiendo que en el futuro la
vida completa de una persona sera registrada utilizando multimedia. Una motivacin para esta
posibilidad es habilitar la bsqueda de todo lo que una persona ha hecho o escrito. Otra motivacin
es permitir las bsquedas utilizando nexos contextuales, tales como encuentre el artculo que yo
estaba leyendo en el encuentro que tuve el 1. de julio con Mara y Pedro.

47

Tambin hay un inters creciente en identificar el comportamiento de individuos y grupos, tanto


para evaluar la calidad de los tems de informacin como para sugerir puntos de partida para la
bsqueda. Los sistemas que recomiendan crecern en diversidad e importancia. Las interfaces de
usuario necesitarn guiar a los usuarios a tems recomendados apropiados basados en sus
necesidades de informacin.
El campo de la visualizacin de la informacin necesita algunas nuevas ideas sobre cmo disponer
espacios de informacin grandes y abstractos, de forma intuitiva. Hasta que eso suceda el rol de la
visualizacin de informacin estar confinada a proveer vistas generales temticas y mostrar
grandes jerarquas de categoras en forma dinmica.

48

Potrebbero piacerti anche