Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Captulo 10:
Interfaces de usuario y visualizacin
Trad. de Ana Sanllorenti
10.1
Introduccin
Este captulo discute las interfaces de usuario para la comunicacin entre usuarios humanos que
buscan informacin y los SRI. La bsqueda de informacin es un proceso impreciso. Cuando los
usuarios se acercan a un sistema de acceso a informacin, tienen a menudo slo una comprensin
difusa acerca de cmo pueden lograr su propsito. Por lo tanto, la interfaz de usuario debera
ayudarlo a comprender y expresar su necesidad de informacin. Tambin debera ayudarlo a
formular sus consultas, seleccionar entre las distintas fuentes de informacin disponible,
comprender los resultados de la bsqueda, y seguir el progreso de su bsqueda.
La interfaz hombre-computadora es menos comprendida que otros aspectos del la RI, en parte
porque los seres humanos son ms complejos que las computadoras, y sus motivaciones y
conductas son ms difciles de medir y caracterizar. Como el rea est cambiando rpidamente, la
discusin en este captulo enfatizar desarrollos recientes ms que conocimientos ya establecidos.
Primero se delinear el lado humano del proceso de bsqueda de informacin y luego se focalizarn
los aspectos de este proceso que puede ser mejor soportados por la interfaz de usuario. La discusin
se encaminar hacia la prctica y tecnologa actuales, las propuestas recientes de ideas innovadoras
y las sugerencias para futuras reas de desarrollo.
La seccin 10.2 presenta los principios del diseo para la interaccin hombre-computadora e
introduce nociones relacionadas con la visualizacin de informacin. La seccin 10.3 describe los
modelos de bsqueda de informacin pasados y presente. Las siguientes cuatro secciones describen
el soporte de la interfaz de usuario para comenzar el proceso de bsqueda, para la especificacin de
la consulta, para ver los resultados recuperados en contexto y para la retroalimentacin interactivo
por relevancia. La seccin 10.8 describe las tcnicas de interfaz de usuario que apoyan el proceso de
acceso a la informacin como un todo. La seccin 10.9 especula sobre futuros desarrollo y la
seccin 10.10 provee sugerencias para otras lecturas. La figura 10.1 presenta el flujo de los
contenidos de los captulos.
Introduccin
Bases de la interaccin
Hombre-computadora
El proceso de acceso a la
informacin
Los puntos de partida
La especificacin de la
consulta
Contexto
Juicios de relevancia
Soporte de la interfaz
Conclusiones
Figura 10.1 Contenidos de este captulo
10.2
operacin de la interfaz, pero pueden consumir ms tiempo para ser aprendidas e imponen un
esfuerzo de memoria para las personas que usan el sistema de forma intermitente. Una solucin
comn es usar una tcnica con un andamio de apoyo (scaffolding). Se presenta al usuario inicial
una interfaz simple que puede ser aprendida rpidamente y que provee la funcionalidad bsica de la
aplicacin, pero que es restringida en cuanto a potencia y flexibilidad. Se ofrecen interfaces
alternativas para usuarios ms experimentados, permitiendo ms control, ms opciones y ms
caractersticas, o eventualmente modelos de interaccin completamente diferentes. Los buenos
diseos de interfaces proveen puentes intuitivos entre las interfaces simples y las avanzadas.
Las interfaces de acceso a la informacin deben enfrentar la dificultad del equilibrio entre la
simplicidad y la potencia. Una de esas dificultades es la cantidad de informacin que se muestra
acerca de los trabajos del sistema de bsqueda. Los usuarios nuevos de un sistema o de una
coleccin pueden no saber demasiado acerca del sistema o del dominio asociado con la coleccin,
como para hacer elecciones entre caractersticas complejas. Pueden no saber cmo pesar o valorar
los trminos, o, en el caso de retroalimentacin por relevancia, no saber cules seran los efectos de
la revaloracin de los trminos. Por otra parte, los usuarios que han trabajado con un sistema
probablemente sean capaces de elegir entre trminos sugeridos para agregar a su consulta mayor
informacin. Determinar cunta informacin se debe mostrar al usuario es una de las decisiones
principales en el diseo de interfaces de acceso a la informacin.
10.2.2 El rol de la visualizacin
Las herramientas del diseo de interfaces de computadora son familiares para la mayora de los
usuarios de hoy: ventanas, menes, conos, cajas de dilogos, etc. Estos recursos hacen uso de
despliegue de mapas de bits y grficos para proveer una interfaz ms accesible que las
visualizaciones basadas en comandos. Un rea menos familiar pero en crecimiento es la de la
visualizacin de la informacin, que intenta proveer representaciones visuales de espacios de
informacin muy grandes.
Los seres humanos estn acostumbrados a las imgenes y a la informacin visual. Los cuadros y los
grficos puede ser cautivantes si estn bien diseados. Una representacin visual puede comunicar
algunas clases de informacin mucho ms rpida y efectivamente que cualquier otro mtodo.
Consideremos la diferencia entre la descripcin escrita de la cara de una persona y su fotografa, o
la diferencia entre una tabla de nmeros que contienen una correlacin y un grfico que representa
la misma informacin.
La aparicin creciente de rpidos procesadores de grficos y de monitores de color de alta
resolucin incrementa el inters en la visualizacin de informacin. La visualizacin cientfica, una
rama en rpido avance, mapea fenmenos fsicos en representaciones de dos o tres dimensiones. Un
ejemplo de este tipo de visualizacin es la imagen color de patrones de picos y valles en el suelo del
ocano; esto provee una vista de fenmenos fsicos que actualmente la fotografa no puede cubrir.
La imagen se construye a partir de datos que representan los fenmenos subyacentes.
La visualizacin de informacin abstracta es ms difcil y la visualizacin de informacin
representada textualmente constituye un desafo. El lenguaje es nuestro principal medio de
comunicacin para las ideas abstractas, para las cuales no hay manifestaciones fsicas obvias.
Cmo lucira un cuadro que describiera negociaciones en las que una parte demandara concesiones
en polticas ambientales mientras que otra parte requiriera su refuerzo?
A pesar de las dificultades, los investigadores estn intentando representar aspectos del proceso de
acceso a la informacin utilizando tcnicas de visualizacin de la informacin. Adems de usar
3
innovacin de la interfaz puede ser til y plancentera para algunos usuarios, y extraa para otros.
Por tanto, el diseo de software debera permitir flexibilidad en el estilo de interaccin, y considerar
que las nuevas caractersticas no sern igualmente tiles para todos los usuarios.
Un importante aspecto de la interaccin hombre computadora es la metodologa de evaluacin de
las tcnicas de interfaz de usuario. Las medidas de acierto y precisin han sido ampliamente
utilizadas para comparar los resultados de sistemas no interactivos, pero son menos apropiadas para
evaluar sistemas interactivos. Las evaluaciones estndares enfatizan altos niveles de acierto; en
TREC (Text Retrieval Conferences, foros destinados a promover la investigacin en Recuperacin
de Informacin para grandes colecciones de texto) los sistemas de tareas son comparados para ver
cmo retornan los principales 1000 documentos (Cap.3). Sin embargo, en muchos sistemas
interactivos los usuarios requieren slo unos pocos documentos relevantes y no les importa el
acierto alto. La mtrica til sobre acierto y precisin incluye: tiempo requerido para aprender el
sistema, tiempo requerido para conseguir las metas de cada tarea, tasas de error, y retencin del uso
del la interfaz en el tiempo. En este captulo se muestran resultados empricos de estudios de
usuarios.
Los datos empricos que implican a los usuarios son el tiempo consumido y la dificultad para
extraer conclusiones. Esto se debe en parte a la variacin de las caractersticas de los usuarios y sus
motivaciones, y enparte al amplio alcance de las actividades de acceso a la informacin. Los
estudios psicolgicos formales slo han cubierto conclusiones especficas en contextos muy
restringidos. Por ejemplo, cantidades tales como el tiempo que toma al usuario seleccionar un tem
de un men en varias condiciones. Pero en cambio es difcil cuantificar las variaciones en el
comportamiento de la interaccin para tareas complejas de acceso a informacin. Nielsen [605]
invoca un enfoque de evaluacin ms informal (llamada evaluacin heurstica).
10.3
1)
2)
3)
4)
5)
6)
7)
8)
Este modelo simple de interaccin (utilizado por los motores de bsqueda en la Web) es el que
utilizan la mayora de los que buscan informacin en la actualidad. Este modelo no toma en
consideracin que muchos usuarios se disgustan ante una gran lista de resultados desorganizados
que no refieren directamente a sus necesidades de informacin. Tambin incluye un supuesto: la
necesidad de informacin del usuario es esttica y el proceso de bsqueda de informacin es una
sucesin de refinamientos de una consulta hasta que se recupera todos y slo los documentos
relevantes a la necesidad de informacin original.
Necesidad
de
informacin
Consulta
Enviar al
sistema
Recibir los
resultados
Reformular
Evaluar los
resultados
S
i
No
Satisfacci
n?
Fin
Figura 10.2 Diagrama simplificado del modelo estndar del proceso de acceso a la informacin
En realidad, los usuarios aprenden durante el proceso de bsqueda. Ellos revisan la informacin,
leen los ttulos en los resultados, leen los documentos recuperados, ven las listas de tpicos
relacionados con los trminos de bsqueda, y navegan por los sitios Webs relacionados por
hipervnculos. El advenimiento de los hipervnculos como parte central del proceso de bsqueda de
informacin, hace imposible ignorar el rol de la revisin (scanning) y de la navegacin como partes
del mismo proceso. En particular, y mucho ms que en las bsquedas bibliogrficas hoy es muy
comn que se intenten aproximaciones utilizando los hipervnculos de la Web, en la espera de
encontrar una pgina til luego de algunos saltos por diferentes sitios o pginas.
Ese modelo tambin subestima la interaccin que tiene lugar cuando el usuario revisa trminos
sugeridos como resultado de un proceso de retroalimentacin por relevancia, revisa una estructura
de tesauro, o visualiza esquemas temticos de una coleccin de documentos. Ese modelo tampoco
valora suficientemente el rol de la seleccin de fuentes que est adquiriendo creciente importancia
desde que hay disponibles miles de colecciones de informacin.
Por estas razones, a pesar de que es til para describir las bases del proceso de acceso a la
informacin, est siendo muy criticado [65,614,105,365,192]. Bates [65]propone el modelo
recoger granos (berry-picking), que contiene dos puntos principales. El primero es que, como
resultado de la lectura y aprendizaje a partir de la informacin encontrada en el proceso de
bsqueda, continuamente cambian tanto la necesidad de informacin del usuario como la
formulacin de las consultas. La informacin encontrada en un punto de la bsqueda puede
producir un cambio no previsto de direccin de la misma. La meta original puede lograrse de forma
parcial y cambiar la prioridad de una meta en relacin con otra. Esto contradice el supuesto de que
la necesidad de informacin del usuario permanece inamovible durante el proceso de bsqueda. El
segundo punto de este modelo es que las necesidades de informacin del usuario no son satisfechas
por un nico conjunto final de documentos recuperados, sino por una serie de selecciones y bits de
informacin encontrados a lo largo del proceso. Esto contradice el supuesto de que la principal meta
de un proceso de bsqueda es encontrar el conjunto perfecto de documentos que satisfacen la
necesidad original de informacin.
El modelo berry-picking est respaldado por una cantidad de estudios observacionales [236,105]
incluyendo los de ODay y Jeffries [614]. Ellos encuentran que el proceso de bsqueda de
informacin consiste en una serie de bsquedas interconectadas pero diversas sobre un tema base.
Tambin encuentran que los resultados de una bsqueda tienden a plantear nuevas metas y producen
cambios de direccin de la bsqueda, pero esto se va produciendo en etapas. Tambin plantean que
el principal valor de una bsqueda reside en el aprendizaje acumulado y en la adquisicin de
informacin que se produce durante el proceso, ms que en el conjunto de resultados finales.
En consecuencia, una interfaz de usuario para el acceso a la informacin debera permitir a los
usuarios cambiar sus metas y ajustar sus estrategias de acuerdo con estos cambios. Puede ocurrir
que un usuario encuentre un disparador que produzca un cambio temporario de estrategia, quizs
para retornar ms tarde a la actividad inicial. Una consecuencia de estas observaciones es que la
interfaz debera permitir dejar y seguir rastros de las actividades realizadas. Esto puede lograrse en
parte mediante recursos para grabar el progreso de la estrategia y almacenar, encontrar y volver a
cargar los resultados intermedios. Tambin debera permitir el seguimiento de varias estrategias de
forma simultnea.
La interfaz de usuario debera contener formas de monitorear el estado de la estrategia en relacin
con las tareas que est realizando el usuario y con las metas que se ha propuesto. Una de las
maneras puede ser a travs de un anlisis de costo / beneficio. Estos anlisis suponen que en
7
cualquier punto del proceso de bsqueda, el usuario persigue la estrategia que tiene la mayor
expectativa de utilidad. Si, como consecuencia de alguna eleccin tctica, otra estrategia se presenta
como de mayor utilidad, la anterior ser temporaria o permanentemente abandonada a favor de la
nueva.
Hay algunas teoras que contrastan el browsing, el realizar consultas, el navegar y el revisar
(browsing, querying, navigating y scanning). Nosotros asumimos que el usuario revisa una
estructura de informacin, sea en ttulos, trminos de tesauros, hipervnculos, categoras, o el
resultado de clustering (agrupamiento automtico), y entonces o selecciona un tem para algn
propsito (lectura en detalle, para usarlo como input de otra consulta, para navegar a otra pgina), o
formula una consulta (utilizando algunas palabras o seleccionando categoras). En ambos casos, se
hace visible para su revisin un nuevo conjunto de informacin. Las consultas tienden a producir
colecciones de informacin que no haban sido reunidas con anterioridad, mientras que la seleccin
de categoras recupera informacin que haba sido previamente compuesta u organizada. La
navegacin se refiere al seguimiento de una cadena de links, con alguna meta en particular, en una
secuencia de operaciones de revisin y seleccin. El browsing se refiere a una exploracin no
dirigida y casual, de estructuras de informacin. Usualmente es realizada en forma conjunta con
selecciones, a pesar de que pueden realizarse consultas para crear subcolecciones sobre las que
realizar un posterior browsing. Un aspecto importante del proceso de interaccin es que la salida
producto de una accin debera poder ser utilizada fcilmente como entrada en el paso siguiente.
10.3.2 Las partes no-bsqueda en el proceso de acceso a la informacin
El estudio ODay y Jeffries [614] hall que la bsqueda de informacin es slo una parte del
proceso de trabajo completo que realizan las personas. Durante las sesiones de bsqueda se realizan
diferentes clases de trabajo con la informacin recuperada, por ejemplo leer, anotar y analizar. Esos
autores analizaron los pasos de anlisis en mayor detalle, encontrando que el 80 % del trabajo puede
clasificarse en seis tipos principales: encontrar tendencias, hacer comparaciones, agregar
informacin, identificar conjuntos crticos, valorar, e interpretar. El 20 % restante consiste en
realizar referencias cruzadas, sumarizar, encontrar visualizaciones evocativas para los informes, y
otras actividades miscelneas. El trabajo de Russell et al [690] Sensemaking (construccin de
sentido) presenta el trabajo de informacin como un proceso en el que la recuperacin de
informacin es slo una pequea parte. Ellos observan que la mayor parte del esfuerzo realizado en
Sensemaking se encuentra en la sntesis de una buena representacin, o en las vas de pensamiento
acerca de algo. Describen el proceso de formular y cristalizar los conceptos importantes para una
tarea dada.
A partir de estas observaciones es conveniente dividir el proceso completo de acceso a la
informacin en dos componentes principales: bsqueda y recuperacin, y anlisis y sntesis de los
resultados. Las interfaces de usuario deberan permitir combinar ambos tipos de actividad. Sin
embargo, el anlisis / sntesis son actividades que pueden ser hechas con independencia de la
bsqueda de informacin, y nos parece til hacer una distincin entre ambos tipos de actividades.
10.3.3
Actualmente el texto buscado es a menudo texto completo y no citas bibliogrficas. Como los
usuarios tienen acceso al texto completo, ms que a sustitutos de los documentos, es ms
probable que las bsquedas simples encuentren respuestas relevantes como parte del procesos
de bsqueda.
Los sistemas modernos usan ranking estadstico (que son ms efectivos cuando se dispone de
texto completo y de abstracts, que cuando se trata de citas), mientras que la mayora de estos
estudios se realizaron sobre sistemas booleanos.
La mayora de las bsquedas actuales son realizadas por usuarios finales, ms que por
profesionales intermediarios, que era el foco de los tempranos estudios.
Hoy hay disponibles decenas de miles de fuentes en lnea y en red, y muchos estn relacionados
por hipervnculos, a diferencia de las colecciones separadas pertenecientes a diferentes
servicios. Los primeros estudios generalmente usaron sistemas en los que cambiarse de una
coleccin a otra requera un conocimiento y tiempo considerable.
Finalmente, muchos usuarios tienen acceso a muestras de mapas de bits que permiten la
manipulacin directa, o pueden llenar formularios. La mayora de los estudios tempranos y de
los sistemas bibliogrficos se implementaron con comandos en lnea, que requeran una sintaxis
y no tenan formas para mostrar el contexto.
Puntos de partida
Las interfaces de usuario deben proveer a los usuarios con buenas formas para iniciar su trabajo.
Una pantalla vaca o un formulario en blanco no ayudan al usuario a decidir cmo iniciar el proceso
de bsqueda. Por lo general un usuario no comienza con una detallada expresin de su necesidad de
informacin. Los estudios muestran que los usuarios tienden a comenzar con consultas muy breves,
analizan el resultado, y luego modifican las consultas en un ciclo de retroalimentacin incremental.
La consulta inicial puede ser vista como una prueba para ver los resultados y a partir de all hacerse
una idea de cmo reformular la consulta. En consecuencia, una tarea de la interfaz de acceso a la
informacin, es ayudar a los usuarios a seleccionar las fuentes y colecciones en las que buscar
informacin.
Por ejemplo, hay muchas fuentes de informacin asociadas con el tema cncer, y son muchas las
clases de informacin que un usuario podra querer conocer acerca del tema. Mediante una correcta
gua al usuario, este podra resolver el problema inicial de la formulacin. La bsquedas
bibliogrficas tradicionales suponen que el usuario comienza mirando una lista de nombres de
fuentes y elige en cules colecciones buscar; en cambio los motores de bsqueda en la Web
eliminan las diferencias entre fuentes y arrojan al usuario en medio de un sitio Web con poca
informacin acerca de la relacin entre ese acierto de la bsqueda y el resto de la coleccin. En
ninguno de los dos casos la interfaz disponible es demasiado til.
En esta seccin presentaremos cuatro tipos de puntos de partida: listas, vistas generales (overviews),
ejemplos, y seleccin automtica de fuentes.
10.4.1
Listas de colecciones
Los sistemas en lnea tpicos, como LEXIS-NEXIS requieren que los usuarios comiencen una
bsqueda con una revisin de una larga lista de nombres de fuentes y supongan cules sern de
inters. Generalmente se provee poca informacin en lnea sobre el contenido de estas fuentes (ver
Figura 10.3). Si el usuario no es satisfecho con los resultados de una coleccin, tiene que
redireccionar su bsqueda en otra direccin (coleccin).
Los usuarios habituales aprenden qu conjuntos de fuentes les son tiles para sus dominios de
inters, ya sea a travs de la experiencia, la capacitacin formal, o por recomendaciones de sus
colegas. Las fuentes ms utilizadas pueden registrarse en listas de favoritos en la Web. Existen
investigaciones que exploran el mantenimiento de perfiles de informacin personalizados para
usuarios o grupos de trabajo, basados en las clases de informacin que han utilizado anteriormente.
[277]
Sin embargo, cuando los usuarios quieren buscar fuera de sus dominios de especialidad, no es
suficiente una lista de fuentes familiares. Los buscadores de informacin profesionales, como los
bibliotecarios, aprenden a travs de la experiencia y aos de entrenamiento, cules fuentes son
apropiadas para diferentes necesidades de informacin. La naturaleza restrictiva de las interfaces
tradicionales desalienta la exploracin y descubrimiento de nuevas fuentes. Recientes
investigaciones han ideado diferentes mecanismos para ayudar a la comprensin del contenido de
las colecciones como forma de iniciar una bsqueda.
10.4.2
Vistas generales
10
Como puede comenzar un usuario que se enfrenta con un conjunto grande de colecciones de
texto?. Una posibilidad es analizar una vista general del contenido de las colecciones. Tal vista
general puede mostrar los dominios temticos representados en la coleccin, para ayudar al usuario
a seleccionar o eliminar fuentes. Una vista general puede ayudar a los usuarios a comenzar,
dirigindolos hacia barrios temticos generales, despus de lo cual pueden recorrer usando
descripciones ms detalladas. Shneiderman [724] propone un modelo de interaccin en el cual el
usuario comienza con una vista general de la informacin con la que va a trabajar, luego panea
(recorre panormicamente) y realiza zooms para encontrar reas de inters potencial, y entonces
mira los detalles. El proceso se repite tantas veces como sea necesario.
En esta subseccin se presentan tres tipos de vistas generales. La primera es la muestra y
navegacin de una jerarqua de categoras temticas asociada con los documentos de una coleccin.
El segundo tipo lo constituyen las vistas generales construidas de forma automtica, generalmente
elaboradas mediante tcnicas de clustering sobre los textos de los documentos. El tercer tipo de
vista general es el que se crea mediante la aplicacin de variantes del anlisis de co-citacin sobre
conexiones o vnculos entre diferentes entidades en una coleccin. Otra clase de vistas generales
son las que, por ejemplo, muestran representaciones grficas de estanteras o pilas de libros [681,
46]
Vistas generales de categoras o directorios
Hoy existen grandes colecciones en lnea de colecciones de textos a los que se les han asignado
etiquetas con categoras temticas. Los sistemas bibliogrficos tradicionales han asignado por
dcadas encabezamientos de materia a los libros y otros documentos [752]. MEDLINE, una
coleccin de artculos biomdicos utiliza el Medical Subjects Headings, que contiene
aproximadamente 18.000 categoras [523]. Las Association for Computing Machinery (ACM)
desarroll una jerarqua de aproximadamente 1.200 categoras
(palabras clave) (http://
www.acm.org/class/). Yahoo [839] organiza las pginas Web en una jerarqua de miles de
categoras.
La popularidad de Yahoo y de otros directorios Web sugiere que las categoras organizadas
jerrquicamente son puntos de partida tiles para los usuarios que buscan en a Web. Esta
popularidad puede reflejar una preferencia respecto de comenzar con un inicio lgico, o puede
tambin denotar el deseo de evitar tener que pensar qu palabras debera ser utilizadas para
recuperar la informacin deseada. (Tambin puede reflejar el hecho de que los servicios con
directorios intentan mejorar la calidad de algunos sitios Web).
El significado de las etiquetas de categoras difiere entre las distintas colecciones. La mayora estn
diseadas para ayudar a organizar los documentos y en la especificacin de las consultas.
Desafortunadamente, los usuarios de los catlogos bibliogrficos en lnea raramente utilizan los
encabezamientos de materia disponibles [335, 222]. Hancock-Beaulieu y Drabenstott y Weller,
entre otros, han planteado la pobreza de las interfaces basadas en comandos, para proveer ayuda en
la seleccin de etiquetas temticas y requerir de los mismos la revisin de largas listas alfabticas.
An en las interfaces grficas de la Web, encontrar el lugar adecuado con una jerarqua de
categoras puede ser una tarea que insuma mucho tiempo, y una vez que ha sido encontrada la
coleccin usando ese tipo de representacin, se requiere un medio alternativo para buscar en el sitio
mismo.
La mayora de las interfaces que presentan de modo grfico categoras jerrquicas lo hacen
asociando los documentos a la categora a la que han sido asignados. Por ejemplo, al clikear en una
categora en Yahoo, se despliega la lista de documentos que han sido asignados a esa etiqueta de
11
categora. Conceptualmente, el documento es almacenado con esa etiqueta. Para utilizar la lista de
categoras para realizar bsquedas en Yahoo, el usuario debe elegir la que considere ms apropiada
para contener referencias de su inters temtico. Una eleccin incorrecta requiere que vuelva atrs y
trate nuevamente, recordando qu pginas contienen qu informacin. Si la informacin deseada se
encuentra en un nivel muy especfico de la jerarqua, o no est disponible, esto se convierte en un
proceso muy largo y probablemente frustrante. Como conceptualmente los documentos estn
almacenados dentro de las categoras, los usuarios no pueden crear consultas basadas en la
combinacin de categoras.
Figura 10.4
Es difcil disear una buena interfaz que integre la seleccin de categoras dentro de la
especificacin de la consulta, en parte porque la visualizacin de jerarquas de categoras ocupa
gran cantidad de espacio en la pantalla. Por ejemplo, Internet Gratefull Med
(http://igm.nlm.nih.gov:80/) es un servicio Web que permite una integracin de las bsquedas con
visualizacin y seleccin de categoras MeSH. Despus que el usuario tipea el nombre de una
categora, se despliega una larga lista de opciones en una pgina. Para ver ms informacin acerca
de una categora, el usuario selecciona un link (por ejemplo Radiation Injuries, Lesiones por
Radiacin). Esto produce que desaparezca el contexto de la consulta y que aparezca una nueva
pgina Web que muestra los ancestros del trmino y sus descendientes inmediatos. Si el usuario
intenta ver los hermanos del trmino padre (Wound and Injuries, Heridas y Lesiones), aparece una
nueva pgina que cambia otra vez el contexto. Al volver a la consulta, desaparece la ilustracin de
las categoras.
El sistema MeSHBrowse [453] permite entonces que slo se muestre el subconjunto relevante de la
jerarqua, haciendo ms fcil el browsing de una jerarqua total muy extensa. La interfaz tiene las
limitaciones de espacio inherentes a las visualizaciones de jerarquas bidimensionales y no provee
mecanismos para buscar en una coleccin de documentos subyacente. Ver Figura 10.4.
El sistema HiBrowse [646] representa metadatos de categoras de un modo ms eficiente,
permitiendo a los suarios desplegar varios subconjuntos diferentes de metadatos de categoras
simultneamente. El usuario primero selecciona qu tipo de atributos (o facetas, como se llaman los
12
atributos en este sistema) va a visualizar. Por ejemplo, el usuario puede elegir primero physical
disease (enfermedad fsica) como valor para la faceta Disease (Enfermedad). Las categoras que
aparecen un nivel por debajo se muestran junto con el nmero de documentos que contiene cada
categora. El usuario puede entonces seleccionar otro tipo de atributos Therapy and Groups (by
age), Terapia y grupos (por edad). Se muestran los nmeros de documentos que contienen atributos
de los tres tipos. Si ahora el usuario selecciona un refinamiento de una de las categoras, tal como el
valor child (nio) del atributo Grupos, entonces se muestra el nmero de documentos que
contienen los tres tipos de facetas seleccionadas. Al mismo tiempo, se actualiza el nmero de
documentos que contienen las subcategoras que se encuentran bajo physical desease,
(enfermedad fsica) y therapy (general), (terapia (general)) para reflejar esta especificacin. Ver
Figura 10.5. Un problema con el sistema HiBrowse es que requiere que el usuario navegue a travs
de la jerarqua de categoras, ms que la especificacin directa de las consultas. En otras palabras, la
especificacin de la consulta no est estrechamente asociada con la visualizacin de las categoras.
Como solucin a alguno de estos problemas, se describe la interfaz Cat-a-Cone en la seccin 10.8
Figura 10.5
13
14
Figura 10.6
Scatter / Gather muestra una representacin textual de los cluster de documentos. Los
investigadores han desarrollado varios enfoques para mapear documentos en un espacio documental
que puede ser en dos dimensiones en la que cada documento es representado como un icono o un
glifo (glyph), o en un espacio abstracto de dos dimensiones. Las funciones para transformar los
datos en el espacio dimensional ms bajo (o inferior) difieren, pero el efecto red consiste en que
cada documento es ubicado en un punto representado en el espacio . Los usuarios pueden detectar
temas o clusters en los grupos de signos o glifos. Entre los sistemas que utilizan este tipo de
visualizacin grfica se incluye a BEAD [156], Galaxy of News [671], y ThemeScapes [821]. La
visualizacin de ThemeScapes presenta una representacin tridimensional en el resultado del
clustering (ver Figura 10.7). El sistema hace uso de un espacio negativo para enfatizar las reas
de concentracin donde aparecen los clusters. Otros sistemas muestran de modo jerrquico la
similaridad inter-documental [529,14], mientras que otros muestran los documentos recuperados en
redes basadas en similaridad inter-documental [262,761].
El algoritmo de mapa de caractersticas de Kohonen ha sido utilizado para la creacin de mapas que
caracterizan grficamente el contenido total de una coleccin de documentos [520,163] (ver Figura
10.8). Las regiones del mapa en dos dimensiones varan en medida y forma de acuerdo con la
frecuencia de los documentos asignados a los temas correspondientes que aparecen en la coleccin.
Las regiones se caracterizan por palabras simples o frases y la adyacencia de regiones refleja
relaciones semnticas de los temas de la coleccin. Al mover el cursor sobre una regin, parecen en
una ventana de tipo pop-up los ttulos de los documentos que se asocian ms cercanamente con la
regin marcada. Los documentos pueden ser asociados con ms de una regin.
15
Figura 10.7
16
Figura 10.8
Vista general en dos dimensiones creada utilizando el algoritmo de mapeo de
caractersticas Kohonen, sobre pginas Web, sobre el tema Entretenimiento [163
17
18
puede expandir el dilogo completo para ver qu preguntas son las que siguen, y cerrarlo para
focalizarse en la tarea corriente.
Una forma ms restrictiva del dilogo que se ha difundido bastante en los productos comerciales es
el del Experto (Wizard). Esta herramienta ayuda a los usuarios en tareas de tiempo limitado, pero no
intenta ensear todo el proceso requerido para completar las tareas. El Experto presenta un camino
paso a paso, que el usuario puede seguir para realizar un trabajo [636]. Un estudio reciente [145]
encontr que los expertos son tiles para metas que requieren muchos pasos, para usuarios que
carecen de conocimiento suficiente (por ejemplo un propietario de un restaurante instalando un
software para la contabilidad de su negocio), y cuando los pasos deben ser completados en una
secuencia fija. Las propiedades de los Expertos incluyen el permitir a los usuarios volver a correr el
Experto y modificar su trabajo anterior, mostrar una vista general de las funciones, y proveer
descripciones comprensibles para hacer las elecciones correctas. Los Expertos no son tiles cuando
la interfaz no resuelve un problema de forma efectiva, cuando la meta es ensear al usuario cmo
usar la interfaz y cuando el Experto no ha sido probado.
Una visita guiada (guided tour) conduce al usuario a travs de una secuencia de elecciones de
navegacin a travs de vnculos de hipertexto, presentando los nodos en un orden lgico. En un tour
dinmico, slo se muestran los nodos relevantes [329]. Una aplicacin reciente de es el proyecto
Walden Paths que permite a docentes definir caminos tiles para el entrenamiento, a travs de
pginas Web [289]. Este enfoque no ha sido utilizado demasiado en el proceso de acceso a la
informacin, pero puede ser una direccin interesante para familiarizar al usuario con estrategias de
bsqueda en grandes sistemas de hipervnculos.
10.4.4 Seleccin automtica de fuentes
Las interfaces que ayudan al usuario a elegir las fuentes de informacin ms apropiadas son una
amplia rea de investigacin. Requiere extraer la necesidad de informacin de los usuarios y
comprender cuales necesidades pueden ser satisfechas por cules fuentes. Un ambicioso proyecto es
construir un modelo de la fuente y de la necesidad de iinformacin del usuario y tratar de
determinar cmo se corresponden mejor. Esto se intenta con el uso de sistemas de modelado
(modelling systems) y sistemas de tutoreo inteligente, aplicado a dominios generales [204,814] y a
sistemas de ayuda en lnea [378].
Una alternativa simple es crear una representacin del contenido de las fuentes de informacin y
corresponder esta representacin contra la especificacin de la consulta. Esta aproximacin es la
que se utiliza en GIOSS, un sistema que intenta determinar la mejor base de datos bibliogrfica para
enviar un pedido de bsqueda, basada en los trminos de la consulta [765]. El sistema usa un
anlisis simple de las frecuencias combinadas de las palabras de la consulta en las colecciones
disponibles. El sistema SavySearch [383]lleva esta idea un paso ms all, usando acciones que
realizan los usuarios despus de una consulta para decidir cmo incrementar o disminuir el ranking
de un motor de bsqueda para una consulta en particular (ver tambin Captulo 13).
Otra posibilidad para la seleccin automtica de fuentes es enviar una consulta a mltiples fuentes y
combinar los resultados de alguna manera. Esto es lo que realizan muchos metabuscadores en la
Web. Un rea activa de investigacin actual es cmo combinar los resultados de forma efectiva, y se
conoce en algunos casos como fusin de la coleccin [63,767,388].
10.5
La especificacin de la consulta
19
Para formular una consulta el usuario debe seleccionar una coleccin, metadatos o conjuntos de
informacin, contra los que debe ser equiparada la consulta. Y debe especificar palabras, frases,
descriptores u otra clase de informacin que pueda ser comparada con la informacin en las
colecciones. Como resultado, el sistema crea un conjunto de documentos, metadatos u otro tipo de
informacin que se corresponden con la especificacin de la consulta en alguna forma y muestra los
resultados al usuario.
Shneiderman [725] identifica cinco estilos primarios de interaccin hombre computadora. Son:
lenguaje de comandos, llenado de formularios, seleccin de menes, manipulacin directa y
lenguaje natural. (Esta lista omite modalidades no visuales como el audio). Cada tcnica ha sido
usada en la especificacin de interfaces y tienen ventajas y desventajas, que se describen ms
adelante en el contexto del la especificacin de las consultas booleanas.
10.5 1
Bsquedas booleanas
20
gatos + perros recuperar solamente los artculos que contienen ambos trminos, cuando en
realidad la consulta requiere perro y deja a gato como opcional.
Otro problema con los sistemas puramente booleanos es que no rankean los documentos
recuperados de acuerdo con su grado de correspondencia con la consulta. En un marco booleano un
documento satisface o no satisface la consulta. Los sistemas comerciales realizan un orden con los
documentos de acuerdo con algn tipo de metadato, por ejemplo, el orden cronolgico. Los
sistemas basados en la Web generalmente ordenan los resultado de las consultas booleanas
utilizando algoritmos estadsticas y heurstica especfica de la Web.
10.5.2
Junto con las confusiones acerca del significado lgico del AND y del OR, otra parte del problema
con la especificacin de las consultas en sistemas booleanos bibliogrficos es la arbirtrariedad de la
sintaxis y la falta de contexto de las interfaces. Tpicamente, debe tipearse algo como lo siguiente:
COMANDO ATRIBUTO valor { OPERADOR BOOLEANO ATRIBUTO valor}*
Ejemplos:
FIND PA darwin AND TW species OR TW descent
(ENCUENTRE en autor el valor darwin AND en el ttulo el valor especies OR en el ttulo el valor
descendencia)
FIND TW Mt St. Helens AND DATE 1981
(ENCUENTRE en el ttulo el valor Mt St. Helens AND en fecha el valor 1981)
(estos ejemplos fueron extrados de la sintaxis de la interfaz telnet del sistema Melvyl de la
Universidad de California [526]). El usuario debe recordar los comandos y los nombres de los
atributos, que son fcilmente olvidables entre usos del sistema. Y este problema se hace ms grave
porque comandos y nombres de atributos cambian entre diferentes sistemas.
La nueva versin Web del sistema Melvyl provee formularios y menes de modo que el usuario ya
no tiene que recordar los nombres y tipos de atributos disponibles (http://www.melvyl.ucop.edu/).
Los usuarios seleccionan tipos de metadatos de listas y se muestran de modo explcito los atributos,
permitiendo su seleccin como una alternativa de especificacin. Por ejemplo, el campo tipo de
bsqueda se encuentra junto a un formulario de entrada en el cual los usuarios pueden ingresar
palabras clave y la eleccin entre los operadores AND y NOT se encuentra junto a la lista de tipos
de documentos disponibles. Slo los metadatos asociados a una coleccin en particular se muestran
en el contexto de esa bsqueda. Desafortunadamente, el sistema puede hacer bsquedas en una base
de datos por vez. Sin embargo, provee una facilidad para aplicar una bsqueda ejecutada
previamente a una nueva base de datos. Ver Figura 10.9.
Este sistema tambin permite la retencin del contexto entre bsquedas, almacenando los resultados
anteriores en tablas y realizando hipervnculos de estos resultados con las listas que contienen la
informacin bibliogrfica recuperada. Los usuarios pueden modificar cualquiera de las consultas
anteriores marcando un cuadro que se encuentra junto al registro de la consulta. La visualizacin
grfica hace explcitas e inmediatas muchas de las opciones del sistema que seran difciles de
retener en la versin con comandos.
21
Estas visualizaciones son una mejora sobre las interfaces de comandos, pero no resuelven todos los
problemas. Por ejemplo, un formulario en blanco no es mucho mejor porque no provee al usuario
con ayudas sobre que clase de trminos podra ingresar.
Figura 10.9
10.5.3
Consultas facetadas
Otro problema con las consultas booleanas es que tienden a dar resultados o demasiados grandes
(porque los usuarios incluyen muchos trminos en una disjuncin, o vacos (porque los usuarios
utilizan muchos trminos en interseccin). Este problemas sucede porque no se conocen los
contenidos de la coleccin o el rol de los trminos en esa coleccin.
Una estrategia comn para enfrentar este problema, empleado en sistemas con interfaces de
comandos como DIALOG, es hacer una serie de consultas cortas, ver el nmero de documentos que
se recupera en cada una de ellas, y combinar esas consultas, lo que produce un nmero razonable de
resultados. Por ejemplo, en DIALOG cada consulta produce un conjunto de documentos que se
identifica por un nmero. Antes que ver los ttulos mismos, DIALOG muestra cada nmero de
conjunto con la cantidad de documentos resultantes en cada uno. Luego pueden verse los ttulos de
los documentos solicitndolos con el nmero de conjunto. A su vez, la combinacin entre conjuntos
tambin puede hacerse utilizando ese nmero de conjunto.
Este tipo de formulacin de consultas se denomina consulta facetada, para indicar que la consulta
se divide en tpicos o facetas [553,348]. Por ejemplo, una consulta sobre drogas para la prevencin
de la osteoporosis puede consistir en tres facetas:
(osteoporosis OR prdida sea)
(drogas OR productos farmacolgicos)
(prevencin OR cura)
En este caso el usuario quiere encontrar documentos que contengan a la vez los tres tpicos, con lo
que se uniran en AND.
Una tcnica para dar un orden a los resultados de consultas booleanas es lo que se llama ranking
post-coordinado o nivel de quorum [700]. Segn este enfoque los documentos se rankean de
22
acuerdo con el subconjunto de trminos de consulta que contienen. Dada una consulta sobre
gatos, perros, peces y ratones, el sistema debera rankear primero un documento con al
menos una ocurrencia de perros, gatos y peces, antes que un documento que contenga 30
ocurrencias de gatos y ninguna de los otros trminos.
Una combinacin de las consultas facetadas y el ranking de quorum podra mostrar una lista de
lneas de entrada. Los usuarios entran un tpico por lnea, en el que se escriben una lista de trminos
relacionados semnticamente, que tienen valor equivalente y que son combinado en una disjuncin
(OR). Como resultado, los documentos que contienen por lo menos un trmino de cada faceta son
rankeados antes que los documentos que contienen slo trminos de una de las facetas.
Esta idea puede ser extendida un poco ms all, permitiendo a los usuarios asignarle un peso a cada
faceta, o asignndolo por defecto: la faceta que el usuario list primero tendr el peso ms alto, la
segunda menos peso y as sucesivamente.
10.5.4 Aproximaciones grficas para la especificacin de las consultas
Las interfaces de manipulacin directa constituyen una alternativa a la sintaxis de comando. Las
propiedades de la manipulacin directa son [725]: 1) representacin continua del objeto de inters;
2) acciones fsicas o presin de botones en lugar de una sintaxis compleja; 3) operaciones
incrementales, rpidas y reversibles cuyo impacto sobre el objeto de inters se ve inmediatamente.
Estas interfaces generalmente provocan el entusiasmo de los usuarios y por esta razn vale explorar
su utilizacin. A pesar de que tienen inconvenientes, son ms fciles de usar que otros mtodos, en
muchos contextos.
23
Figura 10.10
Frases y proximidad
En general la proximidad de la informacin puede ser bastante efectiva para mejorar la precisin de
las bsquedas. En la Web, la diferencia entre una consulta de palabra nica y otra de una frase
exacta de dos palabras puede significar la diferencia entre una cantidad inmanejable de documentos
y una lista corta de documentos relevantes.
24
Se han desarrollado un gran nmero de mtodos para especificar frases. En la sintaxis del sistema
LEXIS/NEXIS, para indicar la proximidad entre dos trminos se requiere indicar el rango de
proximidad con un operador en el medio. Por ejemplo, casa w/3 blanca significa: casa y blanca
con tres palabras en el medio, con independencia de su orden. La proximidad exacta de frases se
especifica escribiendo una palabra junto a la otra, separadas de un espacio. Un mtodo comn en
algunos motores de bsqueda de la Web para este mismo propsito es encerrar las palabras entre
comillas.
La desventaja de estos mtodos que requieren la correspondencia exacta de la frase, es que puede
ser comn el caso de que entre las palabras buscadas puede haber otras, aunque sean pocas. Por
ejemplo, en la mayora de los casos el usuario quiera presidente y Lincoln como palabras
adyacentes, pero tambin quiere recuperar Presidente Abraham Lincoln. Otro aspecto a
considerar es si el sistema utiliza algn tipo de stemming para los trminos incluidos en la frase. La
mejor solucin es permitir al usuario que especifique una frase exacta, pero tratarla como si hubiera
solicitado esas palabras con un pequeo rango de proximidad [174]. Tambin se ha demostrado que
una combinacin de ranking de quorum de consultas facetadas, con la restriccin de que las facetas
aparezcan en un pequeo rango de proximidad, puede mejorar en mucho la precisin de los
resultados [356,566].
10.5.6 Lenguaje Natural y Consultas en Texto Libre
Los algoritmos de ranking estadstico tienen la ventaja de permitir a los usuarios la especificacin
de consultas de un modo natural, sin tener que pensar acerca de operadores booleanos u otros
operadores. Pero tienen el inconveniente de brindar al usuario menos retroalimentacin y control
acerca de los resultados. Generalmente el resultado de un ranking estadstico es la lista de
documentos asociados a un puntaje, probabilidad o porcentaje al lado de cada ttulo. A los usuarios
se les da poca informacin acerca de cul es la razn del ranking y que rol juegan los trminos de
consulta en el ranking.
Una estrategia de bsqueda que puede ayudar con este particular problema es la especificacin de la
mandatoriedad de algunos trminos de la consulta en lenguaje natural. Esto permite al usuario
controlar que trminos son considerados importantes, ms que delegar en el algoritmo de ranking la
ponderacin de los trminos. Pero para especificar esta caracterstica para los trminos de bsqueda
es necesario conocer el modo de uso de comandos particulares.
La discusin anterior supone que una consulta en lenguaje natural escrita por el usuario es tratada
como una bolsa de palabras, con las palabras vacas removidas con el propsito de buscar la
correspondencia con los documentos. Sin embargo, algunos sistemas intentan analizar
sintcticamente las consultas en lenguaje natural para extraer conceptos y hacerlos corresponder con
los conceptos en la coleccin de textos. [399,552,748].
De modo alternativo, puede usarse la sintaxis de una pregunta en lenguaje natural para intentar
responder a la pregunta. Un ejemplo es el sistema Murax [463] determina a partir de la sintaxis de
una pregunta si el usuario est preguntando por una persona, lugar o fecha. Luego intenta encontrar
oraciones en artculos de una enciclopedia, que contengan las frases nominales que aparecen en la
pregunta. Esto se realiza ya que es probable que esas oraciones contengan la respuesta a la pregunta.
Por ejemplo, hecha la pregunta Quin fue el ganador novelista del Premio Pulitzer, que se postul
como alcalde de la Ciudad de Nueva York?, el sistema extrae las frases nominales: Premio
Pulitzer, novelista ganador, Alcalde, Ciudad de Nueva York. Luego busca nombres propios
que representen a personas (Ya que Quin indica a una persona), y encuentra, entre otras, las
siguientes oraciones:
25
Contexto
Esta seccin presenta las tcnicas de algunas interfaces para ubicar un conjunto corriente de
documentos en el contexto de otro tipo de informacin, con el objetivo de hacerlo ms
comprensible. Estas tcnicas incluyen la muestra de relaciones entre los documentos y los trminos
de consulta, vistas generales de la coleccin, metadatos descriptivos, estructura de hipervnculos,
estructura de los documentos, y otros documentos en el conjunto.
10.6.1
La forma ms comn de mostrar los resultados de una consulta es listar informacin acerca de los
documentos en un orden de relevancia en relacin con la consulta. Alternativamente, en un ranking
puro booleano, los documentos se listan de acuerdo con atributos de metadatos, como or ejemplo, la
fecha. Tpicamente, una lista de documentos consiste en los ttulos de los documentos y un
subconjunto de metadatos importantes como la fecha, fuente y largo del artculo. En un sistema con
ranking estadstico, puede mostrarse un puntaje o porcentaje junto al ttulo, que indica un grado de
correspondencia o probabilidad de relevancia. Esta clase de informacin es llamada sustituto del
documento. Ver Figura 10.14 [824].
Algunos sistemas permiten al usuario la eleccin entre una visualizacin breve y otra detallada de
los documentos. La vista detallada contiene generalmente un sumario o resumen. En los sistemas
bibliogrficos, se ve el autor o el servicio de resmenes. Los motores de bsqueda de la Web
generan extractos automticos, a partir de las primeras lneas del texto en la pgina Web.
En muchas interfaces, clikear el ttulo del documento o su representacin en un icono, produce una
vista del documento mismo, ya sea en una nueva ventana o en reemplazo de la lista de resultados.
26
(En los sistemas bibliogrficos tradicionales, el texto completo no se encontraba disponible en lnea
y slo poda verse el registro bibliogrfico).
Figura 10.14
10.6.2
En los sistemas en los que el usuario puede ver el texto completo de un documento recuperado, es
til resaltar las apariciones de los trminos o descriptores que se corresponden con aqullos que se
utilizaron en la consulta. Esto se realiza a travs de la utilizacin de otro color para destacar esas
palabras y tiene por finalidad ayudar al usuario a ubicar las partes del texto ms relevantes para su
consulta. [481,542, 52].
KWIC
Una facilidad relacionada con el resaltar son los sustitutos de documentos del tipo palabras clave en
contexto (keyword-in-context, KWIC). Se extraen del texto del documento fragmentos de
oraciones, oraciones completas, o grupos de oraciones que contienen los trminos de consulta, que
se presentan junto con otras partes de los sustitutos de los documentos como el ttulo o el resumen.
Debe notarse que una lista KWIC es diferente de un resumen. Un resumen sumariza los principales
temas del documento pero puede no contener referencias a los trminos de la consulta. Un extracto
KWIC muestra las oraciones que sumarizan las formas en que los trminos de bsqueda son
utilizados en el documento. Esta muestra puede mostrar no slo qu subconjuntos de los trminos
de consulta aparecen en los documentos recuperados, sino tambin el contexto en el que aparecen.
Al respecto deben tomarse decisiones sobre cuntas y cules lneas de texto deben mostrarse.
Algunos estudios han mostrado que los mejores fragmentos a mostrar son los primeros bajo el ttulo
inicial y aqullos que contienen el mayor conjunto de trminos de bsqueda [464]. Si los usuarios
han especificado cules trminos son ms importantes respecto de otros, entonces los fragmentos
27
que contengan trminos importantes deberan ser mostrados antes que los que contienen los menos
importantes. Sin embargo, con el fin de mantener la coherencia de los extractos, las oraciones
seleccionadas deberan mostrarse en el orden original del documento que los contiene.
La facilidad de tipo KWIC no suele utilizarse en la muestra de resultados en la Web, lo ms
probablemente porque para ello el sistema debe tener una copia del documento original de la cual
extraer las oraciones que contienen los trminos de bsqueda. Los motores de bsqueda Web en
general slo retienen los ndices sin la informacin de la posicin de los trminos.
TileBars (Barras de baldosas)
En estas interfaces los usuarios ingresan una consulta en formato facetado, un tpico por lnea.
Despus que el sistema recupera documentos (utilizando un algoritmo de ranking estadstico o por
quorum), se muestra un grfico de barras por cada ttulo de documento recuperado, en el que puede
verse el grado de correspondencia para cada faceta. Las Tile Bars ilustran en un vistazo qu pasajes
de cada artculo contienen qu tpicos y la frecuencia con que es mencionado ese tpico (los
cuadrados ms oscuros representan una correspondencia ms frecuente).
Cada documento se representa por una barra rectangular. La Figura 10.15 muestra un ejemplo. La
barra se subdivide en filas que se corresponden con la facetas de la consulta. En el ejemplo, la fila
superior de cada TileBar corresponde a osteoporosis, la segunda fila a prevencin y la tercera a
investigacin. La barra tambin se subdivide en columnas, y cada columna representa un pasaje
del documento. Los aciertos que se superponen en la misma pgina probablemente indican un
documento relevante, ms que los aciertos dispersos a travs del documento [356].
La oscuridad de cada cuadrado corresponde al nmero de veces que los trminos de la consulta
aparecen en ese segmento del texto, por lo que cuanto ms oscuro es un cuadrado, indica que tiene
mayor nmero de aciertos.
Figura 10.15
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.3
28
Se han desarrollado otras ideas de visualizacin para mostrar informacin de tipo diferente acerca
de las relaciones entre los trminos de consulta y los documentos recuperados. Ms que mostrar
cmo aparecen los trminos de bsqueda en los documentos individuales (como lo hacen las
interfaces KWIC y la TileBars), estos sistemas muestran una vista general o sumario de los
documentos recuperados de acuerdo con los diferentes subconjuntos de trminos de bsqueda que
contienen. Las siguientes subsecciones describen variaciones de esta idea.
Figura 10.17
InfoCrystal
El sistema InfoCrystal muestra cuntos documentos contiene cada subconjunto de trminos de
consulta [738]. Esto libera al usuario de la necesidad de especificar los operadores AND y NOT, ya
que muestra las posibles combinaciones entre los trminos que aparecen en los documentos. El
sistema InfoCrystal permite la visualizacin de todas las posibles relaciones entre N conceptos
especificados por el usuario (aunque una indicacin de ms de cuatro trminos de bsqueda produce
un resultado grfico difcil de comprender). En una extensin del paradigma de los diagramas de
Venn, este sistema muestra el nmero de documentos recuperados que tienen cada posible
subconjunto de los N conceptos. La Figura 10.17 muestra los resultados de una consulta de cuatro
trminos llamados A, B, C, y D. El diamante central indica que slo un documento contiene los
cuatro trminos de bsqueda. El tringulo marcado con 12 indica que se encontraron 12
documentos que contienen los atributos A, B y D, etc.
29
Figura 10.18
VIBE y Lyberworld
VIBE [452] y Lyberworld [363] son presentaciones grficas que operan sobre principios similares.
En ellos los trminos de consulta se ubican en un espacio grfico abstracto. Despus de la bsqueda,
se crean iconos que indican cuntos documentos contiene cada subconjunto de trminos de
consulta. El estado del subconjunto de cada grupo de documentos se indica a travs de la ubicacin
del icono. Por ejemplo, en el sistema VIBE un conjunto de documentos que contiene tres de los
cinco trminos de bsqueda se muestra en un eje que conecta esos tres trminos, en un punto a
mitad de camino entre las representaciones de los tres trminos en cuestin (Ver Figura 10.18).
Lyberworld presenta esta idea en tres dimensiones.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.4
El sistema Superbook [481, 229, 230] utiliza la estructura de un gran documento para mostrar los
aciertos de trminos de bsqueda en su contexto. Para un libro o un manual, se muestra la Tabla de
Contenido en la parte izquierda de la pantalla, y a la derecha se ve el texto completo de la pgina o
seccin. El usuario puede manipular la tabla de contenido para expandir o contraer la vista de las
secciones y subsecciones. Se utiliza un mecanismo foco-ms-contexto para expandir el rea de las
secciones que se estn viendo y comprimir las anteriores.
30
Figura 10.19
Despus de que el usuario especifica una consulta en el libro, se muestran los resultados en el
contexto de la jerarqua de la Tabla de Contenidos. (Ver Figura 10.19). Las secciones que contienen
aciertos se agrandan y las dems se achican. Los trminos de bsqueda que aparecen en los ttulos
de captulos o secciones se resaltan. Cuando el usuario selecciona una pgina desde la Tabla de
contenido, aparece la pgina misma en la parte derecha de la pantalla, con los trminos de consulta
resaltados.
10.6.5
En la seccin 10.4 vimos el uso de categoras o directorios para proveer vistas generales del
contenido de la coleccin de textos. Tambin pueden utilizarse metadatos referidos a categoras para
ubicar los resultados de una consulta en contexto.
Por ejemplo, en su versin original el SuperBook permita la navegacin en un documento
altamente estructurado, como un manual. El proyecto CORE extendi esta idea principal a una
coleccin de 1000 artculos a texto completo sobre qumica. Un estudio demostr su superioridad
respecto de un sistema de bsqueda estndar, en varios tipos de tareas [228]. Como no hay
disponible una tabla de contenidos para toda la coleccin, el contexto se logra ubicando a los
documentos en una jerarqua de categoras que contiene los trminos relevantes de la qumica.
Cuando se selecciona una categora, se listan los documentos asignados a la misma, para ver
mayores detalles. Todas las categoras se organizan en una jerarqua, proveyendo una vista
jerrquica de la coleccin.
Otro proyecto que usa categoras predefinidas para dar contexto a los resultados es el sistema
DynaCat [650]. Este sistema organiza los documentos recuperados de acuerdo con tipos de
categoras, seleccionadas de la taxonoma MESH. DynaCats comienza con un conjunto de tipos de
consultas que se conocen como tiles una poblacin de usuarios y una coleccin dada. Un tipo de
consulta puede comprender a varias consultas. Por ejemplo, el tipo de consulta Efectos adversos
del tratamiento cubre consultas como Cules son las complicaciones de una mastectoma?, o
Cules son los efectos colaterales de la aspirina?. Los documentos estn organizados de acuerdo
con un conjunto de criterios asociados con cada tipo de consulta. Estos criterios especifican qu
31
tipos de categoras son aceptables para organizar los documentos y cules deben ser omitidas de la
visualizacin. Una vez que las categoras han sido asignadas a los documentos recuperados, se
forma una jerarqua basada en el lugar que las categoras tienen en el MeSH.
Figura 10.20
La interfaz DynaCat para visualizar categoras que se corresponden con los tipos de
consultas
La Figura 10.20 muestra los resultados de una consulta sobre prevencin del cncer de mama. La
interfaz se distribuye en tres ventanas. La ventana superior muestra la consulta del usuario y el
nmero de documentos encontrados. La ventana de la izquierda muestra los dos primeros niveles de
las categoras, proveyendo una vista organizada de los resultados. La ventana derecha muestra todas
las categoras de la jerarqua y los ttulos de los documentos que pertenecen a esas categoras.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.6.6
A pesar de que los autores del SuperBook lo describen como un sistema de hipertexto, es mejor
pensar en l como un medio de mostrar los resultados de una bsqueda en el contexto de una
estructura que los usuarios pueden ver y comprender de una vez. El componente hipertextual no es
mencionado como la parte ms exitosa de su diseo. De hecho, parece ser la causa de uno de los
principales problemas de la versin revisada del sistema: los usuarios tienden a extraviarse de las
pginas que estn leyendo, lo que causa una prdida de tiempo.
Esta especie de extravo puede ocurrir en parte porque SuperBook usa una clase de hipertexto no
estndar, en el cual cualquier palabra es vinculada automticamente a las ocurrencias de la misma
palabra en otras partes del documento. Hoy, los sistemas de hipervnculos y el hipertexto en la Web
discriminan mucho ms el uso de las conexiones de hipervnculos (en parte porque son generadas
por autores ms que automticamente). En un estudio se mostr que los usuarios forman mejores
modelos mentales en un sistema de hipertexto pequeo organizado jerrquicamente, que en sistemas
32
que permiten un acceso ms flexible [226]. Se han investigado abundantemente los problemas
relacionados con la navegacin en hipertexto [181, 551, 440, 334].
Ms recientemente se ha utilizado informacin hipertextual para dar contexto a los resultados de las
bsquedas. A continuacin se describen algunos de estos trabajos.
Cha-Cha: SuperBook en la Web
El sistema de bsqueda intranet Cha-Cha [164] extiende la idea de SuperBook a una gran y
heterogneo sitio Web. La Figura 10.21 muestra un ejemplo. Este sistema difiere del SuperBook en
varios aspectos. En la mayora de los sitios Web no existe una verdadera tabla de contenidos o
estructura de categoras, y una intranet como las que podemos encontrar en grandes universidades o
corporaciones generalmente no estn organizadas por una unidad central. El Cha-Cha utiliza la
estructura de vnculos presente en el sitio para crear lo que se intenta como una organizacin
significativa sobre el caos subyacente. Despus que el usuario ha ingresado una consulta, se
registran los caminos ms cortos desde la pgina raz a cada uno de los aciertos de bsqueda. Se
selecciona un subconjunto de estos atajos para mostrarlos como una jerarqua, de modo que cada
acierto se muestra una sola vez. Si el usuario utiliza el trmino centro mdico en lugar de centro
de salud, y mdico aparece como trmino en un documento en la pgina Web del centro de
salud, aparecer la home page de este centro, as como aciertos ms especficos. La organizacin
que produce este mtodo es sorprendentemente comprensible en el sitio de la UC Berkeley.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Figura 10.21
33
Figura 10.22
10.6.7
Tablas
La visualizacin tabular es otra forma de mostrar las relaciones entre los documentos recuperados.
un ejemplo de este enfoque es el sistema Envision [273]: permite al usuario organizar los
resultados de acuerdo con algunos metadatos como autor o fecha, y utiliza grficos para mostrar en
cada celda los valores de los atributos asociados con los documentos (ver Figura 10.23). El color, la
forma y el tamao de los iconos se utilizan para mostrar el grado de relevancia, el tipo de
documento y otros atributos.
34
Figura 10.23
10.7
Una parte importante del proceso de acceso a la informacin es la reformulacin de las consultas, y
una tcnica efectiva para esta reformulacin es la retroalimentacin por relevancia. En su forma
original, la retroalimentacin por relevancia se refiere al ciclo de interaccin en el que el usuario
selecciona un pequeo conjunto de documentos que aparece como relevante para una consulta, y el
sistema entonces utiliza caractersticas derivadas de esos documentos relevantes seleccionados para
revisar la consulta original. Esta consulta revisada se ejecuta y se recupera un nuevo conjunto de
documentos. Los documentos del conjunto original pueden aparecer en los nuevos resultados,
aunque probablemente en otro orden de ranking. La retroalimentacin por relevancia en su forma
original ha sido mostrado como efectivo mecanismo para mejorar los resultados en muchos estudios
[702, 343, 127].
La retroalimentacin por relevancia plantea decisiones de diseo importantes, incluyendo cules
operaciones deben ser realizadas automticamente por el sistema y cules por el usuario. Bates
discute ese punto en detalle [66], afirmando que a pesar del nfasis de los sistemas modernos en
tratar de automatizar el proceso completo, es preferible un enfoque intermedio en el que el sistema
ayuda a automatizar la bsqueda a un nivel estratgico. Bates sugiere una analoga con las cmaras
fotogrficas automticas versus las manuales. En algunas ocasiones es apropiado un mtodo rpido
35
que requiere poco entrenamiento. En otras ocasiones, el usuario requiere tener ms control sobre la
mquina.
10.7.1
Una interfaz estndar para retroalimentacin por relevancia consiste en una lista de ttulos con un
lugar junto a cada titulo para que el usuario pueda marcar los documentos relevantes. Dependiendo
del sistema los documentos no marcados pueden entenderse como no relevantes o como que no se
ha emitido opinin sobre ellos. Otra opcin es proveer la eleccin entre opciones: relevante o no
relevante. En algunos casos los usuarios pueden indicar un valor en una escala de relevancia [73].
Despus de que el usuario ha realizado sus juicios de relevancia sobre un conjunto y emite una
nueva bsqueda el sistema puede revalorar automticamente la consulta y re-ejecutar la bsqueda, o
generar una lista de trminos para que el usuario seleccione y mejorar la consulta original. (Ver
Figura 10.25, en el original en ingls).
Despus de que la consulta es re-ejecutada, se muestra una nueva lista de ttulos. Puede ser til
retener las marcas en los documentos que el usuario ya juzg. Una difcil decisin de diseo
consiste en si deben mostrarse o no los documentos que el usuario ya revis, al principio de la lista.
Mostrar repetidamente el mismo conjunto de documentos al principio puede molestar al usuario que
est intentando crear un conjunto mayor de documentos relevantes. Pero, al mismo tiempo, esto
puede servir como retroalimentacin indicando que la consulta revisada no baja de categora a estos
documentos que ya han sido encontrados especialmente relevantes. Una solucin es mantener una
ventana separada que muestra los rankings de aquellos documentos que no han sido recuperados o
rankeados previamente. Otra solucin es utilizar letras ms pequeas o de otro color para los ttulos
de los documentos que ya fueron vistos.
Los motores de bsqueda en la Web han adoptado la terminologa more like this (ms
documentos como stos), como forma simple de indicar que el usuario est solicitando documentos
similares a uno que ha seleccionado. Esta interaccin de un click es ms simple que el dilogo
estndar de retroalimentacin por relevancia, que requiere que el usuario evale y marque un
pequeo conjunto de documentos y que luego vuelva a pedir un ranking. Desafortunadamente, en la
mayora de los casos se requieren muchos juicios de relevancia para que la retroalimentacin por
relevancia funcione bien. Aalbersberg propone un retroalimentacin por relevancia incremental que
trabaja con slo un documento relevante por vez.
10.7.2
36
Opaco: Las personas simplemente seleccionan documentos relevantes y luego ven los rankings
revisados.
Transparente: Las personas podan ver cmo el sistema reformulaba las consultas (esto es, ver qu
trminos eran agregados) y los rankings revisados.
Penetrable: El sistema es detenido a mitad de camino en el proceso de re-ranking. Se muestra a las
personas los trminos que el sistema habra usado para la reformulacin opaca y la transparente. Las
personas entonces seleccionan cules trminos desean agregar a la bsqueda. Luego el sistema
presenta los rankings revisados.
Las 64 personas que participaron fueron mucho ms efectivas (midiendo la precisin en los
primeros 5, primeros 10, primeros 30 y primeros 100 documentos) con retroalimentacin por
relevancia que sin l. El grupo Penetrable logr resultados significativamente mejores que el de
Control, mientras que Opaco y Transparente se situaron en el medio. Los tiempos de bsqueda no
difirieron significativamente, pero s hubo diferencias en el nmero de iteraciones de la
retroalimentacin. Las personas del grupo Penetrable requirieron mucho menos iteraciones para
lograr mejores resultados (un promedio de 5.8 ciclos en el grupo Penetrable, 8.2 ciclos en el grupo
Control, 7.7 ciclos en el Opaco y sorprendentemente, el grupo Transparente requiri 8.8 ciclos de
promedio). El nmero promedio de documentos marcados como relevantes oscil entre 11 y 14 para
las tres condiciones. Todas las personas prefirieron la retroalimentacin por relevancia sobre los
sistemas que no lo tienen, y varios sealaron que preferan una aproximacin laxa en la que se les
sugiriera trminos, antes que pensarlos por s mismos.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.7.3
El retroalimentacin por relevancia estndar se propone para mejorar las consultas o construir un
perfil de los pasos en una consulta. Investigaciones recientes ha comenzado el desarrollo de
sistemas que monitorean los progresos y la conducta de los usuarios a lo largo de perodos de
interaccin con la intencin de predecir qu documentos o acciones probablemente querr el
usuario en el futuro. Estos sistemas se llaman asistentes semiautomticos o agentes, y a menudo
utilizan tcnicas de aprendizaje por mquina [565]. Algunos de estos sistemas requieren input
explcito del usuario en forma de declaracin de metas [406] o juicios de relevancia [629], mientras
que otros intentan hacer inferencias a partir de las acciones realizadas por los usuarios.
Un sistema desarrollado por Kozierok y Maes [460, 536] hace predicciones sobre cmo
manipularn los usuarios mensajes de correo electrnico (en qu orden los leern, dnde los
archivarn) y sobre cmo organizarn encuentros en un administrador de calendario. El sistema
registra en una base de datos lo que los usuarios van haciendo y considera relevante. Despus de
una acumulacin suficiente de datos, el sistema usa el mtodo del vecino ms prximo [743] para
predecir las acciones del usuario basndose en la similaridad de la situacin corriente con respecto a
situaciones anteriores. Por ejemplo, si el usuario casi siempre guarda los mensajes de una persona
en particular en un determinado archivo, el sistema ofrece automticamente repetir la accin frente
a la misma situacin [536]. El sistema integra el aprendizaje del retroalimentacin implcito y
explcito del usuario. Si el usuario ignora la sugerencia del sistema, el sistema trata esto como
retroalimentacin negativo y lo incorpora. Despus de algunas predicciones incorrectas el sistema
pregunta al usuario de modo de ajustar las predicciones. Finalmente, el usuario puede entrenar
explcitamente al sistema presentando ejemplos hipotticos de pares de acciones que podra realizar.
Otro sistema, Syskill y Webert [629] intenta aprender a utilizar perfiles de usuario basados en
juicios de relevancia explcitos sobre pginas exploradas mientras se realiza browsing en la Web. En
37
cierto sentido, esto se parece al retroalimentacin por relevancia estndar, excepto que los juicios
del usuario son retenidos a lo largo de las sesiones y tambin difiere el modelo de interaccin:
cuando el usuario revisa una nueva pgina Web los vnculos sobre la pgina son anotados
automticamente, sean o no sean relevantes para el inters del usuario.
Letizia [518] es un sistema relacionado, trae a la atencin del usuario un porcentaje de los prximos
movimientos disponibles que ms probablemente sean de su inters, dadas las acciones anteriores
del usuario. Bajo pedido, Letizia provee recomendaciones para acciones ulteriores por parte del
usuario, generalmente en forma de sugerencias de vnculos a seguir. El sistema monitorea el
comportamiento del usuario mientras navega y lee pginas Web, y en forma paralela evala los
vnculos alcanzables desde la pgina corriente. De ese modo, el grabar una pgina como favorito se
toma como una evidencia positiva en relacin con la pgina marcada, y los vnculos dejados de lado
se toma como acciones negativas para la informacin alcanzable a travs de esos vnculos. Los links
seleccionados pueden indicar evidencia positiva o negativa, dependiendo del tiempo que el usuario
utiliza en su revisin y si la decisin de dejar rpidamente una pgina no es revisada ms tarde.
Adicionalmente, la evidencia del inters del usuario debe persistir durante la sesin de browsing. El
sistema utiliza una estrategia de bsqueda y heurstica para determinar cules pginas recomendar.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.7.4
El diseador de la interfaz debe tomar decisiones acerca de cmo organizar varias clases de
informacin en la pantalla y cmo estructurar las posibles secuencias de interacciones. Este es un
problema serio en una actividad compleja como el acceso a la informacin. En esta seccin
presentamos las opciones de diseo para el despliegue de informacin en sistemas de informacin
complejos, e ilustramos las ideas con ejemplos de interfaces existentes. Comenzamos con la
discusin de interfaces muy simples, aquellas utilizadas para bsquedas de cadenas de caracteres y
progresamos hacia interfaces multiventanas y espacios sofisticados de trabajo. Luego contina una
discusin de la integracin de la exploracin, seleccin y realizacin de consultas en interfaces de
acceso a la informacin, y concluimos con las ayudas de interfaces para retener la historia del
proceso de bsqueda.
10.8.1
Una necesidad comn y simple de bsqueda necesita una operacin encontrar, generalmente
ejecutada sobre el contenido de un documento que se est viendo. Generalmente esta funcin no
produce una salida rankeada, ni permite combinaciones booleanas de trminos: la principal
operacin es una correspondencia simple de caracteres (sin capacidad para expresiones regulares).
En forma tpica, se crea una ventana para ese propsito especial, que contiene pocos y simples
controles (por ej. Coincidir maysculas y minsculas, y bsquedas hacia delante y hacia atrs) El
38
usuario tipea la cadena buscada en un formulario de entrada y las cadenas que se corresponden se
resaltan en el texto del documento (ver Figura 10.26).
Figura 10.26
Figura 10.27
Ejemplo de correspondencia de cadenas de caracteres con una lista de resultados, en
este caso, la historia de las pginas Web recientemente visitadas, del Netscape Communicator 4.05
Estas interfaces simples pueden ser mejoradas aumentando su funcionalidad para ayudar a formular
la consulta inicial. Los errores de tipeo son la principal causa de resultados vacos. Puede ser til
una funcin de control de ortografa que sugiera alternativas para los trminos de consulta que
tienen baja frecuencia en la coleccin. Otra opcin es sugerir trminos de un tesauro asociados con
los trminos de consulta. Generalmente esta clase de informacin se muestra despus de que ha sido
entrada la consulta y han sido recuperados los documentos, pero una alternativa es proveer esta
informacin cuando el usuario entra la consulta, en forma de una vista previa de la misma.
10.8.2
Administracin de Ventanas
39
sesiones de trabajo persisten a travs del tiempo. Los usuarios deberan poder dejar una habitacin
dedicada a una tarea, trabajar en otra tarea, y tres das despus volver a la primera habitacin y ver
todas las aplicaciones en el mismo estado que las dejaron. Esta nocin de vincular aplicaciones y
datos para cada tarea ha sido ampliamente adoptado en los programas operativos que utilizan
ventanas.
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.3
Ejemplos de Sistemas
Las siguientes secciones describen el despliegue de informacin y los enfoques empleados en varias
interfaces de modernas de acceso a la informacin.
InfoGrid
Es un ejemplo de despliegue monoltico ,[667]. En l se asume que la visualizacin se divide en un
lado izquierdo y uno derecho (ver Figura 10.28). El lado izquierdo a su vez se subdivide en un rea
superior que contiene formularios de entrada estructurados para especificar las propiedades de la
consulta, una columna de controles con iconos limitando el lado izquierdo, y un rea para retener
documentos de inters en la parte inferior. El rea central principal se utiliza para ver los resultados
recuperados, o representaciones reducidas de los documentos originales, o organizaciones derivadas
de los documentos, tales como clusters Scatter / Gather. Los usuarios pueden seleccionar
documentos desde esta rea y almacenarlos en el rea inferior, o verlos en el lado derecho. La
mayor parte del lado derecho es utilizada para ver documentos seleccionados. El rea inferior a la
visualizacin del documento se destina a mostrar grficamente la historia de las interacciones
anteriores.
Parmetros
de bsqueda
Hoja de
propiedades
Panel
Panel
de
control
Imgenes
Texto
del
documento
Tabla
de
Contenidos
(TOC)
Parmetros de
bsqueda
Area
Figura 10.28
reducidas
de
retencin
Pasos
bsqueda
de
de
control
Subconjunto
de la TOC
Texto
del
documento
Los diseadores deben decidir qu tipos de informacin mostrar en la vista primaria. Si InfoGrid
fuera usada en una visualizacin pequea, o el rea de visualizacin de documentos o el rea de los
resultados deberan ser mostrados en una ventana pop-up superpuesta; de otro modo el usuario
tendra que moverse entre dos vistas. Si el sistema sugiriera trminos para retroalimentacin por
relevancia, una de las vistas existentes debera ser suplantada con esta informacin o debera usarse
una ventana pop-up para mostrar los trminos candidatos. El sistema no provee informacin
detallada para la seleccin de fuentes, a pesar de que esto podra conseguirse fcilmente con un
men pop-up en el panel de control.
SuperBook
41
42
Figura 10.29
Una arquitectura de interfaz flexible libera al usuario de la restriccin de los comandos. Por otra
parte, provee guas para ayuda al usuario a comenzar, brinda orientaciones para los procedimientos
vlidosy previene de los errores. La parte grfica de DLITE hace uso de la animacin para guiar al
usuario.
DLITE usa una ventana Web separada para mostrar informacin detallada sobre los documentos
recuperados, como las citas bibliogrficas y el texto completo. Esta ventana tambin se utiliza para
mostrar resultados clusters Scatter / Gather y permitir a los usuarios seleccionar los documentos
para un retroalimentacin por relevancia. De ese modo DLITE separa la parte de control del
proceso de acceso a la informacin de la parte de revisin y lectura. Esta separacin permite una
construccin reutilizable de las consultas, y al mismo tiempo permite una vista legible de los
documentos y las relaciones entre los mismos. La seleccin que se realice en la vista, se vincula con
la parte grfica de control, de modo que un documentos revisado en la vista puede ser utilizado
como parte de una consulta en el constructor de consultas.
DLITE tambin incorpora la nocin de espacio de trabajo, o centro de trabajo, como se lo
denomina en ese sistema. Se crean diferentes espacios de trabajo para diferentes tipos de tareas. Por
ejemplo, un espacio de trabajo para comprar software puede ser equipado con iconos que
representen fuentes de revisin de software y buenos sitios Web para buscar informacin sobre
precios.
SketchTrieve
El principio subyacente a esta interfaz [365] es la concepcin del acceso a la informacin como un
proceso informal, en el que ideas a medio terminar y caminos parcialmente explorados pueden
retenerse para un uso posterior. Los resultados pueden ser combinados mediante operaciones sobre
objetos grficos. Como se observ que los usuarios utilizan la disposicin fsica de la informacin
en una hoja para organizar esa informacin [584, 722]. Esto motiv a los diseadores del
43
SketchTrieve para permitir a los usuarios que organicen los resultados de las bsquedas de modo de
facilitar su comparacin y recombinacin (Ver Figura 10.30).
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
Figura 10.30
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.4
La seccin 10.3 present las estrategias de bsqueda de informacin y los comportamientos que han
sido observados por los investigadores en este campo. Esta discusin sugiere que la interfaz del
usuario debera mostrar cules son las opciones disponibles en un punto dado, tanto como qu
movimientos se han realizado anteriormente, tcticas de corto y de largo plazo respecto de
estrategias para el uso de los trminos, y permitir al usuario anotar las decisiones tomadas y la
informacin encontrada durante todo el proceso. Los usuarios deberan ser capaces de reunir
diferentes sesiones de bsqueda, grabar partes de una sesin, acceder y modificar flexiblemente
todas ellas. Tambin hay un inters creciente por incorporar la informacin sobre el uso y las
preferencias personales tanto en la formulacin de las consultas como en el uso de los resultados de
una bsqueda [277].
En general estas estrategias no estn bien aplicadas en las interfaces actuales; sin embargo se han
introducido algunos mecanismos en ese sentido. En particular son tiles los mecanismos para
retener la historia de las bsquedas. Usualmente estos mecanismos consisten en ver una lista de
comandos que fueron ejecutados anteriormente, En desarrollos ms recientes, se ha introducido la
historia de la bsqueda en forma grfica, grabando tanto las secuencias de comandos como los
resultados obtenidos. Kim y Hirtle [440] presentan un sumario de los mecanismos de presentacin
de historia de la bsqueda en forma grfica. En forma reciente, una interfaz grfica que muestra la
historia del acceso a pginas Web en una estructura jerrquica, permite ahorrar tiempo cuando se
vuelve a visitar los pginas accedidas anteriormente. [370].
44
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.8.5
En general, las interfaces de usuario para el acceso a la informacin no son buenas en soportar las
secuencias de movimientos desde una operacin a la otra. An algo tan simple como tomar la salida
de los resultado de una consulta y usarlos como entrada para otra consulta no est bien resulto.
Hertzum y Frkjaer [368] encontraron que los usuarios prefieren una integracin de la revisin y la
especificacin de las consultas en las interfaces. Sin embargo, no observaron mejores resultados en
tales interacciones. La hiptesis de estos autores es que si la interaccin es demasiado libre se
producen acciones errneas, y que la interaccin entre dos modos diferentes requiere ms gua.
Sugieren que se necesita ms flexibilidad pero tambin lmites.
Hay excepciones. La nueva versin Web del sistema Melvyl provee formas de tomar la salida de
una consulta y modificarlas ms tarde para su re-ejecucin (ver Figura 10.32). El sistema DLITE y
su concepto de habitaciones permite el almacenamiento y reutilizacin de estados previos. Sin
embargo, estos sistemas no integran bien el proceso general con la revisin y la seleccin de
informacin desde estructuras auxiliares.
Figura 10.32
vnculos a la jerarqua de categoras y una pgina de texto que muestra los contenidos del
documento.
El sistema permite diferentes puntos de partida. Los usuarios pueden comenzar tipeando el nombre
de una categora y mirar qu partes de la jerarqua de categoras se corresponde. Por ejemplo, la
Figura 10.34 muestra el resultado de una bsqueda sobre Radiacin en los trminos del MeSH.
La palabra aparece bajo cuatro encabezamientos principales (Ciencias fsicas, Enfermedades,
Diagnstico y Ciencias Biolgicas). Se muestra entonces por qu Radiacin aparece bajo
Enfermedades (como parte de una rama sobre accidentes ocupacionales). Ahora el usuario puede
seleccionar uno o ms de estas categoras como entradas de la especificacin de la consulta.
Figura 10.33
La interfaz Cat-a-Cone que integra la revisin de categoras y de documentos con la
bsqueda [358]
Otra forma en que el usuario puede comenzar es tipeando una consulta en texto libre. Esta consulta
es equiparada con la coleccin. Los documentos relevantes son recuperados y ubicados en un
formato de libro. Cuando el usuario abre el libro de un documento recuperado, se muestran las
partes de la jerarqua de categoras en la representacin jerrquica. De ese modo, se muestran varias
categoras simultneamente, en su contexto. Esta interfaz combina la manipulacin de extensos y
complejos metadatos, puntos de partida, revisin y realizacin de consultas en una misma interfaz.
Tambin permite una retroalimentacin por relevancia mediante la sugerencia de categoras
adicionales que estn relacionadas con los documentos que han sido recuperados.
46
Figura 10.34
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
10.9
47
48