Sei sulla pagina 1di 5

PRÁCTICO • Greenstone

Construyendo Bibliotecas Digitales con Greenstone

EL COLECCIONISTA
El paquete Greenstone te ayuda a construir tu propia biblioteca

digital. POR CHI-YU HUANG

P
ublicar documentos en la web es Waikato en Nueva Zelanda [1]. El de las distribuciones Linux, y en todo
sencillo, pero los bibliotecarios, paquete Greenstone proporciona una caso se puede descargar de [5].
documentalistas y otros expertos nueva forma de organizar, preservar y Otro de los requisitos de Greenstone es
necesitan sistemas más sofisticados para publicar información en Internet o en un Perl. Para comprobar que Perl ya está insta-
organizar la información en colecciones CD/DVD. No se necesita de ningún soft- lado en nuestro sistema podemos abrir un
digitales. Una opción es construir una red de ware adicional para acceder a una terminal y escribir perl -v para ver si aparece
notas e índices estáticos, aunque esta alter- colección de documentos Greenstone. un mensaje donde se indica la versión del
nativa es demasiado poco flexible, Valdría con cualquier navegador web. intérprete. Como en el caso anterior, la
requiriendo un incremento del trabajo y Una biblioteca Greenstone puede ges- mayoría de las distribuciones Linux vienen
actualizaciones constantes. Otras colecciones tionar gran cantidad de tipos diferentes con una versión de Perl disponible.
digitales hacen uso de scripts caseros y otras de formatos de documentos, incluidos Nuestra aplicación se ejecuta en la mayo-
herramientas propias, pero estas herramien- HTML, PostScript, PDF y MS-Word. De ría de los Sistemas Operativos además de
tas vuelven a necesitar un trabajo hecho, Greenstone no está limitado a Linux, existiendo una versión para Solaris,
considerable y un mantenimiento continuo. documentos de texto, sino que además Mac OS/X y Windows. De hecho, se podrá
Una opción para los usuarios de software puede gestionar documentos de imagen, ejecutar en casi cualquier variante de Unix.
libre que quieren construir colecciones digi- audio y vídeo. Naturalmente para compilar Greenstone
tales de una manera rápida y flexible es Esta herramienta consigue la indexa- desde su código fuente en Unix, necesitare-
Greenstone. Greenstone es un conjunto de ción de todo el texto almacenado, mos del compilador C/C++ de GNU
herramientas que pueden ser usadas para la permitiendo a los usuarios la búsqueda (GCC) y, eso sí, del Gestor de Bases de
construcción de nuestras propias bibliotecas en el contenido de los documentos o en Datos de GNU (GDBM).
digitales. Este software no sólo indexa nues- los metadatos almacenados, tales como
tros documentos, sino que además el título y autor. Greenstone es además Instalación
proporciona un interfaz para la definición y altamente configurable, permitiendo a Lo primero que hay que hacer para instalar
organización de los metadatos. La herra- los usuarios el diseño de la apariencia y Greenstone es descomprimir el fichero tar:
mienta Greenstone proporciona a los del comportamiento de la colección, así
documentalistas y gestores de colecciones como del interfaz web. $ tar xzvf gsdl-2.62-unix.tar.gz
cierta ventaja en la tarea de crear librerías La aplicación soporta múltiples len-
digitales elegantes y altamente estructuradas. guajes, incluidos el Árabe, Chino, Inglés, La última versión tiene un instalador que
En este artículo introduciremos el soft- Francés, Maorí y Español entre otros. nos guía pasa a paso por el proceso de insta-
ware para la generación de colecciones Puedes encontrar ejemplos de bibliote- lación. Para ejecutar este instalador:
digitales Greenstone, y describiremos cómo cas digitales desarrolladas con
instalarlo y configurarlo. Adicionalmente Greenstone en [2] y [3]. $ cd gsdl-2.62-unix
mostraremos cómo construir una biblioteca $ ./setupLinux.bin
digital haciendo uso de un DVD que hemos Preparación
creado a partir de un montón de artículos Greensone requiere de un servidor web El programa es instalado en /usr/local/gsdl
de Linux Magazine descargados de Internet y, naturalmente, Apache es el recomen- por defecto, pero esto requiere de privile-
y clasificados por número. dado. Supondremos que el servidor web gios de administrador. De todas maneras es
Apache ya está instalado y nos centrare- posible configurar la instalación para que
Qué es Greenstone mos en cómo configurarlo para que ésta se produzca en el directorio home del
Greenstone es un programa de biblioteca funcione con la herramienta. Además, usuario. Existen tres opciones diferentes de
digital desarrollado en la Universidad de Apache está disponible para la mayoría instalación:

34 Número 20 WWW.LINUX-MAGAZINE.ES
Greenstone • PRÁCTICO

• Biblioteca Web (Web Library)


• Código Fuente (Source Code) Alias /gsdl U
• Personalizada (Custom) “/home/myuser/local/gsdl”
Si seleccionamos la segunda opción, Código <Directory U
Fuente, el instalador copiará todos los fiche- “/home/myuser/local/gsdl”>
ros necesarios en los directorios de destino. Options Indexes
De esta manera podremos compilar el MultiVires U
código fuente con: FollowSymLinks
AllowOverride None
$ ./configure Order allow, deny
$ make && make install Allow from all
</Directory>
El tiempo de compilación es variable,
dependiendo de las características de la Hay que fijarse en la referencia a
máquina. Si estamos usando una máquina /home/myuser/local/gsdl en las directivas
Linux sobre un PC Intel x86 y es la primera anteriores. Es necesario cambiar este
vez que usamos Greenstone, se recomienda camino por el directorio donde tengamos
seleccionar la primera opción: Web Library, instalado el programa Greenstone.
que es la que instalará los binarios ya pre- Una vez reiniciado el servidor Apache,
compilados. Esta opción sólo tardará unos podemos acceder a Greenstone a través
minutos. Al final de la instalación, seremos de nuestro navegador web y yendo a la Figura 1: Estructura de una instalación
consultados por una contraseña de admi- dirección mostrada [6]. Podemos omitir Greenstone.
nistración. el puerto de la URL si nuestro servidor
web está funcionando en el puerto por
Construyendo con GLI
Montando el Servidor Web defecto 80. Por otro lado, si estamos eje- Para poder empezar a ver cómo funciona
Suponiendo que estamos usando el servi- cutando Apache como un usuario no realmente Greenstone, mostraremos cómo
dor Apache y que éste ya está en privilegiado y hemos modificado el construir una colección de biblioteca digital
funcionamiento, seguramente necesitare- puerto de acceso, deberemos especifi- haciendo uso de los archivos en DVD des-
mos los privilegios de administrador (root) carlo en la URL. cargados de Linux Magazine. Hay que notar
para realizar los cambios que vienen a con- que esta colección es sólo para uso perso-
tinuación. Como es costumbre, si no La Estructura de Greenstone nal. Como norma general es importante
disponemos de dichos privilegios debere- La estructura de directorio de Greenstone asegurarnos de cumplir los requisitos de la
mos hablar educadamente con el es mostrada en la Figura 1. Cuando cons- licencia para cualquier material que publi-
administrador del sistema para que nos truimos una nueva colección ésta es quemos en formato biblioteca digital.
eche una mano. Otra opción sería instalar y creada en una nueva carpeta, llamada Nos aseguramos de que el DVD está
ejecutar Apache como un usuario normal. collection_name, en el directorio de colec- introducido en la unidad y que está mon-
El servidor web debe poder ejecutar el ciones de Greenstone tado. Necesitamos conocer dónde está el
programa de biblioteca, que corresponde /home/myuser/local/gsdl/collect. Cada directorio de montaje. Por ejemplo, en
con la aplicación web de biblioteca de colección contiene la misma estructura Ubuntu el DVD se monta en /media/cdrom.
Greenstone. Usaremos la directiva directorio y subdirectorios (ver Figura 1). Ahora podemos construir la colección
ScriptAlias de Apache para configurar un En el directorio import es donde debe- usando el Interfaz de Biblioteca de Greens-
directorio cgi-bin para nuestra aplicación. mos localizar nuestro material original. El tone (Greenstone Librarian Interface – GLI).
Esto lo haremos añadiendo las siguientes directorio archive contiene los resultados La GLI es una aplicación gráfica incluida en
directivas al fichero de configuración de del proceso de importación. El directorio la distribución Greenstone que nos permite
Apache, httpd.conf: building es un directorio temporal usado construir y adaptar nuestras colecciones de
durante el proceso de construcción de la manera sencilla mediante el uso del ratón.
ScriptAlias /gsdl/cgi-bin U colección. Su contenido es movido al GLI es una aplicación Java que necesita del
“/home/myuser/local/gsdl/cgi-bin” directorio index una vez ha concluido el Java Runtime Environment 1.4 de Sun. Para
<Directory U proceso. El directorio etc contiene la infor- ejecutar GLI tenemos que escribir:
“/home/myuser/local/gsdl/cgi-bin”> mación de configuración de la colección,
Options None localizada principalmente en el fichero cd /home/myuser/local/gli
AllowOverride None collect.cfg. El directorio images contiene ./gli.sh
</Directory> las imágenes específicas de la colección.
En el directorio perllib podemos encontrar Cuando ejecutamos GLI por primera vez
Necesitaremos además configurar el direc- los diferentes programas Perl específicos seremos consultados por la URL de nuestra
torio de Greenstone para que sea accesible de la colección. Para obtener más infor- biblioteca Greenstone, que como ya hemos
por web, añadiendo la siguiente directiva mación de la estructura de directorios del comentado se encuentra localizada en [6].
Alias tras la directiva ScriptAlias de nuestro sistema Greenstone es necesario consul- GLI nos proporciona un entorno de tipo
fichero de configuración: tar la Guía de Usuario [8]. walkthrough para la construcción de

WWW.LINUX-MAGAZINE.ES Número 20 35
PRÁCTICO • Greenstone

Figura 2: El interfaz de bibliotecario de Greenstone (GLI). Figura 3: Las herramientas de diseño están disponibles desde el
panel de Diseño.

nuestras colecciones digitales. En este asignada a una carpeta es heredara por Hay que destacar que no existe un campo
procedimiento los pasos básicos son: todos los ficheros incluidos en ésta. para ‘número de publicación’ en el con-
Una vez copiados los documentos (o junto de metadatos establecidos por Dublin
• Reunión de documentación (en los directorios) al área de colección, podríamos Core. Es por eso por lo que hemos usado el
paneles Download y Gather)
necesitar cambiar los permisos de los fiche- campo dc.Description para almacenar dicha
• Asignación de metadatos (panel Enrich)
ros para lograr la correcta construcción de información. Adicionalmente, a nivel de
• Diseño de las estructuras de indexación
y navegación ésta: fichero, hemos añadido la entrada para
título en el campo dc.Title (en sustitución
• Construcción de la colección
cd /home/myuser/local/gsdl/collect/U del poco útil valor encontrado automática-
Para crear una nueva colección elegimos limuxmag/import mente). Hemos añadido la sección de Linux
New en el menú File. Introducimos el nom- chmod -R +w * Magazine (ej: Noticias Kernel, Práctico,
bre de la colección (sugerimos “Linux Desarrollo) al campo de metadatos
Magazine”) y una descripción antes de pul- Ahora estamos listos para la construcción de dc.Resource Identifier. El prefijo dc viene de
sar OK. Cuando nos pregunte por el tipo de la colección. Para este ejemplo, hemos Dublin Core, que corresponde con el están-
metadatos a usar es conveniente seleccio- copiado sólo los artículos de los números de dar de metadatos adoptado por Greenstone.
nar el conjunto de metadatos de Dublin 1 al 4. De esta manera lograremos disminuir En Greenstone los documentos y las
Core. Podemos seleccionar documentos (o el tiempo del proceso de construcción. Si especificaciones de metadatos son importa-
directorios completos de documentos) deseamos trabajar con el archivo completo dos por módulos software denominados
desde el panel de trabajo (Workspace, deberemos arrastrar todos los directorios, plugins. Éstos permiten que la aplicación
situado a la izquierda) y arrastrarlos hasta el pero habrá que estar preparados a esperar un soporte diferentes formatos de documentos.
panel de colecciones (Collection, a la dere- poco hasta que se complete todo el proceso Podemos añadir o eliminar plugins depen-
cha). El comportamiento de GLI es similar de construcción. diendo de los documentos que tengamos en
al de los gestores de ficheros usuales, permi- Para construir la colección sólo hay que ir nuestra colección (los únicos obligatorios
tiendo la copia y eliminación de ficheros de al panel Create y pulsar sobre el botón Build son GAPlug, ArcPlug y RecPlug). Puesto que
nuestra colección (Figura 2). Collection. Una vez esté finalizado, nuestra el archivo de documento de Linux Maga-
Greenstone es capaz de extraer de colección estará disponible para su acceso. zine está compuesto principalmente por
manera automática la útil metainformación Para poder verla en nuestro navegador web, documentos PDF y HTML, los plugins más
de los ficheros de documentos durante el deberemos pulsar sobre el botón Preview importantes para esta colección serían
proceso de construcción. Esta característica Collection. Como ya se ha comentado, en el PDFPlug y HTMLPlug.
es realmente interesante cuando el docu- caso de que existan metadatos, éstos serán
mento contiene metadatos del tipo título, extraídos automáticamente durante el pro- Indexado
autor, temática o palabras clave. Puesto que ceso de construcción. En este caso hemos Greenstone permite la búsqueda de texto,
los documentos de nuestro DVD no contie- tenido que realizar algunos arreglillos de por todo el cuerpo del documento de la
nen este tipo de metadatos, GLI no podrá manera manual. Desde el panel Enrich colección, desde una ventana de navega-
extraer nada demasiado útil de manera hemos añadido el número de la publicación ción web. Podemos buscar por cualquier
automática. Podemos, por otro lado, añadir de Linux Magazine en el campo dc.Descrip- combinación de palabras o frases. Por
la metainformación de manera manual en tion a nivel de carpeta. Haciendo esto hemos defecto, las colecciones Greenstone vienen
el panel destinado a esta tarea, Enrich. Los logrado que todos los artículos de una misma con tres índices de consultas: texto, título y
metadatos pueden ser tratados a nivel de publicación queden agrupados cuando se fuente. Podemos cambiar los índices asigna-
carpetas o ficheros. La metainformación establezca una clasificación de navegación. dos a nuestra colección desde la sección

36 Número 20 WWW.LINUX-MAGAZINE.ES
Greenstone • PRÁCTICO

Índices de Búsquedas del panel de diseño de navegación. El clasificador AZList mues- Características de Formato
(Figura 4). También es posible eliminar el tra los términos clasificados en orden
índice de fuente de nuestra colección Linux alfabético, mientras que el clasificador Las páginas web de la biblioteca Greens-
Magazine, puesto que hace referencia sólo AZCompactList agrupa los términos que apa- tone son generadas dinámicamente bajo
al nombre del fichero del documento, y en recen repetidos en la jerarquía bajo un nuevo demanda. Los comandos de formato se
este ejemplo no es un parámetro de bús- nodo, mostrado con un icono similar a una usan para poder cambiar la apariencia de
queda útil. Además hemos añadido el estantería. Los parámetros de clasificación (y dichas páginas, en especial en cómo son
campo de metadatos dc.Title como un ele- sus opciones asociadas) de nuestra colección mostrados los documentos en la navega-
mento para el índice de título. Linux Magazine son: ción y en la lista de resultado de
La Figura 5 muestra el interfaz de búsque- búsquedas.
das para la búsqueda por títulos. Greenstone • Para la navegación por título: AZList Para poder manipular los comandos de
permite al usuario indicar términos de con- -metadata dc.Title formateo es necesario elegir las Caracterís-
sultas más complejos. El interfaz de • Para la navegación por número de ticas de Formato (Format Features) del
búsqueda avanzada puede ser adaptado publicación: AZCompactList -metadata panel de Diseño. Podemos hacer uso de
desde la opción de Preferencias, localizada dc.Description -buttoname issue etiquetas HTML, valores de metadatos
en la esquina derecha de nuestra página de la • Para navegar por las secciones de Linux (encerrados entre corchetes), algunos
colección. Magazine: AZCompactList -metadata comandos propios de formateo de cadenas
dc.Resource Identifier -mingroup 1 -but- (ej: highlight, numleafdocs) y expresiones
Clasificaciones de Navegación tonname section condicionales (cómo {If} o {Or}). El lis-
Greenstone permite a los usuarios navegar tado completo se encuentra en [7].
por los documentos de la colección. La Al establecer la opción mingroup a 1 indica- Podemos adaptar la estética de cada una
estructura de la navegación es generada de mos que el nodo de estantería debe ser de las clasificaciones de navegación. Por
manera automática a partir de los metadatos creado al nivel más alto, aún cuando exista ejemplo, para el clasificador de navegación
asociados a cada documento de la colección. un solo ítem en el grupo. Desde el interfaz de Título, seleccionemos CL1:AList -meta-
Podemos establecer los clasificadores de web de Greenstone podemos seleccionar una data dc.Title desde la sección de Selección
navegación desde la opción de mismo nom- de las clasificaciones de navegación (por de Características (Choose Feature), y VList
bre situada en el panel de diseño (Figura 6). ejemplo: títulos, autor y práctico) pulsando (determina el formato de la lista vertical de
Todos los clasificadores generan una estruc- sobre el icono correspondiente. resultados de la búsqueda) del compo-
tura jerárquica que es usada para mostrar un Podemos configurar el icono de cada clasi- nente elegido. Nosotros hemos adaptado la
índice de navegación. El nivel más bajo en ficación de navegación. Si no estamos apariencia usando para ello las siguientes
dicha jerarquía corresponde normalmente a conforme con los valores establecidos por sentencias de formato:
los documentos, pero podría estar consti- defecto, podremos crear nuestros propios
tuida por secciones para algunos iconos. En nuestro ejemplo hemos creado <td valign=top>U
clasificadores. Existen varios tipos de clasifi- nuevos iconos para las opciones de navega- [link][icon][/link]</td>
cadores disponibles; para ver los detalles es ción de secciones y publicaciones. Es posible <td>[srclink][srcicon]U
mejor consultar la Guía de Desarrollo de Gre- asociar estos iconos con sus respectivas clasi- [/stclink]</td>
enstone [7]. ficaciones añadiéndolos en la opción nombre <td>[highlight]{Or}U
Para nuestra colección de Linux Magazine, del botón (buttonname, Figura 6). Mostrare- {[dc.Title],[ex.Title],U
hemos usado los clasificadores AZList y mos después cómo crear estos iconos de Untitled}[/highlight]
AZCompactList para establecer la estructura estilo similar a los de Greenstone. <br>[dc.Description]</td>

Figura 4: Define los ajustes del índice en la sección de Índices de Figura 5: El interfaz para la búsqueda de títulos usando nuestra muy
Búsquedas del panel de Diseño. útil colección de ejemplo.

WWW.LINUX-MAGAZINE.ES Número 20 37
PRÁCTICO • Greenstone

Figura 6: Configurando las clasificaciones de navegación desde el Figura 7: Navegando por títulos en Greenstone.
panel de Diseño.

Esta sentencia de formato nos mos- <br>[dc.Description]. ver cualquier cambio efectuado simple-
trará un icono que enlaza a la <td valign=top>U mente refrescando la página web o
versión Greenstone del documento, [link][icon][/link]</td> pulsando sobre el botón de Vista Previa de
un icono que enlaza al documento <td>{If}{[numleafdocs],U la Colección (Preview Collection) en el panel
original, el titulo y los detalles de <b>[Title]([numleafdoc])</b>,U de creación. Para más opciones de adapta-
publicación para cada documento en [srclink][srcicon][/srclink] ción y operación hay que consultar la Guía
la lista de navegación A-Z de títulos <td>[highlight]{Or}U de Usuario de Greenstone [8].
(Figura 7). {[dc.Title],[ex.Title],U
Con el clasificador de navegación Untitle}[/highlight]<br>U Sumario
por publicaciones (usando [dc.Description]</td>}</td> Greenstone se revela como una herramienta
CL2:AZCompactList -metadata dc. extremadamente útil en aplicaciones de
Description en Choose Feature y VList Cada una de las opciones y configuración ordenación, búsqueda y organización de un
en el componente seleccionado), anteriores pueden establecerse fácilmente número grande de documentos electróni-
hemos realizado el formateado con desde la sección Format Features del panel cos. Una vez construida y adaptada la
las siguientes sentencias: de diseño de GLI. Las opciones de formatos biblioteca digital, ésta estará accesible desde
pueden cambiarse sin necesidad de volver a cualquier navegador web. ■
<td valign=top>U reconstruir la colección.
[link][icon][/link]</td> Recursos
<td>{If}{[numleafdocs],U Sencilla Adaptación de la
<b>[Title]([numleafdoc])</b>,U Colección [1] El Proyecto de la Librería Digital de
Nueva Zelanda: http://www.nzdl.org
[srclink][srcicon][/srclink] Añadir un nuevo icono a nuestra colección
[2] Poyectos de DL Consulting: http://
<td>[highlight]{Or}U es sencillo. Podemos indicar los iconos aso-
www.dlconsulting.co.nz/cgi-bin/index.
{[dc.Title],[ex.Title],U ciados a las páginas ‘acerca de…‘ y la
cgi?a=p&p=projects
Untitle}[/highlight]U principal desde la sección general del panel
[3] Ejemplos de Greenstone en Acción:
</td>}</td> de diseño. Además, Greenstone propor-
http://www.greenstone.org/cgi-bin/
ciona ciertas facilidades para la creación de
library?a=p&p=examples
Con esto lograremos que los docu- imágenes de colección e iconos de clasifica-
[4] Descarga del Software Greenstone:
mentos queden agrupados bajo sus dores de estilo similar a los usados por este
http://prdownloads.sourceforge.net/
respectivas publicaciones, y mostra- programa. Podemos ir a la página http://
greenstone/gsdl-2.62-unix.tar.gz
remos el número total de www.greensotne.org/make-images.html
[5] Apache: http://www.apache.org
documentos para cada publicación. para crear nuevas imágenes e iconos. Estos
De manera similar, las opciones gráficos deben ser alojados en la carpeta de [6] Apunta tu navegador a la URL: http://
para el clasificador de navegación de imágenes de la instalación de Greenstone localhost:9090/gsdl/cgi-bin/library
secciones (seleccionamos (consultar la Figura 2). La página web [7] Adaptando tu Librería Greenstone:
CL3:AZCompactList -metadata explica cómo configurar Greenstone para http://www.greenstone.org/cgi-bin/
library?a=p&p=faqcustomize#customi
dc-Resource Identifier en Choose Fea- usar las nuevas imágenes creadas.
zeformat
ture y VList para nuestro Es posible reconstruir nuestra colección
componente) son las que mostramos en cualquier momento. Los comandos de [8] Documentación de Greenstone:
http:///www.greenstone.org/cgi-bin/
un poco más abajo. Aquí se ha aña- formato pueden ser modificador sin necesi-
library?a=p&p=docs
dido una opción adicional: dad de reconstruir la colección. Podremos

38 Número 20 WWW.LINUX-MAGAZINE.ES

Potrebbero piacerti anche