Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
and
Emilio
Rodrguez-V.-de-Aldana,
University
of
RESUMEN
En la ltima dcada hemos asistido al crecimiento de las webs dinmicas (que presentan
una muy superior complejidad estructural y dispersin fsica del contenido con respecto a
las tradicionales webs estticas) gracias, fundamentalmente, a la aparicin de los
sistemas de gestin de contenido web (WCMS), que permiten la creacin y el
mantenimiento de las mismas sin necesidad de conocer los lenguajes informticos que la
sustentan. Este cambio de paradigma se produce cuando las herramientas de traduccin
asistida por ordenador son cada vez ms eficaces y usables para la gestin y localizacin
de sitios web estticos, de modo que parecera que estamos perdiendo las ventajas de
contextualizacin visual y funcional de la informacin, la capacidad de reconstruccin y
publicacin inmediata de la web, y la ayuda de memorias y terminologas. En este
trabajo investigamos, siguiendo una orientacin didctica, el estado de la cuestin,
comparando los objetos y mtodos de traduccin de los sitios web estticos y dinmicos,
y analizando la posicin del traductor/localizador en este proceso. Posteriormente,
apuntamos hacia la investigacin y los desarrollos necesarios para la recuperacin del
terreno perdido con los nuevos WCMS, incluido el uso de estndares como XLIFF, ITS u
otras tecnologas de la web semntica.
ABSTRACT
Over the last decade, dynamic websites (which are structurally much more complex than
traditional static websites, with localisable content scattered in many more files and
databases) have grown exponentially, mainly due to specialised Web Content
Management Systems (WCMS), which help create and maintain websites with little or no
knowledge of the underlying technology and computer languages. This paradigm shift
has taken place just as Computer-Aided Translation Tools have become more and more
effective and usable for the translation and localisation of static websites. As a
consequence, we seem to be missing out on recently acquired advantages such as visual
and functional contextualisation, the ability of web re-creation for immediate publication,
and translation memory and terminology aids. This research aims, from a didactic
perspective, at exploring the state of the art of static and dynamic web localisation by
comparing their translation objects and methods, and analysing the place of the
translator/localiser in this process. We then suggest possible avenues for research and
development in order to regain lost ground with the spread of new website WCMSs,
including the use of standards such as XLIFF, ITS and other semantic web technologies.
Palabras Clave
Sitio web, web esttica, web dinmica, sistema de gestin de contenido web (WCMS),
traduccin asistida por ordenador (TAO), XLIFF, base de datos, HTML, pginas activas,
localizacin, didctica.
KEYWORDS
Static website, dynamic website, Web Content Management System (WCMS), ComputerAided Translation (CAT), XLIFF, database, HTML, active pages, localisation, training.
153
1. Introduccin
El lenguaje HTML (HyperText Markup Language) debe formar parte del
bagaje cognitivo y tcnico de todo localizador que se precie. Sera incluso
difcil de justificar que un graduado en Traduccin, aunque no se
especializara en el mbito de la localizacin, desconociera su existencia,
su estructura bsica, algunos de sus elementos principales, su funcin y la
forma de traducir el contenido codificado en dicho lenguaje. En este
sentido, podramos argumentar que las pginas en HTML se sitan en el
lmite entre la especialidad de la localizacin y la traduccin general o
especializada tradicionales, debido tanto al tipo de archivos que debe
manejarse para su tratamiento como a la generalizacin de los filtros para
este lenguaje en los programas de Traduccin Asistida por Ordenador
(TAO) convencionales. El siguiente es un esquema que da cuenta de esta
dualidad (Tabla 1): as, en unas condiciones u otras, la traduccin de
pginas en HTML requerira competencias de traduccin generales o
especializadas en localizacin:
Traduccin general
Tipo de documento
En
ocasiones,
necesidad de localizar
Generalmente slo se
otros
archivos
traduce un documento
asociados, que pueden
sencillo
en
formato
contener
texto
(X)HTML.
traducible (imgenes,
CSS, JavaScript).
La mayora de los
programas
de
TAO
Visibilidad de cdigos
permiten ocultar los
internos
/
interfaz
cdigos
internos
u
WSIWYG
ofrecer una interfaz
WYSIWYG.
Encaje
de
los
documentos en los
programas de TAO y
de localizacin
Localizacin
Mayor concentracin y
visibilidad de cdigo
dinmico
(enlaces,
objetos, scripts).
Encajan naturalmente
Encajan naturalmente
y
ofrecen
parsers
y ofrecen filtros para
(analizadores)
para
HTML, e incluso en
HTML y otros lenguajes
ocasiones JavaScript.
dinmicos asociados.
Conocimiento
Facilidad de gestin de
especializado y tcnico,
la macroestructura e
Competencia propia de
no habitual entre las
hiperestructura textual
la localizacin.
competencias
(sitio web)
generales.
Tabla 1: competencias de traduccin y de localizacin relacionadas con el
lenguaje HTML y las webs
157
160
La idea que acabamos de exponer nos permite entender que una base de
datos es un conjunto de informacin almacenado en mltiples filas de
diversas tablas, que el diseador ha organizado siguiendo una cuidadosa
metodologa (De Miguel, Piattini y Marcos 1999; Silberschatz, Korth y
Sudarshan 2006) para que los datos, aparentemente dispersos, puedan
combinarse de mltiples formas en una sola tabla segn el propsito de la
solicitud. As, como veamos en las ilustraciones anteriores, la base de
datos de nuestra web almacena en una tabla determinada el texto de las
opciones del Men Principal en el idioma de origen (aqu, ingls). Todas
las traducciones que se efectan al espaol en nuestra web se guardan en
otra tabla distinta de la BD. Naturalmente, como la base de datos ha sido
diseada de alguna forma para poder emparejar los textos equivalentes
de las diferentes lenguas, es posible, como antes, mediante una sentencia
de seleccin, obtener una tabla que agrupe la informacin dispersa de
ambas. Esto es lo que pretende expresar la ilustracin 6: aunque
fsicamente estn en dos tablas distintas de la BD, las opciones del men
principal en ingls y en espaol pueden reunirse, con la expresin
adecuada de seleccin, en una nueva tabla virtual que empareja en la
misma fila el texto ingls con su correspondiente traduccin 7. Es lo mismo
que ocurre en realidad cuando se selecciona, en el WCMS, un elemento
para traducir (vase, ms adelante, ilustracin 11): el gestor de contenido
realiza una consulta en la BD en funcin de lo que se ha solicitado
traducir, y rene en una tabla el texto original y el espacio para insertar el
de destino.
161
165
168
170
Varios son los inconvenientes de este mtodo (cf. Schnabel 2013: 12): en
primer lugar, el traductor ha de recibir derechos administrativos del sitio;
por otro lado, no estara beneficindose de todas las herramientas que le
proporciona un programa de TAO, incluidas las correspondencias de los
textos actualizados con los fragmentos almacenados en la memoria de
traduccin; por ltimo, debe conocer el funcionamiento del gestor de
contenido, incluida la manera de localizar (adaptar) los vnculos internos,
y recibir indicaciones muy precisas sobre los elementos concretos que
debe traducir, as como si puede, o debe, tocar algunos de los campos
asociados al texto (alias, etc.).
Propuestas de futuro
El perfecto engarce entre la localizacin y los sistemas de desarrollo y
gestin de contenido de una web dinmica multilinge comenzar a
producirse solamente cuando haya un compromiso mutuo entre las
formas de interpretar, estructurar y dar significado a la informacin y la
tarea de cada uno de estos mbitos, haciendo uso, eso s, de la evolucin
de los lenguajes y tecnologas que buscan la mxima interoperabilidad
tcnica y semntica entre herramientas y agentes implicados, en sintona
con los esfuerzos e iniciativas que se despliegan en eventos peridicos
como FEISGILTT (Federated Event for Interoperability Standardization in
Globalisation,
Internationalisation,
Localisation
and
Translation
Technologies), que en su edicin de 2013 dedic un amplio espacio
171
173
Bibliografa
De Miguel, Adoracin y Mario Piattini (1993). Concepcin y diseo de bases de
datos. Del Modelo E/R al Modelo Relacional. Madrid: Ra-ma.
De Miguel, Adoracin, Piattini, Mario y Esperanza Marcos (1999). Diseo de
bases de datos relacionales. Madrid: Ra-ma.
Elmasri, Ramez and Shamkant B. Navathe (2007). Fundamentos de sistemas de
bases de datos. Madrid: Addison Wesley.
Gouadec, Daniel (2002). Training Translators: Certainties, Uncertainties,
Dilemmas." Belinda Maia, Johann Haller and Margherita Ullrych (eds) (2002). Training
the Language Services Provider for the New Millennium. Porto: Universidade do Porto,
31-41.
Gutirrez Gallardo, Juan Diego (2010). Desarrollo Web con PHP 6 y MySQL 5.1.
Madrid: Anaya Multimedia.
Jimnez-Crespo, Miguel A. (2013). Translation and Web Localization. London and
New York: Routledge.
Montalt, Vicent (2003). La traduccin de gneros electrnicos: el caso de la
localizacin." Miguel . Garca Peinado and Emilio Ortega Arjonilla, Emilio (dirs)
(2003). Panorama actual de la investigacin en traduccin e interpretacin, vol. II,
parte II, Seccin III, 313-328.
Pym, Anthony (2002). Training Language Services Providers: Local Knowledge in
Institutional Contexts." Belinda Maia, Johann Haller and Margherita Ullrych (eds)
(2002). Training the Language Services Provider for the New Millennium. Porto:
Universidade do Porto, 21-30.
Pym, Anthony (2009). Exploring Translation Theories. Oxford: Routledge.
Rodrguez-V.-de-Aldana, Emilio y Jess Torres-del-Rey (2014). "Localizacin del
texto de una web multilinge creada con un gestor de contenidos: el ejemplo de
Joomla!". Beln Santana Lpez and Crspulo Travieso Rodrguez (eds) (2014). Puntos
de encuentro: los primeros 20 aos de la Facultad de Traduccin y Documentacin de
la Universidad de Salamanca. Salamanca: Universidad de Salamanca.
Schnabel, Bryan (2013). "Making the Multilingual Web Work: When Open Standards
Meet CMS". W3C Workshop Program: Making the Multilingual Web Work. Roma, 12-13
de
marzo
de
2013.
http://www.w3.org/International/multilingualweb/rome/slides/11_schnabel.pdf
(consultado 13.09.2013).
Silberschatz, Abraham, Korth, Henry F. and S. Sudarshan (2006). Fundamentos
de bases de datos. Madrid: McGraw-Hill.
Zerfass, Angelika (2002). "Evaluating Translation Memory Systems." LREC 2002:
Language Resources in Translation Work and Research. (Las Palmas de Gran Canaria,
29-13 May 2002), 49-52.
Zielinski, Daniel and Martin Beuster (2012). "Localizing Dynamic Websites Created
from Open Source Content Management Systems." memoQfest 2012 (Budapest, 10 de
mayo
de
2012).
174
http://www.loctimize.com/fileadmin/user_upload/termine/20120510_memoQfest/201
20510_WebL10N_memoQfest_Budapest.pdf (consultado 13.09.2013).
Notas biogrficas
Jess Torres del Rey es profesor del Departamento de
Traduccin e Interpretacin de la Universidad de
Salamanca, donde imparte asignaturas de grado y
posgrado sobre tecnologas de traduccin, localizacin
y gestin de proyectos, y donde se doctor en 2003
con una tesis sobre las implicaciones filosficas y
prcticas de las nuevas tecnologas en el campo de la
traduccin y en su enseanza. Es miembro de The
Institute of Localisation Professionals (TILP).
jtorres@usal.es
El acrnimo ingls es Database Management System DBMS. Productos de este tipo son, entre otros
muchos, MySQL y Oracle.
2
Con la expresin manipular una base de datos nos referimos tanto a consultar como a actualizar (insertar,
borrar o modificar) informacin.
3
Nos referimos a los sistemas de memorias de traduccin organizados en bases de datos, segn la clasificacin
de Zerfass (2002).
4
Por ejemplo, las memorias de traduccin de SDL Trados, Kilgray memoQ y Atril Dj Vu X2 en red se gestionan
mediante el SGBD Microsoft SQL Server.
5
Las tablas no son la nica forma de organizar datos en las bases de datos. Existen otras, pero sta es la
dominante (Elmasri y Navathe 2007).
175
Dicha sentencia pertenece al lenguaje SQL (Structured Query Language), un lenguaje estndar (ANSI e ISO)
para la manipulacin de BD basadas en lo que se conoce como modelo relacional. Muchos de los SGBD actuales
incorporan dicho lenguaje. Por la misma razn, muchos de los productos incorporan dichas siglas en su
nombre: MySQL, PostgreSQL, SQLite, SQL Server Naturalmente hay productos, por otro lado muy destacados,
que tambin adoptan dicho lenguaje sin incorporar tales siglas: DB2, Oracle La expresin SQL que se recoge
en la ilustracin 5 est indicando al SGBD que se quieren obtener los datos de las columnas id, menutype
(lnea 1: SELECT) de la tabla en la base de datos llamada jen_menu (lnea 2: FROM jen_menu), pero slo de
aquellas filas que satisfagan la condicin que se expresa en las lneas 3 y 4: WHERE Adems, se mostrarn, en
la consulta, en el mismo orden determinado para la web (campo de anidamiento "lft").
7
Se las denomina tablas virtuales porque, aunque fsicamente no existan en la base de datos, se obtienen, en
tiempo de ejecucin de la consulta, a partir de los datos de las tablas realmente almacenadas. Por otro lado, la
sentencia SQL de la ilustracin 6, en la clusula SELECT, est indicando (como en la expresin que
comentamos anteriormente) que recupere informacin de unas determinadas columnas. Ahora, si nos fijamos,
se seala en la clusula FROM que esas columnas se encuentran en dos tablas (jen_menu origen y
jen_falang_content destino), cuya forma de combinarse adecuadamente se expresa en la clusula
WHERE
8
Todas las ilustraciones que hemos mostrado en este artculo se han creado mediante el WCMS Joomla! 3.0.3.
Nuestros ejemplos se han realizado con el complemento para Joomla! FaLang 1.2.0
(http://www.faboba.com/composants/falang/presentation.html). Existe para Drupal una serie de mdulos
que, tras instalarse y activarse, facilitan la gestin multilinge e internacionalizacin
(http://drupal.org/project/i18n). En el caso de Wordpress tambin existen complementos (plugins) para la
gestin
multilinge,
como
WPML
(http://wpml.org)
o
el
gratuito
.qTranslate
(http://www.qianqin.de/qtranslate).
10
Si no se diera ninguna de estas dos alternativas, el gestor del proyecto podra insertar la URL de la pgina
descargada como <base> de las rutas, en la cabecera (<head>) del archivo HTML.
11
Es decir, en vez de componer HTML a partir de los datos dispersos en la BD, ahora se trata de descomponer
HTML para reubicarlo adecuadamente en la BD.
12
Adems de las referencias visuales y funcionales que le ofrece al traductor manejar una versin HTML de la
pgina, otra de las ventajas de trabajar con este formato es que presenta poco o ningn riesgo de ensuciar el
contenido de la pgina web con cdigos extraos.
13
Seguramente esta ltima opcin se realice en muy pocos casos, puesto que probablemente nuestro cliente
desconozca los entresijos del gestor de contenidos. Sera posible llevarlo a cabo si contara con personal
informtico cualificado.
14
El estndar XML Localization Interchange File Format est gestionado por el consorcio sin nimo de lucro
OASIS: https://www.oasis-open.org/committees/xliff.
15
Vase el proyecto XLIFF Tools de Drupal en http://drupal.org/project/xliff, que est basado en la hoja XSL de
la aplicacin XLIFF Roundtrip de Bryan Schnabel (http://sourceforge.net/projects/xliffroundtrip). La extensin
Localization Manager se puede encontrar en: http://typo3.org/extension-manuals/l10nmgr/3.4.0/view.
JDiction es accesible desde http://jdiction.org/en/jdiction/about-jdiction.
16
Ambos son estndares mantenidos por OASIS: Darwin Information Typing Architecture (https://www.oasisopen.org/committees/dita) y Content Management Interoperability Services (https://www.oasisopen.org/committees/cmis).
17
Se trata del Internationalization Tag Set, del consorcio W3C (http://www.w3.org/TR/its20/), que acaba de
aprobar su nueva versin 2.0, con importantes novedades para el mbito de la localizacin y la traduccin.
176