Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
NDICE
INTRODUCCIN.............................................................................................................3
TIPOS DE SOFTWARE ...................................................................................................4
Software patentado o propietario.................................................................................. 4
Software de cdigo abierto (open source). ................................................................... 4
Herramientas Web ........................................................................................................ 4
TRADUCCIN AUTOMTICA. ....................................................................................6
MEMORIAS DE TRADUCCIN. ...................................................................................7
CORPUS. SEGMENTACIN, ALINEACIN Y EXTRACCIN................................8
Segmentacin. .............................................................................................................. 8
Alineacin..................................................................................................................... 8
Extraccin..................................................................................................................... 9
LA ALINEACIN ..........................................................................................................10
YOUALIGN. GUIA DEL USUARIO. ..........................................................................12
BIBLIOGRAFA.............................................................................................................19
INTRODUCCIN.
El presente trabajo en un principio se basa en la explicacin del funcionamiento de una
herramienta web gratuita denominada YouAlign, cuya funcin principal es la alineacin
de textos bilinges. Esta tarea que se presume sencilla, ya que el funcionamiento del
programa en s no presenta ningn tipo de dificultad, adquiere tintes ms complicados
cuando llega el momento de situarla en el contexto de la traduccin asistida debido a los
muchos conceptos tericos y tcnicos que confluyen en este entorno.
Para empezar, se ha considerado interesante hacer una distincin entre los tipos de
software a nivel de privacidad para as llegar hasta las aplicaciones web (que es de lo
que se trata YouAlign).
El siguiente punto a tratar contiene reflexiones en torno a la traduccin automtica y las
tendencias actuales. A continuacin, una explicacin general del funcionamiento de las
memorias de traduccin y en general de las herramientas y programas de traduccin
asistida.
Llegados a este punto, tambin hay que hablar (igualmente de forma muy general) en
las tecnologas modernas de procesamiento y gestin de textos (segmentacin,
extraccin y alineacin).
La alineacin de textos, que en definitiva es la funcin principal de YouAlign, merece
en este proyecto una explicacin ms amplia para entender la importancia de la
existencia de los bitextos generados en diferentes mbitos de la traductologa y la
utilidad demostrada de los mismos.
El proyecto sigue con una breve presentacin de la herramienta seguida de una
explicativa gua del usuario, contienendo una prctica de alineacin con distintos
documentos y formatos y la creacin y alimentacin de una memoria de traduccin con
los bitextos generados por YouAlign en formato tmx.
Las razones para elegir el tema del software libre y dedicado a la alineacin han sido
sobre todo prcticas. La autora del presente trabajo cuenta con un gran archivo de
traducciones espaol-ingls en diferentes formatos (la mayora en MSWord) con los que
proyecta realizar diferentes trabajos relacionados con los recursos y herramientas de
traduccin actuales, siendo la alineacin de estos textos un paso previo y vital para
proceder a las tareas programadas.
Al igual que en cualquier otra base de datos, el xito en el uso de una memoria de
traduccin depende de una buena planificacin de los metadatos (la informacin que
acompaa a cada segmento de texto).
Los programas de memoria de traduccin nacieron en los aos ochenta por la necesidad
de localizar de forma coherente las aplicaciones informticas ms comunes.
Por este motivo, las memorias de traduccin ms eficientes y avanzadas trabajan con
paquetes de trminos y expresiones dedicados a la localizacin informtica. Los
formatos XLIFF (XML Linguistic Information File Format) y PO (Programming
Objects) son los ms frecuentes de ese mbito. Hay muchsimas memorias de
traduccin libres y de cdigo abierto. Tambin hay programas comerciales para
traducir software, como la desaparecida suite de traduccin de IBM y la aplicacin
PASSOLO, que hace poco se integr en el conjunto de aplicaciones SDL-Trados.
En el mbito de los documentos y los textos no informticos, los programas de memoria
de traduccin ms conocidos en la actualidad son SDL-Trados, Dj Vu, Star Transit,
MultiTrans, WordFast y MetaTexis. Hay dos programas de segunda generacin
denominados Accross y Similis 2, que ofrecen la misma funcionalidad y aaden
opciones derivadas de las tecnologas ms modernas. La mayora de estos programas
ofrecen soluciones empresariales y personales. El ao 2009 fue fructfero en lo que se
refiere al mundo de la traduccin asistida por ordenador. No slo han surgido nuevas
versiones, mucho ms avanzadas y eficientes, de SDL-Trados y Wordfast, sino que
adems Google ha diseado un programa de gestin de memorias de traduccin en
soporte web, que ofrece gratuitamente en su versin Beta. Se denomina Google
Translator Toolkit. Wordfast no ha querido quedarse atrs y tambin ofrece su
TMAnywhere, conceptualmente similar al de Google Esta disponibilidad subyacente a
las memorias de traduccin, hasta entonces disponible solo para quienes dispusieran de
varios miles de dlares y los programas de apoyo (normalmente MS Office), est ahora
al alcance de cualquier persona que tenga una conexin a Internet.
Un segmento es una unidad de texto predefinida que puede ser alineada con su
traduccin correspondiente. Normalmente la unidad bsica de segmentacin es una
frase, aunque otras unidades tambin se pueden definir como segmentos, por ejemplo
titulares, elementos de una lista, celdas de una tabla o prrafos (Bowker 2002, 152)
Importantes estudiosos de la traduccin hacen referencia a la alineacin como proceso
importante en la traduccin asistida, as Melby cuenta la alineacin como un
componente de una de las ocho fases en que divide los sistemas (herramientas) que
pueden ayudar al traductor segn el momento en que se utilizan (antes, durante o
despus de la traduccin). La alineacin aparece en el punto cinco, que se cita
textualmente:
5.- Segment-level before translation: New text segmentation, previous source-target text
alignment, and indexing. The preparation of an aligned, indexed source-target bitext is
vital por the correct functioning of translation memory tools if previously translated text
is to be leveraged (re-used). Indexed bitext are also useful for terminology research.
A continuacin, extracto de un artculo de la publicacin Tradumtica, identificado en la
bibliografa:
En las ltimas dcadas hemos asistido a una autntica revolucin tecnolgica que ha
permitido la creacin de corpus de mayor tamao, gracias, sobre todo, a la red
Internet, as como la gestin de grandes cantidades de textos, debido a la multitud de
herramientas capaces de albergar y procesar corpus de textos en formato electrnico.
10
11
de aproximadamente 2.000
12
ENG] Family
[ENG] and
[ENG] Community
[ENG] doctors
[ENG] General
[ENG] Practitioners
[ENG] practice
[ENG] (100%)
13
14
Esta es la pantalla que aparece una vez se accede con la cuenta ya activada. Aqu es
donde hay que cargar los textos que se quieran alinear. Nos avisa de que el tamao
lmite de los documentos a alinear es de 1 MB.
(1) Hay que definir el idioma de los mismos y (2) elegir las opciones de filtros a
aplicar: Rechazar si una parte del segmento est vaca, si en los dos pone lo mismo y si
hay segmentos duplicados.
15
En pocos segundos la aplicacin nos muestra una vista previa del bitexto que acaba de
crear y la opcin de descargarlo tanto en html como en tmx. Esta es la pantalla:
16
17
Finalmente, al realizar la siguiente alineacin, te informa del total de las que llevamos
hechas y las que hemos creado ese mismo da (el uso est limitado a 5 alineaciones
diarias):
18
BIBLIOGRAFA
ABAITUA ODRIOZOLA, J. (2002). Tratamiento de corpora bilinges. MART ANTONN,
M.A. Y J. LISTERRI BOIX (eds). Tratamiento del lenguaje natural, Barcelona:
Universidad Autnoma de Barcelona. 61-90.
Alcina, Amparo. 2008. Translation technologies: Scope, tools and resources. Target
20:1, 79102. (PDF disponible en la web de John Benjamins Publishing Company)
CASTILLO RODRGUEZ, C. (2009). La elaboracin de un corpus ad hoc paralelo
multilinge. Universidad de Mlaga. Tradumtica Traducci i Tecnologies de la
informaci i la Comunicaci. Nmero 07: Laplicaci dels corpus lingstics a la
traducci: desembre 2009. http://www.fti.uab.cat/tradumatica/revista.
Corpas Pastor, G. (2002). Traducir con corpus: de la teora a la prctica. En Garca
Palacios, J. y M.T. Fuentes Morn (eds.). Texto, Terminologa y Traduccin.
Salamanca: Almar. 189-226.
Melby, Alan K. 1998. Eight types of translation technology. Estudio presentado en
la 39 conferencia anual de la American Translators Association (SYS). 1998.
http://www.ttt.org/technology/8types.pdf
http://ecolore.leeds.ac.uk/ . Pgina en la que, entre otras cosas se comparten recursos
renovables para la localizacin de contenidos electrnicos como soporte a la enseanza
de la traduccin asistida.
http://hiptrad.blogspot.com/. Blog de Jos Garca Verdugo con la documentacin de las
sesiones sobre herramientas informticas para traductores en traduccin rabe-espaol
(Escuela de traductores de Toledo, 14-18 de septiembre de 2009) Jos Garca Verdugo
es traductor de la ONU y profesor de la Universidad de Castilla la Mancha.
19