traduccin asistida por ordenador: la perspectiva humana en la traduccin hombre-mquina
La falta de especialistas en traduccin plantea un problema para los mercados de traduccin en crecimiento en todo el mundo. Una de las soluciones propuestas por la falta de recursos humanos es el automatizado de herramientas de traduccin. En las ltimas dcadas, las organizaciones han tenido la oportunidad de aumentar el uso de los recursos tecnolgicos. Sin embargo, no hay consenso sobre la forma en que los recursos tecnolgicos deben integrarse en los proveedores de servicios de traduccin (PST). El enfoque adoptado por este trabajo es examinar la traduccin interactiva donde los humanos y las mquinas cooperan. Cul es el papel del ser humano? Con base en el marco conceptual de los sistemas de informacin y ciencias de la organizacin, se recomienda dar a los usuarios, que son principalmente traductores para los que las herramientas de traduccin interactiva se disean, un papel fundamental en el pensamiento que rodea a la implementacin de una herramienta tecnolgica.
Introduccin La globalizacin y el incremento de operaciones de comercio mundial ha dado lugar a un crecimiento impresionante del mercado mundial de los servicios de traduccin. Segn la EUATC (Asociaciones de Empresas de Traduccin de la Unin Europea), se espera que la industria de la traduccin crezca alrededor de un cinco por ciento al ao en un futuro previsible (Hager, 2008). Con sus dos idiomas oficiales, Canad es un buen ejemplo de un mercado importante de la traduccin, donde los traductores profesionales altamente cualificados sirven no slo el mercado interno, sino tambien a clientes internacionales. Los recursos humanos especializados en Canad son demasiado escasos para enfrentarse a este enorme aumento de las necesidades de traduccin global. El Comit Sectorial de Industria Traduccin canadiense haba anunciado ya en 1999 que la industria necesitara un promedio de 1.000 nuevos profesionales cada ao para sostener el crecimiento de la demanda (Comit Sectorial de Industria de Traduccin canadiense, 1999); Sin embargo, las universidades canadienses en el ao 2005 an seguan produciendo slo alrededor de 300 graduados por ao.
Aparentemente, esta escasez de recursos especializados no slo es un problema en Canad. Despus de su reunin anual internacional sobre servicios lingsticos, documentacin y 2 publicaciones, que se celebr en Pars en junio de 2010, las Naciones Unidas dio a conocer una declaracin que dice lo siguiente: "Sin una nueva generacin de lingistas y profesionales capacitados con conocimientos de idiomas, la organizaciones internacionales no podrn realizar sus tareas vitales ".
Debido a la utilizacin de las nuevas tecnologas, los procesos se han acelerado en todos los campos de la actividad humana. La traduccin no es una excepcin. Durante ms de medio siglo, los traductores ocupados han estado confiando en tecnologas de la informacin para ajustarse a los plazos y entregar servicios de traduccin de gran volumen. Sin embargo, cuando Beesley (1986: 251) escribe: "Los defensores sostienen que los ordenadores no slo son valiosos en la traduccin, sino que se estn convirtiendo en herramientas absolutamente necesarias para ayudar a manejar la explosin de la informacin mundial", se refiere principalmente a un hardware comn y software bsico de procesador de textos . En nuestro siglo XXI, los proveedores de traduccin pueden sacar ventaja de la traduccin automtica (TA) o de traduccin (CAT) con ayuda del ordanador, con el fin de aumentar su productividad.
En pocas palabras, las organizaciones han aumentado sus necesidades de servicios de traduccin, con el fin de estar presente en los mercados de todo el mundo, pero carecen de los recursos humanos capacitados para apoyar esas necesidades. Existen herramientas que automatizan parcialmente el proceso de traduccin, pero los efectos de esas herramientas en la productividad de los distintos traductores 'an no estn claros. Adems, la influencia de esas herramientas en el rendimiento global de las organizaciones para las que la traduccin es una actividad principal - los proveedores de servicios de traduccin o TSP - an no se ha explorado concienzudamente.
De las estaciones de trabajo individuales a Sistemas de Informacin lingstica integrados (LIS)
El proceso de automatizacin de la traduccin conduce a la interaccin hombre-mquina que puede caracterizarse por un grado variable de implicacin humana, desde la traduccin enteramente humana - lo que podemos llamar traduccin artesana - a la traduccin automtica por completo - sin ningn esfuerzo humano en absoluto. La traduccin producida en su totalidad por las mquinas todava no es lo suficientemente buena para su uso generalizado entre el pblico y por lo general est diseada 3 para consumo interno. La calidad real de la traduccin totalmente automatizada, no es aceptable para un TP. Un traductor profesional (TP) necesita es una gama adecuada de herramientas - incluidas las herramientas de traduccin automtica, herramientas de traduccin asistida por ordenador y herramientas de referencia lingsticas - que los traductores humanos puedan utilizar para producir entregas rpidas de traducciones de alta calidad. Para ello, las organizaciones necesitan ms que una simple estacin de trabajo de traductor individual computarizado. Necesitan un sistema que les ayude a compartir y difundir informacin, de forma que informe de manera til sobre los procesos de produccin de la traduccin. Los traductores profesionales necesitan lo que nosotros proponemos llamar un Sistema de Informacin lingstica.
Qu es un Sistema de Informacin lingstica integrado (LIS)?
Ein-Dor y Segev (1993: 167) lo define como cualquier sistema informtico con una interfaz de usuario o de operador, siempre y cuando el equipo no est incrustado fsicamente. Por ejemplo, los traductores que trabajan en estaciones de trabajo individuales tienen ahora la rutina de acceso a glosarios bilinges digitalizadas que se colocan en la intranet de su organizacin. En tal caso, la organizacin se basa en una ya en un sistema de informacin existente - la intranet - para compartir informacin a travs de lo Taravella (2011) llama la tecnologa pasiva del lenguaje. Otra aplicacin de un sistema de informacin sera la asignacin de los trabajos de traduccin por un sistema de flujo de trabajo centralizado que muestra a cada traductor individual las tareas que l o ella tienen que realizar.
Lo que hace la investigacin en sistemas de informacin distinta de otras disciplinas de la computacin, es decir, la informtica y la ingeniera de software, es su enfoque en temas humanos. Segn Glass, Ramesh y Vessey (2004), la investigacin sobre los sistemas de informacin examina temas relacionados, en gran medida, con los conceptos de organizacin, sobre todo el uso, la explotacin y transferencia de la tecnologa, aunque tambin explora temas / sistemas de software, principalmente a un nivel de anlisis de comportamiento. Esto convierte los sistemas de informacin en un campo adecuado para nuestra investigacin sobre el impacto de la utilizacin de los sistemas de informacin lingstica en los traductores humanos.
De hecho, y teniendo en cuenta que las dimensiones del usuario individual tales como la percepcin, la resistencia al cambio, la inercia y el anlisis de necesidades son algunos de 4 los principales desafos de promocin del cambio organizacional a travs del uso de tecnologa de la informacin. La tecnologa de la informacin facilita la coordinacin interna entre los individuos (Gurbaxani et Whang, 1991), que es precisamente lo que los profesionales de la lengua necesitan para la colaboracin en la produccin de una traduccin. Los sistemas de gestin de flujo de trabajo (WMS) son otro tipo de sistemas de informacin tiles para los profesionales de la lengua. Estos sistemas estn diseados para estructurar el trabajo a realizar, dividirlo en diferentes tareas, organizarlas de manera lgica y el seguimiento de su ejecucin. Los usuarios de un WMS saben qu tareas se han ejecutado y reciben alertas sobre las que an no se ha completado. Los WMS ofrecen una estructura formal para los profesionales de la lengua que se enfrentan con una carga de trabajo cada vez mayor. Sin embargo, puede darse el caso de que no todos los traductores estn listos para ese tipo de estructura. Desde un WMS se hace menos flexible para los usuarios la eleccin de tareas a ejecutar y el momento en que pueden hacerlo, los traductores que no estn cmodos con la tecnologa puede sentir que su autonoma y, en consecuencia, su sentido de propiedad se han reducido.
Las herramientas de traduccin interactivas debern estar diseadas para facilitar el trabajo de los profesionales de la lengua. Para lograr esto, a la hora de seleccionar las herramientas, cada organizacin deber tener en cuenta el factor humano y buscar la integracin de todas las funciones, la adopcin de un enfoque de sistemas de informacin. El objetivo ya no es la seleccin de una herramienta, o el montaje de los ya existentes, sino el diseo y la construccin de un Sistema de Informacin Lingstico.
La traduccin automtica ya no es una disyuntiva En trminos prcticos, la adopcin de un sistema de informacin lingstica libera las empresas de traduccin de tener que decidir si deben optar o no por la traduccin automtica. Con un enfoque de una sola herramienta, el TP se enfrentan a la cuestin de cul es la herramienta que necesitan adquirir, y si la traduccin automtica es una buena solucin. Pero la gran variedad de herramientas que se ofrecen en el mercado, las infinitas posibilidades de la combinacin de mquina y la traduccin humana, y el hecho de que la diferencia entre la traduccin automtica, traduccin asistida por ordenador y tecnologa del lenguaje no est claro hacen que sea imposible seleccionar la herramienta "perfecta". Con un enfoque sobre el proceso, es decir, un enfoque de sistemas de informacin, la atencin se centra en una prioridad prctica diferente: entregar proyectos de traduccin solicitados a tiempo, junto con el cumplimiento de todos los requisitos de calidad. Con esta 5 prioridad en mente, una organizacin puede seleccionar e integrar una serie de diferentes herramientas, con el fin de construir el sistema de informacin "perfecta" para sus necesidades.
Traduccin automtica vs. traduccin interactiva Al explorar la literatura sobre las herramientas de traduccin, la diferencia entre traduccin automtica, traduccin asistida por ordenador y otras formas de traduccin interactiva (combinado de trabajo de mquina y trabajo humano) no es clara y evidente en el uso terminolgico. Por ejemplo, de acuerdo con Bouillon (1993) y Quah (2006), la traduccin de la mquina-humana asistida (Hamt) es un tipo de traduccin automtica (AT) que no puede tener lugar sin la intervencin humana. En francs, su equivalente, traduction automatique assiste par l'homme (TAAH), tambin se llama traduction assiste par ordinateur (TAO), 'traduccin asistida por ordenador' o automatique traduction assiste (TAA) 'traduccin automtica asistida'. Quah (2006: 6) seala que
La traduccin asistida por ordenador (CAT) es a menudo el trmino usado en los Estudios de Traduccin (TS) y la industria de la localizacin [...], mientras que la comunidad de software que desarrolla este tipo de herramientas prefiere llamarlo 'la traduccin automatizada (MAT) .
Es especialmente difcil distinguir entre los sistemas automticos de traduccin con ayuda human(HAMT) y los sistemas de traduccin humana que son asistidas por ordenador (traduccin humana asistida por ordenador (MAHT). Por esta razn, ambos sistemas se refieren a menudo como (CAT) herramientas de traduccin asistida por ordenador (Hutchinson y Somers, 1992; Quah 2006). Por ltimo, como Bowker (2002: 4) nos recuerda, que HAMT se refiere a menudo simplemente a la traduccin automtica (TA). Los lmites muestran pues una imagen borrosa entre diferentes tipos de sistemas debido a la larga historia de los trminos y la evolucin de los sistemas a los que se refieren. Los investigadores tampoco no estn de acuerdo sobre la definicin de la traduccin automtica con respecto a la participacin de los seres humanos. Sin embargo, dado que ningn otro trmino se ha adoptado, se sigue utilizando para referirse a los sistemas que estn totalmente automatizados, y a los que requieren de participacin humana (Quah 2006: 9).
6 Para evitar el mal uso de trminos, nos atendremos a la traduccin automatizada interactiva. Este trmino se refiere a la traduccin realizada con un cierto uso de la traduccin automtica, pero considerado como el resultado de la colaboracin entre la mquina y los traductores humanos. Si la traduccin es asistida por ordenador o por los humanos no es el objetivo aqu. Los usuarios de LIS integrarn rutinariamente herramientas de traduccin automtica, traduccin asistida por ordenador, herramientas y tecnologas pasivas del lenguaje (por ejemplo, bases de datos y glosarios en lnea compartidos), con su propio conocimiento humano, con el fin de producir una traduccin. La atencin se centra en los procesos que hacen posible que los usuarios de LIS interactuen con herramientas automatizadas, y sobre las consecuencias de la automatizacin y la interaccin en los aspectos humanos de la utilizacin de un LIS.
Importancia del aspecto humano La primera pregunta sobre automatizacin es si, y de qu manera, el trabajo humano sigue siendo importante. En otras palabras, cunto de automtica tiene la traduccin automatizada interactiva y cunto de interactiva? La principal distincin entre MT y CAT se encuentra en cul es el principal responsable de la tarea actual de la traduccin. En MT, el ordenador traduce el texto, aunque el resultado de la mquina ms tarde pueda ser editado por un traductor humano. En CAT, los traductores humanos son los responsables de hacer la traduccin, pero pueden hacer uso de una variedad de herramientas informticas para ayudar a completar esta tarea y aumentar su productividad. Por lo tanto, mientras que los sistemas MT tratan de sustituir a los traductores, las herramientas CAT apoyan a los traductores, ayudndoles a trabajar ms eficientemente. (Bowker 2002: 4) Frente a las posibilidades tericamente infinitos de la organizacin de la ejecucin de tareas mediante la combinacin de la actividad humana y el trabajo de la mquina, las organizaciones deben decidir qu combinacin de hecho va a mantener el rendimiento y servir a profesionales de la lengua, En otras palabras, tienen que encontrar un equilibrio entre personas, ambientes de trabajo y procesos (Beesley 1986; Williams 1989). La decisin sobre cmo distribuir el trabajo debe basarse en una descripcin de los procesos de produccin de traduccin dentro de la organizacin, junto con la implementacin de sistemas de informacin lingtica de tamao completo (LIS). Esos sistemas pueden ser vistos como una nueva forma de sistemas de informacin especializados, que compartiran atributos con todos los dems sistemas de informacin. Tambin tendran caractersticas que abordan la especificidad del trabajo y los procesos de traduccin y hacen que el LIS sea diferente de otros sistemas 7 especializados de informacin, sistemas de informacin gerencial (MIS) o sistemas de gestin del conocimiento (KMS), por ejemplo. A continuacin se presentan algunos aportes de la investigacin sobre los sistemas de informacin que creemos que puede informar a nuestra investigacin sobre la LIS. En primer lugar, el uso de tecnologa de la informacin ofrece el potencial para mejorar el desarrollo de tareas de una organizacin (Davis 1989). Segn Daft y Lengel (1986: 556), la tecnologa de la informacin ayuda a las organizaciones a procesar informacin, lo que reduce tanto la incertidumbre y la equivocidad: "Incertidumbre significar la ausencia de informacin. Equivocidad significa ambigedad, la existencia de mltiples y contradictorias interpretaciones acerca de una situacin de la organizacin. "Cuando un traductor carece de informacin para responder a una pregunta especfica, por ejemplo, cmo fue traducido un segmento o el trmino en un proyecto anterior para la mismo cliente, hay incertidumbre. Las Memorias de traduccin y las bases de datos terminolgicas pueden reducir esta incertidumbre mediante la recuperacin de algunas respuestas precisas a la pregunta. Cuando un traductor ni siquiera sabe cmo formular la pregunta con el fin de recuperar informacin til, hay Equivocidad. Si una frase que debe traducirse no esta muy clara para el traductor, ni semnticamente, ni sintcticamente ni terminolgicamente hablando, podra pasar cierto tiempo antes de que el traductor sea capaz de averiguar por dnde empezar la bsqueda de informacin. Un sistema de informacin lingstica, con un interfaz de bsqueda lo suficientemente flexible, podra reunir todas las fuentes de informacin pertinentes y ayudar al traductor a encontrar su camino a travs de una jungla de informacin. En la prctica, por ejemplo, el pegado de la frase a traducir en la interfaz de bsqueda solicitar al sistema de informacin que muestre en la pantalla los resultados de varias bases de conocimiento: una con los equivalentes terminolgicos, otra con frases de estructura similar contextualizadas, y otra con una versin electrnica de un cierto diccionario tradicional. En segundo lugar, un sistema de informacin lingtico puede ser visto como un sistema experto. De acuerdo con la definicin dada por Hunt y citado en Ein-Dor y Segev (1993: 190), un sistema experto "por lo general se compone de una base de conocimientos y un motor de inferencia." Textos paralelos, en los que un texto y su traduccin es colocada al costado de una pantalla de dos columnas, son las bases de conocimiento. Herramientas de traduccin, es decir las memorias de traduccin, utilizan un motor de inferencia para recuperar y sugieren traducciones basado en los criterios de decisin que se construyen en el sistema o decididas por el usuario. En consecuencia, los LIS corresponden a la definicin general de los sistemas expertos. Esto abre un camino de investigacin para la 8 aplicacin de los conocimientos existentes sobre los sistemas expertos a los sistemas de informacin lingstica.
En tercer lugar, la investigacin sobre los sistemas de informacin ha mostrado, desde muy temprano, que "la comprensin de la actividad empresarial es un requisito previo para el diseo e implementacin de sistemas efectivos" (Gorry y Scott Morton-1971). Esto hace que sea necesario explorar sistemticamente los procesos que subyacen a la produccin de la traduccin. Gorry y Scott- Morton (1971) tambin insisten en la importancia de tomar en cuenta la percepcin de los usuarios que se enfrentan a una nueva tecnologa. Para Davis (1989), que cre el TAM (modelo de aceptacin de la tecnologa), los dos factores de xito ms importantes en la adopcin de tecnologas de la informacin se perciben como la utilidad y facilidad de uso. Sin embargo la tilidad y fciliad de uso de un sistema pueden ser objetivos, pero es la utilidad y facilidad de uso que los usuarios perciben subjetivamente lo que forma la actitud de los usuarios y lo puede dar lugar a la adopcin o el rechazo de un sistema de informacin: "Por lo tanto, incluso si una aplicacin mejorase objetivamente el desempeo de sus funciones, si los usuarios no lo perciben como til, es poco probable que lo utilizan. Por el contrario, las personas pueden sobrestimar las ganancias de rendimiento ofrecido por un sistema y adoptar sistemas disfuncionales "(Davis, 1989: 335).
Los factores claves para el xito en la implementacin de un sistema de informacin han sido explorados por muchos investigadores. Armstrong y Sambamurthy (1999) sealan la importancia del papel de liderazgo de alto nivel y la infraestructura de TI, mientras que Jean-Jules y Villeneuve (2011) insisten en que los usuarios se apropien de la nueva tecnologa, en la medida en que el uso que se convierte "en rutina."
Por ltimo, dado que la investigacin sobre los sistemas de informacin tiene en cuenta los factores humanos que permitan un uso eficiente de la tecnologa de la informacin, el enfoque de los sistemas de informacin se adapta perfectamente a explorar el camino para que los traductores se apropien de las herramientas de traduccin interactivos automatizados. Como Banker y Kauffman (2004) nos recuerdan, el valor de la tecnologa para una organizacin est fuertemente relacionada con cmo precisamente los procesos de negocio y las estructuras organizativas se definen, as como a las capacidades cognitivas y la capacidad para procesar informacin demostrado por los usuarios de tecnologa. La siguiente declaracin de esos autores nos anima an ms a explorar el tema de la traduccin automatizada interactivo a travs del objetivo de la investigacin de sistemas de informacin: "[Hay] una 9 creciente apertura de la investigacin acadmica a la teorizacin interdisciplinaria relacionada con la interaccin humano-computadora, y [a] verdadera necesidad de explicaciones ms ricos para que funcione bien en ajustes aplicados complejos "(Banker y Kauffman.
Breve historia de la traduccin automtica Esta seccin ofrece un resumen de la historia y de los acontecimientos ms significativos de la traduccin automtica. La impresin de que la traduccin automtica es algo novedoso no es del todo correcta ya que en 1933, un francs de origen armenio Georges Artsrouni y un ruso Petr Troyanskii patentaron sendas mquinas de traduccin. La ms significativa fue la de Petr Smirnov-Troyanskii quien propuso no slo un mtodo para un diccionario bilinge automtico sino tambin un esquema para codificar funciones gramaticales interlingsticas, basado en el Esperanto y un esbozo de como debe funcionar el anlisis. Dividi la traduccin en tres etapas. En el primer paso un editor que solo conoce el idioma de origen (SL) que analiza las palabras en su forma bsica y las funciones sintcticas. En el paso siguiente, las secuencias de formas y funciones de base de la mquina se convierten en secuencias equivalentes en el idioma destino (TL) Por ltimo, otro editor convierte el resultado en formas normales de su propia lengua. Sin embargo, la idea de Troyanskii no se conoci hasta finales de los aos 50. Poco despus, Konrad Zuse, ingeniero alemn, complet la primera calculadora programable de uso general en 1941 y las primeras calculadoras electrnicas salieron al mercado. Comenz asimismo la investigacin del uso de ordenadores para la traduccin de las lenguas naturales. En pocos aos la investigacin sobre MT se haba extendido a muchas universidades Americanas. En 1954, la colaboracin entre IBM y la Universidad de Georgetown hizo posible la primera demostracin pblica de un sistema de TA. Esta primera dcada estaba llena de grandes expectativas y optimismo que se fueron desvaneciendo en la dcada siguiente debido al encuentro de barreras semnticas infranqueables que hicieron el progreso mucho ms lento de lo esperado. Asimismo la calidad resultante fue un tanto decepcionante. El informe ALPAC en 1966 mostr que las expectativas no se haban alcanzado lo que provoc la reduccin de la financiacin en los EEUU, aunque continu, sin embargo en Canad, Francia y Alemania. A finales de la dcada de los 1980, debido al aumento de capacidad de clculo de los ordenadores, se abarat el costo de la investigacin y se cambin el marco de la investigacin. Producto de esta poca es el sistema METAL, un traductor alemn ingls. Uno de los proyectos ms conocidos de este perodo fue el proyecto Eurotra de la Unin Europea. Era un sistema de transferencia multilinge modular, avanzado y de 10 procesamiento por lotes para la traduccin de las lenguas de la CE. En 1976, en Canad, la Universidad de Montreal desarroll el sistema METEO, para la traduccin de los informes meteorolgicos y textos de campos especficos cuya diversidad planteaba problemas en el manejo de la ambigedad del sentido de las palabras y su traduccin. Hasta finales de la dcada del 1980, la investigacin se bas en las reglas esencialmente lingsticas como las normas para el anlisis sintctico, reglas lxicas, y las reglas para la transferencia lxica. Desde principios de 1990 la investigacin se diversific en muchas direcciones. La direccin principal de esta poca se bas en grandes corpora de textos, la alineacin de textos bilinges, el uso de mtodos estadsticos y el uso de corpora paralelos basados en los ejemplos de traduccin. Desde los aos 60 se sucedieron tres generaciones de sistemas de traduccin automtica representado el primero por SYSTRAN caracterizado por falta de informacin lingstica sobre el texto fuente. El esfuerzo por encontrar formas de captura de esta informacin llev a los sistemas de traduccin indirectos basados en sistemas interlingsticos y de transferencia como EUROTRA, SUSY, METAL y ARIADNE, hasta los aos 80. A partir de esa poca hasta el final de la dcada, otros sistemas basados en el conocimiento lingstico combinado con las reglas gramaticales, tales como DTL y Rosetta fueron los ms utilizados. A partir de los aos 90 surgieron los sistemas hbridos. El diseo de los sistemas de traduccin se pueden dividir en dos grupos principales Sistemas bilinges diseados para dos lenguas en particular y Sistemas multilinges diseados para ms de un par de idiomas. Adems los sistemas bilinges pueden ser unidireccionales, diseados para funcionar en una sola direccin tal como del ruso al alemn o diseado para funcionar en ambas direcciones por ejemplo de ruso al alemn y viceversa. Ha habido dos tipos bsicos de traducciones automticas: las directas y las indirectas. El primer tipo basado en reglas cuyos enfoques pueden ser de informacin interlingstica o de transferencia y el segundo basado en corpus que, a su vez sigue mtodos estadsticos o de corpora de ejemplos de traducciones.
Sistemas de traduccin directa El tipo histricamente ms antiguo del diseo del sistema de TA es el mtodo directo. Este sistema est diseado para un determinado par de lenguas por ejemplo el alemn como idioma de origen y el ingls como lengua de destino. Este 11 mtodo se basa en grandes diccionarios y la traduccin de palabra por palabra con algunos ajustes gramaticales simples. Estos sistemas consisten principalmente en grandes diccionarios bilinges, donde las entradas de la lengua de origen presentan uno o ms equivalentes en la lengua destino y algunas reglas para producir el orden correcto. Todos los sistemas de traduccin automtica de primera generacin se basaron en este mtodo y los resultados del mismo eran muy primitivos. El primer paso hacia adelante fue el anlisis morfolgico del texto de origen donde tena lugar la identificacin de terminaciones de las palabras y los componentes de las palabras. Los resultados del anlisis morfolgico se utilizaran para la bsqueda de entradas del diccionario bilinge. No se haca el anlisis de la estructura sintctica ni de las relaciones semnticas lo que significaba que la identificacin lxica dependera del anlisis morfolgico y conducira directamente al diccionario bilinge para bsqueda de las equivalencias correspondientes en la lengua destino. A continuacin el programa haca una bsqueda de reglas de ordenamiento de la frase en el idioma destino.
La traduccin basada en reglas El proceso de traduccin basado en normas requiere el anlisis y la representacin del significado del texto original y la generacin del text TL equivalente. Las caractersticas tpicas de estos sistemas son el procesamiento por lotes con post-edicin y sin componentes interactivos esencialmente orientados a la sintaxis. A este planteamiento siguieron dos grandes enfoques, el interlingstico de dos etapas una que conduce a la representacin independiente del idioma y de esta representacin interlingual comienza la generacin de los textos en la lengua destino u objeto. El enfoque de transferencia se haca en tres etapas, el primero el anlisis de representaciones en abstrato, el segundo paso sera el traslado de estas representaciones y finalmente la generacin o sntesis de textos. Los sistemas de modelo interlingstico implican la transformacin de la lengua origen a un lenguaje de representacin independiente interlingstico. El idioma de destino se genera despus de la interlingua. Las principales caracterstica de este sistema son su robustez y la economa en los entornos multilingsticos. Los problemas del sistema son la complejidad cada vez mayor del sistema. Este sistema requiere un anlisis en profundidad para la representacin abstracta independiente del lenguaje de origen.
12 Sistemas de transferencia La tercera estrategia o sistemas de transferencia operan en tres etapas que involucra representaciones subyacentes de los dos idiomas; el de origen y el de destino. El anlisis es la primera etapa, convierte el texto de origen en representaciones abstractas. Este paso implica el analizador y la gramtica de la lengua de origen. La segunda etapa es de transferencia. En esta etapa las representaciones abstractas de la lengua origen se convierten en representaciones de la lengua objeto equivalentes. La tercera y ltima etapa, llamada de sntesis o de generacin. Esta etapa genera el texto final. El enfoque de transferencia implica una comparacin entre dos lenguas. La fase de transferencia compara unidades lxicas y la estructura sintctica exactamente a travs de la brecha del idioma y utiliza reglas de asignacin para convertir la representacin de la lengua fuente a la de destino. Estas reglas y cualquier semntica adicional u otra informacin se almacenan en los diccionarios o bases de conocimiento. Ambos mtodos el directo y el indirecto se basan en la especificacin de reglas para la morfologa, la sintaxis, la seleccin lxica, el anlisis semntico y la generacin de lenguaje. Los sistema de traduccin directos se basan en la traduccin de palabra por palabra o frase por frase y esto no soluciona los problemas de ambigedad de la traduccin automtica. El mtodo interlingua se base en un anlisis independiente de la lengua fuente. La ventaja del sistema interlingua es que se pueden aadir nuevos idiomas a un coste relativamente bajo creando slo las reglas que se asignan a partir de la nueva lengua. Por el contrario, el enfoque de transferencia requiere la construccin de reglas de asignacin de la nueva lengua hacia todos y cada uno de las otras lenguas. Pera mejorar la calidad se necesita la adicin de informacin semntica lingstica extra, tarea compleja que consume mucho tiempo. Los sistemas basados en la transferencia son menos ambiciosos que los interlingsticos porque aceptan la necesidad de reglas de correspondencia entra las representaciones ms abstractas del texto de la lengua fuente y el texto de la lengua destino En la prctica los sistemas basados en la transferencia se eligen porque son ms simples y los sistemas interlingsticos se utilizan debido a que requieren menos trabajo aadir nuevas lenguas.
13 Mtodos basados en corpus Desde 1989 la investigacin se ha vuelto hacia el corpus basndose primordialmente en los aspectos semnticos y bajo la premisa de que los textos tienen el mismo significado si son semnticamente equivalentes. El corpus podr ser monolingual o multilingual. En el segundo caso los corpora que se han formateado y comparado se denominan corpora alineados paralelos. Las traducciones de corpora permiten comenzar por una forma o grupo de formas con un significado determinado en una lengua y buscar el significado equivalente en la otra lengua. La extraccin de unidades equivalentes permitir a los diseadores del sistema de traduccin buscar unidades equivalentes en la otra lengua y as recuperar la traduccin de unidades equivalentes, incluyendo palabras, frases, compuestos, colocaciones y frases Descubrir la ayuda proporcionada por el corpus para la produccin de textos traducidos que muestran la naturalidad de la lengua destino. Crear nuevas bases de datos de traduccin que permiten a los usuarios traducir correctamente en un idioma extranjero que slo conocen muy someramente. Generar nuevas bases de datos terminolgicas dado que una gran proporcin del material terminolgico de los nuevos textos no est ni estandarizado ni dentro de los bancos de trminos. Los enfoques basados en corpus se distinguen de los mtodos basados en la estadstica y en los ejemplos
Statistical Machine Translation La esencia del mtodo es la alineacin de oraciones, frases, grupos de palabras y palabras individuales en dos lenguas y el clculo de probabilidades de que cualquier palabra en una oracin de una lengua corresponde a dos, uno, cero palabras en la frase traducida en el otro idioma. La alineacin se establece mediante una tcnica ampliamente utilizada en el reconocimiento de voz. Las probabilidades son estimadas por digramas a juego (dos palabras consecutivas) en cada frase de la lengua fuente contra digramas en las frases de la lengua equivalente. Una caracterstica de la traduccin basada en la estadstica es la disponibilidad de grandes corpora bilinges adecuados y con traduccin fiable.
Traduccin basada en ejemplos (EBMT) Se basa en el principio que los datos son ms duraderos que las teoras lingsticas y en esencia la traduccin se realiza 14 por analoga. El objetivo es descubrir ejemplos anlogos, y ver cmo se han traducido con anterioridad. Los corpora como fuente de informacin. Dentro de la traduccin automtica la informacin del corpus es esencial por varios motivos para la construccin de sublenguajes o de dominios especficos para los que es necesario obtener un conocimiento detallado del vocabulario, las funciones gramaticales de los tipos de texto que se va a traducir. Las bases de textos lexicogrficas y de conocimiento son tambin de importancia para los sistemas interlingsticos con representaciones conceptuales. Las bases de datos bilinges son necesaria para la traduccin basada en ejemplos.
Sistemas hbridos La dificultad innata de los sistemas basados en la estadstica para el procesamiento de frases largas, junto con los problemas del dominio lingstico, los inconvenientes y costos de su formulacin en la traduccin basada en reglas llev a los ingenieros lingsticos a plantearse sistemas hbridos integrando teoras distintas y paradigmas tales como el uso de grandes programas de anlisis simblico, el conocimiento semntico integrado que es en parte simblico y en parte basado en modelos estadsticos y por ltimo la participacin activa del usuario. En otros casos se combinan sistemas basados en reglas con sistemas de transferencia lingstica basados en ejemplos. Otro mtodo consiste en hacer pasar un texto por distintos sistemas de traduccin, cada uno utilizando distintas tcnicas, uno basado en lxico, otro basado en el anlisis de las reglas gramaticales y generacin y un tercero basado en ejemplos o mtodos estadsticos. En cada caso un sistema de evaluacin interno evala el resultado final. La fortaleza de los sistemas hbridos reside en el hecho que distintos enfoque pueden complementarse entre si. No obstante es extremadamente difcil encontrar un equilibrio entre las diferentes arquitecturas. Lenguajes controlados, dominios especficos y sistemas especficos de usuario. Muchos sistemas bien asentados que fueron diseados originalmente para uso general se han limitado a tareas ms especficas. Las reas ms importantes en las que superar las deficiencias conocidas de los sistemas de traduccin automtica son: El control de los textos de entrada o input Restriccin de los sistemas de dominio especfico o sublenguajes Diseo de sistemas para usuarios especficos 15 El control del vocabulario y de las estructuras gramaticales de los textos destinados a la traduccin reduce las dificultades de contruccin de los lxicos con cobertura suficiente y los problemas de ambigedad y la seleccin de los equivalentes. El control del input es una caracterstica del sistema XEROS SYSTRAM. El mejor ejemplo de diseo de sistemas para sublenguajes es el conocido METEO, que lleva traduccin informacin meteorolgica ms de 15 aos
Memorias de traduccin El grupo consultivo de expertos en estndares de ingeniera del lenguaje define la memorias de traduccin como un archivo de texto multilinge segmentado, alineado, analizado y clasificado que permite la recuperacin de los segmentos de texto alineado en varias lenguas por medio de bsquedas variadas. La ltima generacin de estas memorias incluye un motor de anlisis lingstico que divide los segmentos lingsticos en grupos terminolgicos inteligentes creando as glosarios especficos automticamente. Estas memorias se utilizan normalmente en combinacin con otras herramientas de traduccin tales como procesadores de texto, sistemas de gestin terminolgica, diccionarios multilinges, o incluso traducciones automticas. El traductor suministra un texto en el idioma fuente a la base de datos de la memoria de traduccin, el programa analiza el input e intenta buscar segmentos en la base de datos que se utilizarn para generar una traduccin para ser revisada por el traductor quien, a su vez, podr decidir y realizar cambios o aceptar las sugerencias del sistema, si se realiza alguna modificacin, esta quedar archivada en la base de datos para la prxima traduccin. Las memorias de traduccin comparan y buscas las coincidencias entre el texto almacenado en la base de datos y el texto actualizado y revisado. La principal diferencia entre los sistemas de traduccin automtica y las memorias de traduccin es que los primeros fueron diseados para traducir sin intervencin humana mientras que las memorias se disearon para ayudar a los traductores humanos. Ambas tecnologas utilizan bases de datos con diccionarios integrales y reglas gramaticales pero las memorias de traduccin actualizan la base de datos con segmentos de texto creado por el elemento humano. Detrs de este procedimiento aparentemente simple se desarrolla una operacin cognitiva compleja. Para el descifrado del significado del texto original, el traductor interpreta y analiza todas las caractersticas del texto, este proceso requiere un profundo conocimiento de la gramtica, semntica, sintaxis, modismos y formas similares de la lengua de origen as como la cultura de sus hablantes. Para la codificacin posterior en la lengua meta, el traductor deber tener un conocimiento an ms profundo de dicha lengua. Las memorias de traduccin ayudan a los traductores humanos en sus tareas, crean bases de datos, con la terminologa traducida, glosarios de trminos para su 16 posterior recuperacin y permite acceso al material previamente traducido logrando que todo el proceso sea ms eficiente y menos costoso al recuperar material ya traducido. De estas memorias el traductor puede recuperar coincidencias exactas o equivalencias aproximadas con informacin de la fecha de traduccin, nombre del creador, identificacin del proyecto, dominio, etc. El uso de una base de datos terminolgica integrada proporciona a los traductores un potencial para realizar las equivalencias aproximadas de un trmino determinado o utilizar el sugerido por el sistema. Sin la ayuda de estas memorias el traductor no puede obtener las sugerencias de traduccin para trminos individuales.
Memorias de traduccin compartidas Las memorias de traduccin compartidas permiten a dos o ms traductores traducir los archivos del mismo proyecto al usar la misma memoria de traduccin para recuperar los segmentos previamente traducidos. Las memorias pueden compartirse desde un archivo centralizado de memorias gestionado por uno de los proveedores del cliente. Cuando el proveedor 1 recibe un trabajo de traduccin deber descargar toda la memoria, realizar las labores de preprocesado necesarias y analizar el trabajo con la memoria que ha descargado. Cuando el proveedor 2 recibe un encargo de traduccin, repite esta misma operacin. Al finalizar los trabajos, es preciso incluir las unidades de memoria nuevas o cambiadas en la memoria principal. Esta tarea ser responsabilidad exclusiva de uno de los proveedores en calidad de custodio de la memoria, o, si dispone de los recursos adecuados, del cliente.
Razones para compartir las memorias de traduccin Las razones por las que un cliente puede desear este sistema son: Reducir costes haciendo que ambos proveedores compitan entre s en igualdad de condiciones respecto a la memoria. Permitir que dos proveedores especializados en reas distintas (software, sitios web, marketing) compartan contenidos traducibles. Diversificar riesgos y evitar una dependencia total de un nico proveedor. Tener el control de la base de datos de las memorias. Las razones por las que un proveedor puede preferir este sistema son: 17 Tener una ventaja comercial sobre otros proveedores. Como custodio de la memoria de traduccin (TM), el proveedor utilizar su posicin para conseguir ms trabajos y relegar a otros proveedores a un papel subsidiario. Demostrar su superioridad tcnica sobre otros proveedores.
Ventajas del uso compartido de memorias Si se gestionan adecuadamente, las unidades de traduccin (frases y expresiones) creadas y gestionadas por un proveedor pueden ser utilizadas por otro, con la consiguiente reduccin de costes. Adems, al centralizarse el recurso de memoria, desaparece la duplicacin de gastos de mantenimiento de las memorias. Todo ello redunda en la reduccin de los costes de uso de la memoria. Existe la percepcin de que si se comparte la memoria en lnea (o de cualquier otra forma) el contenido se pone a libre disposicin de quien desee utilizarla, como en los procesos de authoring. Sin embargo, es preciso indicar que las herramientas de memoria de traduccin como Trados estn diseadas para el uso diario por parte de traductores profesionales, el software no est ideado para facilitar esta utilizacin por parte del cliente.
Problemas Para utilizar con xito las memorias de forma compartida es preciso solventar una serie de problemas. Algunos son de fcil solucin, pero otros constituyen un reto importante.
Aunque la utilizacin compartida de memorias parece ser positiva desde el punto de vista del cliente por eliminar la dependencia de un solo proveedor, en la prctica esta dependencia no est relacionada con quin sea el custodio de la memoria en un momento dado. Hay razones mucho ms poderosas para utilizar un nico proveedor para un mismo tipo de contenidos. Cuando distintos proveedores traducen distintos tipos de contenido, entonces s puede considerarse la utilizacin compartida de memorias, pero aun as hay varios problemas que habr que tener en cuenta. En la mayora de los casos, la prctica ms aconsejable sera mantener separados los procedimientos del proveedor y distribuir peridicamente a ambos los archivos de memoria. Si se utilizan memorias compartidas, un proveedor (o, si dispone de recursos especializados, el cliente) deber responsabilizarse de las memorias. Si esta tarea recae sobre uno de los proveedores, recomendamos que el segundo proveedor sea considerado como una subcontrata a efectos del proceso.
18 Bases de datos terminolgicas Otras herramientas de gran utilidad para los traductores son las bases de datos terminolgicas que incluyen campos en el registro de la base de datos para cada trmino y para definir cada concepto, proporcionando glosas apropiadas para cada concepto. La mayor parte de los sistemas de traduccin incluyen una base de datos terminolgica. Esta deber ser robusta, bien estructurada y granular; capaz de grabar homnimos, sinnimos capaz de incorporar nuevos trmino y otra informacin al uso. Las bases de datos pueden ser orientadas a la palabra que rene todos los significados de una palabra en un solo registro, de la misma forma que un diccionario tradicional. La mayora de los programas de software de gestin de terminologa off-the-shelf estn orientados a la palabra. Las bases de datos orientadas al concepto conectan trminos con el mismo significado en un mismo registro utilizando sinnimos. El uso de una base de datos terminolgica integrada proporciona a los traductores un potencial para buscar las equivalencias aproximadas de un trmino determinado o utilizar el sugerido por la mquina Analisis de input Es muy difcil calcular el tiempo empleado en una traduccin. Los sistema de Traduccin tienen la capacidad de analizar un documento para buscar frases, segmentos repetidos o similares, proporcionar el nmero de palabras ignorando elementos no textuales tales como grficos, etiquetas html, cdigo de software, etc. Esta funcin tambin se puede utilizar para explorar documentos buscando similitudes y as calcular el tiempo empleado en la traduccin. El proceso de anlisis se desarrolla en seis etapas a saber: Anlisis textual. El reconocimiento de la puntuacin hace posible el reconocimiento del final de una frase y distinguir etiquetas o cdigos o elementos especiales que no deben traducirse. El anlisis sinttico o linguistic parsing. Este anlisis prepara un lista de palabras conocidas y otra de las desconocidas y un texto para la recuperacin automtica de vocabulario de un banco de trminos. Este anlisis normaliza la variacin del orden de palabras de las frases y determina qu palabras pueden formar una oracin. La segmentacin cuya principal funcin es la seleccin de las unidades traducibles ms tiles. Una correcta segmentacin puede dar como resultado unidades de traduccin naturales y de longitud adecuada. Permite adems correspondencias de traduccin entre la lengua fuente y la meta. El alineamiento significa definir las correspondencias de traduccin entre los texto origen y destino o meta. El alineamiento se basa en la segmentacin y proporciona informacin al propio proceso de segmentacin que corrige 19 la segmentacin inicial incrementando as la utilidad de las memorias de traduccin. La extraccin de trminos es muy til en la estimacin del tiempo a emplear en la traduccin lo que facilita la programacin de tareas del traductor y junto con herramientas de estadsticas de texto proporcionan informacin sobre la cantidad de tiempo involucrado en la tarea de traduccin de un proyecto.
Estndares y productos La estandarizacin permite la utilizacin de datos lingsticos en los distintos sistemas y plataformas sin ser bloquearlos por formatos propios. LISA (Localization Industry Standards Association) y OSCAR (Open Standards for Container/content Allowing Reuse) intentan desarrollar estndares abiertos que den apoyo a las industrias de traduccin y localizacin. OSCAR desarrolla y mantiene normas tcnicas relacionadas con las necesidades lingsticas asociadas a las memorias de traduccin, los gestores terminolgicos, procesadores de textos para la traduccin, recuento de palabras y gestores de contenido multilinge. Los estndares OSCAR oficialmente aceptados y recomendados son el formato TMX (Translation Memory eXchange) es un estndar abierto XML, aunque no aceptado universalmente para el intercambio de datos de traduccin sin prdida de informacin durante el proceso lo que transforma las bases de datos terminolgicas en ms porttitles.
TBX (TermBase eXchange format) es tambin un formato abierto XML para el intercambio de datos terminolgicos que incluye informacin lxica detallada. Los archivos TBX se pueden importar y exportar a la mayora de los sistemas de traduccin compatibles que incluyan un base de datos terminolgica. Tarea que facilita la fluidez de informacin entre una organizacin y sus proveedores de servicios. SRX (Segmentation Rules eXchange format) es un estndar XML que mejora el estndar TMX para que los datos de la memoria de traduccin que se intercambia entre las aplicaciones se pueda utilizar de manera m eficaz. GMX (Global Information Management Metrics eXchage Metrics or GILT Metrics) es una familia de estndares para la mtrica de productos de la traduccin. Consta de tres partes GMX-V para la mtrica del volumen; GMX-C para la mtrica de la complejidad y GMX-Q para la mtrica de calidad. La norma GILT tiene la tarea de cuantificar los requisitos de carga de trabajo y de calidad para cualquier tarea. 20 Xml:tm (XML based Text Memory) es un enfoque radicalmente nuevo a las memorias de traduccin basado en el concepto de memoria de texto, que comprende la memoria autor y la traduccin. Es uno de los primeros avances significativos en la tecnologa de memoras de traduccin desde su creacin.
OLIF (Open Lexicon Interchange Format) es otro estndar compatible XML para el intercambio de terminologa y datos lxicos. XLIFF (XML Localization Interchange File Format). Este formato o estndar tiene como objetivo proporcionar un nico formato de archivo de intercambio para intercambiar informacin de localizacin que puede entenderse con cualquier proveedor de localizacin. TransWS (Translation Web Services) especifica los requerimientos necesarios para la utilizacin de los servicios Web para la presentacin y recuperacin de archivos y mensajes relacionados con los proyectos de localizacin.
Textos adecuados para el uso de Sistemas de traduccin Aunque los sistemas de traduccin automtica pueden ser de gran ayuda al asegurar la coherencia, mejorar la eficiencia y reducir los costos, no son ideales para todos los documentos. En particular, los sistemas de traduccin son menos eficaces para documentos cortos o los producidos con diferentes estilos de escritura y con varios contextos de terminologa. Tampoco son recomendables para documentos que contengan las llamadas fuzzy matches (equivalencias aproximadas)en el texto origen, como puede ser la traduccin de un men de una aplicacin informtica.
La cantidad de documentacin a traducir es un factor importante para el uso de un sistema de traduccin. Los sistemas de traduccin automtica son ideales cuando se trata de gran cantidad de documentacin o documentos multiples relacionados y documentos con vacabulario especializado. La reutilizacin del texto es problemente el criterio ms importante para el uso de un sistema de traduccin ya que permite la actualizacin de la traduccin y su revisin. Estas actualizaciones de traduccin se vuelven ms fciles dado que el traductor no tiene que buscar en todo el documento para realizar los cambios. En muchos casos cuando un documento a revisar es similar a una versin anterior, el trabajo de la traduccin de la versin actualizada se puede reducir en un 70 o 80 % Las ventajas de los sistemas de Traduccin son la consistencia especialmente cuando el trabajo lo realizan varios traductores lo que lleva, a su vez, a un aumento de la calidad del resultado final, la rapidez pues el sistema guarda 21 todos los segmentos traducidos anteriormente que no have falta volver a traducir lo que puede acelerar el proceso de traduccin, la reduccin de los costes al emplear menor tiempo y poder reutilizar los segmentos ya traducidos. A pesar de las grandes ventajas de las memorias de traduccin, tambin ellas conllevan desventajas materializadas en el alto costo de adquisicin al principio, la falta de adecuacin a todo tipo de documentos, las dificultades de post edicin de los textos traducidos, y, sobre, la dificultad en la integracin total con los sistemas de traduccin actuales.
22
Sistemas de traduccin en el mercado actual Comparacin entre las herramientas de traduccin ms conocidas. http://www.proz.com/software-comparison-tool/cat/cat_tools/2
Herramientas de ayuda para la traduccin (CAT Tools)
Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia Dj Vu Microsoft Office (Word, Excel, Powerpoint, also embedded objects, and Access), Help Contents (CNT), FrameMaker (MIF), PageMaker, QuarkXPress, QuickSilver/Interleaf ASCII, Java Properties (.properties), HTML, HTML Help, XML, RC, C/Java/C++, IBM TM/2, Trados Workbench, Trados BIF (old TagEditor), Trados TagEditor, JavaScript, VBScript, ODBC, TMX, EBU, InDesign (TXT, ITD, INX, IDML), GNU GetText (PO/POT), OpenOffice, OpenDocument SDLX (ITD), ResX, XLIFF (XLF, XLIF, XLIFF, MQXLIFF, Windows Proprietary 23 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia unsegmented and segmented SDLXLIFF), Visio (VDX), PDF, Transit NXT PPF, WordFast Pro TXML GlobalSight Text ANSI / ASCII / Unicode for Windows, Text for Apple Macintosh, HTML, XML (ASP.NET, ASP, JSP, XSL), SGML, MS Word for Windows, MS Excel, MS PowerPoint, RTF, RC, Adobe FrameMaker, Adobe InDesign Java platform / Java Apache License 2.0 gtranslator PO POSIX C GTK+ GNU General Public License Lokalize Gettext PO, Qt ts, XLIFF, TMX Cross-platform C++ Qt GNU General Public License memoQ .MIF, InDesign formats (.INDD, .INX, .IDML), .XML, .DITA, .XML, .MM, .PO, .HTML, .HMT, .SHT, .properties, .DOC, .RTF, .BAK, .DOT, .DOCX, .XLS, .XML, Windows Proprietary 24 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia .XLSX, .XLSM, .XLS, .XLT, .PPT, .PPS, .POT, .PPTX, .PPSX, .POTX, .SLDX, .VDX, .HHC, .HHK, .ODT, .ODF, .TXT, .INF, .INI, .REG, .PDF, .SVG, .SDLPPX, .TTX, .SDLXLIFF, .TMX, .TXML, .RESX, .XLF, .XLIF, .XLIFF, XLIFF:doc MemSource .doc, .docx, .rtf, .ppt, .pptx, .xls, .xlsx, .htm, .html, .properties, .tmx, .ttx, .xhtm, .xhtml, .xml, .dita, .ditamap, .xliff, .sdlxliff, .txt, .csv, .resx, .idml, .mif Java platform / Java Proprietary MetaTexis Microsoft Word, Excel and Powerpoint, all kinds of text formats, XML, HTML, XLIFF, RTF, TRADOS Studio (SDLXLIFF), TagEditor (TTX), POT/PO, Manual Maker, several further formats... Microsoft Office Word add-in Proprietary OmegaT Plain text, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Office Open XML, Help & Manual, HTML Help Compiler (HCC), LaTeX, DokuWiki, QuarkXPress CopyFlow Gold, DocBook, Android Resource, Java Properties, Typo3 LocManager, Mozilla DTD, Windows RC, WiX, ResX, INI files, XLIFF, PO, SubRip Subtitles, SVG Images Java platform / Java GNU General Public License 25 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia Open Language Tools XLIFF, HTML/XHTML, XML, DocBook SGML, ASCII, StarOffice/OpenOffice/ODF, PO, .properties, .java (ResourceBundle), .msg/.tmsg (catgets) Java platform / Java CDDL Poedit PO Cross-platform C++ GTK+ MIT License Pootle PO, XLIFF, OpenOffice GSI files (.sdf), TMX, TBX, Java Properties, DTD, CSV, HTML, XHTML, Plain Text Cross-platform Python Web GNU General Public License SDL Trados Features four translation environments: dedicated TagEditor, MSWord Interface, SDLX, the integrated interface SDL Trados Studio 2014. Filters for translating with Trados Studio or TagEditor available: Word, Excel, PowerPoint, OpenOffice, InDesign, QuarkXPress, PageMaker, Interleaf, Framemaker, HTML, SGML, XML, SVG, Xliff, Legacy Trados files TTX, ITD, Word Bilingual, Wordfast, MemoQ .... Includes SDL MultiTerm for terminology management and Project Management Dashboard for automating tasks and Windows Proprietary 26 Nombre Formatos compatibles Sistema Operativo Idioma Widget tool Licencia tracking. Virtaal XLIFF, PO and MO, TMX, TBX, Wordfast TM, Qt ts Many others via converters in the Translate Toolkit Cross-platform Python GTK+ GNU General Public License WordfastPRO MS Word, Excel, PowerPoint (all versions), PDF, SGML, HTML, XML, InDesign, FrameMaker, tagged documents, XLIFF, etc. Java platform / Java Proprietary Segn la encuesta de Imperial College a 874 traductores profesionales de 54 countries,en el ao 2006, la principal herramienta de traduccin uitlizada fue : Trados(35%), Wordfast (17%), Dj Vu (16%), SDL Trados 2006 (15%), SDLX (4%), STAR Transit (3%), OmegaT (3%), others (7%).
27 En el siguiente direccin se pueden comparar las herramientas de traduccin entre si. En este caso, a modo de ejemplo, hemos elegido slo 5 de las herramientas ms utilizadas en la traduccin
http://www.proz.com/software-comparison-tool/compare/2-/sdl_trados_studio_2011_freelance-to- Resultado de la comparacin entre SDL Trados studio 2011 Freelance, SDL Trados Studio 2014, Djvu X2 Professional, Wordfast y Omega T.
Name SDL TRADOS Studio 2011 - Freelance SDL Trados Studio 2014 Atril Dj Vu X2 Professional Wordfast Pro OmegaT Review breakdown
(20 reviews)
(11 reviews)
(10 reviews)
(10 reviews)
(7 reviews) 28 Most helpful review
The Dinosaur of CAT By Pavel Tsvetkov PROS 1. Trados is still considered by many to be the best CAT tool out there if not the most advanced or reliable, at least the most comprehensive one. 2. Their support is good, as long as you are willing to pay for it. That said, oftentimes, even they cannot figure what the problem is. 3. It is actively developed and marketing is aggressive, and with clear messages not the case with Atril' More 54 out of 58 found this review helpful.
Read more reviews
Losing Momentum By Pavel Tsvetkov PROS 1. Trados is still considered by many to be the best CAT tool out there if not the most advanced or reliable, at least the most comprehensive one. 2. Their support is good, as long as you are willing to pay for it. That said, oftentimes, even they cannot figure what the problem is. 3. It is actively developed and marketing is aggressive, and with clear messages not the case with Atril' More 41 out of 48 found this review helpful.
Read more reviews
Easy to learn By Selcuk Akyuz None of the CAT tools are excellent but some of them are very good, DVX2 is one of them. Easy to install, easy to create a project, translation memory or termbase. Most functions are intuitive, possibly one can start translation right after installing it without reading the pdf help file even partially. 20 out of 20 found this review helpful.
Read more reviews
Quite good, especially for the young translator By SonengoleA I started with the demo version of this tool and later on bought the licence. It's quite easy to use and has the basic functionalities needed by a young translator. Compared to other CAT tools, there are a lot of improvements to make. It is however worth its price. It is a good entry level tool for those new to the translation industry, especially its demo version. Unlike other cat tools, you ca More 17 out of 18 found this review helpful.
Simple, robust, efficient By esperantisto I use this program for most of my translation. Its a free program [1]. Very simple to learn (the start screen shows a 5-minute start guide, and it takes really 5 minutes to start off). Has an excellent spell check feature, as well as grammar check via a plugin [2]. Extremely robust: havent experienced any crash or hang for years. You can have it as a portable version on a USB stick. User setting More 17 out of 17 found this review helpful.
Read more reviews 29
Read more reviews
Product description SDL Trados Studio 2011 Freelance is the ultimate translation software, providing all the tools you need to edit and review high quality translations in the quickest possible time. Based on leading translation memory used by over 80% of the translation supply chain, SDL Trados Studio can help you complete translations up to 40% faster*! Depending on the type of content being translated, this fi More The #1 computer assisted translation environment for translation professionals.
SDL Trados Studio 2014 is the leadingtranslation memory software. It offers a complete environment for professional More DVX2 Professional combines Intelligent Quality technology with customisable productivity and quality assurance. THE #1 TRANSLATION MEMORY SOFTWARE FOR ANY PLATFORM Wordfast Pro (WFP) is a standalone, multiplatform TM tool designed to change the landscape for every stakeholder in the translation process, from project manager to freelance translator OmegaT is the best free and fully multiplatform professional translation memory application. Downloaded close to 400,000 times since its first release and included in most standard Linux distributions, OmegaT is the CAT tool that gives you the most freedom and power as a user. Developed by and for translators, it offers everything you expect from a standard CAT tool. And more! Price From 845 Starter 99 (Perfect for part-time translators) | Freelance 695 (Perfect for freelance translators) | Professional 2.595 (Perfect for language service providers) 590 400 Free of charge & total freedom of use (no license number, no registration etc) 30 File formats 25 years of filter development provides the most comprehensive framework including new filters for PDF, XML, FrameMaker & InDesign file formats Work with over 70 different file types never have to turn down a translation project due to file compatibility ever again. See the full list View all file formats here MS Word MS Excel MS Powerpoint HTML XML ASP/JSP/Java INX (InDesign) MIF (FrameMaker TTX PDF Microsoft Office 2007 and later (.docx, .xlsx, .pptx), PDF (via Infix export), XHTML and HTML, ODF, PO, IDML/TTX/XLIFF/TXML (via Okapi plugin) and close to 30 more formats. License type Perpetual Perpetual Perpetual 3-year license Perpetual, open source Operating system Windows Vista, Windows 7, Windows XP, Windows 8 Windows XP, Windows Vista, Windows 7, Windows 8 Windows XP, Windows Vista, Windows 7, Windows 2000, Windows 8 Windows XP, Windows Vista, Windows 7, Mac OS X 10.4 and higher, Linux Windows Vista, Windows 7, Mac OS X 10.4 and higher, Linux, Windows 8, Windows XP System requirement s As a minimum requirement, we recommend a Pentium IV-based computer with 1 GB RAM and a screen resolution of 1280x1024. For optimum performance, we recommend 2 GB RAM and a more recent Pentium or compa 1 gigahertz (GHz) or faster, 32-bit (x86) or 64-bit (x64) processor and 2 GB RAM (32-bit) or 4 GB RAM (64-bit) based Microsoft Windows PC and a screen resolution of 1280x1024 Minimum system requirements: 1GHz or faster 32-bit (x86) or 64-bit (x64) processor, 1GB RAM No data No specific requirements. Runs anywhere. Compatibilit y Supports open standard file formats XLIFF, TMX, TBX & OLIF and an app store OpenExchange allowing Supports open standard file formats XLIFF, TMX, TBX & OLIF, interoperability Supports open standard file formats XLIFF, TMX, TBX & No data Supports standard data exchange formats (TMX, TBX) and most standard source 31 anyone to integrate their solution with other CAT tools & an OpenExchangeapp store OLIF formats (see above) Support and upgrades offered/incl uded Installation support and complimentary QuickStarthelp Free installation and licensing supportand a choice of competitively priced support and maintenance services. Free updates, but not upgrades, Free technical support via support ticket center Free upgrades for duration of license/Subscriptio n Free community support, Free upgrades to all future versions Support and tutorial links http://www.translationzone.com/ support/online-product-help/ No data No data No data No data Free trial SDL-30 days 30-day trial (fully functional and provides every feature of the product for you to try) Dj Vu - 30 days full-featured demo version that runs without a paid license for translation memories of up to 500 translation units OmegaT is a free download Languages supported Work with as many languages as you want - the Freelance version supports up to 5 languages (which are selected upon installation) SDL Trados Studio 2014 will work with virtually any language combination that is also supported by Everything that takes place in Dj Vu X Workgroup happens within Unicode. This means that all the languages supported Wordfast Pro supports any language that is supported by Microsoft Word. This includes No limitation whatsoever regarding useable language pairs. Possibility to use language codes that are not listed in the defaults. 32 Microsoft Windows.See the full list. by Windows are supported by Dj Vu X Workgroup as source and target (includi Eastern European, Cyrillic, Asian, Right-to-Left, and various other languages.