Sei sulla pagina 1di 4

Introduo No incio dos anos 50, estudiosos de vrios domnios da cincia - como a Psicologia, Fil osofia, Teoria da Informao,

Inteligncia Artificial (IA, doravante), Matemtica, Neuro logia - passam a voltar suas pesquisas para o funcionamento da mente. Nasce, ento , um novo campo de investigao cientfica, de natureza multidisciplinar, cujo objeto de estudo a mente como processador de informaes. Os modelos clssicos da mente foram derivados da estrutura da Mquina de Turing e de Von Newmann. Excluindo os detalhes tcnicos destas mquinas, podemos dizer, em term os gerais, que elas postulam regras de causa e efeito manipuladas por smbolos. ne ste sentido abstrato que podemos dizer que a mente representa uma mquina computac ional, pois dados neurobiolgicos indicam que o crebro , de fato, uma mquina de causa e efeito (Churchland & Grush, 1999: 1). Esta abordagem matemtica argumenta que o cr ebro lida com input (o dado recebido) atravs de representaes e computaes para, ento, p roduzir o output. No podemos dizer, contudo, que o modelo clssico da mente est comp rometido com os detalhes da mquina de Turing e de Von Newman ou de computadores c omerciais; somente com a idia bsica de que o tipo de computao que relevante para ente nder a cognio envolve operaes com smbolos (Fodor e Pylyshin, 1988: 4). Neste contexto, nasce a Lingstica Computacional (LC, doravante), como conseqncia das pesquisas em IA - cincia que pode ser definida como resultado de mtodos programvei s em computador que simulam atividades mentais humanas envolvendo inteligncia (Fr eitas et al., 1999). A LC, por sua vez, tambm conhecida como PLN (Processamento d e Linguagem Natural), destina-se ao estudo dos sistemas computacionais usados pa ra a compreenso e a gerao de linguagem natural. geralmente definida como a interseo e ntre Lingstica e Computao: duas reas que embora aparentemente nada tenham em comum, t rabalham, na prtica, com a razo e a lgica. a Lingstica Formal de Noam Chomsky o grand e elo entre as duas disciplinas. Segundo esta teoria, a competncia lingstica do fal ante de uma lngua poderia ser descrita em termos de um nmero finito de regras ou p rincpios lingsticos capazes de gerar um nmero infinito de frases nessa lngua e de eli minar um nmero infinito de frases consideradas agramaticais. H, portanto, uma anal ogia entre matemtica e linguagem natural. Dentre as principais reas de aplicao da LC est o Processamento de Textos, que viabil iza o desenvolvimento de Tradutores Automticos, Corretores Gramaticais e de Siste mas de Pergunta e Resposta. A Traduo Automtica (TA, doravante), por sua vez, um dos domnios da LC que mais envolve conhecimento lingstico, por codificar informaes de um a lngua para outra. O objetivo da presente anlise focar esta aplicao computacional, buscando compreender sua evoluo pela histria e sua aplicao atual.

Traduo Automtica: breve histrico

A TA, precede a prpria LC, historicamente, embora tenha sido incorporada a ela a partir dos anos 50. Foi a primeira aplicao computacional no-numrica proposta na dcada de 40 dentro da ento recm-introduzida rea de Cincia da Computao. Aps a segunda Guerra Mundial - durante a poca da Guerra Fria - americanos e ingles es, vidos por informaes cientficas soviticas, desenvolveram esta aplicao computacional A real autoria deste invento atribuda ao ingls Booth e ao americano Warren Weaver , que desenvolveram uma calculadora cientfica com dados suficientes para realizar uma traduo palavra por palavra, sem considerar questes sintticas ou de ordem lexica l. Esta mquina permitia que o usurio da rea tivesse acesso traduo de uma lista de pal avras-chave de determinado texto e, conseqentemente, poderia ter uma idia de seu c ontedo (Alfaro, 1998). O ingls Richens, em 1948, introduz, nesta mesma mquina, informaes no mbito gramatical e sinttico da lngua russa, o que veio a acelerar a consulta automtica. J no incio do s anos 50, Weaver prope a explorao automtica do contexto dos termos, no intuito de s olucionar problemas de ambigidade semntica. Ele acreditava que os circuitos lgicos das calculadoras seriam capazes de resolver os elementos lgicos da linguagem, aux iliados pela determinao da rea qual a informao pertence; o que em pouco tempo revelou -se um grande equvoco.

Em 1954, na Universidade de Georgetown, h a primeira experincia bem-sucedida de TA entre o russo e o ingls realizada por um computador - ao invs de calculadoras cie ntficas. O vocabulrio continha 250 palavras e seis regras sintticas (Alfaro, 1998). Esta dcada representa o grande entusiasmo e otimismo com relao habilidade de progra mas de traduo. O que se achava necessrio para este feito era um conhecimento de voc abulrio e gramtica da lngua-fonte e da lngua-meta aliado a regras de converso de uma lngua para a outra. Portanto, partia-se do pressuposto de que as descries existente s das lnguas eram boas descries e que uma simples formalizao daquelas gramticas e dici onrios poderia servir a esses fins (Vale, 1998). Foi necessrio pr em prtica estes pr essupostos tericos para se constatar como eram ingnuos. Conseqentemente, a dcada seguinte revelaria um ceticismo mpar em relao possibilidade de TA. Isto , torna-se claro que enquanto a simples traduo palavra por palavra esta ria longe de resultar em uma traduo ao menos inteligvel, a formalizao das regras a pa rtir das descries fornecidas pelas gramticas tambm parecia longe de dar conta de tod os os aspectos das lnguas em questo. Portanto, constatou-se que as tentativas feitas nos anos 50 no pressupunham que o conhecimento de significado dependia de conhecimento de mundo. Assim como tambm faltava a conscientizao de que uma grande proporo de palavras em uma lngua ambgua, co o pode ser ilustrado em um famoso exemplo do filsofo Bar-Hillel (1964), ao aponta r os problemas que um sistema de TA encontraria em uma seqncia como: Little Peter was looking for his toy box. The box was in the pen Bar-Hillel argumenta que esta passagem ser corretamente interpretada somente quan do se tem o conhecimento do tamanho tpico de canetas e caixas para que se reconhea a impossibilidade de se colocar uma caixa dentro de uma caneta. Assim, recorrese a um contexto infantil, onde pen refere-se a playpen (cercadinho). Segundo Bar-Hill el, um computador nunca poderia ser provido de conhecimento suficiente para lida r com este tipo de problema; conseqentemente, a TA estaria fadada ao fracasso. Embora bastante pertinentes e lcidas as afirmaes sobre a impossibilidade de um pote nte tradutor automtico, h nos anos 80 - aps uma dcada de lacuna neste tipo de pesqui sa motivada por argumentos persuasivos como o acima mencionado - uma retomada de interesses pela TA. Isto se deveu criao da Comunidade Econmica Europia, exploso da nformatizao, ao desenvolvimento e estabelecimento de teorias no mbito da Lingstica Fo rmal, com grande investigao semntica, ao processamento informatizado de lnguas natur ais com base em gramticas de anlise e de gerao (Alfaro, 1998). Com isto, o campo da IA como um todo, mas principalmente o domnio da LC, e mais especificamente, o sub -domnio da TA passaram a receber apoio de diversos pases, em destaque, os europeus . O que, de fato, ajudou esta retomada de interesse foi uma mudana de expectativa p ara um ponto de vista mais pragmtico. Nesta poca j se descartava a esperana de obteno de um tradutor automtico timo, e se passava a confiar na utilidade de um programa de traduo, mesmo que imperfeito. Portanto, a idia disseminada em meados dos anos 50 de que o computador pudesse tr aduzir de forma satisfatria foi completamente descartada nos anos 80. Neste perodo , os objetivos j eram desenvolver aplicativos computacionais que auxiliassem a tr aduo e programas de TA que previssem a interveno humana. Hoje em dia, o grau de aceitao de programas medido pela quantidade de pr e ps-reviso requerida. Um programa cujo ndice de reviso posterior menor do que 20% (uma correo a cada 5 palavras), considervel aceitvel. Alm disso, muitas vezes, o sistema vai sen do melhorado com o uso, ao mesmo tempo em que o tradutor humano adquire prtica na otimizao do sistema, aprende a reconhecer os erros tpicos da TA e pode chegar a do brar sua produo em alguns meses (Slocum, J. apud Alfaro, 1998). Note-se que com a proliferao da Internet, nos anos 90, estes programas so utilizado s de forma exaustiva, pois esto disponveis na rede. Portanto, atualmente, os progr amas de TA desempenham um papel singular na obteno e disseminao de informao em nvel mu dial como ressaltam Alfaro & Dias (1998:569). A quantidade de informaes que podem ser repassadas atravs da rede inimaginve l, assim como o nmero de usurios de lnguas completamente diferentes que tm acesso a essas informaes. Soma-se a isso a aparente comodidade proporcionada por tais siste mas a usurios que precisam verter seus textos para outras lnguas porm no possuem o c onhecimento e a habilidade para tanto e se sentem atrados pela velocidade com que

isso poderia ser feito.

Os Tradutores Automticos Atuais

Atualmente, h tradutores automticos com capacidade de aquisio lexical, como, por exe mplo, o Globalink Power Translator Pro (1995). um software de traduo multilnge inteli gente; isto , o usurio pode acrescentar informaes ao seu banco de dados. Contudo, o guia do usurio deixa clara a necessidade de uma ps-edio, de uma interveno humana no re sultado final da TA. Em 1999, foi introduzido no mercado o Delta Translator, um tradutor bilnge entre a lngua inglesa e uma segunda lngua; nosso estudo destina-se ao exame da verso portug us-ingls deste programa. O que pode parecer um retrocesso tecnolgico- pelo fato de este software traduzir somente entre duas lnguas - pode vir a ser um ganho para o usurio: com um banco de dados mais compacto, por lidar somente com o lxico de doi s idiomas, e menos regras gramaticais e sintticas de correspondncia entre as lnguas , se comparado a um tradutor automtico multilnge, a velocidade do programa otimizad a; muito embora, a ps-reviso humana tambm no venha a ser descartada. Assim como o Globalink, o Delta, possui um dicionrio de palavras e um dicionrio de e xpresses, que podem ser otimizados pelo usurio. A grande vantagem do Delta se deve facilidade com que o usurio pode otimizar o dicionrio. Ou seja, a interface com o usurio bastante simples. Alm disso, o Delta foi elaborado com uma funo de voz, inclui ndo a possibilidade de se ouvir o texto original e a traduo, o que no somente um gr ande auxlio para quem deseja aprender a pronncia em uma das lnguas, como tambm uma f erramenta indispensvel para deficientes visuais. O programa tambm dispe de um assis tente sinttico-semntico que resolve casos de ambigidade categorial de itens lexicai s que no eram equacionados por sistemas de TA mais antigos. Santos (1995:123) apo nta a necessidade de um assistente sinttico no domnio da TA: Sem que uma deciso sintt ica tenha sido tomada, o contributo que esses itens especficos fazem para o senti do das frases em que ocorrem no pode ser computado e, logo, elas no podem ser trad uzidas. O autor cita o clebre exemplo time flies like an arrow; que pode erroneamente ser t raduzido, por sistemas automticos menos sofisticados (desprovidos de um assistent e sinttico robusto), como as moscas do tempo gostam de uma flecha. J o assistente si nttico do Delta viabiliza a traduo O tempo voa como uma flecha. Note-se que o tradutor automtico, mesmo j no sculo XXI, uma ferramenta de trabalho para tradutores ou para leigos em uma das lnguas em questo; no o resultado definiti vo de uma traduo, nem o poderia ser, visto a capacidade exclusivamente humana de e nxergar todas as nuanas da lngua. Na rea de LC fato notrio que, independentemente da sofisticao do sistema, seu desemp enho deve ser medido em grande parte pelos recursos do lxico computacional associ ado a ele. Portanto, a aquisio do lxico passou a ser uma etapa essencial para que u m sistema de PLN (Processamento de Linguagem Natural) fosse realstico. Esta empre itada comeou h mais ou menos 15 anos atravs de uma pesquisa (mencionada em Boguraev e Pustejovsky, 1996:3) direcionada a transformar informao compilada por lexicgrafo s em forma de dicionrios lidos por mquinas. Hoje em dia, entretanto, chegou-se concluso de que mesmo com os dados lexicais de stas fontes, h um enorme nmero de diferentes classes de palavras que ficam fora do alcance de um dicionrio convencional; alm disso h informaes necessrias aos sistemas c mputacionais atuais que no so acessveis a dicionrios lidos por mquinas. (Boguraev e Pu stejovsky, 1996:3). Portanto, podemos dizer que o trabalho do tradutor humano pr imordial e absolutamente imprescindvel. Alfaro & Dias (1998:382) ratificam a insu bstituio do tradutor humano: Os sistemas de traduo por mquina... exigem reviso humana, seja antes, durant e ou aps a traduo, no dispensando algum tipo de interao humana especializada em hiptes alguma... E, cada vez mais, tornam-se fortes aliados dos tradutores profissiona is. So aliados, principalmente, de tradutores tcnicos, tendo em vista que a traduo literr ia lida, na maioria das vezes, com estilos sintticos rebuscados, o que no condizen

te com o pragmatismo da TA. Ou seja, a ps-edio humana de um texto literrio traduzido por um programa, em geral, muito maior do que a de um texto tcnico. Memria de Traduo Os anos 90 tambm trouxeram projetos alternativos s limitaes dos tradutores automticos . Em 1993 foi lanado o sistema Dj-Vu, que consistia em um grande banco de dados par a traduo. Atualmente est sendo introduzido no mercado brasileiro o Sistema TRANSIT, claramente inspirado no sistema Dj-Vu. Assim como o seu antecessor, o TRANSIT no u m tradutor automtico, mas sim, uma memria de traduo. Este software, desenvolvido esp ecialmente para tradutores, chega ao usurio com memria zero; o prprio tradutor quem vai preencher o seu banco de dados. Este preenchimento ocorre on-line; ou seja, durante a traduo do usurio. Toda vez que o TRANSIT detecta uma frase ao menos seme lhante quela do seu banco de dados, ele imediatamente fornece a traduo e a percenta gem de semelhana com a frase a ser traduzida. Este sistema interessante principalmente para tradutores tcnicos que se dedicam a um mesmo domnio terminolgico. Um aspecto bastante interessante do TRANSIT que ele nada mais do que o espelho do tradutor humano. Em outras palavras, se o usurio do software for um tradutor descuidado, o TRANSIT vai ter um banco de dados de pouc a confiabilidade. Entretanto, se o tradutor for criterioso e traduzir textos do mesmo assunto, o software representar, alm de confiabilidade, uma maior otimizao do tempo e lucro.

Concluses O neurologista portugus radicado na Universidade de Iowa, Antnio Damasio, argument a que o grande erro do pensamento cartesiano foi achar que a razo e a lgica despro vidas de emoes nos fariam tomar decises mais acertadas. Em The Descartes Error (1994 ), o neurologista defende que a nossa experincia emocional que nos ajuda a decidi r. A viso de Damasio explica, em parte, a dificuldade de programas eminentemente lgicos em lidar com algo essencialmente humano, a linguagem. Tucker (1986:41) postula que a TA um dos problemas interdisciplinares mais profun dos na histria da pesquisa cientfica. Problema este que somente ser equacionado com a comunho de diversos domnios da cincia - como a LC, a Engenharia Computacional, a IA, e a Neurologia - unindo criatividade e conhecimento acumulado para um nico ob jetivo. Em contrapartida, vivemos uma poca em que a cincia se mostra cada vez mais capaz d e alcanar o impossvel. H algum tempo ningum imaginaria que o enxadrista Gary Kasparo v fosse ser derrotado por um computador, como aconteceu em 1996, quando o progra ma Deep Blue levou o campeo ao desespero. Claro que a lngua no pode ser posta em par de igualdade com a lgica e a estratgia do xadrez. Ela no somente matemtica. Ns, tradutores, respiramos aliviados.

Potrebbero piacerti anche