Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TRADUZIONE AUTOMATICA
E TEORIE DELLA TRADUZIONE
In una fase iniziale degli studi sulla traduzione, quando a prevalere era l'ap-
proccio linguistico, ovvero intorno agli anni '60 e '70 del secolo scorso,
sono state elaborate alcune formulazioni teoriche sul concetto di equivalen-
31
TR,u)U7JON[ Atrt'OMATfCA E TEORJE DELLA TRADUZIONE
CAPrrowDu,
za traduttiva e su quello di traduzione da parte cli studiosi come e r.0
Nida che rivelano un certo interesse per la tecnologia. at rd e
ovvero "basic structural elements out of which Janguage bui Id its el~borate
Jn linguistìc Theory o/Translation ( 1965) Catford, sulla base del!
h•-•" (Nida & Taber I 969· 39) La seconda fase consiste nel
nizione di traduzione come "the replacement of textual materiai in a defi_ surfiace Struc•=- · · . . .
· ,· th
guage (SL) by equivalent te~~ I ~aten~ mano er language (TL)"
one1
an.
irasfetire il messaggio del testo di partenza nella lingua dt amvo, e mfin_e
19 l'ultima fase riguarda la ristrutturazione del messaggio secondo le caratten-
20), ipotizza che le p~bab11ita_ dt eqmvalenza traduttiva possano 65:
espresse sotto fonna dt regole dt traduzione e dunque fonnalizzab 1T SSere stiche proprie della lingua cli arrivo.
1
istruzioni per algoritmi traduttivi (I 965: 31 ): carne
2.2 Traduzione Automatica e gli studi teorici e applicati della
For the purpose ofMachine Translation, translatio~ rules may be operation
instructions_ for_c'.'"rextual search for 1tems marked 1n the mach ine glossa al traduzione
par11cular diacntics, with mstrucllons lo pnnt out the particular co d . .ry by
· · each case. Sueh operat1ona · I mstrucllons,
· · n •lìoned Dopo questi primi contatti iniziali tra i due ambiti cli studio, tuttavia, molta
eqmvaleor m which if foll
can be guaranteed witb a high degree of probability to produce 3 , OWed, letteratura nell 'ambito della teoria della traduzione ma soprattutto nell'am-
resuJ~ are known as algon·th ms. The looser, more contextuall correct' b bito dei Translation Studies non ha fatto alcuna menzione della traduzione
instructions for hurnan translators are 'translation rules' •· the more
y ri3Sed, automatica (ad esempio Gentzler I 993) o, se l'ha fatta, solo molto breve-
·d
co-textually based, instructions for MT are, strictly speaking, 'Iran 1 _gi • mente e senza approfonclime le implicazioni (Beli I 991, Munday 200 I,
i:
algorithms'. In generai, to be effective, translation algorithms m I alìon. Venuti 2012). L'idea di fondo che accomuna questa temperie è che le te-
orie della traduzione e quelle sulla traduzione automatica siano discipline
on equivalences with probabilities approaching. us based
totalmente separate con pochi punti cli contatto. Ciò è in parte dovuto alla
Nel modell~ del processo di ~~uzione proposto da Nida possiamo . convinzione che gli aspetti tecnologici non siano oggetto delle più ampie
facilmente mtravedere la som1ghanza con l'architettura dei s · t . invece riflessioni epistemiche della disciplina, bensl riguardino aspetti eminente-
. . • tsenuatr
f erdt traduzione automatica (cli§ 4 . 1.2.1). Si tratta di un mod II O ans- mente collegati alla pratica professionale.
analisi, transfer e ristrutturazione (fig. 2.1 ). e a tre fasi: È anche vero però che gli approcci teorici alla traduzione automatica
raramente hanno preso in considerazione gli apporti della teoria della tra-
Source Language duzione, una disciplina dal cui clibattito i ricercatori avrebbero potuto trarre
Receptor Language
Text elementi utili per comprendere meglio il processo di traduzione e le proble-
Transfation
J
Anafysis i
Rlriog
matiche ad esso connesse.
La carenza cli ricerche sulle tecnologie per la traduzione nell'ambito del-
la teoria della traduzione è stata rilevata solo in tempi recenti e da diversi
studiosi come Munday (2009), O'Hagan (2013) e Doherty (2016). Inoltre,
benché lo sviluppo delle competenze tecnologiche siano state riconosciute
f Transfer
come indispensabili nella formazione dei traduttori da oltre un decennio
Figura 2.1 li processo di traduzione (Nida & Taber 1969: 33) (EMT Expert Group 2009), pochi sforzi sono stati fatti per meglio analiz-
zare e comprendere le implicazioni dell'affermazione delle tecnologie su
Nella prima fase il traduttore analizza il testo di partenza per interpretarne il vasta scala.
Una prima indicazione che la teoria della traduzione avrebbe dovuto in
messaggio attraverso la trasfonnazione della struttura superficiale del testo
qualche modo occuparsi delle tecnologie per la traduzione proviene dalla
nella sua struttura profonda e l'individuazione delle cosiddette frasi kemel',
gli clcmcnli strutturali di base a partire dai quali la lingua costruisce le sue elaborate strutture
' Le frasi kemel o nucleari sono frasi semplici, attive e dichiarative che rappresentano superficiali (Nida & Taber 1969: 39)
32 33
TRADUZIOr<lt: Alrl'OMATICA E noKlt U[l.l.A TRADUZIONE
CAPITOl.0 DUE
----------
'!'nMlllkmSNdia d arte di gruppi di ricerca degli approcci empmc1 alla traduz1on~ ~utoma .
_a p · particolare IBM con lo sviluppo di un primo sistema stallsttco e di
ucam . 'd c
ruppi giapponesi di ricerca con i primi sistemi basali su csem~• a appro -
~io statistico, ii) l'avvio delle ricerche nel campo della troduz_1one ~oca_le
Tolollllof l'rmlldoa r.....,. infine iii) il passaggio da un approccio teorico allo sviluppo d1 ~pphc~z1om
/
n,,nctcll
A...
'-
,-===
°""""
·~·-~-=---hml- ..
"""'1 - Fllacdoa
poUcy <ridei,,, realmente utilizzabili nei processi di traduzione, come le postazmni d1 lavo-
ro per i traduttori. .
=
Odli hrtlol ...... orimlld orimhd Wolfram Wills, ad esempio, nell'evidenziare che la traduzione è una
specifica forma dell'elaborazione cognitiva di un testo ( 1988:39) descrive le
.._ AlW
r,(~ Rat Tlll-1)-pt Tùlt l'nll>llm
difficoltà che si incontrano nel voler definire in maniera più precisa questa
capacità cognitiva usando la metafora del black box, per sottolineare che si
"'""" llllriclod moic1,d .-ic1od relriclod Nlllicled
tratta di un costrutto ipotetico (Wills 1988:42) in quanto i processi mentali
Figura 2.2 Mappa dei Tra1,s/a1ion Studies (Toury 1995: IO)
che si attivano nella mente di un traduttore sono oscuri e non osservabili
Ma aldilà di questa classificazione, in realtà la traduzione automatica trova scientificamente. Relativamente a questo aspetto, Wilss osserva come que-
poco spazio di riflessione negli stud! suUa traduzione. Probabilmente ciò sti processi siano difficili da riprodurre in un programma di traduzione au-
è dovuto al fatto che l'anno d1 pubbhcaz1one della mappa corrisponde an- tomatica perchè non formalizzabili mediante algoritmi e mette in dubbio le
cora con una fase pionieristica della traduzione automatica e dunque no possibilità di risoluzione dei problemi da parte di un calcolatore ( 1988: 158).
Le soluzioni adottate dai programmi sono infatti deterministiche e limitate
si avvertiva l'urgenza di occuparsi di un fenomeno che invece di li a poc:
avrebbe radicalmente mutato il mercato della traduzione e la pratica profes- alla base di dati archiviati: non può essere creato nulla di nuovo, se non
sionale dei traduttori. soluzioni predefinite e schematiche (Wills 1988: 167). Si tratta dunque della
Questa sottovalutazione del fenomeno in base alla scarsa qualità d 1· mancanza di creatività, che al contrario è invece caratteristica tipica del pro-
risultati delle tecnologie principalmente imputato ad un approccio basa~ cesso traduttivo umano, che consente di trovare soluzioni nuove a seconda
sulla ricostruzione del significato attraverso la traduzione parola per parola~ dello scopo della traduzione: la macchina può tradurre solo testi o porzioni
di testi che sono già stati tradotti in precedenza.
se~brerebbe essere confermata da Steiner, che in After Babel (1975: 3IO)
cosi scnveva: Un primo contributo interessante al dibattito teorico è offerto dal volu-
me di Juan C. Sager language Engineering and Translation (1994), in cui
li hopcs, as il wcr~, lo locate 'rows of words' of which the mere supcr- l'autore riflette su alcuni aspetti della teoria della traduzione che contribui-
scnphon w11h a lcx1eal equivalent will make adcquate sense. The machine scono ad analizzare le implicazioni dell'introduzione delle tecnologie in un
1s _no_ more tha~ a dictionary which consults itself at very high speed. In its ~roces~o tradut~ivo di tipo industriale. Dopo una prima parte dedicata alla
pnm111vc vers1ons, the automatie translator offcrs onc Jcxical countcrpart mdustna delle hngue, l'autore affi-onta gli aspetti rilevanti della teoria della
34 35
TRADUZIONE AUTOMATICA E TEORIE DELLA TRADUZIONE
CAPITOI.O DUE
Sager sottolinea come il modello di conoscenza alla base del processo lra- Relativamente al prodotto finale, partendo dalla constatazione che la tradu-
duttivo sia cruciale sia nell'identificazione che nella soluzione dei problem1• zione automatica cerca di riprodurre il linguaggio naturale, affenna che in
realtà essa produce un linguaggio artificiale privo del potenziale creativo,
traduttivi. La differenza tra traduzione umana e traduzione automatica risied
della flessibilità e multifunzionalità tipici del linguaggio umano: dunque
nelle differenti caratteristiche dei due modelli: mentre le basi di conosceUZ:
un testo frutto di un processo automatico di traduzione non è altro che una
di un traduttore sono flessibili, nel senso che consentono al traduttore di ri-
tipologia testuale specifica della traduzione. Se ciò era vero per i sistemi di
solvere problemi mai incontrati in precedenza per il principio di analogia con
allora, basalo su un set definito di dati lessicali e sintattici, al giorno d'oggi
quelli precedentemente affrontati e risolti, e inoltre in continua espansione
il linguaggio artificiale prodotto dai sistemi si è enormemente evoluto, tanto
(Sager 1994: 247-248) in virtù dell'esperienza che il professionista acquisisce
da avvicinarsi molto al linguaggio umano.
con I'~dare del tempo, la struttura del computer è invece rigida e comparti-
In tempi più recenti -il raffronto tra l'intelligenza biologica e quella ar-
mentahzzata, essendo basata su connessioni prestabilite.
tificiale nel processo traduttivo viene ripreso da Laura Salmon, che rileva
Nonostante il confronto operato da Sager prenda in considerazione m
l'esistenza di due "categorie di strategie per risolvere problemi: gli algo-
delli di tradu~one auto~ti~a ormai obsoleti, ovvero i sistemi a base lingu: ritmi e le euristiche" (2017: 135). Riferendosi a Dennet (1997: 264), sono
st1ca (cfr. Capitolo 4), mdiv1dua alcune limitazioni dei sistemi valide ancora proprio le strategie euristiche, ovvero "forme di algoritmi non deterministici
oggi_ con _i ~uov_i mod:lli neurali, molto p!ù avanzati di quelli disponibili sempre potenzialmente indagabili in termini formali, ma a volte inafferabi-
negh anni 90: m particolare Sager sottolinea la mancanza di compensa- li" (Salmon 2017: 138), a far si che la mente umana affronti la traduzione
zione, ovvero l'incapacità da parte dei sistemi automatici di trovare del- diversamente dal computer.
le soluzioni per compensare con forme alternative l'assenza di traducenti Un altro tentativo di avvicinare i due campi di indagine si ebbe nel 1997
per una determinata parola o espressione. Questa strategia, nonnalmente co~ il volume Machine Translation and Translation Theory (Hauenschild &
adottata dai traduttori, viene usata per superare le difficoltà di traduzione Hetzmann 1-997), una raccolta di contributi presentati per la maggior parte
ad esempio mediante parafrasi, uso di sinonimi o iperonimi, uso di sensi al Second lntemational Workshop on Machine Translation and Trans/ation
letterah al posto di quelli figurati e viceversa e altre soluzioni ancora. Si Theory (~ildeshe~m University, 1994). Tra questi, un primo gruppo riguarda
tratta dt esercitare capacità inferenziali che richiedono talvolta la conside- argom~nll relatlVI a_lla teoria della traduzione di potenziale interesse per la
razione di unità testuali più ampie delle frasi per poter elaborare una solu- traduzione automallca, come ad esempio il contributo di Monika Doherty
36 37
TRADUZIONf. AUTOMATICA F. TEORIE DELI.A TRADUZIONE
CAPITOWDUY.
38 39
TRADUZIONF. ,urro.M ATICA r. T[ORJE DELLA TRADUZIONE
CAPITOLO Out:
40 41
TRADUZIONE AU10MATICA E TEORIE DELLA TRADUZIONE
CAPtrowDut
r-7
MT (atand atone) MT (notwotk) Tmnalallon tools Ungulsllc tools Locallzation 1001,
lavorative o il prodotto.
Micbael Cronin in Translation and globalization (2013) approfondisce
.
™
r~_ _,.1--_J
ThlS
r
Langlllll"·
1
1 h
Document Proiect 1
riflessione sulla traduzione nell'era digitale e tratta tutti i diversi aspelti
:ell'uso delle tecnologie ai tempi di oggi, come ad esempio la traduzione
rl
t.anguage-
dependent independent management mana
___J gsrn,,,, automatica online, il web semantico, le traduzioni ottenute attraverso l'uso
-r--~1~ del crowdsourcing. li libro si propone di esplorare i diversi aspetti legati alla
Dictionariel Glo&MrieS OCR Concordlncers
rivoluzione tecnologica dal punto di vista storico, sociale e culturale, sugge-
MT = machlne uanslation: TM = trons1ation memory; TMS .. tennlnology management systcmo·
rendo che i Translation Studies possono contribuire a meglio comprendere
OCR = optlcal character recos,tltlon •
le irasformazioni della società. Tra i vari aspelli analizzati, di particolare
figura 2.3 Schema degli App/ied Translation Studies (Quah 2006) rilevanza sono alcuni concetti espressi dall'autore a partire dal 'JT para-
digm ': trade, technology, translation, che l'autore considera come insepara-
bili e interdipendenti. A questa triade ne è connessa una seconda: language,
2.3 La svolta tecnologica dei Translation Studies power. translation, in cui la tecnologia gioca un ruolo molto rilevante rispet-
to alle relazioni di potere tra lingue. Cronin sottolinea come nell'era digitale
L'attuale rapido progresso delle tecnologie e la loro diffusa adozione so- queste siano fortemente sbilanciate in favore del cosiddetto globo/ English,
prattutto nell'ambito della traduzione tecnica e in particolar modo nel set- ovvero l'inglese come lingua franca di un mondo globalizzato. Ciò corri-
tore della localizzazione' sono tali da far ipotizzare una svolta tecnologica sponde a una visione in cui le lingue vengono rappresentate in termini pura-
(Technological tum) (Cronm 20 IO; O'Hagan 20 I 3; Alonso & Calvo 20 l S)· mente strumentali, e cosi anche la traduzione, che è finalizzata a trasportare
non si tratta di una semplice c?nstatazion~ ~ell' ~po~ delle tecnologi~ un messaggio da una lingua A a una lingua B nel più breve tempo possibile.
nel lavoro del traduttore, ma nflette una v1smne m cm I uso generalizzato di La disponibilità dei sistemi di traduzione automatica online, come strumenti
tutte le forme di tecnologia nelle diverse fasi del lavoro ridefinisce in ma- di disintermediazione tra domanda e offerta che consentono a chiunque di
niera sostanziale il prodotto, il processo, influisce sugli scopi della traduzio- poter tradurre nella frazione di secondi in qualsiasi lingua, rafforza questa
ne, sull'approccio cognitivo del traduttore, sulle modalità di lavoro e infine visione utilitaristica (Cronin 2013: 47):
sulla sua posizione sociale. La pubblicazione nel 2014 della Encyc/opedia
o/Translation Technology (Chan 2014) sancisce definitivamente, se ce ne The disembodied, instantaneous execution of the 1ransla1ion task implies
era bisogno, l'importanza acquisita dalle tecnologie nel sellare della tra- thai translation is an agentless, automatic function that can be rcalized in no
time al ali, and thai translation is fundamentally a malching or subslitutive
duzione. La svolta tecnologica è confermata anche da un incremento degli
operation, the lexl changing as the language is translaled, but the layoul
studi sulla traduzione automatica e sull'uso delle tecnologie della traduzio-
rcmaining lhe same.
ne. Uno studio condotto da Christensen et al. (2017) sui contributi di alcune
Se da un lato la l'.'3~uzione, assistita da potenti mezzi tecnologici, rispon-
de al suo scopo d1 nmuovere le barriere linguistiche, dall'altro invece c'è
1 Il lcnninc localizzazione (LI ON), dall'inglese /ocalizalion, designa il processo per rcn•
dcrc un prodotto linguisticamente e culturalmente adeguato ad un paese/regione geografica di
da ~hiedersi . qu~l~ sia l_a re~le natura degli interessi economici in gioco
destinazione (locale) dove questo sarà usato o venduto (Monti 2007). nell economrn d1g1tale, m cm la traduzione ha un ruolo cosi determinante,
42 43
TRADUZIONE AUIUMATICA E TF.ORIE DELLA TRADUZIONE CAPITOLO DUE
al punto da indurre ritenere ~he sia pi_ù adeguato p~lare dell'età tecnologie non devono essere considerate come artefatti isolati, ma
che 1e . te s1. co~e Pdarte d'1 una ~omp Iessa rete ID
. cm. I. computer
y-~
contemporanea in temuru d1 Trans/al/on
..
age pmttosto che d1 Jnfonn .
. d . 1· O//on devono essere m
age. La traduzione però n~n è pm appannaggio e1 s~ 1_ traduttori: Pertan. 1
1
runzioi:iano come estens1_one e aAmlemona e delle conoscenze degli esseri
to così come altre forme di conoscenza vengono condivise sul web •~-. ani. Dello stesso avviso sono onso & Calvo (2015) che propongono
. . . . 'k ·
pratiche collabora~ve, I~ trad_UZJon_e ~1 tras,~nn~ ID w1 1-translation, cioè la ~~considerare la traduzione come trans-human trans/ation, definita come
rapida disseminazione d1 pratiche tipiche dei so~1al ~etwork _nel campo della (f..lonso & Calvo 2015: 148):
traduzione, generando da u~ lato nuov~ necessità d1 "'.1duz1one ma dal!' al-
tro chiamando in causa pratiche lavorative nuove, mediate dalle tecnolo . an exiended cognitive, anthropological and socia) system or network which
Le tre principali caratteristiche di qu~sta f~nna di ~uzione sono: ,,0 ,;;;~ inJegrates buman translators and technologies, whether specific to transla-
tion prosumption, post-print translall~n htera?, e infine pluri-subjectivity tion or noi, and acknowledges the collective dimension of many translation
(Cronin 2013: 100-102). 11 concetto d1 translall?n prosumption concerne la ', workflows today.
partecipazione attiva degli utenti,d~lle t~~olo!Pe per la traduzione presenti
sul web alla creazione di contenuti multJlingm, senza nessun intervento d
parte dei traduttori. Post-print translation literacy riguarda il modo in cui~ g)faron O'Brien (2013), pur ritenendo che l'approccio cognitivo sia ancora
contenuti vengono consumati: "In effect, the internet encourages a shift from J gli inizi, individ~a alcune tematiche c~e p~t~ebber~ rivelarsi particolar-
steady, cumulative, linear reading to a fonn of accelerated powerbrowsing" mente promettenti per gettare luce sul tipo dt mterazmne che si stabilisce
tra traduttore e tecnologie. Alcuni suggerimenti riguardano le ricerche che
(Cronin 2013: l00). Questo passaggio a un consumo che potremmo definire
analizzano .la relazione esistente tra i risultati delle metriche automatiche
usa-e-getta dei contenuti fa sì che anche l'impiego della traduzione sia cara.
per la valu)azione della qualità (BLEU, METEOR, ecc.) e lo sforzo co-
biato rispetto all'era della carta stampata: in questo contesto la traduzione
gnitivo necessario al traduttore nella fase di revisione di un testo tradotto
automatica, nonostante fornisca dei risultati qualitativamente inferiori, ri-
automati~àmente (O'Brien 201 la), oppure l'applicazione della stilometria
sponde appieno alle necessità degli internauti, che velocemente e a costi zero
computazionale3 per verificare l'attribuzione autoriale e l'omogeneità delle
intendono accedere o produrre contenuti in lingue diverse. Infine il concetto
caratteristiche stilistiche dei testi allo scopo di misurare le similarità tra testi
pluri-subjectivity fa riferimento a una dimensione corale e comunitaria della
traduzione che ha due risvolti: da un lato un processo de-umanizzato per via ;~ti n_egli esperimenti.
dell'uso delle tecnologie, dall 'altro l'adozione delle tecnologie come stru-
mento di intervento politico da parte di gruppi di persone che usano strategi-
camente le risorse tecnologiche messe a loro disposizione gratuitamente per i.~Approcci sociologici
1
creare contenuti ritenuti rilevanti per una causa o azione politica o sociale. !i.,'/
f'àP,IIBJCCiO sociologico, che indaga principalmente il ruolo degli agenti nel
processo di traduzione, considerandoli come parte di un più ampio sistema di
relazioni sociali, considera la tecnologia come agente non-umano ma che co-
2.4 Gli approcci cognitivi munque ha un ruolo nel contesto sociale della traduzione (Buzelin 2005: 212):
Altri studiosi si sono interessati agli aspetti cognitivi del processo di tra- '" [lbe actor-network theory] reminds us thai the translation process involves
duzione e in particolare a detenninare se l'uso delle tecnologie influisca • , a .multiplicity of mediators, some of which are technological, and thai
sul processo decisionale. In questo filone si inseriscono le riflessioni di Ri- ,.,
sku, che sottolinea come l'impatto delle tecnologie sia cosi significativo che
"the new lìndings in cognitive science will necessarily change some of the , . ' I;a stil~metrfa computaziona_le ri!l°arda le tecniche computazionali adottate per indivi-
common concepts and methodological traditions with regard to the actual duare la relaz10ne esistente tra lo stile d1 un teslo e alcune caraltcristiche dell'autore come clà
text production process and competencies" (Risku 2010: 94). Rileva inoltre gen·cre, grado di istruzione ccc. • '
44 45
L
TRADUZIONE AUTOMATICA E TEORIE DELLA TRADUZIONE
CAPITOLO DUE
the lattcr are not simple tools but 'bla~~ boxes' cnclosing smble fonns of
knowlcdgc, consensus and presuppos111ons aver what const1tutes (gOOd) e il lavoro dei -tradutto~ v~nisse riutili~to_ ~er s~opi_di ~d~estramento e
translation. In short, this conccpt enables us to grasp both the complexity eh_ . mento dei sistemi; ciò ha una sene d1 1mphcazmm etiche, dal mo-
_ and non-linear character - of the translat1on process, and the hybridity of mighorahe questo contributo di fatto non viene riconosciuto né moralmente
mentoc
the translating agent. é economicamente. . . .
n Dorothy Kenny (2011 ), ad esempio, sulla scorta degli studi ~1 Melby 8:
Tuttavia, come rileva Maeve Olohan (2017) in Techno~ogy, Translation and warner (1995), e di D_~gan & Ba~yc~ (2?10), solleva la_qu~stJone ch,e v1
Society: A Constructivist, Criticai Theory Approach, 1 Transla!ion Studies . degli obblighi etJc1 da parte d1 chi sviluppa tecnologie nspetto ali ~so
siano . - d · nu
e le teorie sociali della traduzione non trattano ade~atamente 1I ruolo del- dei contenuti prodotti ~agh utenli, ~oprattu~o quan o q~es1I vengono •
la tecnologia e hanno trascurato il fa~o che esse nflettano_relaz!oni ege. . • ti' per migliorare Ii processo d1 traduzione automatica, come nel caso
Il 11zza . . .
moniche di potere. L'autore propone d1 adottare la prospettiva dei Science d ll'approccio statistJco (cfr. Capitolo 7). Tranne qualche raro caso, osserva
and Technology Studies (STS), e in p~co(are quel_la_ p~oposta in Chandler : nny il 111010 dei traduttori nella creazione dei corpora paralleli nec~ssa-
(20l2), per comprendere come le percez1oru dete~m'.sliche, o":'ero riguar- . e er Ì•addestramento dei sistemi è ignorato e deliberatamente sottaciuto.
do l'obbligatorietà dell'adozione delle tecnologie, siano condizionate dai ~esto argomento viene ripreso da vari altri studiosi, tra cui Moorkens et al.
discorsi di gruppi sociali egemoni (O Johan 2017: 267): (2016), che perorano la causa ~ei ~duttori_, che _hanno diritt! leg~li riguar~
do la proprietà intellettuale dei tesi! tradotti e dei database d1 testi paralleli
derivati dal loro lavoro mediante l'uso le tecnologie, ma che non sono m
The sense that the adoption of certain technologies has an obligatory
grado di affermare i loro diritti a causa delle pratiche lavorative diffuse nel
character (Chandler 2012) also appears to pervade discourses produced
by translators and LSP representatives a_nd _merits investigation. [... ] A mercato della traduzione (Moorkens et al. 2016):
mechanism related to obligatory technolog1es 1s dependency.
The situation at present in which laws of copyright are effectively bypassed
in conteni collection, curation, and exploitation, permits resource holders lo
Lo studioso invita ad indagare anche come le decisioni riguardanti il de- retain data at a cosi to disempowered human writers and translators, and also
sign e l'uso delle tecnologie siano frutto dell'esercizio di un controllo at a cosi to end-users of translated conteni. The disconnect between the MT
egemonico nel settore della traduzione. Le scelte tecnologiche non sono services and the human translated corpora might further alienate translators
mai neutrali: la scelta di un certo modello rispetto ad un altro favorisce from their work, and add to existing mistrust in MT and in data sharing.
alcuni groppi e indebolisce altri. In definitiva la tecnologia, secondo la
visione dell'autore, opera in un sistema di capitalismo globale anche nel Nel contributo vengono suggerite alcune contromisure, come ad esempio
settore della traduzione, con conseguenze importanti sul lavoro dei tradut- un'azione collettiva per massimizzare gli sforzi contro pratiche che tendono
tori, che vedono svalutata la loro professionalità principalmente in termini a indebolire la categoria e la rivendicazione della proprietà intellettuale dei
economici dato che,'sempre più frequentemente, i lavori loro commissio- dati prodotti durante il processo di traduzione. Questi argomenti vengono ri-
nali riguardano la revisione di testi già pre-tradotti dalle tecnologie della presi,e ulteriormente elaborati in Moorkens & Lewis (2019), che analizzano
traduzione. la situazione del mercato della traduzione secondo lo schema proposto da
È proprio questo aspetto che viene approfondito dagli studi critici della Héss & Ostrom (2007) ed elaborano delle proposte concrete con l'adozione
traduzione, un filone di ricerca che riguarda la crescente limitazione del dell'l/nstitutional Analysis and Development (/AD) Framework rispetto alle
ruolo del traduttore che con l'introduzione della tecnologia ha visto pro- questioni etiche sollevate dal riuso dei dati prodotti dai traduttori da parte
gressivamente restringere il suo intervento a una serie di esercizi di pure e degli sviluppatori delle tecnologie per la traduzione.
semplici sostituzioni linguistiche (Pym 2003: 7). La tecnologia, e in parti- Lo schema rappresentato nella fig. 2.4 illustra la metodologia adottata:
colare le tecnologie cloud che hanno consentito di avere degli ambienti di
lavoro su Internet aperti e gratuiti (cfr. Capitolo 7), ha però anche fatto si
46 47
l'RAllllZIONl AlnlJMATICA E 'fEORI K O[LLA TRADUZION E
CAPITOLO 0UF.
48 49
lìuDUZIONE AIJTO~tATICA [ TEORIE DELLA TRADUZIONE
On 3
ctical level. MT could bcnefit fiom various stu~ies _performed in
. pra TS 00 h0 w faciors like regtster or translanon d1rectton 1mpact on "Think. by analogy, of individuals living in a series
empmcal . and translation shifts. Using this knowledge, MT can of tali closed towers, ali erected over a common
lmgulS1lc properttcs od I red . th
timise its strategies in training MT m e s, ucmg e necessary size of foundation. When they try lo communicate witb one
op • ".,.,,uence
data and ID CO,--, the prerequis1tcs for processmg power. another, they shout back and forth. each from his
own closed tower. Il is difficult to make the sound
Christian Hardmeier (2015) in _On statist_ical '."achine tr~nslation and penetrate even the nearest towers. and communi-
•'ieo,y,, nel sintetizzare. I progressi
. ,,, futll dalla teona della lradu- cation proceeds very poorly indeed. Bui, whcn an
transla/lon . .
. . rrendone le tappe pnnc1pali, osserva come la traduzione au. individuai gocs down his towcr, be finds himself in
21one nperco . . di d · · a great open basement, common lo ali the towers.
tematica di tipo statistico s1 basi su un concetto tra uz10ne mvalso negli
Here he establishes easy and useful communication
anni ' 60 e ·10: with the persons who have also descended from
their towers...
!s
Defined in tcrms of an equivalence relation, translation seen as an es-
sentially "transparenl" operation that recodes a text m a d1fferent hnguistic (Weaver 1949: 11)
tation without adding anything of 1ts own, a view that 1gnores much
:::mplexity ofthe decision making processes involved in translation.
J.1 Il sogno della macchina intelligente
Sia i sistemi statistici basati sulla parola (Brown et al. 1990;_1993) che quel- La traduzione automatica ripropone in termini moderni uno dei più antichi
li basati sulle cosiddette phrases (Ko~~ et al. 2003), cosi come I sistemi sogni dell'uomo, ovvero la possibilità di costruire una macchina intelligente
gerarchici SMT (Chiang 2007), condivtdon~ lo stesso approccio, ~vvero in grado di pensare e agire come un essere umano. È un sogno che parte da
mappano elementi linguistici dell~ lmgua d1 partenza con elemenl! della lontano e sembra trovare la sua realizzazione in questi giorni in cui gli al-
lingua di arrivo che si presum~ ab?w10_ lo ste~so ~tgruficato o eh~ ve1colmo goritmi, grazie alla potenza di calcolo raggiunta dai computer e alla ingente
lo stesso messaggio. Hardmeter_ e ~ro- dell avv1s~ ~be_ per nughorare la mole di dati che sono in grado di elaborare, riescono a simulare con buoni
rtà della traduzione aulomattca vt sia la necessità dt abbando11aie una risultati i complessi meccanismi mentali che governano il pensiero umano e
quai · d · ·fl U ·
visione cosi semplicistica della traduzione, ferman 0~1 a n e~e~ su e 1m- primo tra tutti quello collegato ad una delle più complesse operazioni della
licazioni teoriche e sui limiti intrinseci degli approcci adottati ncorrendo a nostra mente: la traduzione.
~ppresentazioni cross-linguistiche_più i:3ppr~sentàtive. . L' idea che ha ispiralo molle ricerche nel campo del trattamento auto-
Si auspica in conclusione che sta ~valo _11 _momento ~1 una convergen- matico del linguaggio è che sia possibile formalizzare i complessi processi
za tra una visione tecnologica e gli studi teonc1 e apphcalt de~la traduz10ne mentali legati all'allività di traduzione da una lingua naturale ad un 'altra,
sia per comprendere meglio la portàtà della svoltà tecnologica ma an,che almeno in parte, tramite un insieme di procedure eseguibili da un program-
per delineare in modo realistico quale sarà il ruolo del traduttore nell era ma software.
digitale e dell ' Intelligenza Artificiale. La storia della ricerca nel campo delle tecnologie per la traduzione, ov-
vero il lenlalivo di automatizzare tulio o parte del processo di traduzione, è
50 51
1,,, PROSPETTIVA SIURICA: DALLA l.AJRJA A GooGLE TRAouno11.t
CAPITOWTRE
caratterizzata dagli entusiasmi, talvolta eccessiv.
stata, da un Iato, . Il . i, da
. . • ·mpegnati nella progettazmne e ne o sviluppo d . . Parte . boli che si riferivano ad una lista di attributi: i dischi si potevano ruotare
::0
dei ncercaton 1 . . . e1 sist sun
all'inizio speravano d1 ottenere nsultat1 se non u ellJi . oJannente per generare un gran numero d.I comb'maziom, . . che mostra-
(che sopratiutto . . 8Uar1
·ti alla tradUZJone effettuata da tradutton professio . , al. tutte le possibili innegabili verità elementari riguardanti l'argomento
meno comparabl . ll!sti)
dall'altra, anche dalla di~denza del grande pub_bhco, e dai timori da :a, della rotula'.
dei traduttori nei confrooll delle nuove tecnolog1e. P tte
eg . ultimi anni ,,.,.~
ft....;. si è avuta una svolta nella conoscenza e
ne la
N I1 • • • fi . 1 d'
·one dei sistenù di tradUZJone automatica: m atti, . . mentre in Pass ato qu•f-
fus 1
.po di tecnoloaia era adottato da un numero 11mllato di utenti i e-
sto Il o·... d . ,ngene
enti O aziende di grosse dimenS1om c~n gran fabb1_s~gno di lraduzio r~
ora invece, grazie soprattutto alla diffusione dei serv1z1 online gra . _n1,
ad un considerevole nùglioramento qualitativo dei risultati, la lrad tu~(] e
.tà ·1 UZ1one
automatica ha raggiunto una notevo Ie popo Ian presso I grande pubbr
impensabile fino a qualche anno fa. L'excursus storico che qui si pro •co'.
u h. ,,, , · A ,. , , Pone s1
basa principalmente sul roac me , rans,allon rcmve , 1 archivio più e
. daJ hn H h. . steso
sulla traduzione automatica curato o utc ms, emmente studio
settore, che raccoglie le pub_bli_cazi_oni in. lingua inglese dai primord/~e~: Figura 3.1 Ars brevis XVIII Century. _Pa_lma de Mallorca BP MS998. Digitai ver.;ion
traduzione automatica fino a1 giorni nostn. Biblioteca Virtual del Patnmomo B1bhografìco. Spaio. Ministerio de Educaci6n,
Cultura y Deporte
3.2 I precursori Le idee di Ramon Llull furono riprese successivamente da Leibniz (1646-
J726), che sviluppò la prima idea di un dizionario basato su codici numerici
L'idea di un meccanismo in grado di riprodurre il ragionamento umano ri- per tradurre da e verso altre lingue. Tale concetto si ispirava all'idea di lin-
sale addirittura al XIII secolo, quando il filosofo e missionario catalano Ra- guaggio universale, che annoverava tra i suoi maggiori sostenitori Descar-
tes (1596-1650), ovvero un linguaggio basato su principi logici e su simboli
mon Llull (1234-13_1~), autore dell'A:~ M~gna, nei _suoi viaggi tra Spagna
iconici comprensibili universalmente, per facilitare il commercio e lo scam-
e Africa del Nord s1 1mbattè nella Zairja (m arabo )c;..,\!il! trascritte anche
bio di conoscenza tra i popoli. La characteristica universalis proposta dal
come zai,jah, zairajah, zairdja, zairadja, e zayirga), una macchina pensan-
filosofo tedesco è dunque un,linguaggio formale in grado di esprimere, tra-
te basata sulle 28 lettere dell'alfabeto arabo corrispondenti ad altrettante
nùte una serie di simboli e loro combinazioni, concetti matematici, scienti-
categorie fìlosofìche, usata dagli astrologi arabi. Considerato un precursore
fici e metafisici. Questa sua elaborazione anticipa di oltre un secolo la logica
della teoria computazionale, Llull immagina una versione cristiana della
matematica di George Boole (1815-1864) e la nascita del primo linguaggio
Zairja, basata su dogmi medievali, destinata a risolvere ogni problema di te-
di programmazione, l'Analytical Engine arder code ideato intorno al 1837
ologia, metafisica, morale per arrivare alla verità senza do.versi preoccupare
da.Ada Lovelace, l'incantatrice dei numeri, per la programmazione della
di pensare. Egli la concepisce come strumento in grado di produrre cono-
maèéhina di Charles Babbage.
scenza per convertire alla fede cristiana i Musulmani attraverso la logica. A Alcuni esempi concreti di dizionari meccanici vennero pubblicati da
tale _scopo inventò le cosiddette rotule Lulliane (fig. 3.1 ), costituite da due coevi di Leibnitz come ad esempio Cave Beck nel suo trattato The Univer-
0 pm dischi di carta sovrapposti su cui venivano riportate delle lettere o dei
so! Character (1657), Johann Joachim Becher in Character pro notitia /in-
' http1/www.mt-archivc.info/ 2 Per una trattazione approfondila delle teorie del filosofo catalano cfr. Eco 2012: 61-81.
52 53
LA PROSPETJ'IVA STORICA: DALJ.A ZAIRJA A Gooc;1.t TRAotn,•o~t
CAPITOLO TRE
guarom universali ( t 661) e Athanasius nel s~o Poiygraph;a (933 petr Petrovif Smimov-Trojanskij, un ingegnere e inven-
et um'versalis (1663). Nel 1668 John Wtlkins m 1n Es~ay towarc4. a no~Q semPre ne1 . 'pò un primo prototipo di traduttore meccanico, modellato
1
Character and a Phi/osophical language
• ·
cercò d, fornire una bas l?.eQ/
I eleo · tore russo ' SVI updi tre diverse fasi del processo dt. traduzione,
. che puÒ esse-
iù solida al concetlo di linguaggio umversa e, cercando di costru· llca su una sequen~ .
· d I ·
base logica e razionale per lo ncerca e e eqmvo enze mterling .•re. . una
P li · re cosi schemauzzato.
'd . I d . U1s1ich
mediante una classificazione vah a umversa mente et concetti e d I e, TESTO NAZIONAL-GRAMMATICALE (A)
. . . i (Traduttore madrelingua A)
tità sottesi a c13scuna lmguo. ·
FORMA LOGICA (A I)
i (Macchina)
3 3 Cerveau mécanique di Georges B. Artsrouni e la macch' FORMA LOGICA(B I)
· Pl!tr Petrovlì! Smirnov-Trojanskij •na di i {Traduttore madrelingua B)
TESTO NAZIONAL-GRAMMATICALE (B)
li primo vero impulso allo sviluppo di sistemi di traduzione autom 1. .
" . t I 193 a ica s1 ·ma fase un traduttore, madrelingua della lingua di partenza, effet-
ebbe solo nel secolo scorso, e ptu prectsamen e ne 3, quando u .
· · ·
gnere francese di ongtm annene, eorg s G e Artsro b
um , revelt una maninge.
· ò h' Nel1a pi~ lisi logica delle parole e della loro funzione sintattica nel testo
per tradurre dal nome Cerveau mécanique (fig. 3.2): l'invenzione cocc_ ina tuava
. nza · Iare fiorma
ana (testo naziona/-grammaticale A), secondo una part1co
. . t d ns1s1e.
va in un dispositivo meccamco aziona o a un motore elettrico pe . fo P.:~A I): tutte te parole ftes~e v~nivano _sostituite eq~ivalent! form~
strare e recuperare infonnazioni su un 'ampia striscia di carta che p:tegi. c!oniche (ad esempio il nommn~t~o P:r t ~o~tanlt~t, _I mfi~1~0 pe~ t ~erbi'.
·
dietro una tastiera. II suo t'd eatore Ia progettò per utt·1·1zzarla per gli sava. ) per questa fase venivano utthzzatt det stmboh d1 anahs1 logica tdeatt
ferroviari ' i conti boncan,' e soprattutto come d" IZIOnano ' meccanico Ol'ari.
O
~jO·5tesso inventore. Nella seconda fase, la macchina trasformava le se-
'
linea del nastro conteneva una parola sorgente (nella hngua di partenza)
'
a dt' ~orme canoniche e di funzioni in sequenze analoghe nella lingua
quenzc '' .
te equivalenze in diverse altre lingue (lingue di arrivo); ad ogni entrata e di arrivo. (forma logica ~I). Nella t:rza. e ~lttma fase, un traduttore mono-
. . d . cor- !' e·della lingua di amvo converttva 1I nsultato della fase precedente nel
rispondevano delle perforaz1om su un secon o nastro, dt carta o di metall
che funzionavano come meccanismo di selezione. Un primo prototipo ~'1. /°fa corrispondente nella lingua di arrivo (testo nazional-grammatica/e B).
questa macchina venne presentato all'Expò di Parigi nel 1937. es l!.8 fonna logica di Trojanskij, basata inizialmente su parole tratte dall'e-
speranto e su 200 simboli a~ili~ (come ad e_sem~io j per _il pl~le o e per
l'avverbio), è un primo esempio dt rappresentazmne mtennedta, comspondente
alla grammatica universale, in grado di rappresentare tutte le diverse lingue. La
macchina ideata da Trojanskij era a tutti gli effetti un dizionario automatico, ma
l'inventore riteneva che anche il processo di analisi logica potesse essere auto-
~tizzato, mediante la creazione di una macchina dedicata; è per questo motivo
clÌ~ Trojanskij è ritenuto a ragione il primo vero precursore della traduzione
automatica. Nonostante ciò, le sue idee non trovarono consensi in Russia e non
ebbero un'influenza diretta sugli sviluppi futuri della traduzione automatica.
II vero inizio della traduzione automatica si ebbe solo con l'avvento del
Figura 3.2 Cerveau mécanique di G. Artsrouni (da Corbé 1960) calcolatore e con il diffondersi delle idee sugli universali linguistici, ovvero
55
54
.,••• DAI.LA :lAIRJA A GOOGl,E TRADln,{)RY,
L• PIIOS1'1!1TIVA STOR~ •
CAPITOWTRt
56 57
LA rROSPETTI VA STORICA: DALLA Z,\IRJA A GOOCLE TRADll1TORF.
CAPITOLO TRF.
r Syntactic Parsing
(Choft'P)', JG65; M.t1•1Nn. 1995: Chambll.. 1996; Coli111. 109!>: Kllil'I M:I M .
SM ,olwd tM probH!lt1 with 1M st.tti•icM - thod .annnc. 2003)
s
s --> ., V,
., - • > Pro
., --> 0.t • N ~P
•-> 0.t-l'
lbu -> AdJ I
,,"->
-->,y ... . .
0.t --> tbe
:t i~ pp
Figura 3.3 Schema di flusso di una parte delle procedure di consultaz· d .. Pro--> lba
I-> probl• 90'-f ~ te
nario del sistema di traduzione automatica di IBM mne cl diz10- • --> ..tbod tnw pn',lbltm w~J\
Y -> solftd Oit1 Nm,
l:..
P · · > wttb
UJ-·> A~
1t1U1tlcal I I
3.5 Gli anni '50 e '60: l'euforia iniziale e la disillusione ,1.1tinia l rnelhod
58 59
LA PROSPETTIVA STORICA: DALLA ZAIRJA A GOOGLE TRADIJlTORE
CAPrroLOTRE
61
60
LA PROSPETOVA STORICA! PALLA ZAIRJA A GoocLE TRADIJrro CAPITOWTRE
IIF.
Contemporaneamente, la Comunità Europea divenne uno di saarbrilcken sviluppò il sistema multilingue a trans/er
vo
. della traduzione automatica, inizialmente
RAN(. con l'adozione deavslplonsor atr,. Il rs:brucker
0
Obersetz11ngssystem) che integrava diverse tecnologie
inglese-francese del sistema SYST acrornmo per System T ersion svsY. . generazione del linguaggio naturale: grammatiche di dipenden-
ideato alla fine degli anni '50 da Peter Torna, ricercatore della GransJatio; . analis•
di edati statistici, re~o Ie ~s tionnaz_iona
. 1_1·, ecc. . .
di
University e sviluppato dall'om~nima s_oci~tà a partire dal 196eorgeto\\-n za, us0 da si assistette mvece m quegh anm a un nnnovato interesse per
traduzione interna di documentazione sc1entdìca, tecnica, amm.101 ) Per la In 01S::, a interlingua, motivato anche dalla ricerca contemporanea nel
· · d I ·1
legale, e successivamente comrrnss10nan o o svi uppo di altre
strar1Va e 1'3PP~U'lntelligenza Artificiale e ~ella Linguistica Cognitiva. Il sistema
guistiche, ovvero francese-inglese e inglese-italiano. coppie lin. cam~p•stributed Language Translallon) sviluppato dalla società infonna-
Fin dall'inizio risultò però evidente che il sistema SYSTRA ~LT135~ era un sistema interattivo multilingue che operava in rete, dove
avre~be potuto ri~pondere in _maniera efficace alla necessità de N non uca. t in:inale doveva essere un traduttore automatico da e verso una sola
mumtà Europea d1 avere un sistema. realmente multilingue , ovverIla C().. ~gn• e La traduzione veniva elaborata in un linguaggio intermedio, una for-
potesse tradurre da e verso tutte le lmgue europee. Pertanto n 1 198 che ° )lngu&·odificata di esperanto.
Comunità Europea decise di finanziare l'ambizioso progetto EiR 2 ta JllamVn secondo progetto o~ I de_se,_1'I proge~~ Rosetta, venne realizzato
· dai·
il cui scopo principale era la realizzazione di un sistema pre-•10dOTRA, hilips -Research Laboratones: 11 sistema ullhzzava la grammatica di Mon-
multilingue avanzato per la traduzione . tra1· tutte le lingue dell a comun·,
USlna1e ~gue, una teoria che l~g_ava ~ire~tarnente sintas~i e. s_emantica, secondo il
europea basato su una struttura ad mter mgua. Tuttavia il pro ltà •ocipio della compos1z1onahtà, m rappresentaz1om interlinguistiche. Nel
nostante gli ingenti finanziamenti ottenuti, non riusci a produrrgetto, n().. p;rso del progetto vennero inoltre esplorate altri importanti aspetti della tra-
sistema operativo, cosicché si concluse alla fine degli anni ,80 ~n vero ~uzione automatica come ad esempio l'isomorfismo e la reversibilità delle
EUROTRA falll nel suo scopo principale, ovvero la creazione d• che se grammatiche e _la _co_mposiz(onalità dei _si8fl!ficati.
ma ~i ~du~ione multil!ngue da e in tutte le lingue europee, eb~~n SJSl~- Altri gruppi d1 ncerca s1 crearono m Giappone, Corea, Taiwan, Cina e
mento d1 stimolare la ncerca transnazionale nel campo della lin P~rò li Malesia cosi come in Unione Sovietica.
computazionale. guislJca Negli Stati Uniti gli sviluppi più significativi si ebbero presso la Carne-
La ricerca in Europa in questo periodo vide come attori princ · r gie-Mellon University a Pit~burgh sotto la direzione di Jaime Carbone!! e
di ricerca diversi: in Francia il gruppo di Grenoble GETA (Gr ipad'. gruppi sergei Nirenburg, che spenmentarono prototipi basati sulle tecnologie di
.
pour Ia Traductlon Automatique), in Germania il gruppo sp · es Intelligenza Artificiale, in particolare sull'utilizzo di basi di conoscenza
. d' S b k enmentale d'1
ncerca I aar riic en, e in Olanda le società BSO di Utrecht e Ph'l' 1 come ad·esempio il sistema KANT. '
Emdhoven. •ps d1 Lo svil~ppo più i~te~s~te de_gli anni '80 fu però la diffusione dei pri-
li gruppo GETA roi\prodotll commerciah di tradUZJone automatica: SYSTRAN e LOGOS.
· sviluppò il. sistema
. Ariane ' un sistema a 1ransfer di
secon da generazJone, che esemto Entrambi i sistemi avevano goduto nel decennio precedente di ingenti fi-
· d . .. una notevole influenza sul!a ncercadi
.
ques 1o peno n~amen~ da parte del ~ovemo ~eg!i ~lati Unit_ i per lo sviluppo di coppie
· o per la sua.fless1b1htà e modularità ma che non d'1venne mai
un vero sistema commerc1ale, nonostante i finanziamenti ottenuti da d1 hngue ntenute strategiche a fim d1 difesa e d1 intelligence' e ora erano
getto nazionale francese sulla traduzione automatica. un pro- pronte a presentarsi sul mercato. Il sistema SYSTRAN venne adottato oltre
. Alla fine degli anni '80 in Francia si ebbe anche la prima real' . che dalla Comunità Europea, anche da altre istituzioni come ad esem~i 0 J
d1 un .servizio di.Iraduz10ne· automatica in rete ad uso del grande pJZZaZJOne NATO,
. nonché da grandi società come la Generai Motors , Dom·e 1 r, A,
eros-a
bbl'
Infatti _nel 1988 il ~ervizio Postale Francese offri su Minitel un se~izi •c;: patiale e Rank Xerox. Contemporaneamente la LOGOS Development Cor-
traduzmne automatJca basato su SYSTRAN di . . . o I
disponibil li · . . per verse coppie d1 hngue,
e ag . utenti su termmah collegati alla rete delle Poste II ..
presentava pero una serie di svanta .. . , servizio , Ad esempio SYSTRAN sviluppò il sistema russo-inglese per la Unitcd Statcs A. F
integrato in ambiente PC. gg1. era caro, relativamente lento e non
e la LOGOS le coppie di lingue inglcsc-viclnamita e inglese-russo. ,r orcc
62 63
I
LA -~·
l'ROSrm • ,.~
STORICA! DAI..LA ZAIIUA,. GooGLP, TRAp,.....__
- • •Ullt,
1
CAPITOIAJ TRf-
65
64
LA PROSPl.,,,VA STORICA: DALLA ZAIRJA A GooGLE TRAourroRr
CAPITOLO TRE
della tenninologia e in particolare la memoria di traduzioni, un a h' . iva digitalizzazione delle informazioni hanno fortemente e re-
di testi di partenza allineati con testi. di arnvo . fi na1·1zzato al recup re •v10
.. . erodi la P'.ogres~te rivoluzionato i tipi di comunicazione (libri, giornali in forma
lavoro fatto in precedenza per nuove traduzmru. 1n particolare que 1, e penuna~e biblioteche con cataloghi elettronici), i metodi di trasmissione
di I d . . s Uhi.
mo strumento consente al traduttore cercare e tra uzmm effettu . elettronic3:deotex, telefax, radiotelefono, televisione via satellite, Internet,
· I
precedenza per stringhe dt paro e o a tn dd' 'ttura per fras ' · ate 1n
I intere, ave d
0 (telete~, v;i •scritti (microfilm, teletext, database, ipertesti, testi multimedia-
disposizione su schermo la traduzione effettuata in precedenza per Stri~ a ecc,): 1tes ni·cazione orale (videotelefono, videoconferenza, telefoni cellu-
esattamente uguali o simili.· Gh· svi·1uppt. pm " recen 1·I de11 a postazione d'"&he
• • d' . 1 la.
1'. Jacomu
1')
elefoni satellitari).
varo del traduttore hanno portalo anche aIl a m1egraz1one I sistemi di 1 laD, t meno che più di tutti caratterizza questa rivoluzione è sicuramente
zione automatica commerciali: l'idea di base è che laddove non sia pos ~u- .[l,,eno
. di Internet come vetnna · su I mon do con siti . ' we b mu I11·1·mgu1.. Una
. · g1'à efiiettuate m
recuperare delle tradUZJom · precedenza, · st· possa proc sid Ile
. ( 1· fi . . e ere rutdiZZo nza immediata dell'ampia diffusione di questo nuovo strumento è
alla traduzione delle parll nuove segmen t, paragra o mten testi) con la conseguemunicazione è diventata veramente globale: da un punto all'altro
traduzione automatica. che!l~ COta le persone comunicano in tempo reale. Le barriere geografiche
Tra i diversi sistemi di Traduzione Assistita sono da citare Trado d' del•planta:e abbattute e la richiesta di localizzare i contenuti e le informazioni
SDL, Transit della STAR Ag in ~erman!a, T~slation Manager dell'f~M: sonois
. . . eb è cresciuta m . mamera
• esponenzrn · Ie.
Eurolang Optimizer della LANT m Belgio e DéJà Vu della Atrii. dei Insitt,W ·
una'società globale_carattenzzat~ da una ~o~~mcaz1one
. . go I baIe e d'1-
In questo periodo il numero di installazioni dei sistemi di traduzione .· r 18 ·è-necessario disporre delle mfonnaz1om m tempo reale per poter
automatica di tipo commerciale aumentò soprattutto presso enti governa- ~ ; : le' opportunità offerte '.13I mercato mond_iale. E pe~ ~oterle cogliere
1
tivi e società multinazionali con notevoli necessità di traduzione di docu. g un crescente bisogno d1 abbattere le bamere lmgu1st1che.
mentazione tecnica. li mercato della localizzazione dei prodotti hardware emerge
,Jla,traduzione e le tecno Iog1e ' Iegate aIl a traduzmne
. assumono m . questo
e software diede un notevole impulso all'utilizzo delle nuove tecnologie .un ,ruolo di non poco conto ed è per questo motivo che uno dei
per la traduzione, dovendo rispondere all'esigenza di commercializzare ; più rilevanti del web di questi ultimi decenni è quello della dif-
nuovi prodotti contemporaneamente nelle lingue originarie di tutti i paesi . emi per la traduzione automatica online gratuiti. Se prima i
del mondo. ,traduzione automatica erano conosciuti e utilizzati da un pubblico
La sempre maggiore diffusione di sistemi di traduzione su PC a basso · ~ fo più società multinazionali ed enti governativi con un gran-
costo per uso personale costrinse inoltre i produttori dei sistemi commer- .de fabbisogno di traduzioni, I~ disponibilità su lnte~et_ di q~es!i servi~i ha
ciali (LOGOS, SYSTRAN, METAL, ecc.) a dover rivedere la loro politica lfbntribui_to in maniera detennmante a far conoscere I s1stem1 d1 traduzmne
commerciale diversificando i prodotti in base alla fascia di utenza. Nac- lutòmatidi,a:J grande pubblico. . . .
quero così delle versioni su PC dei sistemi storici di traduzione automatica ·, JJ:tc:onseguenze di questo fenomeno sono moltephc1. lnnanz1tutto la do-
rivolte principalmente ai traduttori e al pubblico non specializzato, come ad m~W: di,traduzione di testi come ad esempio le e-mail, le pagine web è in
esempio SYSTRAN Pro, Langenscheidt TI (basato sul motore del sistema forte aumento: agevolato da una fiuizione del servizio molto semplice, I'uten-
METAL) nato dalla collaborazione di Sail Labs e Langenscheidt, Persona! te si se~e della traduzione automatica online quando ha la necessità di cono-
Translator PT, commercializzalo da IBM e von Rheinbaben & Bush. scere in tempo reale il contenuto di un testo in lingua straniera (ad esempio
se si vuole tradurre una pagina web in alcuni casi basta immettere solo l'in-
clirizzo della pàgina e dopo alcuni secondi il sistema fornisce la traduzione).
3.8 I servizi di traduzione automatica su Internet Con l'aumento della domanda sono cresciute anche le aspettative rispetto
, . alla qualità _de,lla traduzione fornita. La qualità della t~duzione dei sistem!
li continuo progresso della società dell'infonnazione ha profondamente online della prima ora lasciava però ancora molto a desiderare anche perche
modificato i modi, i tempi e i luoghi della comunicazione sia nella sfera · si .trattava df sistemi, ad esempio proprio come SYSTRAN, progettati e svi-
pubblica, sia io quella personale. Le nuove tecnologie dell 'infonnazione e 1.uppatiper la traduzione di testi di tipo tecnico-scientifico, con un linguaggio
66 67
LA rROSPETflVA STORICA: DALLA ZAIRJA A GOOGLE TRADUlTQRE CAPITOLO TRE
.zznto e dalla sintasSi relativamente semplice In . est'uttima società che diede un impulso decisivo alla diffu-
aItornente standanl 1 . . . · realtà . · qu
testi che si trovano su Internet sono ~1 llpo ~fom'.al~, talvolta anche di ti I ;,p proP11O. servizi di traduz10ne
· automa!Ica· on 1·me alleandosi con AltaVista,
- ad esempio le e-mml o le discuss1om sulle chat e pe Po sione dei otore di ricerca, offrendo al grande pubblico il primo servizio
co Il oqu1a1e come . . . .. • uJ ' rtanto . .o..nosodimtraduzione automatica - on1me - -
. . basat· un approccio di npo trad1Z1ona1e ns tano essere inad 1 il••-: m tempo reale sul dominio noto
s1stem1 1 su . . eglla - 0
allo scopo. Una risposta a questo tipo di_ :-'1ge_~ venuta proprio da lntem t1 gratutt . come Sabei Fish (fig. 3.5). Questo primo esperimento divenne
.
mquanoe 1
nonne archivio di testi mult1hngu1 utlhzz.ato come base di' d . e~
. atida·
aJJCOra _
08?
. ,....v1ss1m0
tempo un grande successo (Yang & Lange 1998): il numero di
d . . .
. -d' traduzione automatica di nuova generazJone (cfr. Capitolo 7) 1 1~ ~- te al giorno di tra uz10ne automallca aumento da 500.000 nel maggio
s1stem1 1 · d"ffu · ·
. dalla fine degli anni '90 s1 sono I s1 velocemente nchlCS 3 milioni nel 2000.
A part ire . . Portai·
J998·0 1
dì traduzione online su Internet come tesllm~mato dal rapporto The lan'. 2008 il sistema venne acquisito da Yahoo e dopo fortune alterne
guage Engineering Directory - A resource gi_11de lo Language Engineerin ·?l'N~l nto definitivamente un anno dopo. Sabei Fish ebbe il merito di
. . ns products and services, pubblicato nel 1996, che cont Venne• 1spe . strada a una tiormuIa che s1· nve · 1o· essere I·1 vero trampolino di
Orgamsa110 • . enevag 1
. - lt 1- di una ricerca condotta per delineare lo stato dell'arte nell'•~b· S1'18~d l~e traduzione automatica: a partire dal 1997 infatti si diffusero ve-
1nsu a 1 . . d d" . . . . . ~u Ilo 1anc101 ete altri servizi. gratmll. . d'I traduz10ne
. automatica. online allo scopo di
den ll 'I dustria delle Lmgue. Nella·sezione
r 1 e.1cata . M
a1 serv1z1 di ingeg .
nena 1ocem~n mercato richiamando l'attenzione del vasto popolo di internauti,
linguistica nella categ~ria "Mac~me rans auon via. odem~ initel" sono
enumerate ben sei società che gia a quel tempo offrivano servizi di que creareh:sassero e sperimentassero questo tipo di servizio.
genere: Compuserve [ne., Globalink lnc., Language_Engineering Corpo~~ aflinJ.à, et,2003 erano presenti su Internet 55 servizi di traduzione automa-
tion, Nec Corporntion - C&C 1T Research Laboratone, Smart Communica. . ' (Hl,ntchins & Hartmann 2003), di cui ben 25 offrivano coppie di lingue
UC8' u
tions Jnc. e infine SYSTRAN SA. , iaDO,
· da allora, la traduzione automatica è diventata un'area di ricer-
evoluzione caratterizz.ata da:
;disponibilità di sistemi open-source (come OpenLogos9, Moses 10,
A.pertium", sistemi Asia _O~ine 12 più rec~nt~me~te OpenNMT13 )
--lii• '·~ ~ - 'che nbn solo hanno contnbu1to a sumolare 11 d1batllto accademico e
- •r .la•sperimentazione in questo campo, ma anche ad attrarre potenziali
,;,... ~utenti -e,investit~ri dell'~dustria _della trad~zione;
art~
.,, . ,tlemergere degh approcci neurali (cfr. Capitolo 4), che hanno contri-
6ìJito·a un incremento considerevole della qualità dei sistemi;
Malrix, il cui·Òbicttivo cm di sviluppare dei molori di ITaduzione au1oma1iea per IUlle le lingue
europee: hllp://www.sialml.org/moscs/.
11 Un sisttnla·oJl"lkl'O"T'C' a regole linguistiche sviluppato nel progetto OpcnTrad dall'univcrsi-
69
68
'f2
LA P1108Pf.TTIVA 910RICA: PALI.A ZAIRJA A Goocu: TRADIJTTo llt.
i
CAPITOLO TRE
70 71
L'r.VOI.IJ7.10Nf.TF.Cl'iot.oc.l<:A
C.\l'ITOI.O Qt1 .\TI'lm
contigue dell a lingua di partenza, mentre i ooq,ora monolingui, che fornisco- In sint1.-si, la traduzione finale è rappresentata dalla fra.,;,:: in cui:
no il modello linguis1lCO della lingua di arrivo, servono per misurare quanto le sequenze di parole nella lingua di arrivo corrispondono molto pro-
è probabile che una dc11.-nninata parola o scqu1.-nza di parole, il loro ordine e i babilmente con le sequenze di parole della lingua di partenza
costrutti grammaticali corrispondano all'uso reale nella lingua di arrivo. • le parole nella lingua di arrivo sono quelle che con maggiore proba-
bilità appaiono insieme nella lingua di arrivo.
8-
Ci sono ire diversi tipi di approcci slatistiei: basato sulla parola (word-bosed
SM/), su una sequenza di parole (phrase-based SMTefa<:lored-hased SMT)
e su modelli sintaltici (syntax-hased SMI).
Nel mode/fo stalÌ.l'lico hafalo .fui/a parola, usato per la prima volta dal
sistema CANDIDE (Brown e/ al. 1988; 1990; 1993) basandosi sul teorema
n StalisbealModel _ _ _ _ di Bayes' (Bayes 1763). le parole sono tradotte come unitil atomiche, ovve-
ro la traduzione i; basala su corrispondenze parola-per-parola (allineamen-
O Slatl'Stle:,,IMllchioe T,.ns lat,onSy,tem Training TextDllta
ti) tm il testo di panenza e quello di arrivo. usando il cosiddetto concetto
(Target
di distribuzione di probabilità della traduzione a livello lessicale (lexical
Figura 4.9 Traduzione Automatica di tipo slatislico transfalion probahilìty cli.~trihution): per ogni parola de l Lesto di partcn;,.a,
il sisLema calcola i) il numero di occorrenze di traduzioni equivalenti in un
Per fornire risultati allìdabili. il sistema deve essere opponunamente addc-
corpus, ii) la distribuzione di probabilità mediante la stima della massima
strnto mediante corpora cst1.-:;i (Training rexr clata), ora sempre più dispo-
verosimiglianza (maximum /ikelihoodesfimation). un metodo per cercare la
nibili libcrnmcnte su ln1emet in molte lingue differenti, come ad esempio
dislribuzione di probabilita che rende i dal i osservati più probabili.
in O PUS• una raccolta online gratuita di corpora paralleli. Questi sistemi.
Il punto di partenza è che ogni parola della lingua di panen:,.a può essere
graiic ai dati di trnining. imparano autum;iticamente qual è la traduzione più
tradotta con ogni parola della lingua di arrivo e il calcolo probabilistico
appropriata calcolando la probabilità di occorrcn7.a nel lramlalion nmclcl.
viene effettuato sulla base di un ampio corpus parallelo. Per rende re pili
Il modello statistico prevedeva inizialmente come unitll di traduzione la
chiaro il metodo adottalo in questo approccio prendiamo ad esempio la frase
singola parola (Urown et al. 1988). ma successivamente è stato adunato con
inglese Thecat is under the tahle che corrisponde alla fra.'iC italiana Il gauo
risultati migliori un approccio basato su stringhe di parole contigue (Koehn
è sollo il tavolo : il sistema cerca nel suo corpus parallelo tutte le corrispon-
et t1I. 2003 ). phrrues in inglese, da non confonck.TC con la nozione di sin-
denze tradullive possibili I)I..T le si ngole parole della frase di partenza e ciò
lagmi in quanto non sono stringhe linguisticamente motivate, bensi rilevate
sib'llifica che in assenza di qualsiasi infonnazione linguistica qua lsiasi pa-
statisticamente nei corpora ulilizzati dai sistemi.
rola della frnse target. ovvero "'ir', "gaflo", "è". "sollo", "'ir', "'tavolo" può
Ogni frase input viene analizzata come sequenza di parole (n-grams).
essere la traduzione ad esempio della parola inglese c:al ma che la ricerca in
Dur,mte la fase di traduzione. il sistema segmenta il testo in sequem:c di pa-
un corpus parallelo r.tfforl-Crà, in ba..e alla stima della massima verosimi•
role e produce in base al tran.sfalion model lune le possibili ipotesi di tradu-
glian7_a. la corrispondenza c:of ..... gaflo , dato che queste due parole co-oc•
zione computando le seq uenze di parole più frequenti nella lingua di arrivo
corrono più frequentemente di altre nel corpus parallelo. Questo mclodo è
che corrispondono alle St.-quen7.e di parole id1,.-ntificate nel testo di partcnw.
sia lo successivamente sostituito da altre metodologie, tuttav ia ha sviluppalo
Successivamente il sistema calcola in base al lunxuoxe model quali frasi
alc uni principi base che MJno validi ancor.i oggi per l'approccio statistico.
nella lingua di arrivo ottenute dalla ricombinazione dei segmenti tradoui
tendono ad apparire pili frequentemente nella lingua di arrivo.
90 91
h, ,11ocu,so 1>1 TIIAl>l/1,l()Nr, At r r~tHICA r. u ; l."<~lrr.TF.N7.F. DJ.I. TIUDl,,,1)11,t;
110 li i
CAPITOLO SEI
QUALITÀ E VALUTAZIONE
DELLA TRADUZIONE AUTOMATICA
1 http://www.caml.org/mt.php
127
C.-.,rr01.o St:1
Qc.-.u,·AI: VAl .l rrA7,ION1' 1)1!1.LA 1·1u11U7JCINI'. AU1'0MA"l'l (:A
could be highly accurate and ycl lacking in intclligibility: this wuuld be likcly
~ella qualità della tr.iduzione automatica lo è ancora di più per ragioni che 10 occur, howcvcr, only in cascs whcrc lhc originai had low i111clligibili1y.
illustreremo nel corso di questo capitolo.
Il vero problema è che ancora c'è poco accordo su quali siam>i para- L'intelligibilità si riferisce ad una tr.iduzione che può essere lclla agevolmente I
metri da considerare quando bisogna valutare le traduzioni prodollc usando ed è facilmente comprensibile, similmente a qualsiasi testo nativo nella lin- 'i1 I
t~ nologie per la traduzione, ovvero le traduzioni grezze. In questo scena- gua di arrivo; si impiega questo criterio per valutare la traduzione automatica
no, un quadro di riferimento condiviso per la valutazione della qualità è come lesto indipendente nella lingua di arrivo, senza alcun confronto con il
consideralo uno dei passi più importanti nel misurclre l'effièacia delle tec-
:, II
testo di partenza: "When a translation sentence was being rated for intelligibi-
nologie in relazione al loro uso.
Prim~ di descrivere lo stato attuale della ricerca in questo sellore è però
lity, it was rated without reference lo lhe originai" (ALPAC 1966: 68).
li criterio di fedeltà invece è usato in connessione con quello di accu-
iI
necessario fare un breve excursus storico?, che evidenzi come le metodo-
logie adottate nel corso del tempo per valutare la qualità della traduzione
ratezza. senza però definirlo con precisione. Solo nel prosieguo del docu-
mento si chiarisce che la fedeltà si valuta confrontando il testo di arrivo
I
,1
automatica oscillino lrcl due estremi opposti: l' adozione di criteri qualitativi, con quello di partenza, di cui si mis ura il grado di informatività (ALPAC I II
che implicano il ricorso aJla valutazione umana del prodotto di traduzione
1966: 68):
automatica, e criteri quanlitativi ed automatici.
li primo lenlalivo di valutare la traduzione automatica risale al famoso "Fidclity" was mcasurcd indircctly: 1hc mlcr was askcd 10 gathcr whatcvcr :11 I
rclpporto ALPAC del 1966 intitolalo languages and mac:hines: computers mcaning he could from lhc tr,111.~lation sentcncc and then evuluatc thc originai
in tran.vlation und linguistics, commissionato dati' Accademia Nazionale sen1cncc for its "informativcncss" in rclation lo what hc had undcrstood I
from thc trunslation scntcncc. Thus. a rnting of thc originai scntcncc ,1s
delle Scicll:lc americana per studiare la fattibilità della traduzione automa-
tica e soprattutto i risultati ottenuti in termini di qualità, velocità e costi a ..highly infor111a1ivc" relative to Lhe crnnslation ~cntencc would lmply thai
1
i,) ti
fronte di circa dieci anni di ingenti finanziamenti della ricerca in qu1..-sto Lhc lattcr was lacking in fidclity. I
settore da parte del governo americano.
Non c'erano allom ancora dei modi affidabili per valutare la qualità. Per fedeltà si intende dunque il grado di infonnatività del lesto di par- i1
tenza rispetto alla traduzione: vale a dire che se per capire la traduzione è
perciò la commissione si rimise ad un esperimento condotlo da John B.
necessario ricorrere al testo originale allora la traduzione è di scarsa qualità.
Carroll che confrontava traduzione automatica e traduzione umana, integra-
lo da uno studio ad opera di Arlhur D. Little, lnc3 sugli errori di un sistema L'intelligibilità si valuta su una scafa da 1 a 9, mentre la fedeltà su una
scala da Oa 9, utilizzando una scala di valori indiretta. Ad ogni valore della '1 I
di traduzione automatica sviluppato da IBM e in uso presso la Foreign Te-
clmology Division. L'esperimento di valutazione della traduzione di frasi scala è associata una breve descrizione, ad esempio il valore 9 nella scala
selezionate dal russo ali ' inglese si basava su criteri di intelligibilità e fedeltà riguardante l' informatività viene descritto come (ALPAC 1966: 58):
i1 I
(ALPAC 1966:67): Extrcmcly informative. Makcs "ali thc dilfcrcncc in the world" in I
comprehcnding thc mcaning intcnded. (A rating of 9 should always be I
h wns reasoned thai lhc two major characlcristics of a 1ransl11tion are (a) iL'I
assigncd whcn lhc originai eomplctcly changes or revCfSCS lhe mcaning I
intelligibilìty, and (b) ils fidclity to the s<..-nscofthcoriginal lcxt. Conceptually,
thClic charactcriscics are indcpcndcnt; that is. a translation could be highly convcycd by Lhc translation). I
I
intclligiblc and yct lacking in fidclily or accumcy. Converscly, 11 tnmslation
L'esperimento venne condollo usando due diversi gruppi di valutatori.
Ad un primo gruppo di valutatori con conoscenze della sola lingua inglese
' f>cr unu biblioi;.rufia sull 'argomento aggiornata lino agli anni 2000 si può con~ultan:
venne affidato il compito di confrontare due tmduzioni in lingua inglese
hltps://www.isi.edu/natural-languagc/mlcvulircfs.hlml#HOV99. delle frasi originali russe. ovvero quella automatica e una traduzione umana
' L"cspcrimcnto di John R.Curroll viene dcscrino nell 'appendice IO e lo studio di Anhur accurata- Ad un secondo gruppo di valutatori bilingui inglesi con compe-
O.Liulc, lnc., nell 'appendice 11 del rapporto ALPAC.
129
128
,' )
' I
CAPITOLO Sr.1 I
QUAU TA 1: VAl.~'TA7,IOl'lf, Dt:Ll ,A TkADU:f.lO'lt: AllTilMATICA
I I,
lenze avanY.a te in russo venne invece affidalo il compito di valutare la frasi • microva/111azione (o val utazione dettugliata) con io scopo J i Ì) valu-
I I
tradlotte automaticamente con le corrispondent i frasi originali russe. tare la migliorabilità del sistema e ii) stabilire una slmtcgia di m iglio-
Questo primo esperimento di va lutaz ione era ba._-.ato su aspettative ramento.
molto a lte. avendo come obiett ivo la famosa Fully Au1omu1ic High Qua-
liry Tran.slation (FAHQT), la cui qualità fosse paragonabile in tutto e per Per ogni livello veng:ono enumerali i diversi criteri di 4ualità. Per la macrn- I I
tutto alla traduzione umana. Si trattava di aspettative dec isam ente non valutazione i criteri proposti a livello cognitivo so no: intelligibilità, li:dcl tà, i' I
rea listiche rispetto alle possibilità delle tecnologie di quei tempi : le con- coerenza. usabilità e acceltabilità; mentre a li ve llo linguistico: ricostruzione
/11
clusioni del rapporto ALPAC in fatti furono che la qualità delle traduzioni
prodotte dai sistemi di traduzione automatica erano ta lment.e scadenti da
de lla relazione semantica, s intattica e coerenza semantica, qualità assoluta,
val utazione sintattica e analisi degli errori. Per la microvalutaZione, invece,
si ricorre a ll 'analisi degli errori e allo sforzo necessario per la rev is ione,
.: ·~
non giustificare il livello di supporto fi nanziario e rogalo in tu lli quegli
anni. In questo modo, il rapporto decretò il fallimento delle ricerche in nonché alJ' analisi delle cause degli errori e delle possibilità di miglioramen-
q uesto settore. a cu i seguì una lunga battuta di sosta nell ' erogazione dei to del sistema. ,J
'
finanziamenti da parte del gov,e mo americano (cfr. Capitolo 3). D'altro Dal rapporto AL r AC a quello di Van Siype si assiste Junque ad una
canto però il rapporto evidenziò la necessità, da un lato, di ulteriori pro- evoluzione del processo di valutazione della traduzione automatica nella
gressi nella ricerca di base nel campo della linguistica computazionale per direz ione di una maggiore complessità del modello, che non tiene conto
un avanzamento delle tecnolog ie in questo ambito e, dall'altro. di rispon- solo di criteri ling ui stici, bensì anche d i criteri di tipo socio-situazionale
dere alle necessi tà dei traduttori di di sporre di stru menti di ausi lio proba- come ad esempio la usabilità e la accettabilit.à da parte degli utenti, o ltre a
bilmente meno sofis ticati ma pi.ù etlicaci nel fornire soluzioni in grado d i comprendere criteri economici (tempi di lt:llura. d i correzione, di tniduzio-
velocizzare il procc..-sso d i traduzione. ne) e opc.rativi (ident ifica:,.ione automatica della lingua. verifica delle aOè r-
'Un altro documemo interessante ri spetto al dibatti!() sulle metodologie mazioni del produttore). Si passa inoltre da un concetto d i qualità di tipo
da adottare nella valutazione è il Van Slype Report ( 1979), uno studio stalico, misurato in termini assoluti avendo come: modello di riferimento il
commissionato dalla Commiss ione Europea a seguito de'll'adozione di risultato della traduzione umana, a un concetto di qualità p iù dinam ico, che
SYSTRAN e dell'avvio del progello di ricerca Èuro1ra. Lo stud io pone tenga conto di un u~ diverso della traduzione automatica rispetto a quella
l'accento sul fallo che la qualilà è un concetto relativo (Van Slype 1979: umana, sganciando cosi la va lutazione dei sistemi di traduzione automatica
12): dal criterio della Fully Automatic High Q11ality Translatìan (FAIIQT), men-
zionato in precedenza.
Trmslation quality is nor an absol ute conccpt, and has to be a.sscsscdrcla1i- Tale tendenza è confermata dal volume di Lehrberger & Bourbeau
,,cty, applying severa! distinc1 critcria illuminating cach special aspcc1 of 1hc ( 1988) dal titolo Machine Translation: linguistic characleristics of MI' sy-
quality of thc translationallowing for thc spccific nature of MT. which is a stems and generai m elhodology o/ eva/11ation: gli autori. constatando che
produc.:1 quite diffcrcnt from IIT fl-luman Transla1ion] and for which a qui1c dopo circa trenta ann i di ricerca nel settore, non ,erano state ancora defi nite
difTcrcnt markc.:t may open up. misure affidabi li e universalmente accettate, cercano di form ulare una me-
todologia generale pi:r la valutazione della traduzione automatica esc:mpli-
li m.p porto sottolinea come la vaJula:t.ionc debba essere condotta su due li- ficato nella fig. 6. 1.
vc ll i:
• macmvalutazione (o valutazione complessiva) con lo soopo di i) va-
lutare il grado d i acceuab ilillì del sistema di traduzione, ii) confron-
lare la quali tà di sistemi diversi o di versioni diverse di uno stesso
sistema e infine iii) val utare l' usabi lità de l sistema di traduzione au-
to mat ica.
130 13 1
QuAUTÀ t: VALIJTAZIOl'lt : Dt:LI.A TRADIJ7.IOl'lt. AUTOMATICA CAPrro1.o Sr.1
_....._
T•--1811
..........
__
~--· ., imellìgibilità, ovvero il grudo di chiarezza e comprensibilità di ogni
frase (Gcrvais 1980). iii) .,·ti/e appropriato rispetto all'uso del testo:
-
• miglior.1bil it.à del sistema. valutabile in base alla performance delle
diverse componenti cosi come dell ' intero sistema;
THt Edlt"'9
TorvecT••'
Claalllcaclon
vridtor.......,
..... -~Hurnen
eveluallOnd
• estensibilità ad allri domini e ad altre coppie di lingue:
• faci lità d' uso. considerando tutti gli aspetti ergonomici del sistema:
interfaccia. documentazione, inLcrallivitù, c:.-cc.
R.-.1100-..,
AMI-""' 1M911 llr,gu,,Qt Un altro momento rilevante è stato rappresentato dal lancio delle camr>a1,rne di
valutazione della traduzione automatica e delle metodologie proposte dall'A-
dvanccd Rcscarch Projccts Agcncy Sullwarc and lntelligent Systcms Tcchno-
Figuro e,.I Schemn gcncmle della v11lu111zionc di un sistema di traduziooc automati-
logy (ARPA e successivamente DARPA), l'agen:tia statunitense che formula
ca (Lchrbcri;cr & Bourhcnu 1'>88: 133)
e finanzia progetti tecnologicamente innovativi principalmente per rispondere
ad esigen7.c militari. Agli inizi degli unni '90 i'ARPA si diede l'obiettivo di
In questo schema di flusso, la traduzione automatica viene valutata sia come
promuovere progressi ..rivol u:tionari" (White cl al. 1994) nel campo della
rroccsso sin cumc prodotto, essendo solluposta a tre diversi approcci: i) la
traduzione automatica attraverso un programma di ricerca dedicato appunto
valutazione linguistica e ii) quella dei costi/benefici da parte dell'utente,
ad una valutazione black box' dei sisLCmi. in modo da fornire una ba.<;e per mi•
e infine iii) la valutazione da parte dello sviluppatore. La valutazione lin-
surure e dunque facil itare il miglioramento delle tecnologie in questo settore.
guistica avviene in base alla traduzione grezza e comporta principalmente
Successivamente, a metà degli anni '90, l'Expert Advisory Group on
la valutazione degli errori effettuati dal sistema e la loro correzione nella
Language Engineerin g Standards (liAGLES) ho elaborato lo standard ISLE
fase di post-editin g. Questo tipo di valutai,jonc consente all'utente di com-
(lntemational Standards for Language Engineering) sulla ba.-.e della ISO/
prendere il funzioname nto del sistema e la sua effcuiva migliorabilità. La
IEC - 91 265 (EAGLES 1996 -2008) secondo il quale la qualità puo 1,-ssc-
valutazione dei custi/benefìci viene ell"èuuota invece considerando tutti i
costi dircni e indirclli connessi olle diverse fosi del processo di traduzione
automatica (la raccolta dei lesti campione, la traduzione automatica e la sua • Con blocA: box nialuatlun. che in italiano potrommo tntdum: con va1Uta7ianc al buio.
valutazione. nonché il prodotto finale revisionato nella lingua di arri vo) e si inlendc la m1surnzionc: dcll.1 qualità di un sislcma solamente in base al suo prodono. senza
cunfrontandoli con quelli di una traduzione umana della stessa qualità. In• cun~ld.:mrc il pniccsso che lo hn (lOrtalO u rntc risullntu.
fine la valutazione da parte dello sviluppatore è principalm ente fìnaJizzata 1 ISO/IF.C - 9126 è una scrìc di nonnotìvc e lince i;uidu. sviluppate <bll'ISO (Organiz:m•
alla identificazione delle aree critiche del sistema e al loro mig.lioramento. 7ianc intcmazionalc per la nonn37.ionc) in coll:ibor.11.ionc con l'IEC (Commissione Elettrotec-
nica lntcrnarionalc). relative ad un modello di qualità del sonwarc.
132 133
Q u.-.uTA f. V,\I.U1'Al'JONt: 0(1 .1.A TRAot/'/,IONlt AITTO~IATICA CAl'l fOUI Si-:,
re definila come "the totality of fea1ures and char.icteristics or a prod uci In real tà questo metodo è stato poi velocemente abbandonato pcrchè
or service thai bear on its ability lo salisfy stated or implied needs" (ISO/ giudicato non affidab ile (Somers 2005) pri ncipalmente per tre ragioni
IEC, I 99 I : 2). L'obiettivo era quello di creare un modello di quali tà valido (O ' Connell 200 I citato in Somers 2005):
per qualsiasi sistema d i Trattamenlo Automatico del Lin guaggio nalurdle • se non si conosce la lingua verso cui si trad uce. non si è sicuri dove
e di interesse per qualsiasi tipo di utente. Si tratta di un modello d inamico occorre l 'errore, ovvero se è relativo al passaggio dalla lingua di par-
adallabile alle esige nze dell 'utente. che estrapola dal modello gencrnle solo tenza a quella di arri vo o al secondo passaggio dalla lingua di arrivo
quelle carallL-ristiche interessanti ai suoi scopi, consenlcncki in tal modo la nuovamente alla lingua di partenza;
di versa co mbin~ionc dei risullali di misurazione in base.al conlesto d'uso • una calliva traduzione verso la lingua di arrivo può nondimeno pro-
( EAG LES. 1996). durre una ragionevole retroversione;
Una ulteriore elnboruzione si ha con il Frdmework for the Evaluation • la premessa di base della retroversione è in qualche modo falsata :
of Machi ne Trunslation (FEMTI) in ISLE. (King et al. 2003), un quadro di ipotiuando di usare tr.iduuori umani e non un 1r11duttorc automatico,
riferimento specificamenle pensato per la valutazione della lraduzione au - non ci si aspclla di avere lo stesso risultato, ovvero che la retrover-
tomatica, final izzato ad organizzare i diversi me todi d i valutazione e a met- sione sia necessariamente uguale al Lesto di partenza.
terli in relazione con lo scopo ed il contesto d ' uso dei sistcmi6 • Una prima
classificazione delle metriche è basata sul contesto d'uso della lrdduzione La valutazio ne umana viene usata in quasi tutte le metriche citate nel para-
automatka, mentre la seconda class ificazione riguarda le caratteristiche d i grafo precedente. ma viene usata differentemente da sviluppalo~ e utenti.
qualità relative alle necessità pert inenti rispetto al conlesto d ' uso. Per gl i sviluppatori di tecnologie di prima e seconda generll;(.IOne, o me-
g lio di quei s islcmi di traduzione basati su dati linguistici. la \'alulazione
umana era no.:ccssaria per di versi motivi: i) individuare gli errori e valu tare
6.2 Metriche di valutazione basate sul giudizio umano le possibili slmtegie di rniglioramcnlo e ii) identificare cvcnt_ua li ~~io~-
menli, una volta adottate possibili soluz ioni per risolvere gh erron h ngu1-
Le strategie utilizzate nel corso del tempo per valutare la qualità della tradu- stici del sistema.
zione automatica come prodotto, come g ià accennato in precederu.a, oscil- Le strategie di miglioramento riguardavano, ad esem pio, l'ampliamen-
lano lrJ criteri qualitativi che implicano il ricorso a lla va lulazione umana e to della copt.'11ura della base di dati lessicali, con nuovi inserimenti di parole,
criteri (lwtntilativi ed automatici. oppure lo sviluppo di regole per risolvere problem i di tipo sinLattico. Queste
A prevalere fino agli anni ' 90 c irca sono siate inizialmente le metric he valutazioni venivano effettuate c ic licamente dai linguisti impegnali nella rea-
basate sul giudizio umano. Tra le prime slrJtcgic di questo tipo, ricordia- lizzazione delle risorse linguistiche su un corpus definito di testi o frasi (King
mo la cosiddetta retro-versione (i n inglese bac:k-trans lation. bac:k-and-fortl, & Falkcdal 1990: Amold 1993; Balkan et ul. 1994) durante lo sviluppo di un
translation o ancora round trip translatirm), consistente nel tradurre il testo sistema in modo da individuare in maniera punwale le aree critiche su cui in-
di parten:,.a in una lingua di arrivo per poi n tr.idurlo nella lingua di part.e nza. tc.rvenire per migliorare quanto più possibile i risultati. È stata poi abbandona1_3
li famoso mi to, probabilmente apocrifo, della frdSe inglese traila da l Nuo- nel momento in cui i sistemi di tipo statistico sono diventati il parcl(figma domi-
vo Testamento (Matteo 26:4 1) ''Thc spiril is wi lling bui Lhc flesh is weak" nante, perché una siffatta valutazione linguisticament.e accurata dei sistemi non
tradotta in russo con un sistema di tr.iduzione au tomatica e poi ritradotta in aveva più ragion d 'essere. Dato il tipo di approccio, infatti, non è più possibile
inglese dando come risultato: " The whisky is strong, but the mcat is rotten". intervenire in manierd cosi puntuale nella risoluzione dei problemi.
aldilà o meno della verid ici tà dell'ep isodio. illustra bene il metodo che ve- I criteri per la valula.7.ione umana sono cambiati nel corso del tem po.
niva usato per va lutare i prim i s istemi d i tnu.Juziom: automatica. Come accennato in precedenza nel rapporto ALPAC ( 1966: 67)si fa ricorso
ai criteri di intelligibilità e f edeltà. Questa prima metrica venne abbandona-
ta dai successivi tenta tivi di trovare una metodologia più oggettiva e con un
• h11ps:/lwww.is1.edu/na1uml-l11nguagc/m1L-vul/ maggiore accordo tra va lutatori.
134 135
QUAI.ITÀ t: VALIJTAJ.ll)NI'. DEI.LA TltAOC7J(INt: AUTOM,\ "flC/\ CAPITl)l,0 Sr.1
Le campagne di valutazione organi:ct.ate da ARPA cercarono di dclinire a li of thc conteni of a text is conveyed, regurd less of 1hc qua lit y or the En-
La miglior metrica di valu tuionc basala s ul g iudizio umano e sperimen ta- glish in 1hc output". A partire d unque dalle campagne di val utazione ARPA
rono varie soluzioni. Nella campagna di valutazione del 1993 (Whilc & i crih!ri d i adeguatezza e fruibilità si affermano come criteri standard nella
O'Conne ll 1994: 136), i criteri adottali furono : valutazione umana d ei sistemi di traduzione automatica, tanto chi.: ancora
• Jroihilirà (jlue11cy) che gi udicava •' intuitive native speaker senses oggi sono adottali come parametri di val utaz.ione. come vedremo più avanli.
nboul the well-formedncss of the English output on a sentenee by Successivami.:ntc vennero sviluppate metriche di valutazione degli erro-
sentencc basis" e veni vo valutai.li solo in base al testo arrivo; ridi traduzione come il LISA QA Modcl 11 nel campo della localizzazione
• adeguarezz" (adequacy) del testo di arrivo, che veniva giudicata con- e il SAE J 24S03 12 Translation Quality Mctric, uno standard sviluppato per
frontandolo con quello di partenza e misurava 'ihe extcnl 10 which mea- l' industria automobilistica. Entnsmbe le metriche s i basavano sulla valu-
ning present ù1 cxpert translations is present in the FAMT7, HAMT1, tazione umana degli erro ri di traduzione, assebrnando un ruo lo prominente
PE9 and MA 10 versions": tra i criteri base al concetto di accuratezza della traduzione, che prende in
• comprensione (comprehension), che misurava ''Lhe nmount of Lhe considerazione la complete-aa delle informazioni contenute nel testo d i ar-
information that is com:ctly convcyed. i.e. Lhe degrce to which a ri vo. Entrambe le metriche forniscono un grad iente di diverse tipologie di
reader can find integra] information in Lhe passage version". errori, valutati rispeuo a lla loro gravità, in modo da ottenere una valutazione
obielliva cd affidabile de lla qualità della traduzione mediante un punteggio
Se sul conccuo di f mihilità non sono possibili fraintendimenti, la definizione riferito al grado di qua lità del testo di arrivo.
del cooccllo di adeguatezza, come la misura in cui tulio il contenuto del testo Anche se questi approcci intendono essere oggettivi, risultano però len-
d i parten:ai è riportato nel lesto di arrivo, assume qui un significalo molto ti e costosi perché implicano l'intervento del giudizio umano; pertanto g li
vici no ad accurntc-.aa. anche se non ne è un pieno sinonimo: viene uliliv.a- sviluppatori hanno cercato altri modi per va lutare la qualità. con lo scopo di
to, a mio avviso. proprio per evi tare di ricorrere a l criterio della accuratc:a.a velocizzare la procedura e ridurne i costi.
c he equiparerebbe qualitativamente la traduzione automat ico ulla traduzione
umana, con un evidente sbilanciamento in favore di quest •ultima. Le tecno-
6.3 Metriche automatiche
logie di al lord, infatti, nonostante avessero raggiun10 una certa maturità 1anto
da essere transitate da prototipi sperimentali a sistemi operativi in uso presso A punire dagli anni 2000, con l'affermazione dei sistemi di tipo sllltistico, i
industrie ed enti con necessità di produzione di ingenti volumi di traduzione, ricercatori si sono dedicati allo sviluppo e alla sperimentazione di mctrichi.:
non reggevano ancora il confro nto con la traduzione umana, in termini sia d i quantilative automatiche, senza nessun coinvolgimento umano, con l'intcn10
costi che di produttività. di sviluppare una misurazione obiettiva e più veloce dei risultati della tradu-
Nelle successive ediz ioni della campagna di valutazione dcli' ARPA zione uutomatica: si trc1tta di programmi software, come ad esempio BLEU
(White 1995) la metrica adottata abbandona il en te.rio della comprensione (Papi neni et al. 2002), NIST (Doddington 2002), METEOR (Banerjcc & La-
e prevede nuovamente que llo dell'informoti11ità del tesi<>, il c ui obiettivo vie 200S) e Word Error Rate (Snover et al. 2006). che usano una serie di cri-
è misurare "a system's ability to produce a translation that conveys s uffi- teri formalizzati per valutare la traduzione automatica su.Ila base di un corpus
cient infonnatio n so th nt someone can gain necessary information from il"; d i riferimento o gold standard, costituito da testi tradotti da traduuori umani.
include ino ltre froihilità e adeguatezza. anche se quest"ultima viene cosi Tutte queste metriche si basano sul principio di similarità della trad u-
rivisitata: wrhe obj ectivc oflhe adequacy is lo dctermine Lhc cxtent lo which zione automatica rispetto alla trc1duz.ione umana. computando la distanza tm
136 137
J
_ _, _ _ _ _ _ _ _ _ __
4
_...J
SYSTEMA:
li e ti 07ial<; Fe5p()A9ibtkly of \
_ . . .............. .. . . ... v,,,,,,,,,,J............. .......... .,tv,t... ..,...._ ...,........
ort selefy •ooo.t • + 1, 11 "' l-.ri11tfl• . . .~,•--W"llf lt...,,.<\Uf lM'l1, l1
••lt,, ~ •1,
1 pnd,l1M;bf <f\,, 111 1
I• I
"• ' p,..-, ...1,..
REFERENCE:
I,. I
-
lsraeli officials are responsible for airport securi ,t, ••.•
ty • •·•1•"1 • , • ..,..-.... it1,,-.,ft\-~.-.,..,riw ,,., ,,.,
·•Md.'11,/•'• J1111'. dt~• t .. I ,,._.,
'-.: ......
li,,,,
zazione dì campagne di valutazione. Si basa sugli stessi principi di BLEU, Metriche quantitative più recenti come ad esempio quelle proposte da Le
ovvero sul confronto tra testi tradotti automaticamente e un corpus di riferi- & Mikolov (2014). Banchs et al. (20 15), o Wang & Merlo (20 16) cercano
mento di testi tradotti da umani. L'unica differenza consiste nel fatto che a di raffinare i risultati delle metriche precedenti producendo dei risultati più
segmenti rari viene attribuito un peso maggiore ne l computo del punteggio, comparabili al giudizio umano. avendo incorpordlo metodologie, come ad
in quanto maggionnente infomtativi: ad esempio alla sequenza credit card esempio quelle del Latcnl Semanlic lndexing (LSl) 17 o del Word-embed-
viene attribuito un peso maggiore della sequenza ofthe (molto più lrequente ding11, che consentono di calcolare In similarità a livello semantico delle
di credi! card in un testo inglese), considerando in questo modo in maniera parole e degli n-grammi. Queste tipologie di valutazioni quantitative non
più puntuale l'aspetto infonnalivo dei testi da tradurre. · sono sempre rapportabili tra loro, poiché producono risultali differenti; né
METEOR (Metric for Evaluation ofTranslation with Explicit ORdering) tantomeno sono rapportabili al giudizio umano, rispetto al quale presentano
invece individua le parole lessicali (principalmente nomi, verbi e aggettivi) in spesso risultati contrastanl4 come emerge ad esempio da alcune campagne
comune tra il testo tradotto automaticamente e il t.esto di riferimento corrispon- di valutazione. È il caso della valutazione di cinque diven;i sistemi di tra-
dente. Una volta individuate, il sistema cerca di identificare le sequcnz.c più duzione automatica (Joshua. Lucy. Melis, Apertium e MaTrEx) organi?.Zata
lunghe che si riferiscono a queste e che sono condivise tra i due testi. Quanto durante il Workshop on Machine learningfor Hybrid Machine Translation
più alto è il numero di segmenti condivisi, e dunque quanto più il valore del (ML4HMT-20 1l), dove è emerso che il sistema migliore per METEOR non
punteggio si avvicina a I, tanto più In qualità del testo tradotto automaticamente er.i il più perfonnantc per NIST e BLEU (Fedennann et al. 2012). Inoltre
si avvicina a quello di rifcrimcnl(). La ricerca di parole cquivalcnli tra il testo in il sistema giudicato migliore dalle metriche di valutazione automatica rag-
valutazione e il testo di ritèrimento si basa inoltre sull'uso di: giungeva solo il tert.o posto nelle valutazioni manuali. mentre il sistema mi-
I. tema delle parole, grnz ie al quale si tiene conto anche di possibili gliore per le valut.azioni manuali risultava ultimo nelle valu tazioni automati-
cambiamenti di classe grammaticale, come ad esempio tra meeting e che (Labaka et al. 2014). Questi risultali dimostrano come la questione della
meet in base al tema meel comune sia al verbo che al nome; valutazione oggettiva dei risultali non sin affatto risolta, tant'è che se anche
2. risorse linguistiche di sinonimi come ad esempio Wordnct 15. tali metriche sono ancor.i adollale in maniera estesa dagli sviluppatori, si
avvenc la necessità di adottare nuovi modelli di valutazione che includano
Anche se METEOR s i presenta cmne più affidabile nella valutazione della anche il giudizio umano per ottenere risultati più affidabili
qualità della traduzione automatica, ricorrendo a rison;e linguistiche per la TuUavia, rappresentando una soluzione veloce e a basso costo, sono am-
valutazione di aspetti semantici del lesto, è più complessa da mettere in atto, piamente diffuse nelle campagne di valutal!:ione che si sono svi.luppate a
variando i risultati a seconda delle risorse utilizzate nella valutazione; tali panire dalla necessità di valutare e comparare le diverse tipologie di sistemi,
risorse sono infatti disponibili soltanto per un numero limitato di lingue, e nonché i progressi delle tecnologie nel corso degli anni. Con lo scopo di far
la loro adozione influisce sulla velocità e la facilità d'uso. avanz.are la ricerca nel settore, da un lato, e di fornire metriche, strumenti e
Il Word Error Rate (WER), derivato dalla distanza di levenshtein 16, si fonda dati, dall'altro a partire dagli anni 2000 si svolgono annualmente campagne
invece sul computo degli scostamenti tra un testo tradotto e il testo tli rilèrimen- di valutazione: merita specifica menzione il Workshop on Statistica/ Machi-
lo, dunque sul numero di parole di tlèrenti tra questi due. Le diftèrenze computa- ne Translation (WMT) (Koehn & Monz 2006; Callison-Burch et al. 2007a;
le riguardano parole sostituite (S) cancellate (D), inserite (I) sul numero totale di
parole (N) del ICSlo di riferimento, come si può evincere dalla fonnula seguente:
WBll ~ S + D + l " La mclndolugiu Jcl l.atent Scmu111i,· l11clt',tlng considem due documenti scmanl lcamcn-
N h: vicini se hanno molle parole chiave in comune.
,. Lu m.:todologia del Wur,/..,mheddi11g o mpproscntnzionc di,nribuiln delle parole. pcr-
mcltc J i mappare le parole su dei vcnori Ji numeri reali. che forniscono infunnuziuni sulla
'' htlps://wurdnc:t.princcton.cdu/ scman1ica delle parole partendo da un corpus non annoialo. Cìruzic a qucstu lccnicu ò possibile
•• L.n distcmza di I..J:1•c11.<lttdn, o distuni.11 di edlt. introdona dallo scicni.ialo rus.so Vlndimir cos1ruirc lo spazio vettoriale delle parole in cui vcuori vicini indicano la contiguità semantica
I .cvcnsh1cin nel 1965. misura la dillcrcnzo fra Juc stringhe. delle parol.c secondo i ririncipi della semantica dislribuzionalc.
140 14 1
J,
QUAI.ITÀ F. VAl,UTAZION[ IDl!U..A T Ri\OU:llONt: AIITO\lATl('A CAl'ITO l ,O St:1
Callison-Burch et al. 2008; Callison-Burch et al. 2009; Callison-Aurch va.lgono su quello dcll'accuralc:aa, secondo cui le tmduzioni "musl convey
et al. 20 I O; Callison-Burch et al. 20 11 : Callison-Burch et al. 20 12; Dojar lhe infonnation contained in the originai wilh as liule distortion as possible"
et al. 2013 ; Bojar et al. 2014: Bojar et al. 20 15) organizzalo a partire <lui (Pinchuck 1977: 206). Tuttavia, mentre il conceuo di fniibilitù coincide con
2006 dnl gruppo di interesse speciale in traduzione automatica (SIGMT). il significalo che gli viene allribuilo anche nei Trans/ation Studies. o~vero
La campagna. che ini.zialmente si foculia.ava esclusivamente sulle lingue si riforisce alle proprietà linguistiche (gnunmatica, ortografia e coesione)
europee, ora si è aperta anche a lingue cxtrueuropec ed è organizzata in due del testo tradotto come testo indipendente nella lingua di arrivo, il concetto
sessioni: una dedicata alla lraduzione ed un'altra alla valutazione. Le coppie d.i adeguate-a.a assume un significato totalmente differente rispetto a quello
linguistiche sono divise tra inglese-verso le altre lingue e altre lingue verso eorre.ntemente attribuito dagli studiosi della lraduzione.
l'inglese. La valutazione basata sull 'adeguatezza venne introdotta nella valuta-
La comunità dei Translation Stiudies non guarda di buon occhio questo zione della traduzione automatica dal Linguislics Data Consortium (LOC,
tipo di valutazione per varie ragioni: innanzitutto perché la valutazione si 2005) e successivamente fu ulteriormente approfondita da Denkowsk.i &
basa su informazioni molto esigue e quasi tulle le metriche non considemno Lavie (2012). che usano il termine per designare la similarità semantica di
che la fonna superficiale delle paf()le, ìiòr'I vagliando altri aspetti come ad una traduzione ottenuta automaticamente con lè traduzioni di riferimento,
esempio la grammaticalilà del testo, la fruibilità, il registro o lo stile. Inol- cosi come viene percepita da valutatori umani. Specia et al. (2011 ) defini-
tre, basandosi su sequenze limitale di parole, la similarità Lrn la truduzione scono una traduzione adeguata quella traduzione che preserva il significato
automatica e il lesto di riferimento può essere anche molto alta benché si dell' input e non aggiunge informazioni. Propongono una serie di indicatori
trnui di una traduzione scorretta, in quanto basata solo sulla presenza delle di adeguate;r.;,.a, come ad esempio parametri che riOettcmo quanto le frasi
sequenze condivise con il testo di riferimento. Una ulteriore critica riguarda del testo di partenza e quelle del testo di arrivo siano paragonabili ai div.ersi
invece proprio la qualitii del corpus di riferimento usato per la valuta:tione livell i linguistici. Dunque il conccllo d i adeguate-a.a, ovvero il grado in cui
dj cui non sempre è chiara la provenien:,.a cd accertata la validazione quali~ l'output della traduzione automatica cattura il significato della trdduzion.e di
taliva (O'Bri~n & Saldanha 2014), essendo spesso frullo di cmwdrnrm :ing riferi mento, diventa uno dei due princiipali parametri usati nella metriche di
condotto su piattaforme come Amuon Mechanical Turk (cfr. Capitolo 7). valutazione della qualità della Lradu:1.ione automatica insieme alla fruibilità,
Per il modo in cui sono concepite, inoltre, le metriche quantitative non ovvero il grado in cui l'output della traduzione automatica è 1:,rrc1m.maLical-
forniscono nessuna informazione circa le aree linguisùche critiche nei testi mente corretto nel.la lingua di arrivo.
prodo!li dalla traduzione automatica, nè tanto meno sono utili nell'indivi- Se diwno uno sguardo ai due approcci più recenti alla misurazione della
duare e confronLare in maniern più dettagliala punti di forza e debolezze qualilà della traduzione automatica ovvero il TAUS Dynamic Quality Fra-
dei diversi sistemi per una scelta più consapevole da parte degli utenti. Re- mework (DQF)1q e QTLaunchPad Multidimensional Quality Metrics (MQM)-'O
cent~mente Andy Way (20 18) ha messo bene in evidenz.a i limiti di queste possiamo ulteriormente indagare come il concetto di adeguatezza sia usato in
metnche e soprallullo come queste. per essere considerate effettivamente trnduzione automatica per raggiungere una visione che accomuni organi:-o,a-
utili ai fini di una misurazione qualitati va della trc1duzione automatica, deb- zioni pubbliche (inclusa l'Unione Ewopea), enti di ricerca, clienti e fornitori
bano produrre delle misurazioni che in qualche modo siano correlabili al di servizi di traduzione su come valutare in modo oggettivo sia la qualità della
giudizio umnno. trc:1duzionc umana sia quella della traduzione aut.omatica e assistita.
DQF è stata lanciata da TAUS11 nel fèbbraio 20 14 e ha l'obiettivo di
fom ire agli utenti un insieme ampio cd affidabile di strumenti, migliori pra-
6.4 Approcci recenti
142 143
Q UALITÀ t: VALlrT/\7JON F, Dl:LLA TltADU7JO!'IE A V RIMATICA CArrrowSt:1
1fohc, metriche, repon e strumenti di gestione dei <lati per misurare la pro- più coerente dal punto di vista terminologico. ~1clle infalli disp?sizio~e
duui vilà della traduz.ione automatica, classificare i motori della traduzione un quadro di riferimento sistematico per descnvcre le metriche d1 quulnà
automatica. valutarne l'adcguate1.za e la fruibilità o clTclluare una valuta- basate su caraucristic hc testuali e fornisce una serie di criteri per valutare
zione delle tipologie di errori. la qualità della tradu:1:ione, una descrizione dettagliata di oltre 100 ti polo-
DQF, dove "transla1ion quality is considered dynnmic as lranslation gie di errori a vuri livelli di dellaglio, consente agli utenti di c~c_a rsi delle
quality rcqui remen1s change depending on the conteni lype, the purpose of metriche ad hoc ri tagliate sulle proprie necessilii e può essere uuhzzala per
the conteni and its audience''22 si basa sui criteri di adcguate-a a e fruibilità diversi scopi. Di panicolarc rilevanza per la classificazione degli errori è il
defini ti come segue1' : glossario che ne definisce in maniera puntuale le diverse tipologie. A partire
dalla defi nizione di quality translation di Alan Melby in Koby et al. (2014):
Ac.lcquacy: - How much of lhc mcaning expn:sscd in the gold-standard
translation or thc sourcc is also cxpresscd in thc target translatioo" (Lin- A quality translation dcmonstrates accuraey and ftucncy requinxl for the au-
guistic Data Consortium). Thc 4-poiot scale forcsocs 1hc following valucs: dience and purpose and complies with ali othcr spocificalions bctwccn thc
Everything. Most. Lilllc. None rcquester ond provider, taking into account end-user needs.
Flucncy: To whal cx1cn1lhe translation is "onc lhat is wcll-formec.l gr.imma-
tically. conlains comx:t spcllings, adhcrcs 10 comlTlOfl use oft.cnns, titlc..'8 and MQM cerca di fornire una metrica di qualità della tradm:ione, che_ c??senta
namcs, is inruitivcly acccplable and ean be scnsibly inlcrprctcd hy u native di valutare in maniera oocrenle e omogenea l'accuralezza e la fru 1b1htil del
speaker" (Linguistic Data Consortium) . Thc 4-point scale forcsccs thc fol- testo tradotto, sia che sia stato ottenuto allraverso un processo di traduzione
lowing valucs: flawlcss. Good. Dis-nucnt. lncompn:hcnsiblc.
umano, sia aulomalico. In questo quadro di riferimento i problemi di accu-
Anche in questo caso la definizione e.li ac.leguate-a a indica la vicinun~.a del- rc11c-aa riguardano la relazione del testo di arrivo c<>n quel~o di par!en~
la traduzione in valutazione al siguifìcato della trad uzione go/d standard possono essere valutati soltanto considerando qul.'Sla rchwon~, e ri~uar-
<lano cambiamenti rispcllo al significalo inteso. come ad esempio aggiunte
(o di riferimento) o del testo di partenza. Questo uso del termi ne adegua-
od omissioni. È interessante notare come gli autori sentano la ncccssilii di
te--aa in traduzione automatica evidenzia un significato completamen-
!t,X:Cifìcare che l'adeguatez za è "synonym for uccuracy commonl y uscd in
te diverso rispetto a questa nozione come viene gener.tlmente intesa nei
the context of assessing machine trnnslation quality"24 •
Translation Studies: l'adeb'llalezza di una procedura di trc1duzione deve es-
Nel 201 5 TAUS Dynamic Quality Framework (DQF) e QTLaunchPad
sere giudicata nei termini delle spccitìcbe di un dato compito di traduzio-
Multidimcnsional Quali1y Metrics (MQM), grazie al progetto europeo
ne da effettuare secondo le necessità dell'utente (Hatim & Mason 1990:8).
QT2 I, sono stati riconciliati in un unico quadro di riferimento, il MQM-D-
In realtà il significato di adeguutezza, cosi come espresso nell'ambito de-
QF, la cui adozione come standard nel settore dei servizi linguis tici con
gli studi sulla traduzione automatica, sarebbe più adatto per il concetto di
il titolo di ASTM WK46396 è in corso di valutazione da parte dell' Ame-
accurale--aa, poiché misura il grndo di informalività del testo di arrivo in
rican Society for Testing and Materials lntemationa l (ASTM), organism~
riferimento al testo di panenza. Hulchins & Somers (1992: 163), ad esem-
di normazione statunitense. Questa operazione nasce dalla consapevoleua
pio, usano il parametro della accurnlez;,""11fedel1à in riferi mento a 'cxlent lo
che gli scopi delle trnduzioni possono essere molteplici e che rispondono
which the lranslated text conlains the "samc" information as lhe originai'.
a requisiti differenti a seconda del contesto: una tradm:ione eff~ttuata_
Rispetto a ciò la M11/tidimensio11a/ Quality Metrics (MQM), sviluppala
esempio nell'ambilo della localizzazio ne di un software avrà scopt, rcqu1s1LJ
nell'ambito dei progcui europei QTLaunchPad e QTLeap, sembra essere
e standard di qualiuì diversi dalla tmduzione di una pubblicità, di un saggio
0 di un film . Inoltre, dato il progresso della tecnologia è nl.'Cessario avere
uno strumento che sempre più consenta di rc1fl'rontarc i risultati dei processi
i: h1tps://www.1aus.ncvcv.ilua1
c/ubou1
" h11ps://luuN.nct/acadcmyibcst-practiccs/cvaluutc-~1 -prac1iccs/utlcqu11cy-Ouoncy-gui-
tlclincs "' http://www.q l2l.cu/mqm-d clini1ion/di ITs/mqm-0 9 1-0 _9 _ 2-diff., .h1ml
144 145
I~
CAPr fOLO Sr.1
I 1J11
TRAl>C7.IONF. A LTOM ATICA
Q UA LITA f. VAl»T AZION f. on1.A