Sei sulla pagina 1di 10

1

Manutenzione TM con OKAPI OLIFANT

Olifant un software gratuito sviluppato dalla Okapi che serve a facilitare la gestione delle memorie di traduzione di Wordfast (in formato txt) ed SDL-Trados (in formato tmx). In inglese si chiamano TM files; d'ora in poi ci riferiremo a questo tipo di file con espressioni quali: TM, file di TM, "file di memoria" o anche semplicemente "memoria" o "memorie". Possiamo scaricare Olifant qui: http://okapi.sourceforge.net/downloads.html Ad ogni nuovo utilizzo, Olifant ripropone l'ultima memoria su cui abbiamo lavorato:

Una volta installato il programma e aperta una memoria qualsiasi, si apre una finestra di questo tipo:

Cliccando sulla seconda icona da sinistra oppure accedendo alla voce di men File -> Open possiamo scegliere altri file di memoria da aprire:

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

Da notare che in basso a destra del campo Nome file ci viene chiesto di scegliere se aprire memorie "Trados" (in formato tmx) o memorie "Wordfast" (in formato txt). Nella schermata riprodotta qui sopra, la cartella HU-IT vuota solo all'apparenza, in quanto contiene solo memorie in formato txt; e non le possiamo vedere perch il tipo di file impostato su TMX. Con Olifant possiamo anche trasformare le memorie dal formato TMX a quello TXT e viceversa; ma a questo scopo personalmente preferisco usare il programma gratuito Wf2Tmx.exe che possibile scaricare anche dal mio sito. Si tratta di un piccolo programmino eseguibile (non si installa) che vi rendo disponibile anche qui: https://dl.dropboxusercontent.com/u/4100687/Wf2Tmx.exe Personalmente uso Olifant al posto di una "vecchia" ma efficientissima macro di Christine Alba (scaricabile anche qui: https://dl.dropboxusercontent.com/u/4100687/Wfmt.xlt) che permette di aprire le memorie Wordfast in Excel e procedere quindi ad alcune operazioni di facile manutenzione, molte delle quali per sono offerte anche da Olifant - che preferisco, anche perch aprire le memorie di Wordfast in Excel pu comportare alcuni inconvenienti. Il primo legato al fatto che quando si importa in Excel un file di testo separato da tabulazioni (come sono le memorie di Wordfast) Excel tende ad aggiungere delle fastidiose virgolette all'inizio e alla fine di ogni segmento. Teoricamente la cosa risolvibile facendo particolarmente attenzione al secondo passaggio della procedura di importazione guidata, illustrato oui sotto:

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

Nella schermata possiamo notare che il campo Qualificatore di testo mostra il carattere " che l'impostazione predefinita. Ebbene, questo campo andrebbe settato su Nessuno. Ma anche cos, il rischio che Excel aggiunga le fastidiose virgolette reale e sempre in agguato. Questo potrebbe non essere un problema per memorie di minore estensione; ma talune memorie, come quelle prodotte dall'Unione Europea (http://ipsc.jrc.ec.europa.eu/index.php/Traineeships/197/0/#c2744), possono contenere parecchie migliaia di TU (Translation Unities, cio accoppiate di porzioni di testo in lingua originale (source) e relativi traducenti (target); per comodit d'ora in poi le chiamer "segmenti"). In memorie cos voluminose l'aggiunta anche di un solo carattere a ciascun segmento pu appesantire notevolmente il file. Dopo ciascuna sessione di manutenzione in Excel con la macro che vi ho detto (e della quale magari torner a parlarvi in dettaglio in futuro), dunque opportuno riaprire la memoria in Word e procedere a un "trova & sostituisci" per rimuovere non solo le fastidiose virgolette, ma anche taluni codici (tipicamente caratterizzati dalla presenza del segno & preceduto o seguito da un apostrofo e da un numero o una lettera) che si vengono a creare nel file di memoria in sostituzione di particolari segni grafici, come per esempio i trattini lunghi ( ), gli apostrofi o virgolette semplici "inglesi" ( e ), le doppie virgolette "inglesi" ( e ), quelle "francesi" ( e ) e altri fastidiosi codici eventualmente presenti nei segmenti. Anche questa operazione, su memorie particolarmente voluminose pu diventare complessa e arrivare addirittura a "congelare" anche i computer pi brillanti. Con Olifant si risolve il problema alla radice: l'apertura delle memorie in Olifant non comporta alcuna operazione di conversione o di aggiunta di caratteri "strani". Inoltre, possibile svolgere molto rapidamente le stesse funzioni di quella macro Excel (tranne una, che vi dir in seguito). Vediamo i passi che personalmente consiglio di fare per una efficace manutenzione dei file di memoria, partendo dalla schermata iniziale che vi ripropongo qui di seguito.

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

Come prima cosa, vi consiglio di ordinare i segmenti in ordine alfabetico sul testo originale. Per farlo, clicchiamo sulla decima icona da sinistra caratterizzata da una a minuscola sovrapposta a una z minuscola affiancate da una doppia freccia verticale. L'icona corrisponde al comando SORT ORDER (Cntr+R), che apre questa finestra:

Cliccando su Examples ci vengono proposti alcuni possibili esempi di ordinamento del testo. Per ordinarlo sul testo originale scegliamo Sort by source, in key ascending order e poi clicchiamo su Set sort. Fatto questo, consiglio di usare la pratica funzione di Find And Replace di Olifant per togliere eventuali virgolette o qualsiasi altro carattere "di disturbo" da TUTTO il file di memoria, sia source che target. Questa operazione importante specialmente se in precedenza abbiamo usato la macro Excel sullo stesso file di memoria, e/o se pensiamo di usarla ancora in futuro sullo stesso file. Troviamo il comando Find And Replace nella seconda voce di men (Edit), oppure usando la combinazione di tasti Cntr+H. Con questo comando possiamo trovare e sostituire qualsiasi cosa; per esempio possiamo sostituire un traducente con un altro, o possiamo cancellare eventuali caratteri o spazi o tag che desideriamo eliminare per snellire la memoria di traduzione. Possiamo cancellare asterischi o trattini o altri simboli particolari; se Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

ne possono trovare specialmente all'inizio del segmento, residui di eventuali elenchi puntati o numerati segmentati male. Li chiamo "caratteri di disturbo" perch pi caratteri non testuali ci sono in un segmento, minore la probabilit che il CAT riconosca l'eventuale percentuale di match del segmento stesso. Provo a spiegarmi con un esempio. Supponiamo di trovarci di fronte alla frase avvitate il bullone B, che abbiamo gi tradotto sicuramente in passato. Per mettiamo che nella nostra memoria la frase sia stata salvata cos: - avvitate il bullone "B" oppure cos: 1) avvitate il bullone B Stando cos le cose, difficilmente un CAT sar in grado di riconoscere il segmento gi presente in memoria come un full match della frase avvitate il bullone B , proprio a causa dei caratteri non testuali presenti in memoria e che per comodit ho evidenziato in giallo: nel primo caso, il trattino seguito dallo spazio e le virgolette che incorniciano la lettera B; e nel secondo caso, il numero seguito da parentesi e dallo spazio che precede la parola "avvitate". Fatte queste piccole operazioni di pulizia preliminare, che tutto sommato sono opzionali, entriamo nel vivo della manutenzione con la voce di men Entries. Clicchiamoci sopra e scegliamo la voce Flag entries (Cntr+E). Corrisponde alla penultima icona da destra dal tipico punto di domanda), che apre questa finestra: (quella a sinistra dell'icona di Help, caratterizzata

Qui consiglio di procedere per passi successivi. Infatti, nonostante Olifant sia un programma stabile e veloce, se clicchiamo tutte insieme le caselle di spunta che ci interessano questo potrebbe rallentare il Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

computer e in certi casi, perfino arrivare a "congelare" il programma, specialmente se stiamo lavorando su un file di memoria particolarmente voluminoso. Ecco l'ordine che consiglio di seguire: I - Cercare ed eliminare i tag e altri codici II - Cercare ed eliminare i segmenti vuoti III - Cercare ed eliminare quei segmenti in cui il testo source e il testo target sono uguali IV - Cercare ed eliminare i doppioni nei quali allo stesso testo source corrisponde lo stesso testo target Se in una qualsiasi di queste operazioni Olifant non trova corrispondenze, possiamo passare al controllo successivo. Se invece Olifant trova corrispondenze le "flagga". In questo secondo caso, la prima cosa da fare visualizzare solo i segmenti "flaggati" e poi decidere il da farsi: correggerli, cancellarli o lasciarli cos come sono, a seconda del caso. L'ultimo accorgimento prima di passare al controllo successivo quello di ripristinare la visualizzazione dell'intero file di memoria (non solo dei segmenti "flaggati"). Ma vediamo i passi in dettaglio, uno per uno. I - Cercare ed eliminare i tag e altri codici Nella finestra riprodotta pi sopra, clicchiamo sulla casella di spunta Source or Target has inline code e poi su OK. Cos facendo indichiamo a Olifant di cercare tutti i segmenti che contengono particolari tag o codici. Alla fine viene visualizzato il risultato della ricerca:

In questo caso, stato trovato un solo segmento bilingue contenente codici. Naturalmente, ce ne potrebbero essere molti altri, in altri file di memoria. Come possiamo notare, in questo momento non sappiamo se il segmento ha dei codici o tag solo nel testo source, solo nel testo target, oppure in entrambi. Clicchiamo su OK per andare oltre. Fatto questo, chiediamo di visualizzare solo i segmenti "flaggati", cio solo quei segmenti che risultano essere corrispondenti al nostro criterio di ricerca. Per farlo, clicchiamo sull'ottava icona corrispondente al comando Set Filter For Flagged Entries. In questo caso, il filtro mi visualizza l'unica TU contenente codici particolari:

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

La grandezza del carattere del testo contenuti nei segmenti regolabile a piacimento con la rotellina del mouse. Qui ho evidenziato in blu il codice che ritengo sia utile cancellare: <ph>&amp;t2;</ph> Confrontando il testo target e il testo source, mi pare di capire che questa combinazione di caratteri possa corrispondere a un trattino oppure a un semplice spazio. Forse si trattava invece di un rimando ipertestuale, per esempio una nota a pi di pagina. In ogni caso, credo che si possa tranquillamente cancellare. Provvedo dunque alla sostituzione opportuna modificando direttamente il testo del segmento target. Ma se invece di uno solo, ci fossero numerosi segmenti contenenti la stessa combinazione di codici, conviene usare la funzione Find And Replace per eliminare rapidamente i codici indesiderati ed eventualmente sostituirli con altro carattere. Per eliminarli basta non scrivere nessun carattere nel campo Replace by.

Per essere sicuri di trovare tutti i codici, sia nella lingua originale che in quella di partenza, ricordiamoci di spuntare sia la casella del testo source sia la casella del testo target, come nella figura qui sopra. Prima di proseguire con i passi successivi, ripristiniamo la visualizzazione di tutti i segmenti cliccando sull'icona Use Filter (F5), che ora appare incorniciata di blu: II - Cercare ed eliminare i segmenti vuoti Pu capitare a volte che, per errori di segmentazione o di salvataggio delle TU, il file di memoria possa contenere alcuni segmenti vuoti. Possiamo avere tre casi: 1) il segmento source contiene del testo, ma il relativo segmento target vuoto; 2) viceversa, il segmento source pu essere vuoto mentre il target contiene testo; oppure 3) possono essere vuoti sia il source che il target. Personalmente li elimino tutti in un colpo solo, spuntando le caselle Source is empty e Target is empty:

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

E' importante che ad ogni nuova ricerca, nel campo Fields siano spuntate (come nella schermata qui sopra) anche le due caselle del testo target e del testo source, oltre alla casella in basso a sinistra Reset flags before executing the selections . Quest'ultima casella fa s che ogni nostra ricerca successiva non si aggiunga a quelle che abbiamo eventualmente effettuato in precedenza. Avendo prima effettuato una ricerca di TU contenenti codici, se ora non spuntiamo la casella Reset flag, oltre a cercare segmenti vuoti o parzialmente vuoti, Olifant cercher di nuovo eventuali segmenti contenenti codici. Da qui, il procedimento uguale a quello seguito nel caso precedente. Si apre una finestra che ci dice se sono stati trovati segmenti corrispondenti al nostro criterio di ricerca, e quanti. Diamo l' OK e clicchiamo sull'icona corrispondente al comando Set Filter For Flagged Entries . Facciamo le nostre valutazioni del caso (correggere o eliminare i segmenti), e alla fine di tutto, ricordiamoci di cliccare di nuovo sull'icona Use Filter (F5) incorniciata di blu: . Non vi ho ancora detto come cancellare i segmenti indesiderati? Nessun problema: lo potete leggere pi sotto. III - Cercare ed eliminare quei segmenti in cui il testo source e il testo target sono uguali Qui consiglio di cliccare sulla casella Source is the same as Target (case not sensitive). Ecco un possibile risultato dopo aver cliccato su Set Filter For Flagged Entries :

Luciano Drusetta 2014

Manutenzione TM con OKAPI OLIFANT

Qui troviamo nomi propri, indirizzi, localit, formule Se scegliamo l'opzione Source is the same as Target (case sensitive) Olifant fa differenza tra maiuscole e minuscole; cos potrebbe trovare, per esempio, un segmento in cui il testo source EUR e quello target EUR, mentre ignorer eventuali segmenti in cui il testo source EUR e quello target Eur o viceversa. Io sono di bocca buona e cancello inesorabilmente tutti i doppioni. Come si fa? Clicchiamo col mouse a sinistra della casella che in questa schermata evidenziata in blu, cio nel primissimo riquadro a sinistra della prima riga in alto della tabella. Poi andiamo a scorrere la tabella verso il basso fino a trovare l'ultima riga. L teniamo premuto il tasto Maiuscole mentre clicchiamo col mouse nel riquadro a sinistra dell'ultima riga della tabella. Cos facendo, l'intera tabella verr evidenziata e potremo eliminare tutti i doppioni in un colpo solo con la semplice pressione del tasto Canc o Del. Attenzione per: se il file di memoria particolarmente voluminoso e i doppioni da cancellare sono diverse migliaia, pu essere prudente cancellare le TU a gruppetti di 1000-2000 alla volta, altrimenti Olifant potrebbe dare la fastidiosa impressione di non rispondere (anche se magari lavora in background). Poi ricordiamoci di cliccare ancora sull'icona Use Filter (F5) incorniciata di blu per tornare a visualizzare l'intero file di memoria, esclusi ovviamente i segmenti che abbiamo eventualmente cancellato. IV - Cercare ed eliminare i doppioni nei quali allo stesso testo source corrisponde lo stesso testo target Qui consiglio di cliccare sulla casella Duplicate Source and Target (case not sensitive). Ecco un possibile risultato:

Altri possibili esempi di segmenti ripetitivi possono essere: Articolo 1, Articolo 2, Capitolo 10, Allegato 3, Nota Bene... Procediamo a cancellarli come fatto prima: cliccando sulla prima riga della tabella (rettangolo vuoto a sinistra del rettangolo che qui vede evidenziato in blu) e poi sull'ultima riga della tabella tenendo Luciano Drusetta 2014

10

Manutenzione TM con OKAPI OLIFANT

premuto il tasto maiuscole, cio SHIFT (sempre nel rettangolo vuoto a sinistra). Poi clicchiamo di nuovo sull'icona Use Filter (F5) incorniciata di blu per tornare a visualizzare l'intera memoria, esclusi ovviamente esclusi i segmenti che abbiamo eventualmente cancellato. Resta un'ultima operazione di pulizia da fare, che per in Olifant ancora non ho capito bene come fare: quella della ricerca ed eliminazione dei doppioni "parziali", cio di quei segmenti che a parit di testo source hanno due o tre possibili traducenti. Spesso si tratta di segmenti target apparentemente diversi, che per mostrano piccolissime differenze di punteggiatura o di spaziatura, e che a mio avviso si possono tranquillamente cancellare. Questa un'operazione nella quale la macro di Christine Alba ancora insuperabile. Ve ne parler, se Dio vuole, in un'altra occasione. Luciano Drusetta 2014

Luciano Drusetta 2014