Els quès i els perquès de la postedició de traducció automàtica — Clara Ginovart

500px_34_imatge apunt Clara Ginovart
Imatge de Lemonsandtea CC BY-NC-SA 2.0 – Pixabay

Fa tan sols set anys semblava que la traducció automàtica (TA) es reduïa encara a Google Translate i a altres solucions gratuïtes i en línia que es constituïen com una mera ajuda a qualsevol persona que volia entendre una paraula o una frase d’un lloc web, d’un correu electrònic o de la conversa en curs amb un estranger.

Almenys m’ho semblava a mi. L’any 2013 vaig acabar el Grau de Traducció i Interpretació a la Universitat Pompeu Fabra i vaig començar un màster en traducció a la Universitat de Ginebra, el programa del qual ara ha desaparegut i s’ha desdoblat en tres màsters més especialitzats. En sis anys d’estudis superiors, només el darrer, el 2015, vaig entendre que TA era una solució també per a professionals. En una sola assignatura d’un semestre, vam cobrir la història de la TA, les bases de les diferents tecnologies, una mica de nocions d’avaluació dels resultats, una idea de què és i com es fa la postedició (PE), una presentació dels llenguatges controlats, i un pèl de pràctica amb eines de reconeixement de veu. Cadascun d’aquests temes, o fins i tot certes branques d’un sol tema, podrien constituir un màster per si mateixos.

La PE (que ja té pàgina Viquipèdia) és un tema de recerca de llarga data. El 1987, Muriel Vasconcellos ja comparava aquesta tasca a la de la revisió a les actes de la 28a Conferència anual de l’Associació Nord-americana de Traductors, on concloïa que les diferències recauen tant en l’aproximació global com en els tipus d’errors que s’han de corregir. El 2001, Hans P. Krings, traduït de l’alemany a l’anglès per Geoffrey S. Koby (qui vaig tenir el plaer de conèixer personalment l’any passat a la 6a Conferència internacional de IATIS a Hong Kong), va publicar un llibre innovador en el qual s’interessa per la PE monolingüe (contrastada a la correcció de TA amb referència al text original) i la manera com estudiar els processos i la recol·lecció de dades durant la PE. Des d’aleshores, la recerca i les publicacions han anat augmentant exponencialment i, tanmateix, d’aquestes dues primeres referències ja podem deduir dues característiques importants de la PE que ens ajudaran a definir-la:

  • No és el mateix posteditar TA, que revisar una traducció feta per un traductor humà.
  • La PE pot ser bilingüe o monolingüe, és a dir, la correcció del resultat de la TA es pot fer amb referència o sense al text en llengua de partida.

Com heu vist, per definir la PE no he pogut evitar utilitzar la paraula “correcció”. I és que amb l’arribada de la TA neuronal (una nova tecnologia basada en la intel·ligència artificial i l’aprenentatge profund) els resultats han millorat tant que, en algunes situacions, podria equiparar-se la PE a la correcció de textos. Ara bé, cal subratllar en algunes situacions, ja que en el món de la traducció professional, per poder acabar de dibuixar el què de la PE, cal entendre primer el perquè. Jeff Allen, en el capítol “Post-editing” de Computers and Translation (Harold, 2003) introdueix la noció de nivells de PE. Evidentment, segons l’ús que vulguem fer del text traduït, podrem acceptar (o no) una qualitat menor. Per exemple, si només volem entendre el contingut d’un document a trets generals, una PE molt supèrflua o fins i tot nul·la pot ser suficient. En canvi, si es tracta d’un servei que oferim a una gran empresa que ven el seu producte mitjançant la traducció d’un lloc web, és obvi que la qualitat haurà de ser més elevada. Finalment, si el que traduïm és un informe mèdic del qual depèn la decisió d’un doctor sobre si cal operar un pacient, o una sentència d’un jutge que farà que un pres sigui extradit a un altre país, no hi ha dubte: la qualitat de la traducció ha de ser impecable.

Diguem, doncs, que segons els usos o les situacions, els tipus o nivells de PE variaran. Per tal de tenir en compte els diferents graus d’aquesta escala de qualitat, ens calen directrius de postedició. El punt de partida i una base sòlida l’ofereix TAUS el 2010 i es formalitza en la norma ISO 18587 el 2017. Cada empresa pot adaptar-les o modificar-les perquè s’ajustin als seus projectes, ja que una directriu pot aplicar-se o no segons el tipus de text. A més a més, segurament caldrà crear-ne de noves segons el parell de llengües, si volem incloure deixos de guia d’estil en les nostres directrius de PE.

Per comprendre millor què és la PE, cal posteditar. Perfecte, doncs vegem-ne un parell d’exemples traduïts per DeepL, el nou competidor de Google Translate creat a partir de les bases de dades i corpus de Linguee. En els exemples que hi ha a continuació, trobem en la primera casella el text en llengua de partida, la proposta del traductor automàtic en la segona, i en la tercera casella el text posteditat i lliurat per un hipotètic traductor humà:

Por muy surrealista que parezca, son imágenes reales. As surrealistic as it may seem, they are real images. As surrealistic as it may seem, these are real images.

En aquesta frase extreta d’un text periodístic, una sola edició és suficient per fer que la traducció castellà-anglès sigui completament vàlida.

Si el traductor, ara posteditor, en lloc de limitar-se a fer aquest canvi decideix refer la traducció perquè no es noti que és una traducció (per exemple: “It is not an illusion, these pictures are real”), estaria perdent el guany de productivitat que ha de suposar l’ús de la TA. I per tant, seria contraproduent, es tractaria d’una “sobreedició”. Aquesta tendència la solen mostrar els traductors professionals, que estan acostumats a pensar les traduccions per ells mateixos.

Vegem ara un altre exemple:

Depuis plusieurs semaines, des citoyens s’émeuvent sur les réseaux sociaux des feux de forêts qui ravagent la région. Desde hace varias semanas, los ciudadanos se mueven en las redes sociales sobre los incendios forestales que asolan la región. Desde hace varias semanas, los ciudadanos se mueven en las redes sociales sobre los incendios forestales que asolan la región.

Si el posteditor decideix acceptar aquesta proposta del traductor automàtic sense fer-hi cap modificació, incorre en el que anomenem “subedició”, ja que hauria passat per alt un error que era necessari editar perquè el sentit és incorrecte: “émouvoir” s’hauria de traduir per “commoure”, per exemple. Solen cometre subedició traductors que acaben de començar a posteditar i que no saben gestionar bé l’equilibri entre pressió del temps (productivitat demanada pel client) i nivells de qualitat (encara no han integrat les directrius de PE per reconèixer ràpidament quins errors són lleus i es poden deixar passar i quins errors són greus i s’han de corregir). També solen incórrer en subedició els traductors novells.

Vegem dos darrers exemples:

The pilots are striking over pay and benefits. Los pilotos están en huelga por la paga y los beneficios. Los pilotos están en huelga por la paga y los bienes.
They are also calling on the airline to “harmonise pay across the UK in a fair, transparent, and consistent structure”. También piden a la aerolínea que “armonice los salarios en todo el Reino Unido en una estructura justa, transparente y coherente”. También llaman a la aerolínea que “armonice los salarios en todo el Reino Unido en una estructura justa, transparente y coherente”.

El posteditor, en aquests dos casos, hauria comès el que s’anomena “pseudoedició”, és a dir, introduir un error en el text meta. En el primer cas havia identificat un error però el substitueix per un altre error, mentre que en el segon cas la proposta de DeepL podia acceptar-se tal com estava, i el posteditor introdueix un error en el text. La pseudoedició pot presentar-se en traductors que postediten textos d’un idioma en el qual no són nadius, o bé quan aquesta feina s’encarrega a persones que treballen en altres àmbits, sense cap formació lingüística o traductora.

Aquestes tres trampes metodològiques o de tècnica que planteja la PE, juntament amb el fet que l’objectiu primer i principal de la PE és utilitzar tant com sigui possible la proposta del traductor automàtic per augmentar la productivitat i reduir costos, estan contribuint a la creació d’un “argot de postedició”, el cosí germà del ja conegut “translationese” (Baker, 1993). En efecte, això té un gran impacte en les llengües de destinació (especialment les minoritàries), en el sentit que perden les estructures i les solucions expressives més pròpies i s’alineen de manera forçada amb les llengües d’origen. Així, la TA i PE en certa manera fan de catalitzador de la interferència lingüística.

Caldrà veure si en algunes combinacions lingüístiques i tipologies textuals es pot començar a comparar la PE de TA a la revisió o la correcció, però no deixarà de ser una situació excepcional tenint en compte que les màquines i els humans no seguim els mateixos patrons per cometre errors (sistematicitat) ni fem els mateixos tipus d’errors. Amb el poder innovador de la traducció neuronal el que s’observa és una major dificultat a detectar errors a causa d’un text més fluid, per tant sembla ara més necessari que mai referir-se sempre al text original abans d’acceptar una proposta d’un traductor automàtic. En conclusió, podem dir que hi ha diferents quès segons els perquès. Hem de preparar-nos a redefinir constantment les accions lingüístiques sobre i al voltant de la TA per poder respondre d’una manera adequada a les necessitats del mercat i, sobretot, dels lectors.

Clara Ginovart
Assessora en tecnologies de la traducció

Deixa un comentari