La traduction automatique : menace ou opportunité ? Retour sur la journée d’études #TQ2018 du 2 février 2018

Par Simon Watier, étudiant M1 TSM

 

A3_Conférence #TQ2018

À l’occasion de la sixième édition de la journée d’études dédiée à la traduction, l’Université de Lille  et le laboratoire « Savoirs, Textes, Langage » (STL) du CNRS ont organisé le vendredi 2 février une série de conférences qui ont pour objectif de définir le lien entre la biotraduction et la traduction automatique. Afin de dresser un portrait exhaustif de cette thématique complexe mais néanmoins essentielle neuf intervenants ont apporté leurs réponses, fruit de plusieurs années de recherches et de réflexions : Emmanuel Planas, Rudy Tirry, Véronique Huyghebaert, Sandrine Peraldi, Stéphanie Labroue, Fleur Schut, Daniel Prou, Aljoscha Burchardt et Antonio Balvet.

Pour comprendre l’impact de la traduction automatique il convient de retracer l’évolution des outils de TAO (Traduction Assistée par Ordinateur) pour mieux appréhender leur incidence dans le secteur de la traduction. En effet, les premiers outils de traduction automatique remontent avant les années 40, notamment avec le linguiste italien Federico Pucci, véritable précurseur de la traduction automatique moderne. En revanche celle-ci  était davantage considérée comme un outil de décryptage et non comme un véritable acteur de la traduction. La traduction automatique neuronale (TAN) imite le fonctionnement du cerveau humain et créer des voies neuronales pour traduire une phrase dans sa totalité. Elle succède ainsi à la traduction statistique (TAS) qui utilisait également un corpus, découpé en unités de traduction auxquelles on attribuait un score de probabilité.

 

220px-Triangle_de_vauquois.svg

Le triangle de Vauquois est le modèle de base de la traduction automatique.

 

La traduction automatique neuronale connait une véritable « hype » relayée, entre autre, par la presse. En effet la TAN ne se cantonne plus uniquement à la sphère professionnelle, elle fait désormais partie intégrante du quotidien (Google Translate, Facebook, Amazon, DeepL, les exemples sont légion). Pour mieux illustrer le propos, une opposition entre  la TAN et la TAS semble nécessaire afin d’exposer les avantages et les inconvénients de chacun. Le verdict n’en est que plus complexe car si la TAN assure une traduction plus fluide notamment au niveau de la syntaxe, la TAS est plus performante sur la terminologie, un point pourtant essentiel dans le travail du traducteur. Il ne faut pas omettre pour autant la post-édition qui est constituée de 3 niveaux : Full MTPE (Machine Translation Post-Editing) qui ne se distingue pas de la biotraduction, Light MTPE qui se concentre avant tout sur le sens et non sur l’approche stylistique et Focused MTPE qui examine des éléments spécifiques comme les nombres, les noms. Au final l’approche humaine demeure la clef de voûte de la traduction car si la technologie ne cesse de se perfectionner, celle-ci est incapable de retranscrire la créativité et la subtilité de l’Homme.

Heureusement les traducteurs ne sont pas en reste question ressources. Jonckers, une société de traduction créée il y a une vingtaine d’années et présente dans 10 pays a développé des outils afin de fluidifier la gestion de la post-édition, source de nombreux défis à relever. En effet différents maux liés au volume demandé peuvent affecter l’ensemble du processus (retards, client insatisfait, burn-out des traducteurs). Pour y remédier, l’entreprise a créé le Loclab, un centre de post-édition en interne qui a permis de favoriser l’échange et la proximité entre les traducteurs et les formateurs. L’aspect commercial est évidemment de mise puisque les ventes d’un produit peuvent directement dépendre d’une bonne traduction. Ainsi, un système de contrôle de qualité est instauré, 5 % du contenu est extrait puis vérifié, afin de transmettre le score obtenu au post-éditeur. La post-édition est basée sur un moteur de traduction automatique qui permet à la fois un gain de flexibilité et de productivité. Le plus important réside dans la compréhension et l’adaptation aux besoins du client.

 

photo2fev

 

Désormais la traduction automatique est perçue de manière positive, elle ne représente plus une menace pour le traducteur mais bien une aide précieuse. Son implantation dans la formation des traducteurs constitue une preuve irréfutable. Paradoxalement peu d’articles ont été consacrés à ce sujet alors que plusieurs auteurs se sont penchés sur la question d’un point de vue épistémologique. 85 % des formations privilégient les outils les plus utilisés sur le marché, ce choix est directement lié aux pratiques des traducteurs.

Cependant plusieurs études consacrées à l’intégration des outils de TAO ont montré que la plupart des formations privilégiaient l’apprentissage de l’outil sur l’acquisition de véritables compétences en conditions de travail réelles. Il convient de prendre en considération deux aspects : la dimension professionnalisante qui désigne la compréhension des difficultés inhérentes au déploiement d’un nouvel outil dans le travail et la dimension cognitive, liée à la gestion des émotions des traducteurs face aux nouvelles technologies qui peuvent les déstabiliser. De même, l’automatisation d’une partie du processus peut perturber des stratégies de traduction (éloignement du texte source, multiplication des efforts cognitifs). Ainsi les émotions jouent une place prépondérante dans la perception mais aussi dans la performance des outils.

 

photo2fev2

Divers outils comme Euramis (base de données des traductions effectuées dans les institutions européennes), MT@EC (moteurs statistiques avec 79 paires de langues directes), et eTranslation (moteurs neuronaux avec 6 paires de langues) sont quant à eux davantage destinés aux traducteurs de la Commission européenne. La TA peut être utilisée de deux manières : par segment entier ou par fragments successifs. De même la traduction automatique est plus efficace avec certaines langues que les moteurs statistiques, notamment l’estonien.

Systran, qui n’est autre que le leader mondial des technologies de la traduction, a développé un moteur PNMT (Pure Neural Machine Translation) basé sur des réseaux de neurones artificiels et du deep learning. Trois principaux composants constituent la chair de ce système PNMT à savoir le word embedding (prolongement de mots) qui se focalise sur l’apprentissage d’une représentation de mots, les réseaux de neurones récurrents dans lesquels l’information peut se propager dans les deux sens, et l’attention model (modèle d’attention) qui désigne la capacité du moteur à collecter des informations sur des mots spécifiques. Ce moteur pourra s’appliquer dans un futur proche aux correcteurs informatiques et aux chatbot (agents conversationnels). Toutefois cela soulève de nouveaux défis à relever : comment analyser et corriger une erreur ? Comment configurer un moteur pour une tâche très spécifique ? L’IA sera-t-elle capable de rivaliser avec l’être humain en termes de pertinence ?

 

photo2fev3

 

Ainsi s’achève la journée d’études qui a permis de dépoussiérer les notions de bases de la traduction automatique pour mieux cibler les tenants et la aboutissants auxquels devront faire face les traducteurs pour intégrer le marché du travail. Si la technologie ne cesse de se perfectionner, elle pose également ses limites quant à sa capacité à s’adapter. Celle-ci fait toujours l’objet de certaines critiques qui voient en elle une menace pour le biotraducteur. Cependant l’expérience et la recherche combinées des professionnels ont permis de démontrer son apport vital au sein de ce secteur. La traduction automatique neuronale constitue une nouvelle avancée qui imite les réseaux et les connections synaptiques humaines pour mieux cibler le contexte et la terminologie des mots. Cela ouvre tout un nouveau champ de possibilités qui amènera peut-être une imitation quasi-parfaite de la réflexion humaine.

 

NB : la plupart des présentations de la journée du 2 février sont disponibles en ligne sur le site de la conférence : https://tq2018.sciencesconf.org/ 

Publicités

Nouveau cap pour le secteur de la traduction : la post-édition

Article original en anglais The Latest Trend in the Translation Industry: PEMT rédigé par Nikki Graham et publié sur le blog de l’auteur My Words for a Change.

Traduction en français réalisée par Clovis Cerri, étudiant en M2, Master TSM à l’Université Lille3

 

pemt2

Avez-vous entendu parler de la dernière tendance sur le marché de la traduction ? Il s’agit de la PEMT, acronyme anglophone signifiant post-editing machine translation. En clair, les clients font appel à un programme pour traduire leur texte, lequel est ensuite envoyé à un traducteur chargé d’y apporter la touche finale. Certains d’entre eux utilisent des services de traduction automatique plus poussés que ceux disponibles en ligne. Néanmoins, l’expérience me prouve que Google Traduction est l’outil le plus populaire, et c’est donc celui auquel les clients ont le plus souvent recours pour obtenir leur traduction au coût d’une révision, soit environ 50 % du prix.

Excellente idée en apparence, n’est-ce pas ? Qui refuserait la perspective alléchante d’économiser quelques centimes sur le prix des biens qu’il achète ? Vous venez pourtant de commettre une première erreur. La traduction n’est pas un bien, c’est un service. Le prix ne porte pas uniquement sur le produit fini. Ce que vous payez, c’est le savoir-faire qui se cache derrière les étapes amenant au produit fini : une traduction efficace et naturelle, qui n’est ni littérale ni criblée de fautes, qui correspond à vos attentes et, comme disent certains, qui sonne bien.

la traduction n’est pas un bien, c’est un service

Penchons-nous tout d’abord sur les étapes caractérisant le processus de traduction, dont la complexité échappe parfois aux personnes qui ne sont pas familiarisées avec l’exercice.

La traduction humaine

  1. L’agence ou le client envoie un texte source à la traductrice.
  2. Elle étudie le texte source en langue originale.
  3. Elle réfléchit.
  4. Elle rédige une traduction.
  5.  Elle relit son travail avec une grande précaution.
  6. Elle le renvoie à l’agence ou à un(e) collègue pour la révision.
  7. Le texte est révisé.
  8. Tous les points litigieux font l’objet de discussions et de modifications.
  9. La traductrice et/ou le réviseur produit une version finale.
  10. La traduction est envoyée au client.

La PEMT (post-édition)

  1. Une machine traduit le texte.
  2. Le texte source obtenu est envoyé à un traducteur pour être édité.
  3. Le traducteur étudie le texte source.
  4. Il étudie le texte cible.
  5. Il réalise que de nombreuses erreurs sont présentes dans la traduction.
  6. Il réfléchit, mais il s’embourbe au milieu des traits de langage erronés, et il repère des termes et des expressions qui ne collent pas du tout au contexte donné.
  7. Il effectue des va-et-vient entre texte source et texte cible pour s’assurer que les modifications qu’il apporte sont cohérentes avec l’original, ce qui peut prendre un certain temps.
  8. À l’aide de sa souris, il doit mettre en évidence les mots et les expressions qu’il faudra supprimer ou couper-coller par la suite. Encore une fois, c’est une tâche chronophage. Il n’est d’ailleurs pas impossible qu’il décide, afin de gagner du temps, de supprimer la « traduction » de certains passages pour repartir de zéro.
  9. Il retourne au point de départ pour une vérification intégrale, les modifications étant si nombreuses qu’il est nécessaire de s’assurer de la bonne cohérence et de la qualité de l’ensemble.
  10. Il remet le texte cible à l’agence ou au client. Puisqu’il s’agit d’une étape d’édition, la traduction ne subira aucune autre vérification, à moins que le client n’en ait expressément fait la demande et qu’il ne soit disposé à payer.

Le scénario présenté ci-dessus s’applique aux cas de post-édition intégrale, ce qui signifie que l’éditeur est chargé d’éliminer toutes les erreurs et de produire un texte s’apparentant à une traduction humaine plutôt qu’à une traduction automatique. En d’autres termes, il doit faire passer une vessie pour une lanterne.

Le service de post-édition se décline également en une variante dite partielle. L’éditeur ne se concentre alors que sur les erreurs pouvant altérer le sens, les nombreuses autres étant délibérément laissées telles quelles pour des raisons de coût. Oui, vous avez bien lu. La rectification des erreurs dans le texte traduit par la machine n’est pas systématique, le client préférant faire des économies de bout de chandelle, et ce en dépit de l’image inévitablement négative que le texte imparfait donnera des produits et services du client. J’espère sincèrement que vous ne faites pas partie des clients de cette espèce. J’espère sincèrement que vous ne contribuez pas au massacre de notre langue en publiant les ignominies que peuvent produire les machines.

le dialogue fait partie intégrante du processus de traduction

Je dois également faire mention de la pré-édition. Cette étape est parfois nécessaire au préalable de la traduction automatique. Elle consiste à nettoyer le texte, à supprimer le jargon propre à l’entreprise, les fautes de frappe et de grammaire et à améliorer le style, pour faciliter la compréhension du texte par la machine et l’aider à produire un résultat plus intelligible. Évidemment, un traducteur humain comprendrait votre message de lui-même et la correction des erreurs ferait partie intégrante du service proposé. Et si un doute quelconque subsistait, il vous contacterait pour se renseigner. Le dialogue est souvent un élément essentiel du processus, qui profite tant au traducteur qu’au client et qui sert de base solide à des partenariats durables et profitables.

les traducteurs sont capables de repérer une traduction machine

pemt1Vous avez très certainement compris que la post-édition est un exercice laborieux et accablant qui demande énormément de temps. À de trop nombreuses reprises, des clients souhaitant réduire leurs frais m’ont dupée et m’ont envoyé des traductions automatiques à réviser. Depuis, j’ai donc établi des conditions de vente claires. Si je m’aperçois qu’un client a fait appel à une machine, ce qui ne risque pas de m’échapper, j’interromps la révision ou l’édition et je ne reprends pas le travail avant d’avoir obtenu un accord pour facturer selon mes tarifs de traduction habituels. Il va sans dire que le temps préalablement perdu sur l’édition sera également facturé. Utilisez Google Traduction et ses semblables à vos risques et périls. La balle est dans votre camp.