Retour d’expérience : #TranslationCafé, Littératie de la traduction automatique

Par Sophie Vandenmersch, étudiante M1 TSM

Qu’on l’adopte ou non, la traduction automatique (TA) ou traduction machine s’implante de plus en plus dans le secteur. En 2016, la traduction automatique neuronale (TAN) fait son apparition dans le grand public avec Google Traduction, qui a développé son propre système de TAN appelé Google Neural Machine Translation (lien en anglais). Le principe repose sur des réseaux neuronaux profonds qui fonctionnent grâce à l’apprentissage profond (deep learning), un type d’intelligence artificielle. L’année suivante, DeepL, un autre système de TAN également accessible en ligne, voit le jour. Cependant, leur utilisation éclairée requiert d’en comprendre les tenants et aboutissants. Pour en savoir un peu plus, j’ai décidé de participer à la conférence organisée par #Translationcafé qui s’est déroulée le 22 avril dernier et de vous partager quelques points abordés.

Le #TranslationCafé, kézako ?

Il s’agit d’une table ronde mensuelle en ligne, au cours de laquelle trois spécialistes de la traduction échangent de façon informelle autour d’une thématique liée au monde de la traduction. Elle a lieu à 16 heures (heure française) et dure une heure. Les sujets sont divers et variés : de l’histoire de la traduction des langues asiatiques jusqu’au sous-titrage, en passant par l’impact de la crise sanitaire dans le secteur. Les internautes ont la possibilité de poser des questions en direct. Enfin, cet évènement est libre d’accès, sur simple inscription.

Cette deuxième édition portait sur la littératie de la traduction automatique (Machine Translation literacy) avec pour invités : Lynne Bowker, professeure de traduction et sciences de l’information à l’Université d’Ottawa, Lettie Dorst, professeure de linguistique anglaise et de traduction à l’Université de Leyde, et Rudy Loock, professeur de traductologie et de linguistique anglaise à l’Université de Lille.

Dans quelle mesure et comment les professionnels des langues peuvent-ils assister le grand public dans l’utilisation et la confiance en la traduction automatique ?

Lynne Bowker : Tout d’abord, selon moi, la littératie de la traduction automatique suppose certains pré-requis à une utilisation efficace et réfléchie. Contrairement aux autres types de connaissances informatiques, celle-ci relève plus d’un processus cognitif que technique. Autrement dit, de savoir si le contenu à traduire se prête à la TA ou non, mais aussi comment optimiser le résultat, en pré-éditant le texte source par exemple. Trois grandes catégories de personnes utilisent la TA :

  • le grand public, à des fins personnelles ;
  • les professionnels de la traduction souhaitant intégrer la TA dans leur processus ;
  • les étudiants en langues ou linguistique.

Toutes ces personnes ont des connaissances relatives à la traduction et des finalités différentes. De ce fait, l’enseignement doit être adapté aux différents types d’utilisateurs pour répondre à leurs besoins respectifs. Je constate un manque d’objectivité de la part de certains acteurs du monde de la traduction, qui ont tendance à véhiculer une image catastrophique de la TA. Ces idées reçues ne renseignent en aucun cas le grand public qui, en fin de compte, l’utilisera tout de même, donc autant les aider à utiliser cet outil de la manière la plus éclairée possible.

Lettie Dorst : Je confirme dans la mesure où ces affirmations, quelles qu’elles soient, n’instruisent en rien l’utilisateur lambda. J’ai remarqué qu’il y a deux types de messages qui reviennent concernant l’informatique en général : soit tout fonctionne à merveille, soit pas du tout. Certes, grâce à la traduction automatique, nous obtenons une certaine équivalence linguistique concernant la syntaxe et la terminologie, mais le travail des traducteur ne se résume pas à cela. C’est une des problématiques que j’aborde dans le cadre de mon projet sur la traduction automatique (lien en anglais). Techniquement, il ne s’agit pas de « traduction automatique », car ce n’est pas de la traduction à proprement parler, mais plutôt une application d’algorithmes informatiques. J’enseigne à mes étudiants que c’est une machine qui ne comprend pas ce qu’elle produit, qui ne lit pas le texte et qui ne communique rien du tout. Ils adoptent en conséquence un raisonnement plus critique, notamment pour une éventuelle utilisation ainsi que les motifs de cette démarche.

Rudy Loock : En effet, la TA est trop facile d’utilisation. Je le constate avec les étudiants qui, qu’ils soient en traduction ou non, accordent une confiance totale à ce que la machine propose. Ce qui apparaît à l’écran n’est jamais exact et, de fait, il est impératif de disposer d’un esprit critique. Les étudiants toutes spécialités confondues utilisent la TA. La technologie a ses limites, car on y rencontre des problèmes de richesse lexicale, des ambiguïtés, et elle peut même générer un langage discriminatoire. Concernant les étudiants en traduction, l’enseignement de la TA est abordé sous un autre angle, étant donné qu’ils ont une différente approche envers cet outil. Lors d’un projet de traduction, ils doivent être en mesure de déterminer si la TA peut intégrer le processus traductif. De plus, le type d’outil a aussi son importance, car à l’heure actuelle, les entreprises développent leurs propres outils de TA. Je dirais qu’une sensibilisation à la TA est donc impérative et doit être définie selon le profil de l’utilisateur.

Le processus cognitif n’est pas le même en traduction ni en révision ou bien en post-édition, et je crains que, en ayant recours à cette dernière, les étudiants en oublient la formation à l’élaboration d’une traduction et aux processus cognitifs qui y sont liés.

LD : Avant toute chose, je pense qu’il faut garder en tête le profil des étudiants dont il est question, notamment s’il s’agit d’étudiants en langues, en traduction ou d’étudiants d’autres filières qui utilisent la TA comme simple outil. Concernant les étudiants en traduction, il est capital d’approfondir leurs propres compétences en traduction, de même que pour la relecture, tout en les couplant à l’utilisation d’outils de TAO. En outre, ils doivent apprendre à la fois la révision et la post-édition. Lorsque je corrige des travaux d’étudiants, ils sont en mesure de différencier chacune de ces tâches, les compétences liées à celles-ci, qui se complètent les unes les autres. Avec la pratique, ils se rendent compte qu’il s’agit d’opérations bel et bien distinctes. J’estime qu’il est de notre devoir de faire prendre conscience à nos étudiants de leurs forces et faiblesses. Certains sont très à l’aise en traduction et moins en révision. L’inverse est aussi vrai. D’autres brillent en post-édition ; en revanche, ils feraient de mauvais traducteurs. D’autres encore sont de très bons traducteurs mais ne remarquent pas les erreurs produites par la TA ou ne savent pas comment les corriger sans retraduire de zéro.

RL : Traduire et post-éditer sont deux tâches différentes en effet. La plupart conviendra qu’on ne peut être un bon post-éditeur sans être au départ un bon traducteur, la difficulté principale étant de corriger les erreurs et d’améliorer le résultat généré par la machine. Pour appuyer le fait que le traducteur humain doit rester au cœur du processus traductif, certains parlent de « traduction orientée vers l’humain » (human-centered translation).

LB : La question de l’introduction des outils de TA ne date pas d’hier, même quand celle-ci ne jouait pas encore un rôle majeur. Cette même problématique s’est posée lors de l’arrivée des mémoires de traduction. Il n’existe aucune solution prédéterminée. D’une part, posséder de bonnes compétences traductionnelles serait bénéfique à une utilisation efficace de la TA. D’autre part, la post-édition est une compétence, tout comme la traduction, qui peut être améliorée au fil du temps. Par conséquent, il subsiste un certain avantage à l’introduire tôt et à développer lesdites compétences en parallèle. Certains étudiants sont susceptibles de se spécialiser en post-édition. A contrario, on trouve des étudiants destinés à devenir traducteurs et qui vont se servir de leur expérience en TA afin de défendre leur valeur ajoutée lors du processus traductif. Je suis d’avis que les traducteurs et post-éditeurs peuvent se compléter.

Comme le résultat de la TA est une probabilité statistique d’une proposition de traduction, serait-il pertinent de former les utilisateurs afin de déterminer si une suggestion n’a rien à voir avec le sens du texte source ?

RL : Tout à fait. Pour moi cela fait partie des notions à acquérir, et cela vaut également pour la langue maternelle. Pour ce faire, une maîtrise de la langue cible est de rigueur.

LB : Une majeure partie du métier de traducteur et l’utilisation de la TA consiste en des prises de décisions et d’appréciations. Un outil de TA, qui repose en partie sur la probabilité statistique, fera en sorte de suggérer une proposition de traduction. Vient le rôle du traducteur de se prononcer pour un choix plutôt qu’un autre.

Un module dédié à la sensibilisation à la TA dans l’enseignement secondaire serait-il judicieux ?

RL : Personnellement, je ne consacrerais pas de cours spécifique à la TA, même pour les étudiants de licence. Il aurait plutôt sa place en cours de langues ou de traduction.

LD : Je l’aurais intégré aux modules du tronc commun de première année à l’université qui abordent l’accès, l’utilisation des plateformes universitaires en ligne ainsi que l’utilisation des logiciels de bureautique.

LB : Je pense que les étudiants en fin de cycle secondaire ou au début à l’université sont les cibles idéales, étant donné qu’ils commencent à forger leur propre opinion. Cependant,associer des cours de sensibilisation à la TA exclusivement aux cours de langues serait réducteur, car une grande majorité d’utilisateurs lambda de la TA ne parlent pas la langue source.

Avoir recours à un outil gratuit permettrait au site d’exploiter nos données afin d’enrichir leurs services. Quels sont les risques et problèmes ?

LB : Tout dépend du type de contenu. S’il contient des informations sensibles, il est préférable de faire preuve de conscience professionnelle en respectant le souhait du client, et donc de s’en abstenir. Il ne faut pas hésiter à en discuter avec le client ; la solution parfaite n’existe pas.

RL : L’éthique fait partie des fondamentaux, notamment pour les futurs professionnels de la traduction. Négliger cet aspect peut engendrer de lourdes répercussions, comme l’illustre cette histoire (en anglais) d’une agence de voyages norvégienne dont les informations confidentielles ont été exposées au grand public, à la suite de l’utilisation d’un outil de TA en ligne gratuit. J’ajoute que, pour avoir un outil de TA efficace, ce dernier doit être alimenté par des données de qualité, issues de corpus parallèles de traductions réalisées par des humains. Lorsqu’on utilise un outil de TA, il est important de savoir sur quelles bases de données il a été créé. Quant à la collecte des données et à l’accord des utilisateurs, c’est une autre histoire. Bien sûr, l’éthique est essentielle à une utilisation éclairée de la TA par les professionnels du secteur, mais elle concerne tout autant les utilisateurs lambda.

LD : Ce qui est étonnant, c’est que les gouvernements ne prennent pas position sur ce sujet. Prenons l’exemple des Pays-Bas : par manque de traductions officielles, la population s’en remet à la TA pour comprendre les informations personnelles à caractère médical qui leur sont transmises. De plus,le service de l’immigration communique uniquement en néerlandais. Les traducteurs se retrouvent à gérer la question de l’éthique alors que ce ne sont pas les seules personnes à blâmer. Je pense qu’il faudrait aborder le sujet avec ceux qui obligent à utiliser la traduction machine. Dans les Conditions générales d’utilisation de ces outils, il est clairement mentionné que ces derniers sont en mesure de publier le contenu. Par ailleurs, Google lui-même indique que son outil de TA ne remplace pas la traduction humaine.

Comment utiliser la TA de façon responsable et éthique ?

LB : Il s’agit d’une question de morale. Si vous n’êtes pas disposé à l’utiliser, alors ne le faites pas. À mon avis, les utilisateurs prennent des décisions, mais pas en toute connaissance de cause, ou alors ils font au mieux avec ce qu’ils ont sous la main. En tant que représentants du domaine, notre rôle est d’informer le grand public. Pour finir, pourquoi devrions-nous attendre des personnes n’étant pas issues du métier de tout savoir sur ce que nous avons mis cinq à dix ans à apprendre ?

J’étudie la traduction et redoute le jour où l’on me demandera uniquement de post-éditer. Partagez-vous cette inquiétude ?

LD : Il faut s’en inquiéter seulement si vous n’excellez pas en traduction. Certes, de plus en plus d’agences tentent d’instaurer la traduction automatique, mais j’ai aussi l’impression que les étudiants ignorent une partie du secteur de la traduction où la TA n’est pas de mise et où est pratiquée une bien meilleure rémunération. Enfin, certains étudiants préfèrent post-éditer, et le résultat est satisfaisant. Je suis certaine que chacun y trouvera son compte.

LB : Comme mentionné auparavant, tous les types de contenu ne sont pas adaptés à la TA. De fait, les traducteurs humains ont une plus-value à faire valoir. C’est ce que nous explique dans cette vidéo David Jemielty, responsable du département des traductions à la Banque Cantonale Vaudoise (BCV).

Pour aller plus loin concernant la TA et les étudiants, je vous invite à consulter cet article rédigé par mes collègues de formation.

Un grand merci au #Translationcafé d’avoir accepté que je revienne sur cette table ronde dans le cadre du blog du Master TSM.

Retrouvez toutes les actualités du #TranslationCafé sur le compte Twitter (en anglais) : @LetsTalkXl8.

Ce billet est une retranscription partielle des propos énoncés.

Sources :

Ahmad, Sami. 2017. « Google Neural Machine Translation – AI to Improve Translation Accuracy ». Technobyte. 28 avril 2017. https://technobyte.org/google-neural-machine-translation-translate/.

Gouvernement du Canada, Services publics et Approvisionnement Canada. 2020. « Littératie de la traduction automatique : pour une éthique de l’intérêt commun – Blogue Nos langues – Ressources du Portail linguistique du Canada – Langues – Identité canadienne et société – Culture, histoire et sport – Canada.ca ». 19 octobre 2020. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/litteratie-traduction-automatique-machine-translation-ethics-fra.

« O’Brien et Ehrensberger-Dow – 2020 – MT Literacy—A cognitive view.pdf ». s. d. https://digitalcollection.zhaw.ch/bitstream/11475/20864/3/2020_OBrien-Ehrensberger-Dow_MT-Literacy_JBE.pdf.

O’Brien, Sharon, et Maureen Ehrensberger-Dow. 2020. « MT Literacy—A Cognitive View ». Translation, Cognition & Behavior 3 (2): 145‑64. https://doi.org/10.1075/tcb.00038.obr.

« Traduction automatique : faire les bons choix avant de commencer ». 2021. MasterTSM@Lille (blog). 14 février 2021. https://mastertsmlille.wordpress.com/2021/02/14/traduction-automatique-faire-les-bons-choix-avant-de-commencer/.

« Traduction automatique : les algorithmes ont-ils des préjugés ? » 2019. MasterTSM@Lille (blog). 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/.

« Traduction automatique : nouvelle alliée des étudiants en traduction ? » 2020. MasterTSM@Lille (blog). 13 décembre 2020. https://mastertsmlille.wordpress.com/2020/12/13/traduction-automatique-nouvelle-alliee-des-etudiants-en-traduction/.

Traduction, par Colivia. 2021. « Le Deep Learning en traduction automatique, qu’est-ce que c’est ? » Colivia Traduction (blog). 28 mai 2021. https://colivia-traduction.com/le-deep-learning-en-traduction-automatique-quest-ce-que-cest/.

« Translate.Com Exposes Highly Sensitive Information in Massive Privacy Breach ». 2017. Slator. 7 septembre 2017. https://slator.com/technology/translate-com-exposes-highly-sensitive-information-massive-privacy-breach/.

Translating for Europe. s. d. #2019TEF – KEYNOTE SPEECH – The added value of translation. https://www.youtube.com/watch?v=qGGaEnRECHc.

« #Translation Cafe ». s. d. Eventbrite. https://www.eventbrite.co.uk/e/136411876595?aff=efbneb.

« Understanding (the Value of) Machine Translation ». s. d. Leiden University. https://www.universiteitleiden.nl/en/news/2020/05/understanding-the-value-of-machine-translation.

J’ai testé pour vous… Microsoft Translator

Par Ophélie Douchet, étudiante M1 TSM

De plus en plus de géants de l’informatique lancent leur propre moteur de traduction automatique, c’est pourquoi aujourd’hui je m’intéresse à l’application Microsoft Translator, disponible sur iOS et Android. Cette application, disponible au grand public, permet de traduire dans plus de 70 langues, mais la qualité de traduction est-elle vraiment au rendez-vous ? Sans plus tarder, découvrons ensemble ce qu’elle a à nous offrir.

INTERFACE

L’interface est très simple d’utilisation et minimaliste, elle dispose de quatre icônes, chacune proposant un mode de traduction : vocale, textuelle, en conversation instantanée et par la caméra. En arrière-plan, nous apercevons l’image floue d’un coucher de soleil aux couleurs apaisantes, invitant au voyage.

FONCTIONNALITÉS

  • Tout d’abord, en sélectionnant l’icône avec le clavier vous obtiendrez la traduction textuelle. Vous n’avez qu’à taper votre texte et l’application traduira dans la langue cible que vous aurez choisie parmi 91 langues.

J’ai donc voulu tester cette fonctionnalité en écrivant le titre d’un article paru dans The Scientific American (article américain) et voici le résultat :

Le titre An Immune Protein Could Prevent Severe COVID-19—if It Is Given at the Right Time a été traduit par : « Une protéine immunitaire pourrait prévenir covid-19 grave – si elle est donnée au bon moment. ».

Vous remarquerez que c’est une traduction très littérale qui a peu de sens. De plus, elle porte toujours les marques de l’anglais. On retrouve la présence du tiret cadratin, typique d’un titre anglais. Ce ne serait donc pas acceptable pour un titre d’article en français. En effet, cet article américain a une traduction officielle publiée sur le magazine français Pour la Science. Dans ce cas, le titre a été traduit par : « Une arme à double tranchant contre le Covid-19 ». Il est traduit de manière totalement différente et est plus court, ce qui est plus commun pour des articles français. De plus, comparé au titre américain qui révèle le sujet qui va être abordé, dans le titre français on laisse une sorte de suspens : une stratégie journalistique pour donner envie au lecteur de poursuivre sa lecture, ce que les moteurs de traduction automatique ne sont pas encore capables de faire.

Sans surprise, la différence entre la traduction professionnelle et la traduction automatique est donc flagrante ici.

Il me semble également important de préciser que l’application ne fait pas de différence entre l’anglais américain et l’anglais britannique. C’est pourquoi j’ai voulu tester si l’application était programmée pour traduire en anglais américain ou britannique. J’ai donc écrit la phrase suivante dans Microsoft Translator : « Son théâtre préféré se trouve dans le centre-ville. ». Ces mots s’écrivent différemment lorsqu’ils sont employés en anglais américain ou en anglais britannique. Je vous laisse alors découvrir avec quelle variété d’anglais l’application a traduit :

Cette phrase a donc été traduite en anglais britannique. En effet, le mot favourites’écrit favoriteen américain. Il en va de même pour theatre qui donnerait theater et centredonnerait center.

  • Ensuite, l’icône avec le micro permet d’activer la traduction vocale, il vous suffit de parler pour obtenir une traduction dans la langue cible choisie parmi 47 langues.

Les moteurs de traduction automatique sont connus pour reproduire les préjugés. C’est pourquoi j’ai voulu vérifier si cette application reproduisait les stéréotypes sexistes, comme l’a fait Margaux dans son billet de blog pour l’application « Traduire », disponible sur iPhone. J’ai donc repris le même exemple pour pouvoir comparer les deux applications :

Comme l’explique Estelle Peuvion dans son billet de blog, les métiers scientifiques sont directement associés aux hommes alors que les métiers de soins sont associés aux femmes, comme on le voit ici avec le mot “nurse” qui a été traduit par « infirmière ». Pour aller plus loin, j’ai clairement précisé que l’infirmier était un homme : “This nurse is a man”, mais l’application a traduit : « Cette infirmière est un homme ». Donc, comme l’application Traduire, Microsoft Translator reproduit les stéréotypes, prétendant que “nurse” est forcément une infirmière et non pas un infirmier.

  • L’icône avec l’appareil photo vous permettra de prendre en photo un texte pour que Microsoft Translator le traduise dans la langue cible de votre choix.

Pour cette fonctionnalité, j’ai donc pris en photo une annonce d’une maison à vendre en Angleterre et voici le résultat :

Je voulais tester si l’application était apte à localiser les prix et les unités de mesure. On peut observer que le prix en livre n’a pas été converti en euro et qu’il porte toujours les marques de l’anglais avec la virgule. Or, en français, il est préférable d’ajouter une espace insécable ou un point pour séparer les centaines des milliers. À l’inverse, les unités de mesure ont été localisées : “3.3 miles” : « 5.3 km ». On notera tout de même qu’en français on ne met pas de point, mais une virgule pour les unités de mesure, ce qui donnerait « 5,3 km ».

  • La dernière icône vous permettra de converser avec de tierces personnes ne parlant pas votre langue et disposant également de l’application. Pour cela, vous devez créer un salon de conversation et les personnes avec qui vous souhaitez discuter n’auront qu’à entrer un code dans l’application. Ainsi, vous pourrez parler en gardant votre langue maternelle et la tierce personne recevra votre message directement traduit dans sa langue.

Un carnet de phrases est également disponible. Il s’agit de phrases simples et courantes qui peuvent être très utiles lorsque l’on est dans un pays où nous ne connaissons pas la langue. Les phrases sont triées et ajoutées dans différentes catégories pour faciliter l’utilisation :

Ces phrases peuvent être prononcées par l’application en cliquant sur l’icône du son mais aussi être ajoutées en favoris grâce à l’étoile située sur la droite.

Microsoft Translator peut être utilisé hors connexion. Plutôt utile si vous êtes à l’autre bout du monde sans internet ! Pour cela, il vous faut télécharger les bases de données de la langue de votre choix, disponible dans les paramètres. Toutefois, je n’ai pas d’informations sur le corpus utilisé par ce moteur de traduction automatique.

Microsoft Translator est donc très utile pour « dépanner » lorsque vous ne connaissez pas la langue et que vous souhaitez communiquer ou lors d’un séjour à l’étranger. Cependant, pour un usage professionnel, nous avons vu que cette application commettait beaucoup d’erreurs. Microsoft Translator ne serait donc pas profitable pour des traducteurs.rices. À l’instar de tous les moteurs de traduction automatique, il faut rester vigilant sur la qualité de traduction proposée. Bien entendu, pour chaque traduction proposée il existe plusieurs solutions possibles.

Toutes les photos sont des captures d’écran de l’application mobile Microsoft Translator.

App Store. « ‎Microsoft Translator ». https://apps.apple.com/fr/app/microsoft-translator/id1018949559.

Landhuis, Esther. « An Immune Protein Could Prevent Severe COVID-19—If It Is Given at the Right Time ». Scientific American. https://www.scientificamerican.com/article/an-immune-protein-could-prevent-severe-covid-19-if-it-is-given-at-the-right-time1/.

laujan. « Service Microsoft Translator – Azure Cognitive Services ». https://docs.microsoft.com/fr-fr/azure/cognitive-services/translator/translator-info-overview.

Mackowiak, Margaux. « J’ai testé pour vous… Traduire, la nouvelle application de traduction d’Apple » MasterTSM@Lille, 3 janvier 2021. https://mastertsmlille.wordpress.com/2021/01/03/jai-teste-pour-vous-traduire-la-nouvelle-application-de-traduction-dapple/.

Microsoft Translator for Consumers. « Microsoft Translator ». https://www.microsoft.com/en-us/translator/.

Microsoft Translator pour les consommateurs. « Fonctionnalités de l’application-Microsoft Translator ». https://www.microsoft.com/fr-fr/translator/apps/features/.

Peuvion, Estelle. « Traduction automatique : les algorithmes ont-ils des préjugés ? » MasterTSM@Lille, 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/.

« Une arme à double tranchant contre le Covid-19 », Pour la Science. https://www.pourlascience.fr/sr/actualites/une-arme-a-double-tranchant-contre-le-covid-19-20150.php.

La traduction automatique, mère des activités TAL

Par Louison Douet, étudiante M1 TSM

Le lien entre la traduction et les activités du TAL, ou de l’espionnage des Russes pendant la Guerre Froide à Siri, Alexa et DeepL. Si, vraiment. J’ai sauté de nombreuses étapes mais c’est bien ça dans les grandes lignes. Laissez-moi vous présenter le TAL ou Traitement Automatique des Langues.

Les débuts de la TA – Le TAL hier

Cette discipline impliquant la linguistique, l’informatique et l’intelligence artificielle est bel et bien née des besoins de traductions pendant la Guerre Froide, et si son usage premier a été le développement de technologies de traduction automatique (TA) assez performantes pour décoder les messages des Russes, son emploi est maintenant beaucoup plus diversifié.

Mais revenons au tout début : après la naissance de l’informatique, les premiers pas dans la recherche en Traduction Automatique se font par Yehoshua Bar-Hillel au Massachussets Institute of Technology (MIT) en 1952, suivis deux ans plus tard de la première expérience du russe vers l’anglais. Le TAL vise alors le traitement automatique des conversations et n’a pour but que le déchiffrage du russe. L’engouement pour ces nouvelles disciplines est mondial, des conférences et des associations sont créées tout au long du reste de la décennie comme l’ATALA en France (Association pour l’étude et le développement de la Traduction).

Le déclin est toutefois inévitable dans les années 60 lorsque le rapport ALPAC (Automatic Language Processing Advisory Committee) constatant l’écart entre les résultats attendus et ceux obtenus entraine l’arrêt des financements et l’abandon des recherches. C’est pourtant pendant cette période que le TAL obtient l’une de ses premières victoires avec l’automate conversationnel ELIZA qui parvient à duper un humain. Des groupes ont malgré tout persisté et leur succès a porté le regain d’intérêt tout en ouvrant la voie vers l’ampleur que l’on connaît actuellement. On trouve parmi eux Systran, l’une des plus anciennes entreprises en TA, créée en 1968 par Peter Toma, en collaboration avec l’US Air Force et la NASA et bénéficiant de financement par la Communauté européenne, elle est à l’origine du premier logiciel de traduction du russe vers l’anglais.

Et maintenant ? Le TAL aujourd’hui

La démocratisation d’Internet et du web au début des années 90 marque la renaissance complète de la traduction automatique. Pour faire simple, l’accès du grand public, majoritairement non-anglophone, relance les besoins de déchiffrage d’une langue vers l’autre. Ce changement d’emploi de la TA implique également une diversification de celui des activités du TAL qui cherche maintenant à transformer les formes linguistiques en objets informatiques en créant des outils de traitement de la langue naturelle, soit l’intégration aux machines du langage humain. Et si ses domaines d’application ne sont plus simplement centrés sur la traduction, elle reste son utilisation principale et la plus connue, notamment sous la forme de moteurs en ligne tel que Google Traduction et DeepL.

Pourtant, le TAL est un domaine bien plus répandu qu’on pourrait le croire. Il concerne et s’applique à de nombreuses disciplines diverses et variées, recouvrant évidemment l’intelligence artificielle et l’informatique, mais aussi la linguistique, la communication ou les sciences sociales. Vous ne vous en doutez sûrement pas, mais ses applications sont partout dans notre quotidien moderne, car le TAL est derrière la reconnaissance vocale présente dans la plupart des appareils numériques comme les téléphones, tablettes, ordinateurs ou encore enceintes connectées. Oui, je vous l’avais annoncé, c’est bien ce qui se cache derrière Siri et Alexa. Dans ces cas-là, il permet aux appareils d’opérer la synthèse vocale pour le traitement de l’oral afin de retranscrire le parler en une requête compréhensible mais aussi de nous répondre grâce à une voix synthétique.
On le retrouve également derrière les chatbots qui assurent une assistance robotique, ainsi que dans la correction orthographique automatique ou les générateurs de textes déchiffrant l’écriture manuscrite et la dictée et ceux capables de créer des textes sur la base d’un corpus.

Le futur de ces technologies – Le TAL demain

L’amélioration constante due à la part toujours plus importante de l’informatique dans nos vies a fait de la traduction automatique un outil des plus intéressant et a permis l’augmentation des domaines d’applications du TAL. Pourtant, tous ces progrès et avancées, comme la traduction automatique neuronale, n’ont toujours pas atteint les objectifs premiers d’imitation de l’humain, si bien que l’automatisation des activités langagières « intelligentes » n’est pas pour autant gagnée. En clair, il y a encore beaucoup de chemin à faire avant que la TA et le TAL atteignent un niveau semblable à celui d’un humain. Et ce, malgré les efforts joints de nombreux professionnels spécialistes des langues, de l’informatique et de l’humain qui collaborent pour élaborer des modèles toujours plus performants.

Cette problématique et cette collaboration ont donné naissance à la post-édition, nouvelle activité dans le secteur de la traduction, qui loin de représenter une concurrence, est une véritable spécialisation nécessitant une très bonne maîtrise de la traduction ainsi que des connaissances des technologies du TAL. À l’heure actuelle, l’intervention humaine reste absolument nécessaire en préparation ou en révision afin d’obtenir un rendu à la qualité au moins égale à l’humain, et ce tout particulièrement pour la traduction automatique car bien qu’elle soit à l’origine du TAL, elle n’est toujours pas assez perfectionnée et présente encore un certain nombre de problèmes

Bibliographie

Chaumartin, François-Régis, et Pirmin Lemberger. Le traitement automatique des Langues : Comprendre les textes grâce à l’intelligence artificielle. Dunod, 2020, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/catalog/book/88882034.

Delafosse, Lionel.Traitement Automatique des Langues. [en ligne] https://ldelafosse.pagesperso-orange.fr/Glossaire/Tal.htm. Consulté le 4 mars 2021.

Fabien, Maël. « Traitement Automatique du Langage Naturel en français (TAL / NLP) ». Stat4decision, 3 novembre 2019, [en ligne] https://www.stat4decision.com/fr/traitement-langage-naturel-francais-tal-nlp/.

Gilloux, Michel. « Traitement automatique des langues naturelles ». Annales Des Télécommunications, vol. 44, no 5, mai 1989, p. 301‑16. Springer Link, doi:10.1007/BF02995675.

Introduction au TAL – Cours_de_TAL. [en ligne] https://sites.google.com/site/coursdetal/introduction-au-tal. Consulté le 1 mars 2021.

Léon, Jacqueline. « Conceptions du “mot” et débuts de la traduction automatique ». Histoire Épistémologie Langage, vol. 23, no 1, Persée – Portail des revues scientifiques en SHS, 2001, p. 81‑106. http://www.persee.fr, doi:10.3406/hel.2001.2819.

L’Homme, Marie-Claude, et Sylvie Vandaele. Lexicographie et terminologie : Compatibilité des modèles et des méthodes. Presses de l’Université d’Ottawa, 2007, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/book/88867985.

Moreh, Jack. Back to school – Study concept, 14 septembre 2015. [Illustration]. Back to school – Study concept – Free Stock Photo by Jack Moreh on Stockvault.net

Poibeau, Thierry. « Le traitement automatique des langues pour les sciences sociales ». Reseaux, vol. n° 188, no 6, La Découverte, 2014, p. 25‑51.

Quirion, Jean. Dans tous les sens du terme. Presses de l’Université d’Ottawa, 2013, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/book/88820249.

« TRAITEMENT AUTOMATIQUE DES LANGUES ». Encyclopædia Universalis, [en ligne] https://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/. Consulté le 27 février 2021.

Yvon, François. Une petite introduction au Traitement Automatique.pdf. https://perso.limsi.fr/anne/coursM2R/intro.pdf. Consulté le 27 février 2021.

Traduction automatique : faire les bons choix avant de commencer

Par Élise Ventre, étudiante M2 TSM

La traduction automatique devient un outil incontournable du marché. Il existe beaucoup de documentation à son sujet. Elle est parfois présentée comme l’avenir de la traduction. On peut même trouver des articles qui comparent les différents outils. Mais avant de l’utiliser, faisons un tour d’horizon des éléments à prendre en compte avant de décider si elle sera, ou non, adaptée à un projet.

Collaboration entre l’humain et la machine

Quand on parle de traduction automatique, il ne s’agit pas de laisser la machine travailler seule. On ne va pas rentrer du texte dans un moteur de traduction automatique et livrer tel quel ce qui en sort. C’est un outil d’aide à la traduction, parmi tant d’autres (logiciels de TAO, dictionnaires ou corpus), que l’on peut décider d’intégrer à notre processus de traduction.

Ainsi, en associant traduction automatique et les logiciels de TAO, on obtiendra une traduction de meilleure qualité en bénéficiant des remontées des mémoires de traduction. Ensuite, les phrases qui ne peuvent pas en bénéficier seront traduites par un moteur de traduction automatique. Celles-ci seront enfin relues et retravaillées au besoin.

Type de texte à traduire

C’est loin d’être un scoop, mais il s’agit quand même d’un élément important à prendre en compte. Les outils de traduction automatique, gratuits ou payants, génériques ou spécifiques, ne conviennent pas à tous les types de textes. On évitera notamment de l’utiliser pour les contenus marketing. En effet, le transfert linguistique et la compréhension du texte ne seront pas le seul objectif : il faudra également faire preuve de créativité, et c’est là que la machine risque de ne pas être adaptée.

Besoins du client

Autre élément à prendre en compte : l’utilisation finale du contenu à traduire. En effet, une traduction doit être « fit-for-purpose », c’est-à-dire adaptée à son utilisation. Prenons l’exemple de la notice explicative d’un aspirateur. On ne va pas la traduire de la même manière si l’on n’a seulement besoin de donner une petite idée de la manière dont il faut l’utiliser ou s’il faut une explication précise du montage de l’appareil pour quelqu’un qui le réparera.

Les délais et budgets ont également leur importance. Puisque la traduction automatique peut fournir une traduction plus rapidement, alors elle peut être la solution pour un projet avec des délais courts. Il en va de même lorsque le budget est peu élevé, car la traduction automatique sera vendue à un prix inférieur à celui de la traduction humaine.

La qualité demandée, bien sûr, doit être prise en compte. Cet élément permet de déterminer si l’utilisation de la traduction automatique permet d’atteindre le niveau de qualité requis, ainsi que le type de post-édition à effectuer. Pour rappel, la post-édition consiste en la relecture et, lorsque cela est nécessaire, la correction de la traduction produite par la machine. Le plus souvent, trois types de post-édition sont proposés : légère, moyenne et complète. Les critères de qualité, le temps de travail, et le budget aideront à déterminer le type de post-édition le plus adapté à un projet.

Besoins du post-éditeur

Cet aspect concerne autant les gestionnaires de projet que les traducteurs indépendants. Ces deniers ne doivent pas hésiter à communiquer à ce sujet avec leur gestionnaire de projet ou client. C’est surtout la productivité, l’outil et la qualité qui ont de l’importance.

La productivité attendue ne correspond pas toujours aux capacités des post-éditeurs. Si la productivité est définie en fonction de critères génériques, il est grandement possible de faire erreur. Lorsque l’on n’arrive pas à atteindre les objectifs de productivité définis, on peut ressentir de la frustration. Il est plus agréable d’être appelé pour tester un outil sur un échantillon du projet afin d’obtenir la meilleure évaluation de la productivité possible.

L’outil de traduction automatique est, la plupart du temps, choisi par l’agence ou le client. Les post-éditeurs ont tendance à préférer utiliser un outil intégré à leur environnement de travail, encore une fois en raison de la productivité. C’est pourquoi il faut veiller à pouvoir utiliser un moteur intégrable dans les outils de TAO.

La qualité attendue pose également un souci. En général, si l’on a recours à la traduction automatique, c’est que les délais et le budget ont la priorité par rapport à la qualité. Encore une fois, cet aspect peut être frustrant pour les post-éditeurs, qui ont à cœur de rendre un travail de la meilleure qualité possible. De plus, la qualité de leur travail est leur image de marque, c’est pourquoi il peut être difficile de livrer un travail à la qualité amoindrie comparée à ce que l’on est capable de produire.

Choix de l’outil

Quand on parle de traduction automatique, il ne s’agit pas d’un seul outil. En effet, ces moteurs ne sont que des algorithmes. Il faut ensuite les entraîner en y incorporant le type de contenu adapté afin d’obtenir les meilleurs résultats possibles. C’est pourquoi il est important de se rendre compte que le meilleur outil de traduction automatique, c’est celui qui est le plus adapté au contenu à traduire. Par exemple, on n’utilisera pas un moteur entraîné avec des textes de loi pour traduire du contenu technique.

L’efficacité d’un moteur dépend du contenu à traduire, mais aussi de la langue. Un outil peut produire de très bons résultats pour une paire de langues, mais beaucoup moins bons pour une autre. Pour un même texte, la traduction automatique vers deux langues différentes peut énormément varier en qualité, et en fonction de la langue cible, la productivité pourrait être grandement différente. C’est une des raisons pour lesquelles faire appel aux post-éditeurs pour tester les outils a vraiment son importance.

La confidentialité du contenu à traduire ne doit pas être négligée. Il faut bien se rendre compte que les outils en ligne, surtout lorsqu’ils sont gratuits, peuvent présenter des risques. En effet, les phrases entrées dans ces moteurs peuvent être enregistrées, risquant de compromettre les données du client. Avant d’utiliser ces outils, prenez garde à ce qui est mentionné concernant la confidentialité.

La productivité reste un élément central dans le choix d’utilisation de l’outil. En effet, s’il y a trop d’éléments à modifier dans les traductions proposées par la machine, alors on ne gagnera pas en productivité. Ce ne sera peut-être pas la peine de s’embarrasser à en utiliser.

Attention à son utilisation finale

La traduction automatique peut présenter des risques. Si l’on décide de traduire des textes juridiques avec de la traduction automatique, alors il faudra bien prendre garde au niveau de post-édition qui sera effectué par la suite. Par exemple, si la traduction est utilisée comme élément dans une affaire judiciaire, alors une seule petite erreur peut peser lourd dans la balance.

De même, lorsqu’il s’agit de textes médicaux, la post-édition peut présenter des risques importants. Un glissement de sens peut avoir de très fortes répercussions. Ainsi, si l’on souhaite utiliser la traduction automatique, il faudra faire énormément attention à l’outil utilisé, ainsi qu’à la post-édition requise.

Importance de l’avis des post-éditeurs

Tous les éléments précédemment énoncés présentent clairement l’intérêt de mêler les post-éditeurs à toutes les phases d’un projet. En tant que spécialistes de la langue, ils auront un avis éclairé sur les meilleurs outils à utiliser pour avoir une bonne productivité et pouvoir rendre un travail au niveau de qualité demandée.

Sources

Bouillon, Pierrette, et al. Integrating MT at Swiss Post’s Language Service: preliminary results. In: Proceedings of the 21st Annual Conference of the European Association for Machine Translation. 2018. p. 281-286

Nunes Vieira, Lucas, et. al. (2019): Translating perceptions and managing expectations: an analysis of management and production perspectives on machine translation, Perspectives, DOI: 10.1080/0907676X.2019.1646776

Nunes Vieira, Lucas, et. al. (2020): Understanding the societal impacts of machine translation: a critical review of the literature on medical and legal use cases, Information, Communication & Society, DOI: 10.1080/1369118X.2020.1776370

Mion, Enrico Antonio. (2020). 9 questions à poser avant d’accepter un projet de post-édition. Traduction augmentée. https://fr.eamtranslations.com/post/9-questions-à-poser-avant-d-accepter-un-projet-de-post-édition

Robert, Anne-Marie. (2013). « Vous avez dit post-éditrice ? Quelques éléments d’un parcours personnel. » The Journal of Specialised Translation Issue 19 – July 2013 <http://www.jostrans.org/issue19/art_robert.pdf&gt;

Van der Vorst, Sarah (2020). Le post-éditeur, un nouveau maillon fort du projet de traduction [Conférence]. #TQ2020 | Traduction & Qualité : Biotraduction et Traduction automatique, Université de Lille : UFR Langues Étrangères Appliquées & Laboratoire « Savoirs, Textes, Langage » du CNRS. https://webtv.univ-lille.fr/video/10748/session-2-traduction-automatique-et-metiers-de-la-traduction

J’ai testé pour vous… Traduire, la nouvelle application de traduction d’Apple

Par Margaux Mackowiak, étudiante M2 TSM

Que vous possédiez un iPhone ou non, vous aurez peut-être entendu parler de la nouvelle application de traduction développée par Apple : Apple Translate, ou tout simplement nommée Traduire en français. L’app (nom donné par la marque à la pomme à ses applications) a été introduite avec la version iOS 14 annoncée en juin dernier lors de la WWDC 2020, à savoir la conférence mondiale des développeurs Apple, et installée automatiquement en effectuant la mise à jour iOS 14 depuis septembre. Parmi l’ensemble des moteurs de traduction automatique déjà présents sur le marché, l’app Traduire a-t-elle les atouts nécessaires pour leur faire concurrence ? C’est l’enquête que j’ai décidé de mener pour vous dans ce billet.

Prise en main et ergonomie

Lors du premier lancement de l’app, vous pourrez suivre un tutoriel vous indiquant de façon claire et simple les différentes fonctionnalités de l’outil de traduction et la manière de l’utiliser.

D’un point de vue ergonomique, l’interface est fluide et épurée, les couleurs sont neutres et agréables et s’adaptent en fonction du mode clair ou sombre paramétré dans les réglages de votre appareil. L’outil est simple d’utilisation, seuls quelques boutons sont présents à l’écran et leur utilité est rapidement identifiable, notamment après avoir lu le tutoriel. Sur ce point, nous pouvons admettre que l’interface est ergonomique.

Fonctionnalités

Nous avons le choix parmi 11 langues sources et cibles disponibles, et une supplémentaire selon la région géographique : l’allemand, l’anglais (des États-Unis ou du Royaume-Uni), l’arabe, le chinois (mandarin simplifié), le coréen, l’espagnol (d’Espagne), le français (de France), l’italien (d’Italie), le japonais, le portugais (du Brésil), ainsi que le russe.

Ce nombre est conséquent puisque, par comparaison, le moteur de traduction automatique à base de réseaux neuronaux DeepL ne propose qu’une variante géographique de plus. En incluant l’anglais britannique et l’anglais américain, nous arrivons ainsi à 130 combinaisons de paires de langues possibles pour Traduire.

De plus, l’outil d’Apple propose non seulement un système de traduction textuel, mais aussi vocal.

Qualité de traduction

Pour évaluer la qualité de Traduire, je vais comparer les traductions proposées par l’outil avec celles de DeepL et de Google Traduction et je vais le tester sur les problèmes récurrents rencontrés lors de l’utilisation des autres moteurs de traduction automatique.

Pour commencer, j’ai choisi un extrait du tutoriel officiel d’Apple en anglais, How to use Translate on your iPhone. Voici la traduction proposée par Traduire :

Traduire a donc traduit “When you download a language to use offline, it might take up space on your iPhone. You can remove a downloaded language whenever you want.” par « Lorsque vous téléchargez une langue pour utiliser hors ligne, cela pourrait prendre de la place sur votre iPhone. Vous pouvez supprimer une langue téléchargée quand vous le souhaitez. » Or, la version française de ce passage sur la page du tutoriel d’Apple en français est : « Le téléchargement d’une langue hors ligne peut occuper de l’espace sur votre iPhone. Vous pouvez à tout moment supprimer une langue téléchargée. »

On observe ainsi que la traduction de Traduire est compréhensible, certes, mais très littérale. L’app nous offre une traduction mot à mot, ce qui ne ferait pas l’affaire dans un texte officiel.

Pour tester l’outil sur la traduction de titres d’articles, j’en ai sélectionné un sur un sujet on ne peut plus d’actualité : celui de la Covid-19.

Ainsi, pour Coronavirus: UK ‘remains in containment phase’ – Johnson, l’app Traduire le traduit en français par Coronavirus : UK « reste en phase de confinement » – Johnson. On voit donc que l’outil n’a pas traduit ‘UK’ par ‘Le Royaume-Uni’, comme le font DeepL et Google Traduction. En français, il est aussi coutume d’ajouter le prénom et de ne pas uniquement nommer une personnalité par son nom de famille, ce que les moteurs de traduction automatique ne prennent pas encore en compte.

Ensuite, j’ai voulu vérifier si l’outil saurait localiser des éléments propres à différents pays. Pour ce faire, j’ai choisi un extrait de mode d’emploi d’un trotteur pour bébé. Voici la traduction d’une phrase tirée de la partie information des consommateurs :

Traduire a donc traduit “Call Consumer Relations 8 AM – 6 PM EST Monday through Friday.” par « Appelez Relations avec les consommateurs de 8 h à 18 h HNE du lundi au vendredi ». Pour cette même phrase, DeepL et Google Traduction proposent « Appelez le service des relations avec les consommateurs de 8 h à 18 h HNE du lundi au vendredi. »

L’app d’Apple a traité ‘Consumer Relations’ comme un nom propre, contrairement aux deux autres moteurs qui l’ont correctement traduit. En outre, les trois outils ont traduit EST (Eastern Standard Time) par HNE (heure normale de l’Est), mais n’ont pas localisé les chiffres en UTC+1, l’heure locale.

Voyons à présent ce qu’il en est des préjugés. Les moteurs de traduction automatique sont connus pour contenir des algorithmes qui reproduisent des stéréotypes racistes ou sexistes provenant des humains, comme en témoigne le billet de blog d’Estelle Peuvion de novembre 2019.

Qu’en est-il du cas de Traduire ? Pour le savoir, j’ai choisi deux métiers du corps hospitalier, à savoir les termes infirmier/infirmière et chirurgien/chirurgienne. Découvrons comment se comporte Traduire avec ces mots.

Si je saisis le texte suivant : “The nurse entered the room. He gave me my medicine.”, Traduire propose « L’infirmière est entrée dans la chambre. Il m’a donné mes médicaments. »

En plus de traduire ‘nurse’ par ‘infirmière’ par défaut, l’outil ne corrige pas le genre alors même que j’ai précisé qu’il s’agissait d’un homme dans la phrase suivante. DeepL et Google Traduction reproduisent la même erreur.

Dans l’exemple suivant, Traduire traduit “The surgeon asked her colleague to give her a scalpel.” par « Le chirurgien a demandé à sa collègue de lui donner un scalpel. »

Là encore, le genre n’est pas inconnu puisque j’ai indiqué à deux reprises qu’il s’agissait d’une femme. Toutefois, la machine considère que le spécialiste est un homme et que le collègue est une femme. Google Traduction propose la même solution, tandis que pour DeepL, les deux protagonistes sont des hommes.

Il est donc clair que l’ensemble des moteurs de traduction automatique reproduisent des clichés, et que, depuis l’article d’Estelle Peuvion mentionné précédemment, la situation n’a pas réellement évolué.

Pour terminer, j’ai choisi un exemple simple en me mettant à la place d’une touriste qui désire prendre un repas dans un restaurant.

Ici, la machine nous propose un faux sens. En retraduisant vers le français, le texte obtenu signifierait : « Bonjour, voudriez-vous savoir si vous mangez encore ? », ce qui est loin de notre texte source d’origine. La traduction correcte en anglais aurait été “Hello, I would like to know if you are still serving food?”. On constate que l’outil peut donc commettre des erreurs, même pour des questions simples que n’importe quel individu pourrait poser lors d’un séjour à l’étranger.

J’ai ici mis en exergue des erreurs qu’a commises la machine lorsque je l’ai testée, mais évidemment, cela n’arrive pas pour chaque phrase entrée par l’utilisateur. L’outil peut proposer des traductions correctes, toutefois, il est important de soulever les erreurs qu’il est susceptible de commettre pour savoir dans quelle mesure l’utiliser.

Aspects positifs et négatifs

S’offre à nous la possibilité de consulter l’historique récent de nos recherches en balayant l’écran vers le bas, ainsi que d’ajouter des traductions en favori qui seront enregistrées dans l’onglet Favorites en cliquant sur l’étoile.

Un dictionnaire est également intégré et accessible en touchant l’icône associée ou en appuyant directement sur un mot de la traduction proposée.

En outre, nous avons l’option de télécharger les langues que nous souhaitons pour pouvoir les utiliser en mode hors ligne, lors d’une absence de connexion Internet.

Lorsque le téléphone est incliné en mode paysage, l’outil permet de traduire des mots prononcés oralement en appuyant sur l’icône du micro. Si l’option de détection automatique est activée au préalable, l’outil reconnaîtra la langue parmi les deux sélectionnées et une voix lira automatiquement la traduction. Celle-ci pourra être réécoutée en appuyant sur l’icône de lecture (le symbole du triangle). L’icône de flèches en sens opposé permet, quant à elle, d’afficher la traduction proposée par l’outil en grands caractères blancs sur fond bleu.

Néanmoins, l’insertion de texte se fait uniquement en mode portrait, l’utilisation du micro étant requise en mode paysage.

L’app est gratuite mais uniquement accessible aux utilisateurs d’Apple propriétaires d’un iPhone avec la version iOS 14 ou une version ultérieure, elle ne détecte pas automatiquement les langues, et il se peut qu’elle commette des erreurs de traduction majeures.

Conclusion

Traduire s’avère particulièrement utile pour les personnes possédant un iPhone. À portée de main, cette application intégrée au smartphone permet de communiquer assez facilement dans une langue qu’on ne maîtrise guère, en voyage à l’étranger ou tout simplement en complément lorsqu’on désire en apprendre une nouvelle, et cela est d’autant plus vrai grâce au micro intégré. L’app est épurée, facile d’accès et simple d’utilisation.

Cependant, il faut se méfier des erreurs types des moteurs de traduction automatique, telles que la reproduction des stéréotypes, les contresens ou encore la non-traduction. Nous avons également vu que l’app peut fournir des traductions erronées, même pour des phrases simples.

Pour pouvoir être utilisée pour de la post-édition comme DeepL Pro par exemple, il faudrait que l’app soit disponible sur MacBook, ce qui n’est pas (encore) le cas, et qu’elle s’améliore sur les aspects négatifs mentionnés tout au long de cette analyse.

Évidemment, ce billet est basé en grande partie sur mon avis et mon expérience en tant qu’utilisatrice de l’application et étudiante en traduction. Des études seraient nécessaires pour mesurer le taux d’erreurs de l’outil et il faudrait les comparer avec celles réalisées jusqu’à présent pour les autres moteurs de traduction automatique. Il s’agit d’une application prometteuse, utile pour les particuliers, mais qui est pour l’instant loin d’être suffisante pour les professionnels de la traduction dans un contexte de post-édition. L’app Traduire ayant été introduite récemment, gardons toutefois à l’œil ce qu’Apple lui réserve, d’autant plus que peu d’éléments sont dévoilés à son sujet, comme le type de corpus qui la constitue et son degré de confidentialité.

Les images de ce billet sont des captures d’écran réalisées par mes soins via l’application pour iPhone ‘Traduire’, propriété d’Apple.

Sources :

App Store. « ‎Traduire ». https://apps.apple.com/fr/app/traduire/id1514844618

Apple Support. « How to Use Translate on Your IPhone », 16 septembre 2020. https://support.apple.com/en-us/HT211671

Apple Support. « Traduire du texte et des voix sur l’iPhone ». https://support.apple.com/fr-fr/guide/iphone/iphd74cb450f/ios

Apple Support. « Utiliser Traduire sur votre iPhone », 29 octobre 2020. https://support.apple.com/fr-fr/HT211671

« Containment Phase “Unlikely to Work on Its Own” ». BBC News, 9 mars 2020. https://www.bbc.com/news/av/uk-51809498

Innocente, Florian. « iOS 14 : « Traduire », l’app d’Apple pour les vacances à l’étranger ». iGeneration, 27 juin 2020. https://www.igen.fr/ios/2020/06/ios-14-une-app-traduire-pour-les-francais-mauvais-en-langues-etrangeres-115921

« Instruction d’utilisation Fisher-Price STRIDE-TO-RIDE WALKER 73499 ». Manualsbase.com. https://www.manualsbase.com/fr/manual/640474/baby_walker/fisher-price/stride-to-ride_walker_73499/

Loock, Rudy. Cours de recherche en traduction automatique dispensé en Master 2 de Traduction spécialisée multilingue à l’Université de Lille.

Peuvion, Estelle. « Traduction automatique : les algorithmes ont-ils des préjugés ? » MasterTSM@Lille (blog), 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/

Turcan, Marie. « iOS 14 est disponible : voici toutes les nouveautés sur votre iPhone ». Numerama, 17 septembre 2020. https://www.numerama.com/tech/632269-ios-14-toutes-les-nouveautes-a-venir-sur-iphone.html

Van der Vorst, Sarah et Pacinella, Quentin. Cours de traduction automatique et post-édition dispensé en Master 2 de Traduction spécialisée multilingue à l’Université de Lille.

Traduction automatique : nouvelle alliée des étudiants en traduction ?

Par Marisa Dos Santos, étudiante M2 TSM

Bien que son utilisation, ou non, reste un choix personnel, on ne peut plus nier aujourd’hui l’utilité de la traduction automatique pour les traducteurs. De plus en plus présente, on sait qu’elle inquiète certains professionnels du marché, mais également les futurs diplômés en traduction. Quel étudiant (ou professionnel d’ailleurs) n’a jamais entendu une fois dans sa vie quelqu’un lui dire « Ah oui mais tu sais, dans dix-quinze ans tu n’auras plus de travail… Je le sais moi, j’ai utilisé Google traduction la semaine dernière, c’est top ce truc, ça marche super bien ! » ? Premièrement, pas d’inquiétude : si l’on écoutait tous les détracteurs du métier, la traduction automatique aurait dû nous évincer il y a déjà de ça 50 ans.

Ensuite, le métier de traducteur, eh bien oui, il évolue comme bien d’autres métiers. Et surprise : lui aussi doit s’adapter aux avancées technologiques. Alors, depuis quelques années, un nouveau nom de métier est apparu et commence tout doucement à faire son nid : celui du post-éditeur. L’apparition de ce genre de nouveaux métiers demande au traducteur d’être constamment à l’affut des nouveautés et des actualités du marché. Mais alors, qu’en est-il des étudiants en traduction ? Peuvent-ils réellement atteindre ce principe de « MT literacy » selon lequel un universitaire devrait, entre autres, savoir dans quel contexte utiliser ou non la traduction automatique, pratiquer correctement la pré-édition afin que la traduction machine soit de meilleure qualité ou encore post-éditer efficacement les productions de la traduction automatique afin que le texte final soit de qualité optimale ?

Les chiffres clés de la traduction automatique

La traduction automatique a fait son apparition sur le marché du grand public dans les années 1980 sous la forme de traduction automatique à base de règles. Rapidement, l’intérêt pour cette nouvelle technologie s’est développé et de grandes avancées ont été accomplies, pour arriver au lancement de la traduction statistique dans les années 2000. Cette technologie fonctionnait déjà bien mieux que la précédente, mais est arrivée en 2015 la fameuse traduction automatique neuronale, celle qui a bouleversé le marché et qui effraie ou fascine tant de personnes.

En effet, ce nouveau modèle de traduction utilise des réseaux neuronaux pour produire des traductions très similaires aux traductions humaines. Décriée par certain, adulée par d’autres, elle est au centre du débat traductologique ces dernières années. Elle occupe une place de plus en plus importante dans le marché du travail, et ce n’est pas près de s’arrêter. En effet, d’après l’enquête European Language Industry Survey menée en 2020, 78 % des sociétés de services linguistiques participant à ladite enquête prévoient de commencer ou d’augmenter l’utilisation de la traduction automatique et de la post-édition au sein de leur structure. Alors pour beaucoup de professeurs, il est impératif que les étudiants en traduction soient formés à ces nouvelles disciplines afin de ne pas se retrouver perdus une fois dans le marché.

Qu’en pensent donc les étudiants ?

De nombreux chercheurs se sont penchés sur les capacités de post-édition d’étudiants n’ayant jamais pratiqué la matière ou à qui elle n’avait jamais été enseignée, ainsi que sur leurs ressentis face à cette nouvelle tâche. Leur but était de savoir comment enseigner la traduction automatique et en conséquence, la post-édition, et de comprendre si ces deux disciplines représenteraient une réelle aide, voire un réel atout, pour eux. Pour ce faire, nombre d’entre eux ont alors demandé à leurs étudiants de post-éditer un texte et ont ainsi analysé différents paramètres. Certains élèves ont été amenés à répondre à des questionnaires pré-test, et généralement, les résultats étaient plutôt similaires.

Les étudiants qui prenaient part aux études estimaient généralement qu’ils ne se sentaient pas capables d’utiliser correctement la traduction automatique et de produire une post-édition convenable. Toutefois, en général, les étudiants ont jugé que la traduction automatique et la post-édition pouvaient leur permettre d’améliorer leur productivité bien qu’ils y voient des risques, qu’ils en aient peur ou qu’ils ne sachent pas l’utiliser. Ces résultats antérieurs aux tests prouvent que la traduction automatique et la post-édition font encore débat, même chez les étudiants et qu’il serait utile de lever leurs doutes lors de la formation universitaire.

Évaluation des besoins des étudiants

C’est exactement ce sur quoi se sont penchés plusieurs professeurs-chercheurs. Leur but : comprendre comment enseigner la traduction automatique et la post-édition afin que son enseignement soit vu comme une compétence à maîtriser plutôt que comme un simple outil technologique à appréhender. Alors certains professionnels, comme Sandrine Peraldi, ont mis en place des ateliers lors desquels les étudiants de master ont tenté d’évaluer les taux de réussite de plusieurs traducteurs automatiques afin de la proposer à un véritable client. Au travers de cette expérience, ils ont pu, entre autres, découvrir l’activité de post-édition et, grâce à quantification et classification des erreurs de la traduction automatique, d’évaluer les efforts cognitifs que leur demandait cette tâche. Ils ont ainsi réussi à proposer une solution de post-édition à leur client avec de véritables résultats.

Aussi, pour connaître les besoins des étudiants, d’autres professeurs ont adopté un mode de fonctionnement différent : ils ont tenté de voir si les étudiants arrivaient à reconnaître correctement les erreurs de la traduction automatique et comment les corrigeaient-ils. La plupart des résultats concordaient : les étudiants n’avaient, généralement, pas de mal à reconnaître les erreurs de syntaxe ou les erreurs très évidentes que produisait l’outil de traduction automatique, mais avaient quelques difficultés à reconnaître certaines erreurs typiques de la traduction automatique comme les calques et contre-sens, notamment avec les faux-amis.

Erreurs de correction

Pourquoi cela ? Eh bien, il y a diverses explications. Pour certains, c’est parce qu’ils font trop confiance à la machine, et ont donc tendance à laisser passer certaines erreurs. Cette confiance excessive les amène même à effectuer moins de modifications lors d’une post-édition que lors de la révision de leurs propres traductions. D’autres ont observé que les erreurs de la traduction neuronale étaient certes, moins nombreuses que celles de la statistique, mais plus dures à corriger et à repérer puisque très similaires aux erreurs humaines et étaient généralement les mêmes que faisaient naturellement les étudiants dans leurs traductions, à savoir les faux et contre-sens : elles passent donc souvent à la trappe. Pour d’autres, cela pouvait aussi être dû au fait que les étudiants se sentaient facilement débordés par la quantité d’information à traiter lors de cet exercice et ajoutaient même parfois des erreurs au texte. Lié à ce manque de concentration, plusieurs études ont révélé que lors d’une post-édition, le traducteur passera moins de temps à lire et à observer le texte source que lors d’une traduction humaine, alors même que dans le cas d’une post-édition complète, il faut autant prêter attention au texte source que pour une traduction sans traducteur automatique. Généralement, les étudiants ayant pris part à une expérience d’eye-tracking ont passé deux fois plus de temps à regarder le texte cible lors d’une post-édition que lors d’une traduction humaine.

Pour conclure, dans l’étude de Masaru Yamada de 2019, il a été démontré que même avec la traduction automatique neuronale, les étudiants ne réussissaient pas à atteindre le taux de 85 % d’erreurs corrigées demandé pour atteindre les standards de qualité professionnels.

Tous ces résultats prouvent qu’il est nécessaire pour les étudiants de connaître à l’avance quelles sont les erreurs les plus communes que produisent les outils de traduction automatique, qu’elle soit neuronale ou statistique, afin de correctement les repérer, les corriger plus facilement et être aptes à maîtriser et utiliser ces outils individuellement ou en modèle hybride. C’est donc un point que plusieurs chercheurs proposent d’aborder dans l’enseignement de ces disciplines.

Effort cognitif et retour des étudiants

Mais qu’en est-il de l’effort que demande une post-édition et du ressenti des étudiants face à cette discipline ?

Un phénomène a été observé dans plusieurs études : bien que parfois, le ressenti des participants puisse être contraire à ce postulat, la post-édition demande autant, si ce n’est plus, d’effort et de compétence que la traduction humaine. Certaines études ayant été menées avec comme texte de référence des textes spécialisés, il a parfois été démontré que la post-édition rendait même la tâche plus compliquée pour les étudiants, et qu’ils se retrouvaient perdus ou perdaient énormément de temps à détecter et corriger les erreurs de la machine, résultant en la production d’un texte qui n’atteignait pas du tout les standards de qualité professionnelle, surtout d’un point de vue stylistique.

Après les tests, certains étudiants ont déclaré avoir une meilleure perception des outils de traduction automatique, quand d’autres ont affirmé que leur vision avait empiré. Néanmoins, nombre d’entre eux ont avoué avoir peur de la traduction automatique car ils craignaient d’être remplacés.

Ces observations prouvent une fois de plus qu’il est impératif de considérer la traduction automatique et la post-édition comme des matières ayant toute leur place au sein d’un cursus en traduction et qu’il ne faut pas, ou plus, les mépriser, puisque sans formation préalable, les étudiants ont beaucoup de mal à produire un texte satisfaisant.

Conclusion

Cette année, au sein du master TSM, nous avons pu découvrir le processus de post-édition et nous avons appris à appréhender les outils de traduction automatique. Et je pense que grâce à cela, nous avons peut-être moins peur de la traduction automatique ou de la post-édition par rapport à des étudiants qui n’auraient jamais eu l’occasion de démystifier la traduction machine.

Il est donc possible de conclure que oui, la traduction automatique constitue une nouvelle alliée pour les étudiants en traduction, à condition qu’ils soient mis en garde des faiblesses des moteurs et qu’ils apprennent à les manier pour pouvoir répondre aux exigences du marché. La traduction automatique ne doit plus constituer une crainte pour l’avenir des futurs professionnels mais doit devenir un outil du quotidien leur permettant d’augmenter leur productivité. Il est également nécessaire de guider les professeurs lors de l’enseignement de ces matières afin qu’ils guident à leur tour les étudiants vers une meilleure identification des erreurs et par conséquent, une meilleure correction. Ce sont pour toutes ces raisons que la mise en place d’enseignements autour de ces disciplines est essentielle : il faut prouver aux élèves que la machine représente une aide pour leur futur métier plutôt qu’une menace.

Ce billet est issu d’une mini-conférence tenue aux côtés de Margaux Mackowiak dans le cadre du cours de recherche en traduction automatique de la deuxième année de master.

Sources :

EUROPEAN LANGUAGE INDUSTRY SURVEY (2020), https://ec.europa.eu/info/sites/info/files/2020_language_industry_survey_report.pdf

de Faria Pires, Loïc. (2020). Master’s students’ post-editing perception and strategies. FORUM. Revue internationale d’interprétation et de traduction / International Journal of Interpretation and Translation. 18. 24-44. 10.1075/forum.19014.pir, https://www.researchgate.net/publication/341408521_Master’s_students’_post-editing_perception_and_strategies/citation/download

Peraldi, Sandrine (2018). Les 12 travaux de la Traduction automatique. Journée d’études Traduction et qualité : « Biotraduction et traduction automatique ». / Université de Lille, https://tq2018.sciencesconf.org/data/pages/Lille_SPeraldi_Les_12_travaux.pdf

Yamada, Masaru. (2019). The impact of Google Neural Machine Translation on Post-editing by student translators. The Journal of Specialised Translation. 87-106. https://www.researchgate.net/publication/330831614_The_impact_of_Google_Neural_Machine_Translation_on_Post-editing_by_student_translators/citation/download

Sycz-Opoń, Joanna & Gałuskina, Ksenia. (2017). Machine Translation in the Hands of Trainee Translators – an Empirical Study. Studies in Logic, Grammar and Rhetoric. 49. 10.1515/slgr-2017-0012. https://www.researchgate.net/publication/316530023_Machine_Translation_in_the_Hands_of_Trainee_Translators_-_an_Empirical_Study/citation/download

O’Brien, Sharon & Ehrensberger-Dow, Maureen (2020). MT Literacy – A cognitive view. Translation Cognition & Behavior. 3. 145-164. 10.1075/tcb.00038.obr. https://www.researchgate.net/publication/345984536_MT_Literacy_-_A_cognitive_view

DeepL Pro, à prendre ou à laisser ?

Par Archibald Marchal, étudiant M2 TSM

Ah notre bel ami DeepL, on le présente plus, l’outil de traduction automatique de Linguee est déjà bien connu. Créé en août 2017 par la filiale Linguee, il tient son nom de « deep learning » signifiant que la machine apprend avec le temps et les informations qu’elle reçoit, à l’image du cerveau humain. Fortiche non ?

DeepL est un outil qui divise les débats. Les pessimistes vous diront que la traduction automatique (TA) n’est rien d’autre que de la poudre aux yeux et qu’elle n’a aucun intérêt pour la traduction professionnelle, alors que les optimistes eux, vous diront qu’il s’agit là d’un instrument magique bientôt capable de remplacer l’humain. Essayons de nous placer du côté réaliste de ce débat. Les développeurs de DeepL eux-mêmes, ne considèrent pas leur outil comme la fin du traducteur, puisqu’on verra par la suite qu’ils collaborent avec les outils de TAO.

Selon moi, au vu des progrès de la TA depuis ces dernières années, il serait idiot de ne pas profiter de ce bel outil à notre disposition, et gratuit ! Bien évidemment, je suis d’accord pour dire que la TA ne remplacera jamais le traducteur professionnel, mais elle permet d’obtenir des résultats majoritairement cohérents en moins d’une seconde. Le gain de temps pour un traducteur est donc considérable. Sans oublier que la post-édition devient de plus en plus courante et qu’en tant que traducteur, il vaut mieux être compétent dans cette tâche et donc commencer dès maintenant à se former à la TA.

Comme vous le savez peut-être, DeepL se base sur un corpus, et ce corpus, c’est internet. Autant dire un mastodonte, regorgeant de bonnes et de moins bonnes sources. C’est pourquoi DeepL sera plus efficace pour des textes peu ou pas spécialisés. Forcément, plus on se spécialise, moins il y a de source, donc moins DeepL est performant.

Maintenant qu’on a toutes les informations en main, intéressons-nous à la version Pro de notre outil préféré. Combien coûte-t-elle ? Qu’apporte-t-elle de plus ? A qui s’adresse-t-elle ? Regardons tout cela en détail.

Tout d’abord il faut savoir que DeepL propose plusieurs forfaits :

Ce tableau proposé par le site de DeepL indique les différences entre chaque forfait. Premièrement on peut voir qu’il existe deux méthodes d’abonnement : mensuelle ou annuelle. La souscription à l’année permet alors de bénéficier de réduction non négligeable (33 %). Deuxièmement on remarque trois versions Pro différentes.

Les points communs

L’intérêt premier de la version Pro de DeepL est évidemment la protection des données. Vos clients vous ont fait signer un accord de confidentialité ? Alors oubliez n’importe quel outil de TA gratuit. DeepL Pro vous propose de la traduction automatique 100 % sécurisée, et ce, pour n’importe quel forfait.

Ensuite, sur DeepL version gratuite, vous avez un nombre de caractères limité, à savoir 5 000. Cela peut s’avérer très peu dans bon nombre de projets. Même si vous segmentez votre texte, attention aux incohérences, DeepL peut très bien vous proposer des traductions différentes pour le même terme lors de différentes recherches. Si vous mettez tout votre texte d’une traite, ce que permet la version pro, fini les incohérences !

Dernier point commun entre les forfaits : l’option formel/informel. En effet, grâce à DeepL Pro, vous pourrez choisir le ton de votre traduction.

Les différences

Vu les forfaits proposés et les divergences de prix, on s’attend évidemment à des fonctionnalités différentes.

D’abord, on constate que DeepL Pro permet la traduction de fichiers intégraux, ce qui signifie qu’à la manière d’un outil de TAO, il va rendre le fichier dans son format original, avec la mise en page originale. Néanmoins, selon le forfait, vous n’aurez pas droit aux mêmes volumes. En effet, pour la version « Starter » seulement 5 fichiers par mois, 20 pour la version « Advanced » et on monte jusqu’à 100 pour la version « Ultimate ».

La seconde différence réside dans la création de glossaires. Le forfait « Starter » ne propose la création que d’un seul glossaire, avec entrées illimitées certes, tandis que les deux autres forfaits permettent la création de « plusieurs » glossaires. Ces glossaires sont interactifs et peuvent s’avérer vite indispensables dans certains projets.

Dernière différence, et non des moindres, la possibilité d’installer un plugin sur votre logiciel de TAO. Cette option n’est disponible que pour les versions « Advanced » et « Ultimate ». Ce plugin permettra la traduction automatique dans vos segments que vous pourrez par la suite modifier à votre guise bien évidemment. Bien qu’il existe déjà des plugins dans certains logiciels tel que SDL Trados Studio, DeepL reste la référence en terme de TA et sera donc probablement plus efficace.

Les points négatifs

Malgré toutes ses belles fonctions, DeepL Pro contient son lot de points négatifs.

Par exemple, DeepL Pro n’est pas accessible pour le monde entier. En effet DeepL est une entreprise européenne et ne propose l’accès à sa version Pro que dans les pays membres de l’UE et depuis peu, à la Suisse, au Liechtenstein, aux USA et au Canada.

Ensuite, si des fichiers entiers sont traduisibles, seuls les fichiers au format .docx, .pptx et .txt le sont. On peut également ajouter les formats .htm et .html mais pour cela il faut encore payer un abonnement supplémentaire (le forfait DeepL API) à 4,99€ par mois.

De plus, si la TA nous permet de gagner un temps fou, la qualité n’est pas systématiquement au rendez-vous, et le travail de post-édition n’est pas si simple qu’il n’y parait, et peut conduire à de moins bonnes traductions finales qu’à l’accoutumée.

Le prix peut également être rédhibitoire, un abonnement professionnel pourrait s’avérer être un mauvais investissement. Il faut être sûr d’amortir son coût, attention donc à être sûr de pouvoir fréquemment utiliser la traduction automatique pour vos projets.

Bilan

Avec ses versions Pro, DeepL propose un package adapté aux besoins des utilisateurs, avec des prix et fonctions variées. Aujourd’hui, en tant que futur traducteur, je sais déjà que DeepL Pro sera un de mes premiers investissements. Reste à savoir, quelle version choisir ? Personnellement j’opterais pour le forfait « Advanced ». Je m’explique. Selon moi, le forfait « Starter » ne dispose pas de suffisamment d’arguments pour être viable sur le long terme. Sa non-intégration aux outils de TAO le rend pour moi inintéressant. Ensuite le forfait « Ultimate », qui est environ deux fois plus cher que le forfait « Advanced » ne se démarque pas suffisamment de ce dernier. Son seul avantage réside dans le nombre de fichiers entiers traduisibles, je pense qu’il s’adresse plutôt à ceux n’ayant pas d’outil de TAO ou voire même aux entreprises directement… Et comme il est difficile de survivre aujourd’hui en tant que traducteur sans utiliser d’outil de TAO, on oublie ce forfait.

Alors en 2020, avec des tarifs sans cesse revus à la baisse, l’émergence de la post-édition et les soucis de confidentialité qu’il peut y avoir, DeepL Pro apparait comme l’allié numéro 1 du traducteur professionnel, lui permettant un gain de temps considérable, et donc un gain d’argent.

Sources :

https://www.deepl.com/fr/blog/20180305.html

https://www.deepl.com/fr/pro/

#TQ2020 Biotraduction et traduction automatique : retour sur la journée d’études Traduction et Qualité du 31 janvier 2020

 

Par Oriane Briand, étudiante M2 TSM

tq2020_site

 

Le laboratoire « Savoirs, Textes, Langage » du CNRS et l’UFR Langues Étrangères Appliquées de l’université de Lille ont organisé, pour sa 7e édition, une journée d’études consacrée à la biotraduction et à  la traduction automatique. Petit bilan du cru 2020.

L’année 2020 vient à peine de commencer, une décennie 2.0 pour cette journée d’études 2.0 elle aussi, puisque l’édition de 2018 était déjà dédiée à la traduction automatique (TA), aussi appelée traduction machine.

Le programme est chargé, l’amphithéâtre est bondé en cette belle journée de fin janvier. Cette journée a pour but de redéfinir le lien entre l’humain et la machine dans le monde de la traduction, un monde qui a en effet été chamboulé par l’arrivée de la traduction automatique neuronale. La journée se découpe en trois thématiques : traduction automatique et monde professionnel, traduction automatique et métiers de la traduction et enfin analyse de la traduction automatique. Dix intervenants se sont succédé sur l’estrade, universitaires comme professionnels, et ont tenté d’apporter leurs éléments de réponse.

La traduction automatique neuronale (TAN) a fait son apparition vers le milieu des années 2010. Auparavant, d’autres systèmes étaient utilisés comme la traduction automatique statistique (TAS). Alors que pouvons-nous attendre de la TAN et comment pouvons-nous l’utiliser comme un outil pour le traducteur, et non plus le voir comme une menace, comme elle est souvent perçue ?

Le fonctionnement de la TAN n’est pas évident pour tout le monde. Les algorithmes utilisés sont complexes et mystérieux. Et pourtant, elle est partout. Elle est utilisée par des millions de personnes tous les jours et fait partie intégrante de notre quotidien comme de notre environnement de travail. Mais quelle posture faudrait-il adopter face à ce trop-plein d’intelligence artificielle ?

Tout d’abord, il faut comprendre ce qu’est la traduction automatique neuronale et surtout, connaître ses points forts et ses points faibles. Car c’est en connaissant la machine avec laquelle nous travaillons que nous pouvons en retirer le meilleur. Par exemple, la TAN est capable de produire des sorties de textes fluides, ce qui peut parfois nous  tromper et donner l’illusion d’un texte bien traduit. Or, cette fluidité se fait, par exemple, au détriment de la terminologie. C’est lorsqu’on se penche sur le résultat qu’on se rend compte que le texte produit est incorrect. C’est pour cette raison que l’utilisation de la TAN ne peut se faire sans une intervention humaine, et, si cela peut vous rassurer, ne peut supplanter le traducteur comme on peut le penser. Mais comme pour chaque nouvelle avancée technologique, il faut se former et former les générations futures. Ainsi, enseigner de manière raisonnée l’utilisation de ce nouvel outil est crucial.

Aujourd’hui, l’intervention humaine face aux résultats de productions machine existe déjà. C’est le métier de post-éditeur. Lorsque nous regardons le marché de la traduction, il existe une certaine segmentation. Chacun son rôle et les moutons sont bien gardés. Mais l’émergence des nouvelles technologies (re)pose la question de l’organisation et de la gestion du projet de traduction. Par exemple, le post-éditeur ne pourrait-il pas être plus qu’un simple post-éditeur ? Il semble logique de demander son expertise à quelqu’un qui s’y connaît, qui est sur le terrain. Alors pourquoi ne pas faire appel aux connaissances et à l’expérience de quelqu’un qui travaille avec le contenu. Il est alors possible de redéfinir ce rôle et de l’impliquer à chaque étape du projet, que ce soit dans l’analyse de celui-ci (il peut estimer les délais, définir le processus le plus adapté…) ou dans ses étapes techniques. Il est important de redéfinir le rôle du post-éditeur dans les projets de TA, mais également redéfinir la gestion de ces projets. Chaque projet est unique, les résultats de TA sont variables tout comme l’effort de post-édition qui suit, et le post-éditeur ne peut qu’ajouter une plus-value.

Car la TAN n’est pas parfaite,  aujourd’hui encore, on tente de la décrypter. Il est important de comprendre ses faiblesses, mais également d’évaluer ce qu’elle produit. Il existe plusieurs méthodes. Quelques exemples :

  • La méthode BLEU, qui consiste à comparer une sortie machine avec une traduction humaine de référence
  • L’observation du système en le manipulant : modifier le texte source et observer si le texte cible se modifie en changeant les temps, les modes, les adjectifs, etc., et son inverse.
  • La dissection du système en ouvrant sa boite noire : interroger celle-ci pour tenter de prédire le résultat.
  • L’évaluation humaine : classement des résultats (par des professionnels ou non), identification et classement des erreurs.

Plusieurs études ont prouvé un gain de temps dans l’utilisation de la post-édition de traduction automatique neuronale, mais il est possible d’améliorer ses sorties de traduction en y incorporant de meilleures données d’apprentissage. Par exemple, une manière d’améliorer ce problème de terminologie serait d’incorporer des séries de textes spécialisés. Y incorporer ses propres corpus semble pour le moment compliqué, car les systèmes sont basés sur l’optimisation des algorithmes. Or, y incorporer ces données ferait baisser ce score d’optimisation. Il faudrait alors repenser le système et lui injecter ces connaissances dès le début de processus.

Comme vous pouvez l’avoir constaté, la traduction automatique neuronale génère de nombreuses questions et suscite un intérêt dans le monde de la traduction. Ses progrès ne semblent pas près de s’arrêter et en parler permet de découvrir de nombreux angles d’approche qui se complètent. Une approche raisonnée et scientifique permet de poser un regard critique sur la machine, et de réconcilier peut-être ce qui ne semblait pas être un couple évident : l’humain et la machine.

 

Un grand merci à Joss Moorkens, Caroline Rossi, Nathalie de Sutter, Geert Benoit, Guillaume Deneufbourg, Sarah van der Vorst, François Yvon, Hanna Martikainen, Orphée De Clercq et Rudy Loock, ainsi qu’à l’université de Lille en partenariat avec le laboratoire « Savoirs, Textes, Langage » du CNRS et l’Association française des formations universitaires aux métiers de la traduction (AFFUMT).

 

La #TQ2020 a été filmée, vous pourrez la visionner dès cette semaine sur la webTV de l’université de Lille et sur le site dédié à cette journée.

BLEU, un algorithme qui calcule la qualité des traductions machine

Par Loréna Abate, étudiante M2 TSM

De nos jours, la traduction machine occupe une place très importante sur le marché de la traduction, et fait couler beaucoup d’encre. Si vous êtes intéressés par le secteur de la traduction machine, il se peut même que vous ayez déjà entendu parler des métriques d’évaluation permettant d’évaluer la qualité des traductions machine. Classer les différents systèmes ou métriques d’évaluation peut donc s’avérer pertinent. Alors, qu’en est-il de ces systèmes d’évaluation ? Eh bien, il en existe une multitude. En effet, on trouve sur le marché les métriques BLEU, ROUGE, METEOR, NIST, WER, etc.

Pour ne pas finir par rédiger un mémoire de 120 pages, il fallait donc faire un choix. Dans ce billet, nous ferons un focus sur l’algorithme BLEU. Pourquoi BLEU, me direz-vous ? Car cette métrique, élaborée et développée en 2002 par Kishore Papineni pour la société IBM, est aujourd’hui l’une des métriques automatisées les plus populaires et les moins coûteuses.

BLEU permet d’attribuer un score à une traduction machine grâce à un système de mesure reposant sur des morceaux de phrases. Ces parties sont appelées « N-grammes », et leur fréquence est également évaluée à l’aide d’une comparaison entre un texte source et un texte cible. Je vous ai perdus ? Accrochez-vous, la suite de l’article arrive.

A background of rippled and folded deep royal blue fabric material.

Pas évident de dénicher une image agréable à regarder sur un sujet si théorique… Vous vous contenterez donc de ce joli bleu roi.

Dis-moi Jamy, qu’est-ce que BLEU ?

BLEU, acronyme pour Bilingual Evaluation Understudy, est en fait une mesure des différences entre une traduction machine et une ou plusieurs traductions de référence créées par l’humain pour une même phrase source. BLEU part donc du postulat que plus une traduction machine se rapprochera d’une traduction humaine et professionnelle, plus elle sera qualitative.

Une fois ces comparaisons réalisées, un score est attribué pour chaque phrase traduite. Puis, une moyenne est calculée sur l’ensemble du corpus afin d’estimer la qualité globale du texte traduit.

Le score BLEU se définit par un nombre compris entre 0 et 1 qui indique la similitude du texte dit « candidat » par rapport aux textes de « référence ». Tout se joue au niveau du nombre de correspondances. En effet, plus le score se rapproche de 1, plus les textes sont similaires. Une valeur égale à 0 indiquerait que la traduction automatique ne correspond en rien à la traduction de référence et serait donc de mauvaise qualité, tandis qu’un score égal à 1 signalerait une correspondance parfaite avec les traductions de référence et serait ainsi de bonne qualité.

Intéressant comme outil, comment ça fonctionne ?

Formation littéraire oblige, nous n’avons pas revu les exponentielles depuis le lycée (et j’en fais encore des cauchemars…) je vous épargne donc les explications de sa formule mathématique qui n’est pas des plus simples :

123

… vous voyez, l’image bleue du début n’était pas si mal.

 

Bref, voici quelques éléments nécessaires à la génération d’un score BLEU :

  • Une ou plusieurs traductions de référence humaine, qui devraient être inconnues du développeur du système de TA
  • Un texte d’au moins 1 000 phrases dans le but d’obtenir une mesure plus pertinente,
  • Si le texte candidat est jugé trop court par rapport à la référence, une pénalité de concision est appliquée sur la traduction,
  • La correspondance de « n-grammes », qui consiste à compter le nombre d’unigrammes (mot unique), de bigrammes (paire de mots), de trigrammes et de quadrigrammes (i = 1,…, 4) qui correspondent à leur équivalent de n-grammes au sein des traductions de référence. Les unigrammes permettent de calculer l’exactitude, tandis que les n-grammes plus longs rendent compte de la fluidité de la traduction.

En pratique, il est impossible d’obtenir un score parfait de 1, et ce, même pour un traducteur humain (à moins d’avoir une traduction mot pour mot identique à la traduction de référence). À titre d’exemple, sur un corpus d’environ 500 phrases, un traducteur humain a obtenu une note de 0,346 8 contre quatre références et de 0,257 1 contre deux références.

Un exemple, peut-être ?

Si l’on prend cette phrase simple : « Le renard brun et rapide sauta sur le chien paresseux », comment l’auriez-vous traduite ?

  1. The quick brown fox jumped over the lazy dog
  2. The fast brown fox jumped over the lazy dog
  3. The fast brown fox jumped over the sleepy dog

Si je vous dis que la traduction de référence est « The quick brown fox jumped over the lazy dog », voyons voir votre score BLEU :

  1. On obtient alors un score de… ? Oui, c’est bien ça, 1,0. Vous voyez, ce n’est pas si compliqué !
  2. En remplaçant le mot « quick » par le mot « fast », votre score chute alors à 0,750.
  3. Cette fois-ci, deux mots sont différents… Désolée, mais vous n’obtenez que 0,48.

Avec cet exemple simple, vous avez d’ores et déjà un aperçu du système de notation. Voici un deuxième cas de figure :

  • Si tous les mots sont différents sur le texte candidat, on obtient le pire score possible: 0,0.
  • Si le texte candidat comporte moins de mots que le texte de référence, mais que les mots sont tous corrects, le score est alors très semblable au score obtenu avec un seul mot différent, à savoir : 0,751.
  • Et avec deux mots de plus que le texte de référence ? À nouveau, nous pouvons voir que notre intuition était la bonne et que le score est équivalent à celui qui comporte deux mots erronés, à savoir: 0,786.
  • Enfin, prenons l’exemple d’une phrase qui serait trop courte en comportant seulement deux mots. L’exécution de cet exemple entraînerait d’abord l’apparition d’un message d’avertissement indiquant que l’évaluation portant sur les trigrammes et quadrigrammes ne peut pas être effectuée, puisque nous n’avons que les bigrammes avec lesquels travailler pour le candidat. Au-delà de cela, nous risquerions d’obtenir un score très bas : 0,030.

Est-ce pour autant suffisant pour évaluer la qualité ?

« Most of us would agree that competent human evaluation is the best way to understand the output quality implications of different MT systems. However, human evaluation is generally slower, less objective and more expensive, and thus may not be viable in many production use scenarios, where multiple comparisons need to be made on a constant and ongoing basis. » (Kirti Vashee, 2019, Understanding MT Quality)

La traduction automatique est un défi particulièrement difficile pour l’IA. Les ordinateurs sont amateurs de résultats binaires. Vous savez tout autant que moi que la traduction, c’est tout l’inverse. Quel choix de traduction serait plus correct qu’un autre ? Difficile à dire. En effet, il peut y avoir autant de traductions correctes qu’il y a de traducteurs et, par conséquent, l’utilisation d’une seule référence humaine pour mesurer la qualité d’une solution de traduction automatisée pose problème.

Vous l’aurez compris, on en revient au même problème que pour la traduction neuronale, mais ici cela devient encore plus complexe, car c’est une machine qui juge une machine. Une vraie machineception.

Le problème avec BLEU…

Les scores BLEU ne reflètent en effet que les performances d’un système sur un ensemble spécifique de phrases sources et les traductions de référence sélectionnées pour l’évaluation. Puisque le texte de référence pour chaque segment n’est évidemment pas la seule traduction correcte et « de qualité », il arrive fréquemment de mal noter (« scorer ») de bonnes traductions. On peut donc dire que ces scores ne reflètent pas systématiquement le rendement potentiel réel d’un système.

Bien que l’objectif de BLEU soit de mesurer la qualité globale de la traduction, le résultat que l’on obtient est plutôt une mesure de la similitude entre deux chaînes de caractères dans un texte. Considérée par certains comme une mesure fiable de la qualité, la majeure partie des experts considèrent que les scores BLEU seraient plus précis si les comparaisons étaient faites au niveau du corpus entier plutôt qu’à chaque phrase. Ainsi, on remet en question la performance de cet outil qui n’a en réalité aucune « intelligence » linguistique qui lui permettrait d’évaluer la qualité d’une traduction machine.

Un système critiqué, et pour cause !

BLEU ne prend pas en compte le sens

Texte original : J’ai mangé la pomme.

Traduction de référence : I ate the apple.

Si l’on en croit BLEU, les trois traductions suivantes, ayant obtenu le même score, seraient aussi mauvaises les unes que les autres :

  1. I consumed the apple.
  2. I ate an apple.
  3. I ate the potato.

Pourtant, la troisième traduction n’a rien à voir avec le sens du texte original, à savoir J’ai mangé la pomme.

BLEU ne prend pas en compte la structure des phrases

Une phrase complètement absurde, avec des mots « corrects », mais simplement placés dans un ordre aléatoire est susceptible d’obtenir un score élevé !

BLEU gère mal les langues « riches » morphologiquement

La métrique BLEU ne fait pas la distinction entre le contenu et les mots-outils. Par exemple, la pénalité liée à l’omission d’un mot-outil tel que « un » est identique à la pénalité appliquée en cas de remplacement du terme « NASA » par « ESA ».

BLEU ne correspond finalement pas tant à une évaluation humaine

Avant le calcul du score BLEU, les traductions de référence et les traductions automatiques doivent être normalisées et « tokenisées », ce qui affecte considérablement le score BLEU final.

En bref…

Le score BLEU, quoiqu’imparfait, offre certains avantages : rapide et peu coûteux à calculer, facile à comprendre *hum hum*, indépendant de la langue, très proche d’une évaluation humaine, cette métrique a largement été adoptée ces vingt dernières années.

Malgré ses imperfections, BLEU est un outil utile et prometteur, et demeure encore aujourd’hui une mesure de référence pour tous les développeurs de traduction automatique. Pour preuve, dans son concours annuel des outils de TA, le NIST (National Institute of Standards & Technology) a choisi d’utiliser BLEU comme indicateur approximatif de la qualité.

Le BLEU « idéal » serait un système dans lequel seraient prises en considération toutes les propriétés linguistiques fondamentales, telles que la structure de la langue, la cohérence, le style d’écriture, le contenu, l’organisation, l’exactitude des propos… À l’heure actuelle, le seul moyen d’obtenir d’excellents résultats est d’associer les métriques automatiques à une évaluation humaine et unilingue.

Sources

Sources en anglais

Sources en français

Parce que cet article vous a passionné…

La machine DeepL

Par Julian Turnheim, étudiant M2 TSM

 

Automne 2007 : les feuilles mortes quittent leurs branches et viennent se poser avec douceur sur le sol encore froid et humide. Pendant ce temps-là, un homme, Dr. Gereon Frahling, ancien employé de chez Google, repère un marché de niche et cherche à développer son idée. Il quitte le géant américain pour lancer, en un an et demi, avec son associé Leonard Fink, leur start-up : le dictionnaire bilingue Linguee. Après dix-huit mois de travail acharné et des tonnes de pizzas, le résultat est impressionnant.

L’objectif de Linguee ? Dr. Frahling l’explique comme suit : « Un moteur de recherche de traductions ouvert à tous. Si quelqu’un a un problème pour traduire une phrase en particulier, il peut vérifier sur Linguee si un traducteur quelque part dans le monde a déjà traduit exactement cette même phrase. Et ensuite, il peut s’orienter par rapport à cette traduction. » (Traduit de l’allemand) Est-ce la racine de DeepL ?

Dix ans plus tard, Lee Turner Kodak, responsable communication chez DeepL, tient dans ses mains le tout premier Prix Honorifique pour l’IA d’Allemagne. Linguee a bien grandi. D’ailleurs, l’entreprise Linguee GmbH ne s’appelle plus Linguee mais DeepL GmbH. En effet, entre temps, l’entreprise a lancé, en 2017, le traducteur automatique DeepL. Ce nouveau traducteur automatique a eu l’effet d’une bombe dans le monde de la traduction. Personne ne pouvait imaginer que, dès sa sortie, ce petit nouveau mettrait dans l’embarras le géant Google Traduction.

C’est de ce petit nouveau, plus si nouveau et plus si petit que ça, finalement, que je voudrais vous parler.

 

Comment utiliser la bête ?

DeepL peut être utilisé gratuitement et sans qu’un enregistrement soit nécessaire. Vous pouvez soit coller le texte à traduire dans le champ dédié, soit téléverser directement votre document texte ou diaporama, grâce à l’option « Traduire un document ». Toutefois, la version gratuite ne permet d’obtenir que des documents en lecture seule, dont vous ne pourrez copier que le texte brut. De plus, il n’est pas possible de corriger la traduction, alors que cela est possible sur la plateforme.

Il est possible de coller un maximum de 5000 caractères dans le champ dédié, mais il n’y a pas de limite de taille pour les documents téléversés. La version gratuite n’est pas forcément adaptée aux exigences des traducteurs professionnels, car le texte que vous insérerez sur la plateforme sera conservé par DeepL, ce qui peut poser quelques problèmes de confidentialité. Mais pas d’inquiétude ! Pour les traducteurs, la version professionnelle de DeepL existe sous la forme d’un plug-in pouvant être intégré à de nombreux outils de TAO, tels que SDL Trados Studio et MemoQ. Cette version professionnelle ne conservera pas les données saisies.

L’un des avantages majeurs de la traduction via le champ dédié est qu’elle permet d’affiner le résultat, ce qui est impossible avec l’option « Traduire un document ». Si une traduction ne vous satisfait pas, un clic sur le texte traduit ouvre un menu proposant des suggestions alternatives, et vous pourrez alors corriger la traduction rapidement et facilement. Lorsque vous corrigez ou modifiez des mots, la plateforme propose, si nécessaire, une phrase entièrement retravaillée. Vous pouvez donc toujours négocier avec DeepL, lui suggérer de nouvelles phrases, de nouveaux mots, ou encore améliorer la traduction qui a été proposée directement dans l’outil. DeepL, n’oubliant pas que vous avez modifié la traduction, utilisera ensuite ces nouvelles connaissances. C’est ce qu’on appelle la traduction automatique neuronale.

 

La traduction automatique neu… quoi ?

La traduction automatique neuronale. Mais oui, parlons-en ! Enfin, essayons d’en parler. L’étudiant de M2 que je suis ne saurait vous expliquer avec exactitude comment fonctionne la traduction automatique neuronale. Les experts eux-mêmes semblent aujourd’hui peiner à en expliquer le processus, tant l’évolution de la traduction automatique est rapide.

Ce que je peux vous dire, c’est que DeepL analyse des textes à l’aide de réseaux neuronaux. Ces réseaux permettent de résoudre des tâches sur la base de modèles prédéfinis. Lorsqu’un réseau neuronal est formé à la traduction, il est tout d’abord alimenté avec des traductions préexistantes et correctes, soit un corpus parallèle géant de qualité. Il les analyse alors jusqu’à pouvoir en déduire la façon dont les nouveaux textes doivent être traduits. Cette méthode est aussi appelée le Deep Learning (oui, DeepL porte bien son nom). Cela fait référence à la capacité d’une machine à apprendre en utilisant d’importants ensembles de données, plutôt qu’en ayant recours à des règles codées, beaucoup trop rigides et limitées. L’ordinateur peut alors apprendre par lui-même et entraîner une intelligence artificielle à prédire les résultats à partir d’un ensemble de données saisies. À l’instar d’un animal ou un bébé humain, il apprend grâce à des exemples, des expériences et des erreurs. Chaque fois que vous traduisez avec DeepL, vous nourrissez le géant.

Cet apprentissage considérable nécessite l’utilisation d’un super-ordinateur d’une performance équivalente à 5000 processeurs d’ordinateurs de bureau. Ce serveur surpuissant n’est d’ailleurs pas situé en Allemagne (lieu du siège de DeepL), mais dans un centre de données en Islande, à Keflavik. Là-bas, il est plus facile de garder les traductions au frais : les basses températures extérieures de cette région du monde facilitent la climatisation de ce gigantesque centre de données. Autrement, le serveur se transformerait rapidement en l’un des nombreux volcans islandais.

 

Maintenant, place à la pratique !

Il est temps d’analyser les performances de ce géant. Pour cela, je vais reprendre les textes que Marine Moreel avait utilisés dans son billet de blog du 8 octobre 2017 : Google Translate vs DeepL : le duel. Ces textes sont extraits du site du Plaza Hotel de New York rédigés en anglais. Je vais donc observer leur traduction vers le français. Ainsi, nous pourrons comparer les textes traduits entre 2017 et aujourd’hui, et en analyser l’évolution.

  • La typographie

En quelques mots, on peut dire qu’il n’y a pas vraiment eu d’évolution en la matière. DeepL ne respecte toujours pas les règles typographiques de la langue française. On ne retrouve donc toujours pas d’espaces insécables ou de guillemets chevrons dans le texte traduit.

  • La localisation

2017

localisation2

2019

CaptureLOCALISATION

En ce qui concerne la localisation, on constate une légère évolution. DeepL ne localise toujours pas les numéros de téléphone et les devises. En revanche, il adapte le format des chiffres en supprimant la virgule séparatrice de milliers, et sait localiser l’heure. Pour l’instant, rien de nouveau sous le soleil. Toutefois, à la dernière phrase, on remarque que DeepL a traduit l’unité de mesure sans la localiser. Cela représente une amélioration par rapport à la version de 2017, dans laquelle DeepL a traduit « 4,500 sq. ft. » par « 4 500 m² » en la faisant suivre de la mesure « ft. » laissée telle quelle, ce qui n’a aucun sens.

  • Omissions

2017

coherence2

2019

CaptureCOHERENCE

En comparaison avec la traduction de 2017, on peut constater que « palatial » n’a pas été omis cette fois-ci. DeepL n’a donc pas supprimé de mots, que ce soit dû à une impossibilité de traduire, ou à la nécessité de rendre la phrase traduite plus humaine.

  • La traduction des mots empruntés à d’autres langues

2017

emprunts2

2019

CaptureDRESSING

 

Confusion de « dressing area » avec « dressing room » ? Mystère ! Toujours est-il que l’on passe d’une traduction peu idiomatique et incorrecte du point de vue du contexte, à une formulation fluide, naturelle et plus vendeuse, reprenant la terminologie adaptée, soit un emprunt dans ce cas. En 2019, DeepL semble donc avoir moins peur des emprunts.

Notons par ailleurs que « luxury », tout d’abord traduit par l’adjectif « luxueux », a trouvé une traduction plus heureuse en 2019 avec le complément du nom « de luxe », qui semble mieux se prêter au contexte.

  • La traduction littérale et le sens

2017

sens2

2019

CaptureBIGFinal

Garder « The Eloise Shop » ou traduire littéralement par « La Boutique Eloise » ? En tant que futur traducteur, j’accompagnerais la traduction du nom original entre crochets. Dans tous les cas, ce sera au post-éditeur et/ou au client de trancher.

En 2017, DeepL avait choisi de proposer la traduction première de « skidder », soit « déraper ». En 2019, il n’en prend même plus la peine et les clients se retrouvent à faire du « skidder » dans le magasin. Ici, le verbe est accompagné de la particule « in ». Son sens s’en voit donc modifié. Les verbes à particule sont porteurs d’une grande richesse sémantique et leurs diverses acceptions évoluent de façon continue. Alors, qui d’autre que le post-éditeur sera à même d’en extraire (mais surtout d’en retransmettre) le sens ?

En revanche, nous pouvons être agréablement surpris de la gestion du mot « (mis)adventures » par l’outil, qui a proposé « (més)aventures » en 2019. Cette fois, DeepL ne s’est pas laissé duper par les parenthèses et a parfaitement rendu le sens du texte source. Une belle évolution depuis 2017.

Le dernier aspect que je souhaiterais aborder est la traduction de « enjoy story time with their mostly companion ». L’outil n’a pas réussi à comprendre le sens du terme « mostly ». À défaut de proposer mieux, DeepL suggère en 2017 l’utilisation de « principal ». En 2019, on ne comprend pas vraiment ce qu’il se passe, et l’on obtient le très étrange « compagnon pour la plupart ». Régression ou apprentissage en cours ?

 

Pour finir

Entre 2017 et 2019, DeepL a augmenté le nombre de langues proposées. Cependant, les traductions délivrées dans certaines combinaisons de langues sont d’une qualité moindre par rapport à d’autres. Est-ce parce que l’outil utilise l’anglais comme langue pivot pour lesdites combinaisons ? Si le sujet de l’anglais comme langue pivot vous intéresse, vous pouvez consulter le billet de blog de ma collègue Angelina Fresnaye.
Les corpus utilisés proviennent notamment de la base de données EUR-Lex, ce qui permet à DeepL d’être très performant dans la traduction automatique de textes juridiques.
Enfin, attention cependant, la très bonne qualité des traductions proposées et leur style naturel sont parfois un mirage. En effet, au nom de la fluidité, le sens pourra être changé et des éléments supprimés. En d’autres termes, si de nombreux articles affirment que la traduction automatique signera la fin du métier de traducteur, nous pouvons constater que l’on en est encore bien loin et que la présence d’un post-éditeur pour rattraper les maladresses, oublis et faux-sens ne sera pas de trop.

 

SOURCES :

Gerald Himmelein (03/06/2019) DeepL: The new gold standard in online translation? softmaker.com.

Radu Raicea (23/10/2017) Want to know how Deep Learning works? Here’s a quick guide for everyone. freecodecamp.org

Wikipedia (08/11/2019) Linguee, Wikimedia Foundation

Magdalena Räth (11/12/2013) Gereon Frahling (Linguee): „Wir haben uns 18 Monate vergraben“ gruenderszene.de

Blog de DeepL (04/10/2019) DeepL remporte le tout premier Prix Honorifique pour l’IA d’Allemagne https://www.deepl.com/blog/20191004.html

Marine Moreel (08/10/2019) Google Translate vs DeepL : le duel. Blog du Master « Traduction Spécialisée Multilingue » (TSM) de l’Université de Lille