Comment bien utiliser la traduction automatique ?

Par Yohann Tsangue, étudiant M1 TSM

Inutile de se cacher, en 2022, et depuis de nombreuses années déjà, l’utilisation de la traduction automatique s’est démocratisée. Que ce soit pour traduire un tweet dans une langue que l’on ne maîtrise pas à l’aide d’un simple bouton, ou bien pour chercher la traduction d’un simple mot, tout le monde a déjà fait usage d’un outil de traduction automatique.

Mais c’est bien connu, cette technologie reste imparfaite malgré ses progrès ces dernières années. Avant que je ne vous donne quelques conseils pour exploiter au mieux cette technologie, laissez-moi faire un petit historique des technologies de traduction automatique.

La Rule-Based Machine Translation (RBMT)

Comme son nom l’indique, cette technique s’appuie sur un ensemble de règles linguistiques, ainsi qu’un dictionnaire. Apparue au début des années 1970, elle fut la première méthode de traduction automatique. Le processus de traduction de la machine se fait en trois étapes.  Pour plus d’informations sur l’évolution de la traduction automatique avant les années 1970, je vous invite à cliquer juste ici.

L’analyse : la machine examine la phrase source et produit une analyse syntaxique de cette dernière, sous la forme d’un arbre syntaxique.

Le transfert :  l’arbre syntaxique de la langue source est converti dans la langue cible.

La sortie : l’arbre syntaxique de la langue cible est converti en une phrase en langue cible.

Pour chaque paire de langue, cet algorithme est utilisé avec un dictionnaire qui contient des mots et des phrases avec des informations grammaticales détaillées, telles que la classe grammaticale d’un mot.

Lors de la traduction, pour chaque phrase source, la machine va étiqueter tous les mots, c’est-à-dire leur associer la classe grammaticale correspondante et les règles auxquels ils obéissent (ex : sujet, verbe, doit s’accorder ou pas en genre et en nombre, etc.). La machine va ensuite chercher la traduction de tous les mots étiquetés qui seront placés dans le bon ordre grâce à l’arbre syntaxique cible généré par la machine.

Cette technique présente certains avantages, elle permet un haut niveau de contrôle de la terminologie et des règles grammaticales.

Cependant, elle est très chronophage car il faut établir un ensemble de règles et un dictionnaire pour chaque paire de langue. Étant donné qu’il existe environ 6 000 langues vivantes sur Terre, il y a encore beaucoup de chemin à faire ! De plus, certaines règles grammaticales s’appliquent seulement dans certains contextes, tandis que d’autres sont ambigües. Bien que les phrases générées soient toujours grammaticalement correctes, elles peuvent manquer de fluidité.

Statistical Machine Translation (SMT)

Cette approche consiste en l’analyse statistique d’un volume important de données déjà traduites. Voici son fonctionnement : une base de données de segments alignés (phrases sources avec leurs traductions en langue cible) sert d’entrée à un système d’apprentissage statistique. La machine apprend à traduire en se basant sur les relations statistiques entre les données sources et cibles. Cette base de données, que l’on peut appeler corpus bilingue, peut contenir des millions de mots traduits. En analysant ce corpus, la machine établit la traduction la plus probable pour un segment donné, c’est-à-dire celle qui revient le plus souvent dans le corpus. Par exemple, dans un corpus de langue générale d’anglais vers le français le mot “power” est plus souvent traduit par “pouvoir” que par “électricité”.

Cette analyse statistique marche pour l’aspect terminologique mais aussi pour la grammaire, la machine déduit également l’ordre des mots le plus probable dans la langue cible grâce aux données. La qualité de la traduction dépend donc de la qualité du corpus (pas forcément de sa taille) et du niveau d’entraînement de la machine d’apprentissage.

Contrairement à la RBMT, il n’y pas besoin d’analyser grammaticalement les phrases sources à l’aide d’arbres syntaxiques, les phrases sources sont découpées en segments et la machine utilise les données statistiques sur la probabilité d’une traduction et l’ordre des mots pour déterminer le meilleur candidat pour la sortie de la traduction.

Cette méthode produit des phrases fluides et relativement sensibles au contexte. Cependant, elle requiert des larges bases de données et offre peu de contrôle sur la terminologie.

La traduction neuronale

La traduction neuronale est la plus récente des méthodes de traduction automatique. Elle utilise l’intelligence artificielle et un réseau de neurones artificiels qui sont associés à des outils sophistiqués. Elle est capable de comprendre les mots mieux que les technologies précédentes, en les replaçant dans leur contexte afin de choisir le sens correct. La marge d’erreur est réduite car la traduction neuronale apprend en continu de ses erreurs. Et ce, dans un laps de temps relativement court.

On peut voir que l’outil de Google s’est amélioré en l’espace de quelques années. Dans sa vidéo de 2016 sur Google traduction, le youtubeur Linguisticae montre les limites de l’outil face à la phrase ambigüe suivante : “Do British people drive on the right side?”. L’ambiguïté porte sur “right side” qui peut autant vouloir dire “côté droit” que “bon côté”. Au moment de la sortie de la vidéo, Google proposait comme unique traduction “Les gens britanniques en voiture sur le côté droit ?”, cette confusion liée à l’ambiguïté de la phrase donne un résultant peu satisfaisant. Mais aujourd’hui l’outil a évolué, pour ce même exemple il propose deux possibilités de traduction.

Cela ne résout toujours pas l’ambiguïté de la phrase mais c’est un bon début. DeepL fait mieux et propose plusieurs traductions possibles en cliquant sur un mot, ce qui va affecter le reste de la phrase.

En cliquant sur “côté” une liste apparaît et propose d’autres traductions de ce mot, lorsque l’on clique sur une de ces propositions, l’outil va automatiquement changer le reste de la phrase pour garder un résultat cohérent (ici en supprimant le mot “droit”).

Toutefois ce système n’est pas infaillible et peut présenter des problèmes de confidentialité. À moins de payer un abonnement, les outils de traduction automatiques en ligne se nourrissent des données que vous leur fournissez pour améliorer leurs algorithmes.

Conseils

Ne pas l’utiliser comme dictionnaire. Si vous demandez à un traducteur la traduction d’un mot il vous répondra certainement “ça dépend”. En effet un mot peut se traduire de différentes manières suivant le contexte dans lequel il est utilisé, ainsi, “way” peut être rendu par “chemin”, “manière”, voire “sens”. Mieux vaut passer par un dictionnaire, papier ou en ligne, lorsque l’on cherche simplement la traduction d’un seul mot. Il est préférable de rentrer une, voire plusieurs phrases à la fois dans un outil de traduction automatique.

La traduction automatique peut se révéler utile dans l’apprentissage d’une langue. Il m’arrive d’utiliser le bouton “Écouter” de Google traduction pour déchiffrer la prononciation de certains mots. Cette fonctionnalité est particulièrement utile pour des langues comme le mandarin et le japonais qui utilisent des caractères chinois, qui doivent être mémorisés un à un. La prononciation de certains caractères peut varier selon le contexte (en particulier avec le japonais). C’est notamment le cas du caractère 日 qui veut dire “jour” ou “soleil”. Dans l’exemple ci-dessous, 日 est utilisé trois fois pour autant de prononciations différentes, respectivement “hi”, “nichi” et “bi”.

Savoir reconnaître les erreurs de la traduction automatique. Humains comme machine, nous faisons tous des erreurs lorsque nous traduisons. Grâce aux progrès technologiques, la traduction automatique est capable de générer des phrases très fluides et crédibles à première vue, mais des erreurs peuvent très bien s’y cacher. Souvent, il n’y a pas d’erreur à proprement parler mais un défaut de style. Cette notion importera plus aux professionnel·le·s de la traduction qu’au grand public, car le style est un des indicateurs de la qualité d’une traduction. Par exemple, pour “the above modifications” un outil de traduction automatique donne “les modifications ci-dessus » mais selon le registre ou le type du texte, mieux vaut employer “les modifications susmentionnées”. C’est ce genre de détail qui fait la différence entre une traduction machine et une traduction humaine.

Conclusion

Malgré les progrès notables de la traduction automatique années après années, l’intervention humaine reste toujours d’actualité. Les projets de traductions professionnelles ayant recours à la traduction automatique font souvent appel à des post-éditeurs, des traducteurs humains formés à reconnaître les erreurs de la machine et qui savent les corriger selon le projet. La valeur ajoutée du traducteur humain est sa capacité à comprendre les nuances de la langue, les aspects culturels et à les rendre fidèlement dans sa langue maternelle. Ainsi la traduction automatique se prête bien à la traduction de textes techniques (juridiques, spécialisés, etc.) mais pas à la traduction de textes créatifs (littéraires, transcréation, etc.).

Bibliographie

Aslan E. « La Place de la Traduction Automatique dans l’Enseignement de la Traduction ». HUMANITAS – Uluslararası Sosyal Bilimler Dergisi [En ligne]. 15 octobre 2021. Vol. 9, p. 16‑32. Disponible sur : < https://doi.org/10.20304/humanitas.944629 >

Écormier-Nocca F. « Thierry POIBEAU, Babel 2.0 : où va la traduction automatique ?, Paris, Odile Jacob, 2019, 216 p. » Reseaux. 31 juillet 2020. Vol. 222, n°4, p. 199‑204.

Européennes C. La traduction automatique met-elle réellement en danger le métier de traducteur ? [En ligne]. Communications Européennes. 9 juin 2021. Disponible sur : < https://communications-europeennes.fr/la-traduction-automatique-met-elle-reellement-en-danger-le-metier-de-traducteur > (consulté le 23 mars 2022)

Hearne M., Way A. « Statistical Machine Translation: A Guide for Linguists and Translators ». Language and Linguistics Compass [En ligne]. 2011. Vol. 5, n°5, p. 205‑226. Disponible sur : < https://doi.org/10.1111/j.1749-818X.2011.00274.x >

Ibanez F. « Traduction Neuronale : Ce Que Vous Devez Savoir ». In : Alphatrad [En ligne]. [s.l.] : [s.n.], 2020. Disponible sur : < https://www.alphatrad.fr/actualites/savoir-traduction-neuronale > (consulté le 23 mars 2022)

Kadiu S. « Human vs. Machine Translation: Henri Meschonnic’s poetics of translating ». In : Reflexive Translation Studies [En ligne]. [s.l.] : UCL Press, 2019. p. 71‑94. Disponible sur : < https://doi.org/10.2307/j.ctv6q5315.9 > (consulté le 23 mars 2022)ISBN : 978-1-78735-252-0.

Loffler-Laurian A.-M. La traduction automatique [En ligne]. [s.l.] : Presses universitaires du Septentrion, 1996. Disponible sur : < https://doi.org/10.4000/books.septentrion.74824 >ISBN : 978-2-85939-502-5.

Mazet F., Mikic J. « Traducteurs automatiques et apprentissage des langues ». p. 8.

Yvon F. « Les deux voies de la traduction automatique ». Hermes, La Revue. 28 novembre 2019. Vol. 85, n°3, p. 62‑68.

« What is Machine Translation? Rule Based vs. Statistical | SYSTRAN ». [s.l.] : [s.n.], [s.d.]. Disponible sur : < https://www.systransoft.com/systran/translation-technology/what-is-machine-translation/ > (consulté le 6 mai 2022)

J’ai testé pour vous : Différents aspects de la sensibilisation à la traduction automatique et la notion de traduction « non professionnelle »

Par Katarzyna Alekoglu , étudiante M2 TSM

Au-delà d’enrichir mes connaissances en métiers de la traduction, mon stage de Master 1 m’a permis de comprendre dans quelle mesure le rôle de fournisseur de services linguistiques s’avère important dans un contexte de crise sanitaire. Avec ma participation aux actions de l’agence, j’ai nettement renforcé mes connaissances pratiques dans la gestion de projets, la traduction, la révision, le service client et la rédaction. J’ai aussi gagné en quelques anecdotes que je voulais partager avec cette communauté. Ce billet de blog se développe ainsi au prisme de la problématique des différents acteurs de l’industrie face au concept de la sensibilisation à la traduction automatique ou bien « MT Literacy » en anglais.

L’expérience que j’ai acquise pendant mon stage m’a appris à optimiser l’utilisation de nombreuses langues et outils de productivité afin de travailler de manière plus efficace et efficiente au quotidien. L’une des choses que j’ai pu découvrir dans une nouvelle perspective est la façon exacte dont les gens perçoivent la traduction automatique (TA), que ce soit du point de vue d’un client, d’un collègue ou autre stagiaire, d’un chef de projet ou bien du PDG d’une entreprise spécialisée dans les services linguistiques.

Créativité : le dernier espoir ?

Lors d’une des conférences #LocFromHome, un événement de 12 heures sur la localisation organisé par SmartCAT, auquel j’ai assisté et sur lequel j’ai par la suite écrit mon premier billet de blog, j’ai écouté l’analyse d’Alex Chernenko, PDG de Translit, sur les dernières tendances en matière d’intelligence artificielle (AI) et d’apprentissage automatique (AA), ainsi que leur impact respectif sur l’industrie linguistique. Interrogé sur la célèbre citation d’Arle Richard Lommel, selon laquelle « la traduction automatique ne remplacera que ceux qui traduisent comme des machines, » il a souligné l’importance de créativité dans le travail humain, notamment dans le cadre du marché de localisation.

Si l’on sait qu’il existe une crainte générale des traducteurs professionnels à l’égard des progrès de cette technologie (Cadwell et al. 2018), la clé de succès de chaque traducteur professionnel aujourd’hui est effectivement de l’exploiter de façon productive et informée, et d’utiliser sa propre créativité pour conquérir le marché. De ce point de vue, on pourrait dire que malgré les changements en cours dans l’industrie de la langue, il existe de multiples solutions et des moyens par lesquels les utilisateurs professionnels, ainsi que des personnes individuelles peuvent s’adapter et même profiter de cette évolution. Cette découverte peut ensuite être suivie par une étape de sensibilisation de leurs collègues afin de contribuer au renforcement des connaissances continu sur cette technologie.

Par exemple, la post-édition des traductions automatiques (en anglais Machine Translation Post-Editing ou MTPE) est un sujet fascinant qui commence à gagner du terrain en dehors des études universitaires. Petit à petit, il démolit le stéréotype de la machine qui remplace progressivement l’humain et montre que nous pouvons coexister et utiliser la traduction automatique neuronale (NMT) comme n’importe quel autre outil d’aide à la traduction afin de produire un travail de haute qualité en moins de temps.

La TA parmi les étudiants

Le multitâche était l’une des compétences les plus importantes à maîtriser lors de mon stage de M1. Pendant des journées particulièrement chargées, lorsqu’il s’agissait de gérer un grand nombre de projets, il n’était pas rare de manquer de temps pour certaines tâches, notamment pour les délais les plus urgents. Parfois, quand un stagiaire recevait une demande de traduire un document plus long que d’habitude et qu’il ou elle parlait la langue source et la langue cible, il était possible de se charger de cette tâche à titre d’exercice pratique pour le stage. Une fois, ainsi, un collègue-stagiaire m’a demandé de relire sa traduction du français vers l’anglais afin de l’aider à respecter le délai du projet. Bien qu’il soit de langue maternelle française et non pas anglaise (je ne m’attendais donc pas à un très haut niveau d’idiomaticité), je n’ai pu m’empêcher de remarquer des tournures de phrases qui n’étaient pas du tout naturelles et j’ai vite compris que mon collègue s’était probablement servi de la traduction automatique pour gagner du temps.

Il a été prouvé que les étudiants d’aujourd’hui sont très favorables à la NMT et la considèrent comme un outil pratique qui peut facilement les aider à gagner du temps (Moorkens 2018). Qu’ils aient des connaissances approfondies des côtés positifs et négatifs de cette technologie ou non, ils ont tendance à avoir des doutes sur leurs instincts « naturels » et à recourir à la traduction automatique quand ils subissent une certaine pression, par exemple lors d’un examen à distance ou d’une semaine chargée pendant un stage. L’éducation étant plus numérisée que jamais, de tels cas sont de moins en moins rares, ce qui rend indispensable que tous les étudiants se familiarisent avec les bases de la traduction automatique, peut-être déjà à partir du cycle secondaire (Bourdais et Guichon 2020).

Les clients ont-ils le droit d’utiliser la TA ?

En tant que stagiaire en administration de bureau et gestion de projets, j’ai rencontré une grande variété de clients et de contextes situationnels qu’ils apportaient avec leurs demandes. On recevait parfois un message avec une demande de révision d’un texte déjà traduit. Un jour, on m’a attribué une tâche de révision d’un article, où il était évident que la traduction avait été faite par l’un des services de traduction automatique en ligne les plus connus. Les excuses les plus courantes pour ce type de demande étaient l’argent et le manque de communication. Quoi qu’il en soit, il était nécessaire que le client soit traité et qu’il se sente respecté. Dans ce genre de cas, ma stratégie consistait à proposer deux montants préalablement convenus avec l’une des cheffes de projet avant d’envoyer le devis au client : le premier prix correspondait à la relecture du document en question et le deuxième, souvent légèrement inférieur, au service de MTPE, à condition que le client fournisse le document dans sa langue d’origine. Il s’agissait ici d’un moyen efficace de récupérer le texte original pour assurer un bon rendu final et le client était heureux de recevoir un service de haute qualité dont le coût ne dépassait pas ses attentes.

La traduction non professionnelle

Cette anecdote n’est qu’un exemple parmi de nombreux cas que je connais, où une personne a décidé de recourir à la traduction automatique. Ce phénomène peut être comparé à celui des traducteurs « non professionnels, » c’est-à-dire des personnes qui pratiquent la traduction seulement sur la base d’un bilinguisme et non de formation dédiée. La traduction non professionnelle est un terme abordé par Luis Pérez-González, professeur de traductologie au département des langues étrangères et de la traduction à l’Université d’Agder en Norvège. Le professeur explique qu’il s’agit, en effet, d’un cas de majorité (Pérez-González 2012) :

« La traductologie, en tant que domaine d’étude, s’adresse potentiellement à un domaine conceptuel et discursif beaucoup plus vaste. Certains diraient même que c’est la traduction professionnelle, plutôt que non professionnelle, qui devrait être perçue comme l’exception dans le contexte plus large de la traduction. Si l’on considère la question sous cet angle, la traduction professionnelle devient simplement un sous-type de traduction, plutôt que la forme prototypique et normative. Les termes utilisés pour désigner le phénomène de la traduction et de l’interprétation non professionnelles (scanlation, romhacking, language brokering, parmi d’autres exemples en anglais) sont désormais très variés et rappellent avec force que la traduction et l’interprétation non professionnelles sont aussi bien, voire plus établies et diversifiées que la traduction et l’interprétation professionnelles. »

Beaucoup de personnes maîtrisant plus d’une langue se retrouvent dans des situations où elles exercent la traduction non professionnelle dans leur vie quotidienne. Cette expérience m’a fait prendre conscience que chaque personne qui s’intéresse à la traduction ne doit pas nécessairement concentrer toute sa vie ou son temps libre à cette tâche et ne doit donc pas non plus être privée des informations vérifiées sur le développement du marché de la traduction, à savoir la NMT. En revanche, à l’instar de l’apprentissage des langues en soi, l’intérêt porté au domaine de la traduction devrait être utilisé comme une opportunité et non comme un obstacle.

Conclusion

En pratique, si un client décide de se servir la traduction automatique, que ce soit en raison d’un manque de compétences, du temps ou de l’argent, et qu’il demande l’aide d’un traducteur professionnel, il convient de respecter son initiative et sens des responsabilités, tout en lui fournissant un service de qualité et des informations utiles sur les enjeux de la traduction automatique. À une époque fondée sur l’intelligence artificielle et l’apprentissage automatique, cette approche peut contribuer, et contribue effectivement, à une sensibilisation accrue et plus répandue à la traduction automatique (Bowker 2021), non seulement parmi les experts, mais aussi auprès du grand public. Une éthique de travail correcte et adaptée rendra alors ce terme moins effrayant et plus familier pour tout le monde, professionnels ou non.

Sources

Alekoglu, K. (2021, juin 15). Retour d’expérience : Conférence virtuelle sur la localisation #LocFromHome « Mettez-vous à la place de votre client. » MasterTSM@Lille. https://mastertsmlille.wordpress.com/2021/06/15/retour-dexperience-locfromhome/

Alekoglu, K. (2021). Traduction, gestion de projets, marketing et soutien aux actions administratives auprès d’un prestataire de services linguistiques. Rapport de stage. Master 1 Traduction Spécialisée Multilingue, Université de Lille.

Bourdais, A. ; Guichon, N. (2020). Représentations et usages du traducteur en ligne par les lycéens. Alsic, v. 23, n. 1. https://doi.org/10.4000/alsic.4533

Bowker, L. (2021, février 1). Translation: It’s not just for translators! The Our Languages Blog – Resources of the Language Portal of Canada – Languages – Canadian Identity and Society – Culture, History and Sport – Canada. https://www.noslangues-ourlanguages.gc.ca/en/blogue-blog/traduction-translation-eng

Cadwell, P. ; O’Brien, S. ; Teixeira, C. S. C. (2018). Resistance and accommodation: Factors for the (non-) adoption of machine translation among professional

translators. Perspectives, 26(3), 301–321. https://doi.org/10.1080/0907676X.2017.1337210

Moorkens, J. (2018). What to expect from Neural Machine Translation: A practical in-class translation evaluation exercise. The Interpreter and Translator Trainer, 12(4), 375–387. https://doi.org/10.1080/1750399X.2018.1501639

Pérez-González, L. (2012). Non-professionals Translating and Interpreting: Participatory and Engaged Perspectives. The Translator, 18(2), 18.

Smartcat. (2021). Alex Chernenko: Disruptive Trends in Multimedia Localization, Speech-to-Text, and Video Streaming. YouTube. Retrieved 26 June 2021, from https://www.youtube.com/watch?v=_HkLOA32MHM

Retour d’expérience : #TranslationCafé, Littératie de la traduction automatique

Par Sophie Vandenmersch, étudiante M1 TSM

Qu’on l’adopte ou non, la traduction automatique (TA) ou traduction machine s’implante de plus en plus dans le secteur. En 2016, la traduction automatique neuronale (TAN) fait son apparition dans le grand public avec Google Traduction, qui a développé son propre système de TAN appelé Google Neural Machine Translation (lien en anglais). Le principe repose sur des réseaux neuronaux profonds qui fonctionnent grâce à l’apprentissage profond (deep learning), un type d’intelligence artificielle. L’année suivante, DeepL, un autre système de TAN également accessible en ligne, voit le jour. Cependant, leur utilisation éclairée requiert d’en comprendre les tenants et aboutissants. Pour en savoir un peu plus, j’ai décidé de participer à la conférence organisée par #Translationcafé qui s’est déroulée le 22 avril dernier et de vous partager quelques points abordés.

Le #TranslationCafé, kézako ?

Il s’agit d’une table ronde mensuelle en ligne, au cours de laquelle trois spécialistes de la traduction échangent de façon informelle autour d’une thématique liée au monde de la traduction. Elle a lieu à 16 heures (heure française) et dure une heure. Les sujets sont divers et variés : de l’histoire de la traduction des langues asiatiques jusqu’au sous-titrage, en passant par l’impact de la crise sanitaire dans le secteur. Les internautes ont la possibilité de poser des questions en direct. Enfin, cet évènement est libre d’accès, sur simple inscription.

Cette deuxième édition portait sur la littératie de la traduction automatique (Machine Translation literacy) avec pour invités : Lynne Bowker, professeure de traduction et sciences de l’information à l’Université d’Ottawa, Lettie Dorst, professeure de linguistique anglaise et de traduction à l’Université de Leyde, et Rudy Loock, professeur de traductologie et de linguistique anglaise à l’Université de Lille.

Dans quelle mesure et comment les professionnels des langues peuvent-ils assister le grand public dans l’utilisation et la confiance en la traduction automatique ?

Lynne Bowker : Tout d’abord, selon moi, la littératie de la traduction automatique suppose certains pré-requis à une utilisation efficace et réfléchie. Contrairement aux autres types de connaissances informatiques, celle-ci relève plus d’un processus cognitif que technique. Autrement dit, de savoir si le contenu à traduire se prête à la TA ou non, mais aussi comment optimiser le résultat, en pré-éditant le texte source par exemple. Trois grandes catégories de personnes utilisent la TA :

  • le grand public, à des fins personnelles ;
  • les professionnels de la traduction souhaitant intégrer la TA dans leur processus ;
  • les étudiants en langues ou linguistique.

Toutes ces personnes ont des connaissances relatives à la traduction et des finalités différentes. De ce fait, l’enseignement doit être adapté aux différents types d’utilisateurs pour répondre à leurs besoins respectifs. Je constate un manque d’objectivité de la part de certains acteurs du monde de la traduction, qui ont tendance à véhiculer une image catastrophique de la TA. Ces idées reçues ne renseignent en aucun cas le grand public qui, en fin de compte, l’utilisera tout de même, donc autant les aider à utiliser cet outil de la manière la plus éclairée possible.

Lettie Dorst : Je confirme dans la mesure où ces affirmations, quelles qu’elles soient, n’instruisent en rien l’utilisateur lambda. J’ai remarqué qu’il y a deux types de messages qui reviennent concernant l’informatique en général : soit tout fonctionne à merveille, soit pas du tout. Certes, grâce à la traduction automatique, nous obtenons une certaine équivalence linguistique concernant la syntaxe et la terminologie, mais le travail des traducteur ne se résume pas à cela. C’est une des problématiques que j’aborde dans le cadre de mon projet sur la traduction automatique (lien en anglais). Techniquement, il ne s’agit pas de « traduction automatique », car ce n’est pas de la traduction à proprement parler, mais plutôt une application d’algorithmes informatiques. J’enseigne à mes étudiants que c’est une machine qui ne comprend pas ce qu’elle produit, qui ne lit pas le texte et qui ne communique rien du tout. Ils adoptent en conséquence un raisonnement plus critique, notamment pour une éventuelle utilisation ainsi que les motifs de cette démarche.

Rudy Loock : En effet, la TA est trop facile d’utilisation. Je le constate avec les étudiants qui, qu’ils soient en traduction ou non, accordent une confiance totale à ce que la machine propose. Ce qui apparaît à l’écran n’est jamais exact et, de fait, il est impératif de disposer d’un esprit critique. Les étudiants toutes spécialités confondues utilisent la TA. La technologie a ses limites, car on y rencontre des problèmes de richesse lexicale, des ambiguïtés, et elle peut même générer un langage discriminatoire. Concernant les étudiants en traduction, l’enseignement de la TA est abordé sous un autre angle, étant donné qu’ils ont une différente approche envers cet outil. Lors d’un projet de traduction, ils doivent être en mesure de déterminer si la TA peut intégrer le processus traductif. De plus, le type d’outil a aussi son importance, car à l’heure actuelle, les entreprises développent leurs propres outils de TA. Je dirais qu’une sensibilisation à la TA est donc impérative et doit être définie selon le profil de l’utilisateur.

Le processus cognitif n’est pas le même en traduction ni en révision ou bien en post-édition, et je crains que, en ayant recours à cette dernière, les étudiants en oublient la formation à l’élaboration d’une traduction et aux processus cognitifs qui y sont liés.

LD : Avant toute chose, je pense qu’il faut garder en tête le profil des étudiants dont il est question, notamment s’il s’agit d’étudiants en langues, en traduction ou d’étudiants d’autres filières qui utilisent la TA comme simple outil. Concernant les étudiants en traduction, il est capital d’approfondir leurs propres compétences en traduction, de même que pour la relecture, tout en les couplant à l’utilisation d’outils de TAO. En outre, ils doivent apprendre à la fois la révision et la post-édition. Lorsque je corrige des travaux d’étudiants, ils sont en mesure de différencier chacune de ces tâches, les compétences liées à celles-ci, qui se complètent les unes les autres. Avec la pratique, ils se rendent compte qu’il s’agit d’opérations bel et bien distinctes. J’estime qu’il est de notre devoir de faire prendre conscience à nos étudiants de leurs forces et faiblesses. Certains sont très à l’aise en traduction et moins en révision. L’inverse est aussi vrai. D’autres brillent en post-édition ; en revanche, ils feraient de mauvais traducteurs. D’autres encore sont de très bons traducteurs mais ne remarquent pas les erreurs produites par la TA ou ne savent pas comment les corriger sans retraduire de zéro.

RL : Traduire et post-éditer sont deux tâches différentes en effet. La plupart conviendra qu’on ne peut être un bon post-éditeur sans être au départ un bon traducteur, la difficulté principale étant de corriger les erreurs et d’améliorer le résultat généré par la machine. Pour appuyer le fait que le traducteur humain doit rester au cœur du processus traductif, certains parlent de « traduction orientée vers l’humain » (human-centered translation).

LB : La question de l’introduction des outils de TA ne date pas d’hier, même quand celle-ci ne jouait pas encore un rôle majeur. Cette même problématique s’est posée lors de l’arrivée des mémoires de traduction. Il n’existe aucune solution prédéterminée. D’une part, posséder de bonnes compétences traductionnelles serait bénéfique à une utilisation efficace de la TA. D’autre part, la post-édition est une compétence, tout comme la traduction, qui peut être améliorée au fil du temps. Par conséquent, il subsiste un certain avantage à l’introduire tôt et à développer lesdites compétences en parallèle. Certains étudiants sont susceptibles de se spécialiser en post-édition. A contrario, on trouve des étudiants destinés à devenir traducteurs et qui vont se servir de leur expérience en TA afin de défendre leur valeur ajoutée lors du processus traductif. Je suis d’avis que les traducteurs et post-éditeurs peuvent se compléter.

Comme le résultat de la TA est une probabilité statistique d’une proposition de traduction, serait-il pertinent de former les utilisateurs afin de déterminer si une suggestion n’a rien à voir avec le sens du texte source ?

RL : Tout à fait. Pour moi cela fait partie des notions à acquérir, et cela vaut également pour la langue maternelle. Pour ce faire, une maîtrise de la langue cible est de rigueur.

LB : Une majeure partie du métier de traducteur et l’utilisation de la TA consiste en des prises de décisions et d’appréciations. Un outil de TA, qui repose en partie sur la probabilité statistique, fera en sorte de suggérer une proposition de traduction. Vient le rôle du traducteur de se prononcer pour un choix plutôt qu’un autre.

Un module dédié à la sensibilisation à la TA dans l’enseignement secondaire serait-il judicieux ?

RL : Personnellement, je ne consacrerais pas de cours spécifique à la TA, même pour les étudiants de licence. Il aurait plutôt sa place en cours de langues ou de traduction.

LD : Je l’aurais intégré aux modules du tronc commun de première année à l’université qui abordent l’accès, l’utilisation des plateformes universitaires en ligne ainsi que l’utilisation des logiciels de bureautique.

LB : Je pense que les étudiants en fin de cycle secondaire ou au début à l’université sont les cibles idéales, étant donné qu’ils commencent à forger leur propre opinion. Cependant,associer des cours de sensibilisation à la TA exclusivement aux cours de langues serait réducteur, car une grande majorité d’utilisateurs lambda de la TA ne parlent pas la langue source.

Avoir recours à un outil gratuit permettrait au site d’exploiter nos données afin d’enrichir leurs services. Quels sont les risques et problèmes ?

LB : Tout dépend du type de contenu. S’il contient des informations sensibles, il est préférable de faire preuve de conscience professionnelle en respectant le souhait du client, et donc de s’en abstenir. Il ne faut pas hésiter à en discuter avec le client ; la solution parfaite n’existe pas.

RL : L’éthique fait partie des fondamentaux, notamment pour les futurs professionnels de la traduction. Négliger cet aspect peut engendrer de lourdes répercussions, comme l’illustre cette histoire (en anglais) d’une agence de voyages norvégienne dont les informations confidentielles ont été exposées au grand public, à la suite de l’utilisation d’un outil de TA en ligne gratuit. J’ajoute que, pour avoir un outil de TA efficace, ce dernier doit être alimenté par des données de qualité, issues de corpus parallèles de traductions réalisées par des humains. Lorsqu’on utilise un outil de TA, il est important de savoir sur quelles bases de données il a été créé. Quant à la collecte des données et à l’accord des utilisateurs, c’est une autre histoire. Bien sûr, l’éthique est essentielle à une utilisation éclairée de la TA par les professionnels du secteur, mais elle concerne tout autant les utilisateurs lambda.

LD : Ce qui est étonnant, c’est que les gouvernements ne prennent pas position sur ce sujet. Prenons l’exemple des Pays-Bas : par manque de traductions officielles, la population s’en remet à la TA pour comprendre les informations personnelles à caractère médical qui leur sont transmises. De plus,le service de l’immigration communique uniquement en néerlandais. Les traducteurs se retrouvent à gérer la question de l’éthique alors que ce ne sont pas les seules personnes à blâmer. Je pense qu’il faudrait aborder le sujet avec ceux qui obligent à utiliser la traduction machine. Dans les Conditions générales d’utilisation de ces outils, il est clairement mentionné que ces derniers sont en mesure de publier le contenu. Par ailleurs, Google lui-même indique que son outil de TA ne remplace pas la traduction humaine.

Comment utiliser la TA de façon responsable et éthique ?

LB : Il s’agit d’une question de morale. Si vous n’êtes pas disposé à l’utiliser, alors ne le faites pas. À mon avis, les utilisateurs prennent des décisions, mais pas en toute connaissance de cause, ou alors ils font au mieux avec ce qu’ils ont sous la main. En tant que représentants du domaine, notre rôle est d’informer le grand public. Pour finir, pourquoi devrions-nous attendre des personnes n’étant pas issues du métier de tout savoir sur ce que nous avons mis cinq à dix ans à apprendre ?

J’étudie la traduction et redoute le jour où l’on me demandera uniquement de post-éditer. Partagez-vous cette inquiétude ?

LD : Il faut s’en inquiéter seulement si vous n’excellez pas en traduction. Certes, de plus en plus d’agences tentent d’instaurer la traduction automatique, mais j’ai aussi l’impression que les étudiants ignorent une partie du secteur de la traduction où la TA n’est pas de mise et où est pratiquée une bien meilleure rémunération. Enfin, certains étudiants préfèrent post-éditer, et le résultat est satisfaisant. Je suis certaine que chacun y trouvera son compte.

LB : Comme mentionné auparavant, tous les types de contenu ne sont pas adaptés à la TA. De fait, les traducteurs humains ont une plus-value à faire valoir. C’est ce que nous explique dans cette vidéo David Jemielty, responsable du département des traductions à la Banque Cantonale Vaudoise (BCV).

Pour aller plus loin concernant la TA et les étudiants, je vous invite à consulter cet article rédigé par mes collègues de formation.

Un grand merci au #Translationcafé d’avoir accepté que je revienne sur cette table ronde dans le cadre du blog du Master TSM.

Retrouvez toutes les actualités du #TranslationCafé sur le compte Twitter (en anglais) : @LetsTalkXl8.

Ce billet est une retranscription partielle des propos énoncés.

Sources :

Ahmad, Sami. 2017. « Google Neural Machine Translation – AI to Improve Translation Accuracy ». Technobyte. 28 avril 2017. https://technobyte.org/google-neural-machine-translation-translate/.

Gouvernement du Canada, Services publics et Approvisionnement Canada. 2020. « Littératie de la traduction automatique : pour une éthique de l’intérêt commun – Blogue Nos langues – Ressources du Portail linguistique du Canada – Langues – Identité canadienne et société – Culture, histoire et sport – Canada.ca ». 19 octobre 2020. https://www.noslangues-ourlanguages.gc.ca/fr/blogue-blog/litteratie-traduction-automatique-machine-translation-ethics-fra.

« O’Brien et Ehrensberger-Dow – 2020 – MT Literacy—A cognitive view.pdf ». s. d. https://digitalcollection.zhaw.ch/bitstream/11475/20864/3/2020_OBrien-Ehrensberger-Dow_MT-Literacy_JBE.pdf.

O’Brien, Sharon, et Maureen Ehrensberger-Dow. 2020. « MT Literacy—A Cognitive View ». Translation, Cognition & Behavior 3 (2): 145‑64. https://doi.org/10.1075/tcb.00038.obr.

« Traduction automatique : faire les bons choix avant de commencer ». 2021. MasterTSM@Lille (blog). 14 février 2021. https://mastertsmlille.wordpress.com/2021/02/14/traduction-automatique-faire-les-bons-choix-avant-de-commencer/.

« Traduction automatique : les algorithmes ont-ils des préjugés ? » 2019. MasterTSM@Lille (blog). 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/.

« Traduction automatique : nouvelle alliée des étudiants en traduction ? » 2020. MasterTSM@Lille (blog). 13 décembre 2020. https://mastertsmlille.wordpress.com/2020/12/13/traduction-automatique-nouvelle-alliee-des-etudiants-en-traduction/.

Traduction, par Colivia. 2021. « Le Deep Learning en traduction automatique, qu’est-ce que c’est ? » Colivia Traduction (blog). 28 mai 2021. https://colivia-traduction.com/le-deep-learning-en-traduction-automatique-quest-ce-que-cest/.

« Translate.Com Exposes Highly Sensitive Information in Massive Privacy Breach ». 2017. Slator. 7 septembre 2017. https://slator.com/technology/translate-com-exposes-highly-sensitive-information-massive-privacy-breach/.

Translating for Europe. s. d. #2019TEF – KEYNOTE SPEECH – The added value of translation. https://www.youtube.com/watch?v=qGGaEnRECHc.

« #Translation Cafe ». s. d. Eventbrite. https://www.eventbrite.co.uk/e/136411876595?aff=efbneb.

« Understanding (the Value of) Machine Translation ». s. d. Leiden University. https://www.universiteitleiden.nl/en/news/2020/05/understanding-the-value-of-machine-translation.

J’ai testé pour vous… Microsoft Translator

Par Ophélie Douchet, étudiante M1 TSM

De plus en plus de géants de l’informatique lancent leur propre moteur de traduction automatique, c’est pourquoi aujourd’hui je m’intéresse à l’application Microsoft Translator, disponible sur iOS et Android. Cette application, disponible au grand public, permet de traduire dans plus de 70 langues, mais la qualité de traduction est-elle vraiment au rendez-vous ? Sans plus tarder, découvrons ensemble ce qu’elle a à nous offrir.

INTERFACE

L’interface est très simple d’utilisation et minimaliste, elle dispose de quatre icônes, chacune proposant un mode de traduction : vocale, textuelle, en conversation instantanée et par la caméra. En arrière-plan, nous apercevons l’image floue d’un coucher de soleil aux couleurs apaisantes, invitant au voyage.

FONCTIONNALITÉS

  • Tout d’abord, en sélectionnant l’icône avec le clavier vous obtiendrez la traduction textuelle. Vous n’avez qu’à taper votre texte et l’application traduira dans la langue cible que vous aurez choisie parmi 91 langues.

J’ai donc voulu tester cette fonctionnalité en écrivant le titre d’un article paru dans The Scientific American (article américain) et voici le résultat :

Le titre An Immune Protein Could Prevent Severe COVID-19—if It Is Given at the Right Time a été traduit par : « Une protéine immunitaire pourrait prévenir covid-19 grave – si elle est donnée au bon moment. ».

Vous remarquerez que c’est une traduction très littérale qui a peu de sens. De plus, elle porte toujours les marques de l’anglais. On retrouve la présence du tiret cadratin, typique d’un titre anglais. Ce ne serait donc pas acceptable pour un titre d’article en français. En effet, cet article américain a une traduction officielle publiée sur le magazine français Pour la Science. Dans ce cas, le titre a été traduit par : « Une arme à double tranchant contre le Covid-19 ». Il est traduit de manière totalement différente et est plus court, ce qui est plus commun pour des articles français. De plus, comparé au titre américain qui révèle le sujet qui va être abordé, dans le titre français on laisse une sorte de suspens : une stratégie journalistique pour donner envie au lecteur de poursuivre sa lecture, ce que les moteurs de traduction automatique ne sont pas encore capables de faire.

Sans surprise, la différence entre la traduction professionnelle et la traduction automatique est donc flagrante ici.

Il me semble également important de préciser que l’application ne fait pas de différence entre l’anglais américain et l’anglais britannique. C’est pourquoi j’ai voulu tester si l’application était programmée pour traduire en anglais américain ou britannique. J’ai donc écrit la phrase suivante dans Microsoft Translator : « Son théâtre préféré se trouve dans le centre-ville. ». Ces mots s’écrivent différemment lorsqu’ils sont employés en anglais américain ou en anglais britannique. Je vous laisse alors découvrir avec quelle variété d’anglais l’application a traduit :

Cette phrase a donc été traduite en anglais britannique. En effet, le mot favourites’écrit favoriteen américain. Il en va de même pour theatre qui donnerait theater et centredonnerait center.

  • Ensuite, l’icône avec le micro permet d’activer la traduction vocale, il vous suffit de parler pour obtenir une traduction dans la langue cible choisie parmi 47 langues.

Les moteurs de traduction automatique sont connus pour reproduire les préjugés. C’est pourquoi j’ai voulu vérifier si cette application reproduisait les stéréotypes sexistes, comme l’a fait Margaux dans son billet de blog pour l’application « Traduire », disponible sur iPhone. J’ai donc repris le même exemple pour pouvoir comparer les deux applications :

Comme l’explique Estelle Peuvion dans son billet de blog, les métiers scientifiques sont directement associés aux hommes alors que les métiers de soins sont associés aux femmes, comme on le voit ici avec le mot “nurse” qui a été traduit par « infirmière ». Pour aller plus loin, j’ai clairement précisé que l’infirmier était un homme : “This nurse is a man”, mais l’application a traduit : « Cette infirmière est un homme ». Donc, comme l’application Traduire, Microsoft Translator reproduit les stéréotypes, prétendant que “nurse” est forcément une infirmière et non pas un infirmier.

  • L’icône avec l’appareil photo vous permettra de prendre en photo un texte pour que Microsoft Translator le traduise dans la langue cible de votre choix.

Pour cette fonctionnalité, j’ai donc pris en photo une annonce d’une maison à vendre en Angleterre et voici le résultat :

Je voulais tester si l’application était apte à localiser les prix et les unités de mesure. On peut observer que le prix en livre n’a pas été converti en euro et qu’il porte toujours les marques de l’anglais avec la virgule. Or, en français, il est préférable d’ajouter une espace insécable ou un point pour séparer les centaines des milliers. À l’inverse, les unités de mesure ont été localisées : “3.3 miles” : « 5.3 km ». On notera tout de même qu’en français on ne met pas de point, mais une virgule pour les unités de mesure, ce qui donnerait « 5,3 km ».

  • La dernière icône vous permettra de converser avec de tierces personnes ne parlant pas votre langue et disposant également de l’application. Pour cela, vous devez créer un salon de conversation et les personnes avec qui vous souhaitez discuter n’auront qu’à entrer un code dans l’application. Ainsi, vous pourrez parler en gardant votre langue maternelle et la tierce personne recevra votre message directement traduit dans sa langue.

Un carnet de phrases est également disponible. Il s’agit de phrases simples et courantes qui peuvent être très utiles lorsque l’on est dans un pays où nous ne connaissons pas la langue. Les phrases sont triées et ajoutées dans différentes catégories pour faciliter l’utilisation :

Ces phrases peuvent être prononcées par l’application en cliquant sur l’icône du son mais aussi être ajoutées en favoris grâce à l’étoile située sur la droite.

Microsoft Translator peut être utilisé hors connexion. Plutôt utile si vous êtes à l’autre bout du monde sans internet ! Pour cela, il vous faut télécharger les bases de données de la langue de votre choix, disponible dans les paramètres. Toutefois, je n’ai pas d’informations sur le corpus utilisé par ce moteur de traduction automatique.

Microsoft Translator est donc très utile pour « dépanner » lorsque vous ne connaissez pas la langue et que vous souhaitez communiquer ou lors d’un séjour à l’étranger. Cependant, pour un usage professionnel, nous avons vu que cette application commettait beaucoup d’erreurs. Microsoft Translator ne serait donc pas profitable pour des traducteurs.rices. À l’instar de tous les moteurs de traduction automatique, il faut rester vigilant sur la qualité de traduction proposée. Bien entendu, pour chaque traduction proposée il existe plusieurs solutions possibles.

Toutes les photos sont des captures d’écran de l’application mobile Microsoft Translator.

App Store. « ‎Microsoft Translator ». https://apps.apple.com/fr/app/microsoft-translator/id1018949559.

Landhuis, Esther. « An Immune Protein Could Prevent Severe COVID-19&mdash;If It Is Given at the Right Time ». Scientific American. https://www.scientificamerican.com/article/an-immune-protein-could-prevent-severe-covid-19-if-it-is-given-at-the-right-time1/.

laujan. « Service Microsoft Translator – Azure Cognitive Services ». https://docs.microsoft.com/fr-fr/azure/cognitive-services/translator/translator-info-overview.

Mackowiak, Margaux. « J’ai testé pour vous… Traduire, la nouvelle application de traduction d’Apple » MasterTSM@Lille, 3 janvier 2021. https://mastertsmlille.wordpress.com/2021/01/03/jai-teste-pour-vous-traduire-la-nouvelle-application-de-traduction-dapple/.

Microsoft Translator for Consumers. « Microsoft Translator ». https://www.microsoft.com/en-us/translator/.

Microsoft Translator pour les consommateurs. « Fonctionnalités de l’application-Microsoft Translator ». https://www.microsoft.com/fr-fr/translator/apps/features/.

Peuvion, Estelle. « Traduction automatique : les algorithmes ont-ils des préjugés ? » MasterTSM@Lille, 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/.

« Une arme à double tranchant contre le Covid-19 », Pour la Science. https://www.pourlascience.fr/sr/actualites/une-arme-a-double-tranchant-contre-le-covid-19-20150.php.

La traduction automatique, mère des activités TAL

Par Louison Douet, étudiante M1 TSM

Le lien entre la traduction et les activités du TAL, ou de l’espionnage des Russes pendant la Guerre Froide à Siri, Alexa et DeepL. Si, vraiment. J’ai sauté de nombreuses étapes mais c’est bien ça dans les grandes lignes. Laissez-moi vous présenter le TAL ou Traitement Automatique des Langues.

Les débuts de la TA – Le TAL hier

Cette discipline impliquant la linguistique, l’informatique et l’intelligence artificielle est bel et bien née des besoins de traductions pendant la Guerre Froide, et si son usage premier a été le développement de technologies de traduction automatique (TA) assez performantes pour décoder les messages des Russes, son emploi est maintenant beaucoup plus diversifié.

Mais revenons au tout début : après la naissance de l’informatique, les premiers pas dans la recherche en Traduction Automatique se font par Yehoshua Bar-Hillel au Massachussets Institute of Technology (MIT) en 1952, suivis deux ans plus tard de la première expérience du russe vers l’anglais. Le TAL vise alors le traitement automatique des conversations et n’a pour but que le déchiffrage du russe. L’engouement pour ces nouvelles disciplines est mondial, des conférences et des associations sont créées tout au long du reste de la décennie comme l’ATALA en France (Association pour l’étude et le développement de la Traduction).

Le déclin est toutefois inévitable dans les années 60 lorsque le rapport ALPAC (Automatic Language Processing Advisory Committee) constatant l’écart entre les résultats attendus et ceux obtenus entraine l’arrêt des financements et l’abandon des recherches. C’est pourtant pendant cette période que le TAL obtient l’une de ses premières victoires avec l’automate conversationnel ELIZA qui parvient à duper un humain. Des groupes ont malgré tout persisté et leur succès a porté le regain d’intérêt tout en ouvrant la voie vers l’ampleur que l’on connaît actuellement. On trouve parmi eux Systran, l’une des plus anciennes entreprises en TA, créée en 1968 par Peter Toma, en collaboration avec l’US Air Force et la NASA et bénéficiant de financement par la Communauté européenne, elle est à l’origine du premier logiciel de traduction du russe vers l’anglais.

Et maintenant ? Le TAL aujourd’hui

La démocratisation d’Internet et du web au début des années 90 marque la renaissance complète de la traduction automatique. Pour faire simple, l’accès du grand public, majoritairement non-anglophone, relance les besoins de déchiffrage d’une langue vers l’autre. Ce changement d’emploi de la TA implique également une diversification de celui des activités du TAL qui cherche maintenant à transformer les formes linguistiques en objets informatiques en créant des outils de traitement de la langue naturelle, soit l’intégration aux machines du langage humain. Et si ses domaines d’application ne sont plus simplement centrés sur la traduction, elle reste son utilisation principale et la plus connue, notamment sous la forme de moteurs en ligne tel que Google Traduction et DeepL.

Pourtant, le TAL est un domaine bien plus répandu qu’on pourrait le croire. Il concerne et s’applique à de nombreuses disciplines diverses et variées, recouvrant évidemment l’intelligence artificielle et l’informatique, mais aussi la linguistique, la communication ou les sciences sociales. Vous ne vous en doutez sûrement pas, mais ses applications sont partout dans notre quotidien moderne, car le TAL est derrière la reconnaissance vocale présente dans la plupart des appareils numériques comme les téléphones, tablettes, ordinateurs ou encore enceintes connectées. Oui, je vous l’avais annoncé, c’est bien ce qui se cache derrière Siri et Alexa. Dans ces cas-là, il permet aux appareils d’opérer la synthèse vocale pour le traitement de l’oral afin de retranscrire le parler en une requête compréhensible mais aussi de nous répondre grâce à une voix synthétique.
On le retrouve également derrière les chatbots qui assurent une assistance robotique, ainsi que dans la correction orthographique automatique ou les générateurs de textes déchiffrant l’écriture manuscrite et la dictée et ceux capables de créer des textes sur la base d’un corpus.

Le futur de ces technologies – Le TAL demain

L’amélioration constante due à la part toujours plus importante de l’informatique dans nos vies a fait de la traduction automatique un outil des plus intéressant et a permis l’augmentation des domaines d’applications du TAL. Pourtant, tous ces progrès et avancées, comme la traduction automatique neuronale, n’ont toujours pas atteint les objectifs premiers d’imitation de l’humain, si bien que l’automatisation des activités langagières « intelligentes » n’est pas pour autant gagnée. En clair, il y a encore beaucoup de chemin à faire avant que la TA et le TAL atteignent un niveau semblable à celui d’un humain. Et ce, malgré les efforts joints de nombreux professionnels spécialistes des langues, de l’informatique et de l’humain qui collaborent pour élaborer des modèles toujours plus performants.

Cette problématique et cette collaboration ont donné naissance à la post-édition, nouvelle activité dans le secteur de la traduction, qui loin de représenter une concurrence, est une véritable spécialisation nécessitant une très bonne maîtrise de la traduction ainsi que des connaissances des technologies du TAL. À l’heure actuelle, l’intervention humaine reste absolument nécessaire en préparation ou en révision afin d’obtenir un rendu à la qualité au moins égale à l’humain, et ce tout particulièrement pour la traduction automatique car bien qu’elle soit à l’origine du TAL, elle n’est toujours pas assez perfectionnée et présente encore un certain nombre de problèmes

Bibliographie

Chaumartin, François-Régis, et Pirmin Lemberger. Le traitement automatique des Langues : Comprendre les textes grâce à l’intelligence artificielle. Dunod, 2020, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/catalog/book/88882034.

Delafosse, Lionel.Traitement Automatique des Langues. [en ligne] https://ldelafosse.pagesperso-orange.fr/Glossaire/Tal.htm. Consulté le 4 mars 2021.

Fabien, Maël. « Traitement Automatique du Langage Naturel en français (TAL / NLP) ». Stat4decision, 3 novembre 2019, [en ligne] https://www.stat4decision.com/fr/traitement-langage-naturel-francais-tal-nlp/.

Gilloux, Michel. « Traitement automatique des langues naturelles ». Annales Des Télécommunications, vol. 44, no 5, mai 1989, p. 301‑16. Springer Link, doi:10.1007/BF02995675.

Introduction au TAL – Cours_de_TAL. [en ligne] https://sites.google.com/site/coursdetal/introduction-au-tal. Consulté le 1 mars 2021.

Léon, Jacqueline. « Conceptions du “mot” et débuts de la traduction automatique ». Histoire Épistémologie Langage, vol. 23, no 1, Persée – Portail des revues scientifiques en SHS, 2001, p. 81‑106. http://www.persee.fr, doi:10.3406/hel.2001.2819.

L’Homme, Marie-Claude, et Sylvie Vandaele. Lexicographie et terminologie : Compatibilité des modèles et des méthodes. Presses de l’Université d’Ottawa, 2007, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/book/88867985.

Moreh, Jack. Back to school – Study concept, 14 septembre 2015. [Illustration]. Back to school – Study concept – Free Stock Photo by Jack Moreh on Stockvault.net

Poibeau, Thierry. « Le traitement automatique des langues pour les sciences sociales ». Reseaux, vol. n° 188, no 6, La Découverte, 2014, p. 25‑51.

Quirion, Jean. Dans tous les sens du terme. Presses de l’Université d’Ottawa, 2013, https://univ-scholarvox-com.ressources-electroniques.univ-lille.fr/book/88820249.

« TRAITEMENT AUTOMATIQUE DES LANGUES ». Encyclopædia Universalis, [en ligne] https://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/. Consulté le 27 février 2021.

Yvon, François. Une petite introduction au Traitement Automatique.pdf. https://perso.limsi.fr/anne/coursM2R/intro.pdf. Consulté le 27 février 2021.

Traduction automatique : faire les bons choix avant de commencer

Par Élise Ventre, étudiante M2 TSM

La traduction automatique devient un outil incontournable du marché. Il existe beaucoup de documentation à son sujet. Elle est parfois présentée comme l’avenir de la traduction. On peut même trouver des articles qui comparent les différents outils. Mais avant de l’utiliser, faisons un tour d’horizon des éléments à prendre en compte avant de décider si elle sera, ou non, adaptée à un projet.

Collaboration entre l’humain et la machine

Quand on parle de traduction automatique, il ne s’agit pas de laisser la machine travailler seule. On ne va pas rentrer du texte dans un moteur de traduction automatique et livrer tel quel ce qui en sort. C’est un outil d’aide à la traduction, parmi tant d’autres (logiciels de TAO, dictionnaires ou corpus), que l’on peut décider d’intégrer à notre processus de traduction.

Ainsi, en associant traduction automatique et les logiciels de TAO, on obtiendra une traduction de meilleure qualité en bénéficiant des remontées des mémoires de traduction. Ensuite, les phrases qui ne peuvent pas en bénéficier seront traduites par un moteur de traduction automatique. Celles-ci seront enfin relues et retravaillées au besoin.

Type de texte à traduire

C’est loin d’être un scoop, mais il s’agit quand même d’un élément important à prendre en compte. Les outils de traduction automatique, gratuits ou payants, génériques ou spécifiques, ne conviennent pas à tous les types de textes. On évitera notamment de l’utiliser pour les contenus marketing. En effet, le transfert linguistique et la compréhension du texte ne seront pas le seul objectif : il faudra également faire preuve de créativité, et c’est là que la machine risque de ne pas être adaptée.

Besoins du client

Autre élément à prendre en compte : l’utilisation finale du contenu à traduire. En effet, une traduction doit être « fit-for-purpose », c’est-à-dire adaptée à son utilisation. Prenons l’exemple de la notice explicative d’un aspirateur. On ne va pas la traduire de la même manière si l’on n’a seulement besoin de donner une petite idée de la manière dont il faut l’utiliser ou s’il faut une explication précise du montage de l’appareil pour quelqu’un qui le réparera.

Les délais et budgets ont également leur importance. Puisque la traduction automatique peut fournir une traduction plus rapidement, alors elle peut être la solution pour un projet avec des délais courts. Il en va de même lorsque le budget est peu élevé, car la traduction automatique sera vendue à un prix inférieur à celui de la traduction humaine.

La qualité demandée, bien sûr, doit être prise en compte. Cet élément permet de déterminer si l’utilisation de la traduction automatique permet d’atteindre le niveau de qualité requis, ainsi que le type de post-édition à effectuer. Pour rappel, la post-édition consiste en la relecture et, lorsque cela est nécessaire, la correction de la traduction produite par la machine. Le plus souvent, trois types de post-édition sont proposés : légère, moyenne et complète. Les critères de qualité, le temps de travail, et le budget aideront à déterminer le type de post-édition le plus adapté à un projet.

Besoins du post-éditeur

Cet aspect concerne autant les gestionnaires de projet que les traducteurs indépendants. Ces deniers ne doivent pas hésiter à communiquer à ce sujet avec leur gestionnaire de projet ou client. C’est surtout la productivité, l’outil et la qualité qui ont de l’importance.

La productivité attendue ne correspond pas toujours aux capacités des post-éditeurs. Si la productivité est définie en fonction de critères génériques, il est grandement possible de faire erreur. Lorsque l’on n’arrive pas à atteindre les objectifs de productivité définis, on peut ressentir de la frustration. Il est plus agréable d’être appelé pour tester un outil sur un échantillon du projet afin d’obtenir la meilleure évaluation de la productivité possible.

L’outil de traduction automatique est, la plupart du temps, choisi par l’agence ou le client. Les post-éditeurs ont tendance à préférer utiliser un outil intégré à leur environnement de travail, encore une fois en raison de la productivité. C’est pourquoi il faut veiller à pouvoir utiliser un moteur intégrable dans les outils de TAO.

La qualité attendue pose également un souci. En général, si l’on a recours à la traduction automatique, c’est que les délais et le budget ont la priorité par rapport à la qualité. Encore une fois, cet aspect peut être frustrant pour les post-éditeurs, qui ont à cœur de rendre un travail de la meilleure qualité possible. De plus, la qualité de leur travail est leur image de marque, c’est pourquoi il peut être difficile de livrer un travail à la qualité amoindrie comparée à ce que l’on est capable de produire.

Choix de l’outil

Quand on parle de traduction automatique, il ne s’agit pas d’un seul outil. En effet, ces moteurs ne sont que des algorithmes. Il faut ensuite les entraîner en y incorporant le type de contenu adapté afin d’obtenir les meilleurs résultats possibles. C’est pourquoi il est important de se rendre compte que le meilleur outil de traduction automatique, c’est celui qui est le plus adapté au contenu à traduire. Par exemple, on n’utilisera pas un moteur entraîné avec des textes de loi pour traduire du contenu technique.

L’efficacité d’un moteur dépend du contenu à traduire, mais aussi de la langue. Un outil peut produire de très bons résultats pour une paire de langues, mais beaucoup moins bons pour une autre. Pour un même texte, la traduction automatique vers deux langues différentes peut énormément varier en qualité, et en fonction de la langue cible, la productivité pourrait être grandement différente. C’est une des raisons pour lesquelles faire appel aux post-éditeurs pour tester les outils a vraiment son importance.

La confidentialité du contenu à traduire ne doit pas être négligée. Il faut bien se rendre compte que les outils en ligne, surtout lorsqu’ils sont gratuits, peuvent présenter des risques. En effet, les phrases entrées dans ces moteurs peuvent être enregistrées, risquant de compromettre les données du client. Avant d’utiliser ces outils, prenez garde à ce qui est mentionné concernant la confidentialité.

La productivité reste un élément central dans le choix d’utilisation de l’outil. En effet, s’il y a trop d’éléments à modifier dans les traductions proposées par la machine, alors on ne gagnera pas en productivité. Ce ne sera peut-être pas la peine de s’embarrasser à en utiliser.

Attention à son utilisation finale

La traduction automatique peut présenter des risques. Si l’on décide de traduire des textes juridiques avec de la traduction automatique, alors il faudra bien prendre garde au niveau de post-édition qui sera effectué par la suite. Par exemple, si la traduction est utilisée comme élément dans une affaire judiciaire, alors une seule petite erreur peut peser lourd dans la balance.

De même, lorsqu’il s’agit de textes médicaux, la post-édition peut présenter des risques importants. Un glissement de sens peut avoir de très fortes répercussions. Ainsi, si l’on souhaite utiliser la traduction automatique, il faudra faire énormément attention à l’outil utilisé, ainsi qu’à la post-édition requise.

Importance de l’avis des post-éditeurs

Tous les éléments précédemment énoncés présentent clairement l’intérêt de mêler les post-éditeurs à toutes les phases d’un projet. En tant que spécialistes de la langue, ils auront un avis éclairé sur les meilleurs outils à utiliser pour avoir une bonne productivité et pouvoir rendre un travail au niveau de qualité demandée.

Sources

Bouillon, Pierrette, et al. Integrating MT at Swiss Post’s Language Service: preliminary results. In: Proceedings of the 21st Annual Conference of the European Association for Machine Translation. 2018. p. 281-286

Nunes Vieira, Lucas, et. al. (2019): Translating perceptions and managing expectations: an analysis of management and production perspectives on machine translation, Perspectives, DOI: 10.1080/0907676X.2019.1646776

Nunes Vieira, Lucas, et. al. (2020): Understanding the societal impacts of machine translation: a critical review of the literature on medical and legal use cases, Information, Communication & Society, DOI: 10.1080/1369118X.2020.1776370

Mion, Enrico Antonio. (2020). 9 questions à poser avant d’accepter un projet de post-édition. Traduction augmentée. https://fr.eamtranslations.com/post/9-questions-à-poser-avant-d-accepter-un-projet-de-post-édition

Robert, Anne-Marie. (2013). « Vous avez dit post-éditrice ? Quelques éléments d’un parcours personnel. » The Journal of Specialised Translation Issue 19 – July 2013 <http://www.jostrans.org/issue19/art_robert.pdf&gt;

Van der Vorst, Sarah (2020). Le post-éditeur, un nouveau maillon fort du projet de traduction [Conférence]. #TQ2020 | Traduction & Qualité : Biotraduction et Traduction automatique, Université de Lille : UFR Langues Étrangères Appliquées & Laboratoire « Savoirs, Textes, Langage » du CNRS. https://webtv.univ-lille.fr/video/10748/session-2-traduction-automatique-et-metiers-de-la-traduction

J’ai testé pour vous… Traduire, la nouvelle application de traduction d’Apple

Par Margaux Mackowiak, étudiante M2 TSM

Que vous possédiez un iPhone ou non, vous aurez peut-être entendu parler de la nouvelle application de traduction développée par Apple : Apple Translate, ou tout simplement nommée Traduire en français. L’app (nom donné par la marque à la pomme à ses applications) a été introduite avec la version iOS 14 annoncée en juin dernier lors de la WWDC 2020, à savoir la conférence mondiale des développeurs Apple, et installée automatiquement en effectuant la mise à jour iOS 14 depuis septembre. Parmi l’ensemble des moteurs de traduction automatique déjà présents sur le marché, l’app Traduire a-t-elle les atouts nécessaires pour leur faire concurrence ? C’est l’enquête que j’ai décidé de mener pour vous dans ce billet.

Prise en main et ergonomie

Lors du premier lancement de l’app, vous pourrez suivre un tutoriel vous indiquant de façon claire et simple les différentes fonctionnalités de l’outil de traduction et la manière de l’utiliser.

D’un point de vue ergonomique, l’interface est fluide et épurée, les couleurs sont neutres et agréables et s’adaptent en fonction du mode clair ou sombre paramétré dans les réglages de votre appareil. L’outil est simple d’utilisation, seuls quelques boutons sont présents à l’écran et leur utilité est rapidement identifiable, notamment après avoir lu le tutoriel. Sur ce point, nous pouvons admettre que l’interface est ergonomique.

Fonctionnalités

Nous avons le choix parmi 11 langues sources et cibles disponibles, et une supplémentaire selon la région géographique : l’allemand, l’anglais (des États-Unis ou du Royaume-Uni), l’arabe, le chinois (mandarin simplifié), le coréen, l’espagnol (d’Espagne), le français (de France), l’italien (d’Italie), le japonais, le portugais (du Brésil), ainsi que le russe.

Ce nombre est conséquent puisque, par comparaison, le moteur de traduction automatique à base de réseaux neuronaux DeepL ne propose qu’une variante géographique de plus. En incluant l’anglais britannique et l’anglais américain, nous arrivons ainsi à 130 combinaisons de paires de langues possibles pour Traduire.

De plus, l’outil d’Apple propose non seulement un système de traduction textuel, mais aussi vocal.

Qualité de traduction

Pour évaluer la qualité de Traduire, je vais comparer les traductions proposées par l’outil avec celles de DeepL et de Google Traduction et je vais le tester sur les problèmes récurrents rencontrés lors de l’utilisation des autres moteurs de traduction automatique.

Pour commencer, j’ai choisi un extrait du tutoriel officiel d’Apple en anglais, How to use Translate on your iPhone. Voici la traduction proposée par Traduire :

Traduire a donc traduit “When you download a language to use offline, it might take up space on your iPhone. You can remove a downloaded language whenever you want.” par « Lorsque vous téléchargez une langue pour utiliser hors ligne, cela pourrait prendre de la place sur votre iPhone. Vous pouvez supprimer une langue téléchargée quand vous le souhaitez. » Or, la version française de ce passage sur la page du tutoriel d’Apple en français est : « Le téléchargement d’une langue hors ligne peut occuper de l’espace sur votre iPhone. Vous pouvez à tout moment supprimer une langue téléchargée. »

On observe ainsi que la traduction de Traduire est compréhensible, certes, mais très littérale. L’app nous offre une traduction mot à mot, ce qui ne ferait pas l’affaire dans un texte officiel.

Pour tester l’outil sur la traduction de titres d’articles, j’en ai sélectionné un sur un sujet on ne peut plus d’actualité : celui de la Covid-19.

Ainsi, pour Coronavirus: UK ‘remains in containment phase’ – Johnson, l’app Traduire le traduit en français par Coronavirus : UK « reste en phase de confinement » – Johnson. On voit donc que l’outil n’a pas traduit ‘UK’ par ‘Le Royaume-Uni’, comme le font DeepL et Google Traduction. En français, il est aussi coutume d’ajouter le prénom et de ne pas uniquement nommer une personnalité par son nom de famille, ce que les moteurs de traduction automatique ne prennent pas encore en compte.

Ensuite, j’ai voulu vérifier si l’outil saurait localiser des éléments propres à différents pays. Pour ce faire, j’ai choisi un extrait de mode d’emploi d’un trotteur pour bébé. Voici la traduction d’une phrase tirée de la partie information des consommateurs :

Traduire a donc traduit “Call Consumer Relations 8 AM – 6 PM EST Monday through Friday.” par « Appelez Relations avec les consommateurs de 8 h à 18 h HNE du lundi au vendredi ». Pour cette même phrase, DeepL et Google Traduction proposent « Appelez le service des relations avec les consommateurs de 8 h à 18 h HNE du lundi au vendredi. »

L’app d’Apple a traité ‘Consumer Relations’ comme un nom propre, contrairement aux deux autres moteurs qui l’ont correctement traduit. En outre, les trois outils ont traduit EST (Eastern Standard Time) par HNE (heure normale de l’Est), mais n’ont pas localisé les chiffres en UTC+1, l’heure locale.

Voyons à présent ce qu’il en est des préjugés. Les moteurs de traduction automatique sont connus pour contenir des algorithmes qui reproduisent des stéréotypes racistes ou sexistes provenant des humains, comme en témoigne le billet de blog d’Estelle Peuvion de novembre 2019.

Qu’en est-il du cas de Traduire ? Pour le savoir, j’ai choisi deux métiers du corps hospitalier, à savoir les termes infirmier/infirmière et chirurgien/chirurgienne. Découvrons comment se comporte Traduire avec ces mots.

Si je saisis le texte suivant : “The nurse entered the room. He gave me my medicine.”, Traduire propose « L’infirmière est entrée dans la chambre. Il m’a donné mes médicaments. »

En plus de traduire ‘nurse’ par ‘infirmière’ par défaut, l’outil ne corrige pas le genre alors même que j’ai précisé qu’il s’agissait d’un homme dans la phrase suivante. DeepL et Google Traduction reproduisent la même erreur.

Dans l’exemple suivant, Traduire traduit “The surgeon asked her colleague to give her a scalpel.” par « Le chirurgien a demandé à sa collègue de lui donner un scalpel. »

Là encore, le genre n’est pas inconnu puisque j’ai indiqué à deux reprises qu’il s’agissait d’une femme. Toutefois, la machine considère que le spécialiste est un homme et que le collègue est une femme. Google Traduction propose la même solution, tandis que pour DeepL, les deux protagonistes sont des hommes.

Il est donc clair que l’ensemble des moteurs de traduction automatique reproduisent des clichés, et que, depuis l’article d’Estelle Peuvion mentionné précédemment, la situation n’a pas réellement évolué.

Pour terminer, j’ai choisi un exemple simple en me mettant à la place d’une touriste qui désire prendre un repas dans un restaurant.

Ici, la machine nous propose un faux sens. En retraduisant vers le français, le texte obtenu signifierait : « Bonjour, voudriez-vous savoir si vous mangez encore ? », ce qui est loin de notre texte source d’origine. La traduction correcte en anglais aurait été “Hello, I would like to know if you are still serving food?”. On constate que l’outil peut donc commettre des erreurs, même pour des questions simples que n’importe quel individu pourrait poser lors d’un séjour à l’étranger.

J’ai ici mis en exergue des erreurs qu’a commises la machine lorsque je l’ai testée, mais évidemment, cela n’arrive pas pour chaque phrase entrée par l’utilisateur. L’outil peut proposer des traductions correctes, toutefois, il est important de soulever les erreurs qu’il est susceptible de commettre pour savoir dans quelle mesure l’utiliser.

Aspects positifs et négatifs

S’offre à nous la possibilité de consulter l’historique récent de nos recherches en balayant l’écran vers le bas, ainsi que d’ajouter des traductions en favori qui seront enregistrées dans l’onglet Favorites en cliquant sur l’étoile.

Un dictionnaire est également intégré et accessible en touchant l’icône associée ou en appuyant directement sur un mot de la traduction proposée.

En outre, nous avons l’option de télécharger les langues que nous souhaitons pour pouvoir les utiliser en mode hors ligne, lors d’une absence de connexion Internet.

Lorsque le téléphone est incliné en mode paysage, l’outil permet de traduire des mots prononcés oralement en appuyant sur l’icône du micro. Si l’option de détection automatique est activée au préalable, l’outil reconnaîtra la langue parmi les deux sélectionnées et une voix lira automatiquement la traduction. Celle-ci pourra être réécoutée en appuyant sur l’icône de lecture (le symbole du triangle). L’icône de flèches en sens opposé permet, quant à elle, d’afficher la traduction proposée par l’outil en grands caractères blancs sur fond bleu.

Néanmoins, l’insertion de texte se fait uniquement en mode portrait, l’utilisation du micro étant requise en mode paysage.

L’app est gratuite mais uniquement accessible aux utilisateurs d’Apple propriétaires d’un iPhone avec la version iOS 14 ou une version ultérieure, elle ne détecte pas automatiquement les langues, et il se peut qu’elle commette des erreurs de traduction majeures.

Conclusion

Traduire s’avère particulièrement utile pour les personnes possédant un iPhone. À portée de main, cette application intégrée au smartphone permet de communiquer assez facilement dans une langue qu’on ne maîtrise guère, en voyage à l’étranger ou tout simplement en complément lorsqu’on désire en apprendre une nouvelle, et cela est d’autant plus vrai grâce au micro intégré. L’app est épurée, facile d’accès et simple d’utilisation.

Cependant, il faut se méfier des erreurs types des moteurs de traduction automatique, telles que la reproduction des stéréotypes, les contresens ou encore la non-traduction. Nous avons également vu que l’app peut fournir des traductions erronées, même pour des phrases simples.

Pour pouvoir être utilisée pour de la post-édition comme DeepL Pro par exemple, il faudrait que l’app soit disponible sur MacBook, ce qui n’est pas (encore) le cas, et qu’elle s’améliore sur les aspects négatifs mentionnés tout au long de cette analyse.

Évidemment, ce billet est basé en grande partie sur mon avis et mon expérience en tant qu’utilisatrice de l’application et étudiante en traduction. Des études seraient nécessaires pour mesurer le taux d’erreurs de l’outil et il faudrait les comparer avec celles réalisées jusqu’à présent pour les autres moteurs de traduction automatique. Il s’agit d’une application prometteuse, utile pour les particuliers, mais qui est pour l’instant loin d’être suffisante pour les professionnels de la traduction dans un contexte de post-édition. L’app Traduire ayant été introduite récemment, gardons toutefois à l’œil ce qu’Apple lui réserve, d’autant plus que peu d’éléments sont dévoilés à son sujet, comme le type de corpus qui la constitue et son degré de confidentialité.

Les images de ce billet sont des captures d’écran réalisées par mes soins via l’application pour iPhone ‘Traduire’, propriété d’Apple.

Sources :

App Store. « ‎Traduire ». https://apps.apple.com/fr/app/traduire/id1514844618

Apple Support. « How to Use Translate on Your IPhone », 16 septembre 2020. https://support.apple.com/en-us/HT211671

Apple Support. « Traduire du texte et des voix sur l’iPhone ». https://support.apple.com/fr-fr/guide/iphone/iphd74cb450f/ios

Apple Support. « Utiliser Traduire sur votre iPhone », 29 octobre 2020. https://support.apple.com/fr-fr/HT211671

« Containment Phase “Unlikely to Work on Its Own” ». BBC News, 9 mars 2020. https://www.bbc.com/news/av/uk-51809498

Innocente, Florian. « iOS 14 : « Traduire », l’app d’Apple pour les vacances à l’étranger ». iGeneration, 27 juin 2020. https://www.igen.fr/ios/2020/06/ios-14-une-app-traduire-pour-les-francais-mauvais-en-langues-etrangeres-115921

« Instruction d’utilisation Fisher-Price STRIDE-TO-RIDE WALKER 73499 ». Manualsbase.com. https://www.manualsbase.com/fr/manual/640474/baby_walker/fisher-price/stride-to-ride_walker_73499/

Loock, Rudy. Cours de recherche en traduction automatique dispensé en Master 2 de Traduction spécialisée multilingue à l’Université de Lille.

Peuvion, Estelle. « Traduction automatique : les algorithmes ont-ils des préjugés ? » MasterTSM@Lille (blog), 10 novembre 2019. https://mastertsmlille.wordpress.com/2019/11/10/traduction-automatique-les-algorithmes-ont-ils-des-prejuges/

Turcan, Marie. « iOS 14 est disponible : voici toutes les nouveautés sur votre iPhone ». Numerama, 17 septembre 2020. https://www.numerama.com/tech/632269-ios-14-toutes-les-nouveautes-a-venir-sur-iphone.html

Van der Vorst, Sarah et Pacinella, Quentin. Cours de traduction automatique et post-édition dispensé en Master 2 de Traduction spécialisée multilingue à l’Université de Lille.

Traduction automatique : nouvelle alliée des étudiants en traduction ?

Par Marisa Dos Santos, étudiante M2 TSM

Bien que son utilisation, ou non, reste un choix personnel, on ne peut plus nier aujourd’hui l’utilité de la traduction automatique pour les traducteurs. De plus en plus présente, on sait qu’elle inquiète certains professionnels du marché, mais également les futurs diplômés en traduction. Quel étudiant (ou professionnel d’ailleurs) n’a jamais entendu une fois dans sa vie quelqu’un lui dire « Ah oui mais tu sais, dans dix-quinze ans tu n’auras plus de travail… Je le sais moi, j’ai utilisé Google traduction la semaine dernière, c’est top ce truc, ça marche super bien ! » ? Premièrement, pas d’inquiétude : si l’on écoutait tous les détracteurs du métier, la traduction automatique aurait dû nous évincer il y a déjà de ça 50 ans.

Ensuite, le métier de traducteur, eh bien oui, il évolue comme bien d’autres métiers. Et surprise : lui aussi doit s’adapter aux avancées technologiques. Alors, depuis quelques années, un nouveau nom de métier est apparu et commence tout doucement à faire son nid : celui du post-éditeur. L’apparition de ce genre de nouveaux métiers demande au traducteur d’être constamment à l’affut des nouveautés et des actualités du marché. Mais alors, qu’en est-il des étudiants en traduction ? Peuvent-ils réellement atteindre ce principe de « MT literacy » selon lequel un universitaire devrait, entre autres, savoir dans quel contexte utiliser ou non la traduction automatique, pratiquer correctement la pré-édition afin que la traduction machine soit de meilleure qualité ou encore post-éditer efficacement les productions de la traduction automatique afin que le texte final soit de qualité optimale ?

Les chiffres clés de la traduction automatique

La traduction automatique a fait son apparition sur le marché du grand public dans les années 1980 sous la forme de traduction automatique à base de règles. Rapidement, l’intérêt pour cette nouvelle technologie s’est développé et de grandes avancées ont été accomplies, pour arriver au lancement de la traduction statistique dans les années 2000. Cette technologie fonctionnait déjà bien mieux que la précédente, mais est arrivée en 2015 la fameuse traduction automatique neuronale, celle qui a bouleversé le marché et qui effraie ou fascine tant de personnes.

En effet, ce nouveau modèle de traduction utilise des réseaux neuronaux pour produire des traductions très similaires aux traductions humaines. Décriée par certain, adulée par d’autres, elle est au centre du débat traductologique ces dernières années. Elle occupe une place de plus en plus importante dans le marché du travail, et ce n’est pas près de s’arrêter. En effet, d’après l’enquête European Language Industry Survey menée en 2020, 78 % des sociétés de services linguistiques participant à ladite enquête prévoient de commencer ou d’augmenter l’utilisation de la traduction automatique et de la post-édition au sein de leur structure. Alors pour beaucoup de professeurs, il est impératif que les étudiants en traduction soient formés à ces nouvelles disciplines afin de ne pas se retrouver perdus une fois dans le marché.

Qu’en pensent donc les étudiants ?

De nombreux chercheurs se sont penchés sur les capacités de post-édition d’étudiants n’ayant jamais pratiqué la matière ou à qui elle n’avait jamais été enseignée, ainsi que sur leurs ressentis face à cette nouvelle tâche. Leur but était de savoir comment enseigner la traduction automatique et en conséquence, la post-édition, et de comprendre si ces deux disciplines représenteraient une réelle aide, voire un réel atout, pour eux. Pour ce faire, nombre d’entre eux ont alors demandé à leurs étudiants de post-éditer un texte et ont ainsi analysé différents paramètres. Certains élèves ont été amenés à répondre à des questionnaires pré-test, et généralement, les résultats étaient plutôt similaires.

Les étudiants qui prenaient part aux études estimaient généralement qu’ils ne se sentaient pas capables d’utiliser correctement la traduction automatique et de produire une post-édition convenable. Toutefois, en général, les étudiants ont jugé que la traduction automatique et la post-édition pouvaient leur permettre d’améliorer leur productivité bien qu’ils y voient des risques, qu’ils en aient peur ou qu’ils ne sachent pas l’utiliser. Ces résultats antérieurs aux tests prouvent que la traduction automatique et la post-édition font encore débat, même chez les étudiants et qu’il serait utile de lever leurs doutes lors de la formation universitaire.

Évaluation des besoins des étudiants

C’est exactement ce sur quoi se sont penchés plusieurs professeurs-chercheurs. Leur but : comprendre comment enseigner la traduction automatique et la post-édition afin que son enseignement soit vu comme une compétence à maîtriser plutôt que comme un simple outil technologique à appréhender. Alors certains professionnels, comme Sandrine Peraldi, ont mis en place des ateliers lors desquels les étudiants de master ont tenté d’évaluer les taux de réussite de plusieurs traducteurs automatiques afin de la proposer à un véritable client. Au travers de cette expérience, ils ont pu, entre autres, découvrir l’activité de post-édition et, grâce à quantification et classification des erreurs de la traduction automatique, d’évaluer les efforts cognitifs que leur demandait cette tâche. Ils ont ainsi réussi à proposer une solution de post-édition à leur client avec de véritables résultats.

Aussi, pour connaître les besoins des étudiants, d’autres professeurs ont adopté un mode de fonctionnement différent : ils ont tenté de voir si les étudiants arrivaient à reconnaître correctement les erreurs de la traduction automatique et comment les corrigeaient-ils. La plupart des résultats concordaient : les étudiants n’avaient, généralement, pas de mal à reconnaître les erreurs de syntaxe ou les erreurs très évidentes que produisait l’outil de traduction automatique, mais avaient quelques difficultés à reconnaître certaines erreurs typiques de la traduction automatique comme les calques et contre-sens, notamment avec les faux-amis.

Erreurs de correction

Pourquoi cela ? Eh bien, il y a diverses explications. Pour certains, c’est parce qu’ils font trop confiance à la machine, et ont donc tendance à laisser passer certaines erreurs. Cette confiance excessive les amène même à effectuer moins de modifications lors d’une post-édition que lors de la révision de leurs propres traductions. D’autres ont observé que les erreurs de la traduction neuronale étaient certes, moins nombreuses que celles de la statistique, mais plus dures à corriger et à repérer puisque très similaires aux erreurs humaines et étaient généralement les mêmes que faisaient naturellement les étudiants dans leurs traductions, à savoir les faux et contre-sens : elles passent donc souvent à la trappe. Pour d’autres, cela pouvait aussi être dû au fait que les étudiants se sentaient facilement débordés par la quantité d’information à traiter lors de cet exercice et ajoutaient même parfois des erreurs au texte. Lié à ce manque de concentration, plusieurs études ont révélé que lors d’une post-édition, le traducteur passera moins de temps à lire et à observer le texte source que lors d’une traduction humaine, alors même que dans le cas d’une post-édition complète, il faut autant prêter attention au texte source que pour une traduction sans traducteur automatique. Généralement, les étudiants ayant pris part à une expérience d’eye-tracking ont passé deux fois plus de temps à regarder le texte cible lors d’une post-édition que lors d’une traduction humaine.

Pour conclure, dans l’étude de Masaru Yamada de 2019, il a été démontré que même avec la traduction automatique neuronale, les étudiants ne réussissaient pas à atteindre le taux de 85 % d’erreurs corrigées demandé pour atteindre les standards de qualité professionnels.

Tous ces résultats prouvent qu’il est nécessaire pour les étudiants de connaître à l’avance quelles sont les erreurs les plus communes que produisent les outils de traduction automatique, qu’elle soit neuronale ou statistique, afin de correctement les repérer, les corriger plus facilement et être aptes à maîtriser et utiliser ces outils individuellement ou en modèle hybride. C’est donc un point que plusieurs chercheurs proposent d’aborder dans l’enseignement de ces disciplines.

Effort cognitif et retour des étudiants

Mais qu’en est-il de l’effort que demande une post-édition et du ressenti des étudiants face à cette discipline ?

Un phénomène a été observé dans plusieurs études : bien que parfois, le ressenti des participants puisse être contraire à ce postulat, la post-édition demande autant, si ce n’est plus, d’effort et de compétence que la traduction humaine. Certaines études ayant été menées avec comme texte de référence des textes spécialisés, il a parfois été démontré que la post-édition rendait même la tâche plus compliquée pour les étudiants, et qu’ils se retrouvaient perdus ou perdaient énormément de temps à détecter et corriger les erreurs de la machine, résultant en la production d’un texte qui n’atteignait pas du tout les standards de qualité professionnelle, surtout d’un point de vue stylistique.

Après les tests, certains étudiants ont déclaré avoir une meilleure perception des outils de traduction automatique, quand d’autres ont affirmé que leur vision avait empiré. Néanmoins, nombre d’entre eux ont avoué avoir peur de la traduction automatique car ils craignaient d’être remplacés.

Ces observations prouvent une fois de plus qu’il est impératif de considérer la traduction automatique et la post-édition comme des matières ayant toute leur place au sein d’un cursus en traduction et qu’il ne faut pas, ou plus, les mépriser, puisque sans formation préalable, les étudiants ont beaucoup de mal à produire un texte satisfaisant.

Conclusion

Cette année, au sein du master TSM, nous avons pu découvrir le processus de post-édition et nous avons appris à appréhender les outils de traduction automatique. Et je pense que grâce à cela, nous avons peut-être moins peur de la traduction automatique ou de la post-édition par rapport à des étudiants qui n’auraient jamais eu l’occasion de démystifier la traduction machine.

Il est donc possible de conclure que oui, la traduction automatique constitue une nouvelle alliée pour les étudiants en traduction, à condition qu’ils soient mis en garde des faiblesses des moteurs et qu’ils apprennent à les manier pour pouvoir répondre aux exigences du marché. La traduction automatique ne doit plus constituer une crainte pour l’avenir des futurs professionnels mais doit devenir un outil du quotidien leur permettant d’augmenter leur productivité. Il est également nécessaire de guider les professeurs lors de l’enseignement de ces matières afin qu’ils guident à leur tour les étudiants vers une meilleure identification des erreurs et par conséquent, une meilleure correction. Ce sont pour toutes ces raisons que la mise en place d’enseignements autour de ces disciplines est essentielle : il faut prouver aux élèves que la machine représente une aide pour leur futur métier plutôt qu’une menace.

Ce billet est issu d’une mini-conférence tenue aux côtés de Margaux Mackowiak dans le cadre du cours de recherche en traduction automatique de la deuxième année de master.

Sources :

EUROPEAN LANGUAGE INDUSTRY SURVEY (2020), https://ec.europa.eu/info/sites/info/files/2020_language_industry_survey_report.pdf

de Faria Pires, Loïc. (2020). Master’s students’ post-editing perception and strategies. FORUM. Revue internationale d’interprétation et de traduction / International Journal of Interpretation and Translation. 18. 24-44. 10.1075/forum.19014.pir, https://www.researchgate.net/publication/341408521_Master’s_students’_post-editing_perception_and_strategies/citation/download

Peraldi, Sandrine (2018). Les 12 travaux de la Traduction automatique. Journée d’études Traduction et qualité : « Biotraduction et traduction automatique ». / Université de Lille, https://tq2018.sciencesconf.org/data/pages/Lille_SPeraldi_Les_12_travaux.pdf

Yamada, Masaru. (2019). The impact of Google Neural Machine Translation on Post-editing by student translators. The Journal of Specialised Translation. 87-106. https://www.researchgate.net/publication/330831614_The_impact_of_Google_Neural_Machine_Translation_on_Post-editing_by_student_translators/citation/download

Sycz-Opoń, Joanna & Gałuskina, Ksenia. (2017). Machine Translation in the Hands of Trainee Translators – an Empirical Study. Studies in Logic, Grammar and Rhetoric. 49. 10.1515/slgr-2017-0012. https://www.researchgate.net/publication/316530023_Machine_Translation_in_the_Hands_of_Trainee_Translators_-_an_Empirical_Study/citation/download

O’Brien, Sharon & Ehrensberger-Dow, Maureen (2020). MT Literacy – A cognitive view. Translation Cognition & Behavior. 3. 145-164. 10.1075/tcb.00038.obr. https://www.researchgate.net/publication/345984536_MT_Literacy_-_A_cognitive_view

DeepL Pro, à prendre ou à laisser ?

Par Archibald Marchal, étudiant M2 TSM

Ah notre bel ami DeepL, on le présente plus, l’outil de traduction automatique de Linguee est déjà bien connu. Créé en août 2017 par la filiale Linguee, il tient son nom de « deep learning » signifiant que la machine apprend avec le temps et les informations qu’elle reçoit, à l’image du cerveau humain. Fortiche non ?

DeepL est un outil qui divise les débats. Les pessimistes vous diront que la traduction automatique (TA) n’est rien d’autre que de la poudre aux yeux et qu’elle n’a aucun intérêt pour la traduction professionnelle, alors que les optimistes eux, vous diront qu’il s’agit là d’un instrument magique bientôt capable de remplacer l’humain. Essayons de nous placer du côté réaliste de ce débat. Les développeurs de DeepL eux-mêmes, ne considèrent pas leur outil comme la fin du traducteur, puisqu’on verra par la suite qu’ils collaborent avec les outils de TAO.

Selon moi, au vu des progrès de la TA depuis ces dernières années, il serait idiot de ne pas profiter de ce bel outil à notre disposition, et gratuit ! Bien évidemment, je suis d’accord pour dire que la TA ne remplacera jamais le traducteur professionnel, mais elle permet d’obtenir des résultats majoritairement cohérents en moins d’une seconde. Le gain de temps pour un traducteur est donc considérable. Sans oublier que la post-édition devient de plus en plus courante et qu’en tant que traducteur, il vaut mieux être compétent dans cette tâche et donc commencer dès maintenant à se former à la TA.

Comme vous le savez peut-être, DeepL se base sur un corpus, et ce corpus, c’est internet. Autant dire un mastodonte, regorgeant de bonnes et de moins bonnes sources. C’est pourquoi DeepL sera plus efficace pour des textes peu ou pas spécialisés. Forcément, plus on se spécialise, moins il y a de source, donc moins DeepL est performant.

Maintenant qu’on a toutes les informations en main, intéressons-nous à la version Pro de notre outil préféré. Combien coûte-t-elle ? Qu’apporte-t-elle de plus ? A qui s’adresse-t-elle ? Regardons tout cela en détail.

Tout d’abord il faut savoir que DeepL propose plusieurs forfaits :

Ce tableau proposé par le site de DeepL indique les différences entre chaque forfait. Premièrement on peut voir qu’il existe deux méthodes d’abonnement : mensuelle ou annuelle. La souscription à l’année permet alors de bénéficier de réduction non négligeable (33 %). Deuxièmement on remarque trois versions Pro différentes.

Les points communs

L’intérêt premier de la version Pro de DeepL est évidemment la protection des données. Vos clients vous ont fait signer un accord de confidentialité ? Alors oubliez n’importe quel outil de TA gratuit. DeepL Pro vous propose de la traduction automatique 100 % sécurisée, et ce, pour n’importe quel forfait.

Ensuite, sur DeepL version gratuite, vous avez un nombre de caractères limité, à savoir 5 000. Cela peut s’avérer très peu dans bon nombre de projets. Même si vous segmentez votre texte, attention aux incohérences, DeepL peut très bien vous proposer des traductions différentes pour le même terme lors de différentes recherches. Si vous mettez tout votre texte d’une traite, ce que permet la version pro, fini les incohérences !

Dernier point commun entre les forfaits : l’option formel/informel. En effet, grâce à DeepL Pro, vous pourrez choisir le ton de votre traduction.

Les différences

Vu les forfaits proposés et les divergences de prix, on s’attend évidemment à des fonctionnalités différentes.

D’abord, on constate que DeepL Pro permet la traduction de fichiers intégraux, ce qui signifie qu’à la manière d’un outil de TAO, il va rendre le fichier dans son format original, avec la mise en page originale. Néanmoins, selon le forfait, vous n’aurez pas droit aux mêmes volumes. En effet, pour la version « Starter » seulement 5 fichiers par mois, 20 pour la version « Advanced » et on monte jusqu’à 100 pour la version « Ultimate ».

La seconde différence réside dans la création de glossaires. Le forfait « Starter » ne propose la création que d’un seul glossaire, avec entrées illimitées certes, tandis que les deux autres forfaits permettent la création de « plusieurs » glossaires. Ces glossaires sont interactifs et peuvent s’avérer vite indispensables dans certains projets.

Dernière différence, et non des moindres, la possibilité d’installer un plugin sur votre logiciel de TAO. Cette option n’est disponible que pour les versions « Advanced » et « Ultimate ». Ce plugin permettra la traduction automatique dans vos segments que vous pourrez par la suite modifier à votre guise bien évidemment. Bien qu’il existe déjà des plugins dans certains logiciels tel que SDL Trados Studio, DeepL reste la référence en terme de TA et sera donc probablement plus efficace.

Les points négatifs

Malgré toutes ses belles fonctions, DeepL Pro contient son lot de points négatifs.

Par exemple, DeepL Pro n’est pas accessible pour le monde entier. En effet DeepL est une entreprise européenne et ne propose l’accès à sa version Pro que dans les pays membres de l’UE et depuis peu, à la Suisse, au Liechtenstein, aux USA et au Canada.

Ensuite, si des fichiers entiers sont traduisibles, seuls les fichiers au format .docx, .pptx et .txt le sont. On peut également ajouter les formats .htm et .html mais pour cela il faut encore payer un abonnement supplémentaire (le forfait DeepL API) à 4,99€ par mois.

De plus, si la TA nous permet de gagner un temps fou, la qualité n’est pas systématiquement au rendez-vous, et le travail de post-édition n’est pas si simple qu’il n’y parait, et peut conduire à de moins bonnes traductions finales qu’à l’accoutumée.

Le prix peut également être rédhibitoire, un abonnement professionnel pourrait s’avérer être un mauvais investissement. Il faut être sûr d’amortir son coût, attention donc à être sûr de pouvoir fréquemment utiliser la traduction automatique pour vos projets.

Bilan

Avec ses versions Pro, DeepL propose un package adapté aux besoins des utilisateurs, avec des prix et fonctions variées. Aujourd’hui, en tant que futur traducteur, je sais déjà que DeepL Pro sera un de mes premiers investissements. Reste à savoir, quelle version choisir ? Personnellement j’opterais pour le forfait « Advanced ». Je m’explique. Selon moi, le forfait « Starter » ne dispose pas de suffisamment d’arguments pour être viable sur le long terme. Sa non-intégration aux outils de TAO le rend pour moi inintéressant. Ensuite le forfait « Ultimate », qui est environ deux fois plus cher que le forfait « Advanced » ne se démarque pas suffisamment de ce dernier. Son seul avantage réside dans le nombre de fichiers entiers traduisibles, je pense qu’il s’adresse plutôt à ceux n’ayant pas d’outil de TAO ou voire même aux entreprises directement… Et comme il est difficile de survivre aujourd’hui en tant que traducteur sans utiliser d’outil de TAO, on oublie ce forfait.

Alors en 2020, avec des tarifs sans cesse revus à la baisse, l’émergence de la post-édition et les soucis de confidentialité qu’il peut y avoir, DeepL Pro apparait comme l’allié numéro 1 du traducteur professionnel, lui permettant un gain de temps considérable, et donc un gain d’argent.

Sources :

https://www.deepl.com/fr/blog/20180305.html

https://www.deepl.com/fr/pro/

#TQ2020 Biotraduction et traduction automatique : retour sur la journée d’études Traduction et Qualité du 31 janvier 2020

 

Par Oriane Briand, étudiante M2 TSM

tq2020_site

 

Le laboratoire « Savoirs, Textes, Langage » du CNRS et l’UFR Langues Étrangères Appliquées de l’université de Lille ont organisé, pour sa 7e édition, une journée d’études consacrée à la biotraduction et à  la traduction automatique. Petit bilan du cru 2020.

L’année 2020 vient à peine de commencer, une décennie 2.0 pour cette journée d’études 2.0 elle aussi, puisque l’édition de 2018 était déjà dédiée à la traduction automatique (TA), aussi appelée traduction machine.

Le programme est chargé, l’amphithéâtre est bondé en cette belle journée de fin janvier. Cette journée a pour but de redéfinir le lien entre l’humain et la machine dans le monde de la traduction, un monde qui a en effet été chamboulé par l’arrivée de la traduction automatique neuronale. La journée se découpe en trois thématiques : traduction automatique et monde professionnel, traduction automatique et métiers de la traduction et enfin analyse de la traduction automatique. Dix intervenants se sont succédé sur l’estrade, universitaires comme professionnels, et ont tenté d’apporter leurs éléments de réponse.

La traduction automatique neuronale (TAN) a fait son apparition vers le milieu des années 2010. Auparavant, d’autres systèmes étaient utilisés comme la traduction automatique statistique (TAS). Alors que pouvons-nous attendre de la TAN et comment pouvons-nous l’utiliser comme un outil pour le traducteur, et non plus le voir comme une menace, comme elle est souvent perçue ?

Le fonctionnement de la TAN n’est pas évident pour tout le monde. Les algorithmes utilisés sont complexes et mystérieux. Et pourtant, elle est partout. Elle est utilisée par des millions de personnes tous les jours et fait partie intégrante de notre quotidien comme de notre environnement de travail. Mais quelle posture faudrait-il adopter face à ce trop-plein d’intelligence artificielle ?

Tout d’abord, il faut comprendre ce qu’est la traduction automatique neuronale et surtout, connaître ses points forts et ses points faibles. Car c’est en connaissant la machine avec laquelle nous travaillons que nous pouvons en retirer le meilleur. Par exemple, la TAN est capable de produire des sorties de textes fluides, ce qui peut parfois nous  tromper et donner l’illusion d’un texte bien traduit. Or, cette fluidité se fait, par exemple, au détriment de la terminologie. C’est lorsqu’on se penche sur le résultat qu’on se rend compte que le texte produit est incorrect. C’est pour cette raison que l’utilisation de la TAN ne peut se faire sans une intervention humaine, et, si cela peut vous rassurer, ne peut supplanter le traducteur comme on peut le penser. Mais comme pour chaque nouvelle avancée technologique, il faut se former et former les générations futures. Ainsi, enseigner de manière raisonnée l’utilisation de ce nouvel outil est crucial.

Aujourd’hui, l’intervention humaine face aux résultats de productions machine existe déjà. C’est le métier de post-éditeur. Lorsque nous regardons le marché de la traduction, il existe une certaine segmentation. Chacun son rôle et les moutons sont bien gardés. Mais l’émergence des nouvelles technologies (re)pose la question de l’organisation et de la gestion du projet de traduction. Par exemple, le post-éditeur ne pourrait-il pas être plus qu’un simple post-éditeur ? Il semble logique de demander son expertise à quelqu’un qui s’y connaît, qui est sur le terrain. Alors pourquoi ne pas faire appel aux connaissances et à l’expérience de quelqu’un qui travaille avec le contenu. Il est alors possible de redéfinir ce rôle et de l’impliquer à chaque étape du projet, que ce soit dans l’analyse de celui-ci (il peut estimer les délais, définir le processus le plus adapté…) ou dans ses étapes techniques. Il est important de redéfinir le rôle du post-éditeur dans les projets de TA, mais également redéfinir la gestion de ces projets. Chaque projet est unique, les résultats de TA sont variables tout comme l’effort de post-édition qui suit, et le post-éditeur ne peut qu’ajouter une plus-value.

Car la TAN n’est pas parfaite,  aujourd’hui encore, on tente de la décrypter. Il est important de comprendre ses faiblesses, mais également d’évaluer ce qu’elle produit. Il existe plusieurs méthodes. Quelques exemples :

  • La méthode BLEU, qui consiste à comparer une sortie machine avec une traduction humaine de référence
  • L’observation du système en le manipulant : modifier le texte source et observer si le texte cible se modifie en changeant les temps, les modes, les adjectifs, etc., et son inverse.
  • La dissection du système en ouvrant sa boite noire : interroger celle-ci pour tenter de prédire le résultat.
  • L’évaluation humaine : classement des résultats (par des professionnels ou non), identification et classement des erreurs.

Plusieurs études ont prouvé un gain de temps dans l’utilisation de la post-édition de traduction automatique neuronale, mais il est possible d’améliorer ses sorties de traduction en y incorporant de meilleures données d’apprentissage. Par exemple, une manière d’améliorer ce problème de terminologie serait d’incorporer des séries de textes spécialisés. Y incorporer ses propres corpus semble pour le moment compliqué, car les systèmes sont basés sur l’optimisation des algorithmes. Or, y incorporer ces données ferait baisser ce score d’optimisation. Il faudrait alors repenser le système et lui injecter ces connaissances dès le début de processus.

Comme vous pouvez l’avoir constaté, la traduction automatique neuronale génère de nombreuses questions et suscite un intérêt dans le monde de la traduction. Ses progrès ne semblent pas près de s’arrêter et en parler permet de découvrir de nombreux angles d’approche qui se complètent. Une approche raisonnée et scientifique permet de poser un regard critique sur la machine, et de réconcilier peut-être ce qui ne semblait pas être un couple évident : l’humain et la machine.

 

Un grand merci à Joss Moorkens, Caroline Rossi, Nathalie de Sutter, Geert Benoit, Guillaume Deneufbourg, Sarah van der Vorst, François Yvon, Hanna Martikainen, Orphée De Clercq et Rudy Loock, ainsi qu’à l’université de Lille en partenariat avec le laboratoire « Savoirs, Textes, Langage » du CNRS et l’Association française des formations universitaires aux métiers de la traduction (AFFUMT).

 

La #TQ2020 a été filmée, vous pourrez la visionner dès cette semaine sur la webTV de l’université de Lille et sur le site dédié à cette journée.