Traduction automatique : faire les bons choix avant de commencer

Par Élise Ventre, étudiante M2 TSM

La traduction automatique devient un outil incontournable du marché. Il existe beaucoup de documentation à son sujet. Elle est parfois présentée comme l’avenir de la traduction. On peut même trouver des articles qui comparent les différents outils. Mais avant de l’utiliser, faisons un tour d’horizon des éléments à prendre en compte avant de décider si elle sera, ou non, adaptée à un projet.

Collaboration entre l’humain et la machine

Quand on parle de traduction automatique, il ne s’agit pas de laisser la machine travailler seule. On ne va pas rentrer du texte dans un moteur de traduction automatique et livrer tel quel ce qui en sort. C’est un outil d’aide à la traduction, parmi tant d’autres (logiciels de TAO, dictionnaires ou corpus), que l’on peut décider d’intégrer à notre processus de traduction.

Ainsi, en associant traduction automatique et les logiciels de TAO, on obtiendra une traduction de meilleure qualité en bénéficiant des remontées des mémoires de traduction. Ensuite, les phrases qui ne peuvent pas en bénéficier seront traduites par un moteur de traduction automatique. Celles-ci seront enfin relues et retravaillées au besoin.

Type de texte à traduire

C’est loin d’être un scoop, mais il s’agit quand même d’un élément important à prendre en compte. Les outils de traduction automatique, gratuits ou payants, génériques ou spécifiques, ne conviennent pas à tous les types de textes. On évitera notamment de l’utiliser pour les contenus marketing. En effet, le transfert linguistique et la compréhension du texte ne seront pas le seul objectif : il faudra également faire preuve de créativité, et c’est là que la machine risque de ne pas être adaptée.

Besoins du client

Autre élément à prendre en compte : l’utilisation finale du contenu à traduire. En effet, une traduction doit être « fit-for-purpose », c’est-à-dire adaptée à son utilisation. Prenons l’exemple de la notice explicative d’un aspirateur. On ne va pas la traduire de la même manière si l’on n’a seulement besoin de donner une petite idée de la manière dont il faut l’utiliser ou s’il faut une explication précise du montage de l’appareil pour quelqu’un qui le réparera.

Les délais et budgets ont également leur importance. Puisque la traduction automatique peut fournir une traduction plus rapidement, alors elle peut être la solution pour un projet avec des délais courts. Il en va de même lorsque le budget est peu élevé, car la traduction automatique sera vendue à un prix inférieur à celui de la traduction humaine.

La qualité demandée, bien sûr, doit être prise en compte. Cet élément permet de déterminer si l’utilisation de la traduction automatique permet d’atteindre le niveau de qualité requis, ainsi que le type de post-édition à effectuer. Pour rappel, la post-édition consiste en la relecture et, lorsque cela est nécessaire, la correction de la traduction produite par la machine. Le plus souvent, trois types de post-édition sont proposés : légère, moyenne et complète. Les critères de qualité, le temps de travail, et le budget aideront à déterminer le type de post-édition le plus adapté à un projet.

Besoins du post-éditeur

Cet aspect concerne autant les gestionnaires de projet que les traducteurs indépendants. Ces deniers ne doivent pas hésiter à communiquer à ce sujet avec leur gestionnaire de projet ou client. C’est surtout la productivité, l’outil et la qualité qui ont de l’importance.

La productivité attendue ne correspond pas toujours aux capacités des post-éditeurs. Si la productivité est définie en fonction de critères génériques, il est grandement possible de faire erreur. Lorsque l’on n’arrive pas à atteindre les objectifs de productivité définis, on peut ressentir de la frustration. Il est plus agréable d’être appelé pour tester un outil sur un échantillon du projet afin d’obtenir la meilleure évaluation de la productivité possible.

L’outil de traduction automatique est, la plupart du temps, choisi par l’agence ou le client. Les post-éditeurs ont tendance à préférer utiliser un outil intégré à leur environnement de travail, encore une fois en raison de la productivité. C’est pourquoi il faut veiller à pouvoir utiliser un moteur intégrable dans les outils de TAO.

La qualité attendue pose également un souci. En général, si l’on a recours à la traduction automatique, c’est que les délais et le budget ont la priorité par rapport à la qualité. Encore une fois, cet aspect peut être frustrant pour les post-éditeurs, qui ont à cœur de rendre un travail de la meilleure qualité possible. De plus, la qualité de leur travail est leur image de marque, c’est pourquoi il peut être difficile de livrer un travail à la qualité amoindrie comparée à ce que l’on est capable de produire.

Choix de l’outil

Quand on parle de traduction automatique, il ne s’agit pas d’un seul outil. En effet, ces moteurs ne sont que des algorithmes. Il faut ensuite les entraîner en y incorporant le type de contenu adapté afin d’obtenir les meilleurs résultats possibles. C’est pourquoi il est important de se rendre compte que le meilleur outil de traduction automatique, c’est celui qui est le plus adapté au contenu à traduire. Par exemple, on n’utilisera pas un moteur entraîné avec des textes de loi pour traduire du contenu technique.

L’efficacité d’un moteur dépend du contenu à traduire, mais aussi de la langue. Un outil peut produire de très bons résultats pour une paire de langues, mais beaucoup moins bons pour une autre. Pour un même texte, la traduction automatique vers deux langues différentes peut énormément varier en qualité, et en fonction de la langue cible, la productivité pourrait être grandement différente. C’est une des raisons pour lesquelles faire appel aux post-éditeurs pour tester les outils a vraiment son importance.

La confidentialité du contenu à traduire ne doit pas être négligée. Il faut bien se rendre compte que les outils en ligne, surtout lorsqu’ils sont gratuits, peuvent présenter des risques. En effet, les phrases entrées dans ces moteurs peuvent être enregistrées, risquant de compromettre les données du client. Avant d’utiliser ces outils, prenez garde à ce qui est mentionné concernant la confidentialité.

La productivité reste un élément central dans le choix d’utilisation de l’outil. En effet, s’il y a trop d’éléments à modifier dans les traductions proposées par la machine, alors on ne gagnera pas en productivité. Ce ne sera peut-être pas la peine de s’embarrasser à en utiliser.

Attention à son utilisation finale

La traduction automatique peut présenter des risques. Si l’on décide de traduire des textes juridiques avec de la traduction automatique, alors il faudra bien prendre garde au niveau de post-édition qui sera effectué par la suite. Par exemple, si la traduction est utilisée comme élément dans une affaire judiciaire, alors une seule petite erreur peut peser lourd dans la balance.

De même, lorsqu’il s’agit de textes médicaux, la post-édition peut présenter des risques importants. Un glissement de sens peut avoir de très fortes répercussions. Ainsi, si l’on souhaite utiliser la traduction automatique, il faudra faire énormément attention à l’outil utilisé, ainsi qu’à la post-édition requise.

Importance de l’avis des post-éditeurs

Tous les éléments précédemment énoncés présentent clairement l’intérêt de mêler les post-éditeurs à toutes les phases d’un projet. En tant que spécialistes de la langue, ils auront un avis éclairé sur les meilleurs outils à utiliser pour avoir une bonne productivité et pouvoir rendre un travail au niveau de qualité demandée.

Sources

Bouillon, Pierrette, et al. Integrating MT at Swiss Post’s Language Service: preliminary results. In: Proceedings of the 21st Annual Conference of the European Association for Machine Translation. 2018. p. 281-286

Nunes Vieira, Lucas, et. al. (2019): Translating perceptions and managing expectations: an analysis of management and production perspectives on machine translation, Perspectives, DOI: 10.1080/0907676X.2019.1646776

Nunes Vieira, Lucas, et. al. (2020): Understanding the societal impacts of machine translation: a critical review of the literature on medical and legal use cases, Information, Communication & Society, DOI: 10.1080/1369118X.2020.1776370

Mion, Enrico Antonio. (2020). 9 questions à poser avant d’accepter un projet de post-édition. Traduction augmentée. https://fr.eamtranslations.com/post/9-questions-à-poser-avant-d-accepter-un-projet-de-post-édition

Robert, Anne-Marie. (2013). « Vous avez dit post-éditrice ? Quelques éléments d’un parcours personnel. » The Journal of Specialised Translation Issue 19 – July 2013 <http://www.jostrans.org/issue19/art_robert.pdf&gt;

Van der Vorst, Sarah (2020). Le post-éditeur, un nouveau maillon fort du projet de traduction [Conférence]. #TQ2020 | Traduction & Qualité : Biotraduction et Traduction automatique, Université de Lille : UFR Langues Étrangères Appliquées & Laboratoire « Savoirs, Textes, Langage » du CNRS. https://webtv.univ-lille.fr/video/10748/session-2-traduction-automatique-et-metiers-de-la-traduction

LancsBox : un logiciel d’analyse de corpus complet et gratuit

Par Xavier Giuliani, étudiant M2 TSM

Vous le savez peut-être déjà, l’exploitation de corpus fait partie intégrante de la formation du master TSM que ce soit en première ou deuxième année. Il existe plusieurs logiciels qui permettent de compiler et d’analyser soi-même des corpus et celui que l’on utilise principalement en cours est le concordancier gratuit AntConc développé par Laurence Anthony. Si vous souhaitez davantage d’informations à propos d’AntConc et de son développeur, je vous invite à lire également le billet de Jordan Raoul qui a eu l’occasion de le rencontrer au Japon.

Quant à moi, je vais vous présenter LancsBox (v 5.1.2) qui est un logiciel d’analyse de corpus développé à l’Université de Lancaster par Vaclav Brezina, Richard Easty et Pierre Weill-Tessier. Ce logiciel, sous licence publique BY-NC-ND Creative Commons, est gratuit et ne peut pas être utilisé à des fins commerciales.

LancsBox v 5.1.2 est également compatible avec les principaux systèmes d’exploitation tels que Windows (32 et 64 bits), Mac et Linux. Dans ce billet de blog, je vais vous présenter ses fonctionnalités sous Windows 64 bits, mais si vous souhaitez installer une autre version, vous pouvez cliquer ici pour accéder au site dédié (en anglais).

Débuter avec LancsBox

Avec LancsBox, il vous est possible d’utiliser des corpus et des listes de mots soit en les chargeant directement depuis votre ordinateur, soit en téléchargeant des ressources en ligne via le logiciel. Ce qui est pratique, c’est que LancsBox prend en charge un grand nombre de formats de fichiers de corpus (.txt, .xml, .doc, .docx, .pdf, .odt, .xls, .xlsx, .zip etc.) vous évitant ainsi de devoir les convertir en amont. Les listes de mots sont prises en charge au format texte séparé par des virgules (.csv). Autre avantage, le tagging (étiquetage) s’effectue automatiquement lors de l’importation des fichiers. En outre, si jamais vous fermez inopinément le logiciel vous pouvez toujours retrouver les derniers corpus chargés dans l’onglet « Corpora ».

Concrètement, pour importer des fichiers depuis son ordinateur c’est simple. Il faut d’abord cliquer sur « Corpus » ou « Wordlist » sous l’onglet « Load Data » pour sélectionner les fichiers dans le répertoire de l’ordinateur. Une fois que c’est fait, il est possible de nommer le corpus sur LancsBox. La dernière étape consiste simplement à appuyer sur « Import ».

Parmi les ressources en ligne accessibles gratuitement depuis le logiciel sous l’onglet « Download », vous pouvez consulter par exemple le British National Corpus, l’American National Corpus, le Brown University Standard Corpus, l’Australian Corpus of English et bien d’autres.

LancsBox v 5.1.2 dispose de sept outils d’analyse que je vais présenter dans le cadre de cet article : KWIC, Graphcoll, Whelk, Words, Ngrams, Text et Wizard.

KWIC : analyser des lignes de concordances

KWIC est l’acronyme de Key Word in Context qui signifie mot-clé en contexte. Comme son nom l’indique, cet outil affiche toutes les occurrences d’un terme, d’une catégorie lexicale ou encore d’une phrase en contexte. Le nombre d’occurrences et la fréquence sont automatiquement calculés et vous pouvez paramétrer la façon dont s’affichent les résultats (textes bruts, lemmatisés ou PoS).

Ce que j’apprécie beaucoup avec KWIC, c’est la possibilité de comparer simultanément deux corpus différents et d’alterner rapidement entre plusieurs corpus déjà chargés. La fonction recherche avancée est intéressante, car elle permet de faire des recherches par lemme et par catégorie grammaticale (PoS) même s’il arrive parfois que des erreurs se glissent dans les résultats. Il peut s’agir d’une mauvaise troncation d’un terme ou bien d’une erreur dans l’étiquetage de certains termes. En effet, il arrive par exemple que certains participes passés soient pris en compte lorsque l’on recherche un verbe (V*) ou bien qu’un déterminant se glisse parmi les noms (N*). Mais dans l’ensemble, je trouve que le tagging (ou étiquetage) automatique fournit des résultats corrects.

GraphColl : analyser des collocations

GraphColl est un outil dédié à la recherche de collocations. Les résultats sont générés et affichés dans un tableau et sous forme de graphique.

Ce que j’ai remarqué avec Graphcoll, c’est qu’il prend en compte tout le contenu du corpus chargé y compris les mots grammaticaux, les nombres, les dates, etc. Par conséquent, ce n’est pas toujours évident de s’y retrouver lorsqu’on s’attend à trouver « des mots qui vont bien ensemble », mais ce n’est pas mission impossible.

Afin d’obtenir des résultats qui soient exploitables et un graphique qui ne soit pas surchargé, il y a plusieurs options possibles. Vous pouvez par exemple choisir le nombre de termes à prendre en compte à gauche et à droite du terme recherché avec l’option span (portée), mais également définir la fréquence minimale des collocations avec threshold (seuil). Vous pouvez également filtrer les collocations dans la colonne « index » du tableau.

Whelk : analyser des fréquences dans des textes

Whelk sert à connaître la répartition d’un terme recherché à travers les différents fichiers d’un corpus sélectionné. Il reprend l’ensemble des fonctionnalités KWIC avec en plus un tableau statistique sur le nombre de tokens, la fréquence et la fréquence relative d’un terme. La mise à jour du tableau statistique se fait instantanément à chaque nouvelle recherche. Mais qu’est-ce qu’un token ? Selon le site du Sketch Engine, un token est défini comme étant la plus petite unité qui compose un corpus. Cela peut être un mot, un signe de ponctuation, un nombre, une abréviation ou un autre symbole qui n’est pas une espace. Quant à la fréquence (absolue) d’un terme, cela correspond tout simplement au nombre d’occurrences de celui-ci dans les fichiers du corpus tandis que la fréquence relative d’un terme est égale à sa fréquence absolue divisée par le nombre total de tokens présents dans le fichier de corpus où il se trouve. La fréquence relative permet de mesurer l’importance d’un terme et comme tous les fichiers n’ont pas le même nombre de tokens, Lancsbox calcule une fréquence relative normalisée sur 10 000 tokens pour chaque fichier du corpus afin d’obtenir des valeurs comparables. En d’autres termes, il suffit de multiplier la fréquence relative par 10 000 pour obtenir la fréquence normalisée. J’ai fait la vérification à la calculatrice et j’obtiens les mêmes résultats que le logiciel.

Words et Ngrams : des outils d’analyse plus poussés

Words est un autre outil qui permet d’effectuer des analyses approfondies sur la fréquence des termes, des lemmes et des catégories grammaticales (PoS). Il est composé de deux parties : les mots-clés, la fréquence ainsi que la dispersion s’affichent dans un tableau sur le côté gauche. À droite, un graphique permet de visualiser ces données. Un code couleur avec une échelle permet de se représenter l’importance d’un terme. Plus la fréquence relative du terme recherché est faible, plus la couleur du graphique circulaire sera claire. En outre, vous pouvez visualiser la structure interne du corpus en double cliquant dessus et également effectuer des comparaisons avec un autre corpus grâce à la vue partagée.

Comme son nom l’indique, l’outil Ngrams permet d’analyser des séquences de n-gramme. Mais qu’est-ce que c’est ? Ce sont des combinaisons comportant un nombre d’éléments défini. Une suite de deux éléments est appelée un bigramme. Une suite de trois éléments est un trigramme. Enfin je pense que vous avez compris le principe. Avec Lancsbox, il est possible de chercher des séquences de mots, de lemmes ou encore de catégories grammaticales (PoS) allant de un à dix. Ainsi, il vous est possible de connaître les suites d’éléments les plus fréquents dans le corpus que vous avez chargé.

Utiliser Text et Wizard

L’outil Text vous permet d’effectuer une recherche approfondie sur le contexte d’un terme soit sur l’ensemble du corpus ou bien soit sur l’un des fichiers au choix. Le terme recherché est surligné en rouge comme avec KWIC et vous pouvez naviguer en faisant défiler avec les flèches du clavier haut et bas. Vous retrouvez aussi la fréquence absolue et la fréquence relative par 10 000 tokens comme avec Whelk. Son utilisation est vraiment très simple et ce qui est pratique c’est que vous pouvez y avoir accès directement via l’outil KWIC en double cliquant sur une occurrence pour retrouver le contexte en entier.

Wizard est la nouveauté de la version 5 de LancsBox. Cet outil permet de combiner l’ensemble des outils précédents pour produire des rapports personnalisés (aux formats .docx ou .html). Il n’y a rien de sorcier dans l’utilisation de cet outil : il suffit de choisir le(s) corpus, le(s) outil(s) ainsi que le(s) terme(s) à rechercher sans oublier le dossier où sera importé le rapport. Il est possible d’aller plus loin en paramétrant les outils individuellement. Autre point de détail, vous n’avez pas besoin d’insérer de termes à rechercher si vous sélectionnez uniquement les outils Words et Ngrams.

Conclusion

En résumé, Lancsbox est un logiciel intéressant qui comprend un grand nombre de fonctionnalités plus ou moins complexes à utiliser. Même si certains outils d’analyse nécessitent une connaissance accrue dans les domaines de la linguistique de corpus et des statistiques, la prise en main des outils de base reste facile et rapide. Gratuit et compatible sous Windows, Mac et Linux, cet outil sept en un convient non seulement aux étudiants de traduction et aux chercheurs, mais également aux traducteurs professionnels.

Je tiens à remercier Vaclav Brezina qui m’a autorisé à utiliser et publier des images du logiciel Lancsbox dans le cadre de cet article.

Sources :

http://corpora.lancs.ac.uk/lancsbox/

http://corpora.lancs.ac.uk/lancsbox/download.php

http://corpora.lancs.ac.uk/lancsbox/docs/pdf/LancsBox_4.0_manual.pdf

http://corpora.lancs.ac.uk/lancsbox/docs/pdf/LancsBox_4.5_manual.pdf

http://corpora.lancs.ac.uk/lancsbox/docs/pdf/LancsBox_4.5_manualFR.pdf

http://corpora.lancs.ac.uk/lancsbox/docs/pdf/LancsBox_5.0_manual.pdf

http://corpora.lancs.ac.uk/lancsbox/materials.php

http://corpora.lancs.ac.uk/lancsbox/help.php

https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode.fr

https://www.youtube.com/watch?v=7SFJMFUP83Y

https://www.youtube.com/watch?v=TJ75iowURQc

https://www.sketchengine.eu/my_keywords/token/

https://www.laurenceanthony.net/software/antconc/

https://mastertsmlille.wordpress.com/2019/11/24/rencontre-avec-laurence-anthony/

Rencontre avec Laurence Anthony, le créateur d’AntConc, perle linguistique du Japon

Par Jordan Raoul, étudiant M2 TSM

 

LaurenceAnthony

Laurence Anthony, toujours très souriant, dans son bureau

 

Fin septembre 2019, mon acolyte m’annonçait qu’elle allait décoller pour Tokyo, à la fin du mois suivant, dans le cadre de son mémoire. En un clin d’œil, ma pause pédagogique était planifiée. Hélas, quelque chose me tracassait. Abstraction faite de la locution お前はもう死んでいる, qui n’allait pas m’amener très loin, je ne peux prétendre parler japonais. Je ne voulais pas me cantonner à la passivité, c’est pourquoi l’idée de donner une dimension éducative à ce voyage me plaisait. « Que faire entre une visite du Pokémon Center et un après-midi détente dans la librairie Tsutaya ? » Ainsi, je me mis à puiser de l’inspiration dans mes études, à l’instar de ma partenaire. Eurêka ! M. Loock, notre professeur, venait justement de nous parler de Laurence Anthony, le développeur de AntConc, lors du cours de grammaire comparée. Laurence Anthony vit à Tokyo, où il est directeur de département au sein du Center for English Language Education in Science and Engineering (CELESE) à l’Université Waseda. En un tour de main j’avais envoyé un e-mail à Laurence Anthony, qui n’a pas tardé à répondre positivement à ma demande. Dans ce billet, je vous parlerai de l’histoire de AntConc, des programmes qui l’accompagnent, et des raisons pour lesquelles vous devriez songer à vous l’approprier. Les informations présentées sont tirées d’une interview avec Laurence Anthony ainsi que de diverses sources que vous pourrez trouver à la fin de l’article.

Qu’est-ce que AntConc ?

AntConc est un logiciel que les traducteurs qualifient généralement d’outil de corpus DIY (Do It Yourself). Le principe est simple : l’utilisateur va lui-même créer son corpus en complétant une base de données. Les fichiers, généralement au format .txt, sont compilés dans une interface très simple d’utilisation. Par exemple, si je suis traducteur et que je suis spécialisé dans la mode ou encore dans l’art, et que je veux être certain de mes sources, je peux créer mon propre corpus dédié au domaine en question. Il est possible de créer autant de corpus que souhaitable. La fonction principale du programme est ce que l’on appelle un KWIC (Keyword-in-context). Cela implique que l’utilisateur doit saisir le terme recherché dans la barre située en bas de l’interface. KWIC, qui signifie, en français, « mot-clef en contexte », est ici illustré par le fait que le programme va produire un résultat qui met en évidence le mot recherché au travers d’une couleur. La fonction KWIC sort, qui se situe encore en dessous, permet de colorer les termes qui suivent ou qui précèdent le terme recherché, permettant ainsi à l’utilisateur de retrouver les mots avec lesquels un terme donné fonctionne, en d’autres termes les collocations. Il existe bien évidemment d’autres logiciels qui offrent le même type de service, comme Sketchengine ou le COCA, mais AntConc présente deux avantages non négligeables : utilisation hors connexion et gratuité !

AntConc

Interface type d’une page de résultats AntConc

 

AntConc n’est pas le seul outil développé par Laurence Anthony. Il y en a en réalité beaucoup, et quelques-uns peuvent se révéler très utiles pour les traducteurs. On peut mentionner AntCorGen, qui permet de générer des corpus spécialisés de façon massive et rapide, ou encore AntPConc, qui est un outil d’analyse de corpus parallèles. Comme nous le verrons plus tard, Laurence Anthony n’a pas développé ces logiciels pour des traducteurs, ce qui suggère des possibilités d’améliorations qu’il admet vouloir programmer à l’avenir.

Mais puisqu’on parle du personnage : qui est vraiment Laurence Anthony ?

Né en 1970 à Huddersfield, au Royaume-Uni, n’a, contre toute attente, jamais été traducteur. Durant ses études, il parvient d’abord à obtenir une licence en physique mathématique au Manchester Institute of Science and Technology (UMIST) [désormais partie intégrante de l’Université de Manchester]. Son intérêt grandissant pour l’apprentissage et l’enseignement des langues le mène ensuite à l’Université de Birmingham, où il a obtenu un Master en 1997, en TEFL/TESL (Teaching English as a Foreign Language/Second Language). Il s’agit d’une certification qui équivaut au FLE (Français en Langue Étrangère), en France, et qui permet d’enseigner sa langue maternelle à des étudiants qui ne la maîtrisent pas (ou pas en tant que première langue). En 2002, enfin, toujours à l’Université de Birmingham, il devient docteur en linguistique appliquée. Son champ d’étude combine l’informatique et la linguistique. Mais Laurence Anthony maintient une relation étroite avec le Japon, et ce depuis 1991, année à laquelle il devient professeur principal dans une école de langue anglaise, avant de devenir membre permanent du corps professoral à la Okayama University of Science. À partir de 2004, il occupe cette même fonction au sein de la Waseda University, à Tokyo, où il est, encore à l’heure actuelle, à ce poste. Ce qui est important à savoir, c’est que AntConc n’a jamais été son projet principal. C’est sa création, certes, mais c’est avant tout un outil qu’il a développé à destination des étudiants. Ainsi, les évolutions qu’a subi AntConc ont une dimension qui s’oriente pleinement vers la pratique.

Comment AntConc est-il né ?

Pour comprendre l’histoire de AntConc, il faut se replonger au milieu des années 1990. Internet est encore naissant, l’ergonomie de l’informatique également, et l’étude du discours dans les corpus se faisait à la main. Laurence Anthony, jeune étudiant doctorant, décide de développer un outil pour sa thèse. Il pense à une interface dédiée à l’analyse du discours par la machine, ce qui lui procurerait une productivité accrue et lui éviterait des tendinites répétitives. Une nouvelle approche, celle de l’apprentissage automatique (machine learning en anglais) serait, à son sens, plus rigoureuse. L’une des grandes nouveautés pour lui, à cette époque, fut le développement d’une interface. Laurence Anthony code depuis ses 11 ans, mais n’avait jusqu’alors jamais créé d’interface. Pragmatique, il était important pour lui que cette interface soit user-friendly, mais également que le programme reste simple et qu’elle se limite à des « widgets, des boutons, etc. ». AntConc 1.0 était né ! Le logiciel est d’ailleurs toujours en ligne, pour les curieux. Notez qu’il est programmé pour être international, grâce au UTF-8.

Laurence Anthony2

En fin d’interview, avec Laurence Anthony. Photo: Yuzhe Jia

 

Comment AntConc a-t-il évolué suite à sa création ?

Pour Laurence Anthony, la vocation première de AntConc est de servir d’outil de travail pour ses étudiants de rédaction. C’est lorsque notre développeur a reçu la demande d’un professeur japonais qui voulait l’utiliser pour sa classe de rédaction, que AntConc est passé de « projet de doctorat » à outil pédagogique. Ces étudiants se servent de l’outil comme nous, les traducteurs, en quelque sorte. En effet, le but est le même : assurer la qualité linguistique du texte final. Que l’on rédige depuis une traduction ou depuis ses pensées, le rendu doit être fluide, adapté au public, et présenter les bonnes collocations. Aujourd’hui, c’est avec plus de 10 000 étudiants que Laurence Anthony exploite l’outil AntConc. Si AntPConc ne présente aucun intérêt pour ce public, l’outil AntCorGen est très apprécié, lorsqu’il s’agit de rédiger un texte spécialisé. Les étudiants peuvent, par exemple, collecter des articles de recherche très rapidement.
Deux premières évolutions ont changé la donne : la possibilité de télécharger AntConc sous Windows et la mise en ligne du logiciel. Très vite, un autre type de public s’est approprié AntConc : les linguistes de corpus. Cela a d’abord surpris Laurence Anthony. Ces linguistes utilisaient AntConc comme outil de recherche et n’ont pas tardé à proposer des améliorations à Laurence Anthony. Des mesures statistiques, des fonctions complexes, bref, des choses que les étudiants n’allaient probablement pas demander. Le logiciel est ainsi devenu très populaire auprès des linguistes. Plus tard et de la même manière, sont arrivés les traducteurs. Ce dernier groupe a, lui aussi, des besoins qui sont très différents des étudiants et des linguistes. Laurence Anthony a des idées plein la tête, mais le temps lui manque.

Waseda

Université Waseda, Tokyo

 

Qu’en est-il des traducteurs, alors ?

À ce sujet, Laurence Anthony est moins confiant. Deux choses sont pourtant intéressantes. Il est intervenu lors d’une conférence sur la traduction et a été interviewé par un site dédié à la traduction qui n’a pas hésité à parler de AntConc en détail, l’auteur en recommandant d’ailleurs fortement l’usage pour les traducteurs. Bien évidemment, je ne suis pas venu sans questions au sujet de la traduction. Un outil attirait mon attention en particulier : AntPConc, qui gère les corpus parallèles. Laurence Anthony admet qu’une fonction permettant de combiner les corpus générés à une mémoire de traduction, de sorte à pouvoir y effectuer des recherches. Le logiciel serait ainsi pourvu de paramètres de choix de langue, et même d’une possibilité de faire des alignements. Tout cela laisse rêveur, si bien que le développeur songe à créer une interface qui soit entièrement dédiée aux traducteurs et aux seuls outils dont ils auraient besoin. Nous verrons ce que l’avenir nous réserve.

Des changements sont toutefois prévus prochainement !

Considérant que AntConc est relativement lent, par rapport aux outils en ligne, Laurence Anthony est en train de créer une nouvelle base de données pour son logiciel. Elle a pour objectif de procurer à AntConc une vitesse comparable à celle des outils en ligne, tout en fonctionnant hors connexion. La langage choisi par le développeur pour cette base de données, Python, est supposé permettre à celle-ci de supporter des corpus de taille beaucoup plus grande, chose qu’apprécieront les linguistes. Des ajouts de mesures statistiques sont également au programme. À l’heure actuelle, AntPConc est déjà rédigé en Python, mais c’est un logiciel que peu de gens utilisent et Laurence Anthony n’a pas vraiment reçu de retours (traducteurs : à vos claviers). Sans retours, il n’y aura pas de changements. Sachez qu’il vous est également possible de soutenir financièrement Laurence Anthony, en passant par les liens PayPal et Patreon qui se trouvent dans l’onglet « Software » du site web. Laurence Anthony serait ravi de pouvoir investir dans les bonnes idées !

Pour conclure…

Pour Laurence Anthony, AntConc doit rester simple. Sa vocation est celle de servir les étudiants mentionnés plus tôt. Une évolution qui suivrait de trop près les attentes et les besoins des linguistes et des traducteurs risquerait de trop complexifier le logiciel. Sa facilité de prise en main a sûrement une influence sur sa popularité. Son succès retentit à travers plusieurs pays : la Bank of England en fait usage, les universités chinoises en sont fans, et la Corée du Sud a vu la publication d’un ouvrage entièrement dédié à AntConc ! Ce dernier a eu l’approbation de Laurence Anthony, mais le développeur a été très agréablement surpris lorsqu’il a appris l’existence du livre. Vous voilà à présent très informés à propos de AntConc et de son créateur, Laurence Anthony. Une chose est sûre, le programme n’a pas fini de grandir !

AntConcbook

L’ouvrage en question, rédigé en coréen

 

Liens :

Le site de l’intéressé (sur lequel sont disponibles tous les logiciels) :
https://www.laurenceanthony.net/

Lien vers l’article de Michael Wilkinson, sur AntConc :
https://www.translationdirectory.com/articles/article2367.php

J’ai testé pour vous… La gestion de projet grâce au logiciel Plunet BusinessManager

Par Clément Surrans, étudiant M2 TSM

Dans le cadre du Master TSM de l’université de Lille, j’effectuais cette année un stage au sein d’une entreprise de gestion de projet : Production SA. Il s’agit d’une société basée en Belgique, qui s’occupe de faire traduire des projets pour de nombreux clients, et qui contracte plus de 700 traducteurs. J’y ai découvert un logiciel, Plunet BusinessManager, qui permet de centraliser et traiter différents projets de traduction. En tant que débutant dans le milieu de la gestion de projet, j’appréhendais la complexité du suivi des projets. Pourtant, grâce à notre principal outil de travail, Plunet, j’ai pu avoir une vue d’ensemble sur les projets en cours, et sa simplicité m’a permis d’être autonome et proactif très rapidement.

Qu’est-ce que c’est ?

Plunet BusinessManager est une plateforme de gestion de projets linguistiques. Cet outil permet de gérer un projet de traduction multilingue, depuis sa création jusqu’à sa livraison, et de suivre l’état d’avancement du projet. Il s’appuie sur une plateforme web, et intègre un logiciel de traduction, une comptabilité financière et des systèmes de gestion de la qualité. Ce système est idéal pour l’optimisation de tous les processus de gestion et de workflow spécifiques aux fournisseurs de services linguistiques professionnels et aux services de traduction. Il est d’ailleurs disponible dans 11 langues.

Plunet regroupe ainsi la gestion de la commande, du devis et de la facturation, de l’avancement des différents projets, du suivi qualité et permet la compilation de glossaires. Il intègre également l’ensemble des fonctionnalités de la technologie Trados. La combinaison de ces deux systèmes, la gestion d’information SDL et les fonctions de gestion de projets d’entreprise de Plunet, facilite la mise en place de processus de gestion.

Comment ça marche ?

À partir de la plateforme en ligne, le Plunet Dashboard, les gestionnaires de projet peuvent avoir une vue d’ensemble sur tous les projets en cours. Vraiment pratique quand on doit en gérer des centaines !

plunet1-1.png

 

En cliquant sur un statut particulier, le détail des devis/projets au statut correspondant s’affiche en bas de page, en dessous du tableau de bord.

  • Request : il s’agit des commandes des clients. Une fois que les clients ont accès au portail, ils peuvent envoyer des demandes via celui-ci, y télécharger les fichiers et inscrire dans leur Request tous ce qu’il faut savoir pour démarrer le projet, tels que le niveau de service demandé ou le degré de confidentialité du contenu, et les consignes pour la traduction s’il y en a.
  • Quote et Order : une fois la commande reçue, il est possible de la convertir en devis pour le client, la Quote, ou de directement lancer le projet. Une fois ce devis accepté, la Quote sera elle aussi convertie en projet, sous le nom Order. Sur le Dashboard Plunet, les projets sont classés en sous-catégories selon les critères que vous voulez. Vous pouvez ainsi savoir quels projets sont urgents, lesquels sont prêts à être livrés, et ceux à traiter dans la journée.

 

L’avantage avec Plunet, c’est que vous pouvez créer votre projet SDL Trados Studio à partir de la plateforme en y associant la mémoire de traduction paramétrée dans le workflow du projet, et que les tarifs de vos clients sont directement liés à l’outil de TAO. Les prix sont calculés automatiquement à partir de l’analyse du fichier dans SDL Trados Studio.

plunet2-1-e1566200246897.png

 

  • Jobs : Une fois le projet inscrit, il faut lui assigner les bons traducteurs. Dans la fiche du Job, grâce à différents filtres, vous pouvez sélectionner les traducteurs de votre base de données selon les spécificités de vos projets. Vous pouvez créer plusieurs jobs dans un projet, et ainsi préparer vos différentes ressources pour ce projet, comme un traducteur, un réviseur ou un préparateur de fichier. Vous pouvez personnaliser différents niveaux de services, et y associer les workflows prédéfinis.

plunet3.png

 

L’interface permet également de comparer les prix des ressources sélectionnées, pour vous aider à trouver la meilleure offre. Dès que vous avez trouvé votre traducteur, vous pouvez directement lui proposer le projet via la plateforme qui se chargera de lui envoyer la demande. Une fois le projet accepté par le traducteur, vous pourrez le lui assigner à partir de la fiche du Job. D’un simple clic, le traducteur peut recevoir tout ce qu’il faut pour commencer le projet. Grâce à l’intégration de SDL Trados Studio, il est possible de créer le package Studio directement à partir de la fiche du job. Le package se créera automatiquement à l’emplacement défini, et sera envoyé directement au traducteur dès que le projet lui sera assigné.

Une fois la traduction réceptionnée, il est possible d’effectuer un suivi qualité pour chaque traduction, en inscrivant dans la fiche du job le feedback du réviseur.

  • Tasks : Servant de mémo, les tâches en cours permettent de noter tout ce qu’il faut se rappeler pour la journée.
  • L’interface permet également la gestion de la facturation, mais je n’ai pas eu le loisir de découvrir ces fonctionnalités.

 

Que conclure ?

Plunet est très bon outil de gestion, qui permet de tout centraliser sur un seul et même écran. Je ne connais pas d’autre système de gestion avec lequel le comparer, mais je pense pouvoir dire qu’avec cet outil, le suivi des projets et d’une simplicité extraordinaire. Avec son système configurable, il propose diverses fonctions et extensions. Il n’existe pas de version gratuite, mais c’est un bon investissement. En prédéfinissant vos workflows, vous pourrez inscrire un projet en très peu de temps, et y associer vos ressources très vite. En intégrant la technologie Trados, il facilite la gestion terminologique et la tarification grâce aux tarifs prédéfinis pour vos clients et pour vos traducteurs. Il permet aussi d’effectuer le suivi qualité de vos traducteurs.

 

J’espère que vous serez emballés comme moi par cet outil !

 

Je tiens à remercier l’équipe de Plunet de m’avoir permis d’utiliser les photos de leur site pour mon article.

 

Sources :

https://www.capterra.fr/software/151878/plunet-businessmanager

https://www.plunet.com/en/translation-management-software/

 

La traduction francophone, oui ! Mais quel français ?

Par Jonathan Sobalak, étudiant M2 TSM

 

variete

Source de l’image : https://www.easyvoyage.com/actualite/quebec-vs-france-quelles-sont-les-differences-entre-les-deux–62809

 

Pour un traducteur, les difficultés au jour le jour sont nombreuses : garder l’équilibre entre le sens et le style, trouver la bonne terminologie, adapter la traduction au public visé ou au client. Mais pour la plupart des langues, y compris le français, il existe une autre difficulté. Trouver un terme technique équivalent en français représente déjà un obstacle, mais concernant les termes courants, il ne faut pas prendre leur traduction à la légère, pour une raison simple : les spécificités régionales. En effet, les termes de la vie courante, même parfois très simples, n’ont pas forcément la même appellation en France, en Belgique, au Québec, en Suisse ou encore dans les DOM-TOM. C’est un souci de plus à rajouter à une liste déjà longue d’éléments problématiques en traduction. Et ces différences ne concernent pas seulement le lexique, mais aussi les termes identiques qui n’ont pas la même définition, ou ne font pas référence au même signifié. Je vous propose de passer en revue les problèmes majeurs qu’impliquent ces disparités régionales.

Des différences dans le lexique

Du point de vue des Français, quand on parle du français québécois, on pense immédiatement à la particularité de l’accent et parfois à la difficulté que l’on rencontre quand il est question de comprendre parfois une simple phrase. Cela représente un défi pour les interprètes certes, mais les accents disparaissent à l’écrit : les traducteurs, qui n’ont pas à s’en soucier, n’auraient donc pas de problème ? Pas vraiment, car ce n’est pas la seule particularité de ce français. Entre anglicismes et mots désuets voire inexistants en France, il sera parfois difficile pour un français de rendre une bonne traduction d’une langue étrangère vers le français québécois ; mais il devra faire attention aussi à ne pas recourir à des termes propres au français québécois pour une traduction vers le français de France. C’est bel et bien le risque qu’on encourt lorsqu’on utilise des dictionnaires en ligne tels que Termium ou encore le Grand dictionnaire terminologique, d’origine québécoise.

Au traducteur alors de vérifier ses sources et d’adapter sa traduction selon sa cible, car traduire « convenience store » par « dépanneur » comme l’indique Termium posera un gros problème de sens en français de France, puisque qu’un dépanneur au Québec, c’est l’équivalent d’une supérette dans l’hexagone. Il faut aussi faire attention au registre de langue, ainsi « piger » au Québec est un mot de registre courant (qui signifie prendre), un mot dont l’utilisation est impensable en français de France dans un registre autre que familier.

Mais le français belge n’est pas en reste en ce qui concerne les différences lexicales, ainsi utiliser le terme de « voie de circulation » pour une traduction vers le français belge constituera une erreur terminologique et affectera la qualité de la traduction finale, car en Belgique, c’est bien de « bandes de circulation » dont il est question. Le même cas concerne le clignotant en France par exemple, qu’on appelle « clignoteur » en Belgique. Voilà autant de raisons d’être attentif au lexique que l’on utilise lors d’une traduction vers un français précis.

Pensez à l’influence de Shakespeare

Les anglicismes, c’est l’utilisation courante d’un terme anglais dans une autre langue, le français dans le cas présent. Et les anglicismes peuvent être différents, absents ou utilisés d’une autre manière selon le français concerné. Par exemple, le français québécois, qui se vante pourtant de ne pas être autant influencé par la langue anglo-saxonne, possède de nombreux termes anglais dans son lexique, que nous n’avons pas récupérés en France. On peut citer par exemple un « fan » pour signifier un ventilateur, ou encore le terme « gun » pour les pistolets. En revanche, certains anglicismes adoptés en France ne l’ont pas été dans cette région, comme un « parking » ou un « drive-in », termes anglais absents du registre québécois : là-bas, ce sont des stationnements et des services au volant.

Mais les anglicismes ne s’arrêtent pas seulement aux termes en eux-mêmes : les constructions de phrase et la syntaxe peuvent aussi être influencées par l’anglais. Ainsi, pour garder la même région comme exemple, une construction telle que « demander une question » serait impensable en français de l’hexagone, mais c’est pourtant la norme au Québec. Un terme ou une construction de phrase, qui nous paraît évident au moment de la traduction, a alors toutes les chances de sonner faux et d’exposer la vraie nature de votre texte : une traduction mal adaptée à la région linguistique. À prendre en compte lors de votre prochaine révision/recherche terminologique.

La traduction machine et les outils de TAO, peut-on leur faire confiance ?

En effet, une question se soulève alors : les outils du traducteur sont-ils adaptés à cette problématique ? Et celle-ci mérite bien d’être posée. Pour la traduction machine, on peut penser par exemple aux deux outils les plus utilisés du domaine : DeepL et Google Translate. Ils possèdent bien comme fonctionnalité la traduction vers ou depuis le français de France, mais qu’en est-il du français belge, suisse ou ivoirien ? C’est une composante à prendre en compte lorsque l’on utilise ces outils, que ce soit pour les traducteurs ou les particuliers.

Les dictionnaires quant à eux devraient être en nombre suffisant pour contenter chaque région linguistique, mais ce n’est pas forcément le cas des concordanciers. Bien que Tradooit, par exemple, précise dans son adresse son origine canadienne pour nous prévenir qu’il est possible d’y trouver du français du Québec, Linguee lui n’indique en aucun cas qu’il possède les variétés linguistiques ailleurs que dans la source des documents cités. Ainsi, c’est à l’utilisateur d’être vigilant quant aux propositions du site, sous peine d’opter pour un « piger » en lieu et place de « prendre ».

Fort heureusement pour la traduction assistée par ordinateur, Studio, le leader du marché, a prévu cette possibilité et propose différentes langues selon les régions linguistiques, pour le français mais aussi beaucoup d’autres langues comme l’anglais ou l’espagnol.

 

Je ne peux donc que vous conseiller d’être vigilant si vous avez besoin de traduire un texte vers le français, que ce soit pour le public visé ou pour les sources de vos recherches, car au Québec, on ne fait pas de shopping mais bien du magasinage, et si vous cherchez des betteraves en Suisse, préparez-vous à trouver des carottes rouges !

 

Sources :

http://correspo.ccdmd.qc.ca/index.php/document/parce-que-ce-ne-sont-pas-que-des-mots/usages-lexicaux-propres-au-francais-du-quebec/

https://culturesconnection.com/fr/francais-quebec-france-differences/

https://www.erudit.org/fr/revues/meta/1994-v39-n1-meta188/004293ar/

Le futur n’a pas besoin de traducteurs*

Article original en anglais The Future Does Not Need Translators, écrit par Jaap van der Meer et publié le 24.02.2016 sur le blog de la TAUS (Translation Automation User Society).

Traduction française de Pierre Ferré, étudiant M1 TSM.

 

traductionautomatique.jpg

 

* Ce titre est inspiré d’un article écrit par Bill Joy (alors chercheur principal chez Sun Microsystems) et publié dans Wired Magazine en avril 2000. (Why the future does not need us, lien en anglais)

 

Cet article quelque peu lugubre nous mettait en garde contre un avenir dans lequel les machines nous domineraient, nous, les humains. « C’est maintenant qu’il faut agir si nous ne voulons pas nous laisser surprendre et choquer […] par les conséquences de nos inventions. » Projeter ce problème fondamental et existentiel sur notre propre secteur, celui de la traduction, pourrait facilement provoquer d’accablantes et déprimantes visions sur l’avenir de l’industrie de la traduction pour les décennies à venir. En conséquence, cela pourrait nous disposer (tous les travailleurs de ce secteur) dans un état d’esprit défensif et réactif ou bien passif. Nous nous devrions plutôt d’être réalistes, d’avoir un esprit ouvert sur les avantages et sur les inconvénients. Le futur n’a peut-être pas besoin de nous, mais nous avons bien besoin de lui.

Le jour viendra où les machines seront plus performantes qu’un traducteur humain pour traduire un texte d’une langue à une autre. Ce moment est dénommé la singularité. Le débat porte sur la question de savoir si cette singularité est vraiment quelque chose que nous devrions espérer. La réalité est que nous sommes tellement engagés sur cette voie qu’il est devenu difficile, si ce n’est impossible, d’inverser la tendance.

La singularité est proche. Ce que cela signifie, en termes simplifiés, pour la traduction qui jusqu’alors a été le domaine exclusif de l’homme, c’est que les machines vaincront le cerveau humain et continueront de se perfectionner dans une sorte d’apothéose d’intelligence. Elles n’auront plus besoin de nous, les humains, pour en apprendre plus et pour s’entraîner. Nous leur avons donné les moyens de s’améliorer elles-mêmes : une incroyable capacité de traitement, l’accès à des volumes de données en constante augmentation et des techniques d’imitation de notre cerveau grâce au deep learning et aux réseaux neuronaux.

Imaginez une machine capable de traduire dans une centaine de langues et tout cela en temps réel. Aucun être humain ne serait capable d’en faire autant. La qualité et l’exactitude de ces traductions automatiques ne sont peut-être pas toujours parfaites, mais elles sont tellement pratiques que nous apprenons à nous en accommoder,  nous nous adaptons et nous la modifions lorsque c’est nécessaire.

A quel point cette singularité est-elle vraiment proche ? Ray Kurzweil (auteur du livre « Humanité 2.0 » et directeur de l’Ingénierie chez Google depuis 2012) prédit qu’en 2019, les traductions automatiques seront suffisamment performantes pour pouvoir remplacer les traducteurs humains. (Interview dirigée par Nataly Kelly, publiée dans Huffington Post en juin 2011,lien en anglais) Nous en sommes suffisamment proches pour en parler sérieusement.

Le TAUS ouvrira cette année un débat sur l’avenir de la traduction. À l’occasion des principaux évènements TAUS (Dublin, 6-7 juin et Portland, 24-25 octobre), nous invitons les chefs de file de la recherche en traduction automatique (TA) et les chefs d’entreprise de traduction à venir discuter de certaines questions fondamentales :

  1. À quel point la singularité en traduction est-elle proche ?
  2. Quelles en sont les limites du point de vue de la recherche?
  3. À quelles avancées vous attendez-vous ?
  4. Quels sont les impacts commerciaux, les avantages et les inconvénients ?
  5. De quelle façon la profession se verra-t-elle affectée ?

En guise d‘introduction au débat, nous avons demandé à certains des participants de partager leur point de vue sur ces questions dans cet article. Permettez-moi d’ouvrir le débat avec mon propre point de vue. À quel point la singularité est-elle réellement proche ? Je ne suis pas le mieux placé pour répondre à cette question. Mais je pense qu’il est concevable qu’elle se produise dans les dix ou vingt prochaines années. Par ailleurs, il s’agira probablement d’une évolution graduelle ponctuée de prises de conscience. Nous parviendrons effectivement à la FAUT (Fully Automated Useful Translation), bien différente du saint Graal qu’est la FAHQT (Fully Automated High Quality Translation) qui a été définie comme étant un objectif réalisable par les concepteurs de la première TA dans les années 50 (en cinq ans !). En ce qui concerne les impacts commerciaux, je crois que la singularité en traduction dynamisera considérablement le commerce mondial. Qu’en sera-t-il du métier de la traduction ? Comme je l’ai dit précédemment, l’accès universel aux FAUT pourra entraîner une croissance de la demande de traductions particulièrement créatives. Je ne pense pas que cela soit une coïncidence si l’on entend souvent les termes « hyper-localisation » et « transcréation » pour faire référence à de nouveaux services du secteur de la traduction. Non, je ne pense pas que les métiers de la traduction soit totalement mis en danger, mais ils changeront profondément. Les tâches ennuyeuses disparaîtront. Les questions que je me pose et qui seront, je l’espère, débattues cette année lors des évènements TAUS, sont les suivantes : où seront construites ces nouvelles machines de traductions puissantes et qui en aura le contrôle ? Verrons-nous de nouveaux innovateurs et changements de donne non influencés par l’héritage de dizaines d’années dans le milieu la traduction et qui, par conséquent, évoluent beaucoup plus vite, dans d’autres parties du monde et dans les économies émergentes ?

Le point de vue sur le débat d’Alex Waibel :

Bien entendu, cette question n’est pas nouvelle : les machines remplaceront-elles les humains et rendront-elles leurs efforts redondants, ou bien ne seront-elles qu’un piètre détail qui jamais n’égalera la véritable performance humaine ? Je suis quelque peu sceptique sur ces deux opinions. Il est exact que nous avons su accroître considérablement les performances de la traduction automatique et de la reconnaissance vocale et qu’elles ont progressé spectaculairement. Et ces progrès se poursuivront. Je crois qu’une performance dépassant celle d’un humain, en fonction du cas d’utilisation, sera possible dans une ou deux décennies. Mais jusqu’à présent, ces avancées ont mené à un élargissement des services et  donc également à une augmentation de la demande et de l’utilisation, en phase avec la mondialisation et la quantité de matériel produit. Les prédictions selon lesquelles nous n’auront plus besoin de traducteurs humains me semblent pour le moins alarmistes et extrêmes. Il est plus probable que nous soyons témoin d’une accélération et d’une augmentation de la quantité des traductions, mais que les humains continuent de jouer leur rôle dans cette demande croissante. Il y aura davantage de symbiose entre les humains et les machines, et l’amélioration de la communication et de la compréhension entre les langues sera bénéfique pour notre espèce. (Alex Waibel est professeur en informatique à la Carnegie Mellon University and Karlsruhe Institute of Technology, il est également directeur d’interACT, International Center for Advanced Communication Technologies.)

 

Le point de vue sur le débat de Marcello Federico :

Ces questions reviennent chaque fois qu’une nouvelle avancée se produit. Les voitures sans chauffeurs remplaceront-elles les chauffeurs humains ? La traduction automatique neuronale éliminera-t-elle les traducteurs humains ?  La vérité est que nous aimons les explications et les conclusions simples (et qu’elles nous fascinent). Le monde réel est bien plus complexe. Le progrès refaçonne constamment les relations entre la technologie et l’humain, bien souvent de manière imprévisible. Il est donc très difficile de faire des prévisions dans ce domaine. La technologie a tendance à progresser de façon verticale, s’efforçant de résoudre des tâches spécifiques qui peuvent mener à des applications  intéressantes. Mais l’action de traduire, de même que celle de conduire une voiture, présente plusieurs facettes et niveaux de difficultés. La traduction automatique de documents techniques du français vers l’anglais ou laisser une voiture sans chauffeur évoluer sur une autoroute américaine sont certainement des avancées technologiques qui ouvrent la voie vers des applications intéressantes. Cependant, ces dernières ne peuvent généralement pas être interprétées comme des solutions pour la traduction ou la conduite. Ce qui est particulièrement important, c’est qu’elles ne prouvent pas à quel point nous nous rapprochons de la résolution de ces problèmes généraux. Quand verrons-nous une voiture autonome capable de naviguer dans les rues de Naples ou une traduction automatique de haute qualité de l’allemand vers le turc ? Bonne question ! En tant que scientifique, je suis optimiste et prudent : il est clair que nous accomplissons des progrès en termes de traduction automatique, mais ils sont difficiles à quantifier.  En tant qu’humain, je préfère l’aspect coopératif de l’IA à l’aspect compétitif : Comment la technologie peut-elle permettre aux traducteurs de travailler mieux et plus rapidement ? Comment les machines peuvent-elles apprendre directement des traducteurs humains ? Comment les machines peuvent-elles débarrasser les traducteurs des tâches ennuyeuses et répétitives afin qu’ils puissent se concentrer sur l’aspect créatif de leur profession ?  Selon moi, hormis le fait qu’elles ouvrent la voie à de nombreuses problématiques de recherche, elles incarnent l’approche qui produira les technologies de demain les plus performantes de notre domaine. (Marcello Federico est directeur de recherche du département de recherche HLT-MT de la Fondazione Bruno Kessler, Trente, Italie. Son équipe participe à plusieurs projets recherche de recherche européens axés sur une nouvelle génération de systèmes de TA, tel que le projet MMT [Modern Machine Translation].)

 

Le point de vue sur le débat de Marco Trombetti :

Le concept de la singularité me fascine depuis mon plus jeune âge. À l’époque, ce terme était davantage associé aux trous noirs qu’à la technologie. Aujourd’hui, la singularité m’effraie de la même manière que les trous m’effrayaient alors. Le mélange de curiosité et de crainte explique ma passion pour ce sujet et pourquoi je passe du temps à travailler sur l’intelligence artificielle (IA).  L’IA, devant la singularité, est en passe de devenir le prochain grand changement dans notre futur proche. Je suis convaincu qu’elle portera l’humanité vers une nouvelle ère d’accessibilité et d’organisation de l’information. La traduction est probablement la tâche humaine la plus complexe à apprendre pour une machine, mais c’est aussi celle avec le meilleur potentiel. Elle pourrait faire du monde une seule grande famille, rapprocher les individus les uns des autres en abattant les barrières linguistiques et permettre un plus grand partage de l’information. Le langage, par rapport à de nombreux autres secteurs pour lesquels l’IA doit analyser une réalité statique, évolue en même temps que les humains.  Les machines ont besoin de l’aide constante de l’homme pour rester à la page. (Marco Trombetti est PDG de Translated, les créateurs de MateCat. Également entrepreneur et investisseur, il vit et travaille à Rome.)

 

Le point de vue sur le débat de Khalil Sima’an :

Il est bien évidemment impossible de prédire quand se produira la « singularité » et quelle forme prendra alors le marché. Pourtant, sur la base de ce que je peux observer en termes de technologie, j’ai le sentiment que nous nous trouvons aujourd’hui à un point où, dans moins de deux décennies, la plupart des tâches de traduction standard seront effectuées par des machines pour un bon nombre des paires de langues économiquement dominantes. Les traducteurs humains continueront de jouer un rôle défini par des besoins très spécifiques des clients, qui auront souvent pour objectif de collecter des nouvelles données afin d’améliorer la TA. Certains types de traductions les plus intéressants, comme la littérature et la poésie de haute qualité, pourraient encore demeurer du ressort de quelques traducteurs humains doués pour un certain temps. Mais le gros de l’industrie de la traduction traditionnelle fera les frais de cette automatisation. Ce qui va changer le marché n’est en fait pas tant l’automatisation totale en soi, mais le fait que celle-ci sera proposée comme « production de masse » représentant une grande part (voire l’ensemble ?) des commandes de traduction. Il est probable que ce service sera offert par une poignée de nouveaux acteurs qui oseront opérer ce changement déstabilisant. Ces derniers auront l’avantage de s’adapter rapidement à l’évolution des besoins du marché et accepteront toutes les commandes de traduction sans distinction. (Khalil Sima’an est professeur de linguistique informatique à la Faculté des Sciences de l’université d’Amsterdam [FNWI]. Son équipe travaille sur plusieurs projets de nouvelle génération de traduction automatique, tel que DatAptor et les projets QT.)

 

Note du traducteur : Ce sujet m’a paru particulièrement intéressant car, en tant qu’étudiant.e.s en Traduction Spécialisée, la traduction automatique et les progrès spectaculaires qu’a accompli celle-ci lors de ces dernières années peut préoccuper certains d‘entre nous quant à l’avenir du métier vers lequel nous nous dirigeons. La traduction automatique neuronale remplacera-t-elle effectivement le traducteur humain ? Les opinions divergent, même au sein des professionnels œuvrant pour son développement. Quelle que soit notre opinion sur le sujet, il est important de rester attentif à l’évolution de cette technologie.

 

Mise à jour des mémoires de traduction et des glossaires : pour quoi faire ?

Par Lucie Lhuillier, étudiante M2 TSM

 

Capture

 

Lorsqu’ils traduisent, les traducteurs ont recours à diverses ressources. Parmi elles, on retrouve notamment les mémoires de traduction et les glossaires qui sont couramment utilisés. Cependant, il est fondamental de veiller à ce qu’ils soient mis à jour régulièrement. Pour quelles raisons ?

 

Qu’est-ce qu’une mémoire de traduction ?

Une mémoire de traduction est une base de données linguistique utilisée lors d’une traduction grâce aux outils de TAO (Traduction assistée par ordinateur). Elle est composée de segments en langue source et de leur traduction en langue cible.

Utiliser une mémoire de traduction permet au traducteur de travailler plus vite et d’être plus efficace. Grâce à celle-ci, il ne traduit jamais deux fois la même chose. La mémoire de traduction est alimentée par le traducteur, les segments traduits et validés sont enregistrés au fur et à mesure de la traduction. Si le logiciel détecte un segment qui a déjà été traduit auparavant, il va automatiquement suggérer la traduction enregistrée dans la mémoire. Il s’agira, selon le degré d’analogie, de correspondances parfaites ou de correspondances partielles. Les nouvelles unités de traduction pourront être utilisées à leur tour lors des projets suivants.

Attention, la mémoire de traduction ne traduit pas à la place du traducteur mais l’assiste dans son travail. C’est au traducteur de déterminer s’il garde la traduction proposée telle quelle ou s’il doit l’adapter. La mémoire va également lui permettre de garder une certaine cohérence et homogénéité au fil de la traduction. Par ailleurs, celle-ci n’est pas capable de repérer les éventuelles erreurs de traduction ou fautes de grammaires, ni de vérifier l’orthographe.

En outre, il ne faut pas confondre mémoire de traduction et traduction automatique (voir ce billet) qui sont deux choses bien distinctes. La traduction automatique ne nécessite aucune intervention humaine contrairement à la mémoire de traduction qui, elle, est créée et alimentée par le traducteur.

Qu’est-ce qu’un glossaire ?

Un glossaire est une base de données contenant une terminologie spécifique en langue source et en langue cible qu’il est possible d’intégrer à un outil de TAO. Il peut être bilingue mais aussi multilingue et ne contient pas de segments mais des termes précis, contrairement aux mémoires de traduction. Ces bases de données permettent de garder une certaine cohérence terminologique et rédactionnelle au sein d’un même projet mais également entre les différents projets d’un client. En effet, ces projets sont parfois espacés dans le temps ou confiés à d’autres traducteurs. Les glossaires garantissent alors l’utilisation de la même terminologie à chaque traduction, à condition bien sûr, que les termes ne soient pas devenus obsolètes. Ils peuvent regrouper des termes qui correspondent à un domaine précis, à un projet ou bien à un client en particulier. Parfois, en plus des termes, on peut également y intégrer d’autres données telles que les définitions et leurs sources, les catégories grammaticales, le contexte, les illustrations ou encore les dates d’insertion (qui peuvent inciter un traducteur à revoir l’usage d’un terme si la date lui paraît éloignée dans le temps).

Un glossaire sert de référence au traducteur dans le choix de la bonne terminologie.  Son utilisation est d’autant plus nécessaire lorsque plusieurs traducteurs travaillent sur un même projet. La mise en commun des ressources, glossaires mais aussi mémoires de traduction, permet de garantir l’homogénéité de la traduction réalisée par une équipe et donc d’offrir une traduction de qualité.

Pourquoi les mettre à jour ?

Les mémoires de traduction et les glossaires sont des ressources essentielles pour le traducteur. En effet, ils possèdent de nombreux avantages qui leur permettent de fournir des traductions de qualité.

Cependant, pour garantir l’efficacité de ces ressources, il est fondamental de les mettre à jour régulièrement non seulement pour les alimenter en ajoutant les nouvelles traductions à chaque projet mais aussi pour supprimer la terminologie obsolète. En effet, rien n’est figé. Par conséquent, la terminologie, tout comme les langues, évolue et change au fil du temps. C’est pourquoi, éliminer cette terminologie devenue obsolète et la remplacer par celle qui correspond à la période actuelle est une étape à ne pas négliger. Si les ressources qu’utilise un traducteur sont désuètes et ne sont donc plus d’actualité, la qualité de la traduction risque d’être mauvaise et donc de ne pas répondre aux exigences du client. La mise à jour des ressources permet d’assurer une qualité constante.

 

 

Sources :

https://www.inter-contact.de/fr/blog/151-memoire-de-traduction-comment-le-traducteur-travaille-t-il-avec-et-comment-en-profitez-vous

http://www.sdltrados.com/fr/solutions/translation-memory/

https://www.technitrad.com/fr/qu-est-ce-qu-un-glossaire/

http://www.itc-france-traduction.com/le-b-a-ba-des-memoires-de-traduction/

https://www.redactionpro.fr/le-glossaire%E2%80%89/

https://www.eazylang.com/blog/index.php/2017/11/20/role-glossaires-traduction-professionnelle/

 

J’ai testé pour vous… Memsource

Par Léa Gonzalvez, étudiante M2

Aujourd’hui j’ai décidé de vous parler de Memsource, un outil que nous avons eu la chance de découvrir dans le cadre du cours « Nouveaux outils » du Master 2 TSM. Pour commencer je vais rapidement vous présenter cet outil, puis je partagerai avec vous un petit guide spécial débutants pour créer des projets et enfin je vous donnerai mon avis.

Présentation de l’outil et de ses fonctionnalités

Fondée en 2010, Memsource est une plateforme de traduction en ligne (cloud) dont le siège est situé à Prague mais qui possède des bureaux un peu partout dans le monde.

Memsource est à la fois un outil de gestion de projets et un outil de TAO destiné aux traducteurs. Il comporte trois composantes différentes mais complémentaires : Memsource Cloud, qui permet de créer et gérer ses projets, Memsource Web Editor, environnement de travail en ligne destiné aux traducteurs et Memsource Editor, environnement de travail hors-ligne également destiné aux traducteurs.

  • Memsource Cloud

Memsource Cloud, c’est la plateforme en ligne à partir de laquelle il est possible de créer ses projets et de suivre leur avancée. C’est également à partir de Memsource Cloud, que l’on peut accéder au Web Editor.

1

Du côté fonctionnalités, on retrouve les mêmes que sur les autres outils de TAO actuels, à savoir : la possibilité de créer, d’importer et de gérer des mémoires de traduction (TM) et des bases terminologiques (TB), ainsi que la possibilité d’utiliser la traduction machine.

  • Memsource Web Editor

Il s’agit de l’environnement de travail en ligne destiné aux traducteurs et accessible directement depuis Memsource Cloud.

Il n’y a rien à installer sur votre ordinateur, une connexion internet suffit. Lorsque vous êtes connecté à Memsource Cloud, il suffit de cliquer sur le nom du fichier à traduire et l’éditeur web s’ouvre directement dans un nouvel onglet : vous pouvez commencer à traduire et les modifications s’enregistrent automatiquement.

L’interface de l’éditeur est très similaire à celle des autres outils de TAO actuels. Du coup, j’ai trouvé que c’était assez facile à prendre en main lorsqu’on est déjà familier avec ce genre d’outils.

2

Je ne parlerai pas de Memsource Editor dans ce post car je ne l’ai pas testé.

Guide pour débutants : créer un projet dans Memsource Cloud

  • Créer un Projet

Voici la page d’accueil de Memsource Cloud.

3 

Tous les menus pour créer et gérer votre projet et ses composantes se trouvent dans la partie gauche (panneau noir) de l’écran, ce qui est plutôt pratique.

Pour commencer cliquez sur Projects (Projets).

Une nouvelle page s’affiche à partir de laquelle vous avez une vue d’ensemble sur vos différents projets et leur progression.

Cliquez simplement sur le bouton New (Nouveau) ou sur le petit + à côté de Projects (Projets) dans le menu de gauche.

4

Une page de création de projet s’affiche. C’est là que vous devez renseigner les différentes informations concernant votre projet (nom, client, date de livraison, langues, etc.).

5

Plus bas sur la page vous pouvez également modifier toute une série de paramètres : utilisation de la traduction machine, assurance qualité, etc.

C’est là qu’il ne faut pas aller trop vite ! C’est dans Workflow (Flux de travail) qu’il faut préciser les différentes étapes du projet : Traduction, relecture, etc. Mais pas de panique, en cas d’oubli vous pouvez toujours éditer le projet par la suite.

6

Un paramètre que je trouve plutôt intéressant en termes de gestion de projets : Project Status Automation (Automatisation du statut de projet). Il permet d’automatiser le changement de statut de votre projet. Par exemple, vous pouvez demander que le statut du projet passe automatiquement à Completed (Terminé), une fois tous les Jobs (Tâches) terminés.

Le fait de pouvoir automatiser certaines tâches permet je pense d’éviter les oublis et d’assurer une vision claire sur l’avancée du projet.

7

Une fois toutes les informations complétées et les réglages personnalisés, cliquez simplement sur Create (Créer).

Une fois créé, une page dédiée au nouveau projet s’affiche : il s’agit du Dashboard (Tableau de bord) de votre projet. À partir de cette page vous pouvez :

Pour ajouter des fichiers vous devez créer un Job (Tâche) en cliquant sur New (Nouveau).

8

 

Sur la page suivante, vous pouvez ajouter des fichiers, choisir la personne à qui vous souhaitez confier la tâche, indiquer la date de livraison, etc.

Une option que je trouve particulièrement intéressante : Notify Linguist (Informer le linguiste). Cette option permet de simplifier la gestion de projet puisqu’un mail est envoyé automatiquement au linguiste pour lui proposer la tâche, et celui-ci peut cliquer directement sur le lien pour accepter (ou refuser) la tâche et se mettre au travail.

Vous pouvez également personnaliser les paramètres d’importation des fichiers au niveau des types de formats ou de la segmentation.

Quand vous avez terminé, cliquez sur Create (Créer).

  • Analyser le fichier

De retour sur le Dashboard (Tableau de bord) de votre projet, sélectionnez les fichiers à analyser et cochant la case à gauche de leur nom et cliquez sur Analyze (Analyser).

9

Une petite fenêtre vous permettant de modifier les paramètres de votre analyse s’affiche alors :

10

Pour consulter l’analyse créée il suffit de cliquer sur son nom dans la section Analyses du tableau de bord du projet.

11

  • Créer un devis

Il suffit de cliquer sur New (Nouveau) dans la section Quotes (Devis).

12

 

Dans la nouvelle fenêtre qui s’affiche vous pouvez nommer votre devis, choisir l’analyse à utiliser ainsi que la liste de prix à appliquer, etc.

Cliquez ensuite sur Next (Suivant).

13

 

Sur la fenêtre suivante, vous pouvez définir la devise, l’unité à prendre en compte, etc. Cliquez ensuite sur Next (Suivant).

14

 

Vous pouvez désormais visualiser votre devis et l’enregistrer en cliquant sur Save (Sauvegarder).

  • Créer ou importer une TM

Si vous désirer réutiliser une TM déjà créée sur Memsource Il suffit d’aller dans la section Translation Memories (Mémoires de traduction) de votre Tableau de bord et de cliquer sur Select (Sélectionner).

Si vous souhaitez utiliser la TM fournie par un client, il faut d’abord créer une nouvelle TM puis importer celle du client dans la TM nouvellement créée. Pour cela, il suffit de cliquer sur Create New (Créer).

15

Encore une fois c’est assez simple, il suffit de compléter les différents champs d’informations de notre TM : nom, langue source, langue(s) cible(s), client (s’il s’agit d’une TM dédiée), domaine, etc.

Cliquez ensuite sur Create (Créer).

16

Une fois créée, cliquez sur son nom pour la modifier.

Sur la page qui s’affiche, vous pouvez choisir d’importer une autre TM (celle fournie par le client par exemple), d’exporter cette TM ou même de procéder à un alignement de fichiers.

17

  • Créer ou importer une TB

Si vous désirer réutiliser une TB déjà créée sur Memsource, cliquez sur Select (Sélectionner).

Si vous souhaitez utiliser la TB fournie par un client, il faut d’abord créer une nouvelle TB puis importer celle du client dans la TB nouvellement créée.

Pour créer une nouvelle TB, il suffit d’aller dans la section Term Bases (Glossaires) de votre Tableau de bord et de cliquer sur Create New (Créer).

18

Encore une fois c’est assez simple, il suffit de compléter les différents champs d’informations : nom, langues, client (s’il s’agit d’une TM dédiée), domaine, etc.

Ensuite, cliquez sur Create (Créer).

19

Une fois créée, cliquez sur son nom pour la modifier.

Sur la page qui s’affiche, vous pouvez éditer votre TB. Vous pouvez entrer manuellement des termes ou importer une autre TB (celle fournie par le client par exemple).

20

Mon avis sur Memsource

Je précise qu’il s’agit de mon avis strictement personnel et que comme je dispose d’un accès à cette plateforme par le biais d’une offre réservée aux universités, je ne peux pas débattre des tarifs, qui ne rentrent donc pas en compte dans mon évaluation de l’outil.

Les + 

  • Intuitif et facile à utiliser: surtout quand on connaît déjà d’autres outils de TAO. Je trouve qu’on trouve assez facilement ce qu’on cherche (options, menus, etc.).
  • Ergonomique : je trouve l’interface simple et belle, sans pollution visuelle. On trouve rapidement ce que l’on cherche et tout va super vite.
  • Léger : ce qui est loin d’être le cas de tous les outils de TAO ! Le fait qu’on ne soit pas obligé d’installer quoi que ce soit sur son ordinateur est à mes yeux un vrai plus, surtout pour les étudiants qui ne disposent pas d’une machine de guerre niveau ordinateur. Il suffit d’une connexion internet et on peut gérer ses projets partout et sur n’importe quelle machine.
  • Pratique: Le fait de pouvoir automatiser certaines tâches permet je pense d’éviter les oublis et de faciliter la gestion de projet. Mais surtout le gros point positif de Memsource c’est de réunir toutes les parties prenantes d’un projet (clients, agences, traducteurs) autour d’une plateforme unique qui centralise les tâches de gestion de projet et le travail sur le contenu (traduction, révision, etc.).

Les

  • Pas de version française du site, de la documentation et de l’interface de l’outil.
  • Le système d’alignement : contrairement à d’autres outils de TAO, Memsource ne propose pas d’éditeur d’alignements. Une fois les fichiers soumis pour alignement, on se retrouve avec un fichier Excel à trois colonnes (segments source et cibles + nom du fichier cible) et on doit se débrouiller avec ça.

C’est tout pour aujourd’hui ! J’espère que cet article vous aura été utile. N’hésitez pas à faire part de votre avis dans les commentaires.

Et si vous êtes curieux et toujours à la recherche de nouveaux outils à tester, je vous invite à rester dans la catégorie « J’ai testé pour vous » de ce blog pour découvrir d’autres articles intéressants sur le sujet.

J’en profite pour remercier Gareth Wilson, l’enseignant chargé du cours « Nouveaux outils ». Je remercie également Memsource et plus particulièrement Filip Šanca, de m’avoir autorisée à utiliser des captures d’écran faites sur Memsource.

LIENS UTILES

Vidéo de présentation du Web Editor conçue par Memsource

Vidéo de présentation de Memsource Cloud conçue par Memsource

BIBLIOGRAPHIE

https://www.memsource.com/about-us/

https://help.memsource.com/customer/en/portal/articles/2174937-getting-started-for-project-managers

https://wiki.memsource.com/wiki/Main_Page

Koomeo, le nouveau système de gestion de traduction collaboratif

Par Lucie Lambert, étudiante M2 TSM

Capture1

 

Lancée à l’été 2017, la plate-forme Koomeo est un outil en ligne qui permet de concevoir, de gérer et de mener à bien toutes les étapes de projets de traduction multilingues. Depuis un même espace, les différents intervenants d’un projet collaborent en utilisant les outils de TAO mis à leur disposition.

La création de Koomeo répond à un besoin particulier, à savoir la traduction d’un site Web et d’une interface d’un éditeur de programmes de téléphonie. Après des échanges avec des traducteurs, la plate-forme est née : les développeurs ont ainsi créé un outil capable de répondre à leurs besoins en collaborant avec des traducteurs externes, tout en gérant la qualité du contenu très technique de façon interne.

L’accès à la plate-forme requiert un identifiant et un mot de passe. Pour plus de sécurité, les données importées et crées sont hébergées dans un data center en France : toutes les actions effectuées sont tracées et les projets sont sauvegardés.

Compte tenu de sa récence, l’outil n’a pas encore atteint tous les objectifs de ses développeurs : des fonctionnalités sont ajoutées fréquemment et les bugs sont traités dès leur signalement.

 

Pour qui ?

La plate-forme s’adresse à plusieurs types de personnes :

  • Les professionnels de la traduction pour contrôler l’avancement de leurs projets
  • Les chefs d’entreprises pour développer leurs activités à l’international
  • Les développeurs pour traduire leurs logiciels et interfaces
  • Les étudiants et les professeurs pour réaliser des exercices pratiques. Déjà trois universités françaises ont intégré Koomeo dans le cadre des cours de traduction.

 

Comment cela fonctionne-t-il ?

La collaboration est sans doute le principal atout de cet outil : les collaborateurs peuvent accéder depuis un même espace à tous leurs projets, qu’ils soient gestionnaires, traducteurs ou réviseurs, et surtout, peu importe où ils se trouvent, seule une connexion Internet suffit ! Les développeurs ont voulu créer un espace de travail agréable, grâce à ses couleurs, et propice à l’échange.

 

Capture2

Accueil du Workshop, avec la possibilité de changer de rôle grâce au menu déroulant.

 

Chaque membre de Koomeo a accès à son propre « Workshop », où il pourra prendre le rôle qu’il souhaite à travers les différents modes qui lui sont proposés. Le profil devra alors être agrémenté, entre autres, des langues de travail afin de faire connaître ses compétences linguistiques. Les différents modes ont pour but de faciliter la collaboration et chacun d’entre eux a des tâches et des droits spécifiques.

Depuis l’accueil, les membres ont accès à différents éléments tels qu’un calendrier, une messagerie ou encore un pense-bête. Tout est fait pour accéder à toutes les fonctionnalités en un seul clic.

 

1. Mode « Chef de projet »

Le mode « Chef de projet » donne le droit de créer et de gérer des projets multilingues.

Après avoir donné un nom, indiqué des langues de travail et une date de livraison, il faut rattacher au projet un document à traduire. Celui-ci peut être un fichier Word (.doc) ou un fichier sous-titre (.srt). La prise en charge des fichiers Excel, PowerPoint, PDF et Adobe Illustrator sera bientôt disponible. Grâce à un plug-in spécifique, Koomeo permet l’intégration des projets Visual Studio afin de contrôler plus facilement la gestion des langues des interfaces de logiciel.

Une fois ces informations indiquées, il est possible d’importer ou de créer une mémoire de traduction (au format .tmx) et des lexiques (au format .xls). Des données supplémentaires peuvent être ajoutées comme des commentaires ou des « tags », c’est-à-dire des mots-clés qui permettront de retrouver plus rapidement un projet.

Le document est alors segmenté et prêt à être utilisé. Le chef de projet doit ensuite assigner le projet aux collaborateurs compétents faisant partie de son cercle. Grâce aux langues définies dans le profil de chaque collaborateur, le chef de projet peut visualiser les compétences linguistiques de chacun.

Capture3

Le chef de projet assigne le travail à ses collaborateurs avec un simple glisser/déplacer.

 

Les collaborateurs qui ont été choisis pour effectuer le travail verront le projet apparaître directement dans leur Workshop.

Le chef de projet peut vérifier l’avancement des projets grâce à des conteneurs de progression qui lui indiquent, au moyen de couleurs et de pourcentages, les étapes en cours ou terminées.

 

 2. Mode « Traducteur »

Comme son nom l’indique, le mode « Traducteur » permet d’effectuer la traduction.

L’utilisateur a le choix entre plusieurs options d’affichage des segments, selon ses préférences. Une fois le segment source sélectionné, le segment cible s’affiche : il reste à taper la traduction et à appliquer le formatage voulu à partir de la zone de texte.

Capture4

Il est également possible d’ajouter des commentaires pour communiquer avec les autres intervenants du projet. Une fois la traduction du segment terminée, il faut l’enregistrer et passer au segment suivant.

Si une mémoire de traduction a été ajoutée, les correspondances sont automatiquement copiées dans les segments de la langue cible. De plus, il est possible de configurer le pourcentage de correspondance pour une propagation personnalisée. Depuis peu, la plate-forme alerte le traducteur lorsque celui-ci n’a pas utilisé la terminologie adaptée sur la base du lexique rattaché au projet.

Lors de la traduction, sont notamment accessibles un correcteur orthographique (disponible en 13 langues) et un outil de traduction automatique.

Une fois la traduction terminée, le traducteur peut relire sa traduction sans la segmentation grâce à un mode « lecture ».

 

3. Relecture

Avec le mode « Relecture », si le relecteur veut modifier la traduction initiale, il doit proposer une nouvelle version ; le suivi de modification sera disponible très prochainement, ce qui donnera la possibilité de repérer très facilement les modifications. Il a également accès aux mêmes outils que le traducteur. Il incombera ensuite au chef de projet de valider ou non les segments.

Capture5

Une fois la révision effectuée, le chef de projet peut valider le projet, puis l’exporter à son format source.

 

Conclusion

Compte tenu de sa récente création, il faut garder à l’esprit que l’outil est toujours en développement. Le but principal est, pour le moment, de le mettre au point.

Certains trouveront cet outil trop simpliste, mais c’est justement ce qui m’a plu. En tant qu’étudiante du Master TSM, dans lequel nous manipulons des outils à vocation similaire bien plus complexes, j’ai apprécié trouver un espace de travail plus épuré, sans fonctionnalités superflues qui viennent freiner le processus de travail et l’ergonomie de l’outil.

Je pense que la plate-forme peut être utile aux traducteurs indépendants qui n’ont jamais eu l’occasion de manipuler ce type d’outil et qui ne souhaitent pas se perdre dans des fonctionnalités dont ils n’auront jamais l’utilité. La plate-forme est synonyme de simplicité et de rapidité. De plus, Koomeo facilite la prise en main grâce à des vidéos dans lesquelles certaines étapes sont expliquées.

Si vous souhaitez en savoir plus sur cet outil, sachez que la création d’un Workshop est gratuite pour tout le corps enseignant, ainsi que pour les étudiants.

 

Je tiens à remercier l’équipe de Koomeo pour leur collaboration, en particulier M. Roca pour la présentation de son outil.

Toutes les captures d’écran sont la propriété de Koomeo, utilisées avec accord.

Maîtriser la traduction automatique

Par Margaux Morin, étudiante M1 TSM

TA

On l’a tous déjà croisée quelque part, cette traduction ratée, fruit de la traduction automatique. Il s’agit malheureusement des traductions que l’on retient le mieux. Dans sa « Critique des logiciels de traduction automatique », le site @-DICTAM Traductions nous fournit même des exemples qui peuvent prêter à rire (d’autres exemples étant disponibles sur le lien) :

  • Dans un aéroport de Copenhague : nous prenons vos sacs et les envoyons dans toutes les directions.
  • Dans le lobby d’un hôtel de Bucarest : L’ascenseur sera en réparation le prochain jour. Pendant ce temps, nous regrettons que vous soyez insupportables.
  • Chez un nettoyeur de Bangkok : Laissez tomber vos pantalons ici pour de meilleurs résultats.

Voilà pourquoi il faut des traducteurs humains pour éviter ce genre de situation qui font perdre aux entreprises toute crédibilité. La traduction effectuée par un traducteur professionnel est pour certains optionnelle et contraignante par rapport à un moteur de traduction automatique, qui aurait l’avantage de leur faire gagner du temps et de l’argent. Or, ce n’est pas toujours vrai ! On a d’ailleurs eu l’occasion de voir dans le billet d’Audrey les conséquences dramatiques qu’une mauvaise traduction peut engendrer.

 

Mais d’abord, la traduction automatique, qu’est-ce que c’est ?

Comme nous l’indique le site de SDL Trados, la traduction automatique est une traduction effectuée par ordinateur, sans intervention humaine.

À cela s’ajoute le fait qu’il existe 2 types de traducteurs automatiques : soit le moteur utilise les règles de grammaire et de conjugaison par le biais de dictionnaires, soit il utilise un système de probabilité notamment pour déterminer les expressions les plus utilisées pour toutes les paires de langues, cette fois-ci par le biais de corpus et de bases de données gigantesques. Sans parler de la traduction basée sur des algorithmes neuronaux qui mériterait à elle seule son billet !

Or, en règle générale, lorsque l’on pense « traduction automatique », on pense Google traduction voire même Babylon ou Reverso. Ils sont pourtant loin d’être les meilleurs outils en la matière, puisqu’ils sont incapables de s’adapter à la traduction selon les domaines et/ou d’évoluer en fonction de ces derniers et ne différencient donc pas les subtilités liées à la technicité du texte source. On s’aperçoit rapidement que le résultat provient de la traduction automatique, ce qui n’est pas bon pour la réputation de l’entreprise. De plus, contrairement à d’autres moteurs de traduction automatique, ils ne s’améliorent pas au fur et à mesure de leur utilisation. Pourtant, il existe une multitude de moteurs de traduction automatique bien plus efficaces ! Laissez-moi vous en présenter quelques-uns :

SYSTRAN

SYSTRAN est un traducteur automatique plutôt intéressant puisqu’il s’agit du leader mondial en matière de traduction automatique. Il met d’ailleurs à disposition des versions pour particuliers et pour professionnels. À noter que ce traducteur automatique est compatible avec plusieurs types de fichiers dont le format PDF. La version Professional permet même d’ajuster des paramètres quant au processus de traduction, en permettant par exemple de choisir de traduire « you » par « tu » ou par « vous » ou bien de traduire vers l’anglais britannique ou l’anglais américain. Une version en ligne gratuite est également disponible avec traduction dans 15 langues.

VERTO

VERTO est un traducteur automatique développé par Lingua Custodia, spécialisé dans le domaine bancaire et financier. Il est capable de s’adapter en fonction de la terminologie, des traductions précédemment effectuées qu’on lui confie et des différents clients. Il s’agit donc d’un moteur de traduction personnalisable.

PROMT Translator

PROMT Translator est également un traducteur automatique disponible gratuitement en ligne mais en plus de traduire dans 14 langues, on peut définir le domaine de la traduction afin de l’orienter sur la bonne voie. On retrouve par exemple les domaines « cuisine », « sciences humaines » et même « chansons » pour les traductions de paroles de chanson ou de genres musicaux. On peut même insérer nos propres thématiques ou laisser le moteur de traduction automatique détecter lui-même le domaine de traduction du texte source. Il fonctionne via des algorithmes intelligents et son contenu est constamment actualisé. D’autres versions (payantes) pour utilisateurs à domicile ou entreprises ou encore pour développeurs existent également, et pas uniquement sous Windows !

 

D’ordinaire, ces moteurs de traduction automatique ne sont pas connus du grand public. La meilleure solution pour le traducteur reste donc d’apprendre à utiliser et donc à maîtriser ces outils. Il ne faut certainement pas les fuir, mais évoluer avec eux, ce qui implique également de se tenir informé en matière de traducteurs automatiques, étant donné qu’ils représentent sans aucun doute l’avenir du monde de la traduction. Il est par conséquent indispensable de se familiariser avec la post-édition (activité qui consiste à repasser derrière un texte prétraduit automatiquement pour le rendre humainement intelligible, voir le site Traduire revues.org) ainsi que les différents types de post-édition (tels que recensés sur le site Traduire revues.org).

La meilleure option pour le traducteur 2.0 sera de travailler main dans la main avec la machine. Cela implique donc de se former dès maintenant à l’utilisation de traducteurs automatiques spécialisés ainsi qu’à la post-édition. Cette dernière lui offrira un meilleur rendement et par conséquent une meilleure productivité qui lui permettra de traduire plus en termes de quantité (sans pour autant avoir un impact négatif sur la qualité) en moins de temps (et le temps, c’est de l’argent !). À l’heure actuelle, certaines agences de traduction commencent d’ores et déjà à former leurs traducteurs dans ce domaine et ce dans le but de rester compétitives dans l’ère du temps.

Néanmoins il ne faut pas oublier que la post-édition reste limitée dans certains domaines comme la transcréation (la traduction des titres de films notamment, qui fonctionne au cas par cas comme nous l’explique Youssef dans son billet Le juste titre). La traduction automatique n’est donc pas prête de nous remplacer !

 

Sources :

« Critique des logiciels de traduction automatique »  sur le site officiel de @-DICTAM Traductions : http://www.a-dictam.com/fr/critiques-des-traductions.htm#plus (page consultée le 27 mai 2017).

Pour tout savoir sur la post-édition :

Traduire revues [En ligne] https://traduire.revues.org/460 (page consultée le 20 juin 2017).

Article de sens-public.org [En ligne] « Le fantasme de la traduction automatique : esquisse d’un imaginaire frelaté »  http://www.sens-public.org/article1152.html (page consultée le 1er juillet 2017).

Article sur PROMT sur leur site officiel : http://www.promt.fr/media/news/58833/ (page consultée le 1er juillet 2017).

Pour tout savoir sur SYSTRAN : http://www.mysoft.fr/produit/systran_traduction_automatique.htm (page consultée le 1er juillet 2017).

Site officiel de Lingua Custodia : http://www.linguacustodia.finance/fr/accueil/ (page consultée le 1er juillet 2017).

Site officiel de SYSTRAN : http://www.systran.fr/lp/traduction-en-ligne/ (page consultée le 1er juillet 2017).

Site officiel de SDL Trados Studio avec la définition de traduction automatique : http://www.sdltrados.com/fr/solutions/machine-translation/ (page consultée le 1er juillet 2017).

PROMT Translator : http://www.online-translator.com/ (page consultée le 30 juin 2017).