Netflix et la traduction

Par Célia Wisniewski, étudiante M2 TSM

NetflixTraduction

 

Avec les réseaux sociaux et les autres moyens de communication, il est assez courant de reporter la moindre erreur, et malheureusement pour Netflix, ils n’ont pas échappé à cette nouvelle réalité. Les erreurs de traduction se sont multipliées, donnant parfois des résultats frôlant le ridicule. Un hashtag TraduisCommeNetflix, un classement Topito ou encore une page Tumblr ont vu le jour. Cette mauvaise publicité a vite fait prendre conscience à Netflix de la faiblesse de son processus de traduction. Quelles étaient les failles de ce processus ? Quelles améliorations ont été apportées ? C’est à ces questions que nous allons répondre. Netflix et la traduction, une histoire au passif mitigé, mais en voie d’amélioration.

En 1997, Netflix voit le jour. En 2010, la plateforme connaît un développement fulgurant grâce à l’accélération du débit internet rendant possible le visionnement en streaming de contenu vidéo. Aujourd’hui, Netflix est présent dans 190 pays pour un chiffre d’affaires de 12 milliards d’euros (2017) pour 158,33 millions de clients (2019). C’est un des leaders incontestés du marché. Ces performances s’expliquent avant tout grâce à la disponibilité de son contenu dans de nombreuses langues (sous-titres et/ou bande audio). Pour exemple, la série « Stranger Things », l’un des contenus originaux phares de Netflix propose 6 bandes audio différentes et 5 langues sont disponibles en sous-titre. Au total, cela permet de toucher sept langues différentes. Ces langues représentent la majeure partie de la cible Netflix (allemand, anglais, espagnol, français, portugais et arabe). Cela démontre bien que la croissance de Netflix est étroitement liée à sa capacité de traduction.

Dans un environnement concurrentiel comme celui du streaming vidéo où seule l’exclusivité de contenu permet de tirer son épingle du jeu, Netflix a fait le choix de produire et/ou de financer son propre contenu. En effet, le nombre de programmes originaux Netflix ne cesse de croître (Orange is the new black, 13 Reasons Why, Narcos, BoJack Horseman, etc.). Mais qui dit production vidéo dit également traduction. La variété de langues sources (anglais, français, coréen, portugais, espagnol, allemand, italien, etc.) et  le nombre de langues cibles rendaient les projets de traduction compliqués et avait comme conséquence finale un coût de traduction important.

Pour y remédier, Netflix a revu son processus de traduction et a lancé en 2017 une plateforme dédiée nommée Hermes. Pour être répertorié sur cette plateforme en tant que traducteur, il faut passer un QCM de 2 heures qui prend en compte la compréhension de l’anglais, mais surtout la rapidité. Ceux qui réussissent le test peuvent ensuite traduire les contenus que Neflix publie au fur et à mesure. Bien sûr, la cohérence entre les épisodes n’est pas respectée puisque les épisodes sortent petit à petit, et les traducteurs changent d’un épisode à un autre. Le salaire proposé est un salaire à la minute de contenu, et non à la minute traduite comme c’est souvent le cas pour la traduction de contenu audiovisuel. Cela signifie donc que le salaire touché peut passer du simple au double voire au triple en fonction du nombre de dialogues dans le film.

Mais les critiques ne se font pas attendre. En effet, contrairement au milieu professionnel de la traduction, les traducteurs Netflix ne sont pas des traducteurs reconnus. Le métier de la traduction admet aujourd’hui une diversité de formations et donc une diversité des profils. De ce fait, les contrats moins rémunérés à l’image de ceux de Netflix, sont choisis par des traducteurs n’ayant pas forcément les capacités de traduction nécessaires. Il en résulte donc une qualité de traduction discutable, surtout lorsque le contexte de la série n’est pas connu lors de la traduction. On trouve souvent dans ces sous-titres des abréviations, des fautes d’orthographe ou même des contresens. Netflix ferme finalement cette plateforme en 2018, prétendument à cause d’une base de données suffisamment étoffée.

Toutes ces problématiques ont contraint Netflix à abandonner cette plateforme afin de revenir à un processus plus traditionnel. Aujourd’hui, Netflix externalise sa fonction de traduction grâce à l’utilisation des partenaires locaux (appelés « Vendor »). Ces partenaires sont ensuite responsables de la qualité des traductions fournies et donc du choix des traducteurs. Côté traducteurs, le travail reste le même avec une méthode de paiement similaire. À titre d’exemple, une traduction de l’anglais vers le français est aujourd’hui rémunérée 7,2$ la minute (soit environ 6 euros) qu’importe le type de contenu traduit (le nombre de mots n’a aucune incidence). Cette traduction est toujours réalisée sur une plateforme développée par Netflix sur laquelle tous les traducteurs employés par Netflix travaillent. Cette plateforme fait également l’objet de vives critiques : chronométrage du temps de traduction, impossibilité d’enregistrer son travail, ou encore, envoi direct au partenaire Netflix sans vérification possible. La critique la plus dénoncée concerne la relecture des traductions. En effet, une relecture est censée être réalisée par une personne tierce physique et non un programme. C’est sur ce point que de nombreux doutes émergent. En effet, même si ce processus permet de réduire le nombre d’erreurs sur les traductions, les erreurs restantes pourraient être évitées par une relecture.

Il y a 5 ans, Netflix était le leader incontesté du streaming vidéo sur le marché. Depuis deux ans, le nombre d’acteurs s’est démultiplié (Amazon Prime, HBO, Canal +, etc.) et les politiques commerciales appliquées par ces derniers sont des plus agressives. De nombreuses séries sont retirées d’une plateforme pour repartir sur une autre et de ce fait, des contenus sont subitement supprimés de Netflix. Ce dernier point est l’autre problème de Netflix. Mais la remise en question de cette industrie pourrait avoir des conséquences sur la totalité des acteurs ayant un rôle à y jouer. Le rôle du traducteur est donc remis en cause. Il est donc normal de se demander si ce changement aura des conséquences sur la traduction de contenu multimédia.

 

Sources :

https://www.alltradis.com/sous-titrages-netflix/

http://www.slate.fr/story/169668/netflix-sous-titrage-traduction-recrutement-remuneration

https://www.assimil.com/blog/que-peut-on-dire-des-sous-titrages-des-programmes-netflix/

https://www.lesechos.fr/2017/04/netflix-a-la-recherche-de-traducteurs-pour-ameliorer-ses-sous-titres-165550

http://www.premiere.fr/Cinema/News-Cinema/Les-mauvais-sous-titres-de-Netflix-enervent-les-professionnels

https://www.lepoint.fr/pop-culture/series/pourquoi-les-sous-titres-de-netflix-frisent-l-amateurisme-06-05-2019-2310985_2957.php

http://www.topito.com/top-traduction-netflix

https://slator.com/demand-drivers/why-netflix-shut-down-its-translation-portal-hermes/

https://beta.ataa.fr/blog/article/le-sous-titrage-francais-de-roma

La traduction touristique : comment transmettre le goût de l’évasion

Par Jeanne Delaunay, étudiante M2 TSM

traductiontourisme

 

Dans une société toujours plus connectée et ouverte sur le monde, le marché touristique n’a pas cessé de se développer et joue désormais un rôle majeur sur la scène internationale. Cet intérêt croissant pour la découverte de nouveaux horizons n’a pas été sans conséquence sur le marché de la traduction, cela va sans dire. En effet, ce dernier a enregistré des besoins accrus et provenant des quatre coins du globe, la demande étant de plus en plus multilingue.

Dans le secteur du tourisme, ce sont des supports divers et variés qui peuvent être traduits : sites internet, catalogues, brochures, programmes détaillés, guides de voyage, dépliants… Il y en a pour tous les goûts ! On pourrait aisément penser que la traduction touristique coule de source et constitue donc un choix facile de spécialisation, et pourtant… Bien que le style employé dans les textes touristiques soit relativement simple, il n’en demeure pas moins qu’une bonne plume est indispensable pour donner aux consommateurs le goût de l’évasion.

Alors, quel est le profil idéal d’un bon traducteur touristique ?

Une traduction adaptée au public cible

Les traductions de contenus touristiques doivent bien sûr être d’une qualité irréprochable, cela tombe sous le sens. Mais une bonne traduction touristique ne doit pas simplement être excellente linguistiquement parlant, il faut également qu’elle soit adaptée au public auquel elle s’adresse. À titre d’exemple, la ville de Trouville-sur-Mer en a payé les frais en publiant une traduction contenant un faux ami. En effet, l’expression « baptême de poney » a été traduite par pony baptism, sauf qu’en anglais le mot « baptême » ne désigne que le sacrement religieux. Il aurait fallu dire first-time pony riding pour parler d’une première expérience.

Par ailleurs, on trouve encore trop souvent des sites Web hôteliers traduits en un certain nombre de langues mais de façon très maladroite, ce qui, d’une part, n’inspire pas confiance et ne donne donc pas envie de consommer et qui, d’autre part, illustre bel et bien le besoin de traducteurs touristiques.

Pour vous donner une idée plus concrète des traductions touristiques de mauvaise qualité que l’on peut trouver sur la Toile, voici un exemple concernant la traduction en français du site Internet d’un hôtel de Madrid : « Hôtel de 3 étoiles au cœur de Madrid. (…) Fonctionnalité et dessine se rejoignent dans l’Hôtel xxx. (…) Ce n’est pas ni chic ni minimaliste, mais vous allez trouver à son intérieur un équipe humain prêt à travailler pour vous offrir un bon service et une soigné attention à la clientèle. » Pas très vendeur, n’est-ce pas ?

Malheureusement, des traductions de ce genre se trouvent encore trop fréquemment sur Internet… Qu’on se le dise, un tel résultat sort bien souvent tout droit d’un traducteur automatique. Cela peut aussi provenir d’un traducteur non natif, or il est communément admis qu’un traducteur ne traduit que vers sa langue maternelle étant donné qu’il en connaît toutes les subtilités.

Selon une étude réalisée par l’agence de traduction TextMaster, les erreurs de traduction sur des sites touristiques représentent plusieurs dizaines de millions d’euros de manque à gagner. Cela prouve que la qualité des traductions touristiques a un impact direct sur l’image de la société en question.

Les compétences d’un bon traducteur touristique

  • Avoir des connaissances dans diverses disciplines

Les documents touristiques (brochures, flyers…) requièrent souvent certaines connaissances en géographie, en gastronomie ou encore en histoire. En effet, en traduction touristique il est important de savoir ce qui distingue la culture source de la culture cible. En d’autres termes, les références culturelles ne seront pas les mêmes dans une traduction espagnole et dans une traduction chinoise.

  • Être précis

Le traducteur doit s’assurer que sa traduction sera correctement adaptée à la culture cible, de façon à restituer fidèlement le message contenu dans le texte source. En effet, si le traducteur n’a jamais mis les pieds dans les lieux mentionnés au cours de sa traduction, cela peut lui compliquer la tâche.

Si un texte mentionne un village perdu au fin fond des Alpes italiennes où le traducteur n’est jamais allé, des recherches s’imposent pour savoir s’il existe des équivalents de noms de villages dans la langue cible. Il est également important que le traducteur cherche des informations complémentaires sur cet endroit (dans des guides de voyage, par exemple), afin de coller un maximum à la réalité. Dans le cas où le texte source n’est lui-même pas clair, il est préférable de demander l’avis du client plutôt que de prendre le risque de dénaturer le message d’origine.

  • Être créatif

Comme vous l’aurez compris, la traduction touristique est un domaine qui demande de grandes qualités rédactionnelles. Elle doit être vectrice d’évasion, d’exotisme ou de rêve et doit donner le goût de l’aventure. La transmission du message de départ est jugée réussie si la phraséologie et le ton employé se prêtent bien à la culture cible.

Il est impératif de ne pas traduire littéralement mais bel et bien de faire preuve de créativité : le but, ce n’est pas de retranscrire le texte source mot pour mot, c’est de restituer fidèlement le message qu’il contient.

 

Pour conclure, nous pouvons affirmer que la traduction touristique constitue bien un domaine de spécialisation à proprement parler. En effet, comme beaucoup de spécialités, elle ne s’improvise pas et présente des spécificités qui lui sont propres. Elle doit donc être effectuée par des professionnels afin que le message d’origine soit restitué de la manière la plus fidèle possible. Quand on sait qu’une enquête réalisée en 2013 a révélé que 82 % des Britanniques réfléchissaient à deux fois avant de faire affaire avec une entreprise dont le site Web a été mal traduit en anglais, cela donne matière à réfléchir.

Des professionnels, il en faut également dans le secteur du sous-titrage. À ce sujet, je vous invite à jeter un œil au billet de blog d’Aurélien Vache à paraître dans deux semaines.

 

Sources :

  • « Traduction pour le tourisme : guide exclusif », BigTranslation, (2018)

https://blog.bigtranslation.com/fr/traduction-pour-le-tourisme-guide-exclusif/

  • « La traduction touristique : savoir traduire l’émotion culturelle des touristes », Sotratech Traduction, (2015)

https://www.sotratech.com/sotratech/blog/41-la-traduction-touristique-savoir-traduire-l-emotion-culturelle-des-touristes.html

  • « Le tourisme et la traduction », Hispafra (2015)

https://hispafra.wordpress.com/2015/02/10/le-tourisme-et-la-traduction/

  • « Les spécificités de la traduction dans le domaine du tourisme », EVS Translations (2012)

https://evs-translations.com/blog/fr/specificites-traduction-tourisme/

  • « Traductions pour le tourisme », Tradutec

https://tradutec.com/traductions-specialisees/traduction-pour-le-tourisme.html

Top 10 de nos billets les plus lus en 2019

La fin de l’année est traditionnellement l’occasion de dresser toutes sortes de bilans, et le blog de la formation de master « Traduction Spécialisée Multilingue » (TSM) n’échappe pas à la règle ! En 2019, le blog a continué sa croissance puisqu’il a reçu 50.086 visites pour 34.370 visiteurs (chiffres du 30/12/2019), contre 37.673 visites/26.773 visiteurs en 2018 et 19.949 visites/13.137 visiteurs en 2017. Selon les statistiques fournies par WordPress, la lecture des billets s’effectue depuis 157 pays différents avec en tête la France, les États-Unis, la Belgique, le Canada, et la Suisse.

statsblogstatspays

 
Ceci est le résultat du travail des étudiantes et des étudiants de la formation, qui rappelons-le contribuent tour à tour au blog depuis septembre 2016 en rédigeant un billet par an (de septembre à février pour les étudiants de seconde année de master, de mars à juillet pour ceux de première année). Les thèmes abordés cette année auront encore été très divers puisqu’il a été question (entre autres) de traduction automatique, de transcréation, de traduction juridique, des différentes langues de travail, de la spécialisation, des compétences linguistiques et culturelles, de l’ubérisation, de santé, sans oublier les activités de la formation (Skills Lab, insertion professionnelle) ou encore les entretiens avec des professionnel(le)s du secteur (vous pouvez retrouver ici la liste complète des billets). Cette rédaction de billets de blog entre dans le cadre d’une sensibilisation à l’e-réputation et à l’importance pour les futurs professionnels d’être présents sur l’internet de façon professionnelle.

Au moment de dresser le bilan, il peut être intéressant de voir quels billets ont le plus retenu l’attention cette année. Il s’agit de billets publiés en 2019 pour certains, mais aussi de billets publiés les années précédentes et qui continuent de trouver leur lectorat. Avant de vous livrer ce Top 10, gardons toutefois en tête qu’il ne s’agit que des billets les plus consultés et non pas un classement en fonction de la qualité de ceux-ci !

Voici donc les 10 billets les plus lus sur le blog en 2019 :

1. L’indétrônable J’ai testé pour vous : des correcteurs orthographiques

2. Un billet toujours beaucoup consulté bien que les chiffres datent de 2011 : Combien gagnent les traducteurs indépendants ? Est-ce suffisant ? (traduction)

3. Signe des temps et reflet des recherches des internautes : Google Translate vs DeepL : le duel

4. Autre reflet de l’importance des nouvelles technologies : La traduction vocale : une révolution ?

5. Une question devenue incontournable pour une prestation commerciale de qualité : Les facteurs de risques dans la gestion de projet

6. Une question qui intéresse particulièrement les étudiants : Être traducteur·trice indépendant·e ou salarié·e : avantages et inconvénients

7. Un écueil contre lequel on nous met souvent en garde : La mauvaise utilisation des anglicismes dans la langue française

8. Un billet qui date de 2017 sur un sujet qui ne cesse d’évoluer : La traduction automatique neuronale et l’avenir du traducteur

9. Une réflexion sur les enjeux linguistiques de la traduction de jeux vidéo : La localisation de jeux vidéo, une traduction technique ou littéraire ?

10. Une autre question qui intéresse particulièrement les étudiants : Comment choisir vos domaines de spécialité ? (traduction)

 

billets

L’insertion professionnelle dans le monde de la traduction : expectations vs reality

Par Maximilien Dusautois, étudiant M2 TSM

InsertionProfessionnelleTraduction.jpg

Si vous arrivez sur ce billet de blog, les chances sont grandes pour que vous soyez impliqué dans le monde de la traduction, que vous soyez professionnel, étudiant ou simple quidam intéressé par la question. Ce monde merveilleux où il peut parfois sembler compliqué de s’insérer professionnellement (« quoi, t’es étudiant en traduction ? Mais ça sert à rien, y a Google Trad maintenant non ? »). Ce monde merveilleux où, lorsque vous êtes parfaitement bilingue français-suédois, on vous propose un poste où l’allemand est requis (« ben quoi, c’est pas la même chose ? »). En tant qu’étudiant de deuxième année de master, presque diplômé et futur entrant sur le marché du travail, il me semblait utile et nécessaire de poser la question qui fâche : comment se passe réellement l’insertion professionnelle sur le marché après des études de traduction?

Si l’on regarde les chiffres et uniquement les chiffres, le monde de la traduction est un monde merveilleux où l’on s’insère sans souci et où l’argent coule à flots. Des milliards et des milliards de dollars sont brassés chaque année et le marché est en croissance exponentielle[i]. Les différentes formations de traduction offrent des chiffres d’insertion professionnelle mirobolants qui feraient baisser la courbe du chômage à eux tout seul. Par exemple, l’ISIT parle de 93% des diplômés qui trouvent un emploi 3 mois après le diplôme, dont 62% avant d’être sortis de l’ISIT[ii] ; les chiffres d’insertion professionnelle du master TSM sont également très prometteurs (94% en 2011, 98% en 2012, 95% en 2013, 93% en 2014, 100% en 2015…)[iii], tout comme ceux de l’ESIT à Paris (87% d’insertion professionnelle)[iv].

Mais les chiffres restent des chiffres. Il convient d’exercer son esprit critique : on peut leur faire dire ce que l’on veut, surtout lorsque ceux-ci deviennent des arguments de vente pour une formation. On ne peut également, en 2019, se baser uniquement sur une analyse quantitative : la qualité du travail et le bien-être dans l’exercice de son activité professionnelle sont des valeurs importantes à prendre en compte.

J’ai donc décidé de mener ma propre enquête*, et j’ai recueilli pour cela les avis de 23 étudiants en traduction spécialisée et de 30 professionnels. Cela m’a permis de comparer les attentes des étudiants à quelques mois de leur diplôme avec la réalité du marché. Les attentes des étudiants sont-elles en adéquation avec ce que le marché a à leur offrir ?

Les rémunérations : ce qui est attendu vs les réalités du terrain

Commençons par le nerf de la guerre et le grand tabou français : les rémunérations ! Je me suis intéressé à la rémunération que souhaiteraient avoir les étudiants après leur diplôme. Après tout, on nous promet monts et merveilles et l’industrie n’est pas en difficulté. Qu’en est-il dès lors des prétentions salariales ?

Sur 23 étudiants, 65% ont répondu espérer toucher entre 25 000 et 31 999€ nets par an, soit une rémunération mensuelle comprise entre 2000€ et 2600€ par mois. Moins nombreux (39%) étaient ceux qui répondaient espérer toucher une rémunération légèrement inférieure, entre 18 000 et 24 999€ par an (soit entre 1500 et 1999€ par mois). 13% ont répondu vouloir ou espérer toucher au-delà de 32 000€ nets par an. (Merci de noter que plusieurs réponses étaient possibles pour cette question. Certains étudiants ont choisi une fourchette plus large en cochant plusieurs réponses, notamment dans les catégories les plus fréquemment choisies. Cela explique le chiffre total supérieur à 100%).

Maintenant, qu’en est-il des réalités du marché ? Sur les 30 répondants, 56,7% ont indiqué toucher une rémunération comprise entre 18 000 et 32 000€ (dans le détail, 36,7% entre 18 000 et 24 999€ et 20% entre 25 000 et 31 999€), ce qui correspond assez bien à ce que souhaitent les étudiants. Une seule personne (3,3% des sondés) a répondu toucher une rémunération supérieure à 38 000€ annuels. Les réponses tendent donc à prouver que les attentes salariales et les rémunérations effectives se situent bel et bien dans la même fourchette, ce qui ne manquera pas de rassurer les étudiants. Ce qui pourrait en revanche inquiéter à la fois étudiants et professionnels, c’est que le salaire moyen des diplômés bac +5 en France s’établit en moyenne à 46 050€[v] par an… Le delta est important, mais il est raisonnable de penser que le grand nombre de jeunes diplômés ayant répondu au sondage (la majorité des répondants ayant entre 25 et 27 ans) fausse le résultat à la baisse. En tout cas, le marché semble répondre aux attentes des futurs professionnels du point de vue salarial.

L’adéquation entre aspirations professionnelles et opportunités offertes par le marché

Un autre aspect intéressant à prendre en compte dans l’insertion professionnelle était pour moi le métier souhaité à la fin des études, et la façon de trouver un emploi.

Sur la première question, une majorité écrasante d’étudiants (82,6%) déclarent déjà savoir le métier qu’ils souhaitent exercer à l’issue de leurs études : traducteur indépendant, gestionnaire de projet, vendor manager… Et la deuxième bonne nouvelle de ce billet, c’est que 96,7% des professionnels sondés ont déclaré avoir exercé, dès la fin de leurs études, le métier qu’ils souhaitaient. Il semble donc possible, voire aisé, de trouver chaussure à son pied sur ce vaste marché.

Ensuite, en ce qui concerne la manière de trouver un emploi, les étudiants semblent assez bien informés de la meilleure manière de procéder. Environ la moitié d’entre eux estiment que le meilleur moyen de trouver un emploi reste le stage ; et un peu moins d’un sur cinq estime que le meilleur moyen est de créer sa propre activité. Des chiffres confirmés par les jeunes professionnels, qui sont 56% à déclarer avoir trouvé leur emploi grâce à leur stage, et 25% en créant leur activité. Les étudiants semblent cependant surestimer la capacité des canaux « classiques » tels que Pôle emploi ou des réseaux sociaux professionnels : s’ils sont 26% à estimer que ceux-ci peuvent leur permettre de trouver un emploi, dans les faits, seuls 10% des professionnels déclarent avoir trouvé un emploi de cette manière. Certains professionnels sont même plutôt critiques des institutions publiques, déclarant que le travail de traducteur est peu ou pas reconnu par les autorités et que les conseillers ne connaissent pas vraiment les spécificités de la branche.

Il m’a également semblé intéressant de demander l’avis des étudiants et des professionnels sur l’auto-entrepreneuriat. Malgré tout le bien qui en est dit lors des études, 71% (hors abstention) des étudiants se sentent freinés dans leur volonté de se lancer par la lourdeur administrative que ce statut implique. Cette proportion s’inverse totalement pour les professionnels de la traduction qui envisagent une reconversion (9 sondés), qui semblent peu effrayés par l’auto-entrepreneuriat (22% se sentent freinés contre 78% non).

Le bien-être au travail

Maintenant, intéressons-nous au bien-être au travail, grand débat du 21e siècle et qui se hisse en tête des priorités des étudiants en traduction dans la recherche d’un emploi (65,2%, contre 26,1% pour la sécurité financière et 8,7% pour l’absence de hiérarchie). Encore une fois, les étudiants peuvent se rassurer grâce aux réponses fournies par leurs aînés diplômés : 63,3% déclarent que leur bien-être au travail est élevé ou très élevé. 33,3% déclarent leur bien-être « moyen » (3 sur une échelle de 5), et seule une personne sondée se déclare peu heureuse au travail. À l’heure de l’explosion des burn-out et de la prise de conscience de la nécessité du soft-management[vi], ces chiffres sont de bon augure.

Le type de contrat signé est également une mesure intéressante du bien-être au travail. Plusieurs études tendent à montrer que l’emploi en CDI reste un marqueur important du bien-être au travail[vii] (pour plusieurs raisons : stabilité, reconnaissance sur le long terme, management inscrit dans la durée, peu de turn-over…). Et là encore, les étudiants peuvent se rassurer : 36,6% des primo-entrants sur le marché du travail ont trouvé tout de suite un emploi en CDI, contre seulement 16,7% en CDD. 46,7% ont créé leur propre activité, ce qui semble confirmer le peu d’aversion pour les jeunes professionnels pour cette forme d’emploi.

Peurs et difficultés d’insertion

Enfin, j’ai interrogé les étudiants sur leurs peurs et leurs doutes quant à leur insertion professionnelle. Ce qui revient le plus fréquemment (13 mentions parmi les 23 réponses), c’est la peur de la concurrence, que d’aucuns qualifieraient de déloyale, des autres traducteurs pratiquant des tarifs très bas, et des salaires qui en découlent et qui peuvent paraître bas pour un niveau bac +5. Vient ensuite la peur d’un démarrage difficile pour ceux qui souhaiteraient s’établir comme indépendants (5 mentions), puis des doutes sur les capacités à l’issue du master (4 mentions). Quelques autres peurs sont mentionnées une fois seulement : l’avenir du métier avec la traduction automatique, l’absence d’emploi à l’issue du stage, l’épanouissement personnel ou entre le statut à adopter. Une seule réponse ne mentionne aucune peur.

Les réponses des professionnels se montrent en partie rassurantes puisque 23 sur 30 ont répondu n’avoir éprouvé aucune difficulté à s’insérer sur le marché du travail. Pour les 7 professionnels ayant éprouvé des difficultés, 6 ont admis avoir eu des difficultés à se constituer un portefeuille client suffisant pour en vivre. Un autre problème rencontré par 2 professionnels a été l’impossibilité de trouver un emploi dans leur branche et dans leur région. Un seul répondant a déclaré que sa formation ne lui avait pas permis de prétendre à l’emploi qu’il souhaitait obtenir.

Au regard de ces résultats, la peur des étudiants concernant le portefeuille client semble être une réalité dans le métier ; cependant, il convient de rappeler que tous les professionnels interrogés semblent avoir surmonté cette difficulté puisqu’ils continuent d’exercer et de percevoir des salaires. La peur concernant les capacités à l’issue du master ne semble pas contre pas confirmée, puisqu’une seule personne n’a pu décrocher d’emploi à cause de cela.

Enfin, achevons de rassurer les étudiants sur leur employabilité : 63,3% des répondants ont déclaré avoir trouvé un emploi dans le mois suivant l’obtention de leur diplôme, 16,7% dans les 3 mois et 16,7% dans les 6 mois. Seuls 3,3% (un répondant !) ont déclaré avoir attendu plus d’un an avant d’obtenir un emploi.

 

Je dois moi-même avouer que les résultats de cette enquête m’ont surpris. Dans le contexte économique actuel, des résultats contraires ne m’auraient pas étonné plus que cela, mais le marché de la traduction semble bel et bien être un marché robuste qui permet à chacun de s’y insérer à l’issue de ses études. Les chiffres communiqués par les différentes formations semblent être conformes à la réalité, et la quantité de travail semble rejoindre dans la majorité de cas une certaine qualité du travail.  J’espère que ce billet de blog rassurera les étudiants bientôt diplômés et convaincra les indécis de se lancer dans le monde de la traduction professionnelle !

 

Un grand merci aux étudiants du master TSM de Lille et à tous les professionnels de la traduction qui ont pris le temps de répondre à mon enquête.

 

*Enquête composée de deux questionnaires anonymisés, un destiné aux étudiants du master TSM de Lille (23 répondants) et un autre aux professionnels de la traduction, tous métiers confondus (30 répondants). Vous pouvez demander un accès aux résultats complets de l’enquête en me contactant par mail (maximilien.dusautois.etu@univ-lille.fr).

 

[i] Source : https://www.tradutec.com/a-propos-de-tradutec/actualites/311-les-chiffres-de-la-traduction-professionnelle-en-2017.html

[ii] Source : https://www.isit-paris.fr/carriere-entreprises/insertion-professionnelle/

[iii] Chiffres communiqués par Rudy Loock, responsable du Master TSM au sein de l’Université de Lille, et issus des enquêtes de l’Observatoire de la Direction des Formations, qui sonde les diplômés 30 mois après l’obtention de leur diplôme, conformément aux demandes du ministère.

[iv] Source : http://www.univ-paris3.fr/medias/fichier/m2p-traduction-editoriale-economique-technique_1546955232570.pdf

[v] Source : https://start.lesechos.fr/emploi-stages/reseau-carriere/bac-2-vs-bac-5-le-match-des-salaires-11581.php

[vi] Définition et explication : https://www.expert-activ.com/soft-management-indispensable-entreprise/

[vii] Pour en savoir plus : https://start.lesechos.fr/emploi-stages/vie-en-entreprise/pour-ou-contre-etre-en-cdi-8904.php

BLEU, un algorithme qui calcule la qualité des traductions machine

Par Loréna Abate, étudiante M2 TSM

De nos jours, la traduction machine occupe une place très importante sur le marché de la traduction, et fait couler beaucoup d’encre. Si vous êtes intéressés par le secteur de la traduction machine, il se peut même que vous ayez déjà entendu parler des métriques d’évaluation permettant d’évaluer la qualité des traductions machine. Classer les différents systèmes ou métriques d’évaluation peut donc s’avérer pertinent. Alors, qu’en est-il de ces systèmes d’évaluation ? Eh bien, il en existe une multitude. En effet, on trouve sur le marché les métriques BLEU, ROUGE, METEOR, NIST, WER, etc.

Pour ne pas finir par rédiger un mémoire de 120 pages, il fallait donc faire un choix. Dans ce billet, nous ferons un focus sur l’algorithme BLEU. Pourquoi BLEU, me direz-vous ? Car cette métrique, élaborée et développée en 2002 par Kishore Papineni pour la société IBM, est aujourd’hui l’une des métriques automatisées les plus populaires et les moins coûteuses.

BLEU permet d’attribuer un score à une traduction machine grâce à un système de mesure reposant sur des morceaux de phrases. Ces parties sont appelées « N-grammes », et leur fréquence est également évaluée à l’aide d’une comparaison entre un texte source et un texte cible. Je vous ai perdus ? Accrochez-vous, la suite de l’article arrive.

A background of rippled and folded deep royal blue fabric material.

Pas évident de dénicher une image agréable à regarder sur un sujet si théorique… Vous vous contenterez donc de ce joli bleu roi.

Dis-moi Jamy, qu’est-ce que BLEU ?

BLEU, acronyme pour Bilingual Evaluation Understudy, est en fait une mesure des différences entre une traduction machine et une ou plusieurs traductions de référence créées par l’humain pour une même phrase source. BLEU part donc du postulat que plus une traduction machine se rapprochera d’une traduction humaine et professionnelle, plus elle sera qualitative.

Une fois ces comparaisons réalisées, un score est attribué pour chaque phrase traduite. Puis, une moyenne est calculée sur l’ensemble du corpus afin d’estimer la qualité globale du texte traduit.

Le score BLEU se définit par un nombre compris entre 0 et 1 qui indique la similitude du texte dit « candidat » par rapport aux textes de « référence ». Tout se joue au niveau du nombre de correspondances. En effet, plus le score se rapproche de 1, plus les textes sont similaires. Une valeur égale à 0 indiquerait que la traduction automatique ne correspond en rien à la traduction de référence et serait donc de mauvaise qualité, tandis qu’un score égal à 1 signalerait une correspondance parfaite avec les traductions de référence et serait ainsi de bonne qualité.

Intéressant comme outil, comment ça fonctionne ?

Formation littéraire oblige, nous n’avons pas revu les exponentielles depuis le lycée (et j’en fais encore des cauchemars…) je vous épargne donc les explications de sa formule mathématique qui n’est pas des plus simples :

123

… vous voyez, l’image bleue du début n’était pas si mal.

 

Bref, voici quelques éléments nécessaires à la génération d’un score BLEU :

  • Une ou plusieurs traductions de référence humaine, qui devraient être inconnues du développeur du système de TA
  • Un texte d’au moins 1 000 phrases dans le but d’obtenir une mesure plus pertinente,
  • Si le texte candidat est jugé trop court par rapport à la référence, une pénalité de concision est appliquée sur la traduction,
  • La correspondance de « n-grammes », qui consiste à compter le nombre d’unigrammes (mot unique), de bigrammes (paire de mots), de trigrammes et de quadrigrammes (i = 1,…, 4) qui correspondent à leur équivalent de n-grammes au sein des traductions de référence. Les unigrammes permettent de calculer l’exactitude, tandis que les n-grammes plus longs rendent compte de la fluidité de la traduction.

En pratique, il est impossible d’obtenir un score parfait de 1, et ce, même pour un traducteur humain (à moins d’avoir une traduction mot pour mot identique à la traduction de référence). À titre d’exemple, sur un corpus d’environ 500 phrases, un traducteur humain a obtenu une note de 0,346 8 contre quatre références et de 0,257 1 contre deux références.

Un exemple, peut-être ?

Si l’on prend cette phrase simple : « Le renard brun et rapide sauta sur le chien paresseux », comment l’auriez-vous traduite ?

  1. The quick brown fox jumped over the lazy dog
  2. The fast brown fox jumped over the lazy dog
  3. The fast brown fox jumped over the sleepy dog

Si je vous dis que la traduction de référence est « The quick brown fox jumped over the lazy dog », voyons voir votre score BLEU :

  1. On obtient alors un score de… ? Oui, c’est bien ça, 1,0. Vous voyez, ce n’est pas si compliqué !
  2. En remplaçant le mot « quick » par le mot « fast », votre score chute alors à 0,750.
  3. Cette fois-ci, deux mots sont différents… Désolée, mais vous n’obtenez que 0,48.

Avec cet exemple simple, vous avez d’ores et déjà un aperçu du système de notation. Voici un deuxième cas de figure :

  • Si tous les mots sont différents sur le texte candidat, on obtient le pire score possible: 0,0.
  • Si le texte candidat comporte moins de mots que le texte de référence, mais que les mots sont tous corrects, le score est alors très semblable au score obtenu avec un seul mot différent, à savoir : 0,751.
  • Et avec deux mots de plus que le texte de référence ? À nouveau, nous pouvons voir que notre intuition était la bonne et que le score est équivalent à celui qui comporte deux mots erronés, à savoir: 0,786.
  • Enfin, prenons l’exemple d’une phrase qui serait trop courte en comportant seulement deux mots. L’exécution de cet exemple entraînerait d’abord l’apparition d’un message d’avertissement indiquant que l’évaluation portant sur les trigrammes et quadrigrammes ne peut pas être effectuée, puisque nous n’avons que les bigrammes avec lesquels travailler pour le candidat. Au-delà de cela, nous risquerions d’obtenir un score très bas : 0,030.

Est-ce pour autant suffisant pour évaluer la qualité ?

« Most of us would agree that competent human evaluation is the best way to understand the output quality implications of different MT systems. However, human evaluation is generally slower, less objective and more expensive, and thus may not be viable in many production use scenarios, where multiple comparisons need to be made on a constant and ongoing basis. » (Kirti Vashee, 2019, Understanding MT Quality)

La traduction automatique est un défi particulièrement difficile pour l’IA. Les ordinateurs sont amateurs de résultats binaires. Vous savez tout autant que moi que la traduction, c’est tout l’inverse. Quel choix de traduction serait plus correct qu’un autre ? Difficile à dire. En effet, il peut y avoir autant de traductions correctes qu’il y a de traducteurs et, par conséquent, l’utilisation d’une seule référence humaine pour mesurer la qualité d’une solution de traduction automatisée pose problème.

Vous l’aurez compris, on en revient au même problème que pour la traduction neuronale, mais ici cela devient encore plus complexe, car c’est une machine qui juge une machine. Une vraie machineception.

Le problème avec BLEU…

Les scores BLEU ne reflètent en effet que les performances d’un système sur un ensemble spécifique de phrases sources et les traductions de référence sélectionnées pour l’évaluation. Puisque le texte de référence pour chaque segment n’est évidemment pas la seule traduction correcte et « de qualité », il arrive fréquemment de mal noter (« scorer ») de bonnes traductions. On peut donc dire que ces scores ne reflètent pas systématiquement le rendement potentiel réel d’un système.

Bien que l’objectif de BLEU soit de mesurer la qualité globale de la traduction, le résultat que l’on obtient est plutôt une mesure de la similitude entre deux chaînes de caractères dans un texte. Considérée par certains comme une mesure fiable de la qualité, la majeure partie des experts considèrent que les scores BLEU seraient plus précis si les comparaisons étaient faites au niveau du corpus entier plutôt qu’à chaque phrase. Ainsi, on remet en question la performance de cet outil qui n’a en réalité aucune « intelligence » linguistique qui lui permettrait d’évaluer la qualité d’une traduction machine.

Un système critiqué, et pour cause !

BLEU ne prend pas en compte le sens

Texte original : J’ai mangé la pomme.

Traduction de référence : I ate the apple.

Si l’on en croit BLEU, les trois traductions suivantes, ayant obtenu le même score, seraient aussi mauvaises les unes que les autres :

  1. I consumed the apple.
  2. I ate an apple.
  3. I ate the potato.

Pourtant, la troisième traduction n’a rien à voir avec le sens du texte original, à savoir J’ai mangé la pomme.

BLEU ne prend pas en compte la structure des phrases

Une phrase complètement absurde, avec des mots « corrects », mais simplement placés dans un ordre aléatoire est susceptible d’obtenir un score élevé !

BLEU gère mal les langues « riches » morphologiquement

La métrique BLEU ne fait pas la distinction entre le contenu et les mots-outils. Par exemple, la pénalité liée à l’omission d’un mot-outil tel que « un » est identique à la pénalité appliquée en cas de remplacement du terme « NASA » par « ESA ».

BLEU ne correspond finalement pas tant à une évaluation humaine

Avant le calcul du score BLEU, les traductions de référence et les traductions automatiques doivent être normalisées et « tokenisées », ce qui affecte considérablement le score BLEU final.

En bref…

Le score BLEU, quoiqu’imparfait, offre certains avantages : rapide et peu coûteux à calculer, facile à comprendre *hum hum*, indépendant de la langue, très proche d’une évaluation humaine, cette métrique a largement été adoptée ces vingt dernières années.

Malgré ses imperfections, BLEU est un outil utile et prometteur, et demeure encore aujourd’hui une mesure de référence pour tous les développeurs de traduction automatique. Pour preuve, dans son concours annuel des outils de TA, le NIST (National Institute of Standards & Technology) a choisi d’utiliser BLEU comme indicateur approximatif de la qualité.

Le BLEU « idéal » serait un système dans lequel seraient prises en considération toutes les propriétés linguistiques fondamentales, telles que la structure de la langue, la cohérence, le style d’écriture, le contenu, l’organisation, l’exactitude des propos… À l’heure actuelle, le seul moyen d’obtenir d’excellents résultats est d’associer les métriques automatiques à une évaluation humaine et unilingue.

Sources

Sources en anglais

Sources en français

Parce que cet article vous a passionné…

La machine DeepL

Par Julian Turnheim, étudiant M2 TSM

 

Automne 2007 : les feuilles mortes quittent leurs branches et viennent se poser avec douceur sur le sol encore froid et humide. Pendant ce temps-là, un homme, Dr. Gereon Frahling, ancien employé de chez Google, repère un marché de niche et cherche à développer son idée. Il quitte le géant américain pour lancer, en un an et demi, avec son associé Leonard Fink, leur start-up : le dictionnaire bilingue Linguee. Après dix-huit mois de travail acharné et des tonnes de pizzas, le résultat est impressionnant.

L’objectif de Linguee ? Dr. Frahling l’explique comme suit : « Un moteur de recherche de traductions ouvert à tous. Si quelqu’un a un problème pour traduire une phrase en particulier, il peut vérifier sur Linguee si un traducteur quelque part dans le monde a déjà traduit exactement cette même phrase. Et ensuite, il peut s’orienter par rapport à cette traduction. » (Traduit de l’allemand) Est-ce la racine de DeepL ?

Dix ans plus tard, Lee Turner Kodak, responsable communication chez DeepL, tient dans ses mains le tout premier Prix Honorifique pour l’IA d’Allemagne. Linguee a bien grandi. D’ailleurs, l’entreprise Linguee GmbH ne s’appelle plus Linguee mais DeepL GmbH. En effet, entre temps, l’entreprise a lancé, en 2017, le traducteur automatique DeepL. Ce nouveau traducteur automatique a eu l’effet d’une bombe dans le monde de la traduction. Personne ne pouvait imaginer que, dès sa sortie, ce petit nouveau mettrait dans l’embarras le géant Google Traduction.

C’est de ce petit nouveau, plus si nouveau et plus si petit que ça, finalement, que je voudrais vous parler.

 

Comment utiliser la bête ?

DeepL peut être utilisé gratuitement et sans qu’un enregistrement soit nécessaire. Vous pouvez soit coller le texte à traduire dans le champ dédié, soit téléverser directement votre document texte ou diaporama, grâce à l’option « Traduire un document ». Toutefois, la version gratuite ne permet d’obtenir que des documents en lecture seule, dont vous ne pourrez copier que le texte brut. De plus, il n’est pas possible de corriger la traduction, alors que cela est possible sur la plateforme.

Il est possible de coller un maximum de 5000 caractères dans le champ dédié, mais il n’y a pas de limite de taille pour les documents téléversés. La version gratuite n’est pas forcément adaptée aux exigences des traducteurs professionnels, car le texte que vous insérerez sur la plateforme sera conservé par DeepL, ce qui peut poser quelques problèmes de confidentialité. Mais pas d’inquiétude ! Pour les traducteurs, la version professionnelle de DeepL existe sous la forme d’un plug-in pouvant être intégré à de nombreux outils de TAO, tels que SDL Trados Studio et MemoQ. Cette version professionnelle ne conservera pas les données saisies.

L’un des avantages majeurs de la traduction via le champ dédié est qu’elle permet d’affiner le résultat, ce qui est impossible avec l’option « Traduire un document ». Si une traduction ne vous satisfait pas, un clic sur le texte traduit ouvre un menu proposant des suggestions alternatives, et vous pourrez alors corriger la traduction rapidement et facilement. Lorsque vous corrigez ou modifiez des mots, la plateforme propose, si nécessaire, une phrase entièrement retravaillée. Vous pouvez donc toujours négocier avec DeepL, lui suggérer de nouvelles phrases, de nouveaux mots, ou encore améliorer la traduction qui a été proposée directement dans l’outil. DeepL, n’oubliant pas que vous avez modifié la traduction, utilisera ensuite ces nouvelles connaissances. C’est ce qu’on appelle la traduction automatique neuronale.

 

La traduction automatique neu… quoi ?

La traduction automatique neuronale. Mais oui, parlons-en ! Enfin, essayons d’en parler. L’étudiant de M2 que je suis ne saurait vous expliquer avec exactitude comment fonctionne la traduction automatique neuronale. Les experts eux-mêmes semblent aujourd’hui peiner à en expliquer le processus, tant l’évolution de la traduction automatique est rapide.

Ce que je peux vous dire, c’est que DeepL analyse des textes à l’aide de réseaux neuronaux. Ces réseaux permettent de résoudre des tâches sur la base de modèles prédéfinis. Lorsqu’un réseau neuronal est formé à la traduction, il est tout d’abord alimenté avec des traductions préexistantes et correctes, soit un corpus parallèle géant de qualité. Il les analyse alors jusqu’à pouvoir en déduire la façon dont les nouveaux textes doivent être traduits. Cette méthode est aussi appelée le Deep Learning (oui, DeepL porte bien son nom). Cela fait référence à la capacité d’une machine à apprendre en utilisant d’importants ensembles de données, plutôt qu’en ayant recours à des règles codées, beaucoup trop rigides et limitées. L’ordinateur peut alors apprendre par lui-même et entraîner une intelligence artificielle à prédire les résultats à partir d’un ensemble de données saisies. À l’instar d’un animal ou un bébé humain, il apprend grâce à des exemples, des expériences et des erreurs. Chaque fois que vous traduisez avec DeepL, vous nourrissez le géant.

Cet apprentissage considérable nécessite l’utilisation d’un super-ordinateur d’une performance équivalente à 5000 processeurs d’ordinateurs de bureau. Ce serveur surpuissant n’est d’ailleurs pas situé en Allemagne (lieu du siège de DeepL), mais dans un centre de données en Islande, à Keflavik. Là-bas, il est plus facile de garder les traductions au frais : les basses températures extérieures de cette région du monde facilitent la climatisation de ce gigantesque centre de données. Autrement, le serveur se transformerait rapidement en l’un des nombreux volcans islandais.

 

Maintenant, place à la pratique !

Il est temps d’analyser les performances de ce géant. Pour cela, je vais reprendre les textes que Marine Moreel avait utilisés dans son billet de blog du 8 octobre 2017 : Google Translate vs DeepL : le duel. Ces textes sont extraits du site du Plaza Hotel de New York rédigés en anglais. Je vais donc observer leur traduction vers le français. Ainsi, nous pourrons comparer les textes traduits entre 2017 et aujourd’hui, et en analyser l’évolution.

  • La typographie

En quelques mots, on peut dire qu’il n’y a pas vraiment eu d’évolution en la matière. DeepL ne respecte toujours pas les règles typographiques de la langue française. On ne retrouve donc toujours pas d’espaces insécables ou de guillemets chevrons dans le texte traduit.

  • La localisation

2017

localisation2

2019

CaptureLOCALISATION

En ce qui concerne la localisation, on constate une légère évolution. DeepL ne localise toujours pas les numéros de téléphone et les devises. En revanche, il adapte le format des chiffres en supprimant la virgule séparatrice de milliers, et sait localiser l’heure. Pour l’instant, rien de nouveau sous le soleil. Toutefois, à la dernière phrase, on remarque que DeepL a traduit l’unité de mesure sans la localiser. Cela représente une amélioration par rapport à la version de 2017, dans laquelle DeepL a traduit « 4,500 sq. ft. » par « 4 500 m² » en la faisant suivre de la mesure « ft. » laissée telle quelle, ce qui n’a aucun sens.

  • Omissions

2017

coherence2

2019

CaptureCOHERENCE

En comparaison avec la traduction de 2017, on peut constater que « palatial » n’a pas été omis cette fois-ci. DeepL n’a donc pas supprimé de mots, que ce soit dû à une impossibilité de traduire, ou à la nécessité de rendre la phrase traduite plus humaine.

  • La traduction des mots empruntés à d’autres langues

2017

emprunts2

2019

CaptureDRESSING

 

Confusion de « dressing area » avec « dressing room » ? Mystère ! Toujours est-il que l’on passe d’une traduction peu idiomatique et incorrecte du point de vue du contexte, à une formulation fluide, naturelle et plus vendeuse, reprenant la terminologie adaptée, soit un emprunt dans ce cas. En 2019, DeepL semble donc avoir moins peur des emprunts.

Notons par ailleurs que « luxury », tout d’abord traduit par l’adjectif « luxueux », a trouvé une traduction plus heureuse en 2019 avec le complément du nom « de luxe », qui semble mieux se prêter au contexte.

  • La traduction littérale et le sens

2017

sens2

2019

CaptureBIGFinal

Garder « The Eloise Shop » ou traduire littéralement par « La Boutique Eloise » ? En tant que futur traducteur, j’accompagnerais la traduction du nom original entre crochets. Dans tous les cas, ce sera au post-éditeur et/ou au client de trancher.

En 2017, DeepL avait choisi de proposer la traduction première de « skidder », soit « déraper ». En 2019, il n’en prend même plus la peine et les clients se retrouvent à faire du « skidder » dans le magasin. Ici, le verbe est accompagné de la particule « in ». Son sens s’en voit donc modifié. Les verbes à particule sont porteurs d’une grande richesse sémantique et leurs diverses acceptions évoluent de façon continue. Alors, qui d’autre que le post-éditeur sera à même d’en extraire (mais surtout d’en retransmettre) le sens ?

En revanche, nous pouvons être agréablement surpris de la gestion du mot « (mis)adventures » par l’outil, qui a proposé « (més)aventures » en 2019. Cette fois, DeepL ne s’est pas laissé duper par les parenthèses et a parfaitement rendu le sens du texte source. Une belle évolution depuis 2017.

Le dernier aspect que je souhaiterais aborder est la traduction de « enjoy story time with their mostly companion ». L’outil n’a pas réussi à comprendre le sens du terme « mostly ». À défaut de proposer mieux, DeepL suggère en 2017 l’utilisation de « principal ». En 2019, on ne comprend pas vraiment ce qu’il se passe, et l’on obtient le très étrange « compagnon pour la plupart ». Régression ou apprentissage en cours ?

 

Pour finir

Entre 2017 et 2019, DeepL a augmenté le nombre de langues proposées. Cependant, les traductions délivrées dans certaines combinaisons de langues sont d’une qualité moindre par rapport à d’autres. Est-ce parce que l’outil utilise l’anglais comme langue pivot pour lesdites combinaisons ? Si le sujet de l’anglais comme langue pivot vous intéresse, vous pouvez consulter le billet de blog de ma collègue Angelina Fresnaye.
Les corpus utilisés proviennent notamment de la base de données EUR-Lex, ce qui permet à DeepL d’être très performant dans la traduction automatique de textes juridiques.
Enfin, attention cependant, la très bonne qualité des traductions proposées et leur style naturel sont parfois un mirage. En effet, au nom de la fluidité, le sens pourra être changé et des éléments supprimés. En d’autres termes, si de nombreux articles affirment que la traduction automatique signera la fin du métier de traducteur, nous pouvons constater que l’on en est encore bien loin et que la présence d’un post-éditeur pour rattraper les maladresses, oublis et faux-sens ne sera pas de trop.

 

SOURCES :

Gerald Himmelein (03/06/2019) DeepL: The new gold standard in online translation? softmaker.com.

Radu Raicea (23/10/2017) Want to know how Deep Learning works? Here’s a quick guide for everyone. freecodecamp.org

Wikipedia (08/11/2019) Linguee, Wikimedia Foundation

Magdalena Räth (11/12/2013) Gereon Frahling (Linguee): „Wir haben uns 18 Monate vergraben“ gruenderszene.de

Blog de DeepL (04/10/2019) DeepL remporte le tout premier Prix Honorifique pour l’IA d’Allemagne https://www.deepl.com/blog/20191004.html

Marine Moreel (08/10/2019) Google Translate vs DeepL : le duel. Blog du Master « Traduction Spécialisée Multilingue » (TSM) de l’Université de Lille

 

Rencontre avec Laurence Anthony, le créateur d’AntConc, perle linguistique du Japon

Par Jordan Raoul, étudiant M2 TSM

 

LaurenceAnthony

Laurence Anthony, toujours très souriant, dans son bureau

 

Fin septembre 2019, mon acolyte m’annonçait qu’elle allait décoller pour Tokyo, à la fin du mois suivant, dans le cadre de son mémoire. En un clin d’œil, ma pause pédagogique était planifiée. Hélas, quelque chose me tracassait. Abstraction faite de la locution お前はもう死んでいる, qui n’allait pas m’amener très loin, je ne peux prétendre parler japonais. Je ne voulais pas me cantonner à la passivité, c’est pourquoi l’idée de donner une dimension éducative à ce voyage me plaisait. « Que faire entre une visite du Pokémon Center et un après-midi détente dans la librairie Tsutaya ? » Ainsi, je me mis à puiser de l’inspiration dans mes études, à l’instar de ma partenaire. Eurêka ! M. Loock, notre professeur, venait justement de nous parler de Laurence Anthony, le développeur de AntConc, lors du cours de grammaire comparée. Laurence Anthony vit à Tokyo, où il est directeur de département au sein du Center for English Language Education in Science and Engineering (CELESE) à l’Université Waseda. En un tour de main j’avais envoyé un e-mail à Laurence Anthony, qui n’a pas tardé à répondre positivement à ma demande. Dans ce billet, je vous parlerai de l’histoire de AntConc, des programmes qui l’accompagnent, et des raisons pour lesquelles vous devriez songer à vous l’approprier. Les informations présentées sont tirées d’une interview avec Laurence Anthony ainsi que de diverses sources que vous pourrez trouver à la fin de l’article.

Qu’est-ce que AntConc ?

AntConc est un logiciel que les traducteurs qualifient généralement d’outil de corpus DIY (Do It Yourself). Le principe est simple : l’utilisateur va lui-même créer son corpus en complétant une base de données. Les fichiers, généralement au format .txt, sont compilés dans une interface très simple d’utilisation. Par exemple, si je suis traducteur et que je suis spécialisé dans la mode ou encore dans l’art, et que je veux être certain de mes sources, je peux créer mon propre corpus dédié au domaine en question. Il est possible de créer autant de corpus que souhaitable. La fonction principale du programme est ce que l’on appelle un KWIC (Keyword-in-context). Cela implique que l’utilisateur doit saisir le terme recherché dans la barre située en bas de l’interface. KWIC, qui signifie, en français, « mot-clef en contexte », est ici illustré par le fait que le programme va produire un résultat qui met en évidence le mot recherché au travers d’une couleur. La fonction KWIC sort, qui se situe encore en dessous, permet de colorer les termes qui suivent ou qui précèdent le terme recherché, permettant ainsi à l’utilisateur de retrouver les mots avec lesquels un terme donné fonctionne, en d’autres termes les collocations. Il existe bien évidemment d’autres logiciels qui offrent le même type de service, comme Sketchengine ou le COCA, mais AntConc présente deux avantages non négligeables : utilisation hors connexion et gratuité !

AntConc

Interface type d’une page de résultats AntConc

 

AntConc n’est pas le seul outil développé par Laurence Anthony. Il y en a en réalité beaucoup, et quelques-uns peuvent se révéler très utiles pour les traducteurs. On peut mentionner AntCorGen, qui permet de générer des corpus spécialisés de façon massive et rapide, ou encore AntPConc, qui est un outil d’analyse de corpus parallèles. Comme nous le verrons plus tard, Laurence Anthony n’a pas développé ces logiciels pour des traducteurs, ce qui suggère des possibilités d’améliorations qu’il admet vouloir programmer à l’avenir.

Mais puisqu’on parle du personnage : qui est vraiment Laurence Anthony ?

Né en 1970 à Huddersfield, au Royaume-Uni, n’a, contre toute attente, jamais été traducteur. Durant ses études, il parvient d’abord à obtenir une licence en physique mathématique au Manchester Institute of Science and Technology (UMIST) [désormais partie intégrante de l’Université de Manchester]. Son intérêt grandissant pour l’apprentissage et l’enseignement des langues le mène ensuite à l’Université de Birmingham, où il a obtenu un Master en 1997, en TEFL/TESL (Teaching English as a Foreign Language/Second Language). Il s’agit d’une certification qui équivaut au FLE (Français en Langue Étrangère), en France, et qui permet d’enseigner sa langue maternelle à des étudiants qui ne la maîtrisent pas (ou pas en tant que première langue). En 2002, enfin, toujours à l’Université de Birmingham, il devient docteur en linguistique appliquée. Son champ d’étude combine l’informatique et la linguistique. Mais Laurence Anthony maintient une relation étroite avec le Japon, et ce depuis 1991, année à laquelle il devient professeur principal dans une école de langue anglaise, avant de devenir membre permanent du corps professoral à la Okayama University of Science. À partir de 2004, il occupe cette même fonction au sein de la Waseda University, à Tokyo, où il est, encore à l’heure actuelle, à ce poste. Ce qui est important à savoir, c’est que AntConc n’a jamais été son projet principal. C’est sa création, certes, mais c’est avant tout un outil qu’il a développé à destination des étudiants. Ainsi, les évolutions qu’a subi AntConc ont une dimension qui s’oriente pleinement vers la pratique.

Comment AntConc est-il né ?

Pour comprendre l’histoire de AntConc, il faut se replonger au milieu des années 1990. Internet est encore naissant, l’ergonomie de l’informatique également, et l’étude du discours dans les corpus se faisait à la main. Laurence Anthony, jeune étudiant doctorant, décide de développer un outil pour sa thèse. Il pense à une interface dédiée à l’analyse du discours par la machine, ce qui lui procurerait une productivité accrue et lui éviterait des tendinites répétitives. Une nouvelle approche, celle de l’apprentissage automatique (machine learning en anglais) serait, à son sens, plus rigoureuse. L’une des grandes nouveautés pour lui, à cette époque, fut le développement d’une interface. Laurence Anthony code depuis ses 11 ans, mais n’avait jusqu’alors jamais créé d’interface. Pragmatique, il était important pour lui que cette interface soit user-friendly, mais également que le programme reste simple et qu’elle se limite à des « widgets, des boutons, etc. ». AntConc 1.0 était né ! Le logiciel est d’ailleurs toujours en ligne, pour les curieux. Notez qu’il est programmé pour être international, grâce au UTF-8.

Laurence Anthony2

En fin d’interview, avec Laurence Anthony. Photo: Yuzhe Jia

 

Comment AntConc a-t-il évolué suite à sa création ?

Pour Laurence Anthony, la vocation première de AntConc est de servir d’outil de travail pour ses étudiants de rédaction. C’est lorsque notre développeur a reçu la demande d’un professeur japonais qui voulait l’utiliser pour sa classe de rédaction, que AntConc est passé de « projet de doctorat » à outil pédagogique. Ces étudiants se servent de l’outil comme nous, les traducteurs, en quelque sorte. En effet, le but est le même : assurer la qualité linguistique du texte final. Que l’on rédige depuis une traduction ou depuis ses pensées, le rendu doit être fluide, adapté au public, et présenter les bonnes collocations. Aujourd’hui, c’est avec plus de 10 000 étudiants que Laurence Anthony exploite l’outil AntConc. Si AntPConc ne présente aucun intérêt pour ce public, l’outil AntCorGen est très apprécié, lorsqu’il s’agit de rédiger un texte spécialisé. Les étudiants peuvent, par exemple, collecter des articles de recherche très rapidement.
Deux premières évolutions ont changé la donne : la possibilité de télécharger AntConc sous Windows et la mise en ligne du logiciel. Très vite, un autre type de public s’est approprié AntConc : les linguistes de corpus. Cela a d’abord surpris Laurence Anthony. Ces linguistes utilisaient AntConc comme outil de recherche et n’ont pas tardé à proposer des améliorations à Laurence Anthony. Des mesures statistiques, des fonctions complexes, bref, des choses que les étudiants n’allaient probablement pas demander. Le logiciel est ainsi devenu très populaire auprès des linguistes. Plus tard et de la même manière, sont arrivés les traducteurs. Ce dernier groupe a, lui aussi, des besoins qui sont très différents des étudiants et des linguistes. Laurence Anthony a des idées plein la tête, mais le temps lui manque.

Waseda

Université Waseda, Tokyo

 

Qu’en est-il des traducteurs, alors ?

À ce sujet, Laurence Anthony est moins confiant. Deux choses sont pourtant intéressantes. Il est intervenu lors d’une conférence sur la traduction et a été interviewé par un site dédié à la traduction qui n’a pas hésité à parler de AntConc en détail, l’auteur en recommandant d’ailleurs fortement l’usage pour les traducteurs. Bien évidemment, je ne suis pas venu sans questions au sujet de la traduction. Un outil attirait mon attention en particulier : AntPConc, qui gère les corpus parallèles. Laurence Anthony admet qu’une fonction permettant de combiner les corpus générés à une mémoire de traduction, de sorte à pouvoir y effectuer des recherches. Le logiciel serait ainsi pourvu de paramètres de choix de langue, et même d’une possibilité de faire des alignements. Tout cela laisse rêveur, si bien que le développeur songe à créer une interface qui soit entièrement dédiée aux traducteurs et aux seuls outils dont ils auraient besoin. Nous verrons ce que l’avenir nous réserve.

Des changements sont toutefois prévus prochainement !

Considérant que AntConc est relativement lent, par rapport aux outils en ligne, Laurence Anthony est en train de créer une nouvelle base de données pour son logiciel. Elle a pour objectif de procurer à AntConc une vitesse comparable à celle des outils en ligne, tout en fonctionnant hors connexion. La langage choisi par le développeur pour cette base de données, Python, est supposé permettre à celle-ci de supporter des corpus de taille beaucoup plus grande, chose qu’apprécieront les linguistes. Des ajouts de mesures statistiques sont également au programme. À l’heure actuelle, AntPConc est déjà rédigé en Python, mais c’est un logiciel que peu de gens utilisent et Laurence Anthony n’a pas vraiment reçu de retours (traducteurs : à vos claviers). Sans retours, il n’y aura pas de changements. Sachez qu’il vous est également possible de soutenir financièrement Laurence Anthony, en passant par les liens PayPal et Patreon qui se trouvent dans l’onglet « Software » du site web. Laurence Anthony serait ravi de pouvoir investir dans les bonnes idées !

Pour conclure…

Pour Laurence Anthony, AntConc doit rester simple. Sa vocation est celle de servir les étudiants mentionnés plus tôt. Une évolution qui suivrait de trop près les attentes et les besoins des linguistes et des traducteurs risquerait de trop complexifier le logiciel. Sa facilité de prise en main a sûrement une influence sur sa popularité. Son succès retentit à travers plusieurs pays : la Bank of England en fait usage, les universités chinoises en sont fans, et la Corée du Sud a vu la publication d’un ouvrage entièrement dédié à AntConc ! Ce dernier a eu l’approbation de Laurence Anthony, mais le développeur a été très agréablement surpris lorsqu’il a appris l’existence du livre. Vous voilà à présent très informés à propos de AntConc et de son créateur, Laurence Anthony. Une chose est sûre, le programme n’a pas fini de grandir !

AntConcbook

L’ouvrage en question, rédigé en coréen

 

Liens :

Le site de l’intéressé (sur lequel sont disponibles tous les logiciels) :
https://www.laurenceanthony.net/

Lien vers l’article de Michael Wilkinson, sur AntConc :
https://www.translationdirectory.com/articles/article2367.php