BLEU, un algorithme qui calcule la qualité des traductions machine

Par Loréna Abate, étudiante M2 TSM

De nos jours, la traduction machine occupe une place très importante sur le marché de la traduction, et fait couler beaucoup d’encre. Si vous êtes intéressés par le secteur de la traduction machine, il se peut même que vous ayez déjà entendu parler des métriques d’évaluation permettant d’évaluer la qualité des traductions machine. Classer les différents systèmes ou métriques d’évaluation peut donc s’avérer pertinent. Alors, qu’en est-il de ces systèmes d’évaluation ? Eh bien, il en existe une multitude. En effet, on trouve sur le marché les métriques BLEU, ROUGE, METEOR, NIST, WER, etc.

Pour ne pas finir par rédiger un mémoire de 120 pages, il fallait donc faire un choix. Dans ce billet, nous ferons un focus sur l’algorithme BLEU. Pourquoi BLEU, me direz-vous ? Car cette métrique, élaborée et développée en 2002 par Kishore Papineni pour la société IBM, est aujourd’hui l’une des métriques automatisées les plus populaires et les moins coûteuses.

BLEU permet d’attribuer un score à une traduction machine grâce à un système de mesure reposant sur des morceaux de phrases. Ces parties sont appelées « N-grammes », et leur fréquence est également évaluée à l’aide d’une comparaison entre un texte source et un texte cible. Je vous ai perdus ? Accrochez-vous, la suite de l’article arrive.

A background of rippled and folded deep royal blue fabric material.

Pas évident de dénicher une image agréable à regarder sur un sujet si théorique… Vous vous contenterez donc de ce joli bleu roi.

Dis-moi Jamy, qu’est-ce que BLEU ?

BLEU, acronyme pour Bilingual Evaluation Understudy, est en fait une mesure des différences entre une traduction machine et une ou plusieurs traductions de référence créées par l’humain pour une même phrase source. BLEU part donc du postulat que plus une traduction machine se rapprochera d’une traduction humaine et professionnelle, plus elle sera qualitative.

Une fois ces comparaisons réalisées, un score est attribué pour chaque phrase traduite. Puis, une moyenne est calculée sur l’ensemble du corpus afin d’estimer la qualité globale du texte traduit.

Le score BLEU se définit par un nombre compris entre 0 et 1 qui indique la similitude du texte dit « candidat » par rapport aux textes de « référence ». Tout se joue au niveau du nombre de correspondances. En effet, plus le score se rapproche de 1, plus les textes sont similaires. Une valeur égale à 0 indiquerait que la traduction automatique ne correspond en rien à la traduction de référence et serait donc de mauvaise qualité, tandis qu’un score égal à 1 signalerait une correspondance parfaite avec les traductions de référence et serait ainsi de bonne qualité.

Intéressant comme outil, comment ça fonctionne ?

Formation littéraire oblige, nous n’avons pas revu les exponentielles depuis le lycée (et j’en fais encore des cauchemars…) je vous épargne donc les explications de sa formule mathématique qui n’est pas des plus simples :

123

… vous voyez, l’image bleue du début n’était pas si mal.

 

Bref, voici quelques éléments nécessaires à la génération d’un score BLEU :

  • Une ou plusieurs traductions de référence humaine, qui devraient être inconnues du développeur du système de TA
  • Un texte d’au moins 1 000 phrases dans le but d’obtenir une mesure plus pertinente,
  • Si le texte candidat est jugé trop court par rapport à la référence, une pénalité de concision est appliquée sur la traduction,
  • La correspondance de « n-grammes », qui consiste à compter le nombre d’unigrammes (mot unique), de bigrammes (paire de mots), de trigrammes et de quadrigrammes (i = 1,…, 4) qui correspondent à leur équivalent de n-grammes au sein des traductions de référence. Les unigrammes permettent de calculer l’exactitude, tandis que les n-grammes plus longs rendent compte de la fluidité de la traduction.

En pratique, il est impossible d’obtenir un score parfait de 1, et ce, même pour un traducteur humain (à moins d’avoir une traduction mot pour mot identique à la traduction de référence). À titre d’exemple, sur un corpus d’environ 500 phrases, un traducteur humain a obtenu une note de 0,346 8 contre quatre références et de 0,257 1 contre deux références.

Un exemple, peut-être ?

Si l’on prend cette phrase simple : « Le renard brun et rapide sauta sur le chien paresseux », comment l’auriez-vous traduite ?

  1. The quick brown fox jumped over the lazy dog
  2. The fast brown fox jumped over the lazy dog
  3. The fast brown fox jumped over the sleepy dog

Si je vous dis que la traduction de référence est « The quick brown fox jumped over the lazy dog », voyons voir votre score BLEU :

  1. On obtient alors un score de… ? Oui, c’est bien ça, 1,0. Vous voyez, ce n’est pas si compliqué !
  2. En remplaçant le mot « quick » par le mot « fast », votre score chute alors à 0,750.
  3. Cette fois-ci, deux mots sont différents… Désolée, mais vous n’obtenez que 0,48.

Avec cet exemple simple, vous avez d’ores et déjà un aperçu du système de notation. Voici un deuxième cas de figure :

  • Si tous les mots sont différents sur le texte candidat, on obtient le pire score possible: 0,0.
  • Si le texte candidat comporte moins de mots que le texte de référence, mais que les mots sont tous corrects, le score est alors très semblable au score obtenu avec un seul mot différent, à savoir : 0,751.
  • Et avec deux mots de plus que le texte de référence ? À nouveau, nous pouvons voir que notre intuition était la bonne et que le score est équivalent à celui qui comporte deux mots erronés, à savoir: 0,786.
  • Enfin, prenons l’exemple d’une phrase qui serait trop courte en comportant seulement deux mots. L’exécution de cet exemple entraînerait d’abord l’apparition d’un message d’avertissement indiquant que l’évaluation portant sur les trigrammes et quadrigrammes ne peut pas être effectuée, puisque nous n’avons que les bigrammes avec lesquels travailler pour le candidat. Au-delà de cela, nous risquerions d’obtenir un score très bas : 0,030.

Est-ce pour autant suffisant pour évaluer la qualité ?

« Most of us would agree that competent human evaluation is the best way to understand the output quality implications of different MT systems. However, human evaluation is generally slower, less objective and more expensive, and thus may not be viable in many production use scenarios, where multiple comparisons need to be made on a constant and ongoing basis. » (Kirti Vashee, 2019, Understanding MT Quality)

La traduction automatique est un défi particulièrement difficile pour l’IA. Les ordinateurs sont amateurs de résultats binaires. Vous savez tout autant que moi que la traduction, c’est tout l’inverse. Quel choix de traduction serait plus correct qu’un autre ? Difficile à dire. En effet, il peut y avoir autant de traductions correctes qu’il y a de traducteurs et, par conséquent, l’utilisation d’une seule référence humaine pour mesurer la qualité d’une solution de traduction automatisée pose problème.

Vous l’aurez compris, on en revient au même problème que pour la traduction neuronale, mais ici cela devient encore plus complexe, car c’est une machine qui juge une machine. Une vraie machineception.

Le problème avec BLEU…

Les scores BLEU ne reflètent en effet que les performances d’un système sur un ensemble spécifique de phrases sources et les traductions de référence sélectionnées pour l’évaluation. Puisque le texte de référence pour chaque segment n’est évidemment pas la seule traduction correcte et « de qualité », il arrive fréquemment de mal noter (« scorer ») de bonnes traductions. On peut donc dire que ces scores ne reflètent pas systématiquement le rendement potentiel réel d’un système.

Bien que l’objectif de BLEU soit de mesurer la qualité globale de la traduction, le résultat que l’on obtient est plutôt une mesure de la similitude entre deux chaînes de caractères dans un texte. Considérée par certains comme une mesure fiable de la qualité, la majeure partie des experts considèrent que les scores BLEU seraient plus précis si les comparaisons étaient faites au niveau du corpus entier plutôt qu’à chaque phrase. Ainsi, on remet en question la performance de cet outil qui n’a en réalité aucune « intelligence » linguistique qui lui permettrait d’évaluer la qualité d’une traduction machine.

Un système critiqué, et pour cause !

BLEU ne prend pas en compte le sens

Texte original : J’ai mangé la pomme.

Traduction de référence : I ate the apple.

Si l’on en croit BLEU, les trois traductions suivantes, ayant obtenu le même score, seraient aussi mauvaises les unes que les autres :

  1. I consumed the apple.
  2. I ate an apple.
  3. I ate the potato.

Pourtant, la troisième traduction n’a rien à voir avec le sens du texte original, à savoir J’ai mangé la pomme.

BLEU ne prend pas en compte la structure des phrases

Une phrase complètement absurde, avec des mots « corrects », mais simplement placés dans un ordre aléatoire est susceptible d’obtenir un score élevé !

BLEU gère mal les langues « riches » morphologiquement

La métrique BLEU ne fait pas la distinction entre le contenu et les mots-outils. Par exemple, la pénalité liée à l’omission d’un mot-outil tel que « un » est identique à la pénalité appliquée en cas de remplacement du terme « NASA » par « ESA ».

BLEU ne correspond finalement pas tant à une évaluation humaine

Avant le calcul du score BLEU, les traductions de référence et les traductions automatiques doivent être normalisées et « tokenisées », ce qui affecte considérablement le score BLEU final.

En bref…

Le score BLEU, quoiqu’imparfait, offre certains avantages : rapide et peu coûteux à calculer, facile à comprendre *hum hum*, indépendant de la langue, très proche d’une évaluation humaine, cette métrique a largement été adoptée ces vingt dernières années.

Malgré ses imperfections, BLEU est un outil utile et prometteur, et demeure encore aujourd’hui une mesure de référence pour tous les développeurs de traduction automatique. Pour preuve, dans son concours annuel des outils de TA, le NIST (National Institute of Standards & Technology) a choisi d’utiliser BLEU comme indicateur approximatif de la qualité.

Le BLEU « idéal » serait un système dans lequel seraient prises en considération toutes les propriétés linguistiques fondamentales, telles que la structure de la langue, la cohérence, le style d’écriture, le contenu, l’organisation, l’exactitude des propos… À l’heure actuelle, le seul moyen d’obtenir d’excellents résultats est d’associer les métriques automatiques à une évaluation humaine et unilingue.

Sources

Sources en anglais

Sources en français

Parce que cet article vous a passionné…

Art : traduire les expositions

Par Angel Bouzeret, étudiante M2 TSM

statue-4255695_1920

Well well, le titre en dit long, alors je ne vais pas laisser plus de suspens : cette année, j’ai décidé de vous parler d’art et même d’Art avec un grand A. L’Art étant un sujet plus qu’étendu, je vais me pencher sur les expositions d’art. Mon but n’est bien évidemment pas de réduire cette vaste discipline, mais justement de vous en détailler une infime partie.

L’art n’a pas de frontière ni de langage, il se vit et se ressent mais sa traduction n’est pas nécessaire dans l’appréhension d’une œuvre. En ce qui concerne sa compréhension, c’est une toute autre histoire. Je ne vais pas m’épancher sur des sujets philosophiques comme « qu’est-ce que l’Art ? » ou « comment comprendre l’Art ? », mais il est évident que le contexte modifie la perception des choses. Par exemple, la très célèbre œuvre Guernica de Pablo Picasso ne sera pas du tout comprise de la même manière, si le contexte de l’œuvre est exposé ou non, ou bien plus ou moins connu du « regardeur » en amont. C’est à ce moment que l’importance du travail du traducteur entre en ligne de compte. Faire en sorte que toute personne, qu’importe sa nationalité et ses connaissances antérieures, soit en mesure de comprendre.

Laissez-moi vous dresser le tableau : dimanche après-midi, jour d’automne, temps pluvieux et froid, vous vous baladez au musée, tout en faisant de votre mieux pour ne pas penser – plus facile à dire qu’à faire – à tous les projets de traduction qui vous attendent. Au cœur du musée, vous vous arrêtez pour lire un panneau explicatif sur les œuvres de Gustave Caillebotte. En vous prenant au jeu, vous continuez de lire et puis déformation professionnelle oblige, votre regard se perd sur les paragraphes en anglais, en italien, en espagnol et en allemand. Essayer de ne pas penser à la traduction ? Raté. Vous commencez à analyser le paragraphe anglais, puis ensuite ceux de vos autres langues de travail. Le résultat vous plaît, oui, non ? Je laisse votre imagination faire le reste, mais vous êtes arrivés à destination.

Au sein des expositions temporaires ou bien permanentes se cachent aussi des traductions qui attirent moins le regard. Il y existe une multitude de supports autres que les panneaux explicatifs à l’entrée des salles comme par exemple les cartels, mais si vous savez ce que c’est : les petites notices autour des œuvres permettant de connaître le nom de l’artiste, le titre de l’œuvre, les matériaux la composant, parfois ses dimensions, ainsi que sa provenance – à savoir le prêteur ; ces éléments composent le « cartel simple ». Ces fameux cartels détaillent aussi l’œuvre en elle-même parfois, par exemple comment le sculpteur a façonné sa statue en décrivant les techniques utilisées, la provenance historique de l’œuvre, le courant artistique ou des éléments descriptifs ; on nomme ce type d’informations le « cartel développé ». C’est pour cela que la traduction d’art se trouve à mi-chemin entre la traduction technique et la traduction créative. Bien sûr selon le cas, il peut s’agir d’une traduction entièrement technique ou que de transcréation, le mélange des deux domaines n’est certainement pas une obligation.

museum-398761_1920

Eve Bouzeret, cheffe de projets expositions temporaires au Centre des monuments nationaux à Paris depuis 4 ans, a accepté de bien vouloir nous en dire plus sur la création des expositions temporaires.

Dans le processus de création d’une exposition, quand la traduction des supports entre-t-elle en ligne de compte ?

« Nous avons une méthodologie de production pour les expositions temporaires, qui jalonne notre travail, que nous travaillions sur une exposition comme Godard-Picasso : collage(s) à l’abbaye de Montmajour (Arles) ou Victor Hugo, la Liberté au Panthéon, au Panthéon (Paris).

Dès le début de la phase de production du projet, avec le commissaire d’exposition et l’administrateur (directeur) du lieu accueillant l’exposition, nous décidons globalement des éléments de médiation que nous souhaitons mettre en œuvre. Pour faire simple, le texte est l’élément principal de médiation dans une exposition. En fonction du site et donc du type de visiteurs qui y viennent, ainsi que des visiteurs potentiels de l’exposition, nous choisissons le nombre de langues présentes dans le circuit de visite. Contrairement aux expositions permanentes, ou au circuit de visite dans l’ensemble du monument historique, qui sont pérennes, et peuvent bénéficier d’une traduction en une dizaine de langues, les expositions temporaires ne durent souvent que 3 mois en raison des normes internationales de conservation préventive des objets de collection et ont des surfaces restreintes. Ainsi, nous devons souvent nous limiter à des textes en 2, 3 ou 4 langues, sachant que les textes sur les cimaises (murs temporaires) ne seront qu’en français, parfois en anglais, mais très rarement traduits dans une troisième langue. De manière générale, les troisième et quatrième langue se trouvent sur des fiches de salle (document imprimé en petit format, avec lequel le visiteur peut se mouvoir dans l’exposition). L’audioguide multilingue existe pour les expositions temporaires au sein de très grands lieux parisiens mais nous avons rarement les moyens financiers d’en créer.

Enfin, dès que les textes sont rédigés et validés en français, nous pouvons les faire traduire. Cela prend du temps et est assez coûteux, il nous faut donc avoir la version définitive des textes avant de les transmettre aux traducteurs, surtout quand nous ne sommes pas capables de relire ensuite pour vérifier la traduction (il faut avoir un bon niveau pour relire 15 000 signes en langue étrangère et voir où se trouve les erreurs d’un traducteur professionnel, mis à part en anglais aucun d’entre nous ne maîtrise suffisamment d’autres langues). Cela peut d’ailleurs causer problèmes si le traducteur s’estime mal rémunéré, il effectuera son travail au plus vite et ne nous posera pas de questions, alors même que certaines notions sont très spécifiques, impliquant parfois des contre-sens. Avec le coordinateur de traduction, nous essayons donc d’anticiper quelques écueils, comme un lexique de certains termes ou des visuels des œuvres exposées, accompagnant ici les textes à traduire. »

Comment le CMN – Centre des monuments nationaux – choisit-il ses traducteurs ?

« Malheureusement, et contrairement à d’autres prestataires, notre service – le département des manifestations culturelles – n’est pas associé au choix des traducteurs. La traduction étant un domaine très vaste et qui sert pour l’ensemble des services du CMN ou presque, nous avons ce que l’on appelle un accord-cadre, puisque notre établissement public est soumis aux règles des marchés publics. Cet accord-cadre permet de sélectionner une entreprise (parfois il peut être multi-attributaire) de traduction avec laquelle nous aurons des prix fixes au mot selon la langue et les délais grâce à un BPU (bordereau de prix unitaire) à respecter pour la période donnée (généralement 3 à 4 ans). L’entreprise, après mise en concurrence ouverte à tous et sélection suivant des critères techniques et de prix, est notre seul interlocuteur. Nous communiquons par e-mail pour les demandes de devis respectant les prix du BPU pour chaque besoin de traduction. Nous demandons tout de même le CV du traducteur travaillant sur le projet mais nous n’échangeons qu’avec une unique personne, le coordinateur, qui est toujours le même. C’est très pratique, mais cela a aussi des limites. »

Que penses-tu de la traduction dans le domaine de l’art ?

« C’est essentiel car nous avons des visiteurs du monde entier, une partie des visiteurs parle anglais mais pas tous. Si nous proposons le français, l’anglais et l’espagnol (parfois avec des abstracts par manque de place) nous pouvons déjà transmettre des informations et du savoir, à une large part de la population mondiale, et donc de nos visiteurs. Les visiteurs étrangers, doivent aussi se sentir à l’aise dans nos monuments, afin de pouvoir se délecter des œuvres qui sont autour d’eux. Acquérir des informations au cours d’une exposition, et se sentir bien, car ces informations sont données dans une langue maîtrisée, sont des raisons qui peuvent pousser le visiteur à avoir envie de revenir ou bien l’inciter à visiter d’autres lieux du réseau CMN – composé de 100 sites sur toute la France. Néanmoins, la traduction dans le domaine de l’art est difficile car elle fait appel à de nombreuses disciplines : l’histoire de l’art en premier lieu mais renvoie aussi au domaine de la création, de la technique de fabrication, de l’histoire, de la géographie, des échanges géopolitiques, de la philosophie, de la philosophie de l’art, du sensible et des idées des artistes, qui sont parfois saugrenues. Le traducteur doit donc d’abord comprendre les nuances du texte en français, sinon il en découle une perte des niveaux de lecture et de sensibilité liés à la traduction. En général, nous trouvons que les traductions – en anglais tout du moins car nous les comprenons – sont trop littérales et simplistes, mais cela doit aussi venir de la commande initiale à travers l’accord-cadre et des faibles prix négociés. »

Quelles sont les difficultés des traducteurs qui ressortent sur les supports ?

« Si le traducteur n’a jamais fait d’histoire de l’art et ne fréquente pas les musées, c’est un problème majeur. Mais même avec cela, il y a aussi une question de recherches en amont de la traduction et aussi les échanges avec nous. Quand je relis les textes du commissaire d’exposition, j’ai souvent des remarques, quelques suggestions à apporter dans la forme et aussi des questions de fond car certaines idées me paraissent trop complexes pour les visiteurs, certaines phrases sont trop longues, des mots sont à définir, parfois je ne comprends pas moi-même la notion mentionnée. Dès lors, quand je n’ai aucune question du traducteur, je me dis soit qu’il est très très fort, soit qu’il y a un problème. Je trouve donc qu’il faudrait plus échanger, faire des lexiques des mots techniques pour chaque projet, faire des résumés de nos idées générales, outre les textes, afin que le traducteur puisse comprendre les idées principales à transmettre. Dans une exposition, 15 à 25 000 signes par langue sont présents, nous pouvons résumer les idées principales que nous voulons véritablement transmettre aux visiteurs en 1 500 signes, il s’agit du synopsis du projet en réalité. Il nous faudrait peut-être donner ce synopsis et la façon dont nous le matérialisons dans l’espace afin d’immerger le traducteur. En effet, une exposition temporaire n’est pas un livre, ce n’est pas un texte illustré de visuel mais un média à part entière composée d’œuvres d’art et/ou d’objets ethnographiques s’inscrivant dans un espace donné, magnifié par la scénographie et entouré d’expôts – œuvres et tout autre élément de médiation, jeux à manipuler, vidéos, textes, maquettes, etc. »

En effet, la traduction que ce soit pour les expositions temporaires ou pour tout autre domaine reprend les mêmes codes : traduire par rapport au public visé mais aussi adapter la traduction à l’usage prévu. Et comme toujours, un écart se creuse entre la théorie et la pratique. Le traducteur ne pourra pas visiter l’exposition puisque cette dernière est en cours de création, la clef de voûte est donc la communication entre les différentes parties afin de pouvoir saisir au mieux les enjeux et les utilisations de chacun des supports mais aussi appréhender les détails techniques. Néanmoins, des réunions générales entre le coordonnateur et les clients – chefs de projets expositions ici – pourraient permettre de mieux cerner les contraintes et attentes des deux parties. Mais la réalité c’est que le temps et l’argent définissent beaucoup de paramètres dans le secteur de la traduction, si ce n’est tous les paramètres, et que cela laisse peu de place pour modifier les procédures.

Pour ne pas vous donner le cafard, je vais conclure en vous disant que même si nous traducteurs ne pouvons pas modifier les façons de faire sur le marché, nous pouvons toujours essayer de les améliorer et que la traduction dans le secteur de l’art a encore de beaux de jours devant elle, tant le domaine est international, créatif et technique.

Sources :

Images :

Traduction automatique : les algorithmes ont-ils des préjugés ?

Par Estelle Peuvion, étudiante M2 TSM

traductionautomatique

Depuis plusieurs années, la traduction automatique connaît des avancées spectaculaires. La traduction neuronale s’impose de plus en plus face à la traduction statistique. Résultat : les moteurs de traduction machine sont capables de traiter de longues phrases, voire des textes complets, en respectant la grammaire, la syntaxe, et en conservant la cohérence terminologique. Certains moteurs de traduction automatique traduisent (presque) aussi bien que les traducteurs humains et de nombreuses entreprises n’hésitent plus à recourir à leurs services pour traduire leurs sites et leurs produits. Cependant, ces résultats remarquables connaissent leurs limites. En effet, les algorithmes sur lesquels reposent ces moteurs de traduction reproduisent en quelque sorte la manière de traduire des humains, mais ne risquent-ils pas de reproduire également nos aspects les plus négatifs ?

Reproduction des préjugés

La réponse est oui : les moteurs de traduction automatique reproduisent les préjugés (sexistes, racistes…) des humains. Cela a été démontré, et nous pouvons le vérifier par nous-même, en quelques clics seulement.

L’exemple le plus flagrant est celui des professions, notamment lorsque l’on traduit d’une langue qui n’a pas de genre lexical vers une langue qui en a. Les femmes sont communément associées aux professions artistiques, aux métiers de soins (infirmière, sage-femme…), au foyer, alors que les hommes sont associés aux professions scientifiques, politiques, et plus globalement aux postes « importants »: le moteur de traduction machine va, dans la majorité des cas, reproduire ces clichés.

Depuis plusieurs années, de nombreux internautes recensent les « dérapages » des moteurs de traduction automatique, et les exemples ne manquent pas. Sur Google Translate, incontournable de la traduction machine, il est facile de se retrouver face à des phrases reprenant des préjugés sexistes. En tapant « The engineer is from Germany », le logiciel nous propose automatiquement « L’ingénieur est allemand. » En revanche, lorsque l’on remplace engineer par nurse, nous obtenons « L’infirmière est allemande »…

Au-delà de ces observations simples, qui peuvent être formulées par n’importe qui, des scientifiques ont également étudié plus en profondeur ce phénomène et sont arrivés aux mêmes conclusions.

Des chercheurs des universités de Princeton et de Bath ont étudié la technologie GloVe, développée par l’université de Stanford, qui calcule les associations entre les mots. GloVe est entraîné à partir du corpus Common Crawl, qui regroupe plusieurs milliards de textes venant du web et est utilisé pour la traduction machine. Les chercheurs ont conclu que le programme GloVe associait très bien les mots, mais ils ont aussi remarqué des dérives racistes et sexistes : les personnes afro-américaines étaient associées à des mots bien plus négatifs que les personnes blanches, et les noms de femmes étaient liés à la famille, alors que les noms masculins étaient associés à la vie professionnelle.

À l’université de Washington, trois chercheurs ont étudié les préjugés sexistes dans la traduction machine (Evaluating Gender Bias in Machine Translation) et ont fait une découverte « amusante ». Ils ont constitué des phrases comprenant deux professions, une communément associée aux hommes et une associée aux femmes. Ils ont féminisé la profession masculine à l’aide d’un pronom ajouté plus loin dans la phrase, et ont laissé une ambiguïté quant à la profession féminine.

Par exemple, dans la phrase « The doctor asked the nurse to help her in the procedure », la profession de médecin a été féminisée grâce au pronom her, et la profession d’infirmier/infirmière est neutre. L’expérience avait deux objectifs : voir si doctor était bien féminisé, et voir si nurse était mis au masculin ou au féminin. Dans la majorité des cas, doctor était au masculin, nurse au féminin et le pronom her était traduit par un pronom féminin dans la langue cible, ce qui changeait le sens de la phrase !

Les chercheurs ont donc tenté d’ajouter un adjectif associé aux femmes au mot doctor, et dans ce cas, doctor était féminisé. Si nous reprenons l’exemple cité plus-haut et rajoutons l’adjectif pretty devant engineer, Google Translate nous propose « La jolie ingénieure est allemande ». En revanche, si l’on remplace pretty par courageous, l’ingénieur redevient un homme ! Conclusion : dans cette expérience, le cliché sexiste a été dépassé par l’ajout d’un autre cliché sexiste.

Comment expliquer ce phénomène ?

Pourquoi donc les moteurs de traduction automatique reproduisent-ils nos préjugés ? Les chercheurs ayant étudié cette problématique ont plusieurs réponses à nous offrir.

Les moteurs de traduction automatique sont basés sur des corpus parallèles et monolingues : des textes en langue cible et des traductions. Ces textes se comptent par millions voire par milliards pour certains moteurs de traduction, et ils proviennent du web dans la majorité des cas. Par conséquent, il est tout simplement impossible de contrôler chacun des textes composant le corpus : cela demanderait trop de main-d’œuvre et de temps. Voilà la première explication à notre problème : les données qui permettent aux moteurs de traduction automatique de nous proposer des traductions fluides, quasi-parfaites dans certains cas, proviennent du web. Ce sont des données que nous, humains, produisons, et nous produisons forcément des données affectées par nos préjugés, que nous le voulions ou non.

Prenons par exemple le corpus utilisé par le site de traduction Reverso Context : il contient des textes provenant de domaines différents, et notamment des sous-titres de films et de séries. Une particularité qui a amené le site à proposer début 2019 des résultats de traduction antisémites, racistes et sexistes. Le fondateur de l’outil s’est excusé et a expliqué que ces résultats pouvaient provenir de films et de séries, et qu’il était difficile de contrôler un corpus aussi conséquent.

De plus, la majorité des moteurs de traduction fonctionnent grâce au word embedding, une technique d’apprentissage automatique qui représente les mots ou phrases d’un texte par des vecteurs de nombres réels. La représentation vectorielle d’un mot représente son « contexte », c’est-à-dire les mots, expressions et phrases qui entourent le plus souvent ce mot.

Il est donc tout à fait logique que les moteurs de traduction reproduisent nos préjugés : ils utilisent nos textes, apprennent nos langues. Ils apprennent aussi les associations culturelles et historiques qui nous mènent à avoir ces préjugés.

La seconde explication se trouve entre les corpus et le processus de traduction en lui-même : les algorithmes. En effet, les concepteurs de ces algorithmes sont en majorité des hommes, blancs, il est donc possible qu’ils prêtent moins attention à la manière dont seront traitées certaines problématiques par l’algorithme.

Lutter contre les « préjugés » de la traduction automatique

Maintenant que nous connaissons l’origine de ce phénomène de reproduction des préjugés sexistes, nous pouvons réfléchir à des solutions.

Les entreprises ayant conçu les principaux moteurs de traduction automatique, et qui utilisent l’intelligence artificielle, se trouvent en première ligne de cette lutte. La majorité d’entre elles ont conscience du problème et ces dernières années, elles ont commencé à proposer des solutions.

Facebook a annoncé il y a quelques mois la création d’un outil servant à trouver les biais dans les algorithmes, « Fairness Flow ». L’outil sera normalement capable de déterminer si un algorithme reproduit les préjugés ; il est pour l’instant en développement.

Récemment, Google Translate a admis avoir proposé des traductions aux préjugés sexistes. Suite à cette annonce, le moteur de traduction prendra en compte le genre grammatical dans les traductions. En proposant un nom neutre en anglais, on peut obtenir deux traductions en français, le féminin et le masculin. Cependant, cette nouvelle fonctionnalité est pour l’instant restreinte à certaines langues et à un certain nombre de mots.

La modification de la langue pourrait également être une solution : par exemple, un pronom neutre a été introduit dans la langue suédoise. Néanmoins, ce genre de modification représente un vrai défi : comment inciter des locuteurs d’une langue à changer de manière radicale leur utilisation de la langue ? De plus, le remplacement des corpus actuels prendrait un temps considérable, et les effets ne seraient pas visibles immédiatement.

L’amélioration des corpus semble être un axe évident dans la résolution de ce problème. Trois chercheurs des universités de Dublin et d’Uppsala (Getting gender right in neural machine translation) ont mené une enquête et ont tenté d’atténuer la reproduction des préjugés sexistes dans la traduction automatique. Ils ont taggué le corpus utilisé par le moteur de traduction et y ont introduit des tags genrés, pour plusieurs paires de langues, aussi bien pour les accords que pour le style et le vocabulaire. Ils ont vu dans les traductions proposées des améliorations significatives, en particulier pour les accords. Cependant, ils ont noté un manque de cohérence dans certaines traductions.

Nous pouvons donc améliorer les corpus en changeant la façon dont nous les utilisons (grâce aux tags, par exemple), mais également en privilégiant les textes avec une écriture non-sexiste.

La diversification des équipes qui conçoivent les algorithmes représente également une idée de résolution du problème, afin qu’elles puissent plus facilement se rendre compte des préjugés reproduits par l’intelligence artificielle.

Enfin, la solution qui serait évidemment la plus efficace, serait que la société change et que tous nos préjugés disparaissent. Malheureusement, c’est un objectif difficile à atteindre, mais nous, traducteurs et traductrices, pouvons apporter notre pierre à l’édifice. Utiliser l’écriture inclusive (quand nous en avons la possibilité), encourager l’amélioration des moteurs de traduction automatique, prêter attention au vocabulaire que nous utilisons, voilà des pistes simples que nous sommes tous et toutes aptes à suivre.

 

Bibliographie :

Et pourquoi pas traduire la mode ?

Par William Brouilly, étudiant M2 TSM

traduirelamode

Il est difficile d’évaluer avec précision la valeur du secteur de la mode et du luxe dans le monde. Cependant, en France et d’après les statistiques établies par le gouvernement, ce dernier représente 150 milliards d’euros de chiffre d’affaires direct, soit plus que les secteurs de l’aéronautique et de la construction automobile réunis. Avec de tels chiffres, inutile de dire qu’il y a du travail, y compris pour les traducteurs. Dans ce billet de blog, je vais donc essayer de vous convaincre de traduire pour ce secteur riche en opportunités.

La mode : de nombreuses possibilités

Comme je l’ai déjà mentionné, le secteur de la mode est un marché très important qui se compose de nombreuses branches différentes. Cela signifie qu’il y a alors une large variété de sous-domaines, et donc de documents à traduire. Dans un article publié sur le blog de l’agence britannique Creative Translation, trois femmes nous expliquent qu’elles travaillent dans le domaine de l’édition et de la traduction spécialisée dans la mode, et que leurs métiers sont très variés. En effet, la première est auteure et traductrice pour l’édition chinoise du magazine ELLE, la deuxième est traductrice spécialisée dans les secteurs de la mode, du luxe et des cosmétiques, tandis que la dernière traduit dans le domaine du marketing de mode. Lucy Williams, traductrice pour Translator’s Studio, liste dans un article publié sur le site de l’agence les différents types de documents qu’il est possible de traduire. Bien que certains ne semblent pas toucher directement à l’univers de la mode (rapports annuels, contrats…), d’autres sont bel et bien en lien avec le secteur, comme par exemple les descriptions de produits, les articles de presse, les biographies et interviews ou encore les contenus marketing et publicitaires. Une chose est donc sûre, ce n’est pas le travail qui manque.

Comme l’explique Lucy Williams, la mode est un cycle. En effet, l’industrie de la mode est basée non pas sur quatre mais sur deux saisons : automne-hiver et printemps-été. Pour les femmes, les collections automne-hiver sont présentées en février/mars tandis que les collections printemps-été sont présentées en septembre/octobre. Cependant, les collections Homme et Haute Couture sont présentées à des dates différentes. Autrement dit, le secteur de la mode est une machine bien huilée qui ne cesse jamais de tourner. Et à chaque saison, les besoins de traduction se font ressentir : brochures de défilés, descriptions de produits, supports publicitaires, la liste est longue. Le secteur de la mode n’est donc pas simplement un secteur qui offre de l’emploi, il s’accompagne également d’une certaine stabilité.

La mode : un art ?

La mode au sens large du terme est considérée par tous les professionnels du secteur comme un art à part entière. Nos vêtements reflètent notre personnalité et certaines pièces crées par les grands couturiers sont de véritables chefs-d’œuvre qui sont plus destinés à être exposés dans des musées qu’à être portés. Dans un article publié dans la revue Traduire, la traductrice néerlandaise Percy Balemans nous raconte comment elle a traduit les textes d’une exposition dédiée au créateur Jean-Paul Gaultier. Au-delà du fait que cela lui a permis de découvrir de nombreuses choses sur le couturier, elle nous explique que ce projet a été « l’un des […] plus intéressants et les plus difficiles [qu’elle a] eu à mener à bien », elle qui était habituée à traduire des articles de blog ou des contenus marketing et web. Ce nouveau type de projets impliquait également de nouvelles contraintes, comme l’absence de supports visuels par exemple. En effet, comment traduire la description d’une pièce lorsque l’on ne sait pas à quoi elle ressemble (et que celle-ci se trouve dans un autre pays) ? Heureusement pour elle, Internet regorge de documentation sur Jean-Paul Gaultier, ce qui lui a permis de pallier le manque de supports visuels.

La mode est donc un art, et il convient de retransmettre ce côté artistique dans les textes qui en parlent, qu’il s’agisse de textes originaux ou de traductions. En fonction du type de document, une belle plume est exigée, et tandis que la description d’un produit sur le site internet d’une marque ne laisse pas toujours place aux envolées lyriques, la traduction d’un article de magazine ou d’un billet de blog, par exemple, nécessite une certaine prose. Dans son article, Lucy Williams révèle qu’elle a traduit la biographie d’un homme à la tête d’une entreprise fabriquant des vêtements de sport. Elle a donc dû adopter un ton plus littéraire, ton qui n’est pas toujours courant selon les domaines, voire même proscrit pour certains.

Toujours concernant l’aspect créatif de la traduction de mode, j’aimerais désormais parler d’une tâche parfois méconnue dans le domaine de traduction : la transcréation. Bien que les besoins en transcréations existent dans de nombreux domaines, elle est particulièrement demandée dans le secteur de la mode, notamment pour les contenus marketing et publicitaires. Comme l’a expliqué Pénélope Girod dans ce billet de blog, la créativité et l’imagination sont essentielles car il s’agit ici de vendre un produit, et une traduction littérale ne suffira pas. Il faut également localiser et adapter le message à la culture du marché cible, donnée qu’il est impératif de prendre en considération lors de la traduction de contenu marketing relatif à la mode car celle-ci se définit différemment d’un pays à l’autre.

La mode : un univers à part entière

Comme chaque industrie, le secteur de la mode possède ses propres spécificités. On pense notamment à la terminologie (comme le précise Percy Balemans avec le mot « caban »), une terminologie souvent truffée d’anglicismes. Alors que certains traducteurs les ont en horreur et font tout pour les éviter, il faut admettre qu’il peut s’avérer difficile de traduire une phrase dans laquelle un mot sur deux ne se traduit pas. Que faire donc lorsqu’il est question de traduire la description d’une tenue composée d’un crop top en jersey, un leggings en tweed et des escarpins nude (cascade vestimentaire donnée à titre d’exemple, ne pas reproduire chez soi) ? Eh bien, chers lecteurs, je vous annonce que le franglais sera ici de rigueur, ces termes ayant été conservés en anglais dans le vocabulaire de la mode. Si cela peut vous consoler, sachez que de nombreux mots français, tels que « maison », « atelier » ou encore « bustier », sont utilisés tels quels en anglais dans le jargon de la mode.

Une autre spécificité dont il faut tenir compte est la différence interculturelle. Il faudra donc adapter si besoin est à la culture du marché cible, comme cela a déjà été mentionné, mais pas seulement. Prenons un exemple au hasard : vous êtes un.e Américain.e en visite à Paris et souhaitez acheter un jean. Vous repérez un modèle qui vous plaît et demandez votre taille : 26. Mais pourquoi le vendeur vous regarde-t-il d’un air ébahi ? C’est parce que les tailles ne sont pas les mêmes d’un pays à un autre, et la taille américaine 26 correspond à une taille 34 en France. Ces différences n’existent pas uniquement pour les jeans mais bien pour tous les types de vêtements ainsi que pour les chaussures. Et comme si cela ne suffisait pas, pour certains types de vêtements, la conversion n’est pas la même entre un modèle femme et un modèle homme. Par ailleurs, certaines marques ne souhaitent pas convertir les tailles. Il faut alors demander au client s’il souhaite localiser les tailles en fonction du marché cible ou non.

 

Pour conclure, le secteur de la mode est un secteur riche en opportunités qui touche de nombreux domaines liés de loin comme de près à l’univers qui s’y rattache. J’espère vous avoir convaincu (ou au moins intéressé) et si la mode n’est pas votre tasse de thé mais que vous avez tout de même un penchant pour l’art, je vous invite à lire le billet de blog d’Angel Bouzeret qui sera publié d’ici deux semaines.

 

Bibliographie

L’anglais comme langue pivot

Par Angelina Fresnaye, étudiante M2 TSM

 

pivot language

En traduction, une langue pivot est une langue, artificielle ou naturelle, utilisée pour faire l’intermédiaire entre deux langues. Ainsi, pour traduire d’une langue A vers une langue B, on aura une première traduction de A vers la langue pivot, puis une seconde traduction de la langue pivot vers la langue B[1]. Comme il n’est pas toujours évident de trouver des traducteurs/trices pour toutes les combinaisons de langues possibles, cette technique peut permettre de pallier ce problème. La plupart du temps, de par son statut actuel, l’anglais est le choix de langue pivot le plus courant.

Au cours de mon stage, j’ai principalement travaillé avec ce procédé. L’agence, située en Flandre-Occidentale (Belgique), reçoit en grande partie des demandes de traduction du néerlandais vers d’autres langues, dont l’anglais et le français. C’est pourquoi l’on faisait d’abord traduire le document du néerlandais vers l’anglais, puis je me chargeais de traduire vers le français à partir de la traduction en anglais. Au fil des tâches qui m’ont été confiées, j’ai pu remarquer quelques problèmes récurrents avec ce passage par une langue pivot.

Dans quels cas passer par une langue pivot et quels sont les avantages ?

La traduction automatique statistique, basée sur des corpus bilingues, doit parfois faire appel à l’anglais comme langue pivot pour fournir ses résultats. En effet, puisque le nombre de ressources disponibles n’est pas égal d’une langue à l’autre (il se peut même qu’il n’existe pas de corpus parallèle pour certaines combinaisons), passer par une langue pivot permet de faire le lien entre deux langues qui ne possèdent pas encore, ou très peu, de corpus.

Par ailleurs, des organisations internationales telles que l’Union européenne ont également recours au système de langue pivot. En raison du grand nombre de langues à gérer, les combinaisons linguistiques se font excessivement nombreuses (552 pour l’Union européenne par exemple). Traduire à partir de toutes les langues sources vers toutes les langues cibles serait alors trop compliqué, car il faudrait faire appel à des traducteurs/trices pour chaque combinaison, ce qui n’est pas toujours possible. C’est pourquoi, depuis 2004, le Parlement européen a recours à ce système et choisit d’utiliser comme langue pivot l’anglais, le français ou encore l’allemand.

bilingual dictionaries

 

Dans le cas de traductions entre langues trop éloignées d’un point de vue linguistique (des langues qui ne feraient pas partie de la même famille, entre autres), l’utilisation d’une langue pivot peut s’avérer d’autant plus avantageuse : par exemple, une étude a démontré que pour une traduction de l’arabe vers le chinois, l’utilisation de l’anglais comme langue pivot donnait en réalité un meilleur résultat qu’une traduction dite « directe ». En effet, s’agissant de deux langues aux systèmes radicalement différents, l’anglais correspondrait à un « juste milieu » entre les deux, rendant le travail de traduction moins ardu.

Enfin, les ressources disponibles ne sont pas égales selon la combinaison de langues. Comme l’expliquait Oriane dans son billet de blog il y a quelques mois, les traducteurs/trices de langues moins communes doivent trouver des stratégies afin de résoudre leurs problèmes terminologiques, et cela peut passer par le choix d’une langue pivot, en général l’anglais. Par ailleurs, cette approche peut être utilisée pour constituer ou nourrir des mémoires de traduction ou des bases terminologiques pour ces langues qui manquent de ressources, voire n’en possèdent pas encore. De plus, pour certaines combinaisons linguistiques rares, il peut être particulièrement difficile de trouver des traducteurs/trices.

 

Quels sont les risques ?

Passer par une langue pivot a ses avantages, mais c’est également un procédé risqué. En effet, on estime souvent que la traduction est un « troisième code », à savoir une variété de langue différente de la langue standard. De ce fait, la langue traduite possède des caractéristiques qui lui sont propres et qui la distinguent de la langue originale.

Risques de pertes

Les références culturelles et expressions idiomatiques posent particulièrement problème aux traducteurs/trices, et ont donc plus de risques d’être omises lors du passage par la langue pivot. Par conséquent, s’il n’y a pas de relecture à partir du texte original, ces dernières seront perdues au moment de la traduction vers la langue cible.

ambiguities

 

Risques d’erreurs ou d’ambiguïtés

Le principal inconvénient du passage par une langue pivot relève de son potentiel impact sur la qualité de la traduction finale. En effet, le risque de faire des erreurs de traduction est d’autant plus élevé car une erreur ou une ambiguïté peut être retranscrite d’une combinaison de langues à l’autre par le biais de la langue pivot. Sans accès au texte original, le/la traducteur/trice risque alors de copier des erreurs ou des mauvaises interprétations qui auraient pu se glisser lors de la première phase de traduction. De même, en cas d’incohérence, il convient de se demander si l’erreur provient du texte source ou de la traduction pivot afin de savoir à qui s’adresser pour tenter de résoudre le problème : le client ou le/la traducteur/trice de la langue A vers la langue pivot.

Comment éviter ces problèmes ?

Dans la plupart des cas, les désavantages liés à l’utilisation d’une langue pivot pourraient en partie être évités grâce à l’accès au texte source, que le/la traducteur/trice comprenne la langue en question ou non. En effet, de manière générale, il reste possible de retrouver, entre autres, les noms propres ; et ce même si la langue source nous est totalement inconnue (pourvu que l’alphabet utilisé nous soit familier). Et si le/la traducteur/trice possède de vagues notions, il/elle peut parfois parvenir à discerner de potentielles erreurs. Enfin, l’idéal serait de faire appel à un·e réviseur/se qui comprend la langue source afin de vérifier qu’aucun glissement de sens n’a eu lieu lors du passage par la langue pivot.

 

Bibliographie

« Les traducteurs du Parlement européen » Parlement européen, http://www.europarl.europa.eu/about-parliament/files/organisation-and-rules/multilingualism/fr-ep_translators.pdf.

“Pivot Language.” Wikipedia, Wikimedia Foundation, 23 Jan. 2019, www.en.wikipedia.org/wiki/Pivot_language.

Briand, Oriane. « Ressources linguistiques : comment faire lorsqu’elles n’existent pas. » MasterTSM@Lille, 8 Apr. 2019, www.mastertsmlille.wordpress.com/2019/04/08/ressources-linguistiques-comment-faire-lorsquelles-nexistent-pas/.

Gammelgaard Woldersgaard, Casper. In search of the third code – A corpus-based study of the Motion category in natural and translated texts in Danish and Spanish. Aarhus University. Web. http://pure.au.dk/portal/files/85464275/Thesis_Proposal_Final_Casper_Woldersga.

Langfocus. “Why Did English Become the International Language?” Online video clip. Youtube. Youtube, 1 Oct. 2017. Web, https://www.youtube.com/watch?v=iqDFPU9YeQM.

Samiotou, Anna,. “Is the Pivot Language Approach Ever a Good Option? – Part I.” TAUS, 25 Aug. 2015, https://blog.taus.net/is-the-pivot-language-approach-ever-a-good-option-part-i.

Samiotou, Anna. “Is the Pivot Language Approach Ever a Good Option? – Part II.” TAUS, 2 Sept. 2015, https://blog.taus.net/is-the-pivot-language-approach-ever-a-good-option-part-ii.

Vermeulen, Anna. The impact of pivot translation on the quality of subtitling. Faculty of Translation Studies, Ghent (Belgium). Web.  https://biblio.ugent.be/publication/4211129/file/6843891.pdf;The.

[1] https://en.wikipedia.org/wiki/Pivot_language

Un emprunt peut en cacher un autre

Par Clément Surrans, étudiant M2 TSM

Que vous travailliez dans le domaine de la traduction ou non, vous avez forcément remarqué les nombreux mots que la langue française emprunte à l’anglais. Ils ont envahi notre quotidien, à tel point que certains sont véritablement ancrés dans notre vocabulaire. Je parle bien entendu des anglicismes. Ils semblent même être devenus indispensables. En effet, ces anglicismes viennent souvent définir des concepts nouveaux, nés dans les pays anglophones et diffusés encore plus facilement maintenant grâce aux réseaux sociaux. Ils permettent en général d’être plus concis que nos longues paraphrases. Ainsi, il est plus cout d’utiliser le terme manspreading plutôt que de dire « la tendance des hommes à écarter leurs jambes dans les transports en commun », ou que d’essayer de trouver une traduction littérale qui serait maladroite.

Les nouvelles technologies apportent également leur lot d’anglicismes : les tweet, les likes en sont un bon exemple. On semble aussi beaucoup les aimer dans le milieu professionnel. Lors de mon stage en entreprise, j’entendais régulièrement les expressions « tu peux me le forwarder », « demande de feedback » et j’en passe. Il existe une véritable tendance qui consiste à « américaniser » certains concepts. Dans le domaine de l’audiovisuel par exemple, on préfère parler de prime-time que des « heures de grande écoute ». On parle aussi beaucoup en ce moment de la French Tech pour désigner les start-ups françaises. L’anglais domine dans de nombreux domaines, et influence beaucoup notre langage.

Alors dans une ère où la tendance est aux anglicismes, certains puristes de la langue française et d’autres opposants à cette américanisation de notre langage font la guerre aux termes empruntés de l’anglais. Pourtant beaucoup ignorent que certains mots tirent leur origine… du français ! Eh oui, un terme emprunté peut en cacher un autre…

madeinfrance

 

Voici quelques exemples d’anglicismes bien français :

  • Budget :

Aujourd’hui utilisé dans le domaine financier pour désigner « les recettes et dépenses prévisionnelles pour l’exercice à venir », ce terme provient à l’origine du vieux français « bougette », nom donné à un petit sac servant de bourse, et qui ne cessait de bouger lorsqu’il était suspendu à la selle d’un cheval. Le mot est exporté en Angleterre, où il désigne dans un premier temps le sac du ministre des finances contenant les documents comptables, avant de prendre son sens actuel et de revenir en France.

  • Cash :

Le terme cash vient du mot « caisse », qui est originaire du terme latin capsa. Cela a donné des mots tels que « cassette » ou « capsule » en français, avant de devenir caisse.

  • Fashion :

L’anglais est fort présent dans le domaine de la mode. Qui n’a jamais entendu parler de la « Fashion week » ou des « fashionistas » ? Pourtant ce terme provient lui aussi de la langue française, à l’époque où tous les yeux étaient tournés vers la cour du roi de France, qui brillait par son élégance, la « façon » désignait ainsi le savoir-faire en matière de vêtement de luxe et l’art de se vêtir.

  • Denim

Pour rester dans le domaine de la mode, parlons de l’origine du denim. Il s’agit d’un tissu en coton servant à fabriquer les jeans. Son nom a été donné en référence à un autre tissu fait à base de laine et de soie, appelé « serge de Nîmes », et fabriqué à l’origine dans cette ville.

À noter que le bleu du tissu provenait d’une teinture italienne dite « blu di genova », ce qui a donné « bleu de Gênes » en français. De là est né le terme blue-jean.

  • Flirter :

Le terme flirt fait référence à une relation amoureuse dénuée de sentiments profonds. Il trouve son origine dans le verbe français « fleureter », devenu par la suite « fleurter », et qui provient de l’expression un peu désuète « conter fleurettes », qui signifiait courtiser. « Fleurettes » désigne ici un compliment d’amour, en référence aux petites fleurs.

  • Tennis :

Le tennis est un sport dérivé du fameux Jeu de Paume, né en France au Moyen Âge. Comme son nom l’indique, on y jouait à l’origine à la paume de la main. Le serveur avait l’habitude d’annoncer son service en criant à son adversaire « Tenez ! ». Alors quand le sport a été exporté en Angleterre, l’engagement a fini pas se faire en criant « Tennis ».  Le tennis est né en Angleterre environ quatre cents ans après le Jeu de Paume.

  • Bacon:

Je suppose que je n’ai pas besoin de définir ce qu’est le bacon, vous le connaissez tous. Mais saviez-vous que le bacon à l’origine vient du vieux français « bacon » qui était utilisé pour désigner la chair de porc, en particulier le porc salé ?

  • People :

Eh oui, ce terme est bien dérivé du mot français « peuple », ou en ancien français « pople ». Le sens a dérivé en revenant en France, ou l’anglicisme désigne désormais les personnalités célèbres.  En France on parle ainsi de « presse people ».

  • Marketing :

Ce terme est issu du français « marché », qui a donné market puis marketing. Cependant les puristes de la langue française lui préfèrent le terme de « mercatique ».

  • Toast :

Cette petite tartine de pain grillée doit son nom au verbe en ancien français « toster », ce qui signifiait « rôtir, griller ». La pratique de « porter un toast » est bien originaire de France, où à la base on l’appelait la « tostée ». Cette pratique s’est exportée en Angleterre avant de revenir en France.

  • Challenge :

En France, on utilisait le mot « chalenge » pour parler d’une fausse accusation, puis de litige. C’est en arrivant en Angleterre qu’il a pris le sens de « provocation, défi ».

 

Conclusion

La langue française a beaucoup été influencée au cours de l’histoire par l’anglais. Nous en sommes même aujourd’hui à décrier ce phénomène dû à la mondialisation et à la domination de l’anglais dans beaucoup de domaines professionnels mais aussi dans le domaine du loisir et des technologies. Mais avant de juger tous les anglicismes et de les rejeter catégoriquement, il peut être intéressant de s’intéresser à l’origine et à l’étymologie des mots. On pourrait découvrir qu’ils viennent en réalité d’une autre langue. Certains concepts ont beaucoup voyagé, et les langues ont eu beaucoup d’influence les unes sur les autres. C’est un aspect à prendre en compte lorsque l’on cherche à traduire certains anglicismes. Si vous voulez découvrir d’autres anglicismes originaires du français, je vous invite à regarder les liens ci-dessous qui m’ont aidé dans la rédaction de ce billet.

 

Liens

 

L’ethnocentrisme juridique : un loup parfois déguisé en agneau

Par Raphaël Bourdon, étudiant M2 TSM

 

« Personne ne le reconnut car tout le monde
croyait que c’était un mouton parmi d’autres
 »[1]

Ésope[2]

BilletBlogTSM_Louton

Introduction

Dans un précédent billet, nous avons démontré que la traduction juridique se trouve à la croisée des cultures juridiques et linguistiques ; que les disparités culturelles se voient amplifiées lorsque le bilinguisme s’accompagne d’un bijuridisme.[3] Il en appert deux éléments. En premier lieu, les références culturelles du traducteur l’exposent au danger de l’ethnocentrisme juridique, également dénommé « juricentrisme ».[4] Celui-ci peut se définir comme un processus inconscient consistant à traduire des termes et concepts juridiques sources en totale méconnaissance des termes et concepts juridiques cibles équivalents. Or, la « quête de l’équivalence » constitue la pierre angulaire de la traduction juridique.[5]

En second lieu, le danger de l’ethnocentrisme juridique est symptomatique de la dichotomie entre pays de droit civil et pays de common law, dans la mesure où ces deux familles juridiques présentent dans la majorité des cas une asymétrie culturelle prononcée. Toutefois, il n’est pas exclusif de cette dichotomie. Le présent billet de blog s’efforce de démontrer que l’ethnocentrisme juridique s’avère davantage insidieux lorsqu’il existe une proximité culturelle entre les systèmes juridiques sources et les systèmes juridiques cibles. Dans cette hypothèse, le « juricentrisme » s’apparente à un loup déguisé en agneau afin de tromper le berger-traducteur.

Dans la fable d’Ésope intitulée « Le loup déguisé en agneau », c’est par le plus grand des hasards que le berger parvient à déjouer la supercherie du loup. Toutefois, il est dangereux de s’en remettre à la chance pour repérer et pourfendre l’ethnocentrisme juridique. Dès lors, il convient d’étudier le modus operandi de celui-ci. En des termes concrets, il sera procédé d’une part à une analyse du profil des bergeries assaillies par le loup, et d’autre part à un inventaire des peaux dont se pare le canidé.

Le profil des bergeries assaillies

L’ethnocentrisme juridique privilégie les bergeries gardées par un berger dont la vigilance est endormie. Toutefois, peu lui chaut que le troupeau se compose de moutons appartenant à la même famille juridique ou à des familles juridiques différentes.

L’endormissement de la vigilance du berger

Le danger de l’ethnocentrisme juridique rôde davantage lorsque la vigilance du traducteur-berger s’endort. Le traducteur juridique, a minima averti, redouble naturellement de vigilance lorsqu’il doit transposer la culture juridique d’un système de common law dans la culture juridique d’un système de tradition romano-germanique, et vice versa. En effet, l’asymétrie culturelle entre ces systèmes est notoire. A contrario, la vigilance du traducteur juridique, même averti, s’endort inconsciemment lorsqu’il existe une proximité culturelle entre les systèmes juridiques à l’étude. Car moins les obstacles culturels sont visibles, plus le traducteur conçoit la traduction, lato sensu, selon les codes de sa propre culture. En somme, le risque d’ethnocentrisme juridique s’accroît paradoxalement en raison de la « zone de perméabilité »[6] juridique et linguistique entre des systèmes juridiques. Au demeurant, plus cette zone est étendue, plus le danger de l’ethnocentrisme juridique est insidieux. Pour un traducteur francophone de France, traduire un texte rédigé en langue allemande et portant sur le droit allemand se révèle intrinsèquement moins périlleux que la simple révision-relecture d’un texte rédigé en français de Belgique et portant sur le droit belge.

Bien que la proximité culturelle favorise, non sans paradoxe, l’ethnocentrisme juridique, il pourrait être argué que seule la terminologie, par opposition aux concepts, fluctue dans cette hypothèse. Néanmoins, il faudrait nuancer ce raisonnement. Certes, des systèmes juridiques culturellement proches trouvent leur assise dans la même pierre angulaire. Toutefois, les concepts juridiques naissent, évoluent et/ou disparaissent au fil du temps. Les développements suivants illustrent en filigrane de la démonstration principale les problématiques afférentes aux variations terminologiques, aux variations conceptuelles, ainsi qu’à l’influence du temps qui passe.

L’uniformité ou la diversité juridique des troupeaux

Au grand dam des bergers-traducteurs, l’ethnocentrisme juridique s’avère particulièrement vorace. Son appétit de loup le conduit à refermer sa mâchoire sur tous les troupeaux. Peu importe si ceux-ci se composent de moutons appartenant à une même famille juridique ou à des familles juridiques différentes. Car si la vigilance du traducteur s’endort en présence d’un troupeau caractérisé par l’uniformité juridique, le « juricentrisme » trompe de manière insidieuse la vigilance du traducteur confronté à des systèmes de common law et de tradition romano-germanique. Autrement dit, la diversité juridique des troupeaux ne constitue en aucun cas un garde-fou contre les crocs du loup, comme l’illustre la problématique de l’acquisition de la propriété animalière par accession.[7]

Certes, d’un point de vue formel, les droits anglais et français dénomment tous deux, nonobstant leur nature juridique distincte, ce phénomène d’acquisition de la propriété animalière « accession », tandis que le droit allemand ne lui accorde aucune dénomination particulière.[8] Toutefois, d’un point de vue matériel, le phénomène d’acquisition de la propriété des animaux par accession est similaire en droit allemand, en droit anglais et en droit français.[9] En outre, la consécration positive de ce phénomène remonte au droit romain, dont les droits positifs allemand, anglais et français sont les héritiers. À l’aulne de ces éléments, il paraîtrait raisonnable de conclure que le phénomène d’acquisition de la propriété animalière par accession existe en tant que tel dans les trois systèmes juridiques. Néanmoins, aussi douce soit-elle, cette conclusion est en réalité erronée. En droit allemand, il est péremptoire de désigner le phénomène similaire à l’accession animalière comme une « acquisition de la propriété des fruits de la chose par l’effet de la loi ».[10]

En somme, la diversité juridique des systèmes en présence trompe la vigilance du traducteur, car celui-ci ne s’attend pas à ce que l’ethnocentrisme juridique sévisse là où la traditionnelle asymétrie culturelle entre pays de droit civil et pays de common law n’a pas frappé. La proximité culturelle octroie davantage d’opportunités au loup avide de satisfaire sa faim. Elle lui met à disposition tout un éventail de peaux lui permettant de se fondre dans n’importe quel troupeau.

 

Inventaire des peaux portées par le loup

La proximité culturelle entre les systèmes juridiques s’apparente à une tannerie mettant à disposition tout un ensemble de peaux dont le loup peut se vêtir. Des peaux d’espèces voisines aux peaux de précédentes générations, le choix est large.

Peaux d’espèces voisines

L’ethnocentrisme juridique peut se déguiser en un agneau d’une espèce voisine. En matière d’acquisition de la propriété animalière par accession, la peau portée transcende la dichotomie entre systèmes de common law et systèmes de tradition romano-germanique, car elle présente des caractéristiques juridiques voisines de ces deux familles. Toutefois, il convient de souligner que cette transcendance relève de l’exception. Les espèces voisines concernées appartiennent en principe à la même famille juridique. À cet égard, les degrés de proximité entre espèces varient. Comme précédemment démontré, plus la proximité culturelle est étroite, plus il est aisé pour le loup de se fondre dans la masse du troupeau. En guise d’illustration, peuvent notamment être comparés les droits belge et français.

En premier lieu, l’ethnocentrisme juridique peut se dissimuler sous une peau arborant de simples dénominations. En tout état de cause, le Code de procédure pénale français doit pourtant être nominativement distingué du Code d’instruction criminelle belge. Par analogie, il importe de ne pas commettre d’amalgame entre le conseil de prud’hommes français et le tribunal du travail belge. De même, le bon père de famille consacré par le Code civil belge ne saurait se confondre avec la personne raisonnable du Code civil français.

En second lieu, l’ethnocentrisme juridique peut se dissimuler sous une peau consacrant divers concepts juridiques. Parmi ces concepts, figure inter alia la Justice de paix belge. La Justice de paix est une ancienne institution juridictionnelle française s’étant exportée en Belgique avec le Code Napoléon de 1804. Toutefois, son existence en droit français fut de facto tumultueuse. Créée en 1790, elle fut par la suite supprimée en 1958. En 2002, furent instituées les Juridictions de proximité, dont les fonctions s’apparentaient à celles du Juge de paix français d’antan et à celles du Juge de paix belge contemporain. Cependant, le 01er juillet 2017, ces Juridictions de proximité furent supprimées à leur tour. Leur compétence était de nouveau dévolue aux tribunaux d’instance. En vertu de trois décrets d’application en date du 30 août 2019, les tribunaux d’instance disparaîtront eux aussi de la scène juridictionnelle française au 01er janvier 2020 pour laisser place aux tribunaux judiciaires. Dès lors, le traducteur juridique francophone veillera à consacrer le concept institutionnel pertinent en tenant compte des évolutions juridictionnelles des systèmes à l’étude. À cet égard, l’aspect ratione temporis mérite un développement approfondi, car il constitue une faille dans laquelle l’ethnocentrisme juridique peut s’engouffrer pour occire les moutons.

Peaux de précédentes générations

L’ethnocentrisme juridique atteint son paroxysme lorsque la dimension temporelle est le seul élément de frontière entre la proximité culturelle et l’identité culturelle. Dans le présent billet, ce phénomène est dénommé « ethnocentrisme juridique temporel ». L’évolution institutionnelle de la Justice de paix en France illustre à merveille ce concept. Au demeurant, il convient de noter qu’une évolution d’ordre social prolongée par une évolution d’ordre juridique relève également du phénomène d’ethnocentrisme juridique temporel. Par exemple, en écho à la promotion de l’égalité entre les hommes et les femmes, la notion juridique de « bon père de famille » a disparu de l’univers juridique français au profit du caractère « raisonnable ».

Force est de constater que l’ethnocentrisme juridique temporel ne produit pas ses effets uniquement selon un axe temporel. La dimension strictement temporelle peut en effet conduire à des différenciations d’ordre matériel et d’ordre territorial, comme l’illustre l’instauration expérimentale des cours criminelles en droit français. Du 13 mai 2019 au 13 mai 2022, ces nouvelles juridictions en matière pénale n’ont compétence qu’en premier ressort et en matière de crimes passibles de 15-20 ans de réclusion. Leur compétence ratione materiae se trouve donc bornée. Durant cette période, elles n’exercent en outre leurs prérogatives que dans certains départements. Dès lors, l’évolution juridictionnelle est délimitée ratione loci. Enfin, en fonction de leur apport au système juridictionnel français, ces cours criminelles verront potentiellement leur existence prolongée et leurs compétences élargies. En conséquence, selon que le traducteur juridique considère les cours criminelles pendant ou postérieurement à la période triennale susmentionnée, les compétences ratione materiae et ratione loci de ces juridictions peuvent évoluer.

Aux fins d’obvier à l’ethnocentrisme juridique temporel, le traducteur juridique dispose en théorie d’une alternative à deux branches. En premier lieu, il peut songer à suivre l’évolution juridique de son propre système. Toutefois, la multiplicité des domaines et sous-domaines juridiques rend cette tâche particulièrement ardue, et ce, même si le principe de sécurité juridique a pour corollaire une évolution juridique à pas de loup. Dès lors, le traducteur juridique avisé pensera à se constituer un réseau de juristes au fait des évolutions juridiques des domaines intéressant ses traductions.

En second lieu, le traducteur juridique peut systématiquement vérifier l’équivalence terminologique et/ou conceptuelle ayant sa préférence. Néanmoins, cela se révélerait particulièrement chronophage et potentiellement superfétatoire. En conséquence, le traducteur juridique s’exposerait à une certaine lassitude. Celle-ci le conduirait à n’opérer de vérification qu’en cas de doute raisonnable, voire sérieux. Or, comme précédemment démontré, l’ethnocentrisme juridique s’avère éminemment insidieux. Somme toute, cette seconde branche ne paraît pas viable en matière d’ethnocentrisme juridique temporel, sauf à s’armer de courage.

 

Conclusion

L’ethnocentrisme juridique n’est pas l’apanage de la dichotomie entre pays de droit civil et pays de common law. Il s’avère davantage insidieux lorsqu’il existe une proximité culturelle étroite entre les systèmes à l’étude. En effet, soit la vigilance du berger-traducteur s’endort de manière inconsciente, soit celui-ci se fourvoie en raison de l’évolution historique et/ou de la transcendance des termes et concepts juridiques concernés.

Dans la fable d’Ésope intitulée «Le loup déguisé en agneau », c’est par le plus grand des hasards que le berger parvient à déjouer la supercherie du loup. Dans le monde réel, le traducteur juridique avisé prend soin de suivre l’évolution des systèmes juridiques concernés et/ou de vérifier de manière systématique ses équivalences conceptuelles et terminologiques. Certes, la tâche peut instiller un sentiment d’épouvante. Toutefois, « à vaincre sans péril, on triomphe sans gloire ».[11]

 

Bibliographie

Articles

Bourdon, Raphaël. « La Traduction juridique : À la croisée des cultures juridiques et linguistiques ». MasterTSM@Lille (blog), 19 février 2019. <https://mastertsmlille.wordpress.com/2019/02/19/la-traduction-juridique/comment-page-1/> (consulté le 02 octobre 2019)

Gémar, Jean-Claude. « De la traduction juridique à la jurilinguistique : la quête de l’équivalence ». Meta : Journal des traducteurs 60, no 3 (2015) : 476-493. <https://doi.org/10.7202/1036139ar> (consulté le 02 octobre 2019)

Monjean-Decaudin, Sylvie. « Territorialité et extraterritorialité de la traduction du droit ». Meta : Journal des traducteurs 55, n° 4 (2010) : 693-711. <https://doi.org/10.7202/045686ar> (consulté le 02 octobre 2019)

Mémoire

Bourdon, Raphaël. « Der Erwerb des Eigentums an Tieren: ein besonderes Recht für eine besondere Rechtsstellung ». Mémoire de Recherche Master ICP, Université de Lille, Universität des Saarlandes, University of Warwick, 2018. <https://www.slideshare.net/slideshow/embed_code/key/HC66QQTpZ6x5D2> (consulté le 02 octobre 2019)

 

Normes

Arrêté du 25 avril 2019 relatif à l’expérimentation de la cour criminelle
Code civil belge dans sa rédaction au 28 mars 2019
Code civil français dans sa rédaction au 21 juillet 2019
Code de l’organisation judiciaire français dans sa rédaction au 02 septembre 2019
Code judiciaire belge dans sa rédaction au 14 août 2019
Décret n° 2019-912 du 30 août 2019
Décret n° 2019-913 du 30 août 2019
Décret n° 2019-914 du 30 août 2019
Deutsches Bürgerliches Gesetzbuch (Code civil allemand) dans sa rédaction au 02 octobre 2019

Notes

[1] Extrait de la fable « Le loup déguisé en agneau », originellement écrite par Ésope. Cette fable apporte un éclairage quelque peu différent selon sa langue véhiculaire (ex., EN-FR). Toutefois, la version française de cette fable fera foi pour les besoins du présent billet.

[2] Né vers 620 avant J.-C. et mort vers 564 avant J.-C., Ésope le Phrygien aurait donné ses lettres de noblesse au genre littéraire de la fable.

[3] Raphaël Bourdon, « La Traduction juridique : À la croisée des cultures juridiques et linguistiques », MasterTSM@Lille (blog), 19 février 2019, <https://mastertsmlille.wordpress.com/2019/02/19/la-traduction-juridique/comment-page-1/> (consulté le 02 octobre 2019)

[4] Sylvie Monjean-Decaudin, « Territorialité et extraterritorialité de la traduction du droit », Meta : Journal des traducteurs 55, n° 4 (2010) : 704, <https://doi.org/10.7202/045686ar> (consulté le 02 octobre 2019)

[5] Jean-Claude Gémar, « De la traduction juridique à la jurilinguistique : la quête de l’équivalence », Meta : Journal des traducteurs 60, no 3 (2015) : 476, <https://doi.org/10.7202/1036139ar> (consulté le 02 octobre 2019)

[6] Monjean-Decaudin, Meta : Journal des traducteurs, 705

[7] À la lumière de l’article 546 du Code civil, l’accession est l’acquisition de la propriété des fruits et produits de la chose mère ou du résultat de la fusion de la chose principale avec des choses accessoires. En vertu de l’article 547 du Code civil, « le croît des animaux [appartient] au propriétaire par droit d’accession ».

[8] Raphaël Bourdon, « Der Erwerb des Eigentums an Tieren: ein besonderes Recht für eine besondere Rechtsstellung » (Mémoire de Recherche Master ICP, Université de Lille, Universität des Saarlandes, University of Warwick, 2018), 41, <https://www.slideshare.net/slideshow/embed_code/key/HC66QQTpZ6x5D2> (consulté le 02 octobre 2019)

[9] Ibid

[10] Traduction libre. Expression en langue allemande : « Gesetzlicher Erwerb des Eigentums an der Früchte der Muttersache». V. Ibid, 46

[11] Pierre Corneille, Le Cid, Acte II, Scène II