J’ai testé pour vous : des correcteurs orthographiques

Par Marie Boussignac, ancienne étudiante TSM.

Durant les six derniers mois, j’ai effectué un stage dans une agence de traduction dans laquelle j’ai beaucoup travaillé sur l’assurance qualité des traductions. Parmi l’arsenal d’outils à ma disposition, le contrôle d’orthographe de MS Word est peut-être celui que j’ai utilisé le plus fréquemment, étant donné que chaque traduction dont je maîtrisais la langue devait être contrôlée par cet outil avant livraison.

Au moment d’écrire mon rapport de stage, c’est donc tout naturellement que je me suis penchée sur les différents outils en matière de correction orthographique qui existent. J’avais en effet dans l’idée que quelque chose d’aussi important et d’utilisé que la correction automatique de l’orthographe et de la grammaire méritait d’être étudiée de plus près. J’ai donc réalisé un comparatif de différents outils en les testant sur des traductions spécialisées réelles d’environ 15 000 mots chacune (une en anglais, une en français) que j’avais eu à contrôler pendant mon stage, en comparant à la fois les fautes que les outils détectaient, mais aussi le temps que durait le contrôle, l’ergonomie de l’outil, son prix…

Le paradoxe du contrôle d’orthographe

Une orthographe et une grammaire irréprochables sont une exigence de base dans le milieu de la traduction. La correction de la langue est l’un des premiers critères de jugement du client lorsqu’il évalue la qualité de la traduction, surtout s’il ne connaît pas la langue source. C’est un signe de sérieux de l’entreprise et du traducteur, de son attention aux détails, de son souci de la finition (avec tout ce que cela a d’arbitraire).

Le correcteur automatique est donc un compagnon de travail indispensable du traducteur et du chef de projet. Dans le monde de la traduction professionnelle, chaque ligne de traduction écrite est vérifiée, souvent plusieurs fois, avant d’être livrée au client, à l’aide d’un correcteur orthographique et grammatical.

On pourrait penser qu’avec une place aussi importante, le choix et les réglages de cet outil seraient particulièrement réfléchis. Or, on se rend compte que bien souvent on utilise l’outil par défaut de son traitement de texte ou de son outil de TAO, simplement parce qu’on ne s’est pas posé la question de son efficacité ni des différents choix possibles dans ce domaine. C’est le moment de se pencher sur ce grand invisible de la qualité de la traduction !

La correction automatique de la langue : où en est-on ?

À l’heure actuelle, les outils de contrôle d’orthographe et de grammaire sont capables de détecter pratiquement toutes les fautes d’orthographe dont la forme fautive n’existe pas dans la langue du texte à contrôler. Ils fonctionnent sur la base de dictionnaires, c’est-à-dire de listes de mots enregistrés auxquelles ils comparent le texte à contrôler. L’utilisateur peut la plupart du temps rajouter des mots à ces listes ou en créer de nouvelles, par exemple pour des termes d’un domaine particulier.

Cependant, la capacité à détecter un mot mis pour un autre (un « se » transformé en « ce » par exemple), les problèmes de sens ou les accords restent des situations dans lesquelles un dictionnaire n’a aucune utilité. C’est pourquoi la recherche s’est concentrée sur ce problème ces dernières années, en rendant les correcteurs « sensibles au contexte » selon une méthode statistique. L’idée est d’analyser des corpus très importants afin d’apprendre à reconnaître le contexte habituel d’utilisation des mots grâce à un algorithme dédié. L’outil devient ainsi capable de proposer une correction pour un mot en fonction des mots qui l’entourent. Par exemple, il saura détecter un problème dans l’expression « porc fluvial » ou « grand fille » car il est très rare que ces mots se retrouvent côte à côte. Il s’agit là d’un progrès conséquent même si ce système a ses limites, notamment en cas d’utilisation de colocations peu fréquentes.

En parallèle, de nombreux correcteurs ont développé un système de règles pour contrôler la grammaire, avec plus ou moins de succès : les correcteurs ont souvent de grandes difficultés à analyser la grammaire globale de la phrase et donc peinent à trouver des accords lointains. Il leur arrive souvent de détecter des éléments qu’ils analysent comme fautifs alors qui ne le sont pas (les « faux positifs ») ou au contraire de ne pas détecter des fautes présentes (les « faux négatifs »).

De plus, l’efficacité de ces outils varie selon la langue contrôlée. Pour l’anglais, ils sont assez performants, autant grâce au nombre de formes limité que peuvent prendre les mots dans cette langue qu’au poids économique qu’elle représente. La situation est déjà moins bonne en français, où les différentes formes d’un mot sont légion (conjugaisons par exemple), et encore plus mauvaise dans des langues à déclinaison comme l’allemand, qui de plus possède un système de composition peu compatible avec une vérification à l’aide d’un dictionnaire.

Les différents outils sur le marché

Il existe sur le marché un grand nombre d’outils pour contrôler l’orthographe et la grammaire d’un texte. Parmi eux, de nombreux outils en ligne sont apparus ces dernières années, le plus connu étant certainement celui de Reverso (http://www.reverso.net/orthographe/correcteur-francais/). Ces outils posent les mêmes problèmes de confidentialité que les outils de traduction automatique en ligne tels que Google Translate, sans parler de leur manque d’ergonomie. Je ne m’étendrai donc pas sur ce sujet. À noter que la plupart des logiciels hors ligne gratuits ou payants possèdent aussi ce genre d’application en ligne, dans le but de permettre au client potentiel de tester l’outil avant de le télécharger.

Un certain nombre d’outils hors ligne ont aussi été développés. Parmi les outils payants, on peut citer Cordial et Antidote pour le français, et Ginger et Grammarly pour l’anglais. Ils basent en général leur stratégie commerciale sur le fait que, plus qu’un correcteur d’orthographe et de grammaire, ils sont de véritables outils d’aide à la rédaction, avec dictionnaires intégrés, conseils sur le niveau de langue à employer selon le type de texte… Personnellement, je suis assez sceptique sur l’utilité de ce genre de fonctionnalité pour le traducteur étant donné qu’elles ont été développées en général pour des personnes dont la rédaction technique n’est pas le métier.

Il existe aussi des outils gratuits. Certains sont des logiciels libres tels que Hunspell, d’autres sont des outils intégrés aux traitements de texte comme le correcteur de la suite Office. Voici un tableau récapitulant les outils que j’ai testés pour mon rapport et que je vais présenter dans cet article :

Nom de l’outil Site Web Langues contrôlées Compatibilité / Intégration[1] Prix
Cordial 21 (Pro)
http://www.cordial.fr/
Français + 70 langues Intégration à MS Office 199 € la licence définitive
Antidote 9
http://www.antidote.info/
Français + Anglais Intégration à MS Office, Illustrator, InDesign. pluggin pour intégration à Studio 119 € la première langue + 59 € la seconde (réductions licence multiposte) licence définitive
Ginger (Basic)
http://www.gingersoftware.com/fr
Anglais Intégration à MS Office 73,44 $ par an (réductions achat plusieurs licences)
Grammarly (version premium)
https://www.grammarly.com/premium
Anglais Intégration à MS Word uniquement 139,95 $ par an, 700 $ par an pour 10 licences, 1 000 $ pour 20 licences
Hunspell
https://hunspell.github.io/
De nombreux dictionnaires. InDesign, SDL Trados Studio 2015 Gratuit
Correcteur de MS Office
https://products.office.com/fr-fr/home
92 MS Office, SDL Trados Studio Gratuit

[1] Je me suis concentrée sur les logiciels utilisés dans l’agence où j’ai effectué mon stage. Je ne fais pas de publicité pour SDL, Adobe ou Microsoft !

 

Cordial

Cordial est l’un des deux principaux logiciels payants d’aide à la rédaction en français. Il propose deux produits différents, Cordial Référence et Cordial Pro. Cordial Pro est présenté comme plus efficace dans la détection des fautes que son homologue. Il propose une correction orthographique et grammaticale du français et du portugais, ainsi qu’une correction uniquement orthographique de 70 autres langues.

L’outil s’intègre dans MS Office. Il n’existe pas d’intégration dans SDL Trados Studio 2015 à ma connaissance.

La technologie employée par Cordial, d’après son site Web, pour l’amélioration de son logiciel consiste entre autres à analyser le corpus formé par les textes analysés par l’outil gratuit en ligne de Synapse, l’éditeur de Cordial, cordial-engine, afin de détecter les types d’erreurs les plus fréquentes commises par les utilisateurs.

cordial

L’outil possède une interface assez semblable à celle du correcteur de MS Office, en légèrement plus complexe, le temps d’adaptation est donc très court. Il n’existe pas d’équivalent à l’option « oui pour tous » ou de « non pour tous », l’outil décide en effet seul de propager la correction à d’autres cas dans le texte (ce qui peut présenter un risque). L’outil propose deux vues différentes : une vue « phrase à phrase » qui présente toutes les erreurs d’une phrase à la fois, et une vue erreur par erreur.

Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
13 100 4 242 23 min

Antidote

Antidote est l’un des principaux outils du marché du correcteur orthographique et grammatical payant pour le français. Il possède aussi un module pour l’anglais depuis la version 9, vendu séparément, dont malheureusement je ne dispose pas et que je n’ai pas pu tester. Il s’intègre dans les outils de la suite Office, mais aussi dans certains logiciels d’Adobe, comme InDesign. Un plugin d’intégration à SDL Trados Studio vient de sortir il y a quelques semaines. Il est disponible à cette adresse : http://appstore.sdl.com/fr/app/antidote-verifier/583/. Un article du blog multifarious écrit par Paul Filkin lui est consacré (https://multifarious.filkin.com/2016/09/08/antidote/).

antidote

L’outil sépare sa détection en plusieurs catégories : Linguistique et Typographie. Parmi les catégories de Linguistique, il fait la distinction entre les « Erreurs » (ce qu’il considère comme des erreurs de grammaire ou d’orthographe), les incohérences (dans la graphie de certains mots en admettant plusieurs, comme événement / évènement), les mots inconnus (avec leur nombre d’occurrences dans le texte), les ruptures (c’est-à-dire les endroits où le logiciel est incapable de faire la liaison grammaticale entre les mots situés avant et après), et enfin les alertes (ce qui peut éventuellement poser problème).

L’interface est un peu plus complexe à utiliser que celle des autres outils présentés ici, mais reste assez claire. Les erreurs sont affichées à droite, et il suffit de cliquer dessus pour qu’elles apparaissent dans le texte. Les erreurs récurrentes sont regroupées (il s’agit du chiffre en face de certaines erreurs, comme « odds »). Il est aussi possible d’utiliser les symboles situés sur le ruban en haut afin de naviguer entre les erreurs, mais la méthode la plus efficace consiste à ne cliquer que sur les erreurs sur lesquelles on souhaite plus de précisions. Les termes dans une autre langue, tout comme les abréviations, se trouvent dans la catégorie « mots inconnus », ce qui permet une réelle lisibilité des éléments détectés et accélère véritablement le processus de vérification.

Le principal point négatif est le fait que l’outil « aspire » le texte à contrôler depuis le logiciel du fichier ouvert, ce qui supprime tout contexte dans l’interface de détection. Il faut donc faire le va-et-vient avec le logiciel qui affiche le fichier à contrôler pour avoir un aperçu du contexte le cas échéant.

Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
13 100 5 404 18 min

Ginger

Ginger est l’un des principaux produits du marché de l’aide à la rédaction en anglais. Il existe aussi deux versions différentes du logiciel, une version Basic et une version Premium, mais l’outil de correction grammaticale et orthographique est le même. L’outil ne s’intègre que dans MS Word.

ginger

L’interface de l’outil est très simple : un bouton s’affiche au milieu par-dessus le bandeau de MS Word. Il suffit de cliquer dessus pour lancer la correction. Puis l’outil scanne le texte phrase par phrase et propose une correction aux erreurs qu’il détecte. La simplicité de cette interface possède quelques inconvénients : il est impossible de n’accepter qu’une seule modification lorsque plusieurs sont proposées dans la même phrase ; il est aussi impossible de modifier soi-même le texte dans l’interface de l’outil si l’on souhaite modifier le texte autrement que comme proposé par l’outil. Mais le principal point négatif de l’outil reste sa lenteur : l’outil relit réellement le texte phrase par phrase sans « sauter » d’une erreur à l’autre comme les autres outils.

Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
15 500 7 304 48 min

Grammarly

Tout comme Ginger, Grammarly est un outil d’aide à la rédaction en anglais, et propose aussi deux versions différentes : une version gratuite et une version premium. L’outil de correction orthographique / grammaticale est présenté comme plus performant en version premium. L’outil ne s’intègre lui aussi que dans MS Word.

grammarly

Comme pour Antidote, les erreurs sont classées en plusieurs catégories (contextual spelling, grammar, punctuation, sentence structure et style). L’interface est très claire et très similaire à celle de MS Word. Les erreurs sont présentées à droite le long du texte, il suffit de cliquer dessus pour en apprendre davantage et pour visualiser le mot exact auquel elles se rapportent (qui est souligné dans le texte). Il est facile d’ignorer les erreurs récurrentes, ce qui diminue de beaucoup le temps nécessaire au contrôle.

Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
15 500 7 488 14 min

Hunspell

Hunspell est un projet de correcteur uniquement orthographique (sans dimension grammaticale) libre, sensible au contexte. Il s’agit de l’outil intégré par défaut dans SDL Trados Studio et c’est aussi l’outil de base des suites LibreOffice et OpenOffice. Dans ces suites, il peut être complété par LanguageTool, qui apporte une correction grammaticale. Il n’est pas vraiment limité en termes de nombre de langues couvertes ; certains dictionnaires (pour la plupart issus de ceux de MySpell, un autre correcteur orthographique libre) sont de meilleure qualité que d’autres, et les corpus analysés pour la sensibilité au contexte sont plus importants dans certaines langues que dans d’autres, où ils peuvent être totalement absents.

verifortho

L’interface est celle par défaut du correcteur d’orthographe de Studio, et ressemble beaucoup aux anciennes versions du correcteur de MS Word. L’outil ne nécessite donc pas de temps d’adaptation particulier. Je n’ai pas testé LanguageTool pour mon rapport (étant donné qu’il n’était question d’utiliser Hunspell que dans Studio), il m’est donc assez compliqué d’émettre un jugement sur les performances de ce couple de logiciels.

Texte Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
Anglais 15 500 0 605 22 min
Français 13 100 1 402 15 min

Correcteur de MS Office

L’outil intégré à MS Office peut être utilisé dans SDL Trados Studio à partir du moment où MS Office est installé sur le même ordinateur. Par défaut, l’outil possède un module de contrôle orthographique sensible au contexte ainsi qu’un module pour la grammaire et la ponctuation, mais ce dernier n’est disponible que sous Word. Les langues couvertes sont très nombreuses (92), mais le module de grammaire n’existe pas dans toutes les langues, et les dictionnaires peuvent varier en qualité, tout comme la taille des corpus analysés pour la sensibilité au contexte.

Voici l’interface du correcteur dans Word 2013 :

grammaire

Texte Nombre de mots total Nombre d’erreurs réelles détectées Nombre de faux positifs Durée du contrôle
Anglais 15 500 2 470 18 min
Français 13 100 1 618 22 min

Pour conclure

En manipulant les outils pendant les tests pour mon rapport, plusieurs points importants se sont dégagés :

  • les outils payants présentés ici semblent globalement plus efficaces que les outils gratuits. Il est assez complexe d’évaluer le retour sur investissement pour ce genre d’outils, à chacun de se faire une idée de si « ça vaut le coup » ;
  • l’ergonomie de l’interface influe beaucoup sur le temps passé sur le contrôle, peut-être même plus que le nombre de « faux positifs » détectés par l’outil. Une interface dans laquelle on peut naviguer librement comme celle d’Antidote et de Grammarly associée à un système de tri des erreurs détectées en différentes catégories permet d’aller beaucoup plus vite, mais aussi d’être plus précis dans le contrôle (possibilité de revenir en arrière, meilleure visualisation des erreurs) d’autant que la prise en main du logiciel, un peu plus complexe, reste tout de même très accessible ;
  • bien que les fautes de grammaire soient globalement les moins fréquentes chez les traducteurs, ce sont aussi les moins bien détectées par les logiciels de correction orthographique et grammaticale. Il peut être intéressant de maximiser l’utilisation d’un correcteur automatique de la grammaire, notamment grâce au plug-in Studio MSWord Grammar Checker (http://appstore.sdl.com/fr/app/msword-grammar-checker/392/). En effet, par défaut, seule l’orthographe est contrôlée dans Studio ;
  • quel que soit l’outil utilisé, il est important de bien le connaître et de le régler à ses besoins. Par exemple, par défaut, l’emploi d’une tournure passive est systématiquement signalé en anglais par le correcteur de MS Word. Or, dans les textes techniques, le passif est extrêmement répandu et ne pose pas de problèmes particuliers. Désactiver cette détection permet d’éliminer de nombreux « faux positifs » et donc de gagner du temps ;
  • il peut être avantageux de créer ou de télécharger des dictionnaires spécialisés adaptés aux domaines traduits, quel que soit l’outil utilisé. Cela permet non seulement de diminuer le nombre de « faux positifs » mais aussi d’éviter de passer à côté d’une erreur de typographie sur un terme pendant le contrôle. Microsoft édite des dictionnaires de ce type (https://www.microsoft.com/fr-fr/download/details.aspx?id=23729) mais il en existe aussi qui ont été créés par des spécialistes du domaine concerné (http://plasserre.developpez.com/dico.htm pour le domaine médical par exemple).

J’espère que cet article donnera envie à chacun de se pencher sur cet outil de notre quotidien trop souvent sous-estimé.

Publicités

3 réflexions sur “J’ai testé pour vous : des correcteurs orthographiques

  1. Bonjour,

    Mentionnons peut-être également l’existence de ProLexis, un poids lourd du secteur, dont l’intérêt réside dans le faible nombre de faux positifs, la rapidité d’analyse ou encore la gestion typographique inégalée, notamment dans InDesign…

    J'aime

  2. Bonjour,

    Juste une petite précision pour le tableau comparatif, il existe également une version à 99€ de Cordial 21: la version Référence, qui possède exactement le même niveau de correction que la Pro. La principale différence entre les deux versions réside dans les outils supplémentaires de la pro, tels que la détection des répétitions, la correction multilingues, etc.

    Bonne journée

    Aimé par 1 personne

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s