Traduire sans trahir : quand l’IA s’en mêle

Partagez l'article

Maths・Ingénierie

Traduire sans trahir : quand l’IA s’en mêle

traduire ia

Le développement croissant des réseaux neuronaux et de l’intelligence artificielle (IA) a bouleversé le processus de traduction automatique. Si les progrès sont fulgurants, annoncent-ils pour autant la disparition des traducteurs humains ?

Cet article fait partie du dossier

LANGAGES

Lire le dossier

Par Paul Périé, journaliste.

 

« Malheur aux faiseurs de traductions littérales, qui en traduisant chaque parole énervent le sens ! C’est bien là qu’on peut dire que la lettre tue, et que l’esprit vivifie »

écrivait Voltaire, dans ses Lettre philosophiques.

 

En utilisant des logiciels de traduction en ligne comme Google Trad, DeepL (Linguee) ou Reverso, qui ne s’est jamais retrouvé devant des phrases sans logique où le sens avait laissé place à l’empilement de mots. Pourtant, tout le monde utilise régulièrement ces outils pour avoir une compréhension globale d’un article ou pour formuler correctement un mail qu’il faut envoyer rapidement à un contact étranger. Mais que se cache-t-il vraiment derrière ces applications et comment fonctionnent-elles ?

Matière vivante qui a évolué au fil des avancées technologiques propres au développement des civilisations, la traduction a joué un rôle essentiel dans la diffusion des savoirs, qu’ils soient scientifiques, culturels ou technologiques. Avec la découverte de l’imprimerie et la multiplication des livres, puis des lecteurs, de nombreux ouvrages sont devenus accessibles. C’est le cas notamment des textes religieux, à l’image de la Bible, sans doute l’un des ouvrages les plus traduits de l’histoire. Le travail acharné de Jean-François Champollion pour décrypter la Pierre de Rosette a, de son côté, permis de comprendre la langue écrite des Égyptiens. Depuis plusieurs années, c’est le développement du traitement automatique des langues (TAL) qui a considérablement influencé la manière d’aborder le travail de traduction.

 

Le TAL, outil perfectible de liaison entre la machine et l’humain.

C’est justement le domaine de recherche de Philippe Muller, enseignant-chercheur à l’Université Toulouse III - Paul Sabatier et chercheur à l’IRIT. « Le TAL a énormément d’applications. Il a fait beaucoup de progrès depuis une dizaine d’années, même au niveau professionnel », explique-t-il avant de détailler. « Je travaille davantage sur la compréhension de textes et l’analyse de conversations. » Pour améliorer les capacités des algorithmes, il utilise par exemple des articles de journaux en anglais et essaye de leur faire déterminer le bord politique du média à l’aide de différents indices allant du vocabulaire employé à des choses plus subtiles comme la construction de l’argumentation. « Le traitement automatique des langues est également mobilisé dans la construction des chatbots, qui se développent rapidement. Il sert aussi aux entreprises, qui ont besoin d’analyser des sources documentaires, et des collègues travaillent à améliorer le fact-checking par exemple », complète-t-il. Pour Philippe Muller, alors que l’interaction homme machine est encore loin d’être fluide, le TAL est un instrument de médiation entre les humains, qui ce soit pour les outils de traduction automatique par exemple ou pour aider à retranscrire une réunion grâce au résumé de conversation.

 

Des outils numériques désormais incontournables

Ces avancées ont été rendues possibles, d’abord grâce à l’apprentissage automatique, puis plus récemment par l’essor des réseaux neuronaux et du deep learning (apprentissage profond) mais le chercheur met en garde sur les limites qui existent encore. Si l’intelligence artificielle a montré son intérêt dans de nombreux domaines, plusieurs aspects restent problématiques. « Le grand public ne se rend pas compte de ce qui est réellement possible », regrette-t-il, soulignant par exemple le côté mécanique du générateur de texte GPT3, de la société OpenIA d’Elon Musk. « Il n’y a aucune compréhension derrière ce modèle », insiste Philippe Muller. Il pointe par ailleurs le fait qu’il est parfois impossible d’expliquer ou de justifier la décision d’un modèle compliqué. « On ne connait pas le cheminement de l’algorithme pour arriver à la réponse. Mais pour les grands acteurs comme les Gafam ou les producteurs d’IA, ce n’est pas la priorité », alerte-t-il.

Quoi qu’il en soit, en matière de traduction, le recours aux ressources numériques est de plus en plus important, constate Amélie Josselin-Leray, enseignante-chercheuse au département Traduction, interprétation et médiation linguistique de l’Université Toulouse – Jean Jaurès, qui travaille sur les outils d’aide à la traduction et sur leur utilisation par les traducteurs, qu’il s’agisse des dictionnaires, papiers ou électroniques, des corpus électroniques, de la traduction assistée par ordinateur (TAO) ou de la traduction automatique.

« Depuis une vingtaine d’années, il y a une assimilation des outils de TAO, qui sont de véritables mémoires de traduction, en gardant en référence des traductions passées », précise la chercheuse du laboratoire Cognition, langues, langage, ergonomie (CLLE). Selon elle, dans le cadre de traductions techniques ou spécialisées, cela permet de ne pas perdre de temps à retraduire. « Ces traductions passées peuvent être partagées. C’est devenu le quotidien pour les professionnels. »

 

Outil limité ? TAL est la question

Mais la chercheuse va plus loin. Pour Amélie Josselin-Leray, avec l’essor de la traduction automatique neuronale (TAN), beaucoup de traducteurs consacrent désormais une grande partie de leur travail à de la post-édition. « La traduction automatique neuronale fonctionne très bien dans certains domaines, techniques notamment », explique-t-elle, prenant l’exemple des brevets.

Des propos appuyés par Philippe Muller, pour qui cette technologie, qui s’appuie sur les réseaux neuronaux profonds, est « fiable jusqu’à un certain point. Dès qu’il y a peu de ressources textuelles, avec des langues sous-représentées par exemple, ça coince. » La traduction automatique permet ainsi d’avoir différents niveaux de qualité, selon les besoins, mais il ne croit pas vraiment à la possibilité d’une traduction littéraire. Par ailleurs, comme le traitement automatique des langues s’appuie sur de l’apprentissage, le chercheur membre d’ANITI fait remarquer que les résultats sont très dépendants de ce qui a servi à l’entraînement.

« Cela peut refléter les biais naturels de la société, comme les biais sexistes. Pour la traduction du mot anglais nurse, il va traduire infirmière, alors qu’il n’y a pas de genre en anglais. Beaucoup de personnes travaillent sur le choix des textes utilisés pour les entraînement, afin de ne pas reproduire les biais du passé. »

précise Philippe Muller.

D’autres limites existent encore avant d’arriver à un résultat satisfaisant dans tous les domaines. Pour compléter le point de vue de Philippe Muller sur la traduction littéraire, Amélie Josselin-Leray voit davantage dans ces outils « une source d’inspiration supplémentaire et potentiellement de créativité pour le traducteur ». En clair, les propositions de la machine, bien que pas totalement pertinentes, offrent d’autres pistes de réflexion. La prise en compte du contexte, historique, social ou autre, existe dans le cadre de la traduction automatique neuronale, « mais de manière indirecte », selon elle. « Les moteurs de TA n’analysent pas le texte comme un tout cohérent au niveau du sens, mais on peut désormais en personnaliser certains en fonction du domaine. »

La chercheuse du CLLE, qui s’intéresse particulièrement au processus de traduction, a vu la perception de ces outils évoluer chez les professionnels de la traduction. Au départ réticents, ils ont assimilé les outils de traduction appliquée par ordinateur puis ceux de la traduction automatique neuronale. Leur travail a donc été fortement affecté, comme elle l’explique en prenant l’exemple des traducteurs de la Commission européenne, avec qui elle travaille. « Ils reçoivent des textes déjà passés par des logiciels de TAO et de TAN. La machine fournit des propositions, soit en se basant sur des traductions existantes dont elle note le degré de similarité avec le texte à traduire et le traducteur contrôle le rendu et l’ajuste », précise-t-elle. L’institution européenne a d’ailleurs développé son propre moteur de traduction, adapté aux types de texte sur lesquels elle travaille.

 

Le travail des professionnels de plus en plus pointu

Le travail des professionnels de la traduction est-il donc plus simple que par le passé ? Pas forcément, assure Amélie Josselin-Leray. « Avec la TAO, la traduction est très segmentée au niveau de la phrase. Le traducteur doit en revanche rendre un texte qui présente une certaine cohésion. Quant à la TAN, elle donne des résultats étonnants, en termes de qualité. Mais c’est un piège pour celui qui ne maîtrise pas la langue source. Les erreurs de traduction sont plus difficiles à identifier. » Les risques sont donc grands de ne pas détecter des contre-sens, ce qui peut avoir des conséquences importantes. C’est notamment le cas lorsqu’il y a des enjeux de santé, avec la forte diffusion de textes sur le Covid en ce moment par exemple. Le travail des traducteurs est donc peut-être encore plus pointu aujourd’hui.

Devant cette nouvelle réalité et l’importance des outils d’intelligence artificielle dans la traduction, il est donc essentiel de former les futurs professionnels aux nouvelles techniques. « Cela a eu un énorme impact sur la formation ces dernières années », assure la chercheuse, qui est coresponsable du master Traduction-interprétation et médiation linguistique de l’Université Toulouse - Jean Jaurès. « Il y a des cours de post-édition mais aussi de pré-édition pour formater les textes aux logiciels, dont on sait qu’ils vont être traduits par la machine, afin d’essayer de diminuer les pièges pour la machine. » Car, bien que particulièrement performante, la TAN ne peut pas encore rivaliser avec le cerveau humain. Les ambiguïtés syntaxiques ou sémantiques, les références culturelles demeurent difficiles pour les réseaux neuronaux.

« L’interdisciplinarité est très utile dans les études de traduction. L’IA a beaucoup apporté mais il y a aussi un vrai apport de la psychologie ergonomique et cognitive, dont les techniques d’oculométrie* par exemple, pour essayer d’entrer dans la tête du traducteur »

conclut Amélie Josselin-Leray.

 

*L’enregistrement du mouvement des yeux peut aider à mieux comprendre le processus de traduction chez les professionnels.

IRIT : Institut de recherche en informatique de Toulouse - CNRS, Toulouse INP, Université Toulouse 1 Capitole, Université Toulouse - Jean Jaurès, Université Toulouse III - Paul Sabatier.

CLLE : Laboratoire Cognition, Langues, Langage, Ergonomie (Université Toulouse - Jean Jaurès, Université Bordeaux Montaigne, CNRS, UMR 5263).