Le chalenge de la traduction

Très intéressant comparatif des traducteurs en ligne publié par Numérama: DeepL : on a mis à l’épreuve le traducteur de Linguee qui promet de ridiculiser Google Trad

Il faut aussi lire les commentaires qui sont très complémentaires de l'article (on se croirait 10 ans en arrières, quand les gens réfléchissaient avant de réagir ;) )

Les médiocres traductions altèrent la langue

Il y a quelques temps j'avais lu un autre passionnant article sur le sujet dont je ne retrouve pas le lien qui disait en substance, que Google trad créait des néologismes de tournure dans les autres langues que l'anglais au sein des jeunes. En effet, l'énorme lacune de Google trad est que sa référence pour toute les langues est l'anglais, donc lorsque l'on traduit un texte français en italien, il est analysé (ou traduit) avec une grille de lecture anglophone, puis ensuite traduit dans la langue de destination. Or le français et l'italien partagent des racines communes qui sont effacées par ce processus, et Google trad parle un italien anglicisé que les enseignants italiens se plaignent d'entendre dans les cours d'école.

Ce qui est intéressant avec DeepL et surtout Linguee, c'est que les grilles d'analyse des textes à traduire sont fait à partir de textes déjà existants et déjà traduits par des humains. La traduction peut donc s'appuyer sur des expressions ou des tournures de phrase réelles et s'affranchir du mot à mot pour des phrases entières.

Pourquoi ne pas simplifier certains écrits pour les traduires facilement

Il y a quelques années, je présentais une conférence sur les enjeux du numérique dans le champs politique et j'avais imaginé d'inventer une langue administrative simplifiée avec un traitement de texte contraignant, restreignant le vocabulaire des documents administratifs, afin de permettre une traduction instantanée dans toutes les langues européennes.

Ce projet techniquement réalisable il y a 10 ans, pourrait encore plus facilement être réalisé aujourd'hui: le logiciel dans lequel vous créez le document textuel, essaierait de traduire immédiatement vos écrits et s'il n'y arrive pas vous impose de reformuler vos propos dans un langage qu'il est capable de comprendre et donc de traduire. Il pourrait y avoir des suggestions de tournures qui favorisent la traduction. Avec un appauvrissement de la langue administrative, on faciliterait la vie des citoyens. Car, si on peut traduire un texte, il devient facile également de le lire[1], ce qui rend le document accessibles aux personnes en situation de handicap (problème de lecture, hospitalisation...), ou qui ne peuvent pas lire le document (travailleur sur un chantier, conducteur...).

Et le sens

Un autre enjeux important est le sens des textes. Aujourd'hui, les textes sont indexés par les mots qu'ils contiennent dans les moteurs de recherche. Mais une succession de mots ne suffit pas pour analyser un texte. Il existe des outils qui essaient de doner un sens aux textes pour la machine. Par exemple, lorsque l'on fait une citation d'un autre auteur dans un texte, comment dire à la machine que ce morceau de texte est lié à un auteur autre que celui du texte courant, et permettre de faire un lien vers la source de la citation, voir même vers l'auteur. C'est tout l'enjeu du web sémantique.

Donner du sens au texte (pour la machine) permet également d'améliorer la traduction des textes et d'en enrichir la contextualisation.

Ces enjeux de la traduction vont bien au delà simplement des langues étrangères, puisque c'est aussi l'avenir des outils de demain que nous utiliserons pour filtrer le web et y trouver les informations dont nous avons besoin... sauf si nous décidons que ce sont les GAFA qui choisissent les données que nous devons lire, mais c'est un autre sujet.

Note

[1] Il parait que 20% des américains utilise la synthèse vocale avec leur smartphone.

Partager Partager ce billet sur les réseaux sociaux

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet