Comment les ordinateurs traduisent le langage humain ?

Marguerite Arnold
L
La Traduction Automatique (TA) est un champ à la croisée de la linguistique et de la technologie. En d'autres termes, il s'agit de logiciels aidant les ordinateurs à traduire et interpréter le langage humain. Bien que n'étant pas parfait, le domaine de la traduction automatique a récemment fait d'énormes avancées.

Dans un environnement des affaires et de la culture sans frontières, la traduction entre les langues est devenue un besoin urgent et continu – même pour les petites entreprises. La globalisation n’est pas la seule à pousser ce domaine, la numérisation le fait aussi. Le marché international de la traduction est énorme, à l’échelle mondiale. En 2017, il représentera un secteur pesant environ 34 millions de dollars. Mais la traduction est une tâche demandant beaucoup de temps. Même quand elle est réalisée par des humains, aucun résultat n’est exactement le même. Pourquoi ? Parce que les nuances culturelles sont abondantes. Et fréquemment, il n’y a pas une « bonne » façon de traduire quelque chose. L’interprétation est hautement subjective et contextuelle.
 
L'interprétation est hautement subjective et contextuelle.
 
Comme les ordinateurs ne peuvent pas interpréter le langage de la même façon que les humains le font, cela fait de la traduction automatique une tâche encore plus délicate. Les « langages » informatiques sont essentiellement composés de codes de commandes qui au final tournent autour d’une seule chose : une compréhension du monde binaire oui/non, marche/arrêt. Le langage informatique, en d’autres termes, n’est pas subjectif. L’Intelligence Artificielle, ou IA, est un domaine d’étude qui examine comment élargir cette fonctionnalité et la TA – Traduction Automatique – fait partie de la discussion. Voici tout le problème basique résumé en quelques mots. Les ordinateurs ne peuvent pas comprendre le contexte. Ils sont littéraux. Ce qui ouvre tout un éventail de problèmes, en particulier dans la traduction et la localisation. Ceci dit, de nouvelles avancées dans les algorithmes informatiques et l’intelligence artificielle sont en train de combler le fossé. Qu’y a-t-il de neuf dans le monde de la traduction automatique ?
 

 

QU’EST-CE QUE LA TRADUCTION AUTOMATIQUE ?

La traduction automatique est un champ de la linguistique qui utilise des logiciels pour interpréter et traduire fréquemment entre les langues. À un certain niveau, les traductions sont en réalité très simples. Un chien est un chien, dans toutes les langues. Cependant, ce que fait le chien, ou comment agit le chien est une toute autre affaire. La TA ne peut pas forcément distinguer le contexte culturel ou local de la langue. Ses interprétations de phrases et d’idiomes, par exemple, sont en résultat très aléatoires. Il est déjà suffisamment difficile pour un humain d’interpréter la langue de l’autre. Quand les ordinateurs entrent en jeu, ceci entraîne une conversation numérique encore plus complexe.
Les logiciels de TA professionnels proposent généralement des personnalisations par profession. Ils ont également tendance à essayer d’améliorer le rendu en limitant l’étendue des données en entrée. Donc, par exemple, quand les entrées à base de formules sont plus élevées, la TA fonctionne mieux. Il y a moins d’ambiguïtés. De plus, la TA s’est fortement améliorée depuis les années 1950, quand elle est devenue pour la première fois un sujet d’intérêt scientifique. Il existe toujours des personnes pour affirmer que l’intelligence artificielle ne pourra jamais rivaliser avec le cerveau humain et donc que la TA ne pourra jamais égaler de « vrais humains » pour la compréhension du sens. De récents développements semblent tracer la direction d’une voie médiane.
 
De récents développements semblent tracer la direction d'une voie médiane.
 

DE NOUVEAUX ALGORITHMES LINGUISTIQUES CHANGENT LA DONNE

Malgré tous les détracteurs, le domaine continue de s’étendre et de développer de nouveaux outils. Par exemple, des chercheurs de l’Université de Liverpool ont introduit un outil révolutionnaire l’année dernière. Les chercheurs ont développé un ensemble d’algorithmes pouvant aider les ordinateurs à contextualiser le discours. En d’autres termes, les algorithmes permettront aux ordinateurs d’agir de la même façon que le ferait un humain. Ces algorithmes vont analyser le mot puis aider l’ordinateur à deviner ce qui devrait apparaître à la suite. Les chercheurs sont alors capables de noter et de comparer l’action des algorithmes. Jusqu’ici, les résultats ont été extrêmement intéressants, si ce n’est encourageants.
 

IMPLICATIONS

Dans le futur, les ordinateurs seront plus aptes à traduire, résumer et contextualiser le langage. Même si la technologie n’est clairement pas encore au point, elle continue de progresser. Mais savoir si elle progressera un jour suffisamment pour rivaliser avec la vision d’un humain reste encore mis en doute.