Search
  • Nouvelles
  • Apprentissage automatique, apprentissage biologique

Des percées dans le domaine des réseaux neuronaux améliorent la traduction automatique

by Lindsay Jolivet avr. 29 / 15

advances-machine-translation-1280x430
Des avancées en traduction automatique à laquelle on associe les réseaux neuronaux ont amélioré notre capacité à traduire des mots et des phrases entre de nombreuses langues. Les chercheurs disent que leurs techniques surpasseront sous peu des outils comme Google Translate.

La traduction automatique traditionnelle entraîne les ordinateurs avec des exemples appariés de texte dans les deux langues et les ordinateurs se souviennent ainsi de la façon dont un mot ou une courte phrase dans une langue se traduit dans une autre. Ces éléments plus courts peuvent alors être combinés pour former des phrases complètes. Cette approche fonctionne raisonnablement bien si les paires de formation sont en nombre suffisant, mais elle ignore toute signification sous-jacente.

Cela fait environ deux décennies que les chercheurs améliorent cette technique traditionnelle, mais ils ont fait appel récemment à une nouvelle approche qui utilise les réseaux neuronaux récurrents.

La technique requiert un codeur et un décodeur. Le codeur lit un mot ou une phrase qu’il transforme par calcul en une série de chiffres qui représentent le sens. Deux phrases différentes, mais à la même signification, seraient représentées presque de la même façon, et des phrases dans deux langues différentes qui veulent dire la même chose seraient aussi représentées avec un ensemble de chiffres très similaires.

« Vous pourriez imaginer une espèce de lingua franca intermédiaire, mais à la base, il n’y a pas de mots, mais des vecteurs », dit Yoshua Bengio (Université de Montréal), Boursier principal de l’ICRA.

Quand on lui donne une représentation de sens, le codeur extrait les chiffres et produit une séquence de mots dans une autre langue. Si vous traduisez de l’anglais au français, le système utilise d’abord le codeur anglais pour faire la conversion à la langue commune numérique et ensuite le codeur français pour produire la traduction.

En parallèle avec des collègues chez Google qui travaillent aussi sur les réseaux récursifs pour la traduction automatique, Bengio et ses collègues ont récemment réalisé une série d’articles sur les améliorations apportées à cette technique, y compris une percée récente qui a permis de régler le problème associé à la traduction de longues phrases en incorporant la capacité de prêter attention à un élément à la fois.

« Disons que je vous demande de traduire une page complète d’une langue à une autre, vous n’allez pas essayer de comprendre la page entière dans votre tête pour ensuite la traduire d’un coup », dit-il. « Après avoir lu le texte d’origine en français, quand vous vous mettez à traduire le texte vers l’anglais, vous repassez les segments nécessaires du texte en français pour guider la traduction au fil de votre travail. »

Bengio et son équipe ont aussi collaboré avec leur collègue Richard Zemel (Université de Toronto), Boursier principal de l’ICRA, pour incorporer le principe d’attention à un modèle de génération de légendes d’images à partir de zéro.

L’amélioration de la traduction permet aux scientifiques d’étudier l’un des grands défis de l’intelligence artificielle – la compréhension du langage naturel. « Cette tâche requiert la compréhension sémantique », dit Bengio. « Il faut vraiment comprendre quelle était l’intention de la personne. »

Il s’agit aussi d’une façon de faire évoluer les applications des réseaux neuronaux qui ont déjà considérablement amélioré la reconnaissance d’image et de la voix. Selon Bengio, les résultats concluants de leurs modèles viennent contredire une thèse de longue date au sein de la communauté de l’intelligence artificielle selon laquelle ces modèles ne pourraient jamais arriver à élucider la signification linguistique.

« Il y a quelques décennies, les spécialistes de l’intelligence artificielle trouvaient qu’il était ridicule de croire que les réseaux neuronaux pourraient faire de la traduction automatique correctement », ajoute-t-il. Mais en fait, leurs modèles se comparent aux meilleures méthodes existantes et s’améliorent rapidement.

« Il ne fait presque aucun doute que d’ici un an nous dépasserons substantiellement l’état de la technique actuelle. »