Search
  • Nouvelles
  • L'intelligence artificielle

Entraîner l’IA à raisonner

by Krista Davidson mars 11 / 20
Pierre-Luc Bacon

Le titulaire de la chaire en IA Facebook-CIFAR Pierre-Luc Bacon découvre une approche révolutionnaire qui permettrait aux machines de raisonner et de prendre des décisions de façon autonome.  

Les dispositifs médicaux tels que les stimulateurs cardiaques et les pompes à insuline ont sauvé des millions de vies, mais malgré de nombreuses avancées technologiques, leur capacité à s’adapter en temps réel aux besoins changeants de l’organisme est limitée.

L’intelligence artificielle (IA) pourrait révolutionner ces dispositifs et d’autres appareils en leur permettant de prévoir les besoins du patient et de s’y adapter sans intervention humaine. 

Des dispositifs médicaux en mesure de prévoir le traitement approprié pour les patients pourraient voir le jour grâce à une percée de Pierre-Luc Bacon dans la conception des algorithmes permettant de prendre des décisions en temps réel.

Pierre-Luc Bacon, titulaire de la chaire en IA Facebook-CIFAR affiliée à Mila, a proposé la toute première méthode permettant de découvrir des actions à longue portée dans le temps, également connues sous le nom d’options, qui pourrait véritablement s’adapter à des problèmes d’envergure. Cette technique, appelée architecture « option-critic », permet aux systèmes de simplifier et d’optimiser les décisions afin d’atteindre un objectif final. Elle permet à un système de découvrir la meilleure façon d’effectuer les tâches.

En utilisant cette méthode, les chercheurs étaient en mesure de garantir qu’un algorithme pouvait fournir les résultats escomptés sans intervention humaine, tout en continuant à apprendre et à s’adapter aux différentes situations.

Au cours des sept dernières années, Pierre-Luc Bacon s’est intéressé à l’apprentissage par renforcement, plus particulièrement dans le domaine des actions temporellement abstraites, qui permet aux systèmes de prévoir à partir d’abstractions temporelles et d’établir leurs propres objectifs afin d’apprendre continuellement et efficacement par eux-mêmes. Ils le font à un niveau élevé de raisonnement tout en prenant de petites décisions.

Il se sert du métro pour illustrer le principe des abstractions temporelles. « Le métro vous emmène où vous souhaitez aller en seulement quelques arrêts. Cependant, si vous conduisez une voiture, vous rencontrerez des dizaines de petits obstacles et de complications dans la rue qui influencent vos décisions. Avec le métro, le problème est beaucoup plus simple à prévoir, et il est plus facile de prendre des décisions qui vous aideront à atteindre votre objectif », dit-il.

Ses travaux dans le domaine lui ont valu le prix du meilleur article d’un étudiant à la 32e conférence annuelle sur l’intelligence artificielle AAAI. « C’était la première fois que nous réussissions à trouver un moyen de découvrir des abstractions temporelles sans avoir à les préciser à l’avance. C’est quelque chose que nous n’avons pas réussi à faire au cours des 20 dernières années. C’était la première fois que nous étions en mesure de proposer une solution », mentionne-t-il. 

C’est un problème complexe, car les chercheurs essaient de développer des systèmes de prise de décision sans savoir à l’avance quelles sont ces bonnes décisions. 

« Plutôt que de déterminer si une action doit prendre le pas sur une autre, nous devons définir une fonction de récompense qui indique si une action est souhaitable ou non dans le présent », explique-t-il.

Un autre défi consiste à développer des algorithmes qui nécessitent peu ou moins d’interactions avec leur environnement.

« Les algorithmes développent de bons réflexes avec la répétition, mais ils ont encore de la difficulté à apprendre et à raisonner dans de nouvelles situations. Pour cela, nous avons besoin de systèmes capables de comprendre le fonctionnement du monde qui les entoure et de prévoir les conséquences de leurs actions », précise le chercheur.

Cette approche pourrait être utile pour une série d’applications, qu’il s’agisse de programmer et de personnaliser les stimulateurs cardiaques et les pompes à insuline en fonction des besoins des patients, d’améliorer la fluidité et le contrôle des mouvements des prothèses, voire de développer la conduite autonome. 

Titulaire de la chaire en IA Facebook-CIFAR, Pierre-Luc Bacon a occupé son premier poste de professeur au Canada en tant que professeur adjoint au département d’informatique et de recherche opérationnelle (DIRO) de l’Université de Montréal.  Il a obtenu son doctorat à l’Université de McGill et a travaillé au Stanford AI for Human Impact Lab, étudiant l’apprentissage sur de longs horizons ainsi que les abstractions « off-politic » et temporelles. 

Son objectif est de concevoir des systèmes robustes, fiables et intuitifs. 

« Il y a beaucoup de travail à faire pour rapprocher nos systèmes des gens, pour les rendre plus robustes et dignes de confiance, mais il est passionnant de constater que nous n’avons pas encore tout résolu. »



Le programme de chaires en IA Canada-CIFAR constitue le programme clé de la Stratégie pancanadienne en matière d’IA du CIFAR. Au total, 86,5 millions de dollars sur cinq ans ont été attribués à ce programme qui a pour objectif de recruter et de maintenir en poste au Canada certains des plus grands chercheurs en IA du monde. Les chaires en IA Canada-CIFAR qui ont été annoncées à ce jour poursuivent des recherches dans une variété de domaines, dont les applications de l’apprentissage automatique en santé, les véhicules autonomes, les réseaux neuronaux artificiels et le changement climatique.