Search
  • Article de fond
  • Apprentissage automatique, apprentissage biologique

Vision artificielle et ordinateurs : Entretien avec David Fleet

by CIFAR juin 3 / 13

Les systèmes de vision artificielle permettent aux ordinateurs d’interpréter les images et les vidéos avec une efficacité croissante. Ils recèlent d’énormes possibilités qui pourraient changer notre vie au quotidien dans de nombreux domaines, notamment : surveillance, véhicules autonomes et navigation dans de vastes quantités d’information.

E7_walking-Man2
Image d’un système de vision artificielle. Image : David Fleet

Le Boursier principal David Fleet du programme Apprentissage automatique, apprentissage biologique (anciennement connu sous le nom ‘Calcul neuronal et perception adaptative révolutionne’) de l’ICRA fera une allocution à un petit déjeuner-causerie à Toronto qui traitera des percées récentes en intelligence artificielle. Le Dr Fleet s’est entretenu récemment avec le bulletin Échange de l’ICRA sur son domaine de recherche.

Q. Comment les ordinateurs reconnaissent-ils les images?

Depuis des décennies, on considère la reconnaissance d’images comme un problème incroyablement difficile à résoudre. Dans les dix dernières années, les chercheurs ont reconnu qu’il existe trois propriétés d’apparence (parfois appelées caractéristiques visuelles) propres à un objet ou à un type d’objets. Nous comprenons maintenant comment les ordinateurs peuvent identifier ces caractéristiques et, en retour, détecter de nombreux types d’objets dans des images. Même si les progrès sont encourageants, nous avons encore beaucoup de chemin à faire.

Q. Pourquoi l’apprentissage automatique est-il si important pour la vision?

Pour découvrir des caractéristiques d’images utiles, nous avons principalement fait appel à de nouveaux algorithmes qui permettent de trier des quantités massives de données – des millions d’images. Nous découvrons qu’en vision artificielle, ainsi que dans d’autres domaines de la perception artificielle, plus il y a de données, meilleur est le rendement.

Q. Comment pouvons-nous mieux comprendre le fonctionnement du cerveau humain en apprenant à un ordinateur à voir?

La science doit avoir des hypothèses à mettre à l’essai. En ce qui concerne la vision, nous n’avons pas encore d’hypothèses de travail, c’est-à-dire, des modèles compétents aptes à « voir » d’une façon ou d’une autre, mais en rien comme un humain. La conception d’ordinateurs doués de vision est une des façons de comprendre comment construire des théories sur la façon dont un organisme pourrait voir. Des psychologues et des neuroscientifiques peuvent ensuite explorer ces théories. Pour cette raison, travailler à la frontière du génie et de la neuroscience se révèle un exercice fascinant.

Q. Selon vous, quelle sera l’incidence de la perception artificielle sur la vie quotidienne des gens à l’avenir?

Chaque fois qu’il vous est utile de voir, il pourrait être utile d’avoir le concours d’un ordinateur. Il pourrait s’agir, par exemple, d’une voiture qui se conduit toute seule, ou de machines, de robots ou de jouets capables de sentir et de comprendre leur environnement. La vision est remarquablement puissante et généralisée – une fois qu’on saura créer des machines douées du sens de la vision, celles-ci seront omniprésentes. Et c’est déjà commencé – caméras qui repèrent des visages, jeux vidéos intelligents, systèmes visuels pour détecter des gens à risque de noyade dans une piscine, aide à la conduite en voiture, etc.

Q. Comment le programme Apprentissage automatique, apprentissage biologique de l’ICRA a-t-il contribué aux percées dans le domaine?

Le programme Apprentissage automatique, apprentissage biologique de l’ICRA a mis l’accent sur plusieurs problèmes clés en apprentissage automatique et en perception artificielle. Entre autres choses, il s’agit de comprendre comment faire pour que des modèles computationnels appelés réseaux neuronaux profonds apprennent correctement. Métaphoriquement, les réseaux neuronaux profonds ont une structure qui ressemble grossièrement à celle du cerveau avec des couches d’unités de traitement (cellules) composées de détecteurs, et de mécanismes sophistiqués de perception, de cognition et d’action. Le programme tente avant tout de comprendre comment assurer la formation de telles structures (apprentissage). Nous avons récemment obtenu des résultats incroyables sur de grands ensembles de données qui vont maintenant changer la donne, non seulement dans les laboratoires de recherche, mais aussi pour des produits comme la recherche Google basée sur l’image.