Search
  • Nouvelles
  • Apprentissage automatique, apprentissage biologique

Une machine apprend à lire, à écrire et à inventer des caractères manuscrits tout comme un humain

by Lindsay Jolivet déc. 16 / 15

Handwritten-characters-ruslan-salakhutdinov-1280x430

Un nouveau modèle informatique apprend à reconnaître et à créer des caractères manuscrits aussi bien qu’un humain, et peut même inventer de nouveaux caractères qui confondent l’œil humain par leur justesse.

Le modèle a appris à reconnaître 1600 types de caractères manuscrits dans cinquante alphabets, y compris le latin, le grec et le sanscrit. Pour le mettre au point, les chercheurs ont eu recours à un nouveau cadre d’apprentissage, appelé « Bayesian Program Learning (BPL) » ou apprentissage bayésien qui imite le mécanisme d’apprentissage des humains.

« La machine à apprendre suprême, c’est l’être humain », dit Ruslan Salakhutdinov (Université de Toronto), Boursier principal au sein du programme Calcul neuronal et perception adaptative de l’ICRA. Il a écrit l’article publié dans la revue Science, décrivant ces nouvelles recherches, en collaboration avec Joshua Tenenbaum (Massachusetts Institute of Technology) et avec l’auteur principal Brenden Lake (Université de New York).

Les humains peuvent voir un exemple d’un objet – une voiture, par exemple – une fois seulement et apprendre immédiatement beaucoup de choses sur cette réalité. Ils peuvent classer l’objet dans une catégorie d’objets qu’ils connaissent déjà, comme les vélos et les motos, en faire un dessin et en comprendre les caractéristiques, comme les roues et les portes. En revanche, il faut des centaines ou des milliers d’exemples pour qu’un ordinateur apprenne à reconnaître et à classer un objet dans une image.

Lake, spécialiste de la cognition et informaticien, a remarqué que les humains excellaient aussi à reconnaître et à reproduire des caractères manuscrits à l’aide d’un seul exemple, même quand les caractères sont dans une écriture non familière, comme le tibétain. Il a découvert que les gens pouvaient aussi facilement inventer de nouveaux caractères au style similaire.

« Les gens sont très créatifs. C’est très difficile pour les machines d’accomplir la même chose », dit Salakhutdinov. Le cadre d’apprentissage BPL essaie de reproduire cette habileté, en partie par l’incorporation de connaissances antérieures afin d’apprendre de nouveaux concepts. Par exemple, le modèle peut apprendre que dans l’écriture manuscrite les gens ont tendance à faire des traits courts et continus. En misant sur cette donnée, le modèle apprend à reconnaître de nouveaux concepts sur l’écriture dans d’autres langues et à générer de nouveaux exemples.

Par exemple, le modèle pourrait d’abord apprendre comment faire un trait simple et, ensuite, miser sur cette habileté et combiner des traits. En fonction de ce qu’il apprend, le modèle formule des hypothèses sur la nature des caractères et comment chaque trait mène au prochain.

L’approche réduit considérablement le nombre d’exemples requis pour apprendre un caractère manuscrit.

Qui plus est, les chercheurs ont vérifié les connaissances du modèle en comparant ses résultats à ceux des humains, et en demandant à des juges de les distinguer. Les trois quarts des juges ont eu du mal à faire la différence entre les caractères produits par l’ordinateur et ceux dessinés par les humains.

Au doctorat, Salakhutdinov a eu pour directeur de thèse Geoffrey Hinton (Université de Toronto), Membre distingué de l’ICRA. Il y a dix ans, ils ont écrit un article important sur l’apprentissage automatique dans lequel ils décrivaient un algorithme qui a appris des chiffres manuscrits à l’aide de milliers d’exemples. Ce modèle a eu recours à une approche appelée apprentissage profond qu’utilisent maintenant de grandes entreprises, comme Google, Microsoft et Baidu.

Le modèle a obtenu de meilleurs résultats que des modèles d’apprentissage profond récents, mais selon Salakhutdinov, en procédant à leur intégration, on pourrait d’autant plus accroître leur efficacité. La seule différence repose sur le fait que l’apprentissage profond est avide de données et requiert des milliers d’exemples, dit-il. Par contraste, l’apprentissage bayésien essaie d’apprendre de ses connaissances antérieures et d’incorporer la créativité.

Parmi les applications de ce modèle, notons une reconnaissance de la parole plus humaine. Les modèles actuels de reconnaissance de la parole ont du mal à apprendre des mots rares. Salakhutdinov donne l’exemple du mot « Darth Vader ». La première fois qu’une personne l’entendra, elle devra repérer le contexte dans lequel le mot se présente, mais après elle le reconnaîtra et établira un lien avec Star Wars. En apprenant de cette façon, un algorithme disposerait d’un bien meilleur vocabulaire.

« Imaginez que vous construisez un robot qui peut se rouler par terre et apprendre des dizaines de milliers de nouveaux concepts. Il doit apprendre tout comme un enfant – la première fois qu’il voit quelque chose, il l’apprend. »

Tout comme un enfant comprend rapidement le contexte dans lequel faire tope-là, un robot conçu pour apprendre de cette façon pourrait aussi reconnaître les gestes dès la première fois. Conséquemment, votre robot hypothétique pourrait discuter du prochain Star Wars et vous faire tope-là quand vous achetez des billets.