Search
  • Nouvelles
  • Apprentissage automatique, apprentissage biologique

DeepBind prédit le site de liaison des protéines et découvre des mutations pathogènes

by CIFAR déc. 15 / 15

tumor-suppressor-deep-bind-1280x430

Un nouvel outil appelé DeepBind a recours à l’apprentissage profond pour analyser le mode de liaison des protéines à l’ADN et à l’ARN, et ainsi détecter des mutations qui pourraient perturber les processus cellulaires et entraîner la maladie.

Le Boursier principal de l’ICRA Brendan Frey (Université de Toronto), et les auteurs principaux coordonnateurs Babak Alipanahi et Andrew Delong ont mis au point cette méthode à l’aide de l’apprentissage profond – une technique d’apprentissage automatique créée par des boursiers du programme Apprentissage automatique, apprentissage biologique (anciennement connu sous le nom ‘Calcul neuronal et perception adaptative révolutionne’) de l’ICRA et mise en pratique aujourd’hui par des entreprises comme Google et Facebook.

Des centaines de milliers de protéines dans les cellules humaines se lient à l’ADN et à l’ARN pour réguler l’expression des gènes. « Elles sont tels des contrôleurs maîtres de la cellule », dit Alipanahi. Mais nombre de ces protéines sont difficiles à satisfaire quant aux séquences auxquelles elles se lieront.

DeepBind peut analyser des données expérimentales bruitées pour déterminer les séquences d’ADN et d’ARN auxquelles se liera un ensemble de protéines. Ensuite, l’outil peut examiner une nouvelle séquence et calculer la probabilité que l’une ou l’autre de ces protéines s’y lie. En présence d’une séquence assortie d’une mutation, DeepBind peut voir si la liaison subit des changements. Des mutations qui ajoutent ou suppriment des sites de liaison des protéines peuvent modifier les modes d’expression géniques et entraîner la maladie.

Selon Frey, Boursier principal au sein des programmes Réseaux génétiques et Calcul neuronal et perception adaptative de l’ICRA, « DeepBind est un exemple d’une série de technologies que nous avons mises au point en combinant notre expertise en apprentissage profond et en biologie génomique. Je crois que ces technologies vont révolutionner les soins de santé et la médecine de précision. Ils changent la donne ».

Cela fait plus d’une décennie que le groupe de Frey met au point des techniques d’apprentissage automatique transformatrices pour comprendre le génome. L’année dernière, des chefs de file technologiques d’entreprises comme Facebook, Google et Deep Mind ont convenu que le prochain grand objectif pour l’apprentissage profond est son application dans les soins de santé et la médecine génétique. Vu tous ses succès depuis plus de dix ans, le groupe de Frey est tout à fait d’accord.

Les premières analyses de données génétiques humaines par DeepBind, décrites dans la revue Nature Biotechnology, ont déjà mené à de nouvelles connaissances sur des perturbations de la fixation des protéines dans des mutations associées au cancer, à l’hémophilie et à l’hypercholestérolémie familiale – un trouble héréditaire associé à des concentrations très élevées de cholestérol. Qui plus est, le système a révélé qu’une mutation génétique entraînant un développement anormal du cortex cérébral pourrait s’avérer plus complexe qu’on ne le croyait. Plus spécifiquement, on a découvert qu’une mutation connue pour sa délétion d’un site de fixation entraînait en fait la délétion de deux sites de fixation simultanément.

DeepBind arrive dans la foulée de la percée sur le « code d’épissage humain » par le groupe de Frey, en collaboration avec les Boursiers principaux de l’ICRA Stephen Scherer (Hôpital pour enfants malades et Université de Toronto) et Timothy Hughes (Université de Toronto). Leur système a cerné de nouveaux gènes qui pourraient jouer un rôle dans le trouble du spectre autistique, le cancer du côlon héréditaire sans polypose et l’amyotrophie spinale par l’identification d’erreurs dans l’épissage des gènes. Comme de nombreuses protéines régulent l’épissage, les chercheurs ont l’intention d’utiliser les résultats de DeepBind pour améliorer le code d’épissage humain. Ce nouvel outil permet d’accroître considérablement le type de mutations qu’il est possible d’analyser et peut ainsi cibler les promoteurs et les amplificateurs.

Frey dit que des collaborateurs de l’ICRA, au premier plan du développement de technologies d’apprentissage profond, ont grandement influencé les concepts qui sous-tendent DeepBind. « L’ICRA a joué un rôle essentiel dans l’établissement d’un réseau de recherche qui a mené à nos percées en apprentissage profond et en médecine génomique », précise Frey.