Search
  • Compte-rendu de recherche
  • Réseaux Génétiques

Découverte de mutations entraînant la maladie dans des régions inexplorées du génome

by CIFAR févr. 11 / 16

De nouvelles possibilités transformatrices se pointent en médecine.

Le code d’épissage humain révèle des données inattendues sur les origines génétiques de maladies, comme le cancer, l’amyotrophie spinale et l’autisme.

Objets de l’étude

Cette étude constitue la première tentative sérieuse de décoder les portions du génome humain en dehors des gènes habituellement considérés dans les études sur la maladie génétique. Pour cerner des mutations qui entraînent des changements dans l’épissage des gènes, les chercheurs combinent leurs travaux d’avant-garde en apprentissage profond avec des techniques génétiques novatrices.

Contexte

Depuis le séquençage du génome en 2003, des scientifiques, des ingénieurs et des médecins ont travaillé très fort pour tenter de cerner les mutations de l’ADN qui causent véritablement la maladie. La plupart des méthodes existantes examinent les mutations dans les exons, des segments d’ADN qui encodent les protéines; toutefois, les scientifiques ont découvert que de nombreuses maladies ne peuvent s’expliquer par ces mutations. D’autres sections de l’ADN, les introns, encodent des instructions d’épissage, ou comment couper et coller ensemble les exons. Ce processus détermine la nature des protéines qui seront produites. Quand des mutations modifient l’épissage, les gènes peuvent produire les mauvaises protéines, ou bien n’en produire aucune, ou alors entraîner d’autres problèmes qui peuvent mener à la maladie.

Pour repérer des mutations dans ces segments moins explorés, des méthodes récentes, comme des études d’association pangénomique, tirent profit de données sur la maladie et comparent les mutations de patients malades à celles de patients en santé pour découvrir des motifs. Toutefois, ces études n’expliquent pas pourquoi une mutation donnée est problématique et cause la maladie.

Cette étude cherche à trouver une explication en utilisant une approche complètement différente. Elle entraîne les ordinateurs à reproduire la technique par laquelle la cellule dirige l’épissage par la détection de motifs dans des séquences d’ADN, appelés le « code d’épissage ». Elle cherche des mutations qui se trouvent profondément dans les introns et les classe en fonction de l’ampleur des changements entraînés dans l’épissage et, en conséquence, en fonction de leur probabilité de causer la maladie.

Le modèle a repéré 39 nouveaux gènes qui pourraient entrer en jeu dans le trouble du spectre autistique, une augmentation de 40 pour cent par rapport aux 100 gènes de l’autisme déjà connus.

Résultats

L’apprentissage profond peut détecter des mutations dans une plus grande région du génome humain que ce qui avait été exploré auparavant. L’apprentissage profond arrive à comprendre des relations incroyablement complexes, comme celles dans les systèmes vivants en biologie et en médecine. Les chercheurs ont réussi à utiliser les plus récentes méthodes d’apprentissage profond pour entraîner des ordinateurs à détecter des dizaines de milliers de mutations qui causent des changements dans l’épissage des gènes et qui pourraient mener à la maladie. Le modèle a pu chercher des mutations profondément dans les introns, en dehors des segments d’ADN déjà explorés qui encodent les protéines.

Un grand nombre des déterminants génétiques repérés pour l’autisme, le cancer du côlon et l’amyotrophie spinale étaient inattendus. Les chercheurs ont entraîné le modèle pour qu’il prédise comment les mutations détectées influenceraient l’épissage des gènes. Cela lui a permis d’évaluer avec précision et de catégoriser la probabilité que les mutations entraînent la maladie. Par exemple, le modèle a correctement prédit 94 pour cent des origines génétiques de maladies ayant fait l’objet de nombreuses études, comme l’amyotrophie spinale, une cause génétique importante de mortalité infantile, et le cancer du côlon (colorectal).

Encore plus important, le modèle a réussi à prédire avec exactitude les mutations qui n’avaient jamais été observées auparavant. À l’aide de séquences d’ADN d’enfants autistes, le modèle a aussi cerné 39 nouveaux gènes qui pourraient entrer en jeu dans le trouble du spectre autistique, une augmentation de 40 pour cent par rapport aux 100 gènes de l’autisme déjà connus. 

Méthodes

L’équipe de recherche a eu recours à des algorithmes d’apprentissage profond pour créer et entraîner un système à lire le génome : balayer des séquences d’ADN, lire les instructions génétiques sur le mode d’épissage des exons qui encodent des protéines et déterminer les protéines qui seront produites.

Les chercheurs ont utilisé le modèle pour chercher et catégoriser les mutations entraînant le mauvais fonctionnement de l’épissage dans les exons et à l’extérieur des exons qui encodent des protéines. Le modèle a catégorisé les mutations en fonction de l’ampleur du changement entraîné sur l’épissage et a prédit leur probabilité de causer des maladies ayant déjà fait l’objet de nombreuses études, comme le cancer du côlon et l’amyotrophie spinale.

Ensuite, les chercheurs ont appliqué leur méthode au trouble du spectre autistique, une maladie génétique complexe. Ils ont comparé les mutations découvertes dans les séquences pangénomiques de cinq enfants autistes, mais pas chez les témoins. Ils ont d’abord utilisé la méthode traditionnelle pour étudier les exons qui encodent les protéines et ils ont ensuite comparé les résultats avec ceux de leur système d’apprentissage profond visant à catégoriser les mutations.

Après deux à quatre semaines, le deuxième cycle de traitement de 15 jours a commencé avec 18 des 24 hommes. Ceux qui avaient reçu précédemment le placebo prenaient maintenant du valproate, et vice-versa. Les chercheurs ont procédé à l’entraînement et à l’analyse de façon similaire, mais avec des cours de reconnaissance de notes et des prénoms différents.

Répercussions

La contribution de cette étude à une meilleure compréhension de la façon dont les mutations modifient l’expression génique constitue une étape importante favorisant l’évolution de la médecine pangénomique de précision ou personnalisée. Comme cette nouvelle méthode peut déterminer les effets de mutations courantes, rares et parfois spontanées, elle pourrait se révéler utile pour nous permettre de rehausser notre compréhension des bases génétiques de toute une gamme de maladies et de troubles au-delà de l’autisme, du cancer du côlon et de l’amyotrophie spinale. 

Télécharger le PDF


Chercheurs : Université de Toronto : Brendan Frey (Boursier principal de l’ICRA), Timothy Hughes (Boursier principal de l’ICRA), Stephen Scherer (Boursier principal de l’ICRA), Hui Xiong, Babak Alipanahi, Leo Lee, Hannes Bretschneider, Ben Blencowe; Microsoft Research : Nebojsa Jojic.

Référence : H. Y. Xiong et coll., « The human splicing code reveals new insights into the genetic determinants of disease. » Science, 347:6218 (2015).