Les LLM détectent les causes génétiques de la perte auditive et des maladies rares

22

Les chercheurs de Stanford ont fait quelque chose de nouveau. Avec l’aide de partenaires taïwanais, Google Research et Google DeepMind, ils ont construit un pipeline d’IA pour la découverte génétique. Cela fonctionne réellement.

“Nous avons démontré que les grands modèles de langage (LLms) pouvaient faciliter la découverte génétique chez la souris… et générer des diagnostics génétiques… chez l’homme”, explique Gary Peltze.

Gary Peltz est professeur d’anesthésie à Stanford. Il a dirigé l’étude. Pourquoi est-ce important ? Environ 350 millions de personnes vivent avec des maladies génétiques rares. Si nous parvenons à identifier les gènes responsables, le traitement sera plus rapide. Beaucoup plus rapide.

Le problème du bruit de l’ADN

Pensez au génome. Il s’agit d’un ensemble d’instructions ADN permettant de fabriquer de l’ARN et des protéines. Quatre paires de bases. L’ordre compte. Mais l’ordre change. Chaque personne est porteuse de milliers de changements de séquence d’ADN appelés « variantes de signification inconnue ».

Ces variantes provoquent-elles des maladies ? Nous ne le savons pas.

La perte auditive illustre le flou. Un tiers des adultes de plus de 61 ans en souffrent. Ce nombre atteint 80 pour cent après 85 ans. La moitié de ces cas proviennent de la génétique. Mais on sait rarement quelles parties. Peltz souligne que le temps presse. Des thérapies réparatrices arriveront bientôt pour d’autres maladies génétiques. Identifier les gènes de la perte auditive semble soudain urgent.

Pourquoi les anciennes méthodes échouent

Les scientifiques mènent généralement une étude d’association à l’échelle du génome, ou GWAS. Ils recherchent des liens statistiques entre un génotype et un trait.

L’astuce ? GWAS trouve de vrais coupables. Il signale également les faux positifs. Beaucoup d’entre eux. Vous devez séparer le bon grain de l’ivraie pour vraiment comprendre la maladie. Les méthodes actuelles le font manuellement. Ils brûlent du cash. Ils perdent du temps. Vous avez besoin d’une expertise coûteuse en généticien clinique pour passer au crible les données.

L’IA change cette équation. Rapide. Moins cher. Précis? Peltz le pense. Il affirme que l’analyse génomique par l’IA pourrait améliorer les soins de santé de milliards de personnes.

Med-PaLM rencontre les Gémeaux

L’équipe a construit des pipelines pour trier les gènes candidats. Ils ont utilisé deux LLM distincts. Med-PaLM 2 est spécialisé dans les connaissances médicales. Gemini 2.5 Pro gère un raisonnement complexe mais manque de mise au point médicale.

Tout d’abord, Med-PaLM 2 a analysé les gènes GWAS de souris. Il a repéré correctement les gènes responsables connus. Puis il a découvert quelque chose de nouveau. Un facteur génétique de perte auditive spontanée chez la souris. Des expériences en laboratoire ont ensuite validé cette découverte.

Puis vinrent les épreuves humaines. En utilisant Gemini 2.5 Pro, l’équipe s’est attaquée à deux groupes. Vingt patients malentendants. Six avec des syndromes génétiques rares.

« Le pipeline… lui a demandé de justifier son classement à l’aide de preuves citées. » — Tao Tu, Google DeepMind

Tao Tu est chercheur scientifique à DeepMind et co-auteur. Le modèle a comparé les gènes des patients à la littérature médicale. Il croisait les symptômes. Ensuite, il a classé les causes probables. Ses résultats étaient en concurrence directe avec les diagnostics de vrais médecins. Un oto-rhino-laryngologiste. Un généticien clinicien.

Les Gémeaux ont gagné sans aucune formation médicale préalable. Il a cloué les cas de perte auditive. Les cas de maladies rares étaient plus difficiles. Des symptômes complexes partout. L’équipe a modifié le pipeline pour tenir compte de ce désordre. Les Gémeaux ont encore trouvé les variantes causales. Cela a aidé à diagnostiquer les maladies rares.

L’étude a atterri dans Advanced Science. Les auteurs affirment que l’IA peut identifier efficacement les racines génétiques de maladies suspectées chez des centaines de millions de personnes dans le monde.

Agents et avenir des génomes

Que se passe-t-il ensuite ? Les chercheurs prévoient d’intégrer ces pipelines dans des cadres d’agents d’IA autonomes. Pensez aux plugins pour les données sur les protéines ou les mutations. Il devient plus performant.

Peltz a de grands rêves. Un modèle lisant les dossiers de santé électroniques. Analyser le génome. Entièrement automatisé. Il voit un changement radical. Ces nouveaux modèles de raisonnement produisent des hypothèses. Ils suscitent la découverte. Ils accélèrent les recherches de traitement.

Cela signifie-t-il que nous abandonnons les médecins ?

Certainement pas. Les humains doivent interpréter l’IA. Les généticiens et les cliniciens restent au centre.

Il existe également une autre lacune. Notre analyse ignore la majeure partie du génome. Seulement deux pour cent de l’ADN code pour l’ARNm ou les protéines. Nous analysons cette partie. Les quatre-vingt-dix-huit pour cent restants nous manquent. Des changements génétiques s’y produisent. Nous ne les comprenons tout simplement pas encore bien.

Peltz désigne AlphaGenome comme une solution potentielle. Ce modèle d’apprentissage en profondeur pourrait interpréter les variations parmi les 98 % ignorés. Cela pourrait déverrouiller des informations cachées.

Si l’IA continue de faire progresser la génétique, la génétique passe du traitement à la prévention. Plans personnalisés basés sur votre code. Cela semble radical.

Peltz voit un changement se produire. De la guérison de la maladie à sa prévention totale.