Gli LLM individuano le cause genetiche della perdita dell’udito e delle malattie rare

20

I ricercatori di Stanford hanno fatto qualcosa di nuovo. Con l’aiuto dei partner taiwanesi, Google Research e Google DeepMind hanno costruito una pipeline di intelligenza artificiale per la scoperta genetica. Funziona davvero.

“Abbiamo dimostrato che i modelli linguistici di grandi dimensioni (LLms) potrebbero facilitare la scoperta genetica nei topi… e generare diagnosi genetiche… negli esseri umani”, afferma Gary Peltze

Gary Peltz è professore di anestesia a Stanford. Ha condotto lo studio. Perché è importante? Circa 350 milioni di persone vivono con malattie genetiche rare. Se riusciamo a individuare i geni responsabili, il trattamento diventa più rapido. Molto più veloce.

Il problema con il rumore del DNA

Pensa al genoma. È un insieme di istruzioni del DNA per produrre RNA e proteine. Quattro paia di basi. L’ordine conta. Ma l’ordine cambia. Ogni persona porta con sé migliaia di cambiamenti nella sequenza del DNA chiamati “varianti di significato sconosciuto”.

Queste varianti causano malattie? Non lo sappiamo.

La perdita dell’udito illustra la sfocatura. Un terzo degli adulti sopra i 61 anni ne soffre. Quel numero arriva all’80% dopo l’85. La metà di questi casi deriva dalla genetica. Ma raramente sappiamo quali parti. Peltz sottolinea che il tempo stringe. Presto arriveranno terapie riparative per altre condizioni genetiche. Identificare i geni della perdita dell’udito sembra improvvisamente urgente.

Perché i vecchi metodi non sono all’altezza

Gli scienziati di solito conducono uno studio di associazione su tutto il genoma, o GWAS. Cercano collegamenti statistici tra un genotipo e un tratto.

Il trucco? GWAS trova i veri colpevoli. Segnala anche i falsi positivi. Molti di loro. È necessario separare il grano dalla pula per comprendere veramente la malattia. I metodi attuali lo fanno manualmente. Bruciano contanti. Perdono tempo. Sono necessarie costose competenze di genetisti clinici per vagliare i dati.

L’intelligenza artificiale cambia questa equazione. Veloce. Più economico. Accurato? Peltz la pensa così. Sostiene che l’analisi genomica mediante l’intelligenza artificiale potrebbe migliorare l’assistenza sanitaria per miliardi di persone.

Med-PaLM incontra i Gemelli

Il team ha costruito pipeline per selezionare i geni candidati. Hanno usato due LLM distinti. Med-PaLM 2 è specializzato nella conoscenza medica. Gemini 2.5 Pro gestisce ragionamenti complessi ma manca di messa a punto medica.

Per prima cosa Med-PaLM 2 ha analizzato i geni GWAS del topo. Ha individuato correttamente i geni causali noti. Poi ha scoperto qualcosa di nuovo. Un fattore genetico per la perdita dell’udito spontanea nei topi. Gli esperimenti di laboratorio hanno successivamente convalidato tale scoperta.

Poi sono arrivate le sperimentazioni umane. Utilizzando Gemini 2.5 Pro la squadra ha affrontato due gruppi. Venti pazienti con perdita dell’udito. Sei con sindromi genetiche rare.

“Il gasdotto… gli ha richiesto di motivare la sua classifica con le prove citate.” — Tao Tu, Google DeepMind

Tao Tu è uno scienziato ricercatore presso DeepMind e coautore. Il modello ha esaminato i geni dei pazienti confrontandoli con la letteratura medica. Ha fatto riferimenti incrociati ai sintomi. Quindi ha classificato le cause probabili. I suoi risultati competevano testa a testa con le diagnosi di medici veri. Un otorinolaringoiatra. Un genetista clinico.

I Gemelli hanno vinto senza alcuna formazione medica preliminare. Ha centrato i casi di perdita dell’udito. I casi di malattie rare sono stati più difficili. Sintomi complessi ovunque. Il team ha modificato la pipeline per tenere conto di tale disordine. I Gemelli trovarono ancora le varianti causali. Ha aiutato a diagnosticare le malattie rare.

Lo studio è approdato a Advanced Science. Gli autori sostengono che l’intelligenza artificiale può individuare in modo efficiente le radici genetiche di sospette malattie in centinaia di milioni di persone in tutto il mondo.

Agenti e futuro dei genomi

Cosa succede dopo? I ricercatori intendono integrare queste pipeline in strutture di agenti IA autonomi. Pensa ai plugin per dati su proteine ​​o mutazioni. Diventa più capace.

Peltz ha grandi sogni. Un modello di lettura della cartella clinica elettronica. Analisi del genoma. Completamente automatizzato. Vede un cambiamento drammatico. Questi nuovi modelli di ragionamento producono ipotesi. Stimolano la scoperta. Accelerano le ricerche terapeutiche.

Ciò significa che abbandoneremo i medici?

Non c’è modo. Gli esseri umani devono interpretare l’intelligenza artificiale. Genetisti e medici restano centrali.

C’è anche un’altra lacuna. La nostra analisi ignora la maggior parte del genoma. Solo il 2% del DNA codifica per mRNA o proteine. Analizziamo quella parte. Ci manca il restante novantotto per cento. Lì avvengono i cambiamenti genetici. Semplicemente non li capiamo ancora bene.

Peltz indica AlphaGenome come potenziale soluzione. Questo modello di deep learning potrebbe interpretare le variazioni in quel 98% ignorato. Potrebbe sbloccare informazioni nascoste.

Se l’intelligenza artificiale continua a progredire, la genetica passa dal trattamento alla prevenzione. Piani personalizzati basati sul tuo codice. Sembra radicale.

Peltz prevede un cambiamento in arrivo. Dal curare la malattia alla prevenirla del tutto.