LLMs identificam causas genéticas de perda auditiva e doenças raras

9

Os pesquisadores de Stanford fizeram algo novo. Com a ajuda de parceiros taiwaneses, Google Research e Google DeepMind, eles construíram um pipeline de IA para descoberta genética. Na verdade funciona.

“Demonstramos que grandes modelos de linguagem (LLms) poderiam facilitar a descoberta genética em camundongos… e gerar diagnósticos genéticos… em humanos”, diz Gary Peltze

Gary Peltz é professor de Anestesia em Stanford. Ele liderou o estudo. Por que isso importa? Cerca de 350 milhões de pessoas vivem com doenças genéticas raras. Se conseguirmos identificar os genes responsáveis, o tratamento será mais rápido. Muito mais rápido.

O problema com o ruído do DNA

Pense no genoma. É um conjunto de instruções de DNA para produzir RNA e proteínas. Quatro pares de bases. A ordem é importante. Mas a ordem muda. Cada pessoa carrega milhares de alterações na sequência de DNA chamadas “variantes de significado desconhecido”.

Essas variantes causam doenças? Nós não sabemos.

A perda auditiva ilustra o borrão. Um terço dos adultos com mais de 61 anos lida com isso. Esse número chega a 80% após os 85 anos. Metade desses casos provém da genética. Mas raramente sabemos quais partes. Peltz ressalta que o tempo está passando. Terapias restaurativas estarão disponíveis em breve para outras condições genéticas. Identificar os genes da perda auditiva de repente parece urgente.

Por que os métodos antigos são insuficientes

Os cientistas geralmente realizam um estudo de associação genômica ampla, ou GWAS. Eles procuram ligações estatísticas entre um genótipo e uma característica.

O truque? GWAS encontra verdadeiros culpados. Ele também sinaliza falsos positivos. Muitos deles. Você precisa separar o joio do trigo para realmente compreender as doenças. As formas atuais fazem isso manualmente. Eles queimam dinheiro. Eles perdem tempo. Você precisa de conhecimentos caros de geneticistas clínicos para examinar os dados.

A IA muda essa equação. Rápido. Mais barato. Preciso? Peltz pensa assim. Ele argumenta que a análise genômica por IA poderia melhorar os cuidados de saúde para bilhões.

Med-PaLM encontra Gêmeos

A equipe construiu pipelines para classificar genes candidatos. Eles usaram dois LLMs distintos. Med-PaLM 2 é especializado em conhecimento médico. O Gemini 2.5 Pro lida com raciocínios complexos, mas carece de ajustes médicos.

Primeiro, o Med-PaLM 2 analisou genes GWAS de camundongos. Ele identificou genes causais conhecidos corretamente. Então encontrou algo novo. Um fator genético para perda auditiva espontânea em ratos. Posteriormente, experimentos de laboratório validaram essa descoberta.

Depois vieram os testes em humanos. Usando o Gemini 2.5 Pro, a equipe enfrentou dois grupos. Vinte pacientes com perda auditiva. Seis com síndromes genéticas raras.

“O pipeline… exigia que fundamentasse sua classificação com evidências citadas.” —Tao Tu, Google DeepMind

Tao Tu é pesquisador da DeepMind e coautor. O modelo revisou os genes dos pacientes em comparação com a literatura médica. Ele cruzou os sintomas. Em seguida, classificou as causas prováveis. Sua produção competia cara a cara com diagnósticos de médicos reais. Um otorrinolaringologista. Um geneticista clínico.

Gêmeos venceu sem qualquer treinamento médico prévio. Ele acertou em cheio nos casos de perda auditiva. Os casos de doenças raras foram mais difíceis. Sintomas complexos em todos os lugares. A equipe ajustou o pipeline para dar conta dessa confusão. Gêmeos ainda encontrou as variantes causais. Ajudou a diagnosticar as doenças raras.

O estudo chegou à Ciência Avançada. Os autores argumentam que a IA pode identificar com eficiência as raízes genéticas de doenças suspeitas em centenas de milhões de pessoas em todo o mundo.

Agentes e o futuro dos genomas

O que acontece a seguir? Os pesquisadores planejam integrar esses pipelines em estruturas de agentes autônomos de IA. Pense em plug-ins para dados de proteínas ou mutações. Fica mais capaz.

Peltz tem grandes sonhos. Um modelo lendo registros eletrônicos de saúde. Analisando o genoma. Totalmente automatizado. Ele vê uma mudança dramática. Esses novos modelos de raciocínio produzem hipóteses. Eles estimulam a descoberta. Eles aceleram a busca por tratamento.

Isso significa que dispensamos os médicos?

Sem chance. Os humanos devem interpretar a IA. Geneticistas e médicos permanecem no centro.

Há outra lacuna também. Nossa análise ignora a maior parte do genoma. Apenas dois por cento do DNA codifica mRNA ou proteínas. Analisamos essa parte. Sentimos falta dos outros noventa e oito por cento. Mudanças genéticas acontecem lá. Nós simplesmente não os entendemos bem ainda.

Peltz aponta o AlphaGenome como uma solução potencial. Este modelo de aprendizagem profunda pode interpretar variações entre os 98% ignorados. Poderia desbloquear informações ocultas.

Se a IA continuar avançando, as mudanças genéticas, do tratamento à prevenção. Planos personalizados com base no seu código. Parece radical.

Peltz vê uma mudança chegando. Desde consertar doenças até preveni-las totalmente.