Saltar para o conteúdo

A OpenAI lançou o GPT-Rosalind, um modelo de IA dedicado à biologia e ao desenvolvimento de medicamentos.

Cientista jovem analisa dados genéticos num tablet com representação holográfica de DNA no laboratório.

GPT-Rosalind: nova IA da OpenAI para ciências da vida, biologia e desenvolvimento de medicamentos

A OpenAI anunciou o lançamento do GPT-Rosalind, um novo modelo de inteligência artificial desenvolvido especificamente para tarefas em biologia, desenvolvimento de medicamentos e medicina translacional. O modelo foi otimizado para fluxos de trabalho científicos e combina uma utilização mais eficaz de ferramentas com uma compreensão mais profunda de química, engenharia de proteínas e genómica.

Atualmente, criar um novo medicamento nos EUA demora, em média, entre 10 e 15 anos - desde a identificação de um alvo biológico até à aprovação pelas entidades reguladoras. E são precisamente as fases iniciais da investigação que têm maior impacto no sucesso final: a escolha correta da meta, a formulação de hipóteses e a qualidade dos ensaios determinam a eficácia de toda a cadeia de desenvolvimento.

Uma das principais limitações na investigação em ciências da vida continua a ser não só a complexidade da própria biologia, mas também a fragmentação dos processos de investigação. Os cientistas têm de trabalhar com grandes volumes de literatura, bases de dados especializadas, resultados experimentais e hipóteses em constante mudança. Estes processos são morosos, pouco escaláveis e exigem recursos significativos.

Na OpenAI, considera-se que sistemas avançados de IA podem acelerar estes processos - não apenas através da automatização, mas também pela capacidade de encontrar ligações menos evidentes, explorar mais hipóteses e chegar mais depressa a conclusões fundamentadas. O GPT-Rosalind foi criado para apoiar tarefas como a síntese de dados científicos, a geração de hipóteses, o planeamento de experiências e a execução de cenários de investigação em várias etapas.

O modelo já está disponível em formato de pré-visualização de investigação no ChatGPT, no Codex e através da API para um grupo limitado de clientes no âmbito do programa de acesso de confiança. Foi também apresentado um plugin especial Life Sciences para o Codex, que dá acesso a mais de 50 ferramentas científicas e fontes de dados.

Entre os parceiros que trabalham com o modelo estão uma das maiores empresas biotecnológicas independentes dos EUA, a Amgen, a empresa de biotecnologia Moderna - pioneira no desenvolvimento de medicamentos e vacinas com base em RNA mensageiro (mRNA), o Allen Institute (Instituto Allen) - uma organização independente sem fins lucrativos de investigação científica especializada em biologia e inteligência artificial - e o conglomerado multinacional Thermo Fisher Scientific, fornecedor mundial de equipamentos científicos, reagentes, consumíveis, software e serviços para diagnóstico, investigação laboratorial, biologia e indústria. Estas entidades estão a utilizar o GPT-Rosalind para acelerar a investigação e o desenvolvimento de novas soluções nas áreas da biologia e da medicina.

O nome do modelo remete para Rosalind Franklin - a cientista cujo trabalho desempenhou um papel decisivo na descoberta da estrutura do ADN e lançou as bases da biologia molecular moderna.

Segundo a OpenAI, o GPT-Rosalind demonstra elevada eficácia em tarefas que exigem raciocínio científico complexo - desde a análise de reações químicas até à interpretação de sequências genéticas e interações entre proteínas. O modelo também revela melhor desempenho na utilização de ferramentas científicas especializadas em tarefas com várias etapas, incluindo análise de literatura, interpretação de dados e planeamento de experiências.

Nos testes realizados em benchmarks públicos, o modelo apresentou resultados de liderança. No BixBench, orientado para tarefas reais de bioinformática e análise de dados, o GPT-Rosalind alcançou os melhores resultados entre os modelos com resultados publicados. No LABBench2, que avalia a execução de tarefas de investigação, o modelo superou o GPT-5.4 em 6 de 11 categorias, incluindo o desenho de protocolos moleculares.

Além disso, o modelo foi testado em conjunto com a Dyno Therapeutics numa tarefa de previsão e geração de sequências de RNA. Neste experimento, os melhores resultados do modelo ultrapassaram os de 95% dos especialistas nas tarefas de previsão e atingiram cerca do 84.º percentil nas tarefas de geração.

O plugin Life Sciences para o Codex funciona como uma camada de orquestração para tarefas científicas, ajudando a trabalhar com genética, estrutura de proteínas, bioquímica e dados clínicos. Reúne o acesso a dezenas de bases de dados e ferramentas, permitindo resolver com mais eficiência questões de investigação complexas.

O lançamento do modelo é acompanhado por medidas de segurança reforçadas. O acesso ao GPT-Rosalind é concedido apenas a organizações que cumpram os requisitos relativos a atividade científica, gestão de riscos e controlo de utilização. Na OpenAI, sublinha-se que o objetivo é promover o avanço da ciência com a minimização de riscos potenciais.

A empresa vê o GPT-Rosalind como um primeiro passo numa estratégia de longo prazo para criar sistemas de IA especializados para a ciência. No futuro, está previsto expandir as capacidades do modelo, sobretudo em tarefas com cadeias de investigação longas e complexas, e aprofundar a colaboração com organizações científicas, incluindo laboratórios nacionais.

Na OpenAI, espera-se que, com o tempo, estes sistemas se tornem ferramentas completas para a descoberta científica - ajudando a acelerar a passagem de hipóteses para provas e de resultados de investigação para a criação de novos tratamentos.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário