GPT-Rosalind: nova IA da OpenAI para ciências da vida, biologia e desenvolvimento de medicamentos
A OpenAI anunciou o lançamento do GPT-Rosalind, um novo modelo de inteligência artificial desenvolvido especificamente para tarefas em biologia, desenvolvimento de medicamentos e medicina translacional. O modelo foi otimizado para fluxos de trabalho científicos e combina uma utilização mais eficaz de ferramentas com uma compreensão mais profunda de química, engenharia de proteínas e genómica.
Atualmente, criar um novo medicamento nos EUA demora, em média, entre 10 e 15 anos - desde a identificação de um alvo biológico até à aprovação pelas entidades reguladoras. E são precisamente as fases iniciais da investigação que têm maior impacto no sucesso final: a escolha correta da meta, a formulação de hipóteses e a qualidade dos ensaios determinam a eficácia de toda a cadeia de desenvolvimento.
Uma das principais limitações na investigação em ciências da vida continua a ser não só a complexidade da própria biologia, mas também a fragmentação dos processos de investigação. Os cientistas têm de trabalhar com grandes volumes de literatura, bases de dados especializadas, resultados experimentais e hipóteses em constante mudança. Estes processos são morosos, pouco escaláveis e exigem recursos significativos.
Na OpenAI, considera-se que sistemas avançados de IA podem acelerar estes processos - não apenas através da automatização, mas também pela capacidade de encontrar ligações menos evidentes, explorar mais hipóteses e chegar mais depressa a conclusões fundamentadas. O GPT-Rosalind foi criado para apoiar tarefas como a síntese de dados científicos, a geração de hipóteses, o planeamento de experiências e a execução de cenários de investigação em várias etapas.
O modelo já está disponível em formato de pré-visualização de investigação no ChatGPT, no Codex e através da API para um grupo limitado de clientes no âmbito do programa de acesso de confiança. Foi também apresentado um plugin especial Life Sciences para o Codex, que dá acesso a mais de 50 ferramentas científicas e fontes de dados.
Entre os parceiros que trabalham com o modelo estão uma das maiores empresas biotecnológicas independentes dos EUA, a Amgen, a empresa de biotecnologia Moderna - pioneira no desenvolvimento de medicamentos e vacinas com base em RNA mensageiro (mRNA), o Allen Institute (Instituto Allen) - uma organização independente sem fins lucrativos de investigação científica especializada em biologia e inteligência artificial - e o conglomerado multinacional Thermo Fisher Scientific, fornecedor mundial de equipamentos científicos, reagentes, consumíveis, software e serviços para diagnóstico, investigação laboratorial, biologia e indústria. Estas entidades estão a utilizar o GPT-Rosalind para acelerar a investigação e o desenvolvimento de novas soluções nas áreas da biologia e da medicina.
O nome do modelo remete para Rosalind Franklin - a cientista cujo trabalho desempenhou um papel decisivo na descoberta da estrutura do ADN e lançou as bases da biologia molecular moderna.
Segundo a OpenAI, o GPT-Rosalind demonstra elevada eficácia em tarefas que exigem raciocínio científico complexo - desde a análise de reações químicas até à interpretação de sequências genéticas e interações entre proteínas. O modelo também revela melhor desempenho na utilização de ferramentas científicas especializadas em tarefas com várias etapas, incluindo análise de literatura, interpretação de dados e planeamento de experiências.
Nos testes realizados em benchmarks públicos, o modelo apresentou resultados de liderança. No BixBench, orientado para tarefas reais de bioinformática e análise de dados, o GPT-Rosalind alcançou os melhores resultados entre os modelos com resultados publicados. No LABBench2, que avalia a execução de tarefas de investigação, o modelo superou o GPT-5.4 em 6 de 11 categorias, incluindo o desenho de protocolos moleculares.
Além disso, o modelo foi testado em conjunto com a Dyno Therapeutics numa tarefa de previsão e geração de sequências de RNA. Neste experimento, os melhores resultados do modelo ultrapassaram os de 95% dos especialistas nas tarefas de previsão e atingiram cerca do 84.º percentil nas tarefas de geração.
O plugin Life Sciences para o Codex funciona como uma camada de orquestração para tarefas científicas, ajudando a trabalhar com genética, estrutura de proteínas, bioquímica e dados clínicos. Reúne o acesso a dezenas de bases de dados e ferramentas, permitindo resolver com mais eficiência questões de investigação complexas.
O lançamento do modelo é acompanhado por medidas de segurança reforçadas. O acesso ao GPT-Rosalind é concedido apenas a organizações que cumpram os requisitos relativos a atividade científica, gestão de riscos e controlo de utilização. Na OpenAI, sublinha-se que o objetivo é promover o avanço da ciência com a minimização de riscos potenciais.
A empresa vê o GPT-Rosalind como um primeiro passo numa estratégia de longo prazo para criar sistemas de IA especializados para a ciência. No futuro, está previsto expandir as capacidades do modelo, sobretudo em tarefas com cadeias de investigação longas e complexas, e aprofundar a colaboração com organizações científicas, incluindo laboratórios nacionais.
Na OpenAI, espera-se que, com o tempo, estes sistemas se tornem ferramentas completas para a descoberta científica - ajudando a acelerar a passagem de hipóteses para provas e de resultados de investigação para a criação de novos tratamentos.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário