Publicidade

Cientistas desenvolvem IA para criar proteínas jamais vistas antes

Por  • Editado por Luciana Zaramela | 

Compartilhe:
EvolutionaryScale/Divulgação
EvolutionaryScale/Divulgação

No que está sendo chamado de “ChatGPT da biologia”, uma nova inteligência artificial foi capaz de desenvolver uma proteína que não existe na natureza, mas que consegue realizar a função biológica da fluorescência. O modelo em questão é chamado de ESM3, e foi usado pela companhia EvolutionaryScale, cujos pesquisadores publicaram um estudo sobre o feito na base de dados científicos bioRxiv.

A empresa é formada por ex-funcionários da Meta, responsável pelo Facebook, e o ESM3 é um modelo de linguagem como o ChatGPT-4, da OpenAI. O software foi alimentado com 2,78 bilhões de proteínas diferentes, com dados incluindo a sequência de aminoácidos que formam cada uma, a estrutura (formato 3D da proteína) e função (o que a proteína faz).

Fazendo uma nova proteína

Canaltech
O Canaltech está no WhatsApp!Entre no canal e acompanhe notícias e dicas de tecnologia
Continua após a publicidade

Para fazer o modelo de linguagem (LLM) trabalhar, os pesquisadores esconderam porções aleatórias de informação sobre cada proteína e pediram que ele previsse como seriam as partes faltantes. Alguns cientistas apontam que há limitações na previsão de modelos de linguagem, mas a alternativa seria usar raios-x para mapear estruturas proteicas uma por uma, o que é caro e demorado. A IA acelera bastante o processo.

Além disso, o ESM3 é diferenciado — ele usou as informações sobre as proteínas às quais teve acesso, cujas características únicas chegam a 771 bilhões de combinações diferentes, e conseguiu gerar proteínas com funções específicas.

No caso, a função desejada era a fluorescência, cujo efeito é gerado quando uma proteína consegue capturar luz e liberá-la em uma frequência de onda mais alta, liberando um brilho esverdeado. As proteínas fluorescentes são importantes para a ciência, já que são ligadas a moléculas específicas para que sejam monitoradas e estudadas por cientistas.

O ESM3 foi capaz de gerar 96 proteínas com estruturas que provavelmente produziriam fluorescência. Os cientistas escolheram as proteínas com menos sequências em comum com proteínas fluorescentes naturais para verificar a eficiência do modelo.

Embora a proteína artificial gere um brilho 50 vezes mais fraco do que as naturais, o modelo conseguiu trabalhar em cima do resultado para aumentar o brilho, criando uma proteína diferente de qualquer uma encontrada na natureza, apelidada de esmGPF.

As iterações da IA, segundo os cientistas, levaram instantes, algo que a evolução teria levado milhões de anos para fazer — mais uma das vantagens da tecnologia no estudo da biologia.

Fonte:   EvolutionaryScalebioRxiv