Nova Delhi:
Uma empresa de pesquisa de IA sediada em Nova York, focada em biotecnologia, gerou uma nova proteína usando um Modelo de Linguagem de Proteínas (ProLLMs) que funciona em uma arquitetura de transformador semelhante à do ChatGPT.
A EvolutionaryScale revelou uma primeira molécula de proteína gerada por IA que brilha – imitando a bioluminescência de uma molécula de água-viva chamada proteína fluorescente verde – em 25 de junho. A nova sequência de proteína é significativamente diferente (menos de 60 por cento de semelhança) da proteína natural: uma diferença apelidada de possível “ao longo de 500 milhões de anos de evolução (natural)” pela empresa.
A empresa usou seu modelo de linguagem de IA de ponta chamado EvolutionaryScale Model-3 (ESM3) para atingir esse feito e garantiu 142 milhões de dólares em uma rodada de financiamento inicial para o mesmo, incluindo investimentos de gigantes da indústria como Nvidia e Amazon.
Estamos entusiasmados com a parceria com a AWS e a NVIDIA para expandir os limites da IA para as ciências biológicas.
— Escala Evolutiva (@EvoscaleAI) 25 de junho de 2024
O ESM3 difere do ChatGPT, pois é treinado em parâmetros (variáveis internas) de três propriedades biológicas fundamentais de proteínas – sequência, estrutura e funções. O modelo foi treinado em 98 bilhões de parâmetros, tornando-o o maior modelo de IA biológica até o momento.
A EvolutionaryScale chama isso de “modelo treinado em toda a evolução”. O conjunto de treinamento compreendeu 2,78 bilhões de proteínas naturais, variando da “floresta amazônica às profundezas do oceano, ambientes extremos como fontes hidrotermais e micróbios em um punhado de solo”.
O ESM3 permite que os usuários gerem proteínas, usando prompts com informações parciais (palavras-chave de sequência, estrutura e função) e iterando o modelo para fazer previsões até que toda a sequência seja concluída. O modelo é destinado principalmente a cientistas e dá a eles controle sem precedentes sobre o processo de geração de proteínas.
Treinamos o ESM3 e estamos animados em apresentar o EvolutionaryScale.
ESM3 é um modelo de linguagem generativa para biologia de programação. Em experimentos, descobrimos que ESM3 pode simular 500M anos de evolução para gerar novas proteínas fluorescentes.
Consulte Mais informação: https://t.co/iAC3lkj0iVfoto.twitter.com/AhWtC4vxlF
— Alex Rives (@alexrives) 25 de junho de 2024
A EvolutionaryScale afirma que seu objetivo é tornar a biologia programável. “ESM3 dá um passo em direção ao futuro, onde a IA é uma ferramenta para projetar a biologia a partir dos primeiros princípios, da mesma forma que projetamos estruturas, máquinas e microchips, e escrevemos programas de computador”, afirma o site da empresa.
A aplicação dessa tecnologia pode levar a avanços em vários campos, como descoberta e desenvolvimento de medicamentos, pesquisa biomédica e sustentabilidade — um exemplo disso já foi demonstrado pela EvolutionaryScale ao mostrar um protótipo de proteína capaz de degradar resíduos plásticos.
As possibilidades são infinitas, com cada célula em cada organismo contendo ribossomos (complexos de proteínas que são responsáveis pela síntese de proteínas). No entanto, também houve preocupações de que a IA poderia ser mal utilizada para criar armas biológicas.
Cientistas adotaram uma abordagem proativa e estabeleceram “Valores Comunitários, Princípios Orientadores e Compromissos para o Desenvolvimento Responsável de IA para Design de Proteínas” em março, buscando orientar os desenvolvimentos neste domínio para a melhoria da humanidade.
Estamos avançando em um novo acordo global assinado por mais de 100 cientistas líderes para garantir que as tecnologias de IA para design de proteínas sejam desenvolvidas de forma responsável. Este campo pode fornecer medicamentos, vacinas e outras inovações que beneficiam a todos. https://t.co/pTlFtBWHNhhttps://t.co/XYn986dEAt
— Instituto de Design de Proteínas (@UWproteindesign) 8 de março de 2024
O EvolutionaryScale também foi elogiado por especialistas por lançar uma versão menor de código aberto para outros usarem livremente. O modelo completo em larga escala não foi lançado, embora o processo de treinamento do mesmo tenha sido tornado público, em uma tentativa de permanecer transparente e compartilhar a tecnologia livremente.