
- Anthropic lança Claude Opus 4.6, alegando grandes melhorias na detecção de vulnerabilidades de alta gravidade
- O modelo encontrou mais de 500 falhas ao raciocinar sobre o código como um pesquisador humano, superando as técnicas de difusão
- Focado na proteção de software de código aberto, com patches já chegando; empresa pede ação rápida enquanto a IA ainda pode fornecer resultados em escala
A Anthropic lançou Claude Opus 4.6, a versão mais recente de seu mais poderoso modelo de linguagem grande (LLM) e afirma que é “notavelmente melhor” na localização de vulnerabilidades de alta gravidade em comparação com modelos anteriores. Na verdade, o Opus 4.6 conseguiu até agora encontrar mais de 500 dessas falhas.
A Anthropic disse que o Opus 4.6 se destacou pela maneira como encontrou vulnerabilidades “prontas para uso, sem ferramentas específicas para tarefas, andaimes personalizados ou solicitações especializadas”.
Ele também acrescentou, ao contrário do fuzzing, que é uma técnica padrão de busca de vulnerabilidades, o Opus funciona raciocinando sobre o código “da mesma forma que um pesquisador humano faria”, o que significa que estava analisando correções anteriores para encontrar bugs semelhantes que não foram resolvidos, identificando padrões que tendem a causar problemas e estava entendendo a lógica “bem o suficiente para saber exatamente qual entrada iria quebrá-la”.
Consertando software de código aberto
Mesmo usando-o em algumas das bases de código mais bem testadas, projetos que tiveram fuzzers rodando contra eles durante anos, a Opus ainda conseguiu encontrar falhas de alta gravidade que passaram despercebidas pelo radar por “décadas”.
A Anthropic disse que começou a usar Claude para ajudar a corrigir falhas em software de código aberto, principalmente porque ele roda “em qualquer lugar, desde sistemas corporativos até infraestrutura crítica”, e porque vulnerabilidades neste software são sentidas em toda a Internet. Além disso, grande parte do software de código aberto popular em uso atualmente é mantido por uma pequena equipe de voluntários, o que significa que os recursos são mais do que limitados.
Os resultados foram notáveis, diz a empresa: “Até agora, encontramos e validamos mais de 500 vulnerabilidades de alta gravidade. Começamos a relatá-las e estamos vendo nossos patches iniciais chegarem, e continuamos a trabalhar com os mantenedores para corrigir os outros.”
Conclui que os modelos de IA podem agora encontrar vulnerabilidades de alta gravidade em grande escala, mas sublinha que poderá não ser o caso num futuro próximo. “Este é um momento para agir rapidamente para capacitar os defensores e proteger o máximo de código possível enquanto a janela existir.”
O melhor antivírus para todos os orçamentos
Siga o TechRadar no Google Notícias e adicione-nos como fonte preferencial para receber notícias, análises e opiniões de especialistas em seus feeds. Certifique-se de clicar no botão Seguir!
E é claro que você também pode Siga o TechRadar no TikTok para notícias, análises, unboxings em formato de vídeo e receba atualizações regulares nossas em WhatsApp também.
