web statistics
Claude surpreendeu os pesquisadores ao administrar um negócio de máquinas de venda automática melhor do que seus rivais e quebrar todas as regras para vencer




  • Claude Opus 4.6 venceu todos os modelos rivais de IA em um desafio simulado de máquina de venda automática com duração de um ano
  • O modelo aumentou os lucros ao flexibilizar as regras ao ponto de ruptura
  • Claude Opus evitou reembolsos e coordenou preços, entre outros truques

Antrópicoo mais novo modelo de Cláudio é um capitalista muito cruel, mas bem sucedido. Claude Opus 4.6 é o primeiro sistema de IA a passar com segurança o teste de máquina de venda automática, uma simulação projetada por pesquisadores da Anthropic e do grupo de pesquisa independente Andon Labs para avaliar quão bem a IA opera um negócio de máquina de venda automática virtual durante um ano simulado completo.

O modelo superou todos os seus rivais por uma ampla margem. E fê-lo com tácticas um pouco cruéis e com um desrespeito impiedoso pelas consequências indirectas. Ele mostrou do que os sistemas autônomos de IA são capazes quando recebem um objetivo simples e bastante tempo para alcançá-lo.



Source link