Um vazamento expôs a existência do Claude Mythos, novo modelo da Anthropic, após um erro de configuração em seu sistema de gestão de conteúdo tornar público um rascunho de post sobre o projeto. O material descrevia o modelo como uma tecnologia capaz de gerar “riscos de cibersegurança sem precedentes”, o que colocou a iniciativa no centro do debate sobre segurança e uso ofensivo de IA avançada. Segundo a reportagem, o rascunho ficou disponível em um repositório de dados público e pesquisável.
Depois da exposição, a Anthropic reconheceu a existência do Claude Mythos e, em declaração reproduzida pela imprensa, afirmou que ele representa um “salto” em relação aos sistemas anteriores, com avanços relevantes em raciocínio, programação e cibersegurança. O documento vazado também indica que o Mythos estaria ligado a uma nova categoria interna chamada Capybara, descrita como superior à linha Opus, até então considerada a mais poderosa da empresa. Isso sugere um novo patamar técnico para os modelos da Anthropic, com maior capacidade de lidar com tarefas complexas e mais autonomia operacional.
A principal preocupação está no potencial de uso ofensivo. A reportagem afirma que a Anthropic vem alertando autoridades, em caráter reservado, sobre a possibilidade de que modelos desse nível ampliem o risco de ataques cibernéticos em larga escala ainda em 2026.
Outro ponto sensível é o uso corporativo desses sistemas. Quanto mais agentes de IA se conectam a ferramentas internas, fluxos automatizados e dados empresariais, maior passa a ser o risco de abuso, erro de configuração e exploração indireta.



