Como o Claude Fable passou de grande aposta da I.A a uma crise de reputação para a Anthropic

17 de Junho de 2026, 08:00

A Anthropic, gigante do setor de I.A., passou cerca de quatro anos construindo uma imagem de empresa mais cautelosa e transparente no setor de inteligência artificial. Porém, o lançamento do Claude Fable 5 mudou esse cenário em apenas 96 horas.

Apresentado em 9 de junho como o modelo mais poderoso já lançado pela empresa, o Claude Fable 5 saiu do ambiente restrito do Project Glasswing e chegou ao público como o primeiro integrante da família Mythos. Poucos dias depois, o projeto virou alvo de críticas técnicas, pressão regulatória e desgaste de imagem.

Detalhe escondido no Claude da Anthropic

Junto com o lançamento, a Anthropic publicou um system card com 319 páginas para explicar o funcionamento e os limites do modelo. Entretanto, pesquisadores encontraram no documento uma informação que rapidamente gerou reação negativa.

O Claude Fable 5 utilizava uma salvaguarda invisível contra distilação que altera respostas quando identifica tentativas de usar o sistema para treinar modelos menores. O problema central surgiu porque o usuário recebia respostas modificadas sem qualquer aviso.

Após a repercussão, a Anthropic publicou um pedido de desculpas em 11 de junho e reconheceu que adotou a estratégia errada ao priorizar proteções invisíveis.

Filtros e respostas inconsistentes

As críticas não ficaram restritas apenas ao detalhe oculto da ferramenta. Pesquisadores apontaram problemas na forma como o modelo tratava conteúdos simples ligados à biologia.

O sistema recusava perguntas básicas sobre mitocôndria, causas da febre do feno e vacinas de mRNA, mas respondia sobre uso de gás cloro como arma química. Especialistas entenderam que o filtro priorizou riscos de forma inconsistente.

Além de não informar assuntos educativos, a falta de transparência do aplicativo e a abertura para assuntos violentos pioraram ainda mais a imagem do lançamento da Anthropic.

Governo americano

Como resultado do fracasso da plataforma, a Anthropic recebeu uma diretiva do Departamento de Comércio dos Estados Unidos que determinou suspensão imediata do acesso ao Fable 5 e ao Mythos 5 para estrangeiros dentro e fora do território americano.

Segundo o governo, uma empresa teria conseguido realizar um jailbreak no sistema e desbloquear capacidades consideradas sensíveis para a segurança nacional.

Como a Anthropic não conseguia diferenciar nacionalidades entre centenas de milhões de usuários, a empresa optou por interromper o acesso de forma ampla. A companhia contestou a gravidade da falha e afirmou que o mesmo método funcionava no GPT 5.5, da OpenAI, sem qualquer suspensão.

Visualizando todos Stories