Como o Claude Fable passou de grande aposta da I.A a uma crise de reputação para a Anthropic
A Anthropic, gigante do setor de I.A., passou cerca de quatro anos construindo uma imagem de empresa mais cautelosa e transparente no setor de inteligência artificial. Porém, o lançamento do Claude Fable 5 mudou esse cenário em apenas 96 horas.
Apresentado em 9 de junho como o modelo mais poderoso já lançado pela empresa, o Claude Fable 5 saiu do ambiente restrito do Project Glasswing e chegou ao público como o primeiro integrante da família Mythos. Poucos dias depois, o projeto virou alvo de críticas técnicas, pressão regulatória e desgaste de imagem.
Leia também: Anthropic se reúne com governo Trump para tentar reverter bloqueio de modelos de IA
Detalhe escondido no Claude da Anthropic
Junto com o lançamento, a Anthropic publicou um system card com 319 páginas para explicar o funcionamento e os limites do modelo. Entretanto, pesquisadores encontraram no documento uma informação que rapidamente gerou reação negativa.
O Claude Fable 5 utilizava uma salvaguarda invisível contra distilação que altera respostas quando identifica tentativas de usar o sistema para treinar modelos menores. O problema central surgiu porque o usuário recebia respostas modificadas sem qualquer aviso.
Após a repercussão, a Anthropic publicou um pedido de desculpas em 11 de junho e reconheceu que adotou a estratégia errada ao priorizar proteções invisíveis.
Filtros e respostas inconsistentes
As críticas não ficaram restritas apenas ao detalhe oculto da ferramenta. Pesquisadores apontaram problemas na forma como o modelo tratava conteúdos simples ligados à biologia.
O sistema recusava perguntas básicas sobre mitocôndria, causas da febre do feno e vacinas de mRNA, mas respondia sobre uso de gás cloro como arma química. Especialistas entenderam que o filtro priorizou riscos de forma inconsistente.
Além de não informar assuntos educativos, a falta de transparência do aplicativo e a abertura para assuntos violentos pioraram ainda mais a imagem do lançamento da Anthropic.
Leia também: Entenda como IPO de OpenAI e Anthropic pode ampliar euforia do mercado com IA
Governo americano
Como resultado do fracasso da plataforma, a Anthropic recebeu uma diretiva do Departamento de Comércio dos Estados Unidos que determinou suspensão imediata do acesso ao Fable 5 e ao Mythos 5 para estrangeiros dentro e fora do território americano.
Segundo o governo, uma empresa teria conseguido realizar um jailbreak no sistema e desbloquear capacidades consideradas sensíveis para a segurança nacional.
Como a Anthropic não conseguia diferenciar nacionalidades entre centenas de milhões de usuários, a empresa optou por interromper o acesso de forma ampla. A companhia contestou a gravidade da falha e afirmou que o mesmo método funcionava no GPT 5.5, da OpenAI, sem qualquer suspensão.
O post Como o Claude Fable passou de grande aposta da I.A a uma crise de reputação para a Anthropic apareceu primeiro em Times Brasil | CNBC.