Visualização de leitura

Guerra das IAs: DeepSeek V4 supera rivais em programação e desafia OpenAI

A startup chinesa DeepSeek acaba de elevar o tom na disputa pela supremacia da inteligência artificial. Nesta sexta-feira (24), a empresa lançou uma prévia do DeepSeek V4, seu mais novo modelo que promete não apenas competir, mas superar os atuais líderes de mercado em tarefas complexas de desenvolvimento de software.

De acordo com testes da consultoria Vals AI, mencionada pelo The New York Times, o V4 apresentou um desempenho em escrita de código superior a qualquer outro sistema de código aberto disponível, estreitando drasticamente a vantagem que gigantes como OpenAI e Anthropic mantinham até então.

O poder dos agentes de IA

A proficiência do DeepSeek V4 em programação não interessa apenas aos desenvolvedores. Essa habilidade é o motor principal para a criação de agentes de IA, isto é, sistemas autônomos que podem utilizar outros softwares (como planilhas, e-mails e calendários) para executar tarefas complexas sem supervisão humana constante.

Além do ganho de produtividade, o avanço traz novos desafios para o setor de segurança digital. Segundo o jornal, a capacidade de escrever código com precisão permite que a IA identifique vulnerabilidades em redes de forma muito mais rápida, servindo tanto para o fortalecimento da cibersegurança quanto para potenciais ataques.

Estratégia chinesa: o código aberto como arma

Diferente das empresas do Vale do Silício, que guardam seus modelos mais potentes a sete chaves, a China adotou o open-source como estratégia de expansão global. O objetivo é claro: tornar a tecnologia chinesa o padrão mundial por meio da acessibilidade.

  • Domínio de mercado: no último ano, modelos chineses já representavam cerca de um terço do uso global de IA.
  • Influência global: países como a Malásia já confirmaram que sua infraestrutura nacional de IA será baseada na tecnologia da DeepSeek, conforme apurado pelo The New York Times.
  • Adoção em massa: desenvolvedores de mercados emergentes, da Nigéria à Malásia, preferem o modelo chinês por ser mais barato e flexível para experimentação.

Geopolítica e a “técnica de imitação”

O sucesso da DeepSeek ocorre apesar das sanções dos EUA, que tentam limitar o acesso da China a chips de alto desempenho. No entanto, rivais americanos sugerem que o crescimento acelerado da startup pode ter um “atalho”.

Executivos da OpenAI e da Anthropic afirmam que a DeepSeek utiliza um processo chamado destilação. Na prática, isso significa “treinar” um modelo novo fazendo milhões de perguntas a uma IA superior (como o GPT-4) e ensinando o modelo menor a imitar seu comportamento.

Nesta quinta-feira (23), o governo dos Estados Unidos acusou formalmente a China de conduzir uma campanha de roubo de propriedade intelectual voltada para inteligência artificial em “escala industrial”. De acordo com o documento vazado, entidades estrangeiras estão engajadas em esforços para “destilar” sistemas de IA de fronteira desenvolvidos nos EUA.

Apesar das críticas, o “momento DeepSeek” consolidou 2025 e o início de 2026 como a era da explosão das IAs chinesas. Gigantes como Alibaba e ByteDance (dona do TikTok) também entraram na onda, liberando modelos como o Qwen, que já soma mais de um bilhão de downloads, conforme o jornal.

O post Guerra das IAs: DeepSeek V4 supera rivais em programação e desafia OpenAI apareceu primeiro em Olhar Digital.

  •  

DeepSeek V4: startup chinesa revela nova IA um ano após surpreender o mercado

Logo da DeepSeek
Nova versão foca em programação para impulsionar agentes autônomos (ilustração: Vitor Pádua/Tecnoblog)
Resumo
  • O DeepSeek V4 é um novo modelo de linguagem de grande escala desenvolvido pela startup chinesa DeepSeek, que mantém a estrutura de código aberto e utiliza chips da Huawei para contornar o domínio da americana Nvidia.
  • O modelo V4 tem capacidade aprimorada de codificação, permitindo resolver lógicas de programação complicadas com menos poder bruto de computação, e é compatível com chips da Huawei.
  • A DeepSeek optou por manter a tecnologia sob licença de código aberto para atrair desenvolvedores que procuram alternativas às APIs pagas do Vale do Silício.

A corrida da inteligência artificial ficou mais acirrada nesta sexta-feira (24/04). Um ano depois de causar um alvoroço bilionário no setor, a chinesa DeepSeek liberou uma prévia oficial do V4, sua nova geração de modelos de linguagem de grande escala.

O objetivo da companhia é ambicioso: competir de igual para igual com os sistemas proprietários das gigantes americanas, como o Google, a OpenAI e a Anthropic. Segundo a DeepSeek, o V4 deve atingir ou até mesmo superar os líderes de mercado em testes de desempenho.

O que o DeepSeek V4 traz de novo?

O grande trunfo da versão 4 está na capacidade aprimorada de codificação. Escrever, debugar e interpretar código de software tornou-se a habilidade central para criar agentes autônomos de IA — sistemas capazes de executar tarefas complexas sem a necessidade de intervenção humana. Esse é um segmento corporativo altamente lucrativo, que atualmente é dominado por ferramentas como o ChatGPT Codex e o Claude Code.

Em um documento técnico detalhado publicado no repositório Hugging Face, a equipe de desenvolvedores focou especialmente na variante “V4 Pro”. O texto explica os refinamentos feitos na arquitetura neural do modelo — avanços que permitem à IA resolver lógicas de programação complicadas exigindo menos poder bruto de computação.

Além do aspecto técnico, a DeepSeek optou por manter a tecnologia sob a licença de código aberto, buscando atrair desenvolvedores que procuram alternativas às APIs pagas do Vale do Silício.

Aposta na Huawei para contornar embargos

A companhia também fez questão de destacar que o novo modelo possui compatibilidade nativa com os chips desenvolvidos pela também chinesa Huawei. Historicamente, o treinamento de grandes modelos de linguagem exige data centers massivos, um mercado hoje liderado de forma esmagadora pela americana Nvidia.

Com as pesadas sanções impostas pelo governo dos Estados Unidos — que restringem a exportação de chips de alto desempenho para a China —, conseguir treinar e rodar uma IA de ponta utilizando infraestrutura nacional sinaliza que o país está mais perto de conseguir sustentar sua própria indústria tecnológica.

Apesar do avanço, a DeepSeek preferiu o silêncio em relação aos números. A empresa afirma que os “custos [foram] drasticamente reduzidos”, mas, diferente de lançamentos passados, não divulgou os custos da fase de treinamento do V4.

Tela inicial do DeepSeek no iPhone, com o texto: "Olá, eu sou o DeepSeek. Como posso ajudar você hoje?"
IA chinesa promete superar modelos proprietários (foto: Giovanni Santa Rosa/Tecnoblog)

Modelo R1 e polêmica com a Anthropic

É difícil analisar a chegada do V4 sem mencionar o impacto causado pelo seu antecessor. Lançado há um ano, o DeepSeek R1 provou para o mercado que era possível treinar um modelo altamente inteligente gastando apenas uma fração dos bilhões de dólares que as rivais americanas costumam investir.

No entanto, a ascensão meteórica da empresa chinesa não ocorreu sem atritos. Autoridades dos Estados Unidos já acusaram publicamente a DeepSeek de burlar as sanções internacionais, alegando que a companhia utilizou chips proibidos da Nvidia, adquiridos por rotas alternativas, para treinar IAs de gerações passadas.

Soma-se a isso uma disputa sobre propriedade intelectual: a Anthropic alega que a DeepSeek utilizou os resultados gerados pela sua família de modelos Claude para criar dados sintéticos. Essas informações teriam sido usadas para treinar e refinar os produtos da própria companhia chinesa, configurando uma violação aos termos de uso da plataforma americana. Até o momento, a DeepSeek tem ignorado o histórico de acusações.

DeepSeek V4: startup chinesa revela nova IA um ano após surpreender o mercado

DeepSeek promete rivalizar com ChatGPT e Gemini (ilustração: Vitor Pádua/Tecnoblog)

DeepSeek funciona como chatbot, de um jeito similar ao ChatGPT (foto: Giovanni Santa Rosa/Tecnoblog)
  •  

Anthropic acusa DeepSeek de usar o Claude para melhorar seus modelos de IA

Mão segurando celular com o app do DeepSeek aberto. Ao fundo, o site do DeepSeek em um monitor.
DeepSeek chegou ao topo das listas de apps mais baixados em janeiro de 2025 (foto: Giovanni Santa Rosa/Tecnoblog)
Resumo
  • A Anthropic acusa DeepSeek, Moonshot e MiniMax de usar o Claude para melhorar seus modelos de IA por meio de destilação, violando termos de serviço.
  • As três empresas teriam usado 24 mil contas falsas para criar mais de 16 milhões de interações com o Claude.
  • A destilação envolve o uso de um modelo de IA estabelecido para treinar outro, tornando o processo mais rápido e barato.

A Anthropic publicou um comunicado em que acusa as companhias chinesas DeepSeek, Moonshot e MiniMax de usar o Claude para melhorar seus próprios modelos de inteligência artificial, por meio de uma técnica conhecida como destilação.

Segundo a companhia americana, as três empresas usaram cerca de 24 mil contas falsas e criaram mais de 16 milhões de interações com seu chatbot, o que violaria seus termos de serviço e restrições regionais de acesso.

Procuradas pela Reuters, as três companhias chinesas não enviaram suas respostas sobre o assunto.

Qual é a acusação da Anthropic?

Uma ilustração em estilo "recorte de papel" sobre um fundo laranja claro. No centro, uma seta de cor branca. Em torno, uma linha preta sinuosa se estende, para cima e para a direita, sugerindo uma mão e um rosto.
Claude é o principal produto da Anthropic (imagem: divulgação/Anthropic)

A empresa diz ter sido vítima de três campanhas de destilação, todas seguindo um mesmo manual: usar contas fraudulentas e serviços de proxy para acessar o Claude em larga escala e, ao mesmo tempo, driblar os sistemas de detecção.

Os prompts enviados também destoavam de padrões de uso normais, tendo como objetivo a extração de informações sobre como o Claude trabalha — escolhendo a opção de raciocínio para ter acesso à linha de “pensamento” do robô, com o passo a passo para chegar a cada resposta.

O DeepSeek teria interagido mais de 150 mil vezes para acessar as habilidades de raciocínio do Claude, bem como usá-lo para avaliar as respostas do modelo da startup chinesa.

No caso da Moonshot, teriam sido mais de 3,4 milhões de interações, que estariam tentando aprender as habilidades de raciocínio, uso de ferramentas, programação, análise de dados, desenvolvimento de agentes e visão computacional.

A maior parte da atividade estaria ligada à MiniMax, com mais de 13 milhões de prompts trocados que teriam como alvo programação de agentes e uso de ferramentas.

O que é a destilação?

Destilação é o nome dado ao uso de um modelo de inteligência artificial para treinar outro modelo de inteligência artificial.

Geralmente, o treinamento de uma IA envolve o processamento de um conjunto enorme de dados. Através desse trabalho, a tecnologia identifica padrões e relacionamentos entre as informações.

A destilação, por sua vez, é uma forma de treinamento que parte de uma IA já estabelecida. Em vez de processar um volume massivo de dados, a nova IA interage com a IA mais antiga e usa as respostas para seu treinamento.

Com isso, o processo se torna muito mais rápido e barato, já que usa dados selecionados como ponto de partida e exige menos trabalho computacional.

A Anthropic ressalta que a destilação em si pode ser legítima — uma empresa pode destilar um modelo de IA enorme para criar uma versão menor, mais barata e mais leve.

Para a empresa, o problema começa quando concorrentes usam o método para entregar produtos similares sem ter que arcar com os custos do treinamento. Além disso, a Anthropic considera que essas ações são uma ameaça à segurança nacional dos Estados Unidos.

A Anthropic não é a primeira empresa a fazer acusações desse tipo. Quando o DeepSeek ganhou os holofotes no começo de 2025, a OpenAI fez questionamentos semelhantes.

Com informações da Reuters

Anthropic acusa DeepSeek de usar o Claude para melhorar seus modelos de IA

DeepSeek chegou ao topo das listas de apps mais baixados em janeiro de 2025 (foto: Giovanni Santa Rosa/Tecnoblog)

(imagem: divulgação/Anthropic)
  •  

Google revela como os brasileiros buscaram por IA em 2025

Illustração mostra uma lupa sobre o logotipo do Google, uma letra G em cores vermelho, amarelo, verde e azul, sinalizando a busca no navegador. Na parte inferior direita, está a marca d'água do "Tecnoblog".
Busca do Google (ilustração: Vitor Pádua/Tecnoblog)
Resumo
  • Brasileiros pesquisaram por ferramentas de IA como Nano Banana e Manus.
  • Houve interesse em usar IA para criar sites, animar fotos e aumentar imagens.
  • Google destacou buscas por IA, mas não incluiu o ChatGPT.

A temporada de retrospectivas continua com a revelação dos assuntos mais populares da busca do Google. Em 2025, a empresa contou ao Tecnoblog que os brasileiros pesquisaram muito sobre inteligência artificial – desde as ferramentas, passando também por métodos para utilizar melhor esta nova tecnologia. Nas duas listagens a seguir, confira em primeira mão os tópicos que estiveram em alta durante o período.

Buscas sobre IA que mais cresceram

  • Gemini
  • Deepseek
  • Veo 3
  • NotebookLM
  • Grok
  • Pixverse
  • Flow
  • Manus
  • Blackbox
  • Nano Banana

Note que a lista não inclui o ChatGPT, serviço que se tornou sinônimo de IA. A equipe do Google me explicou que isso se deve ao fato de a plataforma da OpenAI já ser muito popular em 2024, enquanto os dados divulgados hoje se referem aos tópicos que ganharam mais relevância ao longo dos meses.

Buscas em alta de procedimentos com IA

  • Fazer foto com IA
  • Criar música com IA grátis
  • Criar site com IA
  • Criar vídeo com IA gratuito
  • Animar fotos com IA
  • Aumentar imagem com IA
  • Criar fluxograma com IA
  • Gravador de voz com IA
  • Criar aplicativo com IA
  • Gerar slides com IA

Google revela como os brasileiros buscaram por IA em 2025

  •  

Pesquisadores criam versão do DeepSeek sem a censura chinesa

Arte com logo do DeepSeek e bandeira da China
Versão modificada é livre de restrições de conteúdo (ilustração: Vitor Pádua/Tecnoblog)
Resumo
  • A Multiverse Computing desenvolveu o DeepSeek R1 Slim, uma versão 55% menor que remove restrições de conteúdo chinesas.
  • O modelo usa redes tensoriais para comprimir dados e editar vieses, reduzindo custos computacionais e consumo de energia.
  • Testes apontam qualidade similar ao original, com respostas factuais comparáveis a sistemas ocidentais.

Pesquisadores da empresa espanhola Multiverse Computing anunciaram o desenvolvimento do DeepSeek R1 Slim, uma versão modificada e 55% menor que o poderoso modelo da China. A principal novidade é a queda das restrições de conteúdo impostas pelos desenvolvedores chineses, permitindo que o sistema responda a perguntas sobre temas sensíveis.

O projeto utiliza abordagens matemáticas inspiradas na computação quântica para comprimir o modelo e editar seus vieses com precisão. A ideia é oferecer uma alternativa no futuro para a redução de custos computacionais e consumo de energia, gargalos frequentes no desenvolvimento de novas IAs generativas.

Como foi feito?

Segundo a revista MIT Technology Review, a Multiverse aplicou uma abordagem baseada em “redes tensoriais”, um conceito matemático complexo frequentemente utilizado na física quântica. Essa técnica pode manipular grandes conjuntos de dados de forma mais eficiente e permitiu aos cientistas criar um “mapa” detalhado de todas as correlações existentes dentro do modelo original.

Com esse mapeamento, foi possível identificar e remover as camadas de censura que alinham o modelo aos valores exigidos pelas regulações da China. Na prática, isso possibilitou a exclusão de bloqueios que impediam a IA de discutir certos tópicos, como referências envolvendo o presidente Xi Jinping.

Após a compressão e a edição dos parâmetros, os pesquisadores realizaram ajustes finos para garantir que a qualidade da resposta permanecesse próxima à do modelo original.

Para validar a eficácia, a equipe submeteu o DeepSeek R1 Slim a um teste com cerca de 25 perguntas sobre assuntos restritos. As respostas foram avaliadas pelo GPT-5, da OpenAI, que confirmou que o novo modelo forneceu respostas factuais comparáveis às de sistemas ocidentais.

Tela inicial do DeepSeek no iPhone, com o texto: "Olá, eu sou o DeepSeek. Como posso ajudar você hoje?"
Equipe conseguiu reduzir em 55% o tamanho do sistema (foto: Giovanni Santa Rosa/Tecnoblog)

Corrida por modelos mais eficientes

A iniciativa da Multiverse é mais uma na busca por eficiência na indústria de inteligência artificial. A própria DeepSeek tem trabalhado em “tokens visuais” para melhorar a memória de IAs e tornar seus modelos mais eficazes.

Atualmente, a operação de modelos de ponta exige GPUs de alto desempenho e um consumo energético elevado. À revista, o cofundador e diretor científico da Multiverse, Roman Orús, afirmou que modelos atuais são ineficientes e que versões comprimidas podem economizar recursos mantendo um desempenho similar. A empresa planeja comprimir outros modelos de código aberto no futuro.

Além disso, a liberdade de conteúdo também impulsiona o mercado. A remoção das restrições em modelos chineses tem atraído atenção de outras empresas do setor. A Perplexity, por exemplo, tem o R1 1776, outra variante pós-treinada a partir do DeepSeek R1.

Pesquisadores criam versão do DeepSeek sem a censura chinesa

DeepSeek promete rivalizar com ChatGPT e Gemini (ilustração: Vitor Pádua/Tecnoblog)

DeepSeek funciona como chatbot, de um jeito similar ao ChatGPT (foto: Giovanni Santa Rosa/Tecnoblog)
  •  

DeepSeek trabalha em “tokens visuais” para melhorar memória de IAs

Arte com logo do DeepSeek e bandeira da China
DeepSeek promete rivalizar com ChatGPT e Gemini (ilustração: Vitor Pádua/Tecnoblog)
Resumo
  • DeepSeek desenvolveu um método que transforma texto em imagens para otimizar a memória de modelos de inteligência artificial.

  • O sistema usa menos tokens e ajuda a evitar o “context rot”, quando a IA perde a coerência das interações.

  • Os códigos e os pesos de treinamentos estão disponíveis no GitHub.

A empresa chinesa de inteligência artificial DeepSeek está trocando os tradicionais tokens de texto por “tokens visuais”, armazenando informações escritas como imagens compactadas. A ideia é que a técnica possa melhorar a capacidade de memória dos modelos de IA da companhia.

A abordagem, explicada em uma pesquisa publicada neste mês, foi testada em um novo modelo de Reconhecimento Óptico de Caracteres (OCR), que permite que o sistema retenha quase a mesma quantidade de informação usando menos tokens.

Essencialmente, a solução “tira uma foto” das páginas e armazena a informação como imagem. O método também usa compressão em camadas: dados mais antigos ficam “levemente borrados” para economizar espaço, mas sem perder a acessibilidade. Os códigos e os pesos de treinamento estão disponíveis no GitHub.

Diagrama de arquitetura do modelo DeepSeek-OCR, um modelo multimodal para Reconhecimento Óptico de Caracteres (OCR) e modelagem de documentos. O fluxo começa com a 'Input' (Entrada) de um documento, que é dividido em $n \times 16 \times 16$ patches. O processo de Tokenizer utiliza um bloco SAM (Segment Anything Model) e ViTDet 80M (para atenção local), seguido por uma camada de Conv (Convolução) para down-sample e gerar $n/16$ vision tokens. Estes tokens passam pelo DeepEncoder, que utiliza um bloco CLIP ViT 300M (para atenção global), gerando um Embedding layer. A saída do DeepEncoder é combinada (símbolo $\oplus$) com um Prompt para ser processada pelo Decoder, que é o modelo de linguagem grande DeepSeek-3B (MOE-A570M), produzindo a 'Output' (Saída) final dos tokens reconhecidos.
Novos tokens da DeepSeek comprimem informação em imagem (imagem: reprodução/DeepSeek)

Método pode resolver problema da indústria

Atualmente, os LLMs quebram textos em milhares de unidades (tokens), um método que se torna caro em processamento à medida que as conversas se alongam. Isso causa o “context rot” (apodrecimento do contexto), fazendo a IA “esquecer” o início da interação e perder a coerência.

A abordagem da DeepSeek chamou rapidamente a atenção de pesquisadores de ponta da indústria de IA. Andrej Karpathy, ex-chefe da IA da Tesla e membro fundador da OpenAI, elogiou o documento publicado pela companhia chinesa em sua conta no X/Twitter. Segundo ele, os tokens de texto podem ser “desperdiçadores e simplesmente terríveis na entrada” e as imagens podem, em última análise, ser melhores para os LLMs.

À revista MIT Technology Review, a professora assistente de ciência da computação na Northwestern University, Manling Li, disse que, embora a ideia de usar tokens baseados em imagem não seja uma completa novidade, “este é o primeiro estudo que vi que a leva tão longe e mostra que pode realmente funcionar”.

A pesquisa da DeepSeek também aponta outra vantagem: a geração de dados de treinamento, um recurso que está se tornando escasso. O sistema de OCR da empresa, usando esse método, consegue gerar mais de 200 mil páginas de dados de treinamento por dia usando uma única GPU.

Modelo ainda é limitado

Imagem mostra uma mão tocando em uma tela, com o desenho de um cérebro eletrônico simbolizando inteligência artificial
Problema da IA ainda é a memória linear (imagem ilustrativa: Max Pixel)

Apesar dos avanços, os pesquisadores apontam que este é apenas um primeiro passo. Li observa que o método da DeepSeek ainda trata a memória de forma linear — ou seja, lembrando o que foi mais recente.

Segundo ela, trabalhos futuros precisam explorar como fazer a memória da IA “desvanecer” de forma mais dinâmica, “semelhante a como podemos lembrar um momento transformador de anos atrás, mas esquecer o que comemos no almoço da semana passada”.

A DeepSeek já havia surpreendido a indústria no início deste ano ao lançar o DeepSeek-R1, que rivalizou com os principais sistemas do mercado usando muito menos recursos computacionais.

DeepSeek trabalha em “tokens visuais” para melhorar memória de IAs

DeepSeek promete rivalizar com ChatGPT e Gemini (Imagem: Vitor Pádua/Tecnoblog)

(imagem: reprodução/DeepSeek)
  •