Mais sobre DeepSeek

(Bloomberg) – A DeepSeek, uma startup chinesa de inteligência artificial com pouco mais de um ano de existência, causou admiração e consternação no Vale do Silício após demonstrar modelos de IA que oferecem desempenho comparável aos melhores chatbots do mundo por aparentemente uma fração do seu custo de desenvolvimento.

O surgimento do DeepSeek pode oferecer um contraponto à crença generalizada de que o futuro da IA exigirá quantidades cada vez maiores de poder e energia computacional.

As ações globais de tecnologia despencaram em 27 de janeiro, à medida que o entusiasmo em torno da inovação da DeepSeek crescia e os investidores começavam a digerir as implicações para seus rivais sediados nos EUA e fornecedores de hardware de IA, como a Nvidia Corp.

O que exatamente é DeepSeek?
A DeepSeek foi fundada em 2023 por Liang Wenfeng, chefe do fundo de hedge quantitativo orientado por IA High-Flyer. A empresa desenvolve modelos de IA que são de código aberto, o que significa que a comunidade de desenvolvedores em geral pode inspecionar e melhorar o software. Seu aplicativo móvel subiu para o topo das paradas de download do iPhone nos EUA após seu lançamento no início de janeiro.

O aplicativo se distingue de outros chatbots como o ChatGPT da OpenAI ao articular seu raciocínio antes de entregar uma resposta a um prompt. A empresa alega que seu lançamento R1 oferece desempenho equivalente à última iteração do ChatGPT. Ela está oferecendo licenças para indivíduos interessados em desenvolver chatbots usando a tecnologia para construir sobre ela, a um preço bem abaixo do que a OpenAI cobra por acesso semelhante.

Como o DeepSeek R1 se compara ao OpenAI ou ao Meta AI?
DeepSeek diz que o desempenho do R1 se aproxima ou melhora o de modelos rivais em vários benchmarks líderes, como AIME 2024 para tarefas matemáticas, MMLU para conhecimento geral e AlpacaEval 2.0 para desempenho de perguntas e respostas. Ele também está entre os de melhor desempenho em uma tabela de classificação afiliada à UC Berkeley chamada Chatbot Arena.

Embora não totalmente detalhado pela empresa, o custo de treinamento e desenvolvimento dos modelos da DeepSeek parece ser apenas uma fração do que é necessário para os melhores produtos da OpenAI ou Meta Platforms Inc. A maior eficiência do modelo coloca em questão a necessidade de grandes gastos de capital para adquirir os mais recentes e poderosos aceleradores de IA de empresas como a Nvidia. Ele também foca a atenção nas restrições de exportação dos EUA de tais semicondutores avançados para a China — que tinham como objetivo evitar um avanço do tipo que a DeepSeek parece representar.

Quando o DeepSeek despertou interesse global?
O desenvolvedor de IA tem sido observado de perto desde o lançamento de seu primeiro modelo em 2023. Então, em novembro, ele deu ao mundo um vislumbre de seu modelo de raciocínio DeepSeek R1, projetado para imitar o pensamento humano. Esse modelo sustenta seu aplicativo de chatbot, que explodiu em popularidade como uma alternativa OpenAI muito mais barata, com o investidor Marc Andreessen chamando-o de “momento Sputnik da IA”.

O aplicativo móvel DeepSeek foi baixado 1,6 milhão de vezes até 25 de janeiro e ficou em primeiro lugar nas lojas de aplicativos para iPhone na Austrália, Canadá, China, Cingapura, EUA e Reino Unido, de acordo com dados do rastreador de mercado App Figures.

O que aprendemos com a reação do mercado de ações gigante?
Durante boa parte dos últimos dois anos, desde que o ChatGPT deu início ao frenesi global da IA, os investidores apostaram que as melhorias na IA exigiriam chips cada vez mais avançados, como a Nvidia.

O avanço do DeepSeek sugere que estão surgindo modelos de IA que podem atingir um desempenho comparável usando chips menos sofisticados por um investimento menor.

Os investidores se livraram das ações da Nvidia em resposta, fazendo com que as ações caíssem 17% em 27 de janeiro e eliminando US$ 589 bilhões em valor da maior empresa do mundo — um recorde no mercado de ações. A fabricante de máquinas semicondutoras ASML Holding NV e outras empresas que também se beneficiaram da crescente demanda por hardware de IA de ponta também caíram.

O sucesso do DeepSeek coloca em questão os enormes gastos de empresas como a Meta e a Microsoft Corp. — cada uma das quais se comprometeu com investimentos de capital de US$ 65 bilhões ou mais este ano, principalmente em infraestrutura de IA.

As ações da Meta e da Microsoft também abriram em baixa, embora por margens menores do que a Nvidia, com os investidores avaliando o potencial de economias substanciais nos investimentos em IA das gigantes da tecnologia. A Meta até se recuperou mais tarde na sessão para fechar em alta. Nomes chineses ligados à DeepSeek, como Iflytek Co., também subiram.

Alguns observadores do setor sugeriram que o setor como um todo poderia se beneficiar do avanço do DeepSeek se ele pressionasse a OpenAI e outros provedores dos EUA a cortar seus preços, estimulando uma adoção mais rápida da IA.

Como o DeepSeek afeta a competição estratégica global sobre IA?
A IA é a fronteira-chave na disputa EUA-China pela supremacia tecnológica. Washington proibiu a exportação para a China de equipamentos como unidades de processamento gráfico de ponta em uma tentativa de estancar os avanços do país.

O progresso do DeepSeek sugere que engenheiros de IA chineses contornaram essas restrições, concentrando-se em maior eficiência com recursos limitados. Ainda assim, não está claro a quanto hardware avançado de treinamento de IA o DeepSeek teve acesso.

Já, desenvolvedores ao redor do mundo estão experimentando o software da DeepSeek e buscando construir ferramentas com ele. Isso pode ajudar empresas dos EUA a melhorar a eficiência de seus modelos de IA e acelerar a adoção de raciocínio avançado de IA.

Isso, por sua vez, pode forçar os reguladores a estabelecer regras sobre como esses modelos são usados e com que finalidade.

O progresso do DeepSeek levanta outra questão, que geralmente surge quando uma empresa chinesa faz avanços em mercados estrangeiros: os enormes volumes de dados que o aplicativo móvel coleta e armazena em servidores chineses podem representar uma ameaça à privacidade ou à segurança dos cidadãos dos EUA?

O fato de os modelos do DeepSeek serem de código aberto abre a possibilidade de que usuários nos EUA possam pegar o código e executar os modelos de uma forma que não afete os servidores na China.

Quem é o fundador do DeepSeek?
Nascido em Guangdong em 1985, o graduado em engenharia Liang nunca estudou ou trabalhou fora da China continental. Ele recebeu diplomas de bacharel e mestrado em engenharia eletrônica e de informação pela Universidade de Zhejiang. Ele fundou a DeepSeek com 10 milhões de yuans (US$ 1,4 milhão) em capital registrado, de acordo com o banco de dados da empresa Tianyancha.

O gargalo para mais avanços não é mais arrecadação de fundos, disse Liang em uma entrevista ao canal chinês 36kr, mas as restrições dos EUA ao acesso aos melhores chips. A maioria de seus principais pesquisadores eram recém-formados nas principais universidades chinesas, disse ele, enfatizando a necessidade de a China desenvolver seu próprio ecossistema doméstico semelhante ao construído em torno da Nvidia e seus chips de IA.

“Mais investimento não necessariamente leva a mais inovação. Caso contrário, grandes empresas assumiriam toda a inovação”, disse Liang.

Liang foi comparado ao fundador da OpenAI, Sam Altman, mas o cidadão chinês mantém um perfil muito mais discreto e raramente fala em público.

Qual a posição do DeepSeek no cenário de IA da China?
Os líderes de tecnologia da China, da Alibaba Group Holding Ltd. e Baidu Inc. à Tencent Holdings Ltd., investiram dinheiro e recursos significativos na corrida para adquirir hardware e clientes para seus empreendimentos de IA. Junto com a startup 01.AI de Kai-Fu Lee, a DeepSeek se destaca com sua abordagem de código aberto — projetada para recrutar o maior número de usuários rapidamente antes de desenvolver estratégias de monetização sobre esse grande público.

Como os modelos da DeepSeek são mais acessíveis, eles já desempenharam um papel na redução de custos para desenvolvedores de IA na China, onde os maiores players se envolveram em uma guerra de preços que viu ondas sucessivas de cortes de preços ao longo do último ano e meio.

Quais são as deficiências do DeepSeek?
Como todos os outros modelos de IA chineses, o DeepSeek se autocensura em tópicos considerados sensíveis na China. Ele desvia perguntas sobre os protestos da Praça da Paz Celestial de 1989 ou questões geopoliticamente carregadas, como a possibilidade da China invadir Taiwan. Em testes, o bot DeepSeek é capaz de dar respostas detalhadas sobre figuras políticas como o primeiro-ministro indiano Narendra Modi, mas se recusa a fazê-lo sobre o presidente chinês Xi Jinping.

A infraestrutura de nuvem da DeepSeek provavelmente será testada por sua popularidade repentina. A empresa passou por uma breve interrupção em 27 de janeiro e terá que gerenciar ainda mais tráfego, já que usuários novos e recorrentes despejam mais consultas em seu chatbot.

Publicado originalmente em https://t.ly/7UAgq – Yahoo Finance

Tópicos Quentes

Eleições 2024 - Regras

Eleições 2024 - Candidatos

Eleições 2024 - Campanhas

Eleições 2024 - Espectativas

Tópicos Quentes

Eleições 2024 - Regras

Eleições 2024 - Candidatos

Eleições 2024 - Campanhas

Eleições 2024 - Espectativas

Tópicos

Artigos Relacionados

Propósitos

Negócios

Últimas Publicações

Boletins por Email