O QWEN3 do Alibaba derrota o R1 de Deepseek, agora lidera modelos de IA de código aberto

A nova família de modelos de IA da Alibaba, da Família QWEN3, superou o R1 da Deepseek para se tornar o melhor modelo de código aberto do mundo. Segundo relatos, a QWEN3 fez melhor que o R1 em testes que medem as habilidades dos modelos de IA de código aberto em áreas como instrução de idiomas, matemática, codificação e análise de dados.
A família QWEN3 foi lançada na semana passada pela unidade de computação em nuvem da Alibaba. Possui oito modelos aprimorados com entre 600 milhões e 235 bilhões de parâmetros. No aprendizado de máquina, os parâmetros são as variáveis em um sistema de IA enquanto está sendo treinado.
De acordo com LiveBench , uma plataforma independente dent testa grandes modelos de idiomas, antes desses novos testes, o R1 da Deepseek era o melhor modelo de IA de código aberto do mundo desde que foi lançado em janeiro. Mas não mais.
As empresas americanas e chinesas correm para adotar Qwen 3
A ascensão do QWEN3 no ranking do Livebench mostra a rapidez com que a IA está se desenvolvendo na China. A indústria de tecnologia chinesa cresceu muito graças às ferramentas de código aberto. O código do método de código aberto do Alibaba permitiu que outros desenvolvedores de software de terceiros compartilhassem o design, corrigissem links quebrados ou tornam o programa mais poderoso.
No entanto, os resultados gerais do LiveBench mostraram que o QWEN3 não era tão bom quanto o O3 O3, o Gemini Pro 2.5 do Google e o Claude 3.7 do Antrópico, que são os melhores modelos de IA de código fechado do mundo. O Livebench diz que o O3-Mini High, o modelo de IA mais popular do OpenAI, foi o melhor do mundo em geral. Microsoft Backs OpenAi.
Para cada 1 milhão de tokens, são necessários US $ 10 para executar O3. Por outro lado, o QWEN3 é mais barato de usar, porque custa apenas US $ 0,55 por 1 milhão de tokens para executar. Como a QWEN3 é mais barata e funciona melhor, muitas empresas disseram que apoiariam o mais novo modelo de IA do Alibaba assim que saiu.
Tecnologias Huawei, Threads Moore, Technologies Cambricon e Hygon Information Technology são empresas de chips que disseram que apoiarão a QWEN3.
Cambricon disse na terça -feira passada que havia otimizado com sucesso o QWEN3 para executar rapidamente em suas unidades de processamento de gráficos. Isso foi feito porque os desenvolvedores de IA nas Filipinas queriam chips feitas na China.
O QWEN3 também está sendo usado nos serviços de computação em nuvem de hiperbólicos e fogos de artifício. Os fabricantes de chips americanos Nvidia e Intel começaram a apoiar a QWEN3.
Muitos big centers da China, como os de Pequim, Xangai, Hangzhou e as províncias de Hubei, Jilin e Northwest Shaanxi, também disseram que usarão os modelos Qwen AI de terceira geração da Alibaba. A rede de supercomputação na China também adotou o QWEN3. Essa rede vincula mais de 20 data centers em 20 cidades em 14 províncias.
CEO antrópico diz que a Deepseek era "um pouco exagerada"
Em um evento de negócios, co-fundador da Anthropic, a empresa que fez os modelos de IA de Claude disse que a Deepseek ainda está "seis a oito meses atrás, onde as empresas de fronteira dos EUA estão". Ele também disse que o burburinho recente em torno da start-up chinês era "talvez um pouco exagerado".
Deepseek chamou atenção em todo o mundo no final de dezembro de 2024 e no início de janeiro de 2025, compartilhando dois modelos avançados de IA de código aberto, V3 e R1. Esses modelos foram feitos para uma pequena fração do poder de custo e computação que as grandes empresas de tecnologia geralmente precisam de projetos de LLM.
Não está claro quando a Deepseek lançará a próxima geração de seus modelos. A empresa com sede em Hangzhou lançou discretamente seu Prover-V2 de 671 bilhões de parâmetros no final de abril . Esta foi uma atualização para o seu modelo especializado para lidar com provas de matemática. No entanto, ele não disse nada sobre o progresso de seu tão esperado modelo de raciocínio R2.
Isenção de responsabilidade: este artigo representa apenas a opinião do autor e não pode ser usado como consultoria de investimento. O conteúdo do artigo é apenas para referência. Os leitores não devem tomar este artigo como base para investimento. Antes de tomar qualquer decisão de investimento, procure orientação profissional independente para garantir que você entenda os riscos.
Os Contratos por Diferença (CFDs) são produtos alavancados que podem resultar na perda de todo o seu capital. Esses produtos não são adequados para todos os clientes; por favor, invista com rigor. Consulte este arquivo para obter mais informações.