A Deepseek lançou o R1-0528, uma grande atualização para o modelo de raciocínio R1 da start-up chinês, lançado em janeiro. A atualização chegou apenas um mês depois que o QWEN3 do Alibaba Group Holding venceu o Deepseek R1 original em Livebench, um benchmark on-line para modelos de inteligência artificial de código aberto.
O modelo R1-0528 atualizado da DeepSeek agora está ao lado dos modelos de IA líderes do OpenAI e Google no desempenho. O retorno mostra a rapidez com que as grandes empresas de tecnologia e empresas de tecnologia mais recentes estão pressionando para melhorar suas ferramentas de IA.
Em seu comunicado, Deepseek disse que R1-0528 mostra melhores habilidades de raciocínio e escrita criativa. A atualização também traz a capacidade de codificaçãotronGer. Mais importante, a empresa afirma que o modelo agora produz 50% menos "alucinações".
A Deepseek explicou que as atualizações vieram de poder de computação extra investido durante a fase pós-treinamento, quando os engenheiros ajustam um modelo após o principal processo de treinamento. Durante a fase pós-treinamento, os engenheiros visam aumentar a eficiência do modelo e aprimorar sua precisão e segurança.
No LivecodeBench, que mede o desempenho do modelo de IA, o R1-0528 agora está logo atrás dos modelos O4-Mini e O3 do Openai.
"A última atualização da Deepseek é mais nítida sobre o raciocínio, otronGer sobre matemática e código e fechando modelos de primeira linha como Gemini e O3", disse Adina Yakefu, pesquisadora de IA da Hugging Face.
Ela acrescentou que a nova versão mostra "grandes melhorias na inferência e redução de alucinação" e prova que a start-up não está apenas alcançando, mas competindo ativamente.
O rápido progresso ocorreu depois que Washington restringiu chips avançados e outras exportações de tecnologia para a China. No entanto, as empresas chinesas continuam a refinar seus sistemas. No início deste mês, Baidu e Tencent descreveram maneiras pelas quais estão fazendo seus modelos funcionarem com mais eficiência, apesar do acesso limitado a semicondutores de ponta.
O executivo -chefe da Nvidia, Jensen Huang, criticou os controles de exportação na quarta -feira. "Os EUA basearam sua política na suposição de que a China não pode fazer chips de IA", disse ele. "Essa suposição sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Já faz."
A Deepseek também disse que destilou as etapas de raciocínio usadas em R1-0528 no QWEN3 8B do Alibaba. Esse processo criou um modelo novo e menor que superou o desempenho da QWEN3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.
"Acreditamos que a cadeia de pensamentos da DeepSeek-R1-0528 terá uma importância significativa para pesquisas acadêmicas sobre modelos de raciocínio e trabalho industrial em pequenos modelos", afirmou a empresa.
Segundo a Reuters, um representante do Deepseek disse a um grupo do WeChat que a mudança era uma "atualização de julgamento menor" que já estava aberta para testes públicos. Em resposta à competição mais feroz, o Google desconsiderou algumas camadas de acesso de Gemini, enquanto o OpenAI introduziu o modelo O3 Mini de menor custo.
Academia Cryptopolitan: Cansado de balanços de mercado? Saiba como DeFi pode ajudá -lo a criar renda passiva constante. Registre -se agora