R1-0528 de Deepseek agora está logo atrás do O4-Mini do Openai

Fonte Cryptopolitan

A Deepseek lançou o R1-0528, uma grande atualização para o modelo de raciocínio R1 da start-up chinês, lançado em janeiro. A atualização chegou apenas um mês depois que o QWEN3 do Alibaba Group Holding venceu o Deepseek R1 original em Livebench, um benchmark on-line para modelos de inteligência artificial de código aberto.

O modelo R1-0528 atualizado da DeepSeek agora está ao lado dos modelos de IA líderes do OpenAI e Google no desempenho. O retorno mostra a rapidez com que as grandes empresas de tecnologia e empresas de tecnologia mais recentes estão pressionando para melhorar suas ferramentas de IA.

Em seu comunicado, Deepseek disse que R1-0528 mostra melhores habilidades de raciocínio e escrita criativa. A atualização também traz a capacidade de codificaçãotronGer. Mais importante, a empresa afirma que o modelo agora produz 50% menos "alucinações".

A Deepseek explicou que as atualizações vieram de poder de computação extra investido durante a fase pós-treinamento, quando os engenheiros ajustam um modelo após o principal processo de treinamento. Durante a fase pós-treinamento, os engenheiros visam aumentar a eficiência do modelo e aprimorar sua precisão e segurança.

R1-0528 agora está logo atrás do OpenAi e O4-Mini do Openai

No LivecodeBench, que mede o desempenho do modelo de IA, o R1-0528 agora está logo atrás dos modelos O4-Mini e O3 do Openai.

"A última atualização da Deepseek é mais nítida sobre o raciocínio, otronGer sobre matemática e código e fechando modelos de primeira linha como Gemini e O3", disse Adina Yakefu, pesquisadora de IA da Hugging Face.

Ela acrescentou que a nova versão mostra "grandes melhorias na inferência e redução de alucinação" e prova que a start-up não está apenas alcançando, mas competindo ativamente.

O rápido progresso ocorreu depois que Washington restringiu chips avançados e outras exportações de tecnologia para a China. No entanto, as empresas chinesas continuam a refinar seus sistemas. No início deste mês, Baidu e Tencent descreveram maneiras pelas quais estão fazendo seus modelos funcionarem com mais eficiência, apesar do acesso limitado a semicondutores de ponta.

O executivo -chefe da Nvidia, Jensen Huang, criticou os controles de exportação na quarta -feira. "Os EUA basearam sua política na suposição de que a China não pode fazer chips de IA", disse ele. "Essa suposição sempre foi questionável e agora está claramente errada. A questão não é se a China terá IA. Já faz."

Deepseek aumentou o desempenho do modelo QWEN3 8B do Alibaba em 10%

A Deepseek também disse que destilou as etapas de raciocínio usadas em R1-0528 no QWEN3 8B do Alibaba. Esse processo criou um modelo novo e menor que superou o desempenho da QWEN3 em mais de 10%, segundo a empresa. Ao mesmo tempo, o modelo era 30 vezes menor.

"Acreditamos que a cadeia de pensamentos da DeepSeek-R1-0528 terá uma importância significativa para pesquisas acadêmicas sobre modelos de raciocínio e trabalho industrial em pequenos modelos", afirmou a empresa.

Segundo a Reuters, um representante do Deepseek disse a um grupo do WeChat que a mudança era uma "atualização de julgamento menor" que já estava aberta para testes públicos. Em resposta à competição mais feroz, o Google desconsiderou algumas camadas de acesso de Gemini, enquanto o OpenAI introduziu o modelo O3 Mini de menor custo.

Academia Cryptopolitan: Cansado de balanços de mercado? Saiba como DeFi pode ajudá -lo a criar renda passiva constante. Registre -se agora

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
Por que os investidores da Tesla ainda são tão baixa depois de todos os esforços de Elon Musk e as ações que surgem?As ações da Tesla só saltaram 7,7% nas negociações após o horário comercial, mas os investidores ainda estão resgatando como o vazamento do navio. Elon Musk diz que está recuando da política para se concentrar na empresa, mas isso não está impedindo que os apoiadores de longa data se afastem. Na quarta -feira, o consultor de investimentos e a Tesla Whale Gary Black disse que finalmente vendeu todo o seu […]
Autor  Cryptopolitan
5 Mês 29 Dia Qui
As ações da Tesla só saltaram 7,7% nas negociações após o horário comercial, mas os investidores ainda estão resgatando como o vazamento do navio. Elon Musk diz que está recuando da política para se concentrar na empresa, mas isso não está impedindo que os apoiadores de longa data se afastem. Na quarta -feira, o consultor de investimentos e a Tesla Whale Gary Black disse que finalmente vendeu todo o seu […]
placeholder
Os mercados asiáticos e os futuros dos EUA surgiram após a decisão do tribunal contra as tarifas de TrumpAs bolsas de ações asiáticas aumentaram na quinta -feira, depois que um tribunal dos EUA bloqueou o President Donald Trump de usar uma lei de poderes de emergência para dar um tapa em grandes tarifas sobre as importações. Os futuros do índice dos EUA também subiram em reação, apontando para otronGer Wall Street aberto. O Banco Central da Coréia do Sul, por outro lado, reduziu sua taxa de juros principal, e o sul […]
Autor  Cryptopolitan
5 Mês 29 Dia Qui
As bolsas de ações asiáticas aumentaram na quinta -feira, depois que um tribunal dos EUA bloqueou o President Donald Trump de usar uma lei de poderes de emergência para dar um tapa em grandes tarifas sobre as importações. Os futuros do índice dos EUA também subiram em reação, apontando para otronGer Wall Street aberto. O Banco Central da Coréia do Sul, por outro lado, reduziu sua taxa de juros principal, e o sul […]
placeholder
Preço do ouro parece vulnerável abaixo de US$ 3.300 em meio a notícias sobre tarifas e dólar mais forteO preço do ouro (XAU/USD) atingiu uma baixa de uma semana e meia, em torno da área de US$ 3.246-3.245 durante a sessão asiática de quinta-feira, em reação à notícia de que um tribunal federal bloqueou a entrada em vigor das tarifas comerciais do presidente dos EUA, Donald Trump..
Autor  FXStreet
5 Mês 29 Dia Qui
O preço do ouro (XAU/USD) atingiu uma baixa de uma semana e meia, em torno da área de US$ 3.246-3.245 durante a sessão asiática de quinta-feira, em reação à notícia de que um tribunal federal bloqueou a entrada em vigor das tarifas comerciais do presidente dos EUA, Donald Trump..
placeholder
A NVIDIA vê receita de US $ 44,06 bilhões no primeiro trimestre de 2025, um aumento de 72% como futuros de ações em reaçãoA NVIDIA registrou um primeiro trimestre na quarta -feira, recebendo US $ 44,06 bilhões em receita - 72% a mais do que fabricados no mesmo período do ano passado - de acordo com os dados relatados pela LSEG. O número atingiu bem as expectativas e imediatamente aumentou as ações da Nvidia em torno de 6% nas negociações após o horário comercial. A empresa também venceu os ganhos, registrando 96 centavos […]
Autor  Cryptopolitan
5 Mês 29 Dia Qui
A NVIDIA registrou um primeiro trimestre na quarta -feira, recebendo US $ 44,06 bilhões em receita - 72% a mais do que fabricados no mesmo período do ano passado - de acordo com os dados relatados pela LSEG. O número atingiu bem as expectativas e imediatamente aumentou as ações da Nvidia em torno de 6% nas negociações após o horário comercial. A empresa também venceu os ganhos, registrando 96 centavos […]
placeholder
XRP adere à tendência de tesouraria de criptomoedas com a VivoPower levantando US$ 121 milhões para lançar a reserva de XRPA XRP caiu mais de 2% na quarta-feira, quando a VivoPower anunciou planos para se tornar a primeira empresa de capital aberto a adotar a XRP como um ativo de reserva de tesouraria. O anúncio segue a conclusão da empresa de uma oferta privada de US$ 121 milhões.
Autor  FXStreet
5 Mês 29 Dia Qui
A XRP caiu mais de 2% na quarta-feira, quando a VivoPower anunciou planos para se tornar a primeira empresa de capital aberto a adotar a XRP como um ativo de reserva de tesouraria. O anúncio segue a conclusão da empresa de uma oferta privada de US$ 121 milhões.
goTop
quote