DeepSeek已推出R1-0528,这是对中国初创企业R1推理模型的重大升级,该模型于一月份发布。在阿里巴巴集团Holding的Qwen3击败了LiveBench的原始DeepSeek R1之后,升级仅一个月才到达,这是开源人造模型的在线基准。
DeepSeek升级的R1-0528型号现在与OpenAI和Google Performance的领先AI模型一起站立。复出表明,中国大型技术公司和新技术公司正在推动改善AI工具的速度。
DeepSeek在声明中说,R1-0528表现出更好的推理和创造性的写作技巧。该更新还具有StronGER编码能力。最重要的是,该公司声称该模型现在产生的“幻觉”减少了50%。
DeepSeek解释说,这些升级来自在训练后培训阶段投入的额外计算能力,当时工程师在主要培训过程后对模型进行了微调。在训练后阶段,工程师旨在提高模型的效率并提高其准确性和安全性。
在测量AI模型性能的LiveCodeBench上, R1-0528现在仅落后于OpenAI的O4-Mini和O3型号。
Hugging Face的AI研究人员Adina Yakefu说:“ DeepSeek的最新升级是推理,tronGER的数学和代码方面的更加清晰,并关闭了Gemini和O3等顶级模型。”
她补充说,新版本显示了“推理和减少幻觉的重大改进”,并证明这家初创企业不仅在赶上,而且在积极竞争中。
在华盛顿将高级筹码和其他技术出口限制为中国之后,进步迅速。然而,中国公司继续完善其系统。本月初,Baidu和Tencent描述了他们使模型运行效率更高的方式,尽管访问了尖端的半导体。
NVIDIA首席执行官詹森·黄(Jensen Huang)周三批评出口控制。他说:“美国基于中国不能制造AI芯片的假设。” “这个假设总是值得怀疑的,现在显然是错误的。问题不是中国是否会有AI。它已经做到了。”
DeepSeek还表示,它将R1-0528中使用的推理步骤提炼为阿里巴巴的Qwen3 8b基本型号。据该公司称,该过程创造了一种新的,较小的模型,该模型超过了Qwen3的性能超过10%。同时,该型号小于30倍。
该公司表示:“我们认为,DeepSeek-R1-0528的思想链对于在小型模型上的推理模型和工业工作中的学术研究将非常重要。”
据路透社报道,一位Deepseek代表告诉一个微信集团,这一变化是“次要审判升级”,已经开放了公共测试。为了响应激烈的竞争,Google折扣了一些双子座访问层,而OpenAI则引入了低成本的O3 Mini型号。
密码大都会学院:厌倦了市场波动?了解DeFi帮助您建立稳定的被动收入。立即注册