TradingKey - 9月29日,DeepSeek正式发布 DeepSeek-V3.2-Exp模型,且官方API价格下调,新价格已即刻生效。
输入价格方面,DeepSeek-V3.2-Exp降低50%以上,输出价格下降75%,这主要得益于新模型服务成本的降低。业界人士表示,这一价格使得其他企业的类似服务很难与其竞争。
另外,这一版本模型实现了核心技术突破,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制。
DeepSeek表示,V3.2-Exp是实验版本,作为迈向下一代架构的过渡模型,它在V3.1-Terminus的基础上引入了DSA机制,这种架构旨在降低计算资源消耗的同时提升模型推理效率。
DeepSeek评测结果显示,V3.2-Exp与V3.1-Terminus的表现基本持平,前者在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
DeepSeek表示,V3.2-Exp模型目前已在Huggingface与魔搭开源。对于DeepSeek的V4和R2版本,外界猜测近期可能不会发布。
目前,华为云、寒武纪均已完成对DeepSeek-V3.2-Exp模型的适配工作,华为云最大可支持160K长序列上下文长度。