TradingKey - 9月29日,DeepSeek正式發表 DeepSeek-V3.2-Exp模型,且官方API價格下調,新價格已立即生效。
輸入價格方面,DeepSeek-V3.2-Exp降低50%以上,輸出價格下降75%,主要得益於新模型服務成本的降低。業界人士表示,這筆價格使得其他企業的類似服務很難與其競爭。
另外,這個版本模型實現了核心技術突破,DeepSeek Sparse Attention(DSA)首次實現了細粒度稀疏注意力機制。
DeepSeek表示,V3.2-Exp是實驗版本,作為邁向下一代架構的過渡模型,它在V3.1-Terminus的基礎上引入了DSA機制,這種架構旨在降低計算資源消耗的同時提升模型推理效率。
DeepSeek評測結果顯示,V3.2-Exp與V3.1-Terminus的表現基本持平,前者在幾乎不影響模型輸出效果的前提下,實現了長文本訓練和推理效率的大幅提升。
DeepSeek表示,V3.2-Exp模型目前已在Huggingface與魔搭開源。對於DeepSeek的V4和R2版本,外界猜測近期可能不會發布。
目前,華為雲、寒武紀都已完成DeepSeek-V3.2-Exp模型的適配工作,華為雲最大可支援160K長序列上下文長度。