Sakana AI發佈多智能體系統Fugu:跑分超越GPT5.4與Opus4.6

來源 Jinse_news
金色財經報道,日本 AI 研發公司 Sakana AI 宣佈推出旗艦商用產品 Sakana Fugu,並開放早期 Beta 測試申請。系統定位爲多智能體編排系統,以兼容 OpenAI 格式的單模型 API 形式提供服務,包含側重低延遲優化的 Sakana Fugu Mini 與面向嚴苛任務的 Sakana Fugu Ultra。 產品架構基於團隊在 ICLR 2026 發表的 Trinity 與 Conductor 論文。系統核心爲一個自律學習的輕量級語言模型,無需依靠人工預設的團隊角色或固定流水線,而是根據任務難度動態調用 Worker 模型池並分配分工。系統同時支持測試時縮放,具備自適應遞歸調用能力。模型能夠將自身先前的輸出作爲上下文進行讀取,從而在運行中自主識別缺陷並啓動糾錯工作流,用戶可將遞歸深度作爲推理時可調的算力軸。 評測數據顯示,在硬核推理與編碼基準測試中,Sakana Fugu Ultra 展現出超越前沿單模型的表現。在 GPQAD、LCBv6 與 SWEPro 測試中,Sakana Fugu Ultra 分別取得 95.1、93.2 和 54.2 的成績,表現優於 GPT 5.4、Gemini 3.1 以及 Opus 4.6 等主流旗艦單模型。
免責聲明:僅供參考。 過去的表現並不預示未來的結果。
goTop
quote