GLM 5.2復現學術論文成本僅爲Opus 4.8的約八分之一

來源 Jinse_news
6月26日消息,在學術復現測試中,開源大模型 GLM 5.2 展現出極高性價比。科研平臺 alphaXiv 團隊使用自動化代理測試大模型復現前沿論文的能力。在復現自蒸餾強化學習論文 SDPO 時,GLM 5.2 產生的運行成本僅爲閉源旗艦模型 Claude Opus 4.8 Max 的約八分之一。 實驗要求模型自主閱讀論文、排查開源庫 VeRL 複雜的環境報錯並跑完消融實驗。GLM 5.2 經歷 14 次運行失敗後成功復現,消耗 265 萬 tokens,總花費 6.21 美元。Claude Opus 4.8 Max 經歷 9 次失敗後成功,消耗 453 萬 tokens,花費達 46.35 美元。
免責聲明:僅供參考。 過去的表現並不預示未來的結果。
goTop
quote