GLM 5.2复现学术论文成本仅为Opus 4.8的约八分之一
来源 Jinse_news
6月26日消息,在学术复现测试中,开源大模型 GLM 5.2 展现出极高性价比。科研平台 alphaXiv 团队使用自动化代理测试大模型复现前沿论文的能力。在复现自蒸馏强化学习论文 SDPO 时,GLM 5.2 产生的运行成本仅为闭源旗舰模型 Claude Opus 4.8 Max 的约八分之一。
实验要求模型自主阅读论文、排查开源库 VeRL 复杂的环境报错并跑完消融实验。GLM 5.2 经历 14 次运行失败后成功复现,消耗 265 万 tokens,总花费 6.21 美元。Claude Opus 4.8 Max 经历 9 次失败后成功,消耗 453 万 tokens,花费达 46.35 美元。
免责声明:仅供参考。 过去的表现并不预示未来的结果。
推荐文章