Openai将AI模型供电运算符从GPT-4O的先前自定义版本更新为基于O3的模型,O3是OpenAI O系列“推理”模型中最新的模型之一。 O3操作员对计算机使用的其他安全数据进行了微调,并包括旨在教授模型决策边界的安全数据集。
Openai使用OpenAI O3版本的新计算机使用代理(CUA)模型在Chatgpt升级了借助新模型,在与浏览器交互时,操作员变得更加持久,更准确,从而提高了整体任务成功率。它还提供了更明确和彻底的结构响应。
根据Openai,新的CUA模型显示了相对于该行业的tron 它还显示了tron版本的相对性能,无论是在已建立的基准和人类偏好评估中。
Openai提示CHATGPT运营商代理pic.twitter.com/igpqp9butd
- Sabatage(@sabatage) 2025年5月22日
OpenAI用OpenAI O3的版本代替了现有的基于GPT-4O的操作员模型,尽管API版本将基于4O。 AI公司还声称,O3操作员使用与4O版本相同的多层安全方法。
但是,与O3家族中的其他型号相比,O3操作员对计算机使用的其他安全数据进行了微调,包括旨在教授有关确认和拒绝的模型决策边界的安全数据集。
OpenAI发布了一份技术报告,显示了O3操作员在特定安全评估方面的性能。与GPT-4O操作员模型相比,O3操作员不太可能拒绝执行“非法”活动,并搜索敏感的个人数据,并且不易受到一种称为“及时注入”的AI攻击形式。
“ O3运算符使用与4O版运算符相同的多层安全方法……尽管O3运算符继承了O3的编码功能,但它没有对编码环境或终端的本机访问。”
–开放人工智能
AI公司还透露,新的基于O3的模型通过了标准的安全评估,并且运营商继续作为研究预览,用于全球Chatgpt Pro用户。但是,此升级的模型仅在Chatgpt的运营商中可用。
上周,维持和管理Arc-Agi的ARC奖基金会更新了其O3的近似计算成本。该组织最初估计,O3测试的O3高度表现最佳的配置,O3高约3K左右,以解决一个单个ARC-AGI问题。但是,基金会现在认为,成本可能比以前估计的10倍,每任务可能约为3万美元。
同样,尽管Openai尚未对O3进行定价或完全发布,但ARC奖基金会的共同创始人之一Mike Knoop认为O1-Pro模型定价是合理的代理,并且对O3的真实成本进行了更紧密的比较。但是,他补充说,O3将继续被标记为排行榜上的预览,以反映不确定性,直到宣布正式定价为止。
根据ARC奖基金会的说法,鉴于该模型据报道使用的计算资源数量,O3高价的高价不会不可能。 O3高使用的172x计算比O3低的O3高度计算,是O3的最低计算配置,以应对ARC-AGI。
自3月初以来,关于Openai的昂贵计划正在考虑为企业客户介绍昂贵的计划。该信息报告说,该公司的专业AI“代理商”每月最多可收取高达20k美元的费用,例如软件开发人员代理。
但是,尽管有人认为,即使是Openai最昂贵的模型也会在典型的人类trac或员工所指挥的情况下成本良好,但AI研究人员Toby Ord指出,这些模型可能不那么高效。例如,O3 High需要1,024次尝试在ARC-AGI中的每个任务中获得最佳分数。
钥匙差线:秘密工具加密项目用于获得保证媒体覆盖