Openai將AI模型供電運算符從GPT-4O的先前自定義版本更新爲基於O3的模型,O3是OpenAI O系列“推理”模型中最新的模型之一。 O3操作員對計算機使用的其他安全數據進行了微調,幷包括旨在教授模型決策邊界的安全數據集。
Openai使用OpenAI O3版本的新計算機使用代理(CUA)模型在Chatgpt升級了藉助新模型,在與瀏覽器交互時,操作員變得更加持久,更準確,從而提高了整體任務成功率。它還提供了更明確和徹底的結構響應。
根據Openai,新的CUA模型顯示了相對於該行業的tron 它還顯示了tron版本的相對性能,無論是在已建立的基準和人類偏好評估中。
Openai提示CHATGPT運營商代理pic.twitter.com/igpqp9butd
- Sabatage(@sabatage) 2025年5月22日
OpenAI用OpenAI O3的版本代替了現有的基於GPT-4O的操作員模型,儘管API版本將基於4O。 AI公司還聲稱,O3操作員使用與4O版本相同的多層安全方法。
但是,與O3家族中的其他型號相比,O3操作員對計算機使用的其他安全數據進行了微調,包括旨在教授有關確認和拒絕的模型決策邊界的安全數據集。
OpenAI發佈了一份技術報告,顯示了O3操作員在特定安全評估方面的性能。與GPT-4O操作員模型相比,O3操作員不太可能拒絕執行“非法”活動,並搜索敏感的個人數據,並且不易受到一種稱爲“及時注入”的AI攻擊形式。
“ O3運算符使用與4O版運算符相同的多層安全方法……儘管O3運算符繼承了O3的編碼功能,但它沒有對編碼環境或終端的本機訪問。”
–開放人工智能
AI公司還透露,新的基於O3的模型通過了標準的安全評估,並且運營商繼續作爲研究預覽,用於全球Chatgpt Pro用戶。但是,此升級的模型僅在Chatgpt的運營商中可用。
上週,維持和管理Arc-Agi的ARC獎基金會更新了其O3的近似計算成本。該組織最初估計,O3測試的O3高度表現最佳的配置,O3高約3K左右,以解決一個單個ARC-AGI問題。但是,基金會現在認爲,成本可能比以前估計的10倍,每任務可能約爲3萬美元。
同樣,儘管Openai尚未對O3進行定價或完全發佈,但ARC獎基金會的共同創始人之一Mike Knoop認爲O1-Pro模型定價是合理的代理,並且對O3的真實成本進行了更緊密的比較。但是,他補充說,O3將繼續被標記爲排行榜上的預覽,以反映不確定性,直到宣佈正式定價爲止。
根據ARC獎基金會的說法,鑑於該模型據報道使用的計算資源數量,O3高價的高價不會不可能。 O3高使用的172x計算比O3低的O3高度計算,是O3的最低計算配置,以應對ARC-AGI。
自3月初以來,關於Openai的昂貴計劃正在考慮爲企業客戶介紹昂貴的計劃。該信息報告說,該公司的專業AI“代理商”每月最多可收取高達20k美元的費用,例如軟件開發人員代理。
但是,儘管有人認爲,即使是Openai最昂貴的模型也會在典型的人類trac或員工所指揮的情況下成本良好,但AI研究人員Toby Ord指出,這些模型可能不那麼高效。例如,O3 High需要1,024次嘗試在ARC-AGI中的每個任務中獲得最佳分數。
鑰匙差線:祕密工具加密項目用於獲得保證媒體覆蓋