除了 Gemini3,全球大模型也迎來集體升級

來源 Tradingkey

TradingKey - 本月AI競爭格外激烈,谷歌TPU新進展讓市場暫忘AI泡沫。然而,大型語言模型不只谷歌Gemini 3,全球各大模型本月持續發表新版本。

底層架構方面:Gemini 3 打破輝達依賴

目前市場最受矚目的新模型無疑是谷歌的 Gemini 3。其最大突破在於硬體架構上完全擺脫對輝達 GPU 的依賴,轉而全面採用谷歌自行研發的 TPU(Tensor Processing Unit)。

Gemini 3 的升級模式也與以往截然不同。這一次,谷歌並非在現有基礎設施上進行「微調」或「疊代」,而是徹底更換底層架構。

在模型訓練流程上,Gemini 3 的路徑也區別於傳統大型模型——例如 GPT 系列與 Llama 等通常依賴單一超大型 GPU 集群、海量文本預訓練與有限人類指令微調的方式。谷歌此次引入了「Mixture-of-Experts(專家協作)」架構:每個任務會自動分配給最匹配的子網路(專家)處理,從而顯著提高訓練的針對性與計算效率。

從本質上看,Gemini 3 更像是一套結合「基礎學習 + 專業分工 + 實戰演練」的混合體系。憑藉自行研發 TPU 硬體與分散式平行演算法的結合,谷歌成功將 AI 模型推向了更貼近真實世界應用的「通用智慧」階段,超越了以往大型模型嚴格依賴大算力堆疊的訓練套路。

根據第三方機構 Artificial Analysis 的最新綜合評分,Gemini 3 Pro 以顯著優勢排名第一,比 GPT‑5.1 高出 3 分。這是谷歌自進入語言模型領域以來,首次以絕對優勢登上全球榜首,也意味著 OpenAI 長期的領先神話正式被打破。

ai-agent-tradingkey模型層面:Anthropic 推出 Claude Opus 4.5 強勢突圍

被視為 OpenAI 與谷歌最有力競爭對手的 Anthropic,近日發布了旗艦 AI 模型最新版本——Claude Opus 4.5。

官方介紹稱,新模型在執行日常任務上的表現「顯著更強」。尤其在「代理式編程(Agentic Coding)」領域,Claude Opus 4.5 達到產業領先水準。根據軟體能力評測集 SWE‑Bench Verified 的結果,其得分優於 Gemini 3 Pro 與 GPT‑5.1。

ai-agent-tradingkey

與 OpenAI 不同的是,Anthropic 並未投入大量資源開發圖像或影片生成等重算力領域,而是聚焦於編碼能力優化與企業自動化部署,尤其強調在程式編譯、整合和任務執行等方面的落地實用性,而非人機互動對話功能。目前,該公司已為超過 30 萬家企業使用者提供服務。

在 AI 編程生態中,Anthropic 已成為不可忽視的力量。上週,微軟輝達共同宣布對 Anthropic 投資數十億美元,公司估值躍升至約 3,500 億美元。合作協議中最受矚目的部分,是微軟 Azure AI Foundry 的客戶可直接存取 Claude 系列模型——這使 Claude 成為全球唯一同時部署在三大雲端平台(Azure、AWS、Google Cloud)的尖端大型模型。

值得一提的是,Anthropic 也在顯著擴大 TPU 的使用。根據報導,公司簽署了一項價值數十億美元的長期雲端合作協議,未來將使用高達「一百萬顆 TPU」,總價值或達「數百億美元」。這不僅反映出其與谷歌的算力合作關係,也說明外部尖端 AI 開發者已普遍認可谷歌 TPU 的效能與成本優勢。

根據 Menlo Ventures 7 月發布的報告,Anthropic 在企業級 AI 採用率中位居第一,佔 32% 市場份額;OpenAI 以 25% 居次(較兩年前幾乎腰斬),谷歌 20%,Meta 9%。

應用端:OpenAI GPT‑5.1 強化生態佈局

長期以來,OpenAI 一直穩居業界「最聰明模型」的稱號。其願景是創造造福全人類的通用人工智慧(AGI),並以「大而全」的戰略路線鞏固產業主導:產品組合更豐富、組織體系更龐大。

11 月 22 日,OpenAI 正式發布 GPT‑5.1。資深 AI 使用者普遍認為,該版本較前代「明顯更智能」。

為迎接假期購物季需求高峰,OpenAI 還於本週一推出免費 AI 購物搜尋功能,試圖讓聊天模型融入消費者購物流程,從而打造新的商業化情境。

官方部落格指出,該功能基於 GPT‑5‑Thinking‑Mini 模型優化,透過問答方式收集使用者偏好,再在網路中逐步推薦 10 至 15 件商品供篩選。

過去幾週,OpenAI 密集更新產品:包括群組聊天功能、面向美國 K‑12 教師的免費版 ChatGPT,以及內建 ChatGPT 的瀏覽器版本。這顯示公司正在積極拓展使用者規模與使用情境,以因應成長壓力並強化平台生態。

ai-agent-tradingkey

中國 LLM:阿里 Qwen 3 Max 同樣出色

中國 AI 陣營同樣迎來突破。11 月 24 日,阿里巴巴發表新一代人工智慧交易模型 Qwen 3 Max(通義千問 3 Max)。

產品公開測試僅一週,下載量突破 1,000 萬次,刷新全球 AI 應用歷史紀錄。短短時間內,Qwen 3 Max 在增速上超越 ChatGPT、Sora 乃至今年稍早引發轟動的 DeepSeek,成為史上增速最快的 AI 產品。

效能方面,Qwen 3 Max‑Preview 在多個權威評測集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通義系列最佳紀錄,在部分項目上甚至超越 GPT‑5 與 Claude Opus 4。

ai-agent-tradingkey

受惠於其 AI 雲端業務的大幅上漲,阿里巴巴雖然在其主營電商業務上表現不算特別出色,市場仍對這些公司抱持高度想像空間。

從投資與金融交易面向看,中國 AI 模型也展現強勁實力。在 Hyperliquid 交易平台舉辦的「Alpha Arena」實盤實驗中,每個 AI 模型均獲得 1 萬美元資金、在同等條件下自主交易加密貨幣永續合約。結果顯示:DeepSeek 以 57.5% 報酬率拔得頭籌,而 Qwen 3 Max 以 25% 報酬率位列第二,累計執行 36 筆交易,夏普比率 0.328,為所有參賽模型中表現最穩定者。

Qwen 3 Max 在策略層面專注於波動性控制與風險平衡,有效避免大型模型常見的「過度交易」與「風險飆升」問題,展現出卓越的穩定性與策略優化能力。

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
熱錢回來了!新台幣強勢反彈驚見31.4字頭,背後兩大關鍵曝光市場風向變了!隨著美國聯準會降息預期再度升溫,美元指數從高點回落,加上台股今日上演噴出行情,帶動新台幣匯率展開一波強勢反彈。今日早盤新台幣兌美元一度衝上31.405元,升值4.2分,讓市場驚呼「熱錢回來了!」
作者  Mitrade
11 月 25 日 週二
市場風向變了!隨著美國聯準會降息預期再度升溫,美元指數從高點回落,加上台股今日上演噴出行情,帶動新台幣匯率展開一波強勢反彈。今日早盤新台幣兌美元一度衝上31.405元,升值4.2分,讓市場驚呼「熱錢回來了!」
placeholder
澳幣匯率大反彈!通膨超預期,澳洲央行降息週期已終結?市場預期澳洲央行降息週期已終結,而聯準會仍會繼續降息。因此2026年澳元/美元大機率繼續上漲。
作者  Alison Ho
11 月 26 日 週三
市場預期澳洲央行降息週期已終結,而聯準會仍會繼續降息。因此2026年澳元/美元大機率繼續上漲。
placeholder
日本央行12月升息看聯準會?警惕日幣匯率反轉風險!如果聯準會維持利率不變,將加大日本央行升息的壓力。反之,如果聯準會降息,那麼日本央行更大機率按兵不動。
作者  Alison Ho
20 小時前
如果聯準會維持利率不變,將加大日本央行升息的壓力。反之,如果聯準會降息,那麼日本央行更大機率按兵不動。
placeholder
黃金走勢:美元漲勢受一因素制約,金價有望衝擊4300!勞動力市場數據支持聯准會12月降息25基點;10年期美債殖利率破4%,美元漲勢受一因素制約;黃金技術分析:上升趨勢線維持良好,有望衝擊4300關口
作者  Insights
20 小時前
勞動力市場數據支持聯准會12月降息25基點;10年期美債殖利率破4%,美元漲勢受一因素制約;黃金技術分析:上升趨勢線維持良好,有望衝擊4300關口
placeholder
黃金、白銀價格持續反彈!即將再創新高?分析師這樣說市場普遍看好黃金2026年走勢,但短期內,仍需小心聯準會鷹派意外和地緣政治風險消退帶來的影響。
作者  Alison Ho
1 小時前
市場普遍看好黃金2026年走勢,但短期內,仍需小心聯準會鷹派意外和地緣政治風險消退帶來的影響。
goTop
quote