TradingKey - 本月AI競爭格外激烈,谷歌TPU新進展讓市場暫忘AI泡沫。然而,大型語言模型不只谷歌Gemini 3,全球各大模型本月持續發表新版本。
目前市場最受矚目的新模型無疑是谷歌的 Gemini 3。其最大突破在於硬體架構上完全擺脫對輝達 GPU 的依賴,轉而全面採用谷歌自行研發的 TPU(Tensor Processing Unit)。
Gemini 3 的升級模式也與以往截然不同。這一次,谷歌並非在現有基礎設施上進行「微調」或「疊代」,而是徹底更換底層架構。
在模型訓練流程上,Gemini 3 的路徑也區別於傳統大型模型——例如 GPT 系列與 Llama 等通常依賴單一超大型 GPU 集群、海量文本預訓練與有限人類指令微調的方式。谷歌此次引入了「Mixture-of-Experts(專家協作)」架構:每個任務會自動分配給最匹配的子網路(專家)處理,從而顯著提高訓練的針對性與計算效率。
從本質上看,Gemini 3 更像是一套結合「基礎學習 + 專業分工 + 實戰演練」的混合體系。憑藉自行研發 TPU 硬體與分散式平行演算法的結合,谷歌成功將 AI 模型推向了更貼近真實世界應用的「通用智慧」階段,超越了以往大型模型嚴格依賴大算力堆疊的訓練套路。
根據第三方機構 Artificial Analysis 的最新綜合評分,Gemini 3 Pro 以顯著優勢排名第一,比 GPT‑5.1 高出 3 分。這是谷歌自進入語言模型領域以來,首次以絕對優勢登上全球榜首,也意味著 OpenAI 長期的領先神話正式被打破。
模型層面:Anthropic 推出 Claude Opus 4.5 強勢突圍被視為 OpenAI 與谷歌最有力競爭對手的 Anthropic,近日發布了旗艦 AI 模型最新版本——Claude Opus 4.5。
官方介紹稱,新模型在執行日常任務上的表現「顯著更強」。尤其在「代理式編程(Agentic Coding)」領域,Claude Opus 4.5 達到產業領先水準。根據軟體能力評測集 SWE‑Bench Verified 的結果,其得分優於 Gemini 3 Pro 與 GPT‑5.1。

與 OpenAI 不同的是,Anthropic 並未投入大量資源開發圖像或影片生成等重算力領域,而是聚焦於編碼能力優化與企業自動化部署,尤其強調在程式編譯、整合和任務執行等方面的落地實用性,而非人機互動對話功能。目前,該公司已為超過 30 萬家企業使用者提供服務。
在 AI 編程生態中,Anthropic 已成為不可忽視的力量。上週,微軟與輝達共同宣布對 Anthropic 投資數十億美元,公司估值躍升至約 3,500 億美元。合作協議中最受矚目的部分,是微軟 Azure AI Foundry 的客戶可直接存取 Claude 系列模型——這使 Claude 成為全球唯一同時部署在三大雲端平台(Azure、AWS、Google Cloud)的尖端大型模型。
值得一提的是,Anthropic 也在顯著擴大 TPU 的使用。根據報導,公司簽署了一項價值數十億美元的長期雲端合作協議,未來將使用高達「一百萬顆 TPU」,總價值或達「數百億美元」。這不僅反映出其與谷歌的算力合作關係,也說明外部尖端 AI 開發者已普遍認可谷歌 TPU 的效能與成本優勢。
根據 Menlo Ventures 7 月發布的報告,Anthropic 在企業級 AI 採用率中位居第一,佔 32% 市場份額;OpenAI 以 25% 居次(較兩年前幾乎腰斬),谷歌 20%,Meta 9%。
長期以來,OpenAI 一直穩居業界「最聰明模型」的稱號。其願景是創造造福全人類的通用人工智慧(AGI),並以「大而全」的戰略路線鞏固產業主導:產品組合更豐富、組織體系更龐大。
11 月 22 日,OpenAI 正式發布 GPT‑5.1。資深 AI 使用者普遍認為,該版本較前代「明顯更智能」。
為迎接假期購物季需求高峰,OpenAI 還於本週一推出免費 AI 購物搜尋功能,試圖讓聊天模型融入消費者購物流程,從而打造新的商業化情境。
官方部落格指出,該功能基於 GPT‑5‑Thinking‑Mini 模型優化,透過問答方式收集使用者偏好,再在網路中逐步推薦 10 至 15 件商品供篩選。
過去幾週,OpenAI 密集更新產品:包括群組聊天功能、面向美國 K‑12 教師的免費版 ChatGPT,以及內建 ChatGPT 的瀏覽器版本。這顯示公司正在積極拓展使用者規模與使用情境,以因應成長壓力並強化平台生態。

中國 AI 陣營同樣迎來突破。11 月 24 日,阿里巴巴發表新一代人工智慧交易模型 Qwen 3 Max(通義千問 3 Max)。
產品公開測試僅一週,下載量突破 1,000 萬次,刷新全球 AI 應用歷史紀錄。短短時間內,Qwen 3 Max 在增速上超越 ChatGPT、Sora 乃至今年稍早引發轟動的 DeepSeek,成為史上增速最快的 AI 產品。
效能方面,Qwen 3 Max‑Preview 在多個權威評測集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通義系列最佳紀錄,在部分項目上甚至超越 GPT‑5 與 Claude Opus 4。

受惠於其 AI 雲端業務的大幅上漲,阿里巴巴雖然在其主營電商業務上表現不算特別出色,市場仍對這些公司抱持高度想像空間。
從投資與金融交易面向看,中國 AI 模型也展現強勁實力。在 Hyperliquid 交易平台舉辦的「Alpha Arena」實盤實驗中,每個 AI 模型均獲得 1 萬美元資金、在同等條件下自主交易加密貨幣永續合約。結果顯示:DeepSeek 以 57.5% 報酬率拔得頭籌,而 Qwen 3 Max 以 25% 報酬率位列第二,累計執行 36 筆交易,夏普比率 0.328,為所有參賽模型中表現最穩定者。
Qwen 3 Max 在策略層面專注於波動性控制與風險平衡,有效避免大型模型常見的「過度交易」與「風險飆升」問題,展現出卓越的穩定性與策略優化能力。