除了 Gemini 3,全球大模型也迎来集体升级

来源 Tradingkey

TradingKey - 本月是ai竞争尤为残酷的一个月,谷歌的TPU新进展似乎让市场暂时忘记了AI泡沫。但是,AI大模型不止谷歌gemini3,全球的大模型在本月持续发布了新的版本。

底层架构端:Gemini 3 打破英伟达依赖

目前市场最受瞩目的新模型无疑是谷歌的 Gemini 3。它的最大突破在于硬件架构上完全摆脱对英伟达 GPU 的依赖,转而全面采用谷歌自研的 TPU(Tensor Processing Unit)。

Gemini 3 的升级模式也与以往完全不同。这一次,谷歌并非在现有基础设施上进行“微调”或“叠代”,而是彻底更换底层架构。

在模型训练流程上,Gemini 3 的路径也区别于传统大模型——如 GPT 系列与 Llama 等通常依赖单一超大 GPU 集群、海量文本预训练与有限人类指令微调的方式。谷歌此次引入了全新的 “Mixture-of-Experts(专家协作)”架构:每个任务会自动分配给最匹配的子网络(专家)处理,从而显著提高训练的针对性与计算效率。

从本质上看,Gemini 3 更像是一套结合“基础学习 + 专业分工 + 实战演练”的混合体系。凭借自研 TPU 硬件与分布式并行算法的结合,谷歌成功将AI模型推向了更贴近真实世界应用的“通用智能”阶段,超越了以往大模型严格依赖大算力堆叠的训练套路。

根据第三方机构 Artificial Analysis 的最新综合评分,Gemini 3 Pro 以显著优势排名第一,比 GPT‑5.1 高出 3 分。 这是谷歌自进入语言模型领域以来,首次以绝对优势登顶全球榜首,也意味着OpenAI长期的领先神话被正式打破。

ai-agent-tradingkey模型层面:Anthropic 推出 Claude Opus 4.5 强势突围

被视为 OpenAI 与 谷歌 最有力竞争对手的 Anthropic,近日发布了旗舰AI模型最新版本—— Claude Opus 4.5。

官方介绍称,新模型在执行日常任务上的表现 “显著更强”。尤其在“代理式编程(Agentic Coding)”领域,Claude Opus 4.5 达到行业领先水准。根据软件能力评测集 SWE‑Bench Verified 的结果,其得分优于 Gemini 3 Pro 与 GPT‑5.1。

ai-agent-tradingkey

与 OpenAI 不同的是,Anthropic 并未投入大量资源开发图像或视频生成等重算力领域,而是聚焦于编码能力优化与企业自动化部署,尤其强调在程序编译、集成和任务执行等方面的落地实用性,而非人机交互对话功能。目前,该公司已为超过 30 万家企业用户提供服务。

在AI编程生态中,Anthropic 已成为不可忽视的力量。上周,微软英伟达共同宣布对Anthropic投资数十亿美元,公司估值跃升至约 3,500 亿美元。合作协议中最受瞩目的部分,是微软 Azure AI Foundry 的客户可直接访问 Claude 系列模型——这使 Claude 成为全球唯一同时部署在三大云平台(Azure、AWS、Google Cloud) 的前沿大模型。

值得一提的是,Anthropic 也在显著扩大 TPU 的使用。根据报道,公司签署了一项价值数十亿美元的长期云合作协议,未来将使用高达“一百万颗 TPU”,总价值或达“数百亿美元”。这不仅反映出其与谷歌的算力合作关系,也说明外部前沿AI开发者已普遍认可谷歌TPU的性能与成本优势。

根据 Menlo Ventures 7月发布的报告,Anthropic 在企业级 AI 采用率中位居第一,占 32% 市场份额;OpenAI 以 25% 居次(较两年前几乎腰斩),谷歌 20%,Meta 9%。

应用端:OpenAI GPT‑5.1 强化生态布局

长期以来,OpenAI 一直稳居行业“最聪明模型”的头衔。其愿景是创造造福全人类的通用人工智能(AGI),并以“大而全”的战略路线巩固行业主导:产品组合更丰富、组织体系更庞大。

11 月 22 日,OpenAI 正式发布GPT‑5.1。资深AI使用者普遍认为,该版本较前代“明显更智能”。

为迎接假日购物季需求高峰,OpenAI 还于本周一推出免费AI购物搜索功能,试图让聊天模型融入消费者购物流程,从而打造新的商业化场景。

官方博客指出,该功能基于GPT‑5‑Thinking‑Mini 模型优化,通过问答方式收集用户偏好,再在网络中逐步推荐 10 至 15 件商品供筛选。

过去几周,OpenAI 密集更新产品:包括群组聊天功能、面向美国 K‑12 教师的免费版 ChatGPT,以及内置 ChatGPT 的浏览器版本。这显示公司正在积极拓展用户规模与使用场景,以应对增长压力并强化平台生态。

ai-agent-tradingkey

中国 LLM:阿里 Qwen 3 Max 同样出色

中国AI阵营同样迎来突破。11 月 24 日,阿里巴巴 布新一代人工智能交易模型 Qwen 3 Max(通义千问 3 Max)。

产品公开测试仅一周,下载量突破 1,000 万次,刷新全球AI应用历史记录。短短时间内,Qwen 3 Max 在增长速度上超越 ChatGPT、Sora 乃至今年早些时候引发轰动的 DeepSeek,成为史上增速最快的AI产品。

性能方面,Qwen 3 Max‑Preview 在多个权威评测集(MMLU、GSM8K、HumanEval、BIG‑Bench Hard 等)中均刷新通义系列最佳纪录,在部分项目上甚至超越 GPT‑5 与 Claude Opus 4。

ai-agent-tradingkey

受益于其AI云业务的大幅上涨,阿里巴巴虽然在其主营电商业务上表现不算特别出色,市场仍然对这几公司基于了很高的想象空间。

从投资与金融交易维度看,中国AI模型也展现强劲实力。 在 Hyperliquid 交易平台 组织的“Alpha Arena”实盘实验中,每个AI模型均获 1 万美元资金、在同等条件下自主交易加密货币永续合约。 结果显示:DeepSeek 以 57.5% 收益率拔得头筹,而Qwen 3 Max 以 25% 收益率位列第二,累计执行 36 笔交易,夏普比率 0.328,为所有参赛模型中表现最稳定者。

Qwen 3 Max 在策略层面专注于波动性控制与风险均衡,有效避免大型模型常见的“过度交易”与“风险飙升”问题,显示出卓越的稳定性与策略优化能力。

免责声明:仅供参考。 过去的表现并不预示未来的结果。
placeholder
比特币价格预测:随着ETF资金流入回归、战争紧张局势缓解,BTC攀升至接近69,000美元比特币(BTC)价格延续回升,周三交投于69000美元附近,此前本周早些时候从关键技术位反弹。机构需求显示出早期回暖迹象,现货交易所交易基金(ETF)本周录得两次资金净流入。
作者  FXStreet
9 小时前
比特币(BTC)价格延续回升,周三交投于69000美元附近,此前本周早些时候从关键技术位反弹。机构需求显示出早期回暖迹象,现货交易所交易基金(ETF)本周录得两次资金净流入。
placeholder
【今日要闻】黄金价格突破4700美元,原油跳水,特朗普讲话来袭美伊释放停战信号,原油价格跳水,黄金突破4700美元;今晚ADP数据来袭,特朗普即将发表重要讲话>>
作者  Alison Ho
9 小时前
美伊释放停战信号,原油价格跳水,黄金突破4700美元;今晚ADP数据来袭,特朗普即将发表重要讲话>>
placeholder
中东局势复杂化、阿联酋欲“参战”!WTI原油跌破100,后市如何研判?阿联酋官员表示,该国准备帮助美国及其盟友,动用武力打通霍尔木兹海峡,同时力挺特朗普出兵入侵伊朗本土。这也意味着阿联酋将成为美国和以色列向伊朗发动袭击后,首个加入这场战争的波斯湾国家。
作者  Insights
12 小时前
阿联酋官员表示,该国准备帮助美国及其盟友,动用武力打通霍尔木兹海峡,同时力挺特朗普出兵入侵伊朗本土。这也意味着阿联酋将成为美国和以色列向伊朗发动袭击后,首个加入这场战争的波斯湾国家。
placeholder
美3月非农前瞻:就业回暖?美联储2026年还能降息吗?非农数据将短期影响美元、黄金波动,但中东局势才是主导市场的重要变量。
作者  Alison Ho
17 小时前
非农数据将短期影响美元、黄金波动,但中东局势才是主导市场的重要变量。
placeholder
【财经纵览】:伊总统称愿结束战争!黄金劲涨3.5%,VIX重挫逾17%,美股大涨、英伟达飙5%收复172周二(3月31日)特朗普与伊朗总统佩泽希齐扬(Masoud Pezeshkian)齐齐释放结束战争信号,引发市场出现暴力反弹。白宫新闻秘书莱维特表示,美东时间明晚9点(台湾时间周四上午9点),特朗普将发表全国讲话,提供关于伊朗局势的重要更新。
作者  Insights
19 小时前
周二(3月31日)特朗普与伊朗总统佩泽希齐扬(Masoud Pezeshkian)齐齐释放结束战争信号,引发市场出现暴力反弹。白宫新闻秘书莱维特表示,美东时间明晚9点(台湾时间周四上午9点),特朗普将发表全国讲话,提供关于伊朗局势的重要更新。
goTop
quote