根據 Semi Analysis 於 2026 年 5 月初發布的最新研究報告,Anthropic 的年化營收(ARR)在 2024 年 12 月僅為約 10 億美元,至 2025 年 12 月達到 90 億美元,而到 2026 年 5 月已飆升至 440 億美元。換言之,在過去五個月內,這家公司的營收基礎翻了將近五倍,平均每天淨增 9,600 萬美元的年化營收規模。Meritech Capital 合夥人 Alex Clayton 在公開評論中曾指出,他研究過 200 多家上市軟體公司的 IPO 資料,從未見過這種成長曲線;而他做出此一評論時,Anthropic 的 ARR 才剛從 10 億衝至 30 億,此後增速並未放緩,反而加速。
更值得關注的是同一份報告披露的邊際指標:Anthropic 自營推理基礎設施的毛利率,已從一年前的 38% 躍升至當前的 70% 以上。這意味著,這家公司不僅在快速做大營收基數,其單位經濟效益也在同步改善,與外界普遍認為「AI 公司只能靠融資燒錢」的刻板印象相反。
然而,這場爆炸性增長背後所需的算力規模,Anthropic 自身的基礎設施根本無法獨自承載。市場上經常出現的一個誤讀是:Anthropic 的算力來自 Amazon Web Services 與 Google Cloud,與所謂的 Neocloud 並無直接關係。這一觀察並不完全準確。Anthropic 的算力結構,本身就是當前 AI 產業的縮影——Amazon 與 Google 承擔了頭部訓練負載,但溢出於超大規模雲端廠商自有容量之外的需求,會自然外流至第三方供應商。Anthropic 在 2026 年 4 月與 CoreWeave 簽訂多年期算力合約,5 月又傳出與 Nebius 接觸,即是這種外溢機制的直接體現。
理解這一外溢邏輯,對評估 Neocloud 賽道至關重要——CoreWeave、Nebius、IREN 這三家被市場冠以「Neocloud 三巨頭」稱號的企業,其商業基礎並非來自直接服務 Anthropic 這類前沿 AI 實驗室,而是承接了由整個 AI 產業爆炸性增長所製造的算力缺口。本文將系統梳理兩個驅動 Neocloud 估值重估的結構性變化、三家公司在產業鏈中的差異化定位,以及電力供應鏈瓶頸對競爭格局的重塑作用,並最終歸納出一套可供長期投資者使用的分析框架。
過去二十年,SaaS 行業最核心的盈利模式建立在「席位制」之上。其邏輯相當樸素:企業有 100 名員工需要使用 Salesforce,Salesforce 即按 100 個席位收取月費。這種模式對投資人而言極具吸引力,因其收入穩定、可預測,使得 Salesforce、ServiceNow、Workday 等公司得以建構出數百億乃至千億美元等級的市值。
但生成式 AI 的出現徹底打破了這一邏輯。一個具體的場景足以說明這種斷裂:假設某家公司只有一位工程師,但他使用 Cursor 這類 AI 程式設計工具,在一小時內即可讓 AI 協助重構 5,000 行程式碼,觸發數百次 API 調用,消耗數千萬個 Token。在此情境下,「席位數」與「真實算力消耗」之間已徹底脫鉤。對 SaaS 企業而言,繼續按席位收費意味著一名員工每月支付 20 美元訂閱費,但其後台所消耗的算力成本可能高達 50 美元——這正是 Cursor、Claude Code 等 AI 原生工具在早期面臨虧損的根本原因。
為應對這一結構性矛盾,業界正集體轉向「基礎訂閱費 + 用量計費」的混合模式:企業先支付一筆固定月費作為入門門檻,超過配額後的 Token 消耗則另行計價。目前 OpenAI、Anthropic、Microsoft、HubSpot 等頭部企業均已完成或正在進行此種轉型。Gartner 的預測顯示,到 2026 年底,將有 70% 的企業偏好用量計費模式勝過純席位制。
這一趨勢同時也解釋了 Anthropic 為何能在五個月內實現 ARR 翻五倍。其增長動力主要來自現有企業客戶 Token 消耗量的指數級擴張,而非單純的新客戶獲取。Anthropic 公開披露的數據顯示,年付費超過 100 萬美元的企業客戶數量,在過去兩個月內已翻倍;Fortune 10 企業中有 8 家是其付費客戶;旗下的 Claude Code 產品在 2026 年 2 月單一產品的年化營收即達到 25 億美元,其中企業用戶佔比超過 50%。這些數據共同傳遞一個核心事實:AI 時代的商業模式,販售的已不再是席位,而是 Token——一個席位的價值是固定的,但一個 Token 的需求理論上是無限的。
如果說席位制的崩塌是商業模式層面的轉變,那麼訓練與推理算力的反超,則是基礎設施需求結構的根本重塑。
簡單解釋這兩個概念:訓練是教導大模型學習既有知識的過程,推理則是模型部署後協助用戶解決具體問題的過程。過去兩年市場關注的 AI 算力,主要集中在訓練端——OpenAI 投入數億美元訓練 GPT 系列模型、Meta 興建大型 GW 等級 AI 數據中心,皆屬此類投入。但產業格局正在快速變化。
根據 Gartner 與 Deloitte 的最新預測:2023 年,訓練佔 AI 算力 67%、推理僅佔 33%;到 2025 年兩者各佔一半;2026 年推理已反超至 67%;到 2030 年推理佔比將達 70%。NVIDIA 自家披露的數據則更為直接——目前企業 80% 的 AI 預算已花在推理上,僅 20% 投入訓練。
為何這一反轉具有結構性意義?根本原因在於兩者的消費曲線截然不同。訓練是一次性的研發性支出——模型一旦訓練完成即結束算力消耗;但推理則是持續性的營運性支出——只要還有用戶在調用 AI,推理算力就會持續燃燒。Agent 時代的來臨進一步將這種趨勢放大若干數量級:過去用戶向 ChatGPT 提出一個問題,後台僅觸發一次 LLM 調用;但現在讓 Agent 協助分析一份財報,後台可能自動觸發十幾次的搜尋、讀取、驗證與總結調用,每一步都在消耗 Token。這正是 Anthropic 旗下高度 Agent 化的 Claude Code 產品,單一用戶算力消耗量是傳統 ChatGPT 用戶十倍以上的根本原因。
這裡產生了一個關鍵問題:既然推理需求如此龐大,為何受益的是 Neocloud,而非 Amazon Web Services、Microsoft Azure、Google Cloud 這些超大規模雲端廠商?這一問題若不釐清,整個 Neocloud 多頭論點將無法成立。事實上,推理外溢於超大規模雲端廠商的邏輯包含三個相互獨立但相互強化的層次。
第一層是短期供需錯配:超大規模雲端廠商的容量早已被自家旗艦客戶填滿——Microsoft Azure 服務於 OpenAI 與 Anthropic、Amazon Web Services 服務於 Anthropic、Google Cloud 同時支持 Anthropic 與自家 Gemini。即便這些巨頭維持每年數千億美元的資本開支,建設速度仍跟不上需求增長。Microsoft 與 Nebius 簽訂 174 億美元合約、與 IREN 簽訂 97 億美元合約,正是這種溢出需求的直接證據——若 Microsoft 自有機房足以滿足需求,根本無需向第三方採購。
第二層是價格優勢的結構性差異:Deloitte 於 2026 年 1 月發布的 Tokenomics 報告明確指出:對於中等規模的 Token 工作負載,Neocloud 的價格比傳統超大規模雲端廠商便宜 30% 至 80%。這一差異並非來自價格戰,而是基礎設施代際差異。Neocloud 不存在歷史包袱——其數據中心從設計之初即以 GPU 為核心,無需為支援傳統通用雲端服務而背負冗餘成本。Amazon、Microsoft、Google 是在既有雲端基礎上加蓋 AI 設施,Neocloud 則是純 AI 原生,兩者的單位成本結構完全不同。
第三層是客戶對供應商分散化的主動需求:Anthropic 這類大型 AI 客戶,對過度依賴單一雲端廠商存有警惕——一旦被綁定,談判籌碼即告喪失。因此他們會主動分散算力來源,留一部分需求給 CoreWeave、Nebius 這類立場中立的第三方供應商。Anthropic 一方面與 Google 簽下 100 萬顆 TPU 的歷史性大單,另一方面又與 CoreWeave、Nebius 接觸,核心動機並非 Google 算力不足,而是確保自身始終擁有多元供應管道。
這三層邏輯疊加之後,推理算力需求爆發對 Neocloud 而言並非偶然機遇,而是產業結構變遷下的必然結果。
理解上述兩個結構性變化後,我們可以進入對 CoreWeave、Nebius、IREN 三家公司的具體分析。這三家雖同屬 Neocloud 賽道,但在產業價值鏈中的位置截然不同。
CoreWeave(CRWV) 的市場定位極為鮮明——它是當前少數能夠同時服務全球四大 AI 研發巨頭的 GPU 雲端基礎設施供應商。Meta、Anthropic、OpenAI、Google 在 2026 年均已與 CoreWeave 簽訂重大算力合約,這一客戶結構在 2025 年初尚難以想像,但在 2026 年已成為現實。
財務數據方面,CoreWeave 截至 2025 年 12 月底的合約預收款餘額 (RPO) 累積至 668 億美元,較 2024 年底大幅增長超過 500 億美元 (年增超過 4 倍)。2026 年 4 月 9 日,CoreWeave 與 Meta 在 2025 年 9 月簽訂的 142 億美元合約基礎上,再追加 210 億美元的新合約,使 Meta 總承諾金額累計達到 352 億美元,合約期延至 2032 年 12 月。再加上同期與 Anthropic 簽訂的多年期合約,Wells Fargo 估算 CoreWeave 的真實合約規模已超過 900 億美元。
公司對 2026 年的營收指引為 120 億至 130 億美元,中位數年增 140%;管理層進一步預期 2026 年年化營收將達 170 億至 190 億美元,2027 年年化營收將突破 300 億美元。為支撐這一增長目標,2026 年的資本支出 (CapEx) 指引從 2025 年的 149 億美元躍升至 300 億至 350 億美元。
值得釐清的一點是,CoreWeave 並非「只做訓練」。其軟體堆疊也在積極切入推理領域,包括 CKS (CoreWeave Kubernetes Service)、SUNK (Slurm on Kubernetes) 以及對 Weights & Biases 的收購,皆為強化推理能力的戰略動作。然而,其客戶結構決定了當前業務重心仍以訓練為主——OpenAI、Anthropic、Meta 通常先利用 CoreWeave 訓練前沿模型,推理負載則是訓練完成後的自然延伸。投資 CoreWeave 的核心假設,本質上是「訓練需求將持續加碼」這一判斷。
財務風險層面,CoreWeave 截至 2025 年底的總債務約 210 億美元,加上 340 億美元的表外租賃義務,資本結構高度槓桿化。Q4 單季利息支出已達 3.88 億美元,較 2024 年同期的 1.49 億美元增長一倍以上。Q4 調整後 EBITDA 為 8.98 億美元,EBITDA margin 高達 57%,顯示核心業務的單位經濟效益強勁;但 GAAP 淨虧損擴大至 4.52 億美元,顯示資本投入對短期利潤的壓力仍未緩解。管理層預期 2026 年 Q1 將是利潤率的低點 (調整後營業利潤僅 0–4,000 萬美元),2026 全年逐步恢復至低雙位數,長期目標設定在 25%–30% 區間。
客戶集中度是另一個不可忽視的風險點。Microsoft 在 2024 年貢獻 CoreWeave 營收的 62%,2025 年仍佔 67%,Q2 一度高達 71%。雖然管理層預期隨著 OpenAI、Meta、Anthropic 的合約執行,Microsoft 佔比將降至 50% 以下,但根據 Next Platform 的測算,在擴展後的 878 億美元積壓中,Meta 佔 40.1%、OpenAI 佔 25.5%,兩者合計接近 65%。換言之,客戶集中度並未消失,只是主角換了。2026 年 5 月初《華爾街日報》報導 OpenAI 內部用戶與營收數據未達內部目標,導致 CoreWeave 單日下跌近 3%,市場對此一敞口的敏感度由此可見。此外,機構投資人 Magnetar 於 2026 年 5 月 1 日拋售 128 萬股,套現 1.54 億美元,亦是值得留意的內部信號。
CoreWeave 將於 2026 年 5 月 7 日盤後公布 Q1 2026 財報。根據 LSEG 的市場共識,Q1 營收預期為 19 億至 20 億美元,調整後營業利潤預期為 0–4,000 萬美元。三個關鍵觀察指標包括:合約預收款的季增率是否能突破 50% (市場預期為 35%–40%,意外突破方為強多頭信號);單位經濟效益是否首次轉正;以及 OpenAI 算力交付時程是否如期推進。
Nebius Group(NBIS) 的定位與 CoreWeave 截然不同。如果將 CoreWeave 比喻為「訓練機器」,那麼 Nebius 的核心定位則是「以推理為優先的全棧平台」。其旗艦產品 Token Factory 採取按 Token 用量計費的模式,與 Anthropic、OpenAI 等大模型廠商的對外計費邏輯完全對齊。
為強化這一戰略方向,Nebius 在 2026 年 5 月 1 日宣布以 6.43 億美元收購 Eigen AI——這家由 MIT 韓松實驗室孵化的公司,其核心技術激活感知權重量化能讓同一顆 NVIDIA GPU 輸出更多 Token。在算力極度稀缺的當下,這項技術直接決定了 Nebius 推理業務的單位賺錢效率。
合約層面,Nebius 當前持有接近 500 億美元的合約積壓,主要來自三筆重大訂單:2025 年 9 月與 Microsoft 簽訂的 174 億美元合約 (根據 Nebius 13-F SEC 申報文件,Microsoft 已承諾約 69.6 億美元 upfront 付款,合約分九批交付,前兩批已於 2025 年 11 月與 2026 年 2 月按期交付);2026 年 3 月將原本 30 億美元的 Meta 合約擴大至 270 億美元;以及 NVIDIA 在 2026 年 3 月作為戰略投資人入股 20 億美元。其中 Meta 的 270 億美元合約存在一個易被誤讀的細節:僅 120 億美元屬於 Meta 專屬採購,另 150 億美元為 Meta 作為「保底買家」的承諾——Nebius 會先嘗試將這部分容量銷售給其他第三方客戶,賣不出的部分才由 Meta 兜底。這一結構使 Nebius 的真實客戶集中度,實際上比表面數字所顯示的更為分散。
營收指引方面,Nebius 2026 年全年營收預期為 30 億至 34 億美元,相較於 2025 全年 5.3 億美元的基期增長約 600%;預計 2026 年的年化 ARR 目標設定在 70 億至 90 億美元區間。Q1 2026 共識營收預期為 3.89 億美元,年增 600%。
整支 Neocloud 多頭論述中,最關鍵的一個定位即在於:目前唯一一個可被財報數據直接驗證的「推理用量計費」具體產品,正是 Nebius 的 Token Factory。然而,Token Factory 的具體營收貢獻、客戶數量與 ARR 佔比,公司迄今尚未公開披露。這意味著,2026 年 5 月 13 日盤前 Nebius Q1 財報的發布,將成為整個 Neocloud 產業敘事的試金石——若 Token Factory 客戶數與 ARR 佔比未出現顯著跳升,動搖的將不僅是 Nebius 單一公司的多頭邏輯,而是整個推理用量計費敘事的根基。
風險層面,Nebius 的股價 Beta 高達 2.97,意味著大盤下跌 1% 時該股可能下跌 3%,屬於高賠率高波動的成長股,並非長期持有便可放心的標的。此外,Nebius 持續通過 ATM 增發機制融資,對現有股東形成持續性的稀釋壓力。Wolfe Research 於 2026 年 4 月底首次覆蓋該股,公允價值區間定為 80 至 170 美元——區間寬度接近一倍,直接反映出市場對其未來價值的高度不確定性。另外,數據顯示,Nebius 過去四個季度中有三個季度營收未達預期,5 月 13 日的財報必須兌現承諾,否則股價反應將相當激烈。
財報觀察重點除 Token Factory 營收佔比外,亦包括客戶結構是否進一步分散,以及 Aether 平台的升級進度。Aether 是 Nebius 的全棧雲端管理平台——可理解為其底層「作業系統」——與 Token Factory 是兩個獨立但互補的核心產品。Goldman Sachs 之所以將目標價上調至 205 美元,核心假設正在於對 Aether 與 Token Factory 執行力的信心。
IREN(IREN) 的市場定位最為特殊。若說 CoreWeave 攻訓練、Nebius 攻推理,IREN 則是另一種商業模式——bare-metal landlord,即「GPU 包租公」。它不像前兩者在軟體堆疊上深耕,而是專注於擁有土地、電力以及可再生能源資產等物理基礎設施。
IREN 的主要客戶為 Microsoft——2025 年 11 月雙方簽訂一份為期 5 年、總值 97 億美元的合約,部署完成後將帶來約 19.4 億美元的年化經常性營收 (ARR),EBITDA margin 高達 85%,在 Neocloud 同業中屬頂級水準。
然而,這筆合約存在一個常被誤讀的數字結構。從容量視角看,該合約僅佔用 IREN 總算力容量的 10%——但從營收視角看,其 19.4 億美元 ARR 佔公司 2026 年 AI 雲端業務年化 ARR 目標 (約 34 億美元) 的約 57%。同一份合約在兩個視角下導出截然不同的結論:容量上看是分散的 (IREN 還有 90% 容量可銷售),但從營收角度看,IREN 當前的 AI 雲端業務高度集中於 Microsoft 這一個客戶。
這一容量與營收的反差,源於 IREN 內部業務的單位經濟效益差異。Microsoft 那 10% 容量裝載的是 NVIDIA 最高階 GB300 GPU、採用液冷技術,每 MW 約可貢獻 970 萬美元年營收;而剩下 90% 容量大多仍在運行比特幣挖礦——使用的是 ASIC 礦機而非 GPU,每 MW 年營收僅 100 萬至 300 萬美元。兩者的單位賺錢效率相差三至十倍。
IREN 的競爭優勢是真實存在的:三家中財務槓桿最低、擁有自有土地與電網接入權,加上部分再生能源資產可自行發電,且能夠利用比特幣挖礦產生的現金流補貼新建資料中心的資本支出。然而其缺點同樣明顯:軟體層幾乎為空白,導致每 MW 營收僅約 CoreWeave 的四分之一(CoreWeave 每 MW 可達 1,000 萬至 1,200 萬美元);股本被嚴重稀釋——2021 年 6 月 IREN 在外流通股僅 2,060 萬股,五年內已膨脹至接近 3 億股,稀釋 14 倍以上。最關鍵的問題是,AI 雲端業務尚未真正成形,在算力供給極度稀缺的當下缺乏議價能力。
因此,IREN 的轉型方向雖然正確,低槓桿與自有電力也確實是真實的護城河,但要讓市場以 Neocloud 同業的估值倍數對其重新定價,需要一個明確的觸發點——AI 雲端收入結構性超越比特幣挖礦收入。在此之前,市場仍傾向以「擁有 AI 業務的比特幣礦企」對其估值。
對 Neocloud 賽道的分析若止於上述三家公司的差異化定位,仍屬不完整。一個被市場普遍低估的變數是電力供應鏈瓶頸,而這一瓶頸對三家公司的影響並不一致。
根據 Bloomberg 與 TechSpot 等媒體報導,美國 2026 年計畫建設的 AI 資料中心,有三分之一至二分之一可能面臨延遲或取消。問題核心並非資金不足或 GPU 缺貨,而是電力基礎設施本身已無法跟上需求增長——高壓變壓器的交貨週期,從 2020 年之前的 24 至 30 個月,目前已暴增至 5 年。這一供應瓶頸的根源在於:美國對中國電氣設備的依賴程度急劇攀升,中國變壓器進口量從 2022 年的約 1,500 台,增至 2025 年前 10 個月的 8,000 台以上。
這一風險表面上對所有 Neocloud 公司都構成利空,但拆解後會發現影響完全不對稱。
對 CoreWeave 而言,這是一把雙面刃。其輕資產模式——主要承租 Equinix、Digital Realty 等機房——意味著新容量上線直接受第三方供應鏈瓶頸制約。但反過來說,其已簽下的 668 億美元合約價值已被鎖死,即使未來電力短缺加劇,這些合約的契約價值也不會變動,這反而提升了既有合約的稀缺性。
對 Nebius 而言,影響是雙向的。Nebius 目前在北美、歐洲、中東三大洲已有營運中的資料中心,在電力短缺加劇的環境下,這些已上線容量本身即成為稀缺資產,這是利多。但若要從當前規模擴張至 2030 年底 5GW 的目標,Nebius 同樣需要等待變壓器、同樣需要排隊。換言之,電力瓶頸對 Nebius 短期是順風,長期是挑戰。
對 IREN 而言,這是最大的利多,同時也是最大的風險。其核心優勢在於已鎖定的土地、電網接入權,加上部分再生能源資產可自行發電——理論上部分容量不必完全依賴第三方變壓器供應鏈。然而,由於 IREN 的 AI 雲端業務尚未成熟,這項優勢目前僅能服務 Microsoft 一個客戶,難義轉化為更多商業合約的議價籌碼。
電力供應鏈瓶頸這一外生變數,正在對 Neocloud 內部的競爭格局進行重新洗牌——已經握有電力資源的玩家將進一步脫穎而出,而仍在等待變壓器交付的玩家則會陷入執行風險。
在掌握上述結構性變化、三家公司差異化定位與電力瓶頸影響之後,投資人需要的不是一個單一的「買進賣出」結論,而是一套可以重複使用的判斷框架。以下四個市場上經常被忽略的問題,構成了 Neocloud 部位配置的核心思考路徑。
第一個問題:你押注的是訓練還是推理? 訓練是一次性的研發性支出,推理則是模型部署後持續性的算力消耗。若投資人認同推理超越訓練的結構性反轉趨勢,則最大受益者將是推理龍頭而非訓練龍頭。依此標準檢視:CoreWeave 的客戶結構偏向訓練,Nebius 的 Token Factory 是純粹的推理產品,IREN 則屬基礎設施通吃但軟體深耕度相對較淺。
第二個問題:你是否相信「用量計費」會成為 SaaS 估值的新基礎? 若投資人認同此一敘事,意味著 Neocloud 的中型企業客戶群將出現幾何級數增長——根據 Deloitte 的 Tokenomics 報告,中等規模 token 工作負載是 Neocloud 相對於超大規模雲端服務商最具成本優勢的區段。在此情境下,Nebius 這類「軟體堆疊完整、客戶結構相對分散」的玩家受益最大。反之,若投資人認為最終仍是超大規模雲端服務商通吃,Neocloud 僅是補足溢出需求的角色,則綁定四大 AI 實驗室的 CoreWeave 在確定性上更具優勢。
第三個問題:你能承受多大的下行風險? 三家公司的風險屬性截然不同:CoreWeave 是「高槓桿 + 高合約確定性」(總債務 210 億美元、表外租賃 340 億美元,但合約積壓 668 億美元、客戶均為藍籌巨頭);Nebius 是「低槓桿 + 持續股權稀釋」(財務結構相對健康,但 ATM 增發持續稀釋現有股東);IREN 是「最低槓桿 + 最高客戶集中」(三家中資本結構最健康,但 Microsoft 一家客戶佔 AI 雲端 ARR 目標 57%)。這三種風險特徵沒有絕對優劣,關鍵在於是否匹配投資人的個人風險偏好。
第四個問題:本財報季,真正的試金石指標是什麼? 這一問題的答案直接構成一份可操作的觀察清單。
最後必須釐清幾點重要邊界。第一,Neocloud 三家公司目前均處於財報週的風暴中心,任一份財報的不及預期均可能引發單日 15% 至 25% 的股價波動。本文提供的分析框架並非短期進場點的指引,而是建構未來 6 至 12 個月配置邏輯的工具。短期操作者使用此框架的邊際效用有限,但對長期投資者而言,財報引發的股價回調可能反而是建倉機會。第二,本框架不是標準答案。每位投資者的風險承受能力、資金規模與整體組合配置均不相同——同一套四問框架,不同投資者可能推導出截然不同的配置結果,這是正常現象,而非框架失效。第三,本文所有目標價、合約金額與財報指引,均為 2026 年 5 月初的最新資料。市場環境與公司基本面會隨時間變化,讀者若在數月後閱讀此文,應自行驗證最新進度。