TradingKey - 當地時間12月24日,美國AI晶片新創公司Groq在官網宣布,與輝達(NVIDIA)達成一項非獨家技術許可協議。
根據協議內容,輝達支付約200億美元現金,Groq將向輝達授權其核心AI推論技術,後者計畫將這些技術整合至自身未來產品中。同時,Groq的創辦人Jonathan Ross、總裁Sunny Madra及部分關鍵研發團隊成員將正式加入輝達,以推動相關技術的落地與擴展。
儘管早前市場曾傳出輝達擬以約200億美元現金整體收購Groq的消息,堪稱其史上最大併購案,但這一說法隨後被雙方否認。
輝達明確表示,此次並未進行收購,僅為智慧財產權授權合作。Groq也強調,公司將繼續保持營運獨立,由首席財務官Simon Edwards接任CEO,其原有雲服務業務——GroqCloud仍將正常運行。
在向員工發出的內部郵件中,輝達CEO黃仁勳清晰地闡述了此次與Groq合作的戰略意圖。他指出,透過此次合作,公司將在其NVIDIA AI Factory架構中整合Groq的超低延遲處理器,以支持更大規模、更複雜即時AI推論負載。
黃仁勳補充道:「雖然我們正在吸納優秀人才並獲得Groq的智慧財產權授權,但我們不會收購Groq這家公司。」
隨著生成式AI進入商業化快速部署階段,市場對算力結構的訴求正發生轉變。行業預期,到2030年,「推論任務」將在AI總計算負載中占比高達75%,對應市場體量達到2550億美元。相比之下,如今主流採用的大規模GPU更多用於訓練階段,其成本高昂、功耗龐大,不再適用於所有場景。
Groq的LPU(語言處理單元)技術正具備這一價值。在特定AI推論任務中,其處理速度和延遲表現優於傳統GPU。透過此次授權合作,輝達不僅獲得了關鍵技術,更將核心人才納入麾下,有望快速彌補自身在推論領域的短板。
這一戰略補強行動依託於輝達日益雄厚的財務實力。截至去年10月底,公司現金及短期投資規模已達600億美元,較2023年初的133億美元增長逾三倍。
不同於2019年斥資69億美元收購Mellanox那樣的大型併購,此次Groq交易以非獨家技術許可+人才整合模式展開,這筆交易的架構與微軟、亞馬遜和谷歌過去兩年採用的模式如出一轍,這種非獨家許可交易的結構,是近期科技巨頭規避監管審查的常用手段。
即便沒有進行大規模收購,輝達的防禦性佈局也正在展開。近期,公司密集投資AI生態系統,包括向AI基礎設施企業Crusoe、模型開發商Cohere注資,增持AI雲服務商CoreWeave股份,並計畫向OpenAI投資1000億美元,向英特爾注資50億美元。
成立於2016年的Groq,是一家專注於AI模型推論加速晶片(LPU)設計的矽谷明星新創公司,其創辦人Jonathan Ross曾是谷歌TPU專案的重要成員,並帶領部分原TPU團隊另起爐灶創業。
據悉,其核心產品LPU基於獨特「時序指令集電腦」(Temporal Instruction Set Computer)架構設計,以SRAM作為儲存介質,擁有高頻寬數據吞吐能力和極低延遲特性,可極大提升大語言模型運行效率。
根據第三方評估,在實際運行Meta Llama和Mistral等大模型時,Groq LPU實現了每秒500 token以上生成速度,相比同等條件下使用H100 GPU,大幅領先。
不過,這種高性能也伴隨著代價——單卡記憶體容量僅230MB,一套完整部署需要大量LPU堆疊,上線成本和功耗均顯著高於當前主流GPU系統。
正因如此,不少業內人士認為,無論是在成本經濟性還是生態適配性上,目前階段LPU尚無法成為GPU全面替代品。但作為補足訓練-推論兩端協同效率所需的重要拼圖,其戰略價值不可忽視。
SemiAnalysis首席分析師Dylan Patel指出,儘管第一代產品尚不能撼動H100地位,但Groq後續兩代LPU正具良好競爭力,這或許促使輝達提前入場。