![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
200億美元。
這是英偉達買下AI芯片獨角獸Groq團隊和非獨家技術授權后,最先被市場記住的數字。它超過了此前英偉達任何一筆并購交易的金額。
Groq主攻的是其特有的LPU芯片技術,一種用軟件定義硬件的可重構數據流架構,加之Groq由谷歌TPU初始研發團隊創辦,于是也被一些業內人士稱作“進階版TPU”。
經過多天發酵,此事的核心關注點已經轉移。英偉達的選擇,使「非GPU」賽道新型技術路徑受到高度關注。類似技術路線的代表企業,還包括Intel正在收購的美國的SambaNova、剛剛完成數十億融資的中國的清微智能等。
在公司主體未被收購的前提下,200億美元這個天價數字值得被反復咀嚼:
英偉達究竟在為一種怎樣的技術能力付費?
一、花掉近1/3現金儲備,英偉達在下一盤多大的棋?
答案是AI推理。
在對外表態保持克制的同時,英偉達CEO黃仁勛發送了一封致員工郵件。郵件后來被媒體獲取,其中明確提到,英偉達計劃將Groq的低延遲處理器集成進NVIDIA AI Factory架構,服務于更廣泛的AI推理與實時工作負載。
隨著模型進入規模化部署階段,AI算力消耗形態發生變化。服務于大量終端用戶的推理請求持續膨脹,對并行吞吐能力提出更高要求,延遲是否穩定、能效是否可控、單位算力能承載多少并發,逐漸成為影響整體成本的關鍵因素。
擅長并行計算但具有高能耗特點的GPU,未必是滿足長期推理需求的最佳高效路線。
在英偉達接洽前,Groq并沒有尋求出售,剛剛完成多輪數億美元融資。交易額達200億美元的消息,最早來自其主要投資方Disruptive。該機構CEO Alex Davis透露。
英偉達預計2025年年底現金儲備可能超過700億美元。斥資200億美元收購Groq的人才和技術授權,相當于要花掉接近1/3的現金儲備。
那么英偉達為何如此看好Groq團隊?
這得益于Groq手里的三張王牌:沙特市場、大模型推理、可重構架構。
在推理戰場,英偉達對龐大的主權AI市場虎視眈眈,遍地土豪的沙特無疑是“必征之地”。而Groq在2025年2月宣布已獲得來自沙特阿拉伯15億美元的投資承諾,用于擴大基于LPU的AI推理基礎設施。更早之前,Groq在2024年12月建成沙特阿拉伯最大的推理集群。
據外媒透露,被英偉達遞出橄欖枝時,Groq并未處于出售壓力之下。在2025年9月完成新一輪7.5億美元融資后,Groq的投后估值達到約69億美元,2025年營收目標為5億美元,主要來自大模型推理服務和基礎設施大單。
而這些核心業務的底層硬件,就是一種面向推理負載設計、采用可編程流式架構的新型LPU芯片。
二、彌補GPU短板,走出差異化技術路徑
Groq將芯片設計重點放在極致的推理性能優化。資料顯示,該芯片在int8精度下峰值算力達到750TOPS,運行萬億參數的月之暗面Kimi K2模型可實時生成token。
![]()
這主要通過TSP架構、極致確定性、采用SRAM來實現。該芯片取消了指令分發、分支預測、緩存控制等硬件邏輯,編譯器將每個執行步驟精確到最小執行周期,實現時鐘級確定性。相比GPU通常采用的外部HBM,它采用的SRAM訪問速度更快。
而它最核心TSP(Tensor Streaming Processor)架構,從底層芯片設計邏輯來看,就是一種軟件定義硬件的可重構架構。
不同于遵循馮·諾依曼架構(指令驅動數據)的GPU,可重構數據流是一種支持芯片內部及芯片間的流水線式流程,無需等待計算或內存資源,可以彌補GPU架構的短板,已在持續運行的推理場景中體現出系統工程優勢。
這可能就是英偉達選擇通過技術和團隊引入,將Groq經驗嵌入自身平臺的直接原因。
英偉達、英特爾陸續押注,以及后續可以預見的巨量研發投入,主流AI芯片三大技術流派至此形成:
GPU:擅長暴力并行計算,生態最強,是大模型訓練和通用計算任務的首選,但做推理任務時難避高能耗的劣勢。代表企業有英偉達、摩爾線程等。
ASIC/DSA:專用芯片、領域特定架構路線,硬件路徑是固定的,專為AI運算的矩陣乘法極致優化,但在處理非矩陣類運算時性能會大幅下降。代表企業有谷歌、寒武紀、昆侖芯等。
可重構:根據數據流動態重構計算路徑,能夠適應多元化的算法,隨時調整電路連接方式,相比GPU可大幅減少能耗,相比靜態ASIC又保留了對模型演進的適配能力。代表企業有SambaNova、Groq以及清微智能等。
在可重構的實現方法上,Groq團隊硬件邏輯是靜態、固定的,全靠編譯器來實現邏輯上的重構,這種方法會犧牲一定的通用性。
更經典的做法則是依靠硬件內部的可編程交換矩陣,來動態或半靜態地改變處理單元之間的物理連接。這樣一來,硬件就像會變身的“算力樂高”,能根據算法動態重構計算陣列和互連拓撲,實現更高的通用性。
此外,Groq的優勢還在于“確定性”:基于AI推理任務步驟的可預測性,比如大模型是按順序處理token,來通過軟件提前規劃“數據走哪條路、用多少時間、多芯片怎么配合”,硬件只需按圖索驥,做到“指哪打哪、毫秒不差”。也正因如此,Groq在推理延時和吞吐上,能實現比GPU快5-18倍、能效比高10倍的突破,本質是通過軟件提升了硬件利用率,讓“每一分算力都用在刀刃上”
如今Groq大部分成員歸入英偉達,SambaNova屢傳被英特爾洽談收購。可重構作為第三大AI芯片主流賽道,已被國際芯片巨頭們虎視眈眈。國產可重構AI芯片頭部企業的清微智能,則已啟動IPO籌備。
三、開啟全新資本周期,國產AI芯片迎來第三種解法
2025年12月,清微智能宣布完成超20億元C輪融資,并已啟動上市籌備相關工作,目標打造國內“非GPU”新型架構芯片領域首個上市標桿企業。
當前,中國AI芯片市場呈現多元架構并起的格局,上市公司多為GPU或ASIC企業。清微智能作為全球最早實現可重構計算商用的企業之一,其IPO具有破局意義。
據悉,清微智能是國家集成電路產業投資基金唯一投資的新型架構算力芯片企業,并得到國開裝備基金、京能集團、北創投、京國瑞等多家國資機構,以及螞蟻集團、百度、商湯、兆易創新等產業投資方的持續支持。
在先進制程工藝受限的背景下,可重構芯片通過架構創新換取性能的國產替代方案,是中國實現算力自給的重要方向之一。而清微智能研發的芯片代表了目前中國在可重構計算領域的最前沿。
清微智能今年推出下一代芯片,性能還將大幅提升,其可重構數據流架構具備3D擴展的天然優勢,能夠與3D芯片、晶圓級芯片技術等前沿集成技術結合,形成清晰且可持續的升級迭代路徑。
面向大規模擴展,為可重構架構設計的高效數據互連技術TSM-LINK支持多芯片點對點直連,能夠實現數據高效傳輸,規避傳統交換機架構存在的帶寬瓶頸與通信延遲問題。
針對長期生態建設,清微智能持續推進軟件棧適配與工具鏈建設,以降低開發與遷移成本。
中國擁有豐富的端側AI應用場景,許多場景都對功能、延時極其敏感,這為可重構芯片提供了優質的練兵場。
清微智能可重構芯片2025年算力卡訂單超過3萬張,累計出貨超過3000萬顆,在全國十多座千卡規模智算中心實現規模化落地,對國內AI推理應用算力形成有力支撐。據IDC數據披露,清微智能可重構芯片的出貨已躋身國內AI芯片第一梯隊。
可重構芯片憑借高能效優勢,既符合低碳目標的國情所需,又能夠消解單一架構遇阻的風險。此類企業走向IPO,將有助于鼓勵更多企業探索底層創新技術,為國家算力主權發展出更多條可持續發展的生命線。
結語:英偉達200億美元高價,拉高了可重構賽道的稀缺性
隨著大模型應用重心向“快”和“便宜”轉移,可重構芯片的高能效、低延遲等特性,正好迎合了爆發式增長的AI商業化普及潮。
而英偉達為Groq掏出的200億美元高價,某種程度上提供了可重構這類新架構的技術估值,讓業界意識到AI計算路線勝負未定、軟件定義硬件將是接下來的重要技術發展方向。這一領域的國內頭部企業,在資本市場的稀缺性也在2026年被進一步放大。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.