![]()
3月18日消息,據路透社報道,兩位知情人士透露,人工智能(AI)芯片大廠英偉達正準備推出一款可向中國市場出口和銷售的Groq語言處理單元(LPU)版本,預計將于今年5月上市。
在近日的GTC 2026大會上,英偉達高調發布了基于Groq技術的Groq 3語言處理單元(LPU),將其定位為Vera Rubin GPU的“推理協處理器”,引發了市場的極大關注。
與大多數依賴HBM(高帶寬內存)作為工作內存層的AI加速器不同,每個Groq 3 LPU芯片集成了500MB的片上SRAM(靜態隨機存取存儲器)。雖然其容量遠低于Rubin GPU上的288GB的HBM4,但是其可提供高達150TB/s的帶寬,對于帶寬極度敏感的AI解碼操作,Groq 3 LPU的帶寬是傳統HBM的近7倍。
![]()
英偉達超大規模計算副總裁Ian Buck表示,對于需要極致低延遲的token生成任務,LPU的帶寬優勢無可替代。”
那么,英偉達最新推出的這款LPU是否能夠對華出口呢?
2026年1月,美國為了讓英偉達老的AI芯片能夠對華出口,放寬了相關出口管制的硬件參數限制,已經修改為:TPP(總處理性能)低于21000(3A090.a和3A090.b中所定義)且“總DRAM帶寬”低于6500 GB/s(如第748部分補充2第(dd)(1)段注釋中所定義的)的高級計算商品。
美國的AI芯片出口管制的核心紅線是算力密度(TPP)和互聯帶寬。但LPU的架構與AI GPU完全不同:它不擅長高并行浮點運算(訓練任務),而是專攻低延遲推理。雖然其片上SRAM帶寬極高,但容量極小(單芯片僅500MB),無法獨立運行萬億參數級大模型。如果看FP8精度下的理論峰值算力,可能遠低于H100/B200等芯片。這意味著,Groq LPU的算力密度可能并不觸及現行美國針對AI芯片出口管制的性能閾值。
路透社的報道也指出,英偉達正在為中國市場準備的Groq LPU芯片并非降級版本,也不是專門為中國市場打造的“特供版”。
但是,在英偉達的規劃中,Groq LPU是作為Rubin GPU的“協處理器”存在的。黃仁勛給出的配比建議是:約25%部署Groq LPU,其余75%部署Vera Rubin。LPU負責解碼階段的低延遲生成,Rubin GPU負責預填充階段的海量計算。
這意味著,即使LPU本身可以進入中國,它也無法與Vera Rubin組成完整的混合推理系統——這將顯著影響其在中國市場的實用價值。
不過,消息人士稱,英偉達計劃對華出口的LPU新版本可以適配其他GPU系統——這意味著它可能在接口、互聯協議或系統集成層面進行了調整,以適應中國市場的服務器生態。
另一種可能是,英偉達將Groq LPU以板卡或系統的形式出口,通過整體系統的性能參數來滿足管制要求。消息人士稱“新版本可以適配其他系統”,也暗示了其可能在系統集成層面進行了調整。
雖然目前英偉達在AI訓練芯片市場依然占據著主導地位,但是由于美國出口管制政策的限制,使得其在中國AI芯片市場的份額已持續降低至冰點。同時,在中國的AI推理芯片市場,英偉達更是面臨著寒武紀、HW、阿里平頭哥、百度昆侖芯等眾多本土廠商的激烈競爭。如果英偉達無法將Groq LPU帶入中國,可能將這部分市場份額拱手讓人。這種商業壓力也促使英偉達尋找合適的產品及合規的出口路徑,重新回到中國AI芯片市場。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.