在大模型產業從“能不能跑”走向“算不算得過賬”的階段,GPU 的競爭邏輯正在被重新定義。
1 月 27 日,國產 GPU 廠商曦望(Sunrise)在杭州舉辦首屆 Sunrise GPU Summit,發布新一代推理 GPU 芯片啟望 S3,并同步推出面向大模型推理的超節點方案及推理云計劃。這是曦望在近一年累計完成約 30 億元戰略融資后的首次系統性技術亮相。
與當前行業普遍沿用的“訓推一體 GPU”路線不同,曦望在 S3 上繼續選擇了一條相對“反常識”的路線——不追求峰值訓練性能,而是 All-in 推理效率與單位成本。
![]()
從“拼峰值”到“算單位成本”,推理正在重塑 GPU 設計目標
過去數年,GPU 的核心競爭指標始終圍繞峰值算力、通用性和訓練效率展開。但隨著大模型進入規模化應用階段,算力消耗的重心正在從訓練轉向推理。
曦望聯席 CEO 王勇在發布會上指出,訓練更像一次性、高資本消耗的技術登高,而推理則是長期、持續的算力交付過程。“當推理成為主要算力消耗場景后,GPU 的商業價值不再取決于參數指標,而是單位 Token 的真實成本。”這一判斷,直接決定了啟望 S3 的設計方向。
據介紹,啟望 S3 是一款面向大模型推理深度定制的 GPGPU 芯片,其設計圍繞真實推理負載,對算力結構、存儲體系和互聯方式進行了系統級重構。
在算力層面,S3 支持從 FP16 到 FP4 的多精度靈活切換,使模型在保證效果的前提下,最大化釋放低精度推理效率。這種設計更貼合當前 MoE 和長上下文模型在推理階段的實際需求。
在存儲層面,S3 采用 LPDDR6 顯存方案,成為國內首款采用該方案的芯片。相比 HBM 路線,LPDDR6 更強調容量與能效比。官方數據顯示,S3 的顯存容量較上一代產品提升 4 倍,有效緩解了大模型推理中普遍存在的顯存駐留與訪存瓶頸。
在 DeepSeek V3 / R1 滿血版等主流大模型推理場景中,S3 單位 Token 推理成本較上一代產品下降約 90%。曦望方面稱,這一指標已具備工程可復現性,而非單點實驗室數據。
圍繞 S3,曦望同步發布了面向大模型推理的寰望 SC3 超節點解決方案。
寰望 SC3 從一開始即面向千億、萬億級參數多模態 MoE 推理的真實部署需求進行設計。該方案支持單域 256 卡一級互聯,可高效支撐 PD 分離架構 與 大 EP(Expert Parallelism)規模化部署,顯著提升推理階段的系統利用率與穩定性,適配長上下文、多并發、多專家并行等復雜推理場景。
在交付形態上,寰望 SC3 采用 全液冷設計,具備極致 PUE 表現,并支持模塊化交付與快速部署。曦望方面表示,在同等推理能力量級下,該方案可將整體系統交付成本從行業常見的億元級,降低至千萬元級,實現一個數量級的下降。
這一“算得過賬”的系統級能力,被視為萬億參數模型規模化應用的重要前提。
在軟件層面,曦望構建了與 CUDA 兼容的基礎軟件體系,覆蓋驅動、運行時 API、開發工具鏈、算子庫和通信庫,降低推理應用的遷移門檻。目前,該體系已適配 ModelScope 平臺 90% 以上主流大模型形態,包括 DeepSeek、通義千問等。
在曦望看來,推理 GPU 的競爭并不止于芯片本身,而在于能否將硬件能力穩定轉化為可交付、可計價的推理算力。
![]()
GPU 廠商開始下場,推理云平臺成為“最后一公里”
如果說 S3 回答的是“推理算力如何更便宜”,那么曦望與商湯科技、第四范式等生態伙伴探索的推理云平臺,則試圖解決“推理算力如何更好用”。
通過 GPU 池化與彈性調度,曦望將底層算力整合為統一的推理算力池,并以 MaaS(Model as a Service)作為核心入口,使企業無需關注底層硬件配置與集群運維,即可按需調用大模型推理能力。這一體系也成為“百萬 Token 一分錢”推理成本合作的重要技術基礎。
曦望董事長徐冰在會上表示,推理時代的核心不是“把芯片賣出去”,而是能否持續、穩定地把算力轉化為可交付的生產力。“誰能持續降低推理成本,誰就掌握了 AI 產業的成本曲線。”
據披露,曦望 2025 年推理 GPU 芯片交付量已突破 1 萬片,標志著其推理 GPU 路線完成從工程驗證到規模化交付的關鍵跨越。
中國工程院院士、浙江大學信息學部主任吳漢明指出,推理算力價值的實現離不開協同,需要芯片設計、系統集成、軟件開發到產業應用的全鏈條協作。
在國產 GPU 行業從“拼參數”走向“拼單位經濟成本”的拐點上,曦望選擇以推理為切口,嘗試重構 GPU 的產品形態與算力交付方式。這條 All-in 推理的路徑,正在成為觀察中國推理算力商業化進程的重要樣本。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.