網易首頁 > 網易號 > 正文申請入駐

曦望完成近30億戰略融資：王湛稱不拼參數，做AI產業損益表優化師

2026-01-22 18:22:37　來源: 雷遞

北京舉報

分享至

曦望完成近30億戰略融資

雷遞網樂天1月22日

AI推理算力賽道再迎資本注入。

1月22日，專注于極致推理GPU芯片的科技公司曦望（Sunrise）宣布一年內完成近30億元戰略融資。

投資方包括三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方，以及IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等VC/PE 機構，同時也獲得誠通混改基金等國資背景資本加持。

曦望稱，本輪資金主要用于下一代推理GPU研發、規模化量產及生態共建。

剛完成近10億元融資

曦望成立于2020年，前身為商湯科技大芯片部門。在長期服務于實際AI業務的過程中，團隊積累了對模型演進、算子優化及客戶需求形成深刻理解，這讓其從誕生之初就貼上了“更懂AI的GPU芯片公司”標簽。

曦望的核心團隊在芯片工程與產品化、商業化能力之間形成互補。聯席CEO王勇為前AMD、昆侖芯核心架構師，擁有20年芯片研發經驗，并于2020年加入商湯，主導了曦望兩代芯片的研發和量產；另一位聯席CEO王湛則為百度創始團隊成員、原集團副總裁，曾帶領8000人團隊負責百度搜索業務，并于2025年初加入曦望再創業，負責公司產品化和商業化。

目前，曦望團隊規模約300人，成員主要來自NVIDIA、AMD、昆侖芯、商湯等企業，核心技術骨干平均擁有15年行業經驗。

2025年7月，曦望剛剛宣布完成近10億元人民幣的最新一輪融資。

三代芯片落地，劍指 “百萬 Token 一分錢”

與多數國產芯片廠商仍試圖在通用GPU參數上追趕主流產品不同，曦望選擇差異化的路徑——圍繞推理場景的成本與效率，對芯片架構進行“重寫”。

曦望并未沿用傳統訓推一體GPU為訓練優化的設計思路，其在調度、緩存、片上SRAM、互聯及編譯器路徑上進行推理場景原生優化，并結合LPDDR內存技術，顯著降低單位Token推理成本。同時，曦望采取全棧自研方式，覆蓋指令集、GPGPU IP及編譯工具鏈等關鍵環節。公司已累計并持有200余項核心專利，并在此前的產品中實現“一次流片成功”。

信息顯示，曦望在過去數年研發投入累計20億元，已形成三代芯片產品矩陣，覆蓋從視覺推理到大模型全場景推理的需求。

其中，2020年量產的 S1芯片，作為國內首款視覺推理芯片，適配千余種 CV 模型，已實現 IP 授權索尼、小米等頭部客戶；2024年量產的 S2芯片，對標主流 A/H 系列 GPU，兼容 CUDA 生態，已成功適配 DeepSeek、Qwen等主流模型；2026年即將推出的 S3芯片定位為“推理性價比之王”，在單位 Token 成本、能耗上實現數量級降低，原生支持 FP8/FP4低精度推理，目標直指 “百萬 Token 一分錢” 的行業新基準。

不拼參數拼成本，做 AI 產業的 “損益表優化師”

曦望聯席CEO王湛說，“如果能讓推理成本下降90%，并提供更穩定的服務，我們的競爭就不是‘又一個芯片’，而是‘重寫中國 AI 產業的損益表’。”

對算力廠商、AI 原生應用開發者而言，推理能效、SLA 穩定性與 Token 成本，才是決定業務毛利率與用戶體驗的核心指標。因此，曦望選擇不與訓推一體 GPU 拼參數，而是聚焦真實場景的單位經濟性，成為現有算力系統的 “推理分流與成本優化層”—— 與本土芯片廠商合作為客戶構建推理加速專區，形成獨特的競爭生態。

王湛表示，“我們的目標是極致降低大模型推理成本與門檻，讓算力變得普惠且可廣泛獲取，從而釋放 AGI 的全部潛力。”

雷遞由媒體人雷建平創辦，若轉載請寫明來源。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.