網易首頁 > 網易號 > 正文申請入駐

首發丨曦望完成近30億元戰略融資，All-in推理GPU

2026-01-22 16:10:20　來源: 投中網

上海舉報

分享至

AI推理算力賽道再迎重磅資本注入。

1月22日，專注于極致推理GPU芯片的科技公司曦望（Sunrise）宣布一年內完成近30億元戰略融資，投資方包括三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方，以及IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等知名VC/PE機構，同時也獲得誠通混改基金等國資背景資本加持。本輪資金將主要用于下一代推理GPU研發、規模化量產及生態共建。

作為國內“首家All-in推理的GPU芯片公司”，曦望連續獲得多家機構投資，折射出AI產業從“訓練紅利”向“推理紅利”切換的核心趨勢。當模型訓練進入深水區，推理環節的效率、成本與穩定性，已成為決定AI商業化能否落地的關鍵因素。

從商湯基因到獨立突圍，構建推理算力“真護城河”

曦望成立于2020年，前身為商湯科技大芯片部門。在長期服務于實際AI業務的過程中，團隊積累了對模型演進、算子優化及客戶需求形成深刻理解，這讓其從誕生之初就貼上了“更懂AI的GPU芯片公司”標簽。

團隊層面，曦望的核心團隊在芯片工程與產品化、商業化能力之間形成互補。聯席CEO王勇為前AMD、昆侖芯核心架構師，擁有20年芯片研發經驗，并于2020年加入商湯，成功主導了曦望兩代芯片的研發和量產；另一位聯席CEO王湛則為百度創始團隊成員、原集團副總裁，曾帶領8000人團隊負責百度搜索業務，并于2025年初加入曦望再創業，負責公司產品化和商業化。

目前，曦望團隊規模約300人，成員主要來自NVIDIA、AMD、昆侖芯、商湯等企業，核心技術骨干平均擁有15年行業經驗。多位投資人表示，這種同時具備芯片工程能力與大規模業務經驗的團隊結構，在當前推理GPU這一強調“穩定交付與成本控制”的賽道中十分稀缺。

三代芯片落地，劍指“百萬Token一分錢”

與多數國產芯片廠商仍試圖在通用GPU參數上追趕主流產品不同，曦望選擇了差異化的路徑——圍繞推理場景的成本與效率，對芯片架構進行“重寫”。曦望并未沿用傳統訓推一體GPU為訓練優化的設計思路，其在調度、緩存、片上SRAM、互聯及編譯器路徑上進行推理場景原生優化，并結合LPDDR內存技術，顯著降低單位Token推理成本。同時，曦望采取全棧自研方式，覆蓋指令集、GPGPU IP及編譯工具鏈等關鍵環節。公司已累計并持有200余項核心專利，并在此前的產品中實現“一次流片成功”。

公開信息顯示，曦望在過去數年研發投入累計20億元，已形成三代芯片產品矩陣，覆蓋從視覺推理到大模型全場景推理的需求。其中，2020年量產的S1芯片，作為國內首款視覺推理芯片，適配千余種CV模型，已實現IP授權索尼、小米等頭部客戶；2024年量產的S2芯片，對標主流A/H系列GPU，兼容CUDA生態，已成功適配DeepSeek、Qwen等主流模型；2026年即將推出的S3芯片定位為“推理性價比之王”，在單位Token成本、能耗上實現數量級降低，原生支持FP8/FP4低精度推理，目標直指“百萬Token一分錢”的行業新基準。

不拼參數拼成本，做AI產業的“損益表優化師”

“如果能讓推理成本下降90%，并提供更穩定的服務，我們的競爭就不是‘又一個芯片’，而是‘重寫中國AI產業的損益表’。”曦望聯席CEO王湛的觀點精準概括了公司的差異化定位。

在曦望看來，對算力廠商、AI原生應用開發者而言，推理能效、SLA穩定性與Token成本，才是決定業務毛利率與用戶體驗的核心指標。因此，曦望選擇不與訓推一體GPU拼參數，而是聚焦真實場景的單位經濟性，成為現有算力系統的“推理分流與成本優化層”——與本土芯片廠商合作為客戶構建推理加速專區，形成獨特的競爭生態。

“我們的目標是極致降低大模型推理成本與門檻，讓算力變得普惠且可廣泛獲取，從而釋放AGI的全部潛力。”王湛表示。

隨著AI推理紅利的全面釋放，曦望的崛起不僅是商湯系技術產業化的成功實踐，更標志著國產AI芯片正從“跟跑”轉向“差異化領跑”。當推理成為AI產業盈利的核心抓手，這家專注于“把推理成本打下來”的公司，或將重塑中國AI基礎設施的產業格局。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.