AI推理算力賽道再迎重磅資本注入。
1月22日,專注于極致推理GPU芯片的科技公司曦望(Sunrise)宣布一年內完成近30億元戰略融資,投資方包括三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方,以及IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等知名VC/PE機構,同時也獲得誠通混改基金等國資背景資本加持。本輪資金將主要用于下一代推理GPU研發、規模化量產及生態共建。
作為國內“首家All-in推理的GPU芯片公司”,曦望連續獲得多家機構投資,折射出AI產業從“訓練紅利”向“推理紅利”切換的核心趨勢。當模型訓練進入深水區,推理環節的效率、成本與穩定性,已成為決定AI商業化能否落地的關鍵因素。
![]()
從商湯基因到獨立突圍,構建推理算力“真護城河”
曦望成立于2020年,前身為商湯科技大芯片部門。在長期服務于實際AI業務的過程中,團隊積累了對模型演進、算子優化及客戶需求形成深刻理解,這讓其從誕生之初就貼上了“更懂AI的GPU芯片公司”標簽。
團隊層面,曦望的核心團隊在芯片工程與產品化、商業化能力之間形成互補。聯席CEO王勇為前AMD、昆侖芯核心架構師,擁有20年芯片研發經驗,并于2020年加入商湯,成功主導了曦望兩代芯片的研發和量產;另一位聯席CEO王湛則為百度創始團隊成員、原集團副總裁,曾帶領8000人團隊負責百度搜索業務,并于2025年初加入曦望再創業,負責公司產品化和商業化。
目前,曦望團隊規模約300人,成員主要來自NVIDIA、AMD、昆侖芯、商湯等企業,核心技術骨干平均擁有15年行業經驗。多位投資人表示,這種同時具備芯片工程能力與大規模業務經驗的團隊結構,在當前推理GPU這一強調“穩定交付與成本控制”的賽道中十分稀缺。
三代芯片落地,劍指“百萬Token一分錢”
與多數國產芯片廠商仍試圖在通用GPU參數上追趕主流產品不同,曦望選擇了差異化的路徑——圍繞推理場景的成本與效率,對芯片架構進行“重寫”。曦望并未沿用傳統訓推一體GPU為訓練優化的設計思路,其在調度、緩存、片上SRAM、互聯及編譯器路徑上進行推理場景原生優化,并結合LPDDR內存技術,顯著降低單位Token推理成本。同時,曦望采取全棧自研方式,覆蓋指令集、GPGPU IP及編譯工具鏈等關鍵環節。公司已累計并持有200余項核心專利,并在此前的產品中實現“一次流片成功”。
公開信息顯示,曦望在過去數年研發投入累計20億元,已形成三代芯片產品矩陣,覆蓋從視覺推理到大模型全場景推理的需求。其中,2020年量產的S1芯片,作為國內首款視覺推理芯片,適配千余種CV模型,已實現IP授權索尼、小米等頭部客戶;2024年量產的S2芯片,對標主流A/H系列GPU,兼容CUDA生態,已成功適配DeepSeek、Qwen等主流模型;2026年即將推出的S3芯片定位為“推理性價比之王”,在單位Token成本、能耗上實現數量級降低,原生支持FP8/FP4低精度推理,目標直指“百萬Token一分錢”的行業新基準。
不拼參數拼成本,做AI產業的“損益表優化師”
“如果能讓推理成本下降90%,并提供更穩定的服務,我們的競爭就不是‘又一個芯片’,而是‘重寫中國AI產業的損益表’。”曦望聯席CEO王湛的觀點精準概括了公司的差異化定位。
在曦望看來,對算力廠商、AI原生應用開發者而言,推理能效、SLA穩定性與Token成本,才是決定業務毛利率與用戶體驗的核心指標。因此,曦望選擇不與訓推一體GPU拼參數,而是聚焦真實場景的單位經濟性,成為現有算力系統的“推理分流與成本優化層”——與本土芯片廠商合作為客戶構建推理加速專區,形成獨特的競爭生態。
“我們的目標是極致降低大模型推理成本與門檻,讓算力變得普惠且可廣泛獲取,從而釋放AGI的全部潛力。”王湛表示。
隨著AI推理紅利的全面釋放,曦望的崛起不僅是商湯系技術產業化的成功實踐,更標志著國產AI芯片正從“跟跑”轉向“差異化領跑”。當推理成為AI產業盈利的核心抓手,這家專注于“把推理成本打下來”的公司,或將重塑中國AI基礎設施的產業格局。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.