![]()
曦望完成近30億戰略融資
雷遞網 樂天1月22日
AI推理算力賽道再迎資本注入。
1月22日,專注于極致推理GPU芯片的科技公司曦望(Sunrise)宣布一年內完成近30億元戰略融資。
投資方包括三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方,以及IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等VC/PE 機構,同時也獲得誠通混改基金等國資背景資本加持。
曦望稱,本輪資金主要用于下一代推理GPU研發、規模化量產及生態共建。
剛完成近10億元融資
曦望成立于2020年,前身為商湯科技大芯片部門。在長期服務于實際AI業務的過程中,團隊積累了對模型演進、算子優化及客戶需求形成深刻理解,這讓其從誕生之初就貼上了“更懂AI的GPU芯片公司”標簽。
曦望的核心團隊在芯片工程與產品化、商業化能力之間形成互補。聯席CEO王勇為前AMD、昆侖芯核心架構師,擁有20年芯片研發經驗,并于2020年加入商湯,主導了曦望兩代芯片的研發和量產;另一位聯席CEO王湛則為百度創始團隊成員、原集團副總裁,曾帶領8000人團隊負責百度搜索業務,并于2025年初加入曦望再創業,負責公司產品化和商業化。
目前,曦望團隊規模約300人,成員主要來自NVIDIA、AMD、昆侖芯、商湯等企業,核心技術骨干平均擁有15年行業經驗。
2025年7月,曦望剛剛宣布完成近10億元人民幣的最新一輪融資。
三代芯片落地,劍指 “百萬 Token 一分錢”
與多數國產芯片廠商仍試圖在通用GPU參數上追趕主流產品不同,曦望選擇差異化的路徑——圍繞推理場景的成本與效率,對芯片架構進行“重寫”。
曦望并未沿用傳統訓推一體GPU為訓練優化的設計思路,其在調度、緩存、片上SRAM、互聯及編譯器路徑上進行推理場景原生優化,并結合LPDDR內存技術,顯著降低單位Token推理成本。同時,曦望采取全棧自研方式,覆蓋指令集、GPGPU IP及編譯工具鏈等關鍵環節。公司已累計并持有200余項核心專利,并在此前的產品中實現“一次流片成功”。
信息顯示,曦望在過去數年研發投入累計20億元,已形成三代芯片產品矩陣,覆蓋從視覺推理到大模型全場景推理的需求。
其中,2020年量產的 S1芯片,作為國內首款視覺推理芯片,適配千余種 CV 模型,已實現 IP 授權索尼、小米等頭部客戶;2024年量產的 S2芯片,對標主流 A/H 系列 GPU,兼容 CUDA 生態,已成功適配 DeepSeek、Qwen等主流模型;2026年即將推出的 S3芯片定位為“推理性價比之王”,在單位 Token 成本、能耗上實現數量級降低,原生支持 FP8/FP4低精度推理,目標直指 “百萬 Token 一分錢” 的行業新基準。
不拼參數拼成本,做 AI 產業的 “損益表優化師”
曦望聯席CEO王湛說,“如果能讓推理成本下降90%,并提供更穩定的服務,我們的競爭就不是‘又一個芯片’,而是‘重寫中國 AI 產業的損益表’。”
對算力廠商、AI 原生應用開發者而言,推理能效、SLA 穩定性與 Token 成本,才是決定業務毛利率與用戶體驗的核心指標。因此,曦望選擇不與訓推一體 GPU 拼參數,而是聚焦真實場景的單位經濟性,成為現有算力系統的 “推理分流與成本優化層”—— 與本土芯片廠商合作為客戶構建推理加速專區,形成獨特的競爭生態。
王湛表示,“我們的目標是極致降低大模型推理成本與門檻,讓算力變得普惠且可廣泛獲取,從而釋放 AGI 的全部潛力。”
雷遞由媒體人雷建平創辦,若轉載請寫明來源。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.