![]()
數年投入20億元研發。
作者 | ZeR0
編輯 | 漠影
智東西1月22日報道,今日,浙江杭州GPU芯片公司曦望(Sunrise)正式宣布,一年內已完成近30億元融資,將用于下一代推理GPU研發、規模化量產及生態共建。
該公司匯聚了三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方,以及IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等知名VC/PE機構,并獲得誠通混改基金等國資背景資本加持。
曦望成立于2020年,前身是商湯科技大芯片部門,目前團隊約300人,主要來自于NVIDIA、AMD、昆侖芯、商湯等企業,核心技術骨干平均擁有15年行業經驗。
曦望聯席CEO王勇是前AMD、昆侖芯核心架構師,擁有20年芯片研發經驗,2020年加入商湯后,帶領百人團隊成功主導了曦望兩代芯片的研發和量產。
另一位聯席CEO王湛則是百度創始團隊成員、原集團副總裁,曾帶領百度搜索8000人團隊,2025年初加入曦望,負責公司產品化和商業化。
王湛稱,曦望的目標是極致降低大模型推理成本與門檻,讓算力變得普惠且可廣泛獲取。
據悉,曦望選擇了差異化的技術路徑,摒棄了傳統訓推一體GPU為訓練優化的設計思路,聚焦推理場景進行原生架構重構——在調度、緩存、片上SRAM、互聯及編譯器路徑上做深度優化,結合LPDDR內存技術,從根源降低單位Token推理成本。
同時,該公司全棧自研指令集、GPGPU IP及編譯工具鏈,手握200余項核心專利,具備百人團隊“一次流片成功”的經歷。
公開信息顯示,曦望數年投入20億元研發,已形成三代芯片產品矩陣,覆蓋從視覺推理到大模型全場景推理的需求。
其2026年即將推出的S3芯片,主打高推理性價比,在單位Token成本、能耗上實現數量級降低,原生支持FP8/FP4低精度推理,目標直指“百萬Token一分錢”的行業新基準。
之前,曦望在2020年量產的S1視覺推理芯片,適配千余種CV模型,已實現IP授權索尼、小米等頭部客戶。
2024年量產的S2芯片,對標主流A/H系列GPU,兼容CUDA生態,已成功適配DeepSeek、Qwen等主流模型。
在曦望看來,對算力廠商、AI原生應用開發者而言,推理能效、SLA穩定性與Token成本,才是決定業務毛利率與用戶體驗的核心指標。
因此,曦望選擇聚焦真實場景的單位經濟性,成為現有算力系統的 “推理分流與成本優化層”,與本土芯片廠商合作為客戶構建推理加速專區,形成獨特的競爭生態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.