近期,國內A股與港股掀起一輪GPU頭部企業上市的高潮。25年12月摩爾線程、沐曦股份先后在科創板掛牌,聚焦自主可控;到了2026年,壁仞科技打響了IPO 開門紅,后續還將有更多GPU及算力芯片企業沖刺IPO。這些企業的成功上市募資,可進一步加碼研發,加速推動國產 GPU 替代,為 AI 產業鏈自主可控筑牢 “算力底座”。
![]()
但一個不容忽視的挑戰是,國產芯片的發展必須與大模型進行深度適配,方能充分釋放硬件性能,解決生態協同機制薄弱等問題。商湯科技作為AI行業龍頭企業,近年來積極擁抱國產化硬件生態,與國產算力芯片企業均建立了長期、穩定的戰略合作伙伴關系。2025年7月商湯科技聯合國產生態伙伴發布“商湯大裝置算力Mall”,上述企業均積極參與,通過與商湯SenseCore大裝置等的全面適配,形成“技術互補、資源共享、場景互哺”的合作生態。在推進國產化適配,破解國產芯片“可用難用”困境、構建自主可控的AI產業生態中,商湯科技始終走在前列。
雙向奔赴:大模型與國產芯片的適配之道
算力芯片的國產化是當前社會廣泛關注的重大熱點議題。近年來,華為昇騰、寒武紀、壁仞、沐曦、摩爾線程等企業陸續推出AI芯片產品,在核心算力參數上已經逐步追平國際同類產品,具備了支撐千億參數級大模型訓練與推理的硬件基礎。但不容忽視的問題是,適配不足仍然制約著實際性能的發揮。AI大模型無論訓練還是推理,對芯片算力的穩定性、高效性、兼容性都有著極高要求,國產芯片唯有與大模型實現深度適配,才能充分釋放硬件算力潛能。
另一方面,大模型的規模化落地與商業化突破,同樣離不開適配優化后的國產算力支撐,穩定可靠的本土算力底座是大模型跨越技術試驗期、走向千行百業的核心保障。這種 “芯片賦能模型落地,模型反哺芯片優化”的雙向依存,正是大模型與國產芯片“雙向奔赴”的核心邏輯,也是AI產業國產化的必由之路。
傳統上,與大模型適配更多是由芯片公司來承擔完成。然而商湯科技的實踐卻改變了這一行業邏輯。其通過一系列主動作為,實現對國產AI芯片的多維度適配覆蓋,已完成頭部主流國產芯片的全面適配,覆蓋從訓練到推理、從輕量部署到高性能計算的全場景需求,極大推進了國產硬件生態的發展進程。
標桿引領:聯動國產AI芯片核心企業
商湯與壁仞科技的合作體現了“算力供給-算法需求”的核心匹配邏輯。雙方通過基于對商湯SenseCore大裝置的全面適配,以國產替代戰略為共同導向,最終形成了一個“技術互補、資源共享、場景互哺”的合作生態,實現了資源的有效整合與共享。
與寒武紀的合作中,則充分體現了商湯科技全棧技術能力對支撐算力芯片適配的優勢。為充分釋放國產算力潛力,商湯科技在Seko系列模型與LightX2V框架設計之初,便引入了低比特量化、壓縮通信、稀疏注意力等硬件友好創新機制,從而將推理性能提升3倍以上,可以有力支撐國產算力芯片,從底層創新到場景落地,提升效率與穩定性,降低企業使用門檻。
商湯與沐曦的合作表明,商湯與國產算力芯片企業不僅停留在產品采購與技術支持的層面。在產品技術層面,雙方可以形成底層技術的開放共建共享。商業化落地方面,可以通過技術深度適配,確保國產芯片在商湯大裝置中高效運行。生態層面,基于“商湯大裝置算力Mall”這一生態聯盟平臺,還可以實現資源的有效整合與共享。
商湯科技與摩爾線程在長期協同形成的“雙向賦能”也具有標志性的意義。商湯科技與摩爾線程多年來保持長期業務合作。摩爾線程的MTT S系列GPU完成與商湯大裝置SenseCore的全面適配,實現了對商湯日日新多模態大模型體系的支持。在真實的業務壓力下,商湯不僅幫助摩爾線程驗證性能、打磨產品,完成產品從“可用”到“好用”的淬煉;同時商湯科技也借助芯片企業的渠道資源觸達更多潛在客戶,形成“生態擴容—客戶增長—業績提升”的良性循環。
通過與商湯合作,國產AI芯片已經實現在千億參數級大模型的訓練與推理任務中,接受工業級標準的嚴苛考驗,通過了真實業務場景的規模化驗證,未來還將經歷萬億乃至更高參數級大模型的淬煉。
直面痛點:破解行業適配協同難題
值得注意的是,大模型與國產芯片的適配絕非簡單的技術對接,而是涵蓋硬件架構優化、軟件棧兼容、算法調優、場景驗證的全流程協同,其中需要面臨多重行業性難題。這一方面是因為國產芯片廠商眾多,架構設計差異顯著,導致異構算力集群的調度邏輯復雜,不同芯片難以實現高效協同;另一方面,軟硬件生態尚不完善,適配標準缺乏統一規范,上下游技術銜接存在斷層,增加了適配的技術難度與溝通成本;同時,跨域訓練中穩定性不足、資源利用率偏低等問題,進一步制約了國產算力的規模化應用。這些挑戰相互交織,成為阻礙AI產業國產化進程的重大挑戰。
面對這些行業痛點,商湯科技日前率先發布基于DeepLink的異構混合調度方案,為解決國產算力適配、架構設計差異化等問題提供了核心技術支撐。DeepLink是由上海人工智能實驗室推出的人工智能開放計算體系,其目標是搭建在硬件芯片與深度學習軟件框架之間進行適配的橋梁。商湯大裝置與上海人工智能實驗室長期協作,發布的基于DeepLink的異構混合調度方案,可實現多種國產芯片之間的協同通信與統一調度,并自動進行并行策略優化和負載均衡,真正做到“不同芯片,同一平臺”的協同工作,釋放異構集群的計算潛力;同時顯著提升了異構調度與彈性算力能力,以秒級彈性伸縮、分鐘級故障恢復等,保障大模型訓練過程穩定、高效、可控。此外,該方案還可以兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,適配稠密模型與MoE架構,支持訓練與推理的高效執行。
在技術方案之外,商湯科技以“商湯大裝置算力Mall”為核心載體,推進多方協同生態破局。打一個比方,“商湯大裝置算力Mall”就像一個“面向未來的算力超級市場”。商湯科技聯動華為昇騰、壁仞、沐曦、寒武紀、摩爾線程等硬件廠商,麒麟軟件等軟件伙伴及眾多行業用戶,可以讓開發者和企業客戶能夠像選購商品一樣,自由組合和調配多樣化的算力資源、平臺工具和行業模型服務。在算力層面,提供高效、穩定、自主可控且具有成本優勢的異構計算基礎設施,為各類應用場景提供算力保障。在語料層面,與庫帕思等伙伴合作提供的高質量數據集、數據清洗、標注及合規安全管理服務,提升模型訓練的數據源質量。在算法方面,客戶可直接基于商湯“日日新”多模態大模型等,快速完成模型微調和二次開發。
與此同時,商湯科技還依托自身豐富的應用場景優勢,為芯片廠商提供精準的性能反饋,持續打磨適配效果。以商湯科技“日日新”多模態大模型為例,多模態是大模型未來發展的趨勢,也是國產AI芯片的重要應用場景。商湯科技在視頻生成等多模態領域積累了大量真實業務場景,可以為芯片廠商提供更加精細化的優化方向。這種基于真實場景的協同攻關,讓適配不再是 “紙上談兵”,而是能夠精準匹配業務需求,推動國產芯片與大模型的適配效果持續迭代升級。
商湯科技之所以能在國產化芯片適配領域能夠完成這么多的主動突破核心源于,在戰略層面,商湯科技形成了“大裝置—大模型—應用”三位一體戰略,從根源上解決了適配的碎片化問題。在技術層面,商湯科技具備的全棧適配能力如基于DeepLink技術的異構協同可以對不同芯片企業給予有力支撐。在生態層面,已與華為昇騰、寒武紀、中科曙光、摩爾線程、沐曦、壁仞等主流國產芯片深度適配,具備多元協同整合能力。在場景層面,擁有AIGC、具身智能、產業智能化等領域積累大量真實場景,可為適配提供驗證環境。這些優勢讓商湯科技可以構建起全流程協同整合能力。
可以預期,未來商湯科技還將拓展與更多國產芯片企業的合作,覆蓋更多細分場景與芯片類型,面向更大規模的集群部署,拓展更大范圍生態輻射,為破解國產芯片“可用難用”困境、構建自主可控的AI產業生態提供關鍵支撐。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.