![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西1月2日報道,剛剛,上海GPU龍頭企業壁仞科技在港交所掛牌上市,成為港股“國產GPU第一股”,也是2026年港股市場首只上市新股。
其發行價為每股19.60港元(約合人民幣17.60元),開盤價上漲82.14%至每股35.70港元(約合人民幣32.05元),市值為855.42億港元(約合人民幣768億元)。
截至9點35分,壁仞科技股價為每股41.80港元(約合人民幣37.52元),最新市值為1002億港元(約合人民幣899億元)。
![]()
這家創立于2019年的國產AI芯片代表公司,在2022年收入為49.9萬元,2024年增至3.37億元,年復合增長率達2500%。截至2025年12月15日,其在手銷售訂單約12.41億元,將轉化為未來收入。
![]()
▲2022年~2024年壁仞科技營收、經調整凈利潤、研發支出變化(芯東西制圖)
這些數字對應的,是一家中國AI芯片公司持續投入、持續交付、持續增收的狀態。
在國內AI芯片賽道,壁仞科技取得了許多技術實績:是中國首家采用2.5D芯粒(Chiplet)技術封裝雙AI計算裸晶的公司,在業內率先支持先進互連規范,產品支持DeepSeek、Qwen、Llama等主流開源大模型,在萬億參數大語言模型和多模態模型訓練及推理等重點場景下展現了技術成熟度。
其代表性投資方,有上海國投先導基金、上海人工智能產業投資基金、廣州產投、知識城集團等國資平臺,啟明創投、華登、高瓴創投等創新科技及半導體投資基金,以及平安集團、珠海格力等產業投資方。
基于自研GPGPU架構,壁仞科技完成了從芯片設計、軟件平臺到系統級交付的閉環,正在跑通一條可持續的自主高端算力路線。
![]()
一、研發占比高達83%,發明專利申請數為中國GPGPU公司第一
在GPU行業,高研發占比并不少見。
壁仞科技的一個財報亮點是“三高”:研發人員比例高達83%,研發費用占比超過70%,發明專利申請數量在國內GPGPU公司中排名第一。
![]()
截至2025年12月15日,壁仞科技在全球多個國家和地區累計申請專利1500余項,位列中國GPGPU公司第一;獲得專利授權600余項,位列中國GPGPU公司前列;發明專利授權率達100%,位列國內企業發明專利授權率榜首。
這為其長期發展壘起了一面堅固的專利墻。
相比ASIC、FPGA等路線,GPGPU具有更高的通用性和靈活性,占據AI芯片主流市場。
![]()
為了提升AI計算速度,GPGPU引入了專門硬件單元,并持續升級內存大小、帶寬、互連、通用靈活性及能效。
壁仞科技則是中國首批在商業化產品中使用PCIe 5.0、CXL、高性能DRAM、雙裸晶芯粒(Chiplet)等設計的GPGPU公司之一,同時亦專注于3D堆疊技術、CPO(共封裝光學)等先進技術的研發,以增強AI計算系統性能及可擴展性,降低大模型訓練及部署成本。
該公司是首家也是唯一一家受邀在國際頂級芯片設計會議Hot Chips上發言的中國GPGPU公司,并且是中國最早實現千卡集群商用的GPGPU公司之一、中國首家在單一服務器中實現8塊GPU卡點對點全網狀拓撲的GPGPU公司,還兩度摘得世界人工智能大會最高榮譽SAIL獎(卓越人工智能引領者獎)。
在MLPerf Inference 2.1的封閉組別競賽中語言處理模型BERT及圖像分類模型ResNet50成績方面,壁仞科技GPGPU芯片及搭載該芯片的服務器均獲得量產芯片組別中的第一名。
壁仞科技CTO洪洲負責監督及制定產品技術發展方向,亦是壁仞科技GPGPU芯片的首席架構師。
他在GPGPU的設計及工程方案有近30年經驗,擁有北京大學理學學士學位、清華大學工程學碩士學位、美國紐約州立大學水牛城分校理學碩士學位,曾擔任S3工程總監、英偉達主架構師、S3 Graphics硬件架構副總裁、華為美國研究中心Futurewei Technologies首席架構師。
壁仞科技COO張凌嵐負責壁仞科技產品的項目管理及生產與質量控制。
他在半導體行業擁有超過23年經驗,擁有浙江大學電氣工程學士學位、美國南加州大學電機工程碩士學位、美國加州大學伯克利分校工商管理碩士學位,曾擔任AMD GPU SoC架構師、三星電子美國研發中心高級研發經理、Higon Austin R&D Center Corporation深度運算副總裁。
在他們的帶領下,壁仞科技持續完善其智能計算整體解決方案的五大支柱:自研GPGPU架構、SoC設計、硬件系統、軟件平臺、集群部署優化。
![]()
二、自研GPGPU架構引入多項創新,下一代芯片將支持FP8、FP4精度
從架構、封裝到系統設計,壁仞科技的技術選擇始終圍繞一個前提展開:
在既定工藝條件下,算力還能如何繼續放大?
自2019年啟動第一代GPGPU架構研發以來,壁仞科技已推出BR106、BR166、BR110等多款芯片,覆蓋云端訓練、云端推理、邊緣推理場景。
后續,BR20X系列計劃在2026年商業化上市,將增強對FP8、FP4等數據格式的支持;BR30X和BR31X系列計劃在2028年商業化上市。
![]()
這些均基于壁仞科技自主研發的統一GPGPU架構。
![]()
▲壁仞科技GPGPU架構設計
在制程條件受限的情況下,壁仞科技選擇通過“雙裸晶 + 2.5D封裝”來擴展算力規模,探索出一條持續提升單卡性能的可行之路。
例如,通過共封裝2個BR106芯片裸晶和4個DRAM,壁仞科技利用芯粒技術和裸晶間互連技術,推出性能更高的BR166芯片產品,其性能達到BR106的2倍,兩顆裸晶之間的D2D雙向帶寬達896GB/s。
壁仞科技在GPGPU架構里加入了很多創新:
(1)通用靈活性及AI加速性均表現出色:使用經典的單指令多線程(SIMT)架構,高效處理復雜的并行計算。
(2)先進的張量核架構:專用張量引擎T-core采用特殊設計,可大幅降低矩陣運算過程中從DRAM中重復檢索數據的頻率,支持數據循環,降低AI矩陣計算的帶寬需求,從而大大提高能效及計算效率。
(3)帶組播的異步數據傳輸:組播技術允許從DRAM讀取一次數據,然后同時將其提供給不同的計算內核,可顯著提高大型矩陣計算速度,同時降低能耗。
(4)近內存計算:芯片融合了NUMA、UMA、L2 Reduction等存儲技術,能將數據自動靠近計算核心存儲,并通過L2實現歸約計算,減少從遠程DRAM獲取數據的需要,從而提高數據檢索效率。
這些設計使其架構能適應不斷擴展的模型規模、參數量與復雜度,提供高性能、通用靈活性、能效與可擴展性,最終幫助客戶降低總擁有成本(TCO)。
三、不僅拼高性能,還要拼穩定多元交付
要讓芯片運行成功,離不開一套完備的SoC設計方法論。
壁仞科技在SoC架構、內存系統、多GPU互連、SoC測試、SoC設計流程及芯片封裝設計方面均有技術積累,亦是業內支持先進互連規格的領先者,目標指向量產穩定性和持續交付能力。
例如,壁仞科技SoC架構可根據芯片的AI應用場景及目標細分市場,靈活配置不同數量具備各類異構計算模塊的SPC核,并據此界定內存系統及互連結構;內存系統能提高AI應用程序的有效帶寬訪問,并減少內存訪問的延遲;多級分區技術和模塊復用技術在布局和布線方面簡化了復雜模塊的物理設計,提高了芯片設計的規模。
![]()
▲壁仞科技SPC結構圖
在互連方面,自研BLink技術可實現GPU卡之間的連接,最大雙向數據傳輸速率高達每通道64GB/s,共4至8條通道;率先在中國推出商用GPU光互連技術,推動全光網絡及共封裝光學技術發展。
面向交付,壁仞科技提供PCIe(外圍組件高速互連)板卡、OAM(開放式加速器模組)、服務器等多種產品形態,是中國首批成功開發、原型驗證及量產高性能OAM及通用底板的GPGPU公司之一。
![]()
PCIe適合需要平衡性能和成本的客戶,OAM適用于需要最高性能的客戶,服務器則是即用型算力。服務器可互連為超節點,并進一步擴展為服務器集群。
其下一代產品會升級到700W風冷和1000W液冷,UBB可使用內部P2P接口連接8張具有多種拓撲的OAM卡,還將設計更靈活、更強大的SerDes連接,以縱向擴展系統。
![]()
數據中心GPU最終落地拼得不是單卡性能,而是為集群擴展性設計,這也是芯片公司能否跨越商業化拐點的關鍵。
壁仞科技通過將自有的硬件系統及軟件平臺與合作伙伴提供的服務器、存儲及網絡設備等其他硬件基礎設施相集成,開發了大規模智能計算集群的全面解決方案。
四、為開發者兜底,軟件和集群才是真正的壁壘
算力系統的穩定性,在實際落地中會被放大。對于一家GPU企業,自研軟件平臺既是充分發揮計算及通信能力的關鍵,又是擴大生態城池的基礎。
壁仞科技選擇的軟件路徑,是兼顧降低遷移成本與保留自主演進空間。
![]()
其自研計算軟件平臺BIRENSUPA提供編程接口、算法庫、訓練與推理框架及完整工具鏈,并兼容第三方GPGPU計算軟件平臺,使遷移至壁仞科技GPGPU產品的成本顯著降低。
BIRENSUPA編程模型兼容業界主流GPGPU編程模型,自研GPGPU編譯器通過將高級代碼轉換為壁仞科技專有指令集來優化資源利用率并提高效率,還有一系列自研庫,可加速不同應用領域。
在模型層面,壁仞科技對DeepSeek、Qwen、Llama等主流開源模型進行原生優化,可簡化AI解決方案的開發與部署流程。其Model Zoo托管針對BIRENSUPA進行原生優化的AI模型,支持客戶部署預訓練模型或根據參考實現開發自身模型。
同時,壁仞科技正在與清華大學、復旦大學、上海交通大學、浙江大學等知名高校開展了超過30項聯合項目,持續培育本土GPU開發者生態。
在集群層面,壁仞科技BIRENCUBE集群管理平臺旨在管理廣泛的AI硬件基礎設施,將自有硬件、軟件與服務器、存儲和網絡設備整合,形成端到端解決方案,能夠幫助客戶構建包含成千上萬塊GPGPU芯片的GPU集群系統。
其智能計算集群解決方案在可靠性及性能、通用靈活性及兼容性上領先:
- 千卡集群訓練30天以上無中斷,5天以上無故障;
- 業界首創三級異步檢查點,提高可靠性,減少存取開銷;
- 千卡集群5分鐘內將千億參數模型恢復至最后檢查點,速度行業領先;
- 損失函數在多次連續訓練后實現零誤差,并在1個月的訓練周期后持續下降;
- 支持主流大模型、性能領先、千卡集群線性加速比達到95%;
- 大模型的自動化并行優化、具有業界首創的異步卸載以克服內存瓶頸;
- 全面的模型支持,與上下游合作伙伴共同構建支持50余種大模型的生態系統;
- 開放生態,兼容三類異構軟件加速平臺;
- 通過直連光互連、光電路交換等多種互連方式,支持具有高擴展性及靈活拓撲結構的超節點,可更高效地運行大模型。
2024年,壁仞科技深化與戰略客戶的合作,贏得了商業化AIDC千卡GPU集群等里程碑項目,并將其GPGPU集群部署于5G新通話及其他應用場景,與中國三大電信運營商均建立合作伙伴關系,在大規模應用場景中持續驗證其可靠性與競爭力。
截至2025年6月22日,壁仞科技已服務9家財富中國500強企業,其中有5家上榜財富世界500強,已戰略性拓展AI數據中心、電信、AI解決方案、能源及公用事業、金融科技及互聯網等關鍵行業。
結語:國產GPU走向規模化落地
與國際巨頭相比,國產GPU在生態成熟度、開發者規模、軟件工具鏈成熟度等方面存在客觀差距,但隨著海外GPU供給不再穩定,下游行業開始接受CUDA非唯一解,國產GPU也從可用走向可規模化。
在資本市場中,真正同時具備GPGPU架構、自研軟件平臺和系統級交付能力的公司并不多。壁仞科技在較早階段就將架構、封裝、軟件、系統并行推進,這為其大規模集群和長期演進奠定基礎。
相較于全球競爭對手,這些技術積累加上在中國的本地化專業知識及實地客戶支持能力,使壁仞科技能夠與重點行業的大型客戶建立戰略合作關系,深入理解并滿足獨特需求。
上市之后,市場看到的,將是這些工程選擇在更長周期內的表現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.