![]()
芯東西(公眾號:aichip001)
作者 程茜
編輯 漠影
芯東西12日17日報道,今天,上海GPU龍頭沐曦股份在上交所科創(chuàng)板敲鐘,開盤價為700.00元/股,截至午間休市股價大漲687.79%,總市值達到3298.82億元,將全球算力產(chǎn)業(yè)的競爭推向全新高度。
近一段時間以來,全球算力產(chǎn)業(yè)都處于重磅事件密集爆發(fā)期。
海外,非GPU賽道的谷歌TPU狂攬千億級訂單,在GPU壟斷的算力市場撕開缺口,上周博通CEO爆料Anthropic向博通下總計210億美元(折合人民幣約1486億元)訂單,還疊加Meta等科技巨頭的采購意向;GPU層面,因害怕失去中國市場,美國批準英偉達H200 AI芯片對華出售。
反觀國內(nèi),算力產(chǎn)業(yè)熱度同樣持續(xù)攀升,北京AI芯片明星企業(yè)清微智能拿下超20億元大額融資,背后是業(yè)界少見的投資陣容。此外還有國內(nèi)AI芯片創(chuàng)企密集披露并購、上市計劃,本土算力生態(tài)加速成型。
上述海內(nèi)外算力產(chǎn)業(yè)的密集動向,共同指向一個不可逆的行業(yè)變革:全球算力市場長期由英偉達GPU壟斷的市場格局正在松動。
在大模型發(fā)展初期,市場對通用算力的強需求讓英偉達GPU迅速占據(jù)絕對主導(dǎo)地位,幾乎形成“無GPU不訓(xùn)練”的行業(yè)局面。
如今,一方面谷歌TPU、亞馬遜Trainium3等非GPU芯片在一些場景對GPU實現(xiàn)規(guī)模化替代,國內(nèi)市場2025年上半年非GPU算力卡占比已達30%,寒武紀MLU、昆侖芯ASIC、清微智能可重構(gòu)芯片(RPU)等產(chǎn)品已形成差異化優(yōu)勢。
另一方面在投資市場,英特爾被傳計劃以16億美元(約合人民幣112.9億元)(含債務(wù))收購非GPU路線AI芯片獨角獸SambaNova,挽救自己在AI時代落下的競爭力,還有非GPU路線獨角獸Groq兩年間拿下超30億美元(折合人民幣約213億元)融資。
![]()
▲海外非GPU路線企業(yè)最新動向匯總
可以看到,非GPU芯片勢力崛起已勢不可擋。
在此背景下,全球算力產(chǎn)業(yè)下一步將往哪走?非GPU路線能有多大市場空間?未來會百花齊放還是一支獨大?非GPU賽道哪條路線有望最先沖出重圍?我們試圖通過拆解全球算力格局及國內(nèi)幾家頭部企業(yè)的技術(shù)路線,找到這些問題的答案。
一、全球算力產(chǎn)業(yè)的下一程,將面臨路徑分化
從需求端、底層技術(shù)、全球算力生態(tài)構(gòu)建的三個核心維度來看,全球算力產(chǎn)業(yè)格局變革具有一定的必要性及急迫性。
首先在需求端,今年被稱作大模型落地元年,推理場景算力需求增加,單純堆砌GPU的粗放模式已經(jīng)難以適配當前大模型規(guī)模化落地需求,這正倒逼企業(yè)尋找更高效的算力解決方案。
同時,AI深入千行百業(yè)使得行業(yè)多元、細分需求接連出現(xiàn),如AI視頻生成、AI醫(yī)療診斷、工業(yè)數(shù)字孿生等場景對算力能效比、適配性的要求各不相同。疊加企業(yè)主動分散供應(yīng)鏈風(fēng)險、規(guī)避單一廠商依賴,非GPU算力產(chǎn)品迎來關(guān)鍵的市場切入契機。
其次是技術(shù)端,傳統(tǒng)馮·諾依曼架構(gòu)的存算分離矛盾凸顯,其設(shè)計邏輯已難以突破硬件性能的物理邊界,需要架構(gòu)革新突破瓶頸。
非GPU路線實現(xiàn)多點突破,如谷歌TPU專用架構(gòu)、國產(chǎn)可重構(gòu)芯片的動態(tài)適配能力等,已經(jīng)在特定場景下形成性能與成本優(yōu)勢。
最后是生態(tài)層面,打破單一架構(gòu)生態(tài)壟斷已經(jīng)成為行業(yè)共識,國產(chǎn)開源框架正通過兼容適配、自主優(yōu)化,快速構(gòu)建本土生態(tài)協(xié)同體系。
因此全球算力產(chǎn)業(yè)正在朝著打破單一架構(gòu),不同路徑百花齊放的局面發(fā)展。
就在近日新華社發(fā)布的一則報道提到:“在AI芯片領(lǐng)域,北京已經(jīng)形成了自主可控的“芯片矩陣”,昆侖芯、寒武紀、摩爾線程、清微智能……一系列國產(chǎn)明星產(chǎn)品性能領(lǐng)先。”
這之中既有GPU路線的摩爾線程,還有非GPU中ASIC路線的昆侖芯、寒武紀,以及非GPU中可重構(gòu)計算的清微智能。四家企業(yè)分屬不同技術(shù)路線的發(fā)展態(tài)勢,恰恰印證了北京在AI芯片賽道多元布局、保障供應(yīng)鏈安全的遠見。
在這些明顯的行業(yè)趨勢背后,我們還能捕捉到驅(qū)動行業(yè)發(fā)展的幾大核心趨勢:
第一是GPU與非GPU兩大技術(shù)路線正并行發(fā)展。GPU路線憑借成熟的生態(tài)兼容性和通用計算能力,在需要兼顧圖形渲染、科學(xué)計算與AI訓(xùn)練的場景中將持續(xù)發(fā)揮優(yōu)勢;非GPU路線,則隨著大模型的快速演進,在AI推理領(lǐng)域率先展現(xiàn)出強勁增長潛力。其中可重構(gòu)架構(gòu)憑借通用計算能力,已經(jīng)在AI主流場景中占據(jù)重要地位。第二,全球算力產(chǎn)業(yè)的重心不再唯硬件性能論,而是朝著軟件、模型、場景適配等的全棧布局發(fā)展,通過協(xié)同創(chuàng)新讓算力資源被充分釋放出來,避免算力資源限制,并針對不同硬件架構(gòu)對模型進行壓縮、量化、適配。這一趨勢本質(zhì)上是要實現(xiàn)算力效能最大化。第三是中國廠商的話語權(quán)正在提升。在算力領(lǐng)域長期由歐美廠商主導(dǎo)的市場格局下,中國企業(yè)在非GPU賽道展現(xiàn)出不容小覷的競爭力。
綜上,全球算力產(chǎn)業(yè)的下一程必然會走向路徑分化。
二、非GPU路線市場穩(wěn)步上升,國內(nèi)滲透率高于全球
全球知名市研機構(gòu)Gartner預(yù)計,到2027年,針對AI推理應(yīng)用的算力需求將導(dǎo)致AI加速器(通常指非GPU的AI專用芯片)的出貨量超越GPU。
與此同時,在全球算力產(chǎn)業(yè)中,非GPU路線正在快速成長為與GPU分庭抗禮的核心力量,算力市場雙軌并行的格局有了雛形。
全球知名市研機構(gòu)IDC發(fā)布的報告顯示,今年上半年,中國非GPU芯片市場在加速計算領(lǐng)域增長顯著。2025年上半年,中國非GPU服務(wù)器市場占比約為30%,預(yù)計到2028年市場占有率將接近50%。
![]()
AI在千行百業(yè)的加速滲透對這一趨勢有著極大的推動作用。
英偉達創(chuàng)始人、CEO黃仁勛曾經(jīng)在采訪中透露,中國的AI應(yīng)用發(fā)展速度極快,其社會接納新技術(shù)的節(jié)奏非常快。這是一個讓他深感擔(dān)憂的領(lǐng)域,因為歸根結(jié)底,這場工業(yè)革命的勝負將取決于AI應(yīng)用層面的發(fā)展,取決于誰能成為技術(shù)普及的引領(lǐng)者。
相比于GPU,非GPU技術(shù)路線在成本、能效比、場景適配性上更為契合當下AI主流應(yīng)用場景。
其硬件采購與運維成本更低,更適配中小企業(yè)及大規(guī)模分布式部署需求;能通過定制化架構(gòu)實現(xiàn)低功耗與高精度的平衡,實現(xiàn)更優(yōu)能效比;適配自動駕駛、工業(yè)物聯(lián)網(wǎng)等邊緣端場景的算力需求;同時具備更強的實時性、穩(wěn)定性與靈活性,適配差異化AI任務(wù)。
尤其在智算中心、大模型部署、云計算、泛機器人、智能駕駛等主流AI應(yīng)用場景中,非GPU路線有適配特定負載的高能效比、更低的全生命周期成本、更強的國產(chǎn)供應(yīng)鏈自主可控性,且能通過從0到1的定制化架構(gòu)實現(xiàn)大模型推理高吞吐與低延遲,兼容多業(yè)務(wù)負載。
對于規(guī)模達千億乃至萬億級的AI市場而言,非GPU方案必然會占據(jù)一席之地。
不過,客觀來講,非GPU發(fā)展尚沒有GPU成熟,大部分非GPU芯片生態(tài)成熟度不足,缺乏完善的軟件工具鏈、豐富的開源框架支持。再加上其發(fā)展處于早期,對企業(yè)的早期研發(fā)投入能力也是不小的考驗。
這也從側(cè)面印證,GPU與非GPU兩條技術(shù)路徑各有優(yōu)劣,并非簡單的替代關(guān)系。
三、拆解國內(nèi)頭部芯片企業(yè)布局,可重構(gòu)賽道勢頭正猛
想要探究當前國內(nèi)非GPU賽道的發(fā)展格局,可以聚焦幾家核心企業(yè)作為切入點。
北京AI產(chǎn)業(yè)具有代表性,2024年其AI核心產(chǎn)業(yè)規(guī)模已經(jīng)達到近3500億元,占全國近一半,助攻這一產(chǎn)業(yè)發(fā)展的底層芯片玩家更為關(guān)鍵。
因此新華社報道提到的昆侖芯、寒武紀、摩爾線程、清微智能,這四家北京芯片代表企業(yè),正是國內(nèi)AI產(chǎn)業(yè)蓬勃發(fā)展的生動縮影,透過它們的發(fā)展軌跡,更能清晰窺見國內(nèi)AI芯片產(chǎn)業(yè)格局的深刻變革。
![]()
▲北京四家芯片代表企業(yè)2025年上半年出貨量位居國內(nèi)前列
這四家企業(yè)中,摩爾線程為GPU陣營,其余三家均為非GPU陣營,其中寒武紀、昆侖芯主攻ASIC路線,清微智能以可重構(gòu)架構(gòu)實現(xiàn)通用計算為核心發(fā)力方向。
值得注意的是,這并不是當下非GPU賽道的全部路線,不過這幾家受到北京市認可的企業(yè)極具代表性,既展現(xiàn)出國產(chǎn)非GPU的布局脈絡(luò),也凸顯了政府層面的有力支持。
因為GPU的技術(shù)優(yōu)勢已經(jīng)在業(yè)界有廣泛認知,因此我們主要拆解了另外兩條非GPU路線。
ASIC架構(gòu)是一種為特定用途定制設(shè)計的集成電路,谷歌TPU就是ASIC芯片。ASIC最核心的優(yōu)勢就是性能、功耗,再加上支持深度定制的特性使得其在AI應(yīng)用浪潮中得以大展拳腳。
寒武紀的ASIC芯片采用自研架構(gòu),構(gòu)建了覆蓋云端、邊緣端和終端的完整產(chǎn)品線。以其首款采用Chiplet技術(shù)的芯片思元370為例,該芯片最大算力高達256TOPS(INT8),是寒武紀第二代產(chǎn)品思元270算力的2倍。
昆侖芯基于其自研XPU架構(gòu),昆侖芯R200可提供高達256 TOPS(INT8)和128 TFLOPS FP16的算力,性能可達主流GPU的1.5倍。在實際部署中,其單機4卡R200方案可實現(xiàn)4800 tokens/s的推理吞吐量,滿足千億參數(shù)大模型的實時交互需求。
這些實例足以印證,AI領(lǐng)域中非GPU架構(gòu)對GPU的規(guī)模化替代進程已全面開啟。
不過ASIC的不足之處在于,因為需要定制化所以其從需求定義到量產(chǎn)交付的每個環(huán)節(jié)都需投入大量時間與資源,不僅如此,ASIC架構(gòu)一旦固化便難以調(diào)整,面對算法快速迭代的場景,往往需要重新流片,進一步拉高研發(fā)風(fēng)險與周期成本。
相比之下,兼容GPU、ASIC路線優(yōu)勢的可重構(gòu)計算路線發(fā)展勢頭更猛,核心在于它踩中了AI產(chǎn)業(yè)從算力集中到場景細分轉(zhuǎn)型的行業(yè)趨勢,可以解決GPU通用但低效、ASIC高效但硬件固化的痛點,且通過底層架構(gòu)創(chuàng)新實現(xiàn)了性能與性價比的平衡。相比行業(yè)同類型產(chǎn)品實現(xiàn)成本整體降低50%、能效比提升3倍。截至今年12月,清微智能的可重構(gòu)芯片累計出貨量已超3000萬顆,2025年其算力卡訂單累計超3萬張,在全國十余座千卡規(guī)模智算中心實現(xiàn)規(guī)模化落地。
![]()
▲清微智能AI算力芯片TX81
此外,可重構(gòu)數(shù)據(jù)流技術(shù)路線還與AI計算需求天然適配。在實現(xiàn)芯片高效互聯(lián)這一核心環(huán)節(jié)上,可重構(gòu)數(shù)據(jù)流派自研的TSM-LINK算力網(wǎng)格技術(shù),支持多芯片點對點直連,可實現(xiàn)數(shù)據(jù)的高效傳輸,從根源上規(guī)避傳統(tǒng)交換機架構(gòu)存在的帶寬瓶頸與通信延遲問題。而GPU架構(gòu)在適配晶圓級芯片集成時,只能依賴外部交換機完成互聯(lián),性能損耗與延遲問題難以避免。
在芯片設(shè)計層面,可重構(gòu)數(shù)據(jù)流架構(gòu)從底層架構(gòu)設(shè)計階段就具備三維擴展的天然優(yōu)勢,能夠與晶圓級芯片技術(shù)、3.5D堆疊等先進立體封裝技術(shù)深度結(jié)合,形成清晰且可持續(xù)的升級迭代路徑。據(jù)悉,清微明年推出的下一代芯片會帶來大幅度性能躍升,有望實現(xiàn)對國際主流前沿AI芯片的彎道超車。
![]()
▲GPU與非GPU技術(shù)路線基本性能對比
因此從本質(zhì)上來看,可重構(gòu)計算路線不是對GPU、ASIC的替代,而是通過找到其中的平衡,取兩家之所長,契合了AI規(guī)模化落地的核心需求。
結(jié)語:算力產(chǎn)業(yè)進入多元共生新時代
總的來看,當下AI算力領(lǐng)域格局已較為清晰:GPU憑借成熟生態(tài)與極致并行計算能力,在通用大模型訓(xùn)練、圖形渲染等核心場景仍占據(jù)不可撼動的統(tǒng)治地位,但正面臨功耗攀升、成本高的結(jié)構(gòu)性挑戰(zhàn);而非GPU路線則憑借更高能效比、更低全生命周期成本及自主可控優(yōu)勢,在AI推理、專用算力需求等主流AI應(yīng)用領(lǐng)域快速崛起,共同推動算力體系向多元化、異構(gòu)融合方向演進。
以大模型、生成式AI為代表的新一輪AI浪潮催生出前所未有的AI算力需求,同時國產(chǎn)大模型企業(yè)強勢突圍,帶動了國內(nèi)AI算力需求的持續(xù)增長,中國AI算力產(chǎn)業(yè)迎來新的機遇和挑戰(zhàn)。
當下,國產(chǎn)非GPU企業(yè)異軍突起,正與國內(nèi)大模型廠商形成合力,為國內(nèi)AI算力產(chǎn)業(yè)注入新的活力。目前來看,非GPU技術(shù)路線盡管相比GPU并不成熟,但因其天然優(yōu)勢與AI應(yīng)用落地相契合,正迸發(fā)出強大生命力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.