當?shù)貢r間1月13日,美國政府批準英偉達向中國出口其人工智能芯片H200。該決定預計將重啟H200芯片對中國客戶的出貨。
此前,美國總統(tǒng)特朗普通過社交媒體表示,美國政府將允許英偉達向中國出售H200人工智能芯片。據(jù)悉,上述對華銷售將由美國商務部負責審批和安全審查,美方還將從相關交易中收取約25%的費用。特朗普表示,美國商務部正在敲定相關安排細節(jié),同樣的安排也將適用于其他人工智能芯片公司,如AMD和英特爾公司。
英偉達公司總裁兼首席執(zhí)行官黃仁勛今年早些時候曾表示,中國是一個非常大的人工智能市場,再過兩到三年,中國人工智能市場規(guī)模可能會達到500億美元,錯失這個市場將會是一個巨大的損失;美國必須認識到,在人工智能競賽中,美國并不是唯一的國家。
這一出口政策調整,正值國內GPU公司密集上市之際。
![]()
國產GPU,迎來熱潮
2025年對國產GPU來說,堪稱“成年禮”:摩爾線程、沐曦股份成功登陸科創(chuàng)板,壁仞科技、天數(shù)智芯加速沖刺港股,資本的加持讓國產芯片企業(yè)迎來了發(fā)展熱潮。
12月5日,摩爾線程成功在科創(chuàng)板掛牌,上市首日股價大幅上揚468.8%,總市值迅速攀升至3055億元,一舉躋身科創(chuàng)板市值前五。僅僅十二天后,沐曦股份緊隨其后,成為第二家在A股上市的國產GPU企業(yè),其股價在首日交易中一路飆升,最終收盤漲幅高達692.95%。
12月17日,壁仞科技正式通過港交所上市聆訊,有望成為首家在港股上市的GPU企業(yè)。2026年1月8日天數(shù)智芯正式在香港聯(lián)合交易所主板掛牌上市。
資本的蜂擁而入,背后是產業(yè)邏輯的深刻變革。2025年全球GPU市場規(guī)模預計突破3500億美元,中國占比接近40%。數(shù)據(jù)中心、人工智能訓練與推理、自動駕駛及游戲娛樂成為核心驅動力,其中AI應用占比提升至45%。
資本熱捧的背后,是國產GPU企業(yè)真真切切的技術突破和商業(yè)化進展。摩爾線程基于自主研發(fā)的MUSA統(tǒng)一架構,推出支持全精度計算的“花港”架構,支持FP4到FP64的全精度計算,算力密度提升50%,效能提升10倍;壁仞科技憑借Chiplet異構集成技術,推出性能對標英偉達A100/H100的BR100芯片;天數(shù)智芯成為國內首家實現(xiàn)7nm GPGPU量產的企業(yè),其產品兼容主流AI框架。商業(yè)化層面,國產GPU已從實驗室走向規(guī)模化落地,百度智能云點亮基于昆侖芯的萬卡集群,沐曦股份與之江實驗室共建智算集群聯(lián)合實驗室,多家企業(yè)的產品已切入政務云、智算中心等核心場景。
但必須清醒認知的是,當前國產GPU的突破仍停留在“單點技術達標”層面,尚未形成“全棧生態(tài)閉環(huán)”的核心競爭力。與英偉達Rubin平臺“芯片-架構-軟件-生態(tài)”的全鏈路優(yōu)化相比,國產GPU的差距并非單純的算力參數(shù)差,而是系統(tǒng)級協(xié)同能力的代際差——在高速互連協(xié)議、大規(guī)模集群調度等關鍵環(huán)節(jié),仍存在明顯短板。更核心的問題在于生態(tài):英偉達的CUDA生態(tài)覆蓋了90%以上的AI框架,軟硬件協(xié)同能力經(jīng)過了多年打磨,形成了短期難以撼動的壁壘。當前國產GPU廠商各自為戰(zhàn)的指令集與軟件棧,更導致開發(fā)者適配成本高昂。
除此之外,外部市場的核心邏輯也在發(fā)生顯著轉變。
曾幾何時,GPU 是 AI 算力的絕對代名詞,尤其是英偉達的 H100、A100 系列,幾乎是大模型訓練的 “剛需通行證”。但如今,風向似乎變了。
![]()
GPU,第一個挑戰(zhàn)
如果把GPU比作“萬能瑞士軍刀”,能應對各種算力場景,那ASIC就是“定制手術刀”,專門解決特定問題。而現(xiàn)在,云巨頭們越來越偏愛“手術刀”了。
集邦咨詢預測數(shù)據(jù)顯示,2026 年云服務廠商對自研 ASIC 的需求增速將大幅領先 GPU,其中 ASIC 增長率預計達 44.6%,遠超 GPU 的 16.1%。
云廠商自研芯片時,通常會選擇博通、Marvell、AIChip、聯(lián)發(fā)科等廠商合作設計芯片,再通過臺積電等代工廠完成芯片制造,目前博通客戶量產節(jié)奏領先。
2025年谷歌推出第7代TPU芯片Ironwood,該芯片訓練和推理性能比第六代TPU(Trillium)提升4倍。Global Semi Research數(shù)據(jù)顯示谷歌計劃在2026年將TPU芯片產能提升至430萬顆,按型號拆分V6為15萬顆,V7為135萬顆,V8AX為240萬顆,V8X為40萬顆。其中V8系列合計占比達65%,顯示谷歌正集中資源保障新一代產品的供應。
針對新一代產品開發(fā),Google已從原先與博通的單一伙伴模式,新增與聯(lián)發(fā)科合作,轉為雙供應鏈布局。
2025年12月,亞馬遜推出首款3nmAI芯片Trainium 3。Trainium 3的計算能力較之Trainium 2大幅提升。AWS的合作伙伴包含Marvell(美滿電子)與Alchip。
Meta正與Broadcom共同開發(fā)下一代MTIA v2。Microsoft(微軟)下一代Maia v2的設計也已定案。Microsoft引入Marvell共同參與設計開發(fā)Maia v2進階版,借此強化自研芯片的技術布局。
國內提供云服務的企業(yè),實際上也推出了自研的ASIC芯片。比如阿里巴巴推出了含光800,百度在量產昆侖芯二代后,又在今年宣布百度智能云成功點亮了首個自研萬卡集群,并且宣布是使用的昆侖芯三代P800。騰訊除了自主研發(fā)的紫霄推理芯片外,還通過戰(zhàn)略投資,利用Enflame 的 ASIC 解決方案。
除集邦咨詢外,另有兩家研究機構發(fā)布2026年AI芯片市場預測,結論均指向ASIC對GPU的市場沖擊。
野村證券報告稱,目前英偉達GPU在AI服務器市場中占據(jù)超過80%的份額,而ASIC僅占約8%-11%。但該機構預測,到2025年,僅谷歌和亞馬遜兩家的ASIC出貨量就可能達到英偉達GPU出貨量的40%至60%。隨著Meta和微軟在2026年大規(guī)模部署自研芯片,ASIC的總出貨量有望歷史性地超越GPU。
高盛的報告也佐證了這一觀點,預測ASIC服務器將在2025至2026年間占據(jù)全球AI服務器市場38%至40%的份額。
![]()
GPU,第二個挑戰(zhàn)
存算一體,也在2026年向GPU發(fā)起新一波挑戰(zhàn)。
ASIC的核心是戳中了行業(yè)的痛點——現(xiàn)在AI算力需求越來越偏向“專用高效”,而傳統(tǒng)的計算架構里,存儲和計算是分開的,數(shù)據(jù)在兩者之間來回搬運,既費電又耽誤時間,這就是所謂的“馮·諾依曼瓶頸”,也是GPU在很多場景下的短板。存算一體的思路很直接:把存儲和計算單元集成在一起,從根源上解決數(shù)據(jù)搬運的問題。
![]()
存儲計算“剪刀差” 來源:OneFlow公司,安信證券研究中心
簡單來說,在實際應用中,GPU的算力能不能發(fā)揮出來,全靠內存帶寬撐著。比如處理大模型推理時,數(shù)據(jù)搬運產生的能耗可能占到近50%,延遲還會影響使用體驗;而存算一體通過用氧化鉭/鉿、氧化釩這些新型器件,能把這種損耗降低60%以上,在低功耗場景下優(yōu)勢特別明顯。這也決定了存算一體不是要全面取代GPU,而是“互補競爭”——先從GPU不擅長的場景突破,再慢慢拓展范圍,這也是它產業(yè)化的核心邏輯。
從存算一體發(fā)展歷程來看,自2017年起,英偉達、微軟、三星等大廠提出了存算一體原型,同年國內存算一體芯片企業(yè)開始涌現(xiàn)。
大廠們對存算一體架構的需求是實用且落地快,而作為最接近工程落地的技術,近存計算成為大廠們的首選。諸如特斯拉、三星等擁有豐富生態(tài)的大廠以及英特爾、IBM等傳統(tǒng)芯片大廠都在布局近存計算。
國內初創(chuàng)企業(yè)大都聚焦于無需考慮先進制程技術的存內計算。其中,知存科技、億鑄科技、九天睿芯等初創(chuàng)公司都在押注PIM、CIM等“存”與“算”更親密的存算一體技術路線。億鑄科技、千芯科技等專注于大模型計算、自動駕駛等AI大算力場景;閃易、新憶科技、蘋芯科技、知存科技等則專注于物聯(lián)網(wǎng)、可穿戴設備、智能家居等邊緣小算力場景。
![]()
![]()
2026年GPU,還扛得住嗎?
一邊是ASIC的替代沖擊,一邊是存算一體的技術挑戰(zhàn),GPU的主導地位第一次受到了真正的威脅。
但這并不意味著GPU會被淘汰,畢竟GPU的優(yōu)勢,也很明確:在大模型訓練、復雜科學計算這些需要多任務并行處理的場景里,它的通用性和靈活性是ASIC、存算一體短期內比不了的。
面對壓力,GPU巨頭已經(jīng)開始反擊。
比如2025年12月24日,英偉達以其史上最大規(guī)模交易額200億美金,將推理芯片獨角獸Groq的核心技術與團隊收入麾下。Groq創(chuàng)始人、谷歌TPU初代核心開發(fā)者Jonathan Ross帶隊加盟英偉達,其獨創(chuàng)的LPU芯片技術將融入英偉達AI Factory架構。
當下,推理側需求大于訓練側需求已成為普遍共識。面對推理市場的爆發(fā)式增長,Groq的專屬LPU芯片以5-10倍于GPU 的速度優(yōu)勢,以及1/10的成本優(yōu)勢,成為異軍突起的核心玩家。這種兼顧高效能與低成本的雙重優(yōu)勢,精準切中了英偉達在推理賽道的核心短板,這也正是其愿意斥資200億美元這一史上最大手筆,收購Groq的關鍵動因。
從英偉達過往的產業(yè)布局軌跡來看,此次收購并非臨時決策,而是延續(xù)了其通過并購補全生態(tài)、鞏固優(yōu)勢的一貫策略。
回溯其并購歷史:2000年,英偉達以7000萬美元加100萬股普通股的對價,收購3dfx核心圖形資產,為其后續(xù)在GPU領域的統(tǒng)治地位奠定基礎;2013年,將高性能計算編譯器龍頭PGI收入囊中,進一步強化了CUDA生態(tài)在高性能計算領域的核心支撐作用;2019年,又以約69億美元并購Mellanox,成功補全數(shù)據(jù)中心網(wǎng)絡業(yè)務的短板。
如今,在ASIC、存算一體的雙重技術沖擊與國產GPU崛起的市場競爭下,收購Groq搶占推理賽道優(yōu)勢,正是這一戰(zhàn)略的延續(xù)與升級,更是英偉達守住GPU主導地位的關鍵布局之一。
未來,GPU不會被淘汰,但“萬能瑞士軍刀”的絕對統(tǒng)治時代或將落幕。在大模型訓練等通用算力場景,GPU仍將保持核心優(yōu)勢;而在推理、邊緣計算等細分領域,其與ASIC、存算一體芯片的“互補共存”將成為主流。對整個行業(yè)而言,這種多元競爭格局不僅能更好地匹配不同場景的算力需求,更能倒逼技術加速迭代。
責任編輯 | 陳斌
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.