![]()
當地時間1月13日,美國政府批準英偉達向中國出口其人工智能芯片H200。該決定預計將重啟H200芯片對中國客戶的出貨。
此前,美國總統特朗普通過社交媒體表示,美國政府將允許英偉達向中國出售H200人工智能芯片。據悉,上述對華銷售將由美國商務部負責審批和安全審查,美方還將從相關交易中收取約25%的費用。特朗普表示,美國商務部正在敲定相關安排細節,同樣的安排也將適用于其他人工智能芯片公司,如AMD和英特爾公司。
英偉達公司總裁兼首席執行官黃仁勛今年早些時候曾表示,中國是一個非常大的人工智能市場,再過兩到三年,中國人工智能市場規模可能會達到500億美元,錯失這個市場將會是一個巨大的損失;美國必須認識到,在人工智能競賽中,美國并不是唯一的國家。
這一出口政策調整,正值國內GPU公司密集上市之際。
01
國產GPU,迎來熱潮
2025年對國產GPU來說,堪稱“成年禮”:摩爾線程、沐曦股份成功登陸科創板,壁仞科技、天數智芯加速沖刺港股,資本的加持讓國產芯片企業迎來了發展熱潮。
12月5日,摩爾線程成功在科創板掛牌,上市首日股價大幅上揚468.8%,總市值迅速攀升至3055億元,一舉躋身科創板市值前五。僅僅十二天后,沐曦股份緊隨其后,成為第二家在A股上市的國產GPU企業,其股價在首日交易中一路飆升,最終收盤漲幅高達692.95%。
12月17日,壁仞科技正式通過港交所上市聆訊,有望成為首家在港股上市的GPU企業。2026年1月8日天數智芯正式在香港聯合交易所主板掛牌上市。
資本的蜂擁而入,背后是產業邏輯的深刻變革。2025年全球GPU市場規模預計突破3500億美元,中國占比接近40%。數據中心、人工智能訓練與推理、自動駕駛及游戲娛樂成為核心驅動力,其中AI應用占比提升至45%。
資本熱捧的背后,是國產GPU企業真真切切的技術突破和商業化進展。摩爾線程基于自主研發的MUSA統一架構,推出支持全精度計算的“花港”架構,支持FP4到FP64的全精度計算,算力密度提升50%,效能提升10倍;壁仞科技憑借Chiplet異構集成技術,推出性能對標英偉達A100/H100的BR100芯片;天數智芯成為國內首家實現7nm GPGPU量產的企業,其產品兼容主流AI框架。商業化層面,國產GPU已從實驗室走向規模化落地,百度智能云點亮基于昆侖芯的萬卡集群,沐曦股份與之江實驗室共建智算集群聯合實驗室,多家企業的產品已切入政務云、智算中心等核心場景。
但必須清醒認知的是,當前國產GPU的突破仍停留在“單點技術達標”層面,尚未形成“全棧生態閉環”的核心競爭力。與英偉達Rubin平臺“芯片-架構-軟件-生態”的全鏈路優化相比,國產GPU的差距并非單純的算力參數差,而是系統級協同能力的代際差——在高速互連協議、大規模集群調度等關鍵環節,仍存在明顯短板。更核心的問題在于生態:英偉達的CUDA生態覆蓋了90%以上的AI框架,軟硬件協同能力經過了多年打磨,形成了短期難以撼動的壁壘。當前國產GPU廠商各自為戰的指令集與軟件棧,更導致開發者適配成本高昂。
除此之外,外部市場的核心邏輯也在發生顯著轉變。
曾幾何時,GPU 是 AI 算力的絕對代名詞,尤其是英偉達的 H100、A100 系列,幾乎是大模型訓練的 “剛需通行證”。但如今,風向似乎變了。
02
GPU,第一個挑戰
如果把GPU比作“萬能瑞士軍刀”,能應對各種算力場景,那ASIC就是“定制手術刀”,專門解決特定問題。而現在,云巨頭們越來越偏愛“手術刀”了。
集邦咨詢預測數據顯示,2026 年云服務廠商對自研 ASIC 的需求增速將大幅領先 GPU,其中 ASIC 增長率預計達 44.6%,遠超 GPU 的 16.1%。
云廠商自研芯片時,通常會選擇博通、Marvell、AIChip、聯發科等廠商合作設計芯片,再通過臺積電等代工廠完成芯片制造,目前博通客戶量產節奏領先。
2025年谷歌推出第7代TPU芯片Ironwood,該芯片訓練和推理性能比第六代TPU(Trillium)提升4倍。Global Semi Research數據顯示谷歌計劃在2026年將TPU芯片產能提升至430萬顆,按型號拆分V6為15萬顆,V7為135萬顆,V8AX為240萬顆,V8X為40萬顆。其中V8系列合計占比達65%,顯示谷歌正集中資源保障新一代產品的供應。
針對新一代產品開發,Google已從原先與博通的單一伙伴模式,新增與聯發科合作,轉為雙供應鏈布局。
2025年12月,亞馬遜推出首款3nmAI芯片Trainium 3。Trainium 3的計算能力較之Trainium 2大幅提升。AWS的合作伙伴包含Marvell(美滿電子)與Alchip。
Meta正與Broadcom共同開發下一代MTIA v2。Microsoft(微軟)下一代Maia v2的設計也已定案。Microsoft引入Marvell共同參與設計開發Maia v2進階版,借此強化自研芯片的技術布局。
國內提供云服務的企業,實際上也推出了自研的ASIC芯片。比如阿里巴巴推出了含光800,百度在量產昆侖芯二代后,又在今年宣布百度智能云成功點亮了首個自研萬卡集群,并且宣布是使用的昆侖芯三代P800。騰訊除了自主研發的紫霄推理芯片外,還通過戰略投資,利用Enflame 的 ASIC 解決方案。
除集邦咨詢外,另有兩家研究機構發布2026年AI芯片市場預測,結論均指向ASIC對GPU的市場沖擊。
野村證券報告稱,目前英偉達GPU在AI服務器市場中占據超過80%的份額,而ASIC僅占約8%-11%。但該機構預測,到2025年,僅谷歌和亞馬遜兩家的ASIC出貨量就可能達到英偉達GPU出貨量的40%至60%。隨著Meta和微軟在2026年大規模部署自研芯片,ASIC的總出貨量有望歷史性地超越GPU。
高盛的報告也佐證了這一觀點,預測ASIC服務器將在2025至2026年間占據全球AI服務器市場38%至40%的份額。
03
GPU,第二個挑戰
存算一體,也在2026年向GPU發起新一波挑戰。
ASIC的核心是戳中了行業的痛點——現在AI算力需求越來越偏向“專用高效”,而傳統的計算架構里,存儲和計算是分開的,數據在兩者之間來回搬運,既費電又耽誤時間,這就是所謂的“馮·諾依曼瓶頸”,也是GPU在很多場景下的短板。存算一體的思路很直接:把存儲和計算單元集成在一起,從根源上解決數據搬運的問題。
![]()
存儲計算“剪刀差” 來源:OneFlow公司,安信證券研究中心
簡單來說,在實際應用中,GPU的算力能不能發揮出來,全靠內存帶寬撐著。比如處理大模型推理時,數據搬運產生的能耗可能占到近50%,延遲還會影響使用體驗;而存算一體通過用氧化鉭/鉿、氧化釩這些新型器件,能把這種損耗降低60%以上,在低功耗場景下優勢特別明顯。這也決定了存算一體不是要全面取代GPU,而是“互補競爭”——先從GPU不擅長的場景突破,再慢慢拓展范圍,這也是它產業化的核心邏輯。
從存算一體發展歷程來看,自2017年起,英偉達、微軟、三星等大廠提出了存算一體原型,同年國內存算一體芯片企業開始涌現。
大廠們對存算一體架構的需求是實用且落地快,而作為最接近工程落地的技術,近存計算成為大廠們的首選。諸如特斯拉、三星等擁有豐富生態的大廠以及英特爾、IBM等傳統芯片大廠都在布局近存計算。
國內初創企業大都聚焦于無需考慮先進制程技術的存內計算。其中,知存科技、億鑄科技、九天睿芯等初創公司都在押注PIM、CIM等“存”與“算”更親密的存算一體技術路線。億鑄科技、千芯科技等專注于大模型計算、自動駕駛等AI大算力場景;閃易、新憶科技、蘋芯科技、知存科技等則專注于物聯網、可穿戴設備、智能家居等邊緣小算力場景。
![]()
04
2026年GPU,還扛得住嗎?
一邊是ASIC的替代沖擊,一邊是存算一體的技術挑戰,GPU的主導地位第一次受到了真正的威脅。
但這并不意味著GPU會被淘汰,畢竟GPU的優勢,也很明確:在大模型訓練、復雜科學計算這些需要多任務并行處理的場景里,它的通用性和靈活性是ASIC、存算一體短期內比不了的。
面對壓力,GPU巨頭已經開始反擊。
比如2025年12月24日,英偉達以其史上最大規模交易額200億美金,將推理芯片獨角獸Groq的核心技術與團隊收入麾下。Groq創始人、谷歌TPU初代核心開發者Jonathan Ross帶隊加盟英偉達,其獨創的LPU芯片技術將融入英偉達AI Factory架構。
當下,推理側需求大于訓練側需求已成為普遍共識。面對推理市場的爆發式增長,Groq的專屬LPU芯片以5-10倍于GPU 的速度優勢,以及1/10的成本優勢,成為異軍突起的核心玩家。這種兼顧高效能與低成本的雙重優勢,精準切中了英偉達在推理賽道的核心短板,這也正是其愿意斥資200億美元這一史上最大手筆,收購Groq的關鍵動因。
從英偉達過往的產業布局軌跡來看,此次收購并非臨時決策,而是延續了其通過并購補全生態、鞏固優勢的一貫策略。
回溯其并購歷史:2000年,英偉達以7000萬美元加100萬股普通股的對價,收購3dfx核心圖形資產,為其后續在GPU領域的統治地位奠定基礎;2013年,將高性能計算編譯器龍頭PGI收入囊中,進一步強化了CUDA生態在高性能計算領域的核心支撐作用;2019年,又以約69億美元并購Mellanox,成功補全數據中心網絡業務的短板。
如今,在ASIC、存算一體的雙重技術沖擊與國產GPU崛起的市場競爭下,收購Groq搶占推理賽道優勢,正是這一戰略的延續與升級,更是英偉達守住GPU主導地位的關鍵布局之一。
未來,GPU不會被淘汰,但“萬能瑞士軍刀”的絕對統治時代或將落幕。在大模型訓練等通用算力場景,GPU仍將保持核心優勢;而在推理、邊緣計算等細分領域,其與ASIC、存算一體芯片的“互補共存”將成為主流。對整個行業而言,這種多元競爭格局不僅能更好地匹配不同場景的算力需求,更能倒逼技術加速迭代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.