H200批準對華出口！2026年GPU還扛得住嗎？

2026-01-15 21:11:05　來源: 環(huán)球老虎財經(jīng)

上海舉報

分享至

當?shù)貢r間1月13日，美國政府批準英偉達向中國出口其人工智能芯片H200。該決定預計將重啟H200芯片對中國客戶的出貨。

此前，美國總統(tǒng)特朗普通過社交媒體表示，美國政府將允許英偉達向中國出售H200人工智能芯片。據(jù)悉，上述對華銷售將由美國商務部負責審批和安全審查，美方還將從相關交易中收取約25%的費用。特朗普表示，美國商務部正在敲定相關安排細節(jié)，同樣的安排也將適用于其他人工智能芯片公司，如AMD和英特爾公司。

英偉達公司總裁兼首席執(zhí)行官黃仁勛今年早些時候曾表示，中國是一個非常大的人工智能市場，再過兩到三年，中國人工智能市場規(guī)模可能會達到500億美元，錯失這個市場將會是一個巨大的損失；美國必須認識到，在人工智能競賽中，美國并不是唯一的國家。

這一出口政策調整，正值國內GPU公司密集上市之際。

國產GPU，迎來熱潮

2025年對國產GPU來說，堪稱“成年禮”：摩爾線程、沐曦股份成功登陸科創(chuàng)板，壁仞科技、天數(shù)智芯加速沖刺港股，資本的加持讓國產芯片企業(yè)迎來了發(fā)展熱潮。

12月5日，摩爾線程成功在科創(chuàng)板掛牌，上市首日股價大幅上揚468.8%，總市值迅速攀升至3055億元，一舉躋身科創(chuàng)板市值前五。僅僅十二天后，沐曦股份緊隨其后，成為第二家在A股上市的國產GPU企業(yè)，其股價在首日交易中一路飆升，最終收盤漲幅高達692.95%。

12月17日，壁仞科技正式通過港交所上市聆訊，有望成為首家在港股上市的GPU企業(yè)。2026年1月8日天數(shù)智芯正式在香港聯(lián)合交易所主板掛牌上市。

資本的蜂擁而入，背后是產業(yè)邏輯的深刻變革。2025年全球GPU市場規(guī)模預計突破3500億美元，中國占比接近40%。數(shù)據(jù)中心、人工智能訓練與推理、自動駕駛及游戲娛樂成為核心驅動力，其中AI應用占比提升至45%。

資本熱捧的背后，是國產GPU企業(yè)真真切切的技術突破和商業(yè)化進展。摩爾線程基于自主研發(fā)的MUSA統(tǒng)一架構，推出支持全精度計算的“花港”架構，支持FP4到FP64的全精度計算，算力密度提升50%，效能提升10倍；壁仞科技憑借Chiplet異構集成技術，推出性能對標英偉達A100/H100的BR100芯片；天數(shù)智芯成為國內首家實現(xiàn)7nm GPGPU量產的企業(yè)，其產品兼容主流AI框架。商業(yè)化層面，國產GPU已從實驗室走向規(guī)模化落地，百度智能云點亮基于昆侖芯的萬卡集群，沐曦股份與之江實驗室共建智算集群聯(lián)合實驗室，多家企業(yè)的產品已切入政務云、智算中心等核心場景。

但必須清醒認知的是，當前國產GPU的突破仍停留在“單點技術達標”層面，尚未形成“全棧生態(tài)閉環(huán)”的核心競爭力。與英偉達Rubin平臺“芯片-架構-軟件-生態(tài)”的全鏈路優(yōu)化相比，國產GPU的差距并非單純的算力參數(shù)差，而是系統(tǒng)級協(xié)同能力的代際差——在高速互連協(xié)議、大規(guī)模集群調度等關鍵環(huán)節(jié)，仍存在明顯短板。更核心的問題在于生態(tài)：英偉達的CUDA生態(tài)覆蓋了90%以上的AI框架，軟硬件協(xié)同能力經(jīng)過了多年打磨，形成了短期難以撼動的壁壘。當前國產GPU廠商各自為戰(zhàn)的指令集與軟件棧，更導致開發(fā)者適配成本高昂。

除此之外，外部市場的核心邏輯也在發(fā)生顯著轉變。

曾幾何時，GPU 是 AI 算力的絕對代名詞，尤其是英偉達的 H100、A100 系列，幾乎是大模型訓練的 “剛需通行證”。但如今，風向似乎變了。

GPU，第一個挑戰(zhàn)

如果把GPU比作“萬能瑞士軍刀”，能應對各種算力場景，那ASIC就是“定制手術刀”，專門解決特定問題。而現(xiàn)在，云巨頭們越來越偏愛“手術刀”了。

集邦咨詢預測數(shù)據(jù)顯示，2026 年云服務廠商對自研 ASIC 的需求增速將大幅領先 GPU，其中 ASIC 增長率預計達 44.6%，遠超 GPU 的 16.1%。

云廠商自研芯片時，通常會選擇博通、Marvell、AIChip、聯(lián)發(fā)科等廠商合作設計芯片，再通過臺積電等代工廠完成芯片制造，目前博通客戶量產節(jié)奏領先。

2025年谷歌推出第7代TPU芯片Ironwood，該芯片訓練和推理性能比第六代TPU（Trillium）提升4倍。Global Semi Research數(shù)據(jù)顯示谷歌計劃在2026年將TPU芯片產能提升至430萬顆，按型號拆分V6為15萬顆，V7為135萬顆，V8AX為240萬顆，V8X為40萬顆。其中V8系列合計占比達65%，顯示谷歌正集中資源保障新一代產品的供應。

針對新一代產品開發(fā)，Google已從原先與博通的單一伙伴模式，新增與聯(lián)發(fā)科合作，轉為雙供應鏈布局。

2025年12月，亞馬遜推出首款3nmAI芯片Trainium 3。Trainium 3的計算能力較之Trainium 2大幅提升。AWS的合作伙伴包含Marvell（美滿電子）與Alchip。

Meta正與Broadcom共同開發(fā)下一代MTIA v2。Microsoft（微軟）下一代Maia v2的設計也已定案。Microsoft引入Marvell共同參與設計開發(fā)Maia v2進階版，借此強化自研芯片的技術布局。

國內提供云服務的企業(yè)，實際上也推出了自研的ASIC芯片。比如阿里巴巴推出了含光800，百度在量產昆侖芯二代后，又在今年宣布百度智能云成功點亮了首個自研萬卡集群，并且宣布是使用的昆侖芯三代P800。騰訊除了自主研發(fā)的紫霄推理芯片外，還通過戰(zhàn)略投資，利用Enflame 的 ASIC 解決方案。

除集邦咨詢外，另有兩家研究機構發(fā)布2026年AI芯片市場預測，結論均指向ASIC對GPU的市場沖擊。

野村證券報告稱，目前英偉達GPU在AI服務器市場中占據(jù)超過80%的份額，而ASIC僅占約8%-11%。但該機構預測，到2025年，僅谷歌和亞馬遜兩家的ASIC出貨量就可能達到英偉達GPU出貨量的40%至60%。隨著Meta和微軟在2026年大規(guī)模部署自研芯片，ASIC的總出貨量有望歷史性地超越GPU。

高盛的報告也佐證了這一觀點，預測ASIC服務器將在2025至2026年間占據(jù)全球AI服務器市場38%至40%的份額。

GPU，第二個挑戰(zhàn)

存算一體，也在2026年向GPU發(fā)起新一波挑戰(zhàn)。

ASIC的核心是戳中了行業(yè)的痛點——現(xiàn)在AI算力需求越來越偏向“專用高效”，而傳統(tǒng)的計算架構里，存儲和計算是分開的，數(shù)據(jù)在兩者之間來回搬運，既費電又耽誤時間，這就是所謂的“馮·諾依曼瓶頸”，也是GPU在很多場景下的短板。存算一體的思路很直接：把存儲和計算單元集成在一起，從根源上解決數(shù)據(jù)搬運的問題。

存儲計算“剪刀差” 來源：OneFlow公司，安信證券研究中心

簡單來說，在實際應用中，GPU的算力能不能發(fā)揮出來，全靠內存帶寬撐著。比如處理大模型推理時，數(shù)據(jù)搬運產生的能耗可能占到近50%，延遲還會影響使用體驗；而存算一體通過用氧化鉭/鉿、氧化釩這些新型器件，能把這種損耗降低60%以上，在低功耗場景下優(yōu)勢特別明顯。這也決定了存算一體不是要全面取代GPU，而是“互補競爭”——先從GPU不擅長的場景突破，再慢慢拓展范圍，這也是它產業(yè)化的核心邏輯。

從存算一體發(fā)展歷程來看，自2017年起，英偉達、微軟、三星等大廠提出了存算一體原型，同年國內存算一體芯片企業(yè)開始涌現(xiàn)。

大廠們對存算一體架構的需求是實用且落地快，而作為最接近工程落地的技術，近存計算成為大廠們的首選。諸如特斯拉、三星等擁有豐富生態(tài)的大廠以及英特爾、IBM等傳統(tǒng)芯片大廠都在布局近存計算。

國內初創(chuàng)企業(yè)大都聚焦于無需考慮先進制程技術的存內計算。其中，知存科技、億鑄科技、九天睿芯等初創(chuàng)公司都在押注PIM、CIM等“存”與“算”更親密的存算一體技術路線。億鑄科技、千芯科技等專注于大模型計算、自動駕駛等AI大算力場景；閃易、新憶科技、蘋芯科技、知存科技等則專注于物聯(lián)網(wǎng)、可穿戴設備、智能家居等邊緣小算力場景。

2026年GPU，還扛得住嗎？

一邊是ASIC的替代沖擊，一邊是存算一體的技術挑戰(zhàn)，GPU的主導地位第一次受到了真正的威脅。

但這并不意味著GPU會被淘汰，畢竟GPU的優(yōu)勢，也很明確：在大模型訓練、復雜科學計算這些需要多任務并行處理的場景里，它的通用性和靈活性是ASIC、存算一體短期內比不了的。

面對壓力，GPU巨頭已經(jīng)開始反擊。

比如2025年12月24日，英偉達以其史上最大規(guī)模交易額200億美金，將推理芯片獨角獸Groq的核心技術與團隊收入麾下。Groq創(chuàng)始人、谷歌TPU初代核心開發(fā)者Jonathan Ross帶隊加盟英偉達，其獨創(chuàng)的LPU芯片技術將融入英偉達AI Factory架構。

當下，推理側需求大于訓練側需求已成為普遍共識。面對推理市場的爆發(fā)式增長，Groq的專屬LPU芯片以5-10倍于GPU 的速度優(yōu)勢，以及1/10的成本優(yōu)勢，成為異軍突起的核心玩家。這種兼顧高效能與低成本的雙重優(yōu)勢，精準切中了英偉達在推理賽道的核心短板，這也正是其愿意斥資200億美元這一史上最大手筆，收購Groq的關鍵動因。

從英偉達過往的產業(yè)布局軌跡來看，此次收購并非臨時決策，而是延續(xù)了其通過并購補全生態(tài)、鞏固優(yōu)勢的一貫策略。

回溯其并購歷史：2000年，英偉達以7000萬美元加100萬股普通股的對價，收購3dfx核心圖形資產，為其后續(xù)在GPU領域的統(tǒng)治地位奠定基礎；2013年，將高性能計算編譯器龍頭PGI收入囊中，進一步強化了CUDA生態(tài)在高性能計算領域的核心支撐作用；2019年，又以約69億美元并購Mellanox，成功補全數(shù)據(jù)中心網(wǎng)絡業(yè)務的短板。

如今，在ASIC、存算一體的雙重技術沖擊與國產GPU崛起的市場競爭下，收購Groq搶占推理賽道優(yōu)勢，正是這一戰(zhàn)略的延續(xù)與升級，更是英偉達守住GPU主導地位的關鍵布局之一。

未來，GPU不會被淘汰，但“萬能瑞士軍刀”的絕對統(tǒng)治時代或將落幕。在大模型訓練等通用算力場景，GPU仍將保持核心優(yōu)勢；而在推理、邊緣計算等細分領域，其與ASIC、存算一體芯片的“互補共存”將成為主流。對整個行業(yè)而言，這種多元競爭格局不僅能更好地匹配不同場景的算力需求，更能倒逼技術加速迭代。

責任編輯 | 陳斌

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.