<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      國產(chǎn)GPU迎戰(zhàn)英偉達(dá)H200

      0
      分享至



      給國產(chǎn)芯片多一些時(shí)間

      文/林書

      編輯/劉宇翔

      2025年12月17日,沐曦股份在科創(chuàng)板上市,首日收盤價(jià)829.90元,較發(fā)行價(jià)104.66元上漲725.24%,沐曦專注于高性能GPU芯片研發(fā),產(chǎn)品覆蓋人工智能計(jì)算、通用計(jì)算及圖形渲染領(lǐng)域。

      就在不到兩周前的12月5日,摩爾線程正式登陸科創(chuàng)板,成為“國產(chǎn)GPU第一股”,是2025年科創(chuàng)板募資額最大的IPO,從受理到過會(huì)僅用88天,發(fā)行價(jià)為114.28元/股,上市首日漲幅達(dá)425.46%。

      國產(chǎn)GPU 廠商的密集上市并備受市場追捧,某種程度上,對“狼又回來了”的回應(yīng)。據(jù)媒體報(bào)道,2025年12月8日,美國總統(tǒng)特朗普在社交媒體宣布:美國將允許英偉達(dá)向中國"經(jīng)批準(zhǔn)的客戶"出口H200人工智能芯片,但需將銷售收入的25%上繳美國政府。

      美國智庫進(jìn)步研究所報(bào)告顯示,H200的性能幾乎是H20的六倍,但仍與最新的Blackwell芯片存在代際差距——這恰好卡在"能用但不先進(jìn)"的甜蜜點(diǎn)上。因此美國解禁 H200其實(shí)是其"溫水煮青蛙"策略的延續(xù)——“傾銷”性能相對落后但仍具競爭力的H200芯片,試圖延緩中國國產(chǎn)替代的進(jìn)程。

      更有意思的是,黃仁勛曾直言不諱地表示,增加對華芯片銷售額既能讓中國企業(yè)依賴其技術(shù),又能為公司帶來更多研發(fā)資金。這種"以戰(zhàn)養(yǎng)戰(zhàn)"的思路,與美國鷹派的"技術(shù)依賴論"不謀而合。

      但這場"溫水煮青蛙"的意圖能否得逞,還要看我國接不接招。從加快國產(chǎn) GPU 廠商上市來看,顯然,我國并不上鉤。

      01

      沒有H200的日子

      2022年至2025年,美國對華半導(dǎo)體出口管制政策層層加碼。2025年4月,美國進(jìn)一步收緊管制,導(dǎo)致英偉達(dá)為中國市場定制的特供版H20芯片被迫停售,公司因此承受了約45億美元的庫存損失及80億美元的潛在收入損失。英偉達(dá)CEO黃仁勛在2025年10月公開表示,受出口管制影響,英偉達(dá)在中國的市場份額從95%驟降至0%,公司"100%離開了中國市場"。

      這三年,被業(yè)界稱為中國AI芯片產(chǎn)業(yè)的"至暗時(shí)刻",但也正是這三年,催生了國產(chǎn)芯片的加速崛起。面對外部封鎖,國產(chǎn)GPU廠商采取了"三管齊下"的突圍策略:

      在單卡性能暫時(shí)無法與英偉達(dá)匹敵的情況下,國產(chǎn)廠商通過堆面積、堆晶體管、堆芯片的方式來彌補(bǔ)性能差距。華為昇騰910C采用雙Die設(shè)計(jì),F(xiàn)P16算力達(dá)到800 TFLOPS,性能逼近英偉達(dá)H100的80%;寒武紀(jì)思元590綜合性能達(dá)到英偉達(dá)A100的70-80%;海光信息深算二號(hào)FP16算力達(dá)1024 TFLOPS,接近A100的90%。

      由于能效比較差,國產(chǎn)卡普遍采用"電力+工程能力"硬頂?shù)姆绞浇鉀Q功耗問題。摩爾線程的"平湖"架構(gòu)支持單芯片最高1000W TDP動(dòng)態(tài)功耗管理,通過液冷等工程手段確保穩(wěn)定運(yùn)行。雖然每瓦性能仍落后英偉達(dá)約30%,但國產(chǎn)卡低功耗版已經(jīng)正流片。

      說白了,在這段時(shí)期,國產(chǎn)卡往往采用用更密集的液冷,堆更多服務(wù)器機(jī)架,試圖以更強(qiáng)的工程能力來補(bǔ)落后的能效。

      最后是"生態(tài)兼容+編譯層hack"。面對英偉達(dá)CUDA生態(tài)的壟斷地位,國產(chǎn)廠商采取了兼容策略。海光DCU通過ROCm生態(tài)實(shí)現(xiàn)對CUDA的"軟兼容",實(shí)測遷移效率可達(dá)85%。華為CANN架構(gòu)采用"指令翻譯+動(dòng)態(tài)調(diào)度"技術(shù),實(shí)現(xiàn)對CUDA API的80%覆蓋。

      這里的“兼容 CUDA”,從技術(shù)上來說,相當(dāng)于做了一層翻譯器,讓國內(nèi) GPU 能跑英偉達(dá)的指令語言,例如英偉達(dá)的函數(shù)叫 CUDA_X,國產(chǎn)的函數(shù)叫 BR_X(比如壁仞),→ 相當(dāng)于就做一張“對應(yīng)關(guān)系表”,代碼調(diào)用 CUDA_X 時(shí)自動(dòng)轉(zhuǎn)成 BR_X。就像查字典一樣,把“英偉達(dá)語”翻譯成“國產(chǎn)語”,通過合并算子、分拆算子、調(diào)整執(zhí)行順序等一系列手段,將CUDA中的算式變得更適合本地語法。

      但問題也顯而易見:永遠(yuǎn)慢半拍——因?yàn)閷Ψ讲粩喔抡Z言,你永遠(yuǎn)要追新詞,英偉達(dá)每次更新CUDA、更新架構(gòu),國產(chǎn)廠商立刻要做新的翻譯器,這在戰(zhàn)略上十分被動(dòng)。

      H200 被擋在門口的三年,國產(chǎn) GPU 技術(shù)路線呈現(xiàn)出非常鮮明的“中國式風(fēng)格”——在工藝受限的情況下,通過“架構(gòu)取巧、集群堆疊、算子融合、軟件兼容”這些工程學(xué)上的努力,硬生生把落后的硬件打磨到可用、能上規(guī)模、適配大模型訓(xùn)練的程度。

      這套路線不是工程上的最優(yōu)解,但在封鎖環(huán)境下,是現(xiàn)實(shí)可行的最優(yōu)解。

      02

      差距到底在哪?

      要評(píng)估國產(chǎn)GPU與英偉達(dá)H200的技術(shù)差距,需要用統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行量化對比。根據(jù)美國商務(wù)部工業(yè)與安全局(BIS)定義的"總處理性能"(TPP)指標(biāo),可以對主流AI芯片進(jìn)行橫向比較,作為參考。

      這里的TPP指標(biāo),指的是解析:TPP = 2 × MacTOPS × 操作位長,通常以TFLOPS(FP16)× 16計(jì)算。根據(jù)伯恩斯坦研究2025年12月發(fā)布的報(bào)告,各芯片TPP性能對比如下:

      - 英偉達(dá)H200:60,000 TPP(基于Hopper架構(gòu),141GB HBM3e,4.8TB/s帶寬)

      - 英偉達(dá)H20:15,832 TPP(特供版,性能僅為H200的26%)

      - 華為昇騰910C:36,912 TPP(性能約為H200的61.5%,國產(chǎn)最高)

      - 寒武紀(jì)思元590:29,360 TPP(性能約為H200的49%)

      - 海光BW1000/DCU3:14,688 TPP(性能約為H200的24.5%)

      - 摩爾線程S4000:約20,000 TPP(性能約為H200的33%)

      從公開數(shù)據(jù)可以看出,國產(chǎn)頂級(jí)芯片在單卡性能上仍落后H200約1.6-2倍,但已經(jīng)超越了H20,達(dá)到了"可用"的水平。

      然而,在訓(xùn)練能力方面,國產(chǎn)卡單卡仍落后2-3倍,但所幸的是,集群層面可通過"堆卡+高速互聯(lián)"彌補(bǔ)部分差距。

      華為CloudMatrix 384集群(384張昇騰910C)性能接近英偉達(dá)GB200 NVL72,在部分大模型訓(xùn)練任務(wù)中表現(xiàn)良好。但需要注意的是,由于工藝制程限制(國產(chǎn)芯片普遍采用7nm,H200采用4nm),每瓦性能仍落后30%左右。

      推理能力方面,國產(chǎn)Top卡已持平甚至超越閹割版H20。華為昇騰910B2的INT8算力達(dá)到762 TOPS,在推理階段處理低精度數(shù)據(jù)效率較高;寒武紀(jì)思元590在推理場景中也表現(xiàn)優(yōu)異,KV-Cache放得下、帶寬夠用。沐曦曦云C550的顯存帶寬達(dá)到1600-1800GB/s,超越H200的4.8TB/s,在大規(guī)模推理任務(wù)中具有優(yōu)勢。

      成本和功耗方面,目前海光BW100采購價(jià)格約10萬元/張,寒武紀(jì)590價(jià)格從最初8.5萬元降至6-7萬元,華為910C約18萬元,均顯著低于H200的30-40萬元。更重要的是,H200還需額外支付25%的"美國稅",使得國產(chǎn)卡在成本上具有約50%的優(yōu)勢。功耗方面,雖然國產(chǎn)卡單卡功耗較高,但考慮到H200的700W TDP,實(shí)際差距并不懸殊。

      生態(tài)進(jìn)度是國產(chǎn)芯片最大的短板,但也是進(jìn)步最快的領(lǐng)域。

      目前,華為昇騰的CANN 工具鏈已支持與 MindSpore 深度協(xié)同和 PyTorch 一鍵遷移。其他國產(chǎn)平臺(tái)也在做類似深度編譯器與中間表示 (IR) 適配,讓開發(fā)者可以更少手動(dòng)改代碼地運(yùn)行大模型。



      其中的主要原因,在于不同國產(chǎn)芯片廠商、云廠商、軟件團(tuán)隊(duì)、科研院校都在合作推動(dòng)生態(tài)規(guī)范標(biāo)準(zhǔn)化、工具共享、適配案例共享。

      這種產(chǎn)業(yè)協(xié)同在生態(tài)建設(shè)上是少見優(yōu)勢。

      綜合來看,國產(chǎn)芯片與H200在訓(xùn)練方面的差距依舊存在,但在推理方面,已收斂到"能用+成本更低+可控"的水平。

      現(xiàn)階段,國產(chǎn)芯片正從"勉強(qiáng)及格"向"好用"的爬坡階段邁進(jìn),根據(jù)根據(jù)伯恩斯坦的推測,預(yù)計(jì)2026-2027年,將在部分場景實(shí)現(xiàn)與H200的全面競爭。

      03

      未來的較量

      在產(chǎn)業(yè)方面,從技術(shù)演進(jìn)來看,英偉達(dá)剛剛發(fā)布的Blackwell Ultra系列仍延續(xù)"堆料漲性能"的路線,賭的是摩爾定律(或"黃氏定律")尚未終結(jié)。所謂“黃氏定律”,不是什么物理學(xué)定律,而是英偉達(dá)CEO黃仁勛提出的'GPU性能每兩年翻一倍'的經(jīng)驗(yàn)法則。

      這種“定律”與其說是自然規(guī)律,不如說是英偉達(dá)研發(fā)投入和市場策略的體現(xiàn)——每年投入超過70億美元的研發(fā)費(fèi)用,讓競爭對手望塵莫及。

      但國產(chǎn)芯片沒有直接硬碰硬,而是采用"架構(gòu)取巧+多芯片封裝+集群堆疊"的迂回戰(zhàn)術(shù)。華為昇騰采用雙Die設(shè)計(jì),通過先進(jìn)封裝技術(shù)提升集成度;摩爾線程"平湖"架構(gòu)實(shí)現(xiàn)Chiplet可擴(kuò)展架構(gòu),支持計(jì)算Die、HBM3e存儲(chǔ)Die與IODie靈活配置;沐曦曦云C700系列進(jìn)一步擴(kuò)展對FP4等低精度的計(jì)算支持,對標(biāo)H100。

      總體上來看,在先進(jìn)工藝受限的情況下,國產(chǎn)芯片通過架構(gòu)創(chuàng)新實(shí)現(xiàn)了性能突破。華為昇騰910C采用達(dá)芬奇架構(gòu)3.0,集成32個(gè)自研AI Core,支持原生CANN異構(gòu)計(jì)算;寒武紀(jì)思元590采用MLUarch架構(gòu),通過指令集優(yōu)化提升計(jì)算效率;海光深算三號(hào)采用x86+GPGPU的Chiplet封裝,通過2.5D封裝實(shí)現(xiàn)HBM2e內(nèi)存直連,帶寬達(dá)1.6TB/s。

      這些技術(shù)創(chuàng)新使得國產(chǎn)芯片在特定場景下能夠?qū)崿F(xiàn)與英偉達(dá)相媲美的性能表現(xiàn)。

      并且從應(yīng)用層面看,國產(chǎn)AI芯片已經(jīng)找到了自己的"舒適區(qū)",而且干得相當(dāng)不錯(cuò)。

      例如智算中心這類場景,現(xiàn)在已經(jīng)成了華為的“主場”。截至2025年,全國600多個(gè)智算中心項(xiàng)目中,超過300套Atlas 900超節(jié)點(diǎn)已經(jīng)商用部署,華為昇騰在智算中心領(lǐng)域可以說是"一枝獨(dú)秀"。涵蓋互聯(lián)網(wǎng)、電信、制造等多個(gè)行業(yè)。中國電信粵港澳大灣區(qū)的智算昇騰超節(jié)點(diǎn),更是成為全球首個(gè)商用的超節(jié)點(diǎn)項(xiàng)目。

      同樣地,在面向國內(nèi)大生態(tài)的專用場景,例如智能安防、金融風(fēng)控、OCR / 文本語義檢索、音視頻內(nèi)容處理(如自動(dòng)剪輯、AI 轉(zhuǎn)碼)等任務(wù)中,國產(chǎn)卡可針對特定算法做深度定制優(yōu)化。

      通過自研編譯器和算子庫直接對接國內(nèi)框架如MindSpore,在“我只要這個(gè)任務(wù)跑得快就夠了”的場景下,專用定制往往比通用 GPU 效率更高。

      而在低延遲/ 小規(guī)模邊緣場景,例如邊緣 AI、工控設(shè)備、機(jī)器人本地推理等場景,國產(chǎn) NPU/ASIC 方案比通用 GPU 效率更高。因?yàn)榧軜?gòu)從一開始就針對推理做到低功耗,不依賴重型 CUDA 生態(tài)



      說到底,國產(chǎn)芯片的優(yōu)勢場景都有一個(gè)共同點(diǎn):對成本、功耗、供應(yīng)鏈安全敏感。在這些場景,性能不是唯一指標(biāo),性價(jià)比和自主可控才是王道。

      總結(jié)而言,H200的有限解禁是美國"技術(shù)依賴"策略的體現(xiàn),試圖通過提供次高端產(chǎn)品維持中國對美國技術(shù)的依賴。但這一策略為時(shí)已晚——在H200“斷供”的封鎖期內(nèi),中國AI芯片產(chǎn)業(yè)已經(jīng)建立起從硬件到軟件、從單卡到集群的完整解決方案。

      而這套日益牢固的基本盤,不是一塊H200 就能輕易“打回原形”的。

      更重要的是,大模型越來越穩(wěn)定,訓(xùn)練次數(shù)變少的當(dāng)下,最貴的訓(xùn)練不再那么頻繁,但推理量是每天都在爆炸,國產(chǎn)卡能不能吃掉訓(xùn)練,短期不重要,只要把推理吃死,整個(gè)產(chǎn)業(yè)也就立住了。

      在進(jìn)入“戰(zhàn)略相持”階段的當(dāng)下,倘若再多給國產(chǎn)芯片一些時(shí)間,假以時(shí)日,國產(chǎn)訓(xùn)練卡也將"上桌掰手腕"。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      瑞銀警告:日元或跌至175,干預(yù)只會(huì)“耗盡外匯儲(chǔ)備卻無力回天”

      瑞銀警告:日元或跌至175,干預(yù)只會(huì)“耗盡外匯儲(chǔ)備卻無力回天”

      金融界
      2026-04-02 10:59:01
      玲花唇語被破解!曾毅扔傘那一刻,她嘟囔的話太真實(shí)了

      玲花唇語被破解!曾毅扔傘那一刻,她嘟囔的話太真實(shí)了

      可樂談情感
      2026-03-31 16:44:47
      實(shí)探張雪機(jī)車門店 店長:銷量漲了3倍 熱門車型訂單排至7月

      實(shí)探張雪機(jī)車門店 店長:銷量漲了3倍 熱門車型訂單排至7月

      封面新聞
      2026-04-02 22:03:07
      多出來的那雙拖鞋**宋知寧裴征何妍:宋知寧被裴征辜負(fù)后的轉(zhuǎn)身

      多出來的那雙拖鞋**宋知寧裴征何妍:宋知寧被裴征辜負(fù)后的轉(zhuǎn)身

      l喜歡爬山看日出
      2026-04-01 20:04:54
      劉曉慶只比鄧婕大5歲,二人狀態(tài)大不同,科技臉和原裝臉一眼就懂

      劉曉慶只比鄧婕大5歲,二人狀態(tài)大不同,科技臉和原裝臉一眼就懂

      蓓小西
      2026-03-28 09:17:09
      道指深夜重挫近500點(diǎn),原油飆漲13%

      道指深夜重挫近500點(diǎn),原油飆漲13%

      21世紀(jì)經(jīng)濟(jì)報(bào)道
      2026-04-02 23:04:39
      張雪退出凱越機(jī)車同年參保人數(shù)驟降98%

      張雪退出凱越機(jī)車同年參保人數(shù)驟降98%

      雷達(dá)財(cái)經(jīng)
      2026-04-03 02:00:30
      中東戰(zhàn)局,美“戰(zhàn)斧”導(dǎo)彈消耗創(chuàng)紀(jì)錄

      中東戰(zhàn)局,美“戰(zhàn)斧”導(dǎo)彈消耗創(chuàng)紀(jì)錄

      環(huán)球時(shí)報(bào)國際
      2026-04-02 13:58:54
      6億人都在上面找服務(wù),經(jīng)濟(jì)越差,“中國版暗網(wǎng)”越火?

      6億人都在上面找服務(wù),經(jīng)濟(jì)越差,“中國版暗網(wǎng)”越火?

      深氪新消費(fèi)
      2026-04-02 12:15:02
      毫不可惜!知名開發(fā)者:搞LGBT的游戲公司死就死唄

      毫不可惜!知名開發(fā)者:搞LGBT的游戲公司死就死唄

      游民星空
      2026-04-02 16:00:56
      “老師最煩這種現(xiàn)眼包家長”,寶媽運(yùn)動(dòng)會(huì)穿緊身裙,被嘲故作嬌弱

      “老師最煩這種現(xiàn)眼包家長”,寶媽運(yùn)動(dòng)會(huì)穿緊身裙,被嘲故作嬌弱

      妍妍教育日記
      2026-03-17 20:29:16
      宋寧峰退圈了,說要去看心理醫(yī)生,可他女兒才五歲。

      宋寧峰退圈了,說要去看心理醫(yī)生,可他女兒才五歲。

      老吳教育課堂
      2026-04-02 18:11:33
      英媒:中東新四國集團(tuán)出現(xiàn)

      英媒:中東新四國集團(tuán)出現(xiàn)

      參考消息
      2026-03-31 19:24:44
      嚴(yán)屹寬暖心護(hù)張凌赫 直言質(zhì)疑是走向更遠(yuǎn)的勛章

      嚴(yán)屹寬暖心護(hù)張凌赫 直言質(zhì)疑是走向更遠(yuǎn)的勛章

      情感大頭說說
      2026-04-03 03:07:35
      鄭麗文訪陸前突放大招,賴清德急了,蔣萬安表態(tài) 不簡單

      鄭麗文訪陸前突放大招,賴清德急了,蔣萬安表態(tài) 不簡單

      呼呼歷史論
      2026-04-03 00:49:11
      山東老板周新峰去世,年僅40歲,因腰疼確診晚期,后悔做了三件事

      山東老板周新峰去世,年僅40歲,因腰疼確診晚期,后悔做了三件事

      以茶帶書
      2026-04-02 18:10:59
      80年陳云建議陳錫聯(lián)辭職,陳錫聯(lián)猛拍桌:讓我干啥,我絕無二話!

      80年陳云建議陳錫聯(lián)辭職,陳錫聯(lián)猛拍桌:讓我干啥,我絕無二話!

      抽象派大師
      2026-03-25 12:04:28
      涉“優(yōu)思益”,抖音、淘天、小紅書被約談

      涉“優(yōu)思益”,抖音、淘天、小紅書被約談

      觀察者網(wǎng)
      2026-04-02 19:12:06
      徹底掀桌了?伊朗亮出核底牌,硬剛美國重兵集團(tuán),寧可同歸于盡!

      徹底掀桌了?伊朗亮出核底牌,硬剛美國重兵集團(tuán),寧可同歸于盡!

      薰衣草的美麗
      2026-04-01 18:36:38
      有人靠抄知乎內(nèi)容漲粉40多萬變現(xiàn)幾十萬

      有人靠抄知乎內(nèi)容漲粉40多萬變現(xiàn)幾十萬

      歲月有情1314
      2026-04-01 13:44:34
      2026-04-03 03:44:49
      最話Funtalk
      最話Funtalk
      不寫平庸的故事
      585文章數(shù) 597關(guān)注度
      往期回顧 全部

      科技要聞

      三年虧20億,最新估值58億,Xreal沖刺港股

      頭條要聞

      北京89歲奶奶困屋內(nèi)從27層翻窗下爬 爬到21層嚇壞鄰居

      頭條要聞

      北京89歲奶奶困屋內(nèi)從27層翻窗下爬 爬到21層嚇壞鄰居

      體育要聞

      邵佳一的改革,從讓每個(gè)人踢舒服開始

      娛樂要聞

      《浪姐》人氣榜出爐!曾沛慈斷層第一

      財(cái)經(jīng)要聞

      市場被特朗普一句話打醒 滯脹交易回歸

      汽車要聞

      軸距2米7/后排能蹺腿 試駕后驅(qū)小車QQ3 EV

      態(tài)度原創(chuàng)

      本地
      家居
      親子
      數(shù)碼
      教育

      本地新聞

      從學(xué)徒到世界冠軍,為什么說張雪的底氣在重慶?

      家居要聞

      歲月靜好 典雅新章

      親子要聞

      這個(gè)廣告小時(shí)候抱過我

      數(shù)碼要聞

      跨界者大疆:不折騰才是掃地機(jī)的終極形態(tài)

      教育要聞

      王炸!這個(gè)區(qū)超兩成考生“搖號(hào)上高中”,北京中招格局悄然變臉?

      無障礙瀏覽 進(jìn)入關(guān)懷版