![]()
同一時間,另一個消息更值得琢磨:DeepSeek 的下一代模型 V4,正在深度適配華為昇騰芯片。底層算子全部重寫,從英偉達的 CUDA 框架遷移到華為的 CANN 架構(但是這里也有不同說法,有知名的投資人朋友和我說,只是推理用華為的,訓練還是在英偉達上面。但是無論哪一個,都是好的進展)。
這兩件事拼在一起,指向一個正在發生的產業大分裂:中國的 AI 算力生態,正在和美國徹底分道揚鑣。
而這場分裂的核心,是一顆芯片。華為昇騰。
先說 DeepSeek 為什么突然要錢。
幻方給 DeepSeek 攢了一個叫「螢火二號」的算力集群,砸了10個億,裝了大約1萬張英偉達 A100 GPU。那時候 A100 一張卡七八萬塊錢,1萬張就是將近10億人民幣,光買卡的錢就夠一家中型公司活好幾年。
靠這堆卡,DeepSeek 在2024年底干了件讓整個硅谷坐不住的事。
DeepSeek-V3,671億參數,2048張 H800 GPU,訓練了不到兩個月,總算力成本557萬美元。這個數字公布出來,美國人不敢信。Meta 訓練一個差不多水平的模型,花了幾十倍的錢。OpenAI 更不用說。
緊接著2025年1月,DeepSeek-R1 發布,推理能力對標 OpenAI 的 o1 模型,而且完全開源。
英偉達股價當天跳水。
硅谷的反應很有意思。Meta 內部緊急拉了個專題會,分析 DeepSeek 的技術路線。好幾家大公司的研究員私底下在傳:這幫人用我們五分之一的資源,干出了差不多的活兒,我們是不是哪里搞錯了?
這個背景很重要。DeepSeek 證明了一件事:搞 AI 不一定非得砸天量算力,算法效率才是核心變量。
現在問題來了。
DeepSeek 手里那些英偉達的卡,正在變成一種「消耗品」,而且很可能補不上。
2022年開始,美國對中國 AI 芯片出口管制一輪接一輪地收緊。先是禁了 A100 和 H100,英偉達專門給中國做了個降級版 H20,算力砍了一大截。2025年4月,連 H20 也被要求出口許可。雖然中間有過反復,一會兒放一會兒收,可大方向很清楚:高端 AI 芯片,美國不想讓中國用。
H20 這種降級芯片,性能遠不如 H100,價格還不便宜。2025年初 DeepSeek 火了之后,國內算力需求瘋漲,H20 的價格一度飆到100多萬一臺八卡模組。
做這行的人都清楚一件事:如果你的算力底座隨時可能被人一刀切斷供應,你就不可能安心做長期研發。
所以 DeepSeek 做了一個決定:V4 模型要能在國產芯片上跑。
而國產 AI 芯片里,能接住大模型訓練這種重活的,目前就一個選擇——華為昇騰。
華為昇騰,說大白話就是華為自己搞的 AI 芯片。
這個東西的來頭要從華為海思說起。海思是華為的芯片設計部門,總部在深圳坂田,華為基地里頭。達芬奇架構就是海思團隊自研的,專門針對 AI 計算設計的芯片底層架構。
昇騰910B,對標英偉達 A100。FP16 算力大約320 TFLOPS,A100 是312 TFLOPS,紙面上看差不多。
昇騰910C,對標英偉達 H100。FP16 算力750到800 TFLOPS,H100 是將近1000 TFLOPS。差距有,但不是不能用。
![]()
關鍵的差距在三個地方。
第一,制程。英偉達 H100 用的是臺積電4納米工藝,華為昇騰用的是中芯國際7納米。中芯拿不到 EUV 光刻機(極紫外光刻),只能用 DUV 多重曝光的笨辦法硬磕。做出來的芯片功耗偏高,良率也不行。公開信息顯示,2025年上半年昇騰芯片的良率大約30%到40%,臺積電成熟產線能做到60%到70%。簡單說就是,同樣一片晶圓,華為能用的芯片只有人家的一半。
第二,互聯。英偉達有 NVLink,GPU 之間的數據傳輸帶寬極高,訓練萬億參數模型的時候,這個東西是命脈。華為有自研的 HCCS 協議,帶寬在提升,可在超大規模集群里頭的多卡并行效率,跟 NVLink 比還有差距。
第三,也是最致命的:軟件生態。
CUDA。
英偉達花了19年建起來的軟件棧。全球600萬開發者,40000多家公司在用,400多個加速計算庫,600多個預訓練模型。大學教 AI 的課程,默認就是 CUDA。你寫一個深度學習代碼,不管用 PyTorch 還是 TensorFlow,底下跑的都是 CUDA。
這東西的恐怖之處在于切換成本。一家公司如果所有的訓練代碼、推理流程、優化腳本都是基于 CUDA 寫的,你讓他換到華為的 CANN 上來,等于重寫一遍。不是改幾行代碼的事,是整個工程體系推倒重來。
做過 CUDA 開發的工程師轉到昇騰上,痛苦是實打實的。CANN 的版本匹配要求極高,驅動、固件、框架、算子包,任何一個版本對不上,就可能出隱性 bug,查起來要命。有工程師在技術社區里寫過:「從 PyTorch 模型轉成昇騰推理模型的過程,是 bug 最密集的環節,經常一個算子不支持,整個流水線就卡住了。」
![]()
這就是華為面對的真實處境:硬件上在追,追到了70%到80%的水平;軟件上差得更遠,生態的厚度不是三五年能補上的。
可問題是,留給中國的選擇并不多。
英偉達的芯片隨時可能斷供(現在的限制本來就非常多,實質上對中國是關著門的)。AWS、Google 這些美國云廠商的算力也不可能給中國的核心 AI 企業用。在這種大環境下,昇騰不是「最好的選擇」,而是「唯一能走的路」。
2025年,華為在全聯接大會上公布了一張芯片路線圖,野心不小。
2026年一季度,昇騰950PR 推出,專門做推理任務。四季度推昇騰950DT,做訓練和解碼。兩款芯片都搭載華為自研的高帶寬內存(HBM),不再依賴三星和 SK 海力士。
2027年四季度出昇騰960,算力、帶寬比950翻一倍。2028年出970。
每年迭代一代,步子不算慢。
這條路線圖背后,是一整條正在成型的國產算力產業鏈。做昇騰這件事,不是華為一家在干,是幾十家上市公司一起在干。
先說最上游,芯片封裝基板。昇騰910C 用的是雙 Die 封裝(簡單說就是把兩顆芯片拼在一塊),這個活對基板的精度要求極高。深南電路和興森科技,這倆公司是國內高端 PCB 和封裝基板的龍頭,昇騰的關鍵供應商。
再說連接器。AI 服務器里頭,芯片之間、背板之間的數據傳輸,靠的是高速連接器。華豐科技做昇騰的高速背板連接器,意華股份做板對板連接器。這些東西看著不起眼,但數據跑不通,整臺服務器就是廢鐵。
然后是整機。華為自己不造服務器,找的是合作伙伴。高新發展控股的華鯤振宇,拿到了華為鯤鵬加昇騰雙領先級認證。拓維信息做「兆瀚」系列 AI 服務器。神州數碼是昇騰全球總經銷商,自己還做了一個「神州鯤泰」系列。工業富聯負責代工。
光模塊。AI 服務器搞萬卡集群,卡和卡之間要用光纖連起來。華工科技做800G 光模塊,光迅科技做光器件,中際旭創是高速光模塊龍頭。
最后一個大件:液冷。昇騰 AI 服務器功耗高,傳統風冷扛不住,必須上液冷。高瀾股份做液冷全套方案,川潤股份做昇騰超節點的液冷系統,市占率不低。
軟件生態這邊,軟通動力是華為的頂級軟件伙伴,潤和軟件做昇思 MindSpore 框架的優化,科大訊飛是昇騰生態最大的應用合作方。
這條產業鏈拉出來,從底層基板到芯片封裝,從連接器到整機制造,從光模塊到液冷系統,從軟件框架到行業應用,幾十家公司各占一個環節。
2026年初,中國移動搞了一次超50億的 AI 通用計算設備集采,昇騰系廠商拿走了34億。字節跳動也有大規模的昇騰芯片采購計劃,910C 和 950 都要,用來搭訓練加推理的算力閉環。
說回 DeepSeek 的融資。
3億美元,對一個估值100億美元的公司來說,真的不算多。圈里分析比較集中的一個判斷是:這筆錢的主要目的是給期權定價。
![]()
另一個更實際的原因:向國產芯片遷移是重資產投入。V4 模型要從 CUDA 全面切到 CANN,底層算子要重寫,推理框架要重做,集群通信要重新優化。這些工程量巨大,需要大量高水平的系統工程師,而且沒有現成方案可以抄,全得自己趟路。
這件事的意義已經不只是 DeepSeek 一家公司的戰略選擇。當中國最強的 AI 大模型公司開始全面擁抱國產芯片,整個行業的生態重心就開始位移了。
華為昇騰此前的客戶以國資背景為主,運營商、央企、政府智算中心。DeepSeek 是第一個站出來說「我要在昇騰上訓練頂級大模型」的純市場化 AI 公司。這給整個昇騰生態帶來的信號量是不一樣的。
做開發工具的會跟進,做模型優化的會跟進,做部署方案的也會跟進。一旦生態里有了足夠多的頭部用戶,CANN 的成熟速度會比現在快得多。
截至2025年底,中國已建成的萬卡智算集群有42個,智能算力規模超過1590 EFLOPS。整個智算中心市場預計2026年能到1763億元。這個盤子足夠大,大到能養活一條完整的國產算力產業鏈。
華為的策略也看得出來,不是跟英偉達比單芯片性能,而是靠「超節點加集群」的系統級方案來補單卡差距。用自研的「靈衢」互聯協議把幾千張昇騰芯片串成一個整體,用專門優化過的推理引擎降低實際運行成本。
DeepSeek 的加入讓這條路更快了一步。這家公司最擅長的事情就是在有限資源下把算法效率做到極致。如果他們能在昇騰上把 V4 訓出來,而且性能不掉太多,對整個國產算力生態就是一針強心劑。
昇騰現在的狀態,有點像當年的安卓。早期的安卓也是一堆毛病,卡頓、兼容性差、開發者罵街。可一旦生態轉起來,用戶上來了,開發者就跟著來了,應用豐富了,體驗也就慢慢好了。現在國產 AI 芯片走的就是這條路。
做集群運維的工程師現在兩條腿走路,一邊維護英偉達的存量設備,一邊學 CANN 的新框架。很多公司的招聘里已經開始加一條:「有昇騰開發經驗者優先」。
說到底,這場 AI 算力的產業分化不是突然發生的,是被逼出來的。英偉達不賣高端芯片給中國,中國就只能自己造。造出來不好用,就硬著頭皮優化。優化的過程中,一條國產產業鏈慢慢長出來了。
![]()
這條產業鏈現在還粗糙,問題一大堆。可它正在給幾十萬工程師創造就業機會,給幾十家上市公司帶來新的增長曲線,給整個 AI 行業提供一個不怕斷供的底座。
加油!非常期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.