<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      自主還是兼容:DeepSeek V4延期背后的中國AI生態選擇題

      0
      分享至

      文 | 孫永杰

      進入到2026年,DeepSeek V4的發布窗口一再推遲,卻意外點燃了全球AI圈對“去CUDA化”的討論。而從多家媒體的報道看,這款預計參數規模達萬億級、支持百萬token上下文的多模態開源模型,正全力適配華為昇騰芯片,并通過CANN框架完成核心代碼重寫。

      如果上述最終成為現實,這將是中國AI體系第一次在真實生產環境中,系統性探索在非CUDA平臺上承載核心模型能力的可能性。換言之,這不僅是一款模型的發布,更像是一場底層技術路線的“壓力測試”。

      然而,正如DeepSeek創始人梁文峰在內部溝通中強調的,這只是“萬里長征的第一步”。未來風險與機遇并存,兼容與自立之間的平衡,甚至取舍,將決定中國AI能否真正走出屬于自己的發展之路。

      DeepSeek V4延期,基礎AI計算平臺轉換的必然代價

      如前述,原計劃在今年農歷新年或2—3月發布的V4,一再錯過窗口,直至4月初相關媒體確認“數周內發布”,究其原因,是推理端與采用華為昇騰芯片的深度適配。但問題在于,這條路徑遠比想象中復雜。而要理解這種復雜性,首先需要回到DeepSeek V4本身的技術特征。

      眾所周知,進入2026年,大模型參數規模已經跨越“萬億”門檻,向數萬億級邁進。在這一背景下,雖然V4采用更為激進的MoE(專家混合)架構,在理論上通過“按需激活專家”降低單次推理計算量,但代價則是對包括內存帶寬、芯片間互聯(Interconnect)以及KV Cache管理等的系統能力提出了更極端的要求。


      換句話說,算力壓力從“純計算”轉向了“系統調度與通信”。而在在英偉達生態內,這套問題有相對成熟的解法。

      例如基于H100或B200,通過NVLink與NVSwitch構建的高帶寬互聯,其單節點GPU間帶寬可達TB/s級別,形成近似“全連通”的計算網絡,數據在芯片間流動如同高速公路,延遲與同步成本被極大壓縮。但當DeepSeek試圖將這套精密體系遷移至華為昇騰平臺時,面對的卻是完全不同的硬件拓撲。

      不可否認,昇騰芯片近年來進步顯著,但在超大規模集群的“全連通能力”上,與英偉達仍存在物理層差距。例如,受制于制程與SerDes IP能力,昇騰更多依賴光模塊進行跨節點擴展,這種“以空間換帶寬”的方案雖然可行,但也引入了更長的物理鏈路,從而帶來信號延遲、同步開銷以及功耗與散熱管理等的復雜性。

      與此同時,軟件層面的差距同樣不可忽視。昇騰的CANN框架在算子覆蓋、自動并行、內核融合以及分布式通信調度等方面,整體成熟度仍落后于CUDA生態。這意味著,DeepSeek工程團隊需要在大量底層細節上進行針對性優化,甚至手動重寫關鍵算子。

      更棘手的是,這種落后往往不是線性,而是系統性的。具體表現為一個算子的性能下降,可能影響整條計算鏈路;一次通信效率的降低,可能導致整體吞吐大幅波動。最終的結果可能就是模型尚能運行,但距離穩定、高效、可規模化還有很長的距離。

      從這個角度看,DeepSeek V4的延期,并非簡單的產品節奏問題,而是中國頂尖算法團隊與國產芯片體系之間深度磨合的必然代價。雖然過程艱難,卻意義重大。

      更重要的是,這一過程釋放出一個清晰信號,即AI競爭,正在從“模型能力比拼”,轉向“系統工程能力比拼”。而在這一階段,誰能更快把模型“跑起來、跑穩定、跑便宜”,誰才真正接近產業級優勢。

      CUDA壟斷難破,CANN無奈妥協

      如果說上述DeepSeek V4在推理側的適配困難,揭示的是工程層面的現實瓶頸,那么順著這個問題往下追問,一個更本質的疑問也隨之浮現:為什么只是把模型從一個算力平臺遷移到另一個平臺,會變得如此困難?

      回看PC時代的Wintel聯盟,微軟與英特爾雖然聯手壟斷,但兩家公司之間存在利益博弈,這為后來Linux、AMD乃至蘋果系統的崛起預留了空間。然而,英偉達在AI領域建立的是一種“單體垂直壟斷”,即微軟與英特爾的合體。

      具體體現為,硬件層面上,英偉達定義了SM(流式多處理器)的物理結構和Tensor Core的計算邏輯;軟件層面上,CUDA提供了與之1:1完美契合的cuBLAS、cuDNN等閉源庫。二者疊加導致了一個極其恐怖的現實:全球600萬+的開發者圍繞cuBLAS、cuDNN、NVLink/NVSwitch優化算法、框架(PyTorch、TensorFlow)優先CUDA實現,甚至AWS Trainium+Cerebras WSE的“反NVIDIA”異構集群,在KV緩存遷移時仍需NVIDIA NIXL軟件和AWS EFA。


      由此可見,這已不是單點的技術細節,是生態鎖定,即模型可移植性失效前,開發者“用英偉達硬件特性語言思考”已成為慣性。而正是這種生態慣性,讓英偉達像一個巨大的黑洞,吸納了全球90%以上的創新紅利。

      在上述背景下,作為其最強有力競爭者的華為CANN最初確實試圖走一條相對獨立的路線,但隨著大模型時代的到來,這種路徑逐漸顯露出問題,例如開發者不愿遷移,企業不敢承擔風險,生態增長緩慢。加之時間(例如大模型的快速迭代)的壓力,完全自立的路徑開始變得不再現實。

      基于此,CANN逐步引入類似CUDA的抽象層設計,例如在CANN Next中嘗試對標cuBLAS、cuDNN接口,實現高比例兼容,使模型遷移成本從“數周甚至數月”壓縮至“小時級”;在架構層面,新近發布的950PR異構架構(預填充/解碼解耦)也刻意模仿英偉達解耦式服務,而非谷歌TPU的徹底異構路線。

      我們必須承認,這種近似于“兼容優先”的策略在短期內是成功的,它降低了門檻,使昇騰迅速在國內市場獲得應用基礎,并讓像DeepSeek、騰訊、字節跳動等這樣的公司能夠以較低的門檻嘗試國產算力。例如CANN Next通過SIMT編程模型實現高達95%以上的CUDA兼容性,已幫助多家企業將遷移時間大幅縮短至小時級,加速了實際落地。

      但隨之而來的挑戰是,一旦涉及前沿創新,兼容層就會變成“天花板”。

      例如當開發者真正深入使用昇騰平臺時會發現,雖然常見路徑已經被鋪平,但一旦涉及一些冷門、創新的底層算子,CANN的支持度就會下降,性能抖動劇烈。而DeepSeek V4在適配過程中遇到的諸如在嘗試引入SSM(狀態空間模型)或Mamba這類非Transformer結構的混合架構時,發現CANN的底層優化仍主要向矩陣乘法(GEMM)傾斜的所謂困難,很大程度上是因為其在嘗試一些超越常規的算法優化時,撞到了CANN兼容層的“邊界”。

      而更深層的問題在于,一旦選擇兼容,就意味著默認CUDA仍然是隱形標準,你可以替換硬件,但在軟件語義和開發范式上,仍然在沿用對方定義的規則。這既是捷徑,也是限制。

      兼容存隱患挑戰,未來機遇仍需真正自立

      如前述,在CUDA生態形成事實標準的現實下,華為選擇“類兼容”路徑幾乎是必然結果,但同時也將整個中國AI產業推到了一個關鍵性的選擇節點:是繼續兼容CUDA,還是逐步走向真正獨立的生態體系?

      從短期來看,答案幾乎沒有懸念,那就是必須兼容,這是效率與現實的選擇。但從長期來看,這條路徑則隱藏著不容忽視的風險。

      眾所周知,當一個系統(如CANN)為了兼容另一個系統(如CUDA)而設計時,它不可避免地會繼承對方的局限性。

      事實是,目前全球大部分開源算法都是圍繞英偉達架構開發的,如果為了利用這些存量資產而一味追求1:1兼容,那么我們就會在硬件設計上陷入“模仿者陷阱”,并表現為一旦英偉達的硬件架構在未來某個節點面臨范式轉型,例如從Transformer轉向某種不需要大規模矩陣乘法、而是更依賴異步邏輯的新架構時,那么一直處于“影子狀態”的國產算力棧可能會面臨瞬間的技術斷層,而這種“Bug對Bug兼容”的死胡同,無疑讓我們的底層創新始終籠罩在別人的陰影之下。

      而更深層的風險在于“時間差”。根據伯恩斯坦和Epoch AI的統計數據,雖然華為在國內份額激增,但在全球AI算力總量中,國產芯片的占比僅為5%,仍屬相對有限。而正是這種絕對規模的差距,導致了嚴重的“研發效率摩擦”。



      具體表現為,美國AI巨頭可以利用Blackwell強大的通信帶寬,在18個月內跑通10T參數的Scaling Laws,而中國的頂尖人才卻不得不將50%以上的科研產能消耗在“如何解決老舊芯片的信號衰減”和“適配不成熟的編譯器”等問題上。

      需要說明的是,上述時間上的錯位,在瞬息萬變的AI時代會被無限放大。當我們的人才還在忙于“填坑”時,對手可能已經完成了模型能力的指數級復利,導致對手一年模型的領先,演變為我們在模型能力、數據飛輪、安全對齊均呈指數復合增長疊加后,與對手形成不止一年的鴻溝。

      當然,挑戰往往蘊含著機遇。DeepSeek V4若成功發布,將證明“國產全棧”可行性,加速CANN生態成熟,吸引更多開發者跟進,加之全球“天下苦英偉達久矣”的情緒,業內對CANN的支持或將超出預期。而華為昇騰等后續芯片若達H100的80%—90%推理性能,疊加CANN Next的兼容紅利,中國AI供應鏈臨界規模有望在1—2年內形成。

      但需要清醒認識的是,兼容只能解決“活下來”的問題,真正的自立,才能決定“走多遠”。而未來3-5年,將是一個關鍵窗口期。如果我們能夠在保持兼容的同時,逐步建立獨立的編程模型、算子體系與系統架構,中國AI生態仍有機會實現從跟隨到定義規則的躍遷。否則中國AI或將陷入“粗糙復制列車”的軌道。

      寫在最后:DeepSeek V4的延期發布,看似偶然的“跳票”,實則揭示了一個更深層的現實,即AI競爭早已不只是模型之爭,而是底層生態與系統能力的全面較量。兼容CUDA固然是通往現實的最短路徑,但若止步于此,也可能鎖定未來的天花板。

      所以真正的挑戰,不在于能否替代一套技術,而在于能否擺脫對既有范式的依賴,構建屬于自己的規則體系。而接下來的3-5年,將決定中國AI是成為全球生態中的重要一極,還是長期停留在“高水平跟隨”的位置。當然,在追求自立的同時,也需警惕封閉生態可能對全球開發者吸引力的潛在影響,以確保生態的開放性和長期國際競爭力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      YSL“露腚裝”惹爭議,比巴黎世家還炸裂!

      YSL“露腚裝”惹爭議,比巴黎世家還炸裂!

      互聯網品牌官
      2026-04-21 19:11:35
      澳門有多大

      澳門有多大

      新科文
      2026-04-16 18:31:53
      馬拉多納兒子:在所有人類球員中梅西是最棒的,但我父親是神

      馬拉多納兒子:在所有人類球員中梅西是最棒的,但我父親是神

      懂球帝
      2026-04-21 23:37:05
      偉大的10-2!吳宜澤破百收工,復仇戰創2大紀錄,中國4人進16強!

      偉大的10-2!吳宜澤破百收工,復仇戰創2大紀錄,中國4人進16強!

      劉姚堯的文字城堡
      2026-04-21 22:32:23
      真相曝光!日本真子公主逃離紐約,懷抱嬰兒現身康州:徹底平民化

      真相曝光!日本真子公主逃離紐約,懷抱嬰兒現身康州:徹底平民化

      奇怪的鯊魚們
      2026-04-21 14:18:34
      英媒:吳宜澤是中國斯諾克流水線最新旗艦產品,他有一項隱藏技能

      英媒:吳宜澤是中國斯諾克流水線最新旗艦產品,他有一項隱藏技能

      楊華評論
      2026-04-21 15:38:52
      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      橙星文娛
      2026-04-17 13:19:56
      笑麻了!長大了竟然能理解反派了,網友:現在真的能共情容嬤嬤

      笑麻了!長大了竟然能理解反派了,網友:現在真的能共情容嬤嬤

      夜深愛雜談
      2026-04-21 20:11:53
      姆巴佩破門造2大紀錄,熊皇世界波,皇馬2-1送阿拉維斯交手9連敗

      姆巴佩破門造2大紀錄,熊皇世界波,皇馬2-1送阿拉維斯交手9連敗

      釘釘陌上花開
      2026-04-22 05:33:49
      83年李鵬當上副總理,79歲的鄧穎超親自上門叮囑:切不可脫離群眾

      83年李鵬當上副總理,79歲的鄧穎超親自上門叮囑:切不可脫離群眾

      我不是沃神
      2026-04-12 14:35:03
      資本家的丑孩子收手吧!沒演技還長得丑的星二代,別來禍禍觀眾了

      資本家的丑孩子收手吧!沒演技還長得丑的星二代,別來禍禍觀眾了

      雨月海星
      2026-04-22 06:13:47
      “全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網友催開業…

      “全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網友催開業…

      北京商報
      2026-04-21 21:54:51
      中國女籃落入死亡之組

      中國女籃落入死亡之組

      刺猬籃球
      2026-04-22 10:42:52
      哈文含淚道破李詠葬在美國原因:不是不愛國,而是三天內必須下葬

      哈文含淚道破李詠葬在美國原因:不是不愛國,而是三天內必須下葬

      悅君兮君不知
      2026-04-22 01:54:22
      盤踞武漢多年“黑老大”黃大發等12人組織、領導、參加黑社會性質組織案一審宣判

      盤踞武漢多年“黑老大”黃大發等12人組織、領導、參加黑社會性質組織案一審宣判

      澎湃新聞
      2026-04-21 14:58:02
      造29年恥辱紀錄,切爾西0-3布萊頓吞5連敗,遠征球迷痛罵主帥

      造29年恥辱紀錄,切爾西0-3布萊頓吞5連敗,遠征球迷痛罵主帥

      釘釘陌上花開
      2026-04-22 04:55:04
      刷短視頻跳出游戲鏈接,32歲小伙兒上癮充值500萬元傾家蕩產,當事人:每天充值沒限額,30連抽十幾萬就沒了,“如今債務纏身”;平臺回應

      刷短視頻跳出游戲鏈接,32歲小伙兒上癮充值500萬元傾家蕩產,當事人:每天充值沒限額,30連抽十幾萬就沒了,“如今債務纏身”;平臺回應

      極目新聞
      2026-04-21 13:44:47
      巴鐵1.3萬中械師進沙特,阿聯酋提1500億進京,中東變天了

      巴鐵1.3萬中械師進沙特,阿聯酋提1500億進京,中東變天了

      戰爭史
      2026-04-20 11:04:19
      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      這才是宋美齡和繼子蔣經國的一張真實合影,都是真人的容貌

      喜歡歷史的阿繁
      2026-04-16 11:17:28
      留下238億遺產,為何4個孩子沒人愿意繼承,甚至連花圈都不給他送

      留下238億遺產,為何4個孩子沒人愿意繼承,甚至連花圈都不給他送

      米果說識
      2026-03-21 17:02:24
      2026-04-22 11:16:49
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      132572文章數 862112關注度
      往期回顧 全部

      科技要聞

      凌晨突發!ChatGPT Images 2.0發布

      頭條要聞

      牛彈琴:伊朗發出讓人毛骨悚然的警告 玩的就是心跳

      頭條要聞

      牛彈琴:伊朗發出讓人毛骨悚然的警告 玩的就是心跳

      體育要聞

      一到NBA季后賽,四屆DPOY就成了主角

      娛樂要聞

      復婚無望!baby黃曉明陪小海綿零交流

      財經要聞

      伊朗拒絕出席 特朗普宣布延長停火期限

      汽車要聞

      四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

      態度原創

      時尚
      手機
      家居
      教育
      本地

      頂流復工,已判若兩人

      手機要聞

      vivo Y600 Pro手機官宣4月27日發布,搭載10200mAh耐低溫電池

      家居要聞

      極簡繪夢 克制和諧

      教育要聞

      歡迎報考!開封智慧健康職業學院2026單招報考指南

      本地新聞

      春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

      無障礙瀏覽 進入關懷版