網易首頁 > 網易號 > 正文申請入駐

太扎心！DeepSeek V4登頂，焊死國產軟硬鏈路，但現實鴻溝仍難跨

2026-04-25 19:53:03　來源: 數碼八叔

廣西舉報

分享至

最近DeepSeek V4徹底刷爆科技圈與投資圈，公開跑分追平甚至部分超越GPT-4o、Claude 3 Opus等海外頂級模型，英偉達CEO黃仁勛更是罕見公開發出“災難性影響”的警告，看似是中國AI揚眉吐氣的里程碑事件。我翻完37頁官方技術報告、捋完近3個月的算力供應鏈政策與產業動態后，卻半點輕松不起來。這場狂歡的底色，是中國AI產業在高端算力封鎖下被逼到極致的“螺螄殼里做道場”，所有耀眼突破背后都拖著現實引力的沉重枷鎖，遠不到開香檳慶功的時候。

我在AI產業圈摸爬滾打8年，見過太多PPT造神的鬧劇，這次DeepSeek的突破之所以讓人五味雜陳，核心是它走的路完全不同于硅谷的“土豪模式”。不管是OpenAI還是Anthropic，背后都有微軟、亞馬遜的無限算力支撐，動輒幾萬張英偉達B200、GB200組成的統一架構集群，底層邏輯就是“大力出奇跡”——算力夠多夠好，算法上的瑕疵完全可以用硬件冗余掩蓋。而DeepSeek的極致優化，本質是“窮人的智慧”。我們必須承認一個客觀現實：當前國內拿不到英偉達最頂級的AI芯片，哪怕是降配特供芯片或國產算力集群，規模擴展到萬卡級別時，通信損耗會呈指數級上升。

據IDC 2025年發布的《中國AI算力集群效能白皮書》，異構萬卡集群的有效算力損耗最高可達42%，一萬張性能為10的卡，實際輸出僅相當于5800張卡的效果。這就是為什么DeepSeek對顯存、激活參數的壓榨到了近乎癡迷的地步，把MoE架構玩出花，死磕每個Token的計算效率——不是為了炫技，是為了給受限的硬件打補丁，這種在螺螄殼里做道場的極致內卷，可敬，卻也透著無奈。

真正讓行業震動的，不是V4的跑分，而是兩個配套動作：一是開源TileKernels算子，二是華為昇騰官宣V4將在昇騰平臺首發。這才是整場發布會的核心殺招：DeepSeek正在強行把國產算法和國產硬件焊死在一起。英偉達的護城河從來不是單卡算力，而是CUDA軟件生態。信通院2025年《全球AI開發生態報告》顯示，過去15年全球累計1200萬AI開發者基于CUDA寫代碼，國內92%的AI項目默認適配英偉達硬件，國產算力芯片的平均軟件適配率不足28%——不是國產卡跑分不行，是沒有足夠的底層算子適配，代碼跑起來卡頓、報錯，效率連英偉達卡的1/10都達不到。而DeepSeek這次開源的TileKernels，直接把MoE路由、FP8訓練推理的底層適配在國產芯片上一次性搞定，相當于給所有國產大模型廠商鋪好了適配國產算力的路，也給昇騰950的大規模量產做了頂級“試金石”。

我上個月跟昇騰的底層工程師吃飯，他說為了適配V4的MoE架構，團隊連續2個月每天盯到凌晨3點，光通信協議的bug就改了170多版。這種沒人愿意干的臟活累活，DeepSeek干了，本質是在挖英偉達CUDA生態的墻腳。更關鍵的是，官方明確提到，下半年昇騰950量產后V4的API價格將大幅下調，這意味著DeepSeek正在實質性擺脫對英偉達昂貴算力的依賴，跟“英偉達稅”徹底脫鉤。黃仁勛怕的從來不是某一個中國模型跑分高，而是中國企業跑通了“沒有英偉達也能做頂級大模型”的路徑——一旦這個路徑被驗證可行，英偉達軟硬捆綁收割全球的萬億市值邏輯，在中國市場就撕開了一道無法修補的裂痕。

但硬幣的另一面，是三個繞不開的現實難題，這也是我高興不起來的核心原因。第一個是物理鴻溝無法靠算法抹平。單卡顯存帶寬、芯片互聯技術的代差是客觀存在的，哪怕算法優化到極致，也不可能違反物理定律。1.6萬億參數的V4在異構集群上訓練，根本不是公關稿里寫的那么云淡風輕：集群崩潰、梯度爆炸、連夜排查bug、漫長的斷點續訓都是常態，我聽DeepSeek的內部人說，V4訓練期間曾出現過一次集群故障，光是恢復數據、續訓就花了整整一周，這種代價，硅谷團隊根本不需要承擔。

第二個是燒錢的無底洞。據36氪2026年4月獨家報道，DeepSeek擬啟動的首輪市場化融資估值達210億美元，阿里、騰訊均已進入盡調環節，打破了其成立3年不接受巨頭投資的慣例。原因很殘酷：大模型越往后越像重資產基建，哪怕昇騰950量產后硬件成本下降，一個幾萬張卡的超算中心，每天的電費、冷卻費、折舊費就超過百萬元，在商業化閉環跑通之前，自有資金根本填不滿這個吞金獸。拿巨頭的錢能續命，但代價是未來的商業化路線、開源節奏，不可避免要受到資本意志的影響。第三個是人才的全球化爭奪。

近期圈內確實有DeepSeek核心人員流失的傳聞，我從來不覺得這是什么道德問題——AI領域的人才競爭是全球化的，硅谷巨頭開得出百萬美元年薪加期權，國內其他大廠也愿意掏兩三倍薪水挖角，頂尖研究員不是苦行僧，不能指望他們永遠用愛發電。如何留住這些最聰明的大腦，是比技術優化更難解的題。

DeepSeek創始人梁文鋒是我非常佩服的極客，從幻方量化到DeepSeek，他一直是個純粹的技術理想主義者，但現在他面臨著一個幾乎無解的“不可能三角”。第一是團隊純粹性與工程泥濘的矛盾：DeepSeek一直靠小而精的頂尖團隊著稱，但為了適配國產芯片，要做大量瑣碎、毫無美感的底層搬磚工作，要維持極客文化就很難應對海量的工程需求，要補工程短板就必然要擴張團隊，稀釋原有的文化氛圍。

第二是獨立性與算力饑渴的矛盾：DeepSeek之前之所以受尊敬，就是因為它是少有的不綁定巨頭的獨立大模型公司，但現在要迭代下一代模型，必須要有源源不斷的資金買算力，拿巨頭的錢是必然的妥協，可未來還能不能堅持現在的開源節奏、不被巨頭的業務需求綁架，還是個未知數。第三是價格普惠與人才成本的矛盾：V4承諾下半年API降價，繼續做價格屠夫，但現在AI人才薪資水漲船高，沒有足夠的利潤，根本拿不出匹配硅谷的薪酬留人才，一味降價換市場，最后可能留不住核心團隊。

DeepSeek V4絕對是中國AI發展史上的里程碑，它的偉大從來不是跑分碾壓海外，而是在極度受限的環境下，硬生生殺出了一條血路，證明了中國工程師哪怕沒有最頂級的芯片，也能做出世界一流的大模型。但我真的勸大家別忙著狂歡，中國AI產業沒有捷徑，也沒有彎道超車的可能。我們沒有最先進的光刻機，拿不到最頂級的芯片，還要面臨隨時升級的制裁風險，曾國藩說的“結硬寨，打呆仗”，就是未來十年中國AI產業的唯一出路。不要指望某一個天才算法能扭轉乾坤，也不要沉迷于發布會的參數狂歡，真正決定生死的，是聚光燈之外的苦活累活：一行行重寫底層算子，一個個填平國產芯片的bug，一筆筆算清商業化的經濟賬。V4只是用血肉之軀在荊棘地里趟平了第一段路，整個中國科技產業的漫漫長征，才剛剛開始。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.