最近DeepSeek V4徹底刷爆科技圈與投資圈,公開跑分追平甚至部分超越GPT-4o、Claude 3 Opus等海外頂級模型,英偉達CEO黃仁勛更是罕見公開發出“災難性影響”的警告,看似是中國AI揚眉吐氣的里程碑事件。我翻完37頁官方技術報告、捋完近3個月的算力供應鏈政策與產業動態后,卻半點輕松不起來。這場狂歡的底色,是中國AI產業在高端算力封鎖下被逼到極致的“螺螄殼里做道場”,所有耀眼突破背后都拖著現實引力的沉重枷鎖,遠不到開香檳慶功的時候。
![]()
我在AI產業圈摸爬滾打8年,見過太多PPT造神的鬧劇,這次DeepSeek的突破之所以讓人五味雜陳,核心是它走的路完全不同于硅谷的“土豪模式”。不管是OpenAI還是Anthropic,背后都有微軟、亞馬遜的無限算力支撐,動輒幾萬張英偉達B200、GB200組成的統一架構集群,底層邏輯就是“大力出奇跡”——算力夠多夠好,算法上的瑕疵完全可以用硬件冗余掩蓋。 而DeepSeek的極致優化,本質是“窮人的智慧”。我們必須承認一個客觀現實:當前國內拿不到英偉達最頂級的AI芯片,哪怕是降配特供芯片或國產算力集群,規模擴展到萬卡級別時,通信損耗會呈指數級上升。
據IDC 2025年發布的《中國AI算力集群效能白皮書》,異構萬卡集群的有效算力損耗最高可達42%,一萬張性能為10的卡,實際輸出僅相當于5800張卡的效果。這就是為什么DeepSeek對顯存、激活參數的壓榨到了近乎癡迷的地步,把MoE架構玩出花,死磕每個Token的計算效率——不是為了炫技,是為了給受限的硬件打補丁,這種在螺螄殼里做道場的極致內卷,可敬,卻也透著無奈。
![]()
真正讓行業震動的,不是V4的跑分,而是兩個配套動作:一是開源TileKernels算子,二是華為昇騰官宣V4將在昇騰平臺首發。這才是整場發布會的核心殺招:DeepSeek正在強行把國產算法和國產硬件焊死在一起。 英偉達的護城河從來不是單卡算力,而是CUDA軟件生態。信通院2025年《全球AI開發生態報告》顯示,過去15年全球累計1200萬AI開發者基于CUDA寫代碼,國內92%的AI項目默認適配英偉達硬件,國產算力芯片的平均軟件適配率不足28%——不是國產卡跑分不行,是沒有足夠的底層算子適配,代碼跑起來卡頓、報錯,效率連英偉達卡的1/10都達不到。而DeepSeek這次開源的TileKernels,直接把MoE路由、FP8訓練推理的底層適配在國產芯片上一次性搞定,相當于給所有國產大模型廠商鋪好了適配國產算力的路,也給昇騰950的大規模量產做了頂級“試金石”。
我上個月跟昇騰的底層工程師吃飯,他說為了適配V4的MoE架構,團隊連續2個月每天盯到凌晨3點,光通信協議的bug就改了170多版。這種沒人愿意干的臟活累活,DeepSeek干了,本質是在挖英偉達CUDA生態的墻腳。更關鍵的是,官方明確提到,下半年昇騰950量產后V4的API價格將大幅下調,這意味著DeepSeek正在實質性擺脫對英偉達昂貴算力的依賴,跟“英偉達稅”徹底脫鉤。黃仁勛怕的從來不是某一個中國模型跑分高,而是中國企業跑通了“沒有英偉達也能做頂級大模型”的路徑——一旦這個路徑被驗證可行,英偉達軟硬捆綁收割全球的萬億市值邏輯,在中國市場就撕開了一道無法修補的裂痕。
![]()
但硬幣的另一面,是三個繞不開的現實難題,這也是我高興不起來的核心原因。 第一個是物理鴻溝無法靠算法抹平。單卡顯存帶寬、芯片互聯技術的代差是客觀存在的,哪怕算法優化到極致,也不可能違反物理定律。1.6萬億參數的V4在異構集群上訓練,根本不是公關稿里寫的那么云淡風輕:集群崩潰、梯度爆炸、連夜排查bug、漫長的斷點續訓都是常態,我聽DeepSeek的內部人說,V4訓練期間曾出現過一次集群故障,光是恢復數據、續訓就花了整整一周,這種代價,硅谷團隊根本不需要承擔。
第二個是燒錢的無底洞。據36氪2026年4月獨家報道,DeepSeek擬啟動的首輪市場化融資估值達210億美元,阿里、騰訊均已進入盡調環節,打破了其成立3年不接受巨頭投資的慣例。原因很殘酷:大模型越往后越像重資產基建,哪怕昇騰950量產后硬件成本下降,一個幾萬張卡的超算中心,每天的電費、冷卻費、折舊費就超過百萬元,在商業化閉環跑通之前,自有資金根本填不滿這個吞金獸。拿巨頭的錢能續命,但代價是未來的商業化路線、開源節奏,不可避免要受到資本意志的影響。 第三個是人才的全球化爭奪。
![]()
近期圈內確實有DeepSeek核心人員流失的傳聞,我從來不覺得這是什么道德問題——AI領域的人才競爭是全球化的,硅谷巨頭開得出百萬美元年薪加期權,國內其他大廠也愿意掏兩三倍薪水挖角,頂尖研究員不是苦行僧,不能指望他們永遠用愛發電。如何留住這些最聰明的大腦,是比技術優化更難解的題。
DeepSeek創始人梁文鋒是我非常佩服的極客,從幻方量化到DeepSeek,他一直是個純粹的技術理想主義者,但現在他面臨著一個幾乎無解的“不可能三角”。第一是團隊純粹性與工程泥濘的矛盾:DeepSeek一直靠小而精的頂尖團隊著稱,但為了適配國產芯片,要做大量瑣碎、毫無美感的底層搬磚工作,要維持極客文化就很難應對海量的工程需求,要補工程短板就必然要擴張團隊,稀釋原有的文化氛圍。
第二是獨立性與算力饑渴的矛盾:DeepSeek之前之所以受尊敬,就是因為它是少有的不綁定巨頭的獨立大模型公司,但現在要迭代下一代模型,必須要有源源不斷的資金買算力,拿巨頭的錢是必然的妥協,可未來還能不能堅持現在的開源節奏、不被巨頭的業務需求綁架,還是個未知數。第三是價格普惠與人才成本的矛盾:V4承諾下半年API降價,繼續做價格屠夫,但現在AI人才薪資水漲船高,沒有足夠的利潤,根本拿不出匹配硅谷的薪酬留人才,一味降價換市場,最后可能留不住核心團隊。
![]()
DeepSeek V4絕對是中國AI發展史上的里程碑,它的偉大從來不是跑分碾壓海外,而是在極度受限的環境下,硬生生殺出了一條血路,證明了中國工程師哪怕沒有最頂級的芯片,也能做出世界一流的大模型。但我真的勸大家別忙著狂歡,中國AI產業沒有捷徑,也沒有彎道超車的可能。我們沒有最先進的光刻機,拿不到最頂級的芯片,還要面臨隨時升級的制裁風險,曾國藩說的“結硬寨,打呆仗”,就是未來十年中國AI產業的唯一出路。 不要指望某一個天才算法能扭轉乾坤,也不要沉迷于發布會的參數狂歡,真正決定生死的,是聚光燈之外的苦活累活:一行行重寫底層算子,一個個填平國產芯片的bug,一筆筆算清商業化的經濟賬。V4只是用血肉之軀在荊棘地里趟平了第一段路,整個中國科技產業的漫漫長征,才剛剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.