網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek V4爆春節(jié)登場！四大殺招突襲全球編程王座，Claude危

2026-01-10 09:18:00　來源: 新智元

北京舉報(bào)

分享至

　　新智元報(bào)道

　　編輯：桃子定慧

　　【新智元導(dǎo)讀】DeepSeek春節(jié)憋大招，V4要當(dāng)「編程之神」！一個(gè)月后代碼圈變天？

　　每逢假期，必發(fā)新品。

　　Information爆料稱，DeepSeek將計(jì)劃在2月中旬，也正是春節(jié)前后，正式發(fā)布下一代V4模型。

　　而這一次，所有目光都聚焦在同一維度上——編程能力。

　　目標(biāo)：編程之王。

　　據(jù)稱，DeepSeek V4編程實(shí)力可以趕超Claude、GPT系列等頂尖閉源模型。

　　要知道，如今Claude是全網(wǎng)公認(rèn)的編程王者，真要擊敗了它，那可真不是小事兒。

　　毫無疑問，V4是繼去年12月V3的重大迭代版，但內(nèi)部測試者普遍反饋：

　　這不是一次常規(guī)的升級，而是一次質(zhì)的跨越。

　　復(fù)刻R1春節(jié)核爆，全網(wǎng)期待值拉滿

　　此次發(fā)布時(shí)間的選擇，同樣意味深長。

　　還記得，去年1月20日，恰逢春節(jié)前夕，DeepSeek R1重磅出世，在全網(wǎng)掀起了巨震。

　　R1的上線，最終被證明是教科書級的節(jié)奏：討論密度、傳播強(qiáng)度、社區(qū)反饋，全部被拉到了峰值。

　　或許這一次，DeepSeek希望再次復(fù)刻這種「時(shí)間窗口效應(yīng)」。

　　回看過去一年，DeepSeek的發(fā)展軌跡，其實(shí)已經(jīng)給出一條清晰的敘事線：

　　DeepSeek V3嶄露頭角，讓國際開發(fā)者第一次正眼看這個(gè)來自中國的團(tuán)隊(duì)。

　　DeepSeek R1才是真正引爆的那個(gè)點(diǎn)。

　　一款開源「推理」模型，把「先思考、再作答」變成顯性過程，用相對克制的訓(xùn)練成本，實(shí)現(xiàn)了復(fù)雜問題上的驚人穩(wěn)定性。

　　這種「性價(jià)比反差」，直接擊中了硅谷最敏感的那根神經(jīng)。

　　隨后，DeepSeek在國內(nèi)，推出了由R1+V3加持的聊天應(yīng)用，短時(shí)間內(nèi)成為了現(xiàn)象級應(yīng)用。

　　接下來的一年中，DeepSeek進(jìn)行了多次模型版本迭代，比如V3.1、V3.2，智能體能力植入等等。

　　進(jìn)入2025年，開源早已成為整個(gè)行業(yè)最大共識。

　　中國大廠與初創(chuàng)公司密集發(fā)布和開源，中國AI的存在感被整體抬升了一個(gè)量級，被視為全球開源AI領(lǐng)導(dǎo)力量之一。

　　上個(gè)月，DeepSeek V3.2出世，在部分基準(zhǔn)測試上碾壓GPT-5、Gemini 3.0 Pro。

　　這是DeepSeek在一直未推出真正意義上的重大換代模型的情況下，實(shí)現(xiàn)的反超。

　　也正因如此，V4被賦予了比以往任何一次迭代都更高的期待。

　　劍指編程王座，四大突破曝光

　　從目前流出的信息來看，DeepSeek V4在以下四個(gè)關(guān)鍵方向上，實(shí)現(xiàn)了核心突破，或?qū)⒏淖冇螒蛞?guī)則。

　　編程能力：劍指Claude王座

　　2025開年，Claude一夜之間成為公認(rèn)的編程之王。無論是代碼生成、調(diào)試還是重構(gòu)，幾乎沒有對手。

　　但現(xiàn)在，這個(gè)格局可能要變了。

　　知情人士透露，DeepSeek內(nèi)部的初步基準(zhǔn)測試顯示，V4在編程任務(wù)上的表現(xiàn)已經(jīng)超越了目前的主流模型，包括Claude系列、GPT系列。

　　如果消息屬實(shí)，DeepSeek將從追趕者一步躍升為領(lǐng)跑者——至少在編程這個(gè)AI應(yīng)用最核心的賽道上。

　　超長上下文代碼處理：工程師的終極利器

　　V4的另一個(gè)技術(shù)突破在于，處理和解析極長代碼提示詞的能力。

　　對于日常寫幾十行代碼的用戶來說，這可能感知不強(qiáng)。但對于真正在大型項(xiàng)目中工作的軟件工程師來說，這是一個(gè)革命性的能力。

　　想象一下：你有一個(gè)幾萬行代碼的項(xiàng)目，你需要AI理解整個(gè)代碼庫的上下文，然后在正確的位置插入新功能、修復(fù)bug或者進(jìn)行重構(gòu)。以前的模型往往會忘記之前的代碼，或者在長上下文中迷失方向。

　　V4在這個(gè)維度上取得了技術(shù)突破，能夠一次性理解更龐大的代碼庫上下文。

　　這對于企業(yè)級開發(fā)來說，是真正的生產(chǎn)力革命。

　　算法提升，不易出現(xiàn)衰減

　　據(jù)透露，V4在訓(xùn)練過程的各個(gè)階段，對數(shù)據(jù)模式的理解能力也得到了提升，并且不容易出現(xiàn)衰減。

　　AI訓(xùn)練需要模型從海量數(shù)據(jù)集中反復(fù)學(xué)習(xí)，但學(xué)到的模式/特征可能會在多輪訓(xùn)練中逐漸衰減。

　　通常來說，擁有大量AI芯片儲備的開發(fā)者可以通過增加訓(xùn)練輪次來緩解這一問題。

　　推理能力提升：更嚴(yán)密、更可靠

　　知情人士還透露了一個(gè)關(guān)鍵細(xì)節(jié)：用戶會發(fā)現(xiàn)V4的輸出在邏輯上更加嚴(yán)密和清晰。

　　這不是一個(gè)小改進(jìn)。這意味著模型在整個(gè)訓(xùn)練流程中對數(shù)據(jù)模式的理解能力有了質(zhì)的提升，而且更重要的是——性能沒有出現(xiàn)退化。

　　在AI模型的世界里，沒有退化是一個(gè)非常高的評價(jià)。很多模型在提升某些能力時(shí)，會不可避免地犧牲其他維度的表現(xiàn)。

　　V4似乎找到了一個(gè)更優(yōu)的平衡點(diǎn)。

　　最近一周，CEO梁文鋒參與合著的一篇論文，也透露出一些線索：

　　他們提出了一種全新的訓(xùn)練架構(gòu)，在無需按比例增加芯片數(shù)量的情況下，可以Scaling更大規(guī)模的模型。

　　論文地址：https://arxiv.org/pdf/2512.24880

　　技術(shù)溯源

　　從V3到V4，DeepSeek做對了什么？

　　要理解V4可能有多強(qiáng)，我們需要先回顧DeepSeek過去一年的技術(shù)積淀。

　　MoE架構(gòu)：用更少的計(jì)算做更多的事

　　DeepSeek-V3的核心技術(shù)優(yōu)勢在于其創(chuàng)新的MoE（混合專家）架構(gòu)。

　　V3擁有高達(dá)6710億的總參數(shù)，但推理時(shí)每個(gè)token只激活約370億參數(shù)。

　　這種稀疏激活機(jī)制讓模型在保持超大規(guī)模的同時(shí)，維持了極高的推理效率。

　　更重要的是，DeepSeek改進(jìn)了傳統(tǒng)MoE模型的訓(xùn)練方法，采用「細(xì)粒度專家+通才專家」的策略——使用大量小型專家而非少數(shù)大型專家，更好地逼近連續(xù)的多維知識空間。

　　MLA：讓推理更快、更省內(nèi)存

　　另一個(gè)關(guān)鍵技術(shù)是MLA（多頭潛在注意力）機(jī)制。

　　這項(xiàng)技術(shù)從V2就開始引入，通過將鍵（Key）和值（Value）張量壓縮到低維空間，大幅減少推理時(shí)的KV緩存和內(nèi)存占用。

　　研究表明，MLA在建模性能上優(yōu)于傳統(tǒng)的分組查詢注意力（GQA），這是DeepSeek能夠在有限硬件條件下實(shí)現(xiàn)高性能的關(guān)鍵。

　　R1強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn)

　　2025年1月發(fā)布的DeepSeek-R1是一個(gè)由強(qiáng)化學(xué)習(xí)驅(qū)動的推理模型，其核心技術(shù)后來被融合到了更新版的V3中。

　　這里有一個(gè)關(guān)鍵信息：V4很可能繼承了R1在強(qiáng)化學(xué)習(xí)方面的所有優(yōu)化經(jīng)驗(yàn)。

　　如果說V3是「基礎(chǔ)能力」，R1是「推理能力」，那么V4很可能是兩者的完美融合——基礎(chǔ)能力+強(qiáng)化學(xué)習(xí)優(yōu)化+編程專項(xiàng)突破。

　　而且不要忘了剛剛發(fā)布的新論文mHC。

　　mHC：解決大模型訓(xùn)練的根本性約束

　　就在2025年12月31日，也就是V4爆料前不久，DeepSeek悄悄發(fā)布了一篇重磅論文：《mHC:Manifold-Constrained Hyper-Connections》（流形約束超連接）。

　　這篇論文解決了一個(gè)困擾AI行業(yè)十年之久的難題：大模型訓(xùn)練的不穩(wěn)定性問題。

　　核心思想是什么？

　　在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練中，信號在層與層之間傳遞時(shí)會出現(xiàn)放大效應(yīng)——在不受約束的情況下，信號可能被放大3000倍。

　　這種失控的放大會導(dǎo)致訓(xùn)練崩潰、梯度爆炸等一系列問題，是阻礙大模型規(guī)?；母拘云款i之一。

　　mHC的解決方案是：利用Sinkhorn-Knopp算法，將神經(jīng)網(wǎng)絡(luò)的連接矩陣投影到一個(gè)數(shù)學(xué)流形上，從而精確控制信號放大。結(jié)果：信號放大被壓縮到僅1.6倍。

　　實(shí)際效果有多強(qiáng)？

　　- 在BIG-BenchHard推理基準(zhǔn)上提升了2.1%

　　- 僅增加6.7%的訓(xùn)練開銷

　　- 在高達(dá)270億參數(shù)的模型上得到驗(yàn)證

　　業(yè)內(nèi)專家評價(jià)：這項(xiàng)研究可能重塑整個(gè)行業(yè)構(gòu)建基礎(chǔ)模型的方式。它解決了一個(gè)限制大語言模型架構(gòu)創(chuàng)新的根本性約束。

　　可以看出，DeepSeek一直在進(jìn)行底層算法優(yōu)化、數(shù)學(xué)工程優(yōu)化，但不要忘了更重要的一件事：

　　這些優(yōu)化都是在「限制之下」完成的，這也正是DeepSeek的厲害之處。

　　硬件限制下的算法突破

　　這才是真正的故事

　　在討論V4時(shí)，有一個(gè)背景不能忽視：芯片出口限制。

　　外媒的報(bào)道特別提到，盡管面臨芯片出口限制，DeepSeek依然在算法效率上取得了進(jìn)展。這與其V3/R1系列的高性價(jià)比路線一致。

　　還記得V3的訓(xùn)練成本嗎？約557.6萬美元。

　　這個(gè)數(shù)字在當(dāng)時(shí)震驚了整個(gè)AI行業(yè)，因?yàn)樗h(yuǎn)低于其他同級別模型——OpenAI和Google的訓(xùn)練成本往往是這個(gè)數(shù)字的幾十倍。

　　DeepSeek用更少的資源做出更好的模型，這不是偶然，而是算法、框架和硬件協(xié)同優(yōu)化的結(jié)果。

　　V4很可能延續(xù)這一路線：不拼硬件數(shù)量，而是拼算法效率。

　　如果V4真的在受限硬件條件下實(shí)現(xiàn)了超越Claude的編程能力，這將是一個(gè)極具象征意義的里程碑——

　　證明在AI競賽中，聰明的算法可以彌補(bǔ)硬件的不足。

　　懸念：V4還會有哪些驚喜？

　　根據(jù)目前的信息，我們已經(jīng)知道V4在編程能力、長上下文處理、推理嚴(yán)密性三個(gè)維度上有顯著提升。

　　但DeepSeek向來有低調(diào)憋大招的傳統(tǒng)。

　　以下是幾個(gè)值得關(guān)注的懸念：

　　1.是否會有蒸餾版本？

　　DeepSeek-R1發(fā)布時(shí)，同時(shí)推出了一系列蒸餾版本，讓更多用戶可以在消費(fèi)級硬件上體驗(yàn)強(qiáng)化學(xué)習(xí)推理模型。

　　V4是否會延續(xù)這一策略？

　　2.多模態(tài)能力如何？

　　目前的報(bào)道主要聚焦于編程能力，但V4在多模態(tài)（圖像、音頻等）方面是否有提升？這是一個(gè)未知數(shù)。

　　3.API定價(jià)會有驚喜嗎？

　　DeepSeek一直走極致性價(jià)比路線。

　　如果V4的編程能力真的超越Claude，但價(jià)格只有Claude的幾分之一，那將是對整個(gè)市場的巨大沖擊。

　　4.開源策略會變嗎？

　　V3和R1都在MIT許可下開源。

　　V4是否會延續(xù)這一策略？V5、V6呢，DeepSeek會一直開源下去嗎？

　　考慮到編程領(lǐng)域的商業(yè)價(jià)值，這是一個(gè)值得觀察的變量。

　　LMArena上的神秘身影：V4已經(jīng)在野測了？

　　如果說以上都是內(nèi)部消息，那么有一個(gè)線索可能暗示V4比我們想象的更接近：

　　有用戶在LMArena（大模型競技場）上發(fā)現(xiàn)了匿名模型，據(jù)說就是V4。

　　有人已經(jīng)在LMArena上發(fā)現(xiàn)匿名模型，據(jù)說就是V4。

　　但由于模型會「撒謊」，還無法最終確認(rèn)。

　　這是一個(gè)值得密切關(guān)注的信號。

　　如果The Information的報(bào)道屬實(shí)，那么我們只需要再等不到一個(gè)月的時(shí)間。

　　屆時(shí)，它是否能真正超越Claude成為編程之王？

　　敬請期待。

　　參考資料：

　　https://x.com/jukan05/status/2009616683607179726

　　https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=lx3hes

　　https://www.reddit.com/r/LocalLLaMA/comments/1q88hdc/the_information_deepseek_to_release_next_flagship/

　　https://www.reddit.com/r/LocalLLaMA/comments/1q89g1i/deepseek_v4_coming/

　　https://x.com/jukan05/status/2009617025933656436?s=20

　　https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability

　　https://economictimes.indiatimes.com/tech/artificial-intelligence/deepseek-to-launch-new-ai-model-focused-on-coding-in-february-report/articleshow/126438150.cms?from=mdr

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.