網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

編程表現(xiàn)超越Claude和GPT？DeepSeek準備第二次震驚全世界

2026-01-10 08:15:21　來源: 字母榜

北京舉報

分享至

去年7月，由于DeepSeek下載量從高峰期的8000多萬暴跌至2000多萬，下滑72.2%，“DeepSeek跌落神壇”就成為了當(dāng)時互聯(lián)網(wǎng)最熱門的話題。

但據(jù)多位知情人士透露，DeepSeek即將重登王座。他們計劃在二月中旬發(fā)布新一代模型DeepSeek-V4。

也就是農(nóng)歷2026年新年期間，距離上一代模型DeepSeek-R1的發(fā)布正好一年。

這次發(fā)布的重點是代碼生成和處理能力。

根據(jù)DeepSeek內(nèi)部的基準測試，V4在編程任務(wù)上的表現(xiàn)超過了目前市場上的主流競品，包括Anthropic的Claude和OpenAI的GPT系列。

根據(jù)報道，在即將發(fā)布的新模型中，DeepSeek團隊解決了許多長期困擾AI發(fā)展的技術(shù)難題。很可能會徹底改變Vibe Coding產(chǎn)業(yè)。

報道中提到一件事，“DeepSeek-V4模型在整個訓(xùn)練過程中理解數(shù)據(jù)模式的能力也有所改進，且性能未出現(xiàn)衰減。”

這句話有些難以理解，我們不妨拆開來解讀。

首先是前半句，它指的是模型不再只是死記硬背數(shù)據(jù)，而是能看透數(shù)據(jù)背后的規(guī)律和邏輯。

DeepSeek-R1有個具代表性的例子，就是讓模型數(shù)strawberry里有幾個r。

由于當(dāng)時的DeepSeek模型并不能理解“數(shù)”（count）這個概念，只能根據(jù)訓(xùn)練時的數(shù)據(jù)來輸出答案。可這個數(shù)據(jù)恰好又是錯的，所以無論DeepSeek怎么思考，它給出的答案大多數(shù)情況都是2，而不是正確的3。

而DeepSeek-V4則會徹底杜絕這個情況，前提是在訓(xùn)練過程中，讓模型徹底理解某一件事情。

后半句的性能退化，指的是在AI訓(xùn)練中，隨著模型不斷學(xué)習(xí)新東西或訓(xùn)練時間加長，往往會出現(xiàn)“學(xué)了新的忘了舊的”或者模型變得不穩(wěn)定的情況。

這種現(xiàn)象在業(yè)內(nèi)被稱為“災(zāi)難性遺忘”（Catastrophic Forgetting）或“模型坍塌”（Model Collapse）。

因此，V4在不斷變聰明、變復(fù)雜的過程中，依然保持了極高的穩(wěn)定性和原有能力的完整性，沒有出現(xiàn)任何“副作用”或能力倒退。

這恰恰是構(gòu)建編程Agent的前置條件。

在現(xiàn)代軟件工程中，一個微小的修改可能波及數(shù)個文件、數(shù)千行代碼的依賴關(guān)系。

但是以往的模型往往受限于上下文窗口或注意力機制的衰減，從而沒辦法對于龐大的項目進行修改。

V4極有可能是一個為“Agent時代”量身定制的模型。

一年前，DeepSeek-R1 的發(fā)布確實在行業(yè)內(nèi)引起了不小的波動。那款主打推理能力的模型證明了低成本研發(fā)路徑的可行性。

然而一年后的今天，人工智能行業(yè)的關(guān)注焦點已經(jīng)發(fā)生了顯著轉(zhuǎn)移。單純的文本生成或邏輯推理已不再是唯一的競爭高地，代碼生成正在演變?yōu)榇竽Ｐ湍芰Φ摹霸嚱鹗薄?/p>

在當(dāng)前的開發(fā)環(huán)境中，“Vibe Coding”成為新趨勢，要求AI不僅能補全代碼，更能理解開發(fā)者的意圖流（Flow），實現(xiàn)從自然語言到復(fù)雜工程邏輯的無縫轉(zhuǎn)化。

DeepSeek似乎已經(jīng)準備好在新賽道上狂飆了。

如果深入梳理DeepSeek團隊以及核心人物梁文鋒在R1發(fā)布之后這一年里的學(xué)術(shù)軌跡，我們會發(fā)現(xiàn)一條清晰且扎實的技術(shù)演進路線。

這些公開發(fā)表的論文與技術(shù)報告，不僅是對過去成果的總結(jié)，更是V4強大能力的注腳與預(yù)演。

2025年9月，DeepSeek-R1的相關(guān)論文成功登上了頂級學(xué)術(shù)期刊《Nature》的封面，梁文鋒署名通訊作者。

面對審稿人關(guān)于是否使用了OpenAI模型輸出進行蒸餾訓(xùn)練的尖銳質(zhì)疑，DeepSeek團隊在回應(yīng)中給出了明確的否認，并首次公開了令人咋舌的低成本數(shù)據(jù)：從V3-Base訓(xùn)練到R1，僅花費了29.4萬美元。

當(dāng)然，這個成本僅指R1的后訓(xùn)練階段成本，不包含V3-Base基礎(chǔ)模型本身約600萬美元的訓(xùn)練投入。

數(shù)據(jù)公開后，以及《Nature》為此專門撰寫的社論，標志著DeepSeek在學(xué)術(shù)嚴謹性和技術(shù)原創(chuàng)性上獲得了國際最高認可，徹底洗刷了外界對于中國大模型“套殼”或“跟隨”的刻板印象。

不過，真正能佐證DeepSeek-V4在代碼方面有大幅突破的證據(jù)，是2025年最后一天，DeepSeek團隊發(fā)表的論文《mHC：流形約束超連接》。

代碼生成任務(wù)對模型的邏輯深度和上下文跨度有著極高的要求，這通常需要更大規(guī)模的模型參數(shù)和更深的網(wǎng)絡(luò)結(jié)構(gòu)。

然而，傳統(tǒng)的超連接（Hyper-Connections）架構(gòu)在模型規(guī)模擴大時，會面臨嚴重的信號增益問題，最終導(dǎo)致訓(xùn)練過程極不穩(wěn)定甚至崩潰。

為了解決這一阻礙模型擴容的根本性物理難題，DeepSeek團隊在這篇論文中提出了一種全新的架構(gòu)mHC。

簡單來說，它給狂奔的信號加了一道精密的閥門，將信號增益嚴格控制在1.6倍左右。

論文數(shù)據(jù)顯示，在3B、9B乃至18B參數(shù)規(guī)模的模型測試中，應(yīng)用了mHC架構(gòu)的模型在BIG-BenchHard推理基準上提升了2.1%。

這項由梁文鋒聯(lián)合署名的研究成果，實際上解決了大模型在“做大”和“做復(fù)雜”過程中的穩(wěn)定性難題。

這意味著V4模型極有可能采用了這種全新的架構(gòu)，從而在擁有更龐大參數(shù)量和更深層推理能力的同時，依然保持了高效的訓(xùn)練效率和極高的穩(wěn)定性。

不僅如此，在2026年1月初，DeepSeek悄無聲息地將arXiV上的R1論文從原本的22頁大幅擴充至86頁。

這多出來的60多頁內(nèi)容，詳盡地披露了R1的完整訓(xùn)練管線，包括冷啟動、推理導(dǎo)向的強化學(xué)習(xí)（RL）、拒絕采樣與再微調(diào)、以及對齊導(dǎo)向的強化學(xué)習(xí)這四個關(guān)鍵步驟。

業(yè)界普遍推測，這種在春節(jié)前夕“清庫存”式的技術(shù)披露，往往預(yù)示著下一代更強大的技術(shù)已經(jīng)成熟。

既然R1的技術(shù)細節(jié)已經(jīng)不再是核心壁壘，那么即將到來的V4必然擁有了更高維度的護城河。

就在2026年的元旦，另一股來自量化界的力量也加入了戰(zhàn)局。

由九坤投資創(chuàng)始團隊發(fā)起成立的至知創(chuàng)新研究院（IQuestResearch），發(fā)布了名為IQuest-Coder-V1的開源代碼大模型。我們曾在文章《又是量化基金，第二個DeepSeek時刻到來了？》中對其進行了報道。

這支同樣出身于量化背景的團隊，他們僅有40B參數(shù)的模型，在SWE-benchVerified測試中斬獲了81.4%的高分，一舉達到了Claude和ChatGPT的水平。

而在Vibe Coding的戰(zhàn)場上，國內(nèi)互聯(lián)網(wǎng)大廠的動作同樣不容小覷。

字節(jié)跳動的豆包在2025年初就推出了Trae編程工具，并在AI編程功能上實現(xiàn)了HTML預(yù)覽、Python運行和完整項目生成等能力，讓開發(fā)者可以在一個界面內(nèi)完成從構(gòu)思到部署的全流程。

阿里的通義千問則在12月26日更新到了Qwen Code v0.5.0版本。

此次更新的最大亮點就是支持在終端窗口中同時運行四個Qwen Code實例，可并行處理智能問答、實時翻譯、原型設(shè)計、創(chuàng)意繪圖等不同任務(wù)，實現(xiàn)了AI編程“跳出命令行”的突破。

不過，真正引發(fā)行業(yè)震動的，是豆包在硬件終端上的突破性嘗試。

2025年12月1日，字節(jié)跳動與中興通訊合作推出了搭載豆包手機助手的努比亞M153工程樣機，售價3499元，首批約3萬臺在當(dāng)天迅速售罄，甚至在二手市場炒出了高價。

這款手機助手的核心能力在于跨應(yīng)用操作。用戶只需用自然語言下達指令，AI就能自動跳轉(zhuǎn)多個應(yīng)用完成點外賣、訂機票、比價購物等復(fù)雜任務(wù)。

這一系列動作背后，折射出的是AI大模型從云端走向終端、從工具走向入口的戰(zhàn)略轉(zhuǎn)型。

說不定DeepSeek手機也不遠了。

與此同時，資本市場也迎來了大模型行業(yè)的收獲季。

曾經(jīng)歷過“百模大戰(zhàn)”喧囂的中國AI行業(yè)，正在加速向頭部收斂。智譜AI和MiniMax這兩家公司均已成功上市。

智譜是1月8日在港交所敲的鐘，發(fā)行價定在116.2港元/股，上市第一天就給了市場一個驚喜 —— 開盤120港元，收盤131.5港元，第一天就漲了13.17%，市值一下子沖到578.9億港元，成了 “全球大模型第一股”。

第二天開盤直接137.2港元起，收盤158.6港元，較首日收盤價又漲了20.6%，市值也跟著漲到698.21億港元，兩天下來從發(fā)行價算已經(jīng)漲了快37%，完全沒給空頭機會。

MiniMax比智譜晚一天，但風(fēng)頭更勁。發(fā)行價165港元/股，而且是頂格定價，上市前一天的暗盤就已經(jīng)漲了25%-29%，報205.60-212.60港元。

上市當(dāng)天開盤235.4港元，漲了42.7%，之后一路飆升，盤中最高到351.8港元，最終收盤345港元，較發(fā)行價暴漲 109.09%，市值來到1054億港元，成了千億市值俱樂部新成員。

雖然高額的研發(fā)投入使得兩家公司目前仍處于虧損狀態(tài)，但強勁的增長曲線證明了市場對于高質(zhì)量AI模型的付費意愿正在形成。

中國AI方興未艾，但當(dāng)全球目光已經(jīng)再次聚焦到DeepSeek身上。一年前那個用低成本路徑顛覆行業(yè)認知的團隊，即將在春節(jié)期間交出新的答卷。

DeepSeek能否第二次“震驚全世界”，只要再等幾天就會知曉。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

凌晨三點，徹底失眠：Seedance 2.0告訴我們，AI對現(xiàn)實世界工作流“壓縮”正在加速

華爾街見聞官方 2026-02-09 07:57:50
18 跟貼 18
蘋果把傳統(tǒng)手藝交給AI了：微調(diào)千問模型自動完成UI設(shè)計

DeepTech深科技 2026-02-07 20:37:51
0 跟貼 0

ICLR 2026｜UIUC：一行代碼徹底解決LLM推理的過度思考！

機器之心Pro 2026-02-09 12:26:23
0 跟貼 0

SOLO Coder 在現(xiàn)有項目基礎(chǔ)上繼續(xù)完善功能、修復(fù)問題

機器之心Pro 2025-11-13 14:18:40
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0

馬斯克：最便宜的AI算力在太空，每年至少發(fā)射1萬次，人形機器人就是“印鈔機”

澎湃新聞 2026-02-09 16:10:19
26 跟貼 26

全新視角看世界模型：從視頻生成邁向通用世界模擬器

機器之心Pro 2026-02-09 12:55:00
0 跟貼 0
自動駕駛進入“生態(tài)競合”時代：頭部企業(yè)加速算力生態(tài)綁定，智駕芯片國產(chǎn)化率持續(xù)提升

每日經(jīng)濟新聞 2026-02-09 17:06:05
0 跟貼 0

AI巨頭的超級碗豪賭能否敲開AI普惠大門？

鈦媒體APP 2026-02-09 17:14:24
0 跟貼 0
編程AI變天了！實測神秘模型Pony Alpha：Opus級智能，架構(gòu)師思維上線

智東西 2026-02-09 17:05:11
0 跟貼 0
神秘模型「Pony Alpha」火了，被曝是GLM-5

量子位 2026-02-09 14:56:43
1 跟貼 1
國外工廠鋼筋制作，不敢拖泥帶水，不是技術(shù)硬而是八字硬

小貓動漫 2026-02-09 10:08:44
1 跟貼 1
兄弟倆從浙江自駕回安徽老家，看錯導(dǎo)航到了江蘇同名鄉(xiāng)鎮(zhèn)，兩地相距300多公里

極目新聞 2026-02-08 19:28:20
2609 跟貼 2609
29元韭菜炒蚌殼肉吃出粉色珍珠？網(wǎng)友直呼新年好運，門店：情況少見，可免費拿走

極目新聞 2026-02-07 12:54:35
2513 跟貼 2513
這個臺灣小伙了不起：頭腦清醒，思維邏輯清晰，說出兩岸人民心聲

美人愛數(shù)碼 2026-02-09 15:26:05
0 跟貼 0
俄外長：若歐洲國家發(fā)動攻擊俄方將用一切手段進行軍事回應(yīng)

環(huán)球網(wǎng)資訊 2026-02-09 06:15:27
2243 跟貼 2243
大車司機打開雙閃，努力控制跑丟的輪胎，帶球技術(shù)比國足強！

文鴻愛搞笑 2026-02-08 16:28:48
1 跟貼 1
5億買一個域名，這個幣圈狠人，想讓你60秒擁有自己的AI賈維斯

新智元 2026-02-09 16:29:59
0 跟貼 0
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關(guān)注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
開源鴻蒙重寫世界，從一行微小的代碼開始

量子位 2025-12-31 01:50:02
0 跟貼 0
小姐姐摔倒被扶起，動作八百年學(xué)不會，最后這幾下是核心技術(shù)！

松鼠的搞笑日記 2026-02-08 11:01:10
1 跟貼 1
Codex上線MacOS，展示工作樹系統(tǒng)與自動化能力

量子位 2026-02-06 19:00:16
0 跟貼 0
大鵝與烏沖突升級：無人機被擊落，平民遇難，戰(zhàn)爭邏輯再顯

花魄m 2026-02-08 02:38:43
0 跟貼 0
女子和男友生氣，直接給自己氣成模型了，男友差點笑進ICU

甜心萌物醬i 2026-02-08 16:31:24
0 跟貼 0
我們每個人都是“大模型”

圓方你怎么看啊 2026-02-06 20:24:36
0 跟貼 0
購房邏輯，需求排序，看房之前想清楚

老薛的直播日常 2026-02-05 13:38:14
0 跟貼 0
千問、元寶紅包口令在微信內(nèi)已可復(fù)制；多家快遞企業(yè)春節(jié)期間將繼續(xù)提供收派服務(wù)｜一周未來商業(yè)

每日經(jīng)濟新聞 2026-02-09 06:35:06
1 跟貼 1
首月扣費0.7元次月暴漲中老年水滴保上中招

上觀新聞 2026-02-09 06:57:26
892 跟貼 892
文玩假拍騙局調(diào)查:3500元瓷瓶估值300萬

新京報 2026-02-09 07:48:44
172 跟貼 172
熱聞|大逆轉(zhuǎn)、神劇情！曼城客場2-1利物浦，落后榜首阿森納6分

齊魯壹點 2026-02-09 07:02:29
134 跟貼 134
蘋果2026年度Swift學(xué)生編程挑戰(zhàn)賽開放申請

IT之家 2026-02-09 16:53:05
0 跟貼 0
海南：175名選調(diào)生，提拔使用擔(dān)任副處級及以上領(lǐng)導(dǎo)職務(wù)

新京報政事兒 2026-02-08 20:54:31
92 跟貼 92
美會對伊下手嗎？高市賭贏了？都是什么信號

大胡子說房 2026-02-09 17:07:25
0 跟貼 0
登頂Hugging Face論文熱榜，LLM重寫數(shù)據(jù)準備的游戲規(guī)則

機器之心Pro 2026-02-09 12:16:39
0 跟貼 0
豆包編程模型來了2 (將 C++ 項目重構(gòu)為 Python 項目)

機器之心Pro 2025-11-11 17:26:07
0 跟貼 0
109.7元超市發(fā)票抽中一輛東風(fēng)汽車！市民以為“遇到騙子！”

極目新聞 2026-02-09 11:34:35
55 跟貼 55
編程新王Claude Opus 4.5震撼登場

機器之心Pro 2025-11-25 10:38:20
0 跟貼 0
豆包編程模型來了

機器之心Pro 2025-11-11 17:24:25
0 跟貼 0

字母榜

讓未來不止于大。

2219文章數(shù) 8042關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

游戲

房產(chǎn)

手機

家居要聞

手機 / 數(shù)碼

房產(chǎn) / 家居

編程表現(xiàn)超越Claude和GPT？DeepSeek準備第二次震驚全世界

馬斯克終于想通了：先去月球“刷經(jīng)驗”

女子1個月結(jié)2次婚周旋在倆"老公"之間 孩子是第3人的

女子1個月結(jié)2次婚周旋在倆"老公"之間 孩子是第3人的

創(chuàng)中國冬奧最佳戰(zhàn)績！19歲速滑新星含淚向天拉勾

李亞鵬暫停直播：將投入嫣然醫(yī)院工作

文玩假拍騙局調(diào)查:3500元瓷瓶估值300萬

長安將搭鈉電池 好比汽車要裝柴油機？

態(tài)度原創(chuàng)

山院煥新 雅聚悅親朋

別只等3月內(nèi)卷，抓住“春招提前批”的黃金窗口！

網(wǎng)友為《生化5》"種族歧視"平反:非洲背景當(dāng)然殺黑人

海南又一千億級賽道出現(xiàn)，京東、華潤、中石化等巨頭率先殺入！

女子1個月結(jié)2次婚周旋在倆"老公"之間孩子是第3人的

女子1個月結(jié)2次婚周旋在倆"老公"之間孩子是第3人的

長安將搭鈉電池好比汽車要裝柴油機？

山院煥新雅聚悅親朋