剛發(fā)布就落伍！DeepSeek V4竟坦承不如GPT-5.4

2026-04-24 14:34:49　來源: 電腦報(bào)少年派

重慶舉報(bào)

分享至

2026年4月24日，全球AI行業(yè)迎來一個(gè)足以載入史冊的日子。

中國AI公司DeepSeek正式發(fā)布全新系列模型DeepSeek-V4預(yù)覽版并同步開源，總參數(shù)高達(dá)1.6萬億。而同一天，OpenAI發(fā)布的新一代旗艦?zāi)Ｐ虶PT-5.5，API定價(jià)飆升至每百萬Token輸出30美元，是前代的三倍。

一邊是“開源普惠、成本重構(gòu)”，另一邊是“性能登頂、價(jià)格翻倍”。同一天的隔空對撞，徹底將AI行業(yè)撕裂為兩條完全不同的道路。

這不是巧合，這是一場蓄謀已久的路線攤牌。

參數(shù)對決

1.6萬億MoE架構(gòu)的降維打擊

DeepSeek-V4此次推出Pro和Flash兩個(gè)版本：DeepSeek-V4-Pro總參數(shù)1.6萬億、激活參數(shù)49B；DeepSeek-V4-Flash總參數(shù)284B、激活參數(shù)13B，均原生支持100萬token上下文。

架構(gòu)上，V4采用了DSA2注意力機(jī)制，融合了DeepSeek V3/R1中已驗(yàn)證的DSA設(shè)計(jì)與今年初論文中提出的NSA稀疏注意力方案。混合專家系統(tǒng)（MoE）啟用Mega內(nèi)核結(jié)構(gòu)，每層配置384個(gè)專家，每次推理激活其中6個(gè)。

這套架構(gòu)的直接效果是驚人的效率突破——在100萬上下文設(shè)置下，V4-Pro的單token推理FLOPs只有前代V3.2的27%，KV Cache只有10%；V4-Flash更極端，分別壓到10%和7%。

這意味著，DeepSeek做了一個(gè)大膽的選擇：不拼絕對性能的“越級”，而是把超長上下文的計(jì)算成本打穿到極致。官方自己承認(rèn)，V4的能力水平發(fā)展軌跡大約滯后前沿閉源模型3至6個(gè)月。但這句話背后隱藏的真實(shí)意圖是——當(dāng)別人在堆性能時(shí)，我在拆成本。

而GPT-5.5則在另一條賽道上狂奔。在Terminal-Bench 2.0這項(xiàng)測試復(fù)雜命令行工作流的硬核基準(zhǔn)中，GPT-5.5得分82.7%，不僅碾壓前代GPT-5.4的75.1%，更將最強(qiáng)競品Claude Opus 4.7的69.4%拉開了超13個(gè)百分點(diǎn)。在評估44種職業(yè)知識工作能力的GDPval中，GPT-5.5在84.9%的任務(wù)中達(dá)到或超過行業(yè)專家水平。

但注意，DeepSeek V4技術(shù)報(bào)告公開的對比對手，是GPT-5.4、Opus 4.6，并不含同一天發(fā)布的GPT-5.5。在這場同臺競技中，V4的對手已經(jīng)不是最新一代，真正的差距還需要第三方評測來驗(yàn)證。

30美元 vs 1元錢

AI的階級分裂

如果說參數(shù)是武器，價(jià)格就是那道真正的撕裂線。

GPT-5.5的API定價(jià)為每百萬Token輸入5美元、輸出30美元，GPT-5.5 Pro更是高達(dá)輸入30美元、輸出180美元，比GPT-5.4翻了三倍。OpenAI總裁Greg Brockman的辯解是：雖然單價(jià)漲了，但GPT-5.5完成相同任務(wù)所需Token數(shù)量大幅減少，完成相同智能水平任務(wù)時(shí)綜合成本反而下降約40%。

再看DeepSeek V4：Flash版本1元/百萬Token（緩存未命中），輸出僅需2元；Pro版本也不過12元/百萬Token輸入、24元輸出。按當(dāng)前匯率簡單換算，GPT-5.5 Pro的輸出價(jià)格約是DeepSeek V4-Pro的50倍以上。

這不是價(jià)格差異，這是階層分化。

OpenAI選擇了“奢侈品路線”——讓最先進(jìn)的技術(shù)先服務(wù)于能付得起錢的企業(yè)級客戶。NVIDIA GB200 NVL72系統(tǒng)上部署GPT-5.5后，百萬Token成本確實(shí)降到了前代的1/35，但這個(gè)降幅的受益方是英偉達(dá)內(nèi)部，不是普通開發(fā)者。

DeepSeek則選擇了一條完全相反的路線——開源權(quán)重、全量模型可下載，1M上下文成為所有官方服務(wù)的標(biāo)配。不需要依賴特定硬件，不需要支付天價(jià)Token費(fèi)。"普惠"這個(gè)詞，DeepSeek是認(rèn)真的。

誰才是真正的“打工人替代者”

如果說價(jià)格是用戶的選擇題，Agent能力就是技術(shù)路線的最終驗(yàn)收場。

GPT-5.5的核心定位是“面向真實(shí)工作的新型智能”，最大的突破在于Agent能力——用戶無需精細(xì)管理每一步，只需下達(dá)模糊的多部分任務(wù)，模型即可自主規(guī)劃、調(diào)用工具、檢查結(jié)果并持續(xù)推進(jìn)直至完成。

英偉達(dá)一位內(nèi)測工程師的說法極具沖擊力：“失去GPT-5.5的訪問權(quán)限，就像被截肢。”這不是公關(guān)話術(shù)，這是一線開發(fā)者的真實(shí)反饋。Cursor CEO Michael Truell也給出了實(shí)測評價(jià)：“GPT-5.5比GPT-5.4明顯更聰明、更持續(xù)，對于復(fù)雜、長時(shí)間運(yùn)行的任務(wù)，它能堅(jiān)持到底不中途停下。”

而在Agent這條賽道上，DeepSeek V4同樣沒有缺席。V4-Pro在Agentic Coding評測中已達(dá)到當(dāng)前開源模型最佳水平，使用體驗(yàn)優(yōu)于Sonnet 4.5，交付質(zhì)量接近Opus 4.6非思考模式。V4還針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產(chǎn)品進(jìn)行了專項(xiàng)適配和優(yōu)化。

但差距也是明擺著的。在Terminal-Bench 2.0 Agent任務(wù)中，V4-Pro得分67.9%，低于Gemini 3.1 Pro的68.5%，與GPT-5.5的82.7%差距更是一目了然。

一位行業(yè)觀察者的判斷精準(zhǔn)而殘酷：“GPT-5.5從模型層面改進(jìn)了智能體最核心的幾個(gè)特征——理解目標(biāo)、拆解步驟、調(diào)用工具、修正過程，并最終交付結(jié)果。每一項(xiàng)都不是全新能力，但被放到同一個(gè)系統(tǒng)里之后，體驗(yàn)開始發(fā)生變化。”

這句話翻譯過來就是：DeepSeek把Agent的基礎(chǔ)設(shè)施鋪好了，但GPT-5.5已經(jīng)跑在上面的成品賽道上了。

開源 vs 閉源

一場沒有回頭路的路線分裂

這場同日對撞的本質(zhì)，不是“誰更好”的比較題，而是“哪條路能走通”的路線之爭。

OpenAI的GPT-5.5走的是極致性能閉環(huán)。它與英偉達(dá)GB200/GB300 NVL72系統(tǒng)聯(lián)合設(shè)計(jì)，從訓(xùn)練到部署，模型和硬件之間從誕生開始就“雙向奔赴”。NVIDIA內(nèi)部已有超過10,000名員工率先使用，原本耗時(shí)數(shù)天的調(diào)試周期縮短至數(shù)小時(shí)，復(fù)雜多文件代碼庫的實(shí)驗(yàn)周期從數(shù)周壓縮至一夜之間。

DeepSeek V4走的是開源生態(tài)擴(kuò)張。模型權(quán)重全部公開，API兼容OpenAI ChatCompletions與Anthropic兩套標(biāo)準(zhǔn)，1M上下文向下兼容，全部模型可本地部署，對國產(chǎn)AI硬件（華為昇騰等）和NVIDIA Blackwell架構(gòu)做了雙重優(yōu)化。

這兩條路的選擇背后，藏著更深的地緣政治邏輯。DeepSeek V4在KnowYourSymbol評測中以96%領(lǐng)先GPT-5.4的95%和Gemini 2.5 Pro的92.8%，在中文語境和東方知識體系中的表現(xiàn)已展現(xiàn)獨(dú)到優(yōu)勢。而OpenAI則深度綁定英偉達(dá)生態(tài)，Codex產(chǎn)品被推廣至英偉達(dá)全公司，奧爾特曼親自曬出了與黃仁勛的交流郵件。

這不是一場單純的產(chǎn)品競爭，這是兩種AI治理體系和產(chǎn)業(yè)生態(tài)的全面角力。

差距承認(rèn)了，然后呢？

最有意思的，是DeepSeek這次罕見的“坦誠”。

官方技術(shù)報(bào)告中明確寫道：V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro。注意，這里說的甚至不是GPT-5.5，而是上一代的GPT-5.4。

這種公開“認(rèn)輸”在AI行業(yè)極為罕見。但細(xì)看之下，這不是認(rèn)輸，而是一種精妙的重置敘事——我承認(rèn)我現(xiàn)在追不上你，但我要告訴你，追不上的那段路，我不跟你比了。

V4在長上下文成本上做到了極致，將百萬token推理的KV Cache降到了前代的10%，這種工程化突破的價(jià)值遠(yuǎn)不止于“省內(nèi)存”——它打開了允許模型在一個(gè)連續(xù)語境中讀完100萬本書、追蹤整個(gè)代碼倉庫歷史、處理一個(gè)企業(yè)全部會議紀(jì)要的技術(shù)通道。

GPT-5.5在智力上跑得更快，但GPT-5.5的400K上下文窗口背后，是每百萬Token 30美元的代價(jià)。DeepSeek的1M上下文背后，是1元錢的Flash版入門費(fèi)。

“更聰明”需要更強(qiáng)算力、更貴硬件、更高單價(jià)。而“足夠聰明但更便宜”需要更極致的架構(gòu)創(chuàng)新和工程優(yōu)化。哪條路能走得更遠(yuǎn)？行業(yè)里沒人有標(biāo)準(zhǔn)答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.