2026年4月24日,全球AI行業(yè)迎來一個(gè)足以載入史冊的日子。
中國AI公司DeepSeek正式發(fā)布全新系列模型DeepSeek-V4預(yù)覽版并同步開源,總參數(shù)高達(dá)1.6萬億。而同一天,OpenAI發(fā)布的新一代旗艦?zāi)P虶PT-5.5,API定價(jià)飆升至每百萬Token輸出30美元,是前代的三倍。
![]()
一邊是“開源普惠、成本重構(gòu)”,另一邊是“性能登頂、價(jià)格翻倍”。同一天的隔空對撞,徹底將AI行業(yè)撕裂為兩條完全不同的道路。
這不是巧合,這是一場蓄謀已久的路線攤牌。
01
參數(shù)對決
1.6萬億MoE架構(gòu)的降維打擊
DeepSeek-V4此次推出Pro和Flash兩個(gè)版本:DeepSeek-V4-Pro總參數(shù)1.6萬億、激活參數(shù)49B;DeepSeek-V4-Flash總參數(shù)284B、激活參數(shù)13B,均原生支持100萬token上下文。
架構(gòu)上,V4采用了DSA2注意力機(jī)制,融合了DeepSeek V3/R1中已驗(yàn)證的DSA設(shè)計(jì)與今年初論文中提出的NSA稀疏注意力方案。混合專家系統(tǒng)(MoE)啟用Mega內(nèi)核結(jié)構(gòu),每層配置384個(gè)專家,每次推理激活其中6個(gè)。
![]()
這套架構(gòu)的直接效果是驚人的效率突破——在100萬上下文設(shè)置下,V4-Pro的單token推理FLOPs只有前代V3.2的27%,KV Cache只有10%;V4-Flash更極端,分別壓到10%和7%。
這意味著,DeepSeek做了一個(gè)大膽的選擇:不拼絕對性能的“越級”,而是把超長上下文的計(jì)算成本打穿到極致。官方自己承認(rèn),V4的能力水平發(fā)展軌跡大約滯后前沿閉源模型3至6個(gè)月。但這句話背后隱藏的真實(shí)意圖是——當(dāng)別人在堆性能時(shí),我在拆成本。
而GPT-5.5則在另一條賽道上狂奔。在Terminal-Bench 2.0這項(xiàng)測試復(fù)雜命令行工作流的硬核基準(zhǔn)中,GPT-5.5得分82.7%,不僅碾壓前代GPT-5.4的75.1%,更將最強(qiáng)競品Claude Opus 4.7的69.4%拉開了超13個(gè)百分點(diǎn)。在評估44種職業(yè)知識工作能力的GDPval中,GPT-5.5在84.9%的任務(wù)中達(dá)到或超過行業(yè)專家水平。
![]()
但注意,DeepSeek V4技術(shù)報(bào)告公開的對比對手,是GPT-5.4、Opus 4.6,并不含同一天發(fā)布的GPT-5.5。在這場同臺競技中,V4的對手已經(jīng)不是最新一代,真正的差距還需要第三方評測來驗(yàn)證。
02
30美元 vs 1元錢
AI的階級分裂
如果說參數(shù)是武器,價(jià)格就是那道真正的撕裂線。
GPT-5.5的API定價(jià)為每百萬Token輸入5美元、輸出30美元,GPT-5.5 Pro更是高達(dá)輸入30美元、輸出180美元,比GPT-5.4翻了三倍。OpenAI總裁Greg Brockman的辯解是:雖然單價(jià)漲了,但GPT-5.5完成相同任務(wù)所需Token數(shù)量大幅減少,完成相同智能水平任務(wù)時(shí)綜合成本反而下降約40%。
![]()
再看DeepSeek V4:Flash版本1元/百萬Token(緩存未命中),輸出僅需2元;Pro版本也不過12元/百萬Token輸入、24元輸出。按當(dāng)前匯率簡單換算,GPT-5.5 Pro的輸出價(jià)格約是DeepSeek V4-Pro的50倍以上。
這不是價(jià)格差異,這是階層分化。
OpenAI選擇了“奢侈品路線”——讓最先進(jìn)的技術(shù)先服務(wù)于能付得起錢的企業(yè)級客戶。NVIDIA GB200 NVL72系統(tǒng)上部署GPT-5.5后,百萬Token成本確實(shí)降到了前代的1/35,但這個(gè)降幅的受益方是英偉達(dá)內(nèi)部,不是普通開發(fā)者。
DeepSeek則選擇了一條完全相反的路線——開源權(quán)重、全量模型可下載,1M上下文成為所有官方服務(wù)的標(biāo)配。不需要依賴特定硬件,不需要支付天價(jià)Token費(fèi)。"普惠"這個(gè)詞,DeepSeek是認(rèn)真的。
03
誰才是真正的“打工人替代者”
如果說價(jià)格是用戶的選擇題,Agent能力就是技術(shù)路線的最終驗(yàn)收場。
GPT-5.5的核心定位是“面向真實(shí)工作的新型智能”,最大的突破在于Agent能力——用戶無需精細(xì)管理每一步,只需下達(dá)模糊的多部分任務(wù),模型即可自主規(guī)劃、調(diào)用工具、檢查結(jié)果并持續(xù)推進(jìn)直至完成。
![]()
英偉達(dá)一位內(nèi)測工程師的說法極具沖擊力:“失去GPT-5.5的訪問權(quán)限,就像被截肢。”這不是公關(guān)話術(shù),這是一線開發(fā)者的真實(shí)反饋。Cursor CEO Michael Truell也給出了實(shí)測評價(jià):“GPT-5.5比GPT-5.4明顯更聰明、更持續(xù),對于復(fù)雜、長時(shí)間運(yùn)行的任務(wù),它能堅(jiān)持到底不中途停下。”
而在Agent這條賽道上,DeepSeek V4同樣沒有缺席。V4-Pro在Agentic Coding評測中已達(dá)到當(dāng)前開源模型最佳水平,使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Opus 4.6非思考模式。V4還針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產(chǎn)品進(jìn)行了專項(xiàng)適配和優(yōu)化。
![]()
但差距也是明擺著的。在Terminal-Bench 2.0 Agent任務(wù)中,V4-Pro得分67.9%,低于Gemini 3.1 Pro的68.5%,與GPT-5.5的82.7%差距更是一目了然。
一位行業(yè)觀察者的判斷精準(zhǔn)而殘酷:“GPT-5.5從模型層面改進(jìn)了智能體最核心的幾個(gè)特征——理解目標(biāo)、拆解步驟、調(diào)用工具、修正過程,并最終交付結(jié)果。每一項(xiàng)都不是全新能力,但被放到同一個(gè)系統(tǒng)里之后,體驗(yàn)開始發(fā)生變化。”
這句話翻譯過來就是:DeepSeek把Agent的基礎(chǔ)設(shè)施鋪好了,但GPT-5.5已經(jīng)跑在上面的成品賽道上了。
04
開源 vs 閉源
一場沒有回頭路的路線分裂
這場同日對撞的本質(zhì),不是“誰更好”的比較題,而是“哪條路能走通”的路線之爭。
OpenAI的GPT-5.5走的是極致性能閉環(huán)。它與英偉達(dá)GB200/GB300 NVL72系統(tǒng)聯(lián)合設(shè)計(jì),從訓(xùn)練到部署,模型和硬件之間從誕生開始就“雙向奔赴”。NVIDIA內(nèi)部已有超過10,000名員工率先使用,原本耗時(shí)數(shù)天的調(diào)試周期縮短至數(shù)小時(shí),復(fù)雜多文件代碼庫的實(shí)驗(yàn)周期從數(shù)周壓縮至一夜之間。
![]()
DeepSeek V4走的是開源生態(tài)擴(kuò)張。模型權(quán)重全部公開,API兼容OpenAI ChatCompletions與Anthropic兩套標(biāo)準(zhǔn),1M上下文向下兼容,全部模型可本地部署,對國產(chǎn)AI硬件(華為昇騰等)和NVIDIA Blackwell架構(gòu)做了雙重優(yōu)化。
這兩條路的選擇背后,藏著更深的地緣政治邏輯。DeepSeek V4在KnowYourSymbol評測中以96%領(lǐng)先GPT-5.4的95%和Gemini 2.5 Pro的92.8%,在中文語境和東方知識體系中的表現(xiàn)已展現(xiàn)獨(dú)到優(yōu)勢。而OpenAI則深度綁定英偉達(dá)生態(tài),Codex產(chǎn)品被推廣至英偉達(dá)全公司,奧爾特曼親自曬出了與黃仁勛的交流郵件。
這不是一場單純的產(chǎn)品競爭,這是兩種AI治理體系和產(chǎn)業(yè)生態(tài)的全面角力。
05
差距承認(rèn)了,然后呢?
最有意思的,是DeepSeek這次罕見的“坦誠”。
官方技術(shù)報(bào)告中明確寫道:V4的能力水平仍落后GPT-5.4和Gemini-3.1-Pro。注意,這里說的甚至不是GPT-5.5,而是上一代的GPT-5.4。
![]()
這種公開“認(rèn)輸”在AI行業(yè)極為罕見。但細(xì)看之下,這不是認(rèn)輸,而是一種精妙的重置敘事——我承認(rèn)我現(xiàn)在追不上你,但我要告訴你,追不上的那段路,我不跟你比了。
V4在長上下文成本上做到了極致,將百萬token推理的KV Cache降到了前代的10%,這種工程化突破的價(jià)值遠(yuǎn)不止于“省內(nèi)存”——它打開了允許模型在一個(gè)連續(xù)語境中讀完100萬本書、追蹤整個(gè)代碼倉庫歷史、處理一個(gè)企業(yè)全部會議紀(jì)要的技術(shù)通道。
GPT-5.5在智力上跑得更快,但GPT-5.5的400K上下文窗口背后,是每百萬Token 30美元的代價(jià)。DeepSeek的1M上下文背后,是1元錢的Flash版入門費(fèi)。
![]()
“更聰明”需要更強(qiáng)算力、更貴硬件、更高單價(jià)。而“足夠聰明但更便宜”需要更極致的架構(gòu)創(chuàng)新和工程優(yōu)化。哪條路能走得更遠(yuǎn)?行業(yè)里沒人有標(biāo)準(zhǔn)答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.