4月24日,DeepSeekV4終于千呼萬喚始出來。
DeepSeek官微發文,宣布V4預覽版正式上線并同步開源。按照模型大小,該系列分為兩個版本:V4-pro和V4-flash。
pro對應專家模式,flash對應快速模式,用戶可以直接在官網或者App使用,默認V4版本。
![]()
新更新的模型,全系支持百萬字超長上下文處理能力,并且官方承諾,從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。
在Agent能力、世界知識和推理性能上,新模型多項測試并肩全球頂尖的閉源模型,在國內和閉源模型里都處于領先位置。
DeepSeek介紹API價格時,小字部分還提到“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro價格會大幅下調”,算是對此前傳聞的正式回應。
受此影響,國產算力股集體暴漲,華宏半導體漲超14%,中芯國際漲超8%。
![]()
![]()
pro版達到開源模型最佳水平
flash版能力稍弱,但價格很香
分別來看,pro版和flash版各有優勢。
pro版的Agent能力相比前代模型,能力明顯提升,已經達到目前開源模型的最佳水平。
據DeepSeek透露,V4已經是公司內部員工使用的Agentic Coding模型,體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但也坦誠表示還與Opus 4.6思考模式存在一定差距。
![]()
小編讓V4專家模式幫忙規劃了一份帶父母去廣州醫院檢查的流程清單,包括醫院提前掛號、買車票、訂酒店、以及每個時間節點都很清晰,遺憾的是弄錯了人數,只計算了我爸媽,把我漏了。
![]()
而在世界知識和推理性能上,V4的表現也可圈可點。
在數學、STEM、競賽型代碼的測評中,Pro版更是超越了當前所有已公開評測的開源模型,比肩世界閉源模型。
flash版相比pro版,能力略遜一籌,但價格很香。
pro版每百萬token輸入費用1-12元,輸出費用24元;而flash版的輸入費用直接降到了0.2-1元,輸出費用僅2元。
甚至不用跟國外大模型動則上百的價格對比,對比國產大模型,也十分具有競爭力。
對比MiniMax M2.7,參數對標 V4flash版,輸入價格2.1元,輸出價格8.4元,但上下文僅支持最高205K。
![]()
![]()
標配百萬上下文
將近百萬字的《三體》它幫我啃了
除此之外,V4全系都標配百萬字超長上下文能力。
小編特意找了本接近100萬字的小說——《三體》,全三冊共計88萬字,丟給它。
然后隨便找了個點問它:第二部上部里,“危機紀年第3年 三體艦隊距太陽系4.21光年”部分出現的第一句對話是誰和誰說的?
很快它就告訴了我答案:
“父親的病怎么樣了?”吳岳問。
章北海輕輕搖搖頭,“不好,也就是維持吧。”
跟原文完全一致,且讓它概括這部分的內容也完全正確。
![]()
這么大塊頭的書,要啃下來怎么都得要幾天,現在可以直接讓DeepSeek幫你啃了。
目前市面上主流模型上下文仍在20萬左右,僅在某些特定版本開放百萬字超長上下文能力。
因為模型的注意力機制導致上下文長度每增加一倍,計算量和顯存消耗量相當于暴增4倍。
而DeepSeek V4開創了一種全新的注意力機制,它可以大幅壓縮緩存的體積,減少需要計算的數量,讓模型學會精準分配注意力,只處理最關鍵的部分上下文,相比傳統方法大大降低了對計算和顯存的需求。
得益于此,DeepSeek決定把百萬上下文能力,下放到旗下所有模型。
DeepSeek V4相當于帶動全球大模型行業,提前邁入百萬上下文普惠時代。
![]()
結語
在介紹完V4新版本后,DeepSeek用了一句《荀子·非十二子》的話作為結尾:
“不誘于譽,不恐于誹,率道而行,端然正己。”
不被贊譽所誘惑,不因誹謗而恐懼,始終遵循道義行事,保持莊重,端正自身。
在大模型圈,DeepSeek已然是清流的存在。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.