采用華為昇騰國(guó)產(chǎn)算力,價(jià)格大幅下調(diào),性能比肩頂級(jí)閉源模型,DeepSeek V4終于來(lái)了!
![]()
4月24日,DeepSeek官方正式發(fā)文,稱DeepSeek V4的預(yù)覽版本正式上線并同步開(kāi)源。
DeepSeek V4擁有Pro與Flash兩個(gè)版本模型,分別對(duì)應(yīng)網(wǎng)頁(yè)端/App上的“專家模式”與“快速模式”。
![]()
DeepSeek V4 Pro的參數(shù)達(dá)到1.6T,激活參數(shù)49B,預(yù)訓(xùn)練數(shù)據(jù)33T,上下文長(zhǎng)度達(dá)到1M。
DeepSeek V4 Flash的參數(shù)達(dá)到284B,激活參數(shù)13B,預(yù)訓(xùn)練數(shù)據(jù)32T,上下文長(zhǎng)度同樣達(dá)到1M。
那么DeepSeek V4的性能表現(xiàn)如何呢?根據(jù)DeepSeek公布的測(cè)試數(shù)據(jù):
在Agent能力方面,DeepSeek V4 Pro在Agentic Coding測(cè)評(píng)中,是開(kāi)源模式中最佳水平,交付質(zhì)量接近Opus 4.6非思考模式,與Opus思考模式還存在一定差距。
![]()
在世界知識(shí)方面,DeepSeek V4 Pro僅稍落后于閉源模型Gemini-Pro-3.1。
而在推理性能方面,DeepSeek V4 Pro在已公開(kāi)評(píng)測(cè)的開(kāi)源模型中排名第一。
![]()
DeepSeek V4 Pro與V4 Flash的API已經(jīng)同步上線,價(jià)格上Pro版本每百萬(wàn)token輸入(緩存未命中)12元,輸出24元,而Flash版本則是每百萬(wàn)Token輸入(緩存未命中)1元,輸出2元。
不過(guò)DeepSeek表示,受限于高端算力,目前Pro的服務(wù)吞吐十分有限,預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格還會(huì)大幅下調(diào)。
![]()
實(shí)際上目前DeepSeek V4的價(jià)格已經(jīng)在行業(yè)內(nèi)非常有競(jìng)爭(zhēng)力,而通過(guò)這番注解,可以看到DeepSeek V4并未采用CUDA生態(tài),而是實(shí)現(xiàn)了國(guó)產(chǎn)化適配,因此價(jià)格有望一降再降。
雖然發(fā)布比大家想象中要更晚一些,但是DeepSeek V4的意義還是比較重大的,它意味著國(guó)產(chǎn)頂級(jí)開(kāi)源大模型在推理環(huán)節(jié)已經(jīng)擺脫對(duì)英偉達(dá)GPU的依賴。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.