DeepSeek正式宣布推出全新系列模型DeepSeek-V4,包含V4-Pro和V4-Flash兩個(gè)版本。該系列以百萬字的超長上下文能力為亮點(diǎn),在Agent能力、世界知識(shí)及推理性能方面,不僅在國內(nèi)市場上處于領(lǐng)先地位,也在開源領(lǐng)域中取得了顯著成績。用戶可以通過更新API服務(wù)中的model_name為deepseek-v4-pro或deepseek-v4-flash來調(diào)用新的功能。
![]()
V4-Pro在多項(xiàng)評(píng)測中表現(xiàn)卓越,特別是在Agent能力、世界知識(shí)和數(shù)學(xué)推理等方面達(dá)到了開源模型的最佳水平,其推理性能與頂尖閉源模型相媲美。而V4-Flash則通過更小的參數(shù)量,提供更快速且經(jīng)濟(jì)的API服務(wù),適合輕量級(jí)應(yīng)用場景。這一設(shè)計(jì)延續(xù)了DeepSeek一直以來的效率優(yōu)先哲學(xué),盡管總參數(shù)量高達(dá)1萬億,但每個(gè)token僅需激活約370億參數(shù),保持了與前代V3相當(dāng)?shù)耐评沓杀尽?/p>
![]()
![]()
![]()
為了實(shí)現(xiàn)這一重大進(jìn)步,DeepSeek V4將運(yùn)行在華為最新的昇騰芯片上。工程師們?yōu)榇送度氪罅烤Γ鉀Q了芯片適配問題,不僅重寫了核心代碼,還完成了從英偉達(dá)CUDA生態(tài)向華為CANN架構(gòu)的底層遷移。這一技術(shù)決策不僅標(biāo)志著DeepSeek在硬件適應(yīng)性上的重大突破,也傳遞出強(qiáng)烈的戰(zhàn)略信號(hào),表明其獨(dú)家開放了早期訪問權(quán)限給國產(chǎn)芯片廠商,而沒有為英偉達(dá)或AMD提供提前優(yōu)化的機(jī)會(huì)。
此外,V4針對多款主流Agent產(chǎn)品進(jìn)行了專項(xiàng)適配優(yōu)化,舊版API接口模型名deepseek-chat和deepseek-reasoner將于2026年7月24日正式停用,用戶需要提前切換至新模型名稱。DeepSeek表示,百萬級(jí)的超長上下文能力將成為旗下所有官方服務(wù)的標(biāo)準(zhǔn)配置,未來將繼續(xù)致力于推動(dòng)AI技術(shù)的發(fā)展與應(yīng)用。
![]()
在官方發(fā)布的文章最后,DeepSeek還引用荀子名句自勉:不誘于譽(yù),不恐于誹,率道而行,端然正己.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.