4月24日,剛剛,DeepSeek正式發(fā)布并開源新一代大模型DeepSeek-V4預(yù)覽版,同步上線官網(wǎng)及App,并開放API調(diào)用。
據(jù)介紹,該系列主打“百萬字上下文(1M tokens)”能力,在Agent執(zhí)行、推理性能和世界知識等方面實(shí)現(xiàn)顯著提升。
![]()
DeepSeek-V4提供兩種版本:
V4-Pro:性能對標(biāo)頂級閉源模型,在Agentic Coding、數(shù)學(xué)與STEM推理等評測中達(dá)到開源模型領(lǐng)先水平,官方稱其交付質(zhì)量接近部分頂級閉源模型非思考模式。
V4-Flash:主打低成本與高響應(yīng)速度,在保持接近推理能力的同時(shí),提供更具性價(jià)比的API服務(wù)。
![]()
![]()
技術(shù)上,V4引入新的注意力機(jī)制與DSA稀疏注意力(DeepSeek Sparse Attention),通過token維度壓縮顯著降低計(jì)算與顯存開銷,使“1M超長上下文”成為默認(rèn)配置。
在生態(tài)適配方面,DeepSeek-V4已針對多種Agent框架優(yōu)化,包括代碼生成、文檔處理等典型場景。API層面兼容OpenAI與Anthropic接口,并支持“思考模式”與推理強(qiáng)度調(diào)節(jié)。
同時(shí),DeepSeek宣布舊版模型接口(deepseek-chat、deepseek-reasoner)將于2026年7月24日停止服務(wù)。新模型權(quán)重已在開源社區(qū)發(fā)布,支持本地部署。(袁寧)
