DEEPSEEK
V3.1 正式發(fā)布
2025年08月21日
北京
混合推理架構(gòu)
思考/非思考模式合一
更高思考效率
更少 Token,更快響應(yīng)
更強 Agent 能力
工具使用與智能體任務(wù)提升
MODEL UPDATES
核心架構(gòu)與使用
混合推理架構(gòu): 單一模型支持思考與非思考雙模式。
網(wǎng)頁端/App: 已同步升級,通過“深度思考”按鈕自由切換。
API 升級: 上下文擴展至 128K。
? deepseek-chat 對應(yīng)非思考模式。
? deepseek-reasoner 對應(yīng)思考模式。
AGENT BOOST
智能體能力增強
通過 Post-Training 優(yōu)化,工具使用與智能體任務(wù)表現(xiàn)大幅提升。
編程智能體: 在代碼修復(fù) (SWE) 和命令行終端 (Terminal-Bench) 評測中,相比舊版模型有明顯提高。
![]()
搜索智能體: 在復(fù)雜搜索 (browsecomp) 和多學(xué)科難題 (HLE) 測試上,性能大幅領(lǐng)先 R1-0528。
![]()
EFFICIENCY UP
思考與輸出效率
思考模式 (V3.1-Think): 經(jīng)思維鏈壓縮訓(xùn)練,輸出 token 數(shù)減少 20%-50% ,而性能與 R1-0528 持平 (如 AIME, GPQA 等評測)。
非思考模式: 相比 V3-0324,輸出長度顯著減少,同時保持同等模型性能。
![]()
API & FRAMEWORK
API 新特性
Strict Mode FC: Beta 接口支持嚴格模式的 Function Calling,確保輸出嚴格滿足 Schema 定義。
Anthropic API 兼容: 增加對 Anthropic API 格式的支持,可輕松將 V3.1 能力接入 Claude Code 等框架。
OPEN SOURCE
模型開源與技術(shù)要點
訓(xùn)練增量: V3.1 Base 模型在 V3 基礎(chǔ)上額外訓(xùn)練了 840B tokens。
開源模型: Base 模型與后訓(xùn)練模型均已在 Huggingface 和魔搭開源。
注意: 使用 UE8M0 FP8 Scale 參數(shù)精度;分詞器及 chat template 與 V3 存在較大差異,部署需詳讀新文檔。
PRICING ADJUST
價格調(diào)整通知
生效時間: 北京時間 2025年9月6日凌晨起。
調(diào)整內(nèi)容:
1. 執(zhí)行新版價格表。
2. 取消夜間時段優(yōu)惠。
過渡期: 在 9月6日前,仍按原價格政策計費。API 服務(wù)資源已擴容。
![]()
Hugging Face
huggingface.co/deepseek-ai
魔搭 (ModelScope)
modelscope.cn/organization/deepseek-ai
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.