![]()
↑閱讀之前記得關(guān)注+星標(biāo)??,,每天才能第一時間接收到更新
DeepSeek-V3.2系列模型正式上線
作為“為Agent構(gòu)建的推理優(yōu)先模型”,DeepSeek-V3.2包含兩個版本:
DeepSeek-V3.2:V3.2-Exp的官方繼任者,平衡了推理能力與生成長度,性能對標(biāo)GPT-5,現(xiàn)已上線App、Web端及API
DeepSeek-V3.2-Speciale:專攻深度推理能力的極限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前僅通過API提供
![]()
技術(shù)報告顯示,DeepSeek-V3.2-Speciale在2025年國際數(shù)學(xué)奧林匹克(IMO)、國際信息學(xué)奧林匹克(IOI)、ICPC世界總決賽及CMO中均取得了金牌級成績
![]()
官方已公開上述競賽的最終提交結(jié)果,社區(qū)可通過assets/olympiad_cases進行二次驗證
![]()
技術(shù)報告:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf
![]()
以下是詳細(xì)信息
核心能力與技術(shù)突破
DeepSeek-V3.2基于三大技術(shù)突破,實現(xiàn)了高計算效率與卓越推理、Agent性能的統(tǒng)一:
1.DeepSeek Sparse Attention (DSA):引入高效注意力機制,大幅降低計算復(fù)雜度,并針對長上下文場景進行了優(yōu)化
2.可擴展強化學(xué)習(xí)框架:通過穩(wěn)健的RL協(xié)議與后訓(xùn)練(post-training)算力擴展,實現(xiàn)了高性能表現(xiàn)
3.大規(guī)模Agent任務(wù)合成管線:涵蓋1800+環(huán)境及8.5萬+復(fù)雜指令
這一合成管線不僅提升了模型在復(fù)雜交互環(huán)境中的遵循度和泛化能力,更讓DeepSeek-V3.2將“思考”直接整合進工具使用(Tool-Use)的模型,同時支持在思考和非思考模式下使用工具
![]()
API更新與Speciale版限制
DeepSeek-V3.2:
API使用模式與V3.2-Exp保持一致,作為日常主力模型(Daily Driver),提供GPT-5級別的性能
DeepSeek-V3.2-Speciale:
該版本專為解決復(fù)雜任務(wù)設(shè)計,消耗更多Token,目前僅作為API提供,具體限制如下:
臨時端點:需使用
base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"
服務(wù)期限:該端點服務(wù)至2025年12月15日 15:59 (UTC) 截止
功能限制:不支持工具調(diào)用(Tool Calls),僅用于支持社區(qū)評估與研究。
定價:與DeepSeek-V3.2保持一致
聊天模板重大調(diào)整
DeepSeek-V3.2不再提供Jinja格式模板,并引入了“帶工具思考”及新角色設(shè)定。
Python腳本編碼:官方提供了encoding文件夾,包含Python腳本(encoding_dsv32.py),用于將OpenAI兼容格式消息編碼為模型輸入字符串及解析輸出
Developer角色:模板新增developer角色,專門用于搜索Agent場景,官方API不接受分配給該角色的消息
輸出解析注意:提供的解析函數(shù)僅處理格式良好的字符串,生產(chǎn)環(huán)境需自行增加穩(wěn)健的錯誤處理機制。
代碼示例如下:
本地部署建議import transformers
from encoding_dsv32 import encode_messagestokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")
messages = [
{"role": "user", "content": "hello"},
{"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."},
{"role": "user", "content": "1+1=?"}
]
# 思考模式配置
encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)
prompt = encode_messages(messages, **encode_config)
tokens = tokenizer.encode(prompt)
模型結(jié)構(gòu)與DeepSeek-V3.2-Exp相同。
采樣參數(shù):建議設(shè)置 temperature = 1.0,top_p = 0.95。
Speciale版提示:本地部署Speciale版本時,同樣不支持工具調(diào)用功能
開源與協(xié)議
倉庫及模型權(quán)重均采用 MIT License 授權(quán)。
--end--
最后記得??我,這對我非常重要,每天都在更新:
歡迎點贊轉(zhuǎn)發(fā)推薦評論,別忘了關(guān)注我
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.