2025年12月2日,DeepSeek正式發(fā)布了新一代開源大模型DeepSeek-V3.2及其長思考增強(qiáng)版DeepSeek-V3.2-Speciale。該系列模型在多項(xiàng)推理與智能體基準(zhǔn)測(cè)試中取得了開源模型的最佳性能,標(biāo)志著開源模型在追趕閉源模型的道路上取得了重要進(jìn)展。
一、核心性能表現(xiàn)
根據(jù)官方信息及權(quán)威評(píng)測(cè)平臺(tái)Artificial Analysis的數(shù)據(jù),DeepSeek-V3.2在公開的推理基準(zhǔn)測(cè)試中表現(xiàn)卓越。標(biāo)準(zhǔn)版V3.2已達(dá)到GPT-5水平,略低于Gemini-3.0-Pro。與當(dāng)前另一高性能開源模型Kimi-K2-Thinking相比,V3.2在相同測(cè)試設(shè)置下均實(shí)現(xiàn)領(lǐng)先,且其輸出長度更短,計(jì)算開銷和用戶等待時(shí)間顯著減少。
![]()
長思考增強(qiáng)版V3.2-Speciale則專注于深度推理,它結(jié)合了DeepSeek-Math-V2的定理證明能力,在主流推理基準(zhǔn)上的性能表現(xiàn)媲美Gemini-3.0-Pro。該模型在國際數(shù)學(xué)奧林匹克(IMO 2025)、國際大學(xué)生程序設(shè)計(jì)競賽(ICPC 2025)等賽事中均達(dá)到金牌水平,其ICPC成績相當(dāng)于人類選手第二名。Speciale版本專為復(fù)雜任務(wù)設(shè)計(jì),Tokens消耗大、成本高,目前僅供研究使用。
![]()
二、關(guān)鍵技術(shù)突破:DSA架構(gòu)與高效后訓(xùn)練
DeepSeek團(tuán)隊(duì)認(rèn)為,此前開源模型與閉源模型的差距主要源于三方面:傳統(tǒng)注意力機(jī)制處理長序列效率低下、訓(xùn)練后階段算力投入不足、智能體應(yīng)用場景中的泛化與指令遵循能力較弱。為了解決這些關(guān)鍵限制,DeepSeek首先引入高效的DSA稀疏注意力機(jī)制,顯著降低計(jì)算復(fù)雜度并維持長上下文場景下的模型性能;其次開發(fā)了可擴(kuò)展的強(qiáng)化學(xué)習(xí)協(xié)議,投入超過預(yù)訓(xùn)練成本10%的算力用于訓(xùn)練后擴(kuò)展,以解鎖模型高級(jí)能力;第三,提出創(chuàng)新的流程來促進(jìn)工具使用場景中的泛化推理,通過合成超過1800個(gè)環(huán)境和85000個(gè)提示的大規(guī)模智能體任務(wù)數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí),從而顯著提升模型在智能體場景中的泛化與指令遵循能力。
三、模型特點(diǎn)與未來方向
DeepSeek-V3.2是Deepseek推出的首個(gè)將思考過程融入工具使用的模型,同時(shí)支持思考與非思考兩種工具調(diào)用模式,且在真實(shí)應(yīng)用場景中能夠展現(xiàn)出較強(qiáng)的泛化性。目前,標(biāo)準(zhǔn)版V3.2已在官方網(wǎng)頁端、App和API全面上線,兩個(gè)模型均已開源。
DeepSeek也指出了當(dāng)前模型的不足與未來改進(jìn)方向:由于總體訓(xùn)練計(jì)算量(FLOPs)相對(duì)較少,模型的世界知識(shí)廣度仍落后于領(lǐng)先的專有模型;在達(dá)到與Gemini-3.0-Pro同等輸出質(zhì)量時(shí),Token效率(即需要生成長度)仍有提升空間;解決極端復(fù)雜任務(wù)的能力與前沿模型相比尚有差距。團(tuán)隊(duì)計(jì)劃通過擴(kuò)大預(yù)訓(xùn)練規(guī)模、優(yōu)化推理鏈的“智能密度”以及完善后訓(xùn)練方案來持續(xù)迭代。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.