![]()
新智元報道
編輯:艾倫 KingHZ
【新智元導讀】「開源之神」DeepSeek重磅發布V3.2正式版,性能全面超越GPT-5 High,與谷歌Gemini-3.0 Pro平分秋色。新模型不僅斬獲4項國際奧賽金牌級成績,更憑借獨創的DSA稀疏注意力架構,打破「速度、成本、智能」的不可能三角。
OpenAI這次真的要慌了!
就在剛剛,「源神」DeepSeek開源了DeepSeek-V3.2正式版——
在數學編程等多項推理基準上,全面超越GPT-5 High,優于Claude 4.5 Sonet;
與刷屏的Gemini 3.0 Pro相比,則難分伯仲,不相上下!
![]()
表1:DeepSeek-V3.2與其他模型在各類數學、代碼與通用領域評測集上的得分(括號內為消耗Tokens估計總量)
在今年,DeepSeek此前已發布7款模型——「開源之神」,當之無愧:
DeepSeek?R1、DeepSeek?R1?Zero
DeepSeek?V3、DeepSeek?V3.1、DeepSeek?V3.1-Terminus、DeepSeek?V3.2?Exp
DeepSeek?OCR、DeepSeek?Math-V2
出手即王炸
開源4項奧賽金牌級AI
全新模型DeepSeek-V3.2,出手即王炸。
DeepSeek正式發布DeepSeek-V3.2與DeepSeek-V3.2-Speciale——專為智能體打造的推理優先模型!
DeepSeek-V3.2:V3.2-Exp的官方迭代版本,現已登陸App、網頁端及API;
DeepSeek-V3.2-Speciale:突破推理能力邊界,目前僅通過API提供服務。
![]()
兩款模型均達到世界級推理性能 :
V3.2:推理能力與文本長度兼顧,擁有GPT-5級別性能,適合日常驅動;
V3.2-Speciale:極致推理能力,取得了4項金牌級成績;目前僅提供API版本(不支持工具調用),以支持社區評估與研究。
在主流推理基準測試上,DeepSeek-V3.2-Speciale的性能表現媲美Gemini-3.0-Pro(見表1)。
更令人矚目的是,V3.2-Speciale 模型成功斬獲多項金牌:
IMO 2025(國際數學奧林匹克)
CMO 2025(中國數學奧林匹克)
ICPC World Finals 2025(國際大學生程序設計競賽全球總決賽)
IOI 2025(國際信息學奧林匹克)
其中,ICPC與IOI成績分別達到了人類選手第二名與第十名的水平。
而DeepSeek-V3.2是首個將思考直接整合到工具使用中的模型,同時支持在思考和非思考模式下使用工具。
目前,兩款模型均已開源:
· DeepSeek-V3.2
HuggingFace:https://huggingface.co/deepseek-ai/
DeepSeek-V3.2
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
· DeepSeek-V3.2-Speciale
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
從「引擎驗證」到「全能車手」
DeepSeek V3.2的進化論
如果說兩個月前發布的DeepSeek-V3.2-Exp是一臺在賽道上呼嘯而過的「概念車」,用來向世界證明「稀疏注意力」引擎的動力潛力;
那么今天正式轉正的DeepSeek V3.2,則是一輛完成了內飾精修、裝配了頂級導航系統、可以隨時上路解決復雜問題的「量產超跑」。
這就是DeepSeek V3.2相比于Exp版(實驗版)最大的進化邏輯:核心引擎不變,但駕駛技巧(Agent能力)發生了質變。
![]()
V3.2正式版 vs. Exp
學會了「邊干邊想」
在架構層面,V3.2沿用了Exp版本驗證成功的DSA架構,但在「軟實力」上,DeepSeek解決了一個困擾AI界的頑疾——思考與行動的斷裂
在V3.2-Exp時期(以及其他大多數推理模型),模型像是一個記性不好的老學究:它會先花很長時間思考,決定調用一個工具(比如搜索天氣)。
但當工具把「今天是雨天」的結果扔回來時,它往往會「斷片兒」,忘了剛才思考到哪一步了,不得不重新規劃。
V3.2正式版引入了「思維上下文管理」。
![]()
這就像給模型裝了一個「工作記憶暫存區」。
現在的V3.2像一位經驗豐富的外科醫生,在伸手要手術刀(調用工具)的間隙,腦子里的手術方案依然清晰連貫,拿到刀后能無縫銜接下一步操作。
為了練就這項絕活,DeepSeek甚至為V3.2搭建了一個「虛擬演練場」。
他們合成了1800多個虛擬的操作系統、代碼庫和瀏覽器環境,生成了8.5萬條極其刁鉆的指令,逼著V3.2在虛擬世界里反復練習「修Bug」、「查資料」、「做報表」。
正是這種高強度的特訓,讓V3.2正式版從一個只會做題的「做題家」,進化成了能熟練使用工具解決現實難題的「實干家」。
最大技術亮點
給注意力裝上「閃電索引器」
V3.2能夠同時兼顧「聰明」和「便宜」,其最大的功臣依然是那個名為稀疏注意力(DSA)的底層黑科技。
![]()
DeepSeek-V3.2的注意力架構
要理解它的牛逼之處,我們得先看看傳統模型有多「笨」。
傳統模型在處理長文檔時,就像一個強迫癥晚期的圖書管理員:
為了回答你一個簡單的問題,它強迫自己必須把圖書館里每一本書的每一頁、每一行字都讀一遍,并計算它們之間的關聯。
這導致計算量隨著書的厚度呈指數級爆炸(O(L^2))。
DSA則給這位管理員配備了一套「閃電索引器」。
當問題來臨時,DSA先用極低的成本掃描一遍「索引」,瞬間判斷出哪幾頁書可能包含答案,把無關的99%的廢話直接扔掉。
然后,它只對這篩選出的1%的關鍵內容進行精細的深度閱讀。
這種「查目錄」而非「死磕全書」的策略,將計算復雜度從可怕的指數級直接拉低到了近乎線性(O(L))。
帶來的顯著提升
打破「不可能三角」
DSA技術的成功落地,直接擊穿了AI領域的「速度、成本、智能」不可能三角。
![]()
其一,成本腰斬,長文無憂。
對于用戶來說,丟給模型一本幾十萬字的小說或代碼庫,不再是「燒錢」的奢侈行為,處理速度也從「泡杯咖啡」變成了「眨眼之間」。
其二,算力盈余帶來的「智力涌現」,這是最精彩的一點。
正因為DSA節省了大量算力,DeepSeek才有底氣推出那個恐怖的Speciale版本。
既然讀得快,那就讓它想得久一點!
Speciale版本利用節省下來的資源,進行更深度的「長思考」和邏輯推演。
結果是震撼的:DeepSeek-V3.2-Speciale在數學(IMO金牌)、編程(IOI金牌)等硬核指標上,不僅超越了GPT-5 High,更是與谷歌最強的Gemini 3.0 Pro戰成平手。
![]()
從驗證DSA引擎潛力的V3.2-Exp,到將Agent能力、思維上下文管理、虛擬演練場訓練全部裝車的V3.2正式版,DeepSeek展示的是另一條通往強智能的路線:在算力緊箍咒下,用更聰明的架構、更精細的訓練和更開放的生態,撬動推理極限。
DeepSeek-V3.2的橫空出世,正是DeepSeek開源AI的魅力時刻:拒絕無腦燒錢Scaling,靠更聰明的算法,在算力的縫隙中開辟出通往頂峰的捷徑。
參考資料:
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.