![]()
歡迎來(lái)到北茗的AI茶館
ChatGPT發(fā)布三周年之際,DeepSeek搞了個(gè)突然襲擊。
剛剛發(fā)布了「DeepSeek-V3.2 」和「 DeepSeek-V3.2-Speciale」兩款模型。
![]()
模型有多強(qiáng)呢?
一句話你就懂了:超越GPT-5,與Gemini3 Pro不相上下。
![]()
![]()
分別介紹一下。
DeepSeek-V3.2,適合日常場(chǎng)景,平衡了推理能力與輸出長(zhǎng)度。
在推理測(cè)試中,比Gemini3 Pro稍差一點(diǎn),但能和GPT-5打個(gè)平手。
DeepSeek-V3.2- Speciale,不裝了,達(dá)到開源模型的最強(qiáng)推理能力。
在各大測(cè)試中的表現(xiàn),媲美最強(qiáng)模型Gemini3 Pro。
![]()
IMO 2025(國(guó)際數(shù)學(xué)奧林匹克)、CMO 2025(中國(guó)數(shù)學(xué)奧林匹克)、ICPC World Finals 2025(國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽全球總決賽)、IOI 2025(國(guó)際信息學(xué)奧林匹克)這些頂級(jí)競(jìng)賽的金牌隨便拿!
![]()
這次的新模型有什么不同呢?
DeepSeek-V3.2將思考融入了工具使用。思考和非思考模式下,都能實(shí)現(xiàn)工具調(diào)用。
這簡(jiǎn)直就是為智能體而生的呀!
DeepSeek團(tuán)隊(duì)還提出了一種大規(guī)模Agent訓(xùn)練數(shù)據(jù)合成方法。
他們用大量的難以解答,但容易驗(yàn)證的任務(wù),進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練。
這樣可以大幅提高模型的泛化能力。
下面是DeepSeek-V3.2在智能體工具調(diào)用方面評(píng)測(cè)的表現(xiàn)。
![]()
開源模型中的top one。
官方給出一個(gè)示例:

深度思考加上工具調(diào)用,回答效果大大提升。
此外,DeepSeek-V3.2引入的DSA機(jī)制(DeepSeek Sparse Attention)也有不小功勞。
想要了解DSA的小伙伴,可以看之前寫的這篇:
或者直接看DeepSeek的新模型技術(shù)報(bào)告:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf
總的來(lái)說(shuō),DSA大幅提高了模型在長(zhǎng)文本上的表現(xiàn),并且?guī)缀醪唤档洼敵鲑|(zhì)量。

最后,附上兩個(gè)版本的開源地址:
DeepSeek-V3.2
HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
DeepSeek-V3.2-Speciale
HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
同時(shí)期待DeepSeek早日發(fā)布R2模型!
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.