![]()
哈嘍,大家好,今天小墨就帶大家分析國產大模型的硬核逆襲 ,DeepSeek-V3.2 系列開源直接對標 Gemini-3.0-Pro,拿滿國際競賽金牌還把推理成本砍半。
ChatGPT 發布三周年之際,全球 AI 賽道迎來關鍵轉折點。當閉源模型還在算力軍備競賽中比拼參數規模時,中國團隊 DeepSeek 突然拋出兩顆 “重磅炸彈”。
![]()
![]()
雙模型精準卡位,競賽成績刷新開源天花板
DeepSeek 此次發布的兩款模型形成明確分工。
標準版 V3.2 聚焦 “平衡實用”,在日常問答、通用 Agent 任務和工具調用場景中表現亮眼,其推理能力達到 GPT-5 級別,僅小幅落后于 Gemini-3.0-Pro,且輸出長度較同類模型大幅縮短,顯著降低用戶等待時間與計算開銷。
![]()
更值得關注的是,該模型在未針對測試集特殊訓練的情況下,拿下當前開源模型 Agent 評測的最高分數,在 SWE-Verified 代碼任務中實現 73.1% 的解決率,Terminal Bench 2.0 準確率達 46.4%,大幅超越現有開源模型。
增強版 Speciale 則劍指 “極致推理”,融合 DeepSeek-Math-V2 的定理證明能力后,一舉斬獲 IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025 四項國際頂級競賽金牌,其中 ICPC 成績躋身人類選手第二名,IOI 排名第十,成為首個在編程與數學競賽中比肩頂尖人類選手的開源模型。
![]()
不過官方特別提醒,該版本專注科研場景,未優化日常對話,且 Token 消耗與使用成本顯著高于標準版,目前僅開放臨時 API 供研究使用。
![]()
成本效率實現顛覆性突破
支撐此次性能飛躍的核心,是 DeepSeek 獨創的 DSA(DeepSeek Sparse Attention)稀疏注意力機制。
傳統注意力機制處理長序列時計算復雜度為 O (L2),嚴重制約部署效率,而 DSA 通過 “閃電索引器” 與 “細粒度 token 選擇” 雙組件。
![]()
將復雜度降至 O (L?k)(k 遠小于 L),在 128k 長序列任務中,推理成本較上一代 V3.1-Terminus 大幅降低 ,H800 集群測試顯示,預填充階段每百萬 token 成本從 0.7 美元降至 0.2 美元,解碼階段從 2.4 美元降至 0.8 美元。
更關鍵的是,該技術實現了 “降本不降價”,支持 FP8 精度與 MLA 架構,適配昇騰 Atlas 800 A2 等國產芯片,通過結構化剪枝與混合量化策略,可在精度損失小于 1% 的前提下將參數量壓縮 40%,算力利用率提升 200%。
這種架構創新讓 DeepSeek 走出了一條區別于 “算力堆料” 的技術路線,其訓練成本僅為 Meta Llama-3 的 1/11,卻實現了相當的性能表現。
![]()
![]()
破解開源模型泛化難題
DeepSeek 在強化學習(RL)領域的投入同樣打破行業常規 ,將訓練后階段的計算預算提升至預訓練成本的 10%,這在開源模型中極為罕見。
團隊基于 GRPO 算法優化出無偏 KL 估計、離線序列掩碼等技術,解決了大規模 RL 訓練的穩定性問題,同時通過 “專家蒸餾” 策略,讓模型吸收數學、編程、Agent 任務等 6 大領域的專項能力。
![]()
為提升 Agent 泛化能力,DeepSeek 構建了全球領先的自動環境合成管線,生成 1827 個任務導向環境與 85000 個復雜提示,涵蓋旅行規劃、軟件開發等真實場景,其中代碼 Agent 從 GitHub 挖掘數百萬 issue-PR 對,搭建了多語言可執行測試環境,搜索 Agent 則通過多智能體協作生成高質量長尾數據。
這種 “難解易驗” 的訓練模式,讓 V3.2 在未見過的 Agent 場景中仍能保持高性能,大幅縮小了開源與閉源模型的差距。
![]()
開源社區認可度持續攀升
目前 DeepSeek-V3.2 已全面登陸官方 App、Web 端與小程序,API 調用成本降低 50% 以上,而 Speciale 版本開放臨時 API 供科研使用。
![]()
作為首個登上 Nature 封面的中國大模型,DeepSeek 的開源生態已形成規模效應,GitHub 星數超越同類模型,R1 版本曾創下 7 天用戶破 1 億的紀錄,較 ChatGPT 達成同等規模快 53 天。
更重要的是,其推出的大模型一體機已覆蓋 1.5B 至 671B 全尺寸模型,從邊緣端到云端實現國產化算力解決方案落地。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.