<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V3.2 在推理任務中的表現優于 GPT-5

      0
      分享至


      作者 | Anthony Alford

      譯者 | 平川

      DeepSeek 發布 DeepSeek-V3.2,這是一個開源的推理和代理 AI 模型家族。在多項推理基準測試中,其高性能計算版本 DeepSeek-V3.2-Speciale 表現優于 GPT-5,與 Gemini-3.0-Pro 相當。

      DeepSeek 在開發 DeepSeek-V3.2 時應用了三項新技術。首先,他們使用了一種更高效的注意力機制,稱為 DeepSeek 稀疏注意力(DSA),這降低了模型的計算復雜性。他們還擴展了強化學習階段,使其消耗的計算資源超過了預訓練。最后,為了改進模型使用工具的能力,他們開發了一個代理任務合成管道。最終,該模型在一系列編碼、推理和代理基準測試中的表現超過了其他大多數開源模型,并且與 GPT-5 和 Gemini-3.0-Pro 等前沿閉源模型持平或更好。不過,DeepSeek 團隊指出:

      盡管取得了這些成果,我們承認,DeepSeek 與前沿封閉源模型相比還存在某些局限性……首先,由于訓練過程的 FLOP 總數較少,DeepSeek-V3.2 在世界知識的廣度方面仍然落后于領先的專有模型。在未來的迭代中,我們計劃通過擴大預訓練的計算量來解決這一知識差距問題。其次,令牌效率仍然是一個挑戰……未來的工作將專注于優化模型推理鏈的智能密度以提高效率。第三,解決復雜任務的能力仍然不如前沿模型,這激勵我們進一步完善我們的基礎模型和后訓練方法。

      InfoQ 報道過 DeepSeek 之前的幾個版本,包括最初的 DeepSeek-V3 以及他們的第一個推理模型 DeepSeek-R1。這兩個版本都是在 2025 年初發布的。2025 年晚些時候,InfoQ 報道了 DeepSeek-V3.1,這是一個混合推理模型,在單一系統中融合了思考模式與非思考模式。


      DeepSeek-V3.2 基準測試性能(圖片來源:DeepSeek 技術報告)

      DeepSeek-V3.2 使用的架構與 DeepSeek-V3.1 相同,只是使用了新的 DSA 注意力機制。團隊從 DeepSeek-V3.1 的一個檢查點入手,在繼續預訓練并生成 DeepSeek-V3.2 之前,將上下文長度擴展到了 128K。新的注意力機制將計算復雜性從 O(L^2) 降低到了 O(Lk),其中 L 是上下文長度,k<

      對于后訓練,團隊使用了專家蒸餾(specialist distillation)技術。他們訓練了一組專門針對特定領域的專家模型:編碼、數學運算和幾個代理任務。然后,這些專家模型生成合成訓練數據,用于微調主模型。

      在 Hacker News 上關于 DeepSeek-V3.2 的討論中,部分用戶指出了高性能開源模型的優勢。一位用戶寫道:

      如果你試圖構建基于 AI 的應用程序,你應該比較基于供應商的解決方案和使用自己的硬件托管開源模型之間的成本……然后將其與 GPT-5 的成本進行比較,這比較簡單,因為每(百萬)令牌的成本可以從網站上獲取。運行 DeepSeek(或更成熟的 Qwen3)這類系統能為你節省的云服務開支,絕對超乎想象……DeepSeek 和 Qwen 能在廉價 GPU 上流暢運行,而其他模型會直接卡死。

      DeepSeek-V3.2 模型文件可以從 Huggingface 上下載,但高計算資源版本 DeepSeek-V3.2-Speciale 目前僅通過 DeepSeek 的 API 提供。

      https://www.infoq.com/news/2026/01/deepseek-v32/

      聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      整天開會有啥必要???

      北京老付
      2026-01-20 10:59:33

      32歲凱恩獲拜仁天價續約,背后是6500萬解約條款的恐慌

      32歲凱恩獲拜仁天價續約,背后是6500萬解約條款的恐慌

      浮萍足球
      2026-01-27 00:53:05
      內幕來了!中國雷達被正名,美媒:美軍向委內瑞拉投下電磁脈沖彈

      內幕來了!中國雷達被正名,美媒:美軍向委內瑞拉投下電磁脈沖彈

      安珈使者啊
      2026-01-26 16:20:59
      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      女護士處理男患者隱私部位,會感覺難為情嗎?美女護士說出大實話

      第7情感
      2025-09-17 12:12:15
      日本政壇大變局,新首相人選出爐,對華態度不簡單

      日本政壇大變局,新首相人選出爐,對華態度不簡單

      你笑的好甜美
      2026-01-27 11:35:32
      庫里26397分超名宿!沖歷史前十要多久?答案太意外

      庫里26397分超名宿!沖歷史前十要多久?答案太意外

      籃球看比賽
      2026-01-27 12:33:28
      500架巨額訂單!巴基斯坦出口“梟龍”賺的錢,中國會有分成嗎?

      500架巨額訂單!巴基斯坦出口“梟龍”賺的錢,中國會有分成嗎?

      軍武次位面
      2026-01-26 19:30:48
      為何近期中國沒有懟特朗普?原來是中國銘記了拿破侖的一句名言!

      為何近期中國沒有懟特朗普?原來是中國銘記了拿破侖的一句名言!

      我心縱橫天地間
      2026-01-27 12:58:53
      烏軍能否守住紅軍城?不能!

      烏軍能否守住紅軍城?不能!

      史政先鋒
      2025-11-17 16:09:20
      格陵蘭拒絕美國吞并!有國家跪求成為美國的州,為啥美國不要?

      格陵蘭拒絕美國吞并!有國家跪求成為美國的州,為啥美國不要?

      軍武次位面
      2026-01-26 19:28:37
      負債4091億的京東花169萬買條魚,劉強東以前吃了保守的虧?

      負債4091億的京東花169萬買條魚,劉強東以前吃了保守的虧?

      BT財經
      2026-01-27 07:00:03
      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      古書記史
      2025-12-11 17:37:45
      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      翟欣欣鄰居曝猛料:她被帶走時哭瘋了,父母跟著落淚,稱跟她無關

      談史論天地
      2026-01-26 18:40:03
      年薪近2000萬,在49歲時仍然是單身!這位董秘的硬核人生,太颯了

      年薪近2000萬,在49歲時仍然是單身!這位董秘的硬核人生,太颯了

      墨蘭史書
      2026-01-22 23:50:03
      策略:明天1月28日的預判出來了,全面減倉之前,我要說兩句!

      策略:明天1月28日的預判出來了,全面減倉之前,我要說兩句!

      一擔金
      2026-01-27 13:09:20
      172:199,日本選舉殺出黑馬,新首相浮現?對華態度成最大看點

      172:199,日本選舉殺出黑馬,新首相浮現?對華態度成最大看點

      面包夾知識
      2026-01-27 11:45:52
      閆學晶又迎噩耗,最擔心的事還是發生了,兒媳體制內工作恐難保

      閆學晶又迎噩耗,最擔心的事還是發生了,兒媳體制內工作恐難保

      離離言幾許
      2026-01-23 00:04:19
      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      簡直不敢相信,莫言竟將日本侵華戰爭比作“兄弟爭奪家產”

      雪中風車
      2026-01-18 17:08:39
      詹姆斯24+5創NBA歷史第1神跡!東契奇46+7+11+8記3分刷爆紀錄

      詹姆斯24+5創NBA歷史第1神跡!東契奇46+7+11+8記3分刷爆紀錄

      一將籃球
      2026-01-27 12:05:08
      他8次上春晚,作死被捕入獄,如今56歲無人問津,淪落到四處走穴

      他8次上春晚,作死被捕入獄,如今56歲無人問津,淪落到四處走穴

      小熊侃史
      2026-01-06 11:17:00
      2026-01-27 13:43:00
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      11987文章數 51717關注度
      往期回顧 全部

      科技要聞

      理想開始關店“過冬”,否認“百家”規模

      頭條要聞

      寶馬5系車主揪出汽修店一個"意外疏忽":我氣得吐血

      頭條要聞

      寶馬5系車主揪出汽修店一個"意外疏忽":我氣得吐血

      體育要聞

      帶著母親遺愿戰斗12年,交易添頭成了隊魂

      娛樂要聞

      張雨綺被曝代孕,春晚被拒,代言跑路

      財經要聞

      金價狂飆 “牛市神話”未完待續

      汽車要聞

      劍指小米YU7與特斯拉Model Y 問界M6要來了?

      態度原創

      時尚
      家居
      數碼
      本地
      藝術

      降溫了!羽絨服這樣穿顯瘦又時髦

      家居要聞

      現代古典 中性又顯韻味

      數碼要聞

      蘋果M4 Max秀肌肉:非原生運行卡普空3A游戲大作狂飆近100幀

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      藝術要聞

      日本東京國立博物館中的100幅宋畫

      無障礙瀏覽 進入關懷版