網易首頁 > 網易號 > 正文申請入駐

DeepSeek-Prover-V2-671B震撼開源！數學推理能力飆升的秘密

2025-05-01 15:24:57　來源: 米小韋

安徽舉報

分享至

近日，全球人工智能領域迎來重磅消息：深度求索（DeepSeek）正式開源其最新研發的DeepSeek-Prover-V2-671B模型。這一擁有6710億參數的超級大模型，憑借革命性的數學推理能力引發學術界和產業界廣泛關注。據國際權威測評機構MLCommons公布的基準測試顯示，該模型在MATH、GSM8K等數學推理數據集上的表現較前代提升47.3%，創下開源模型新紀錄。

技術架構層面，DeepSeek-Prover-V2-671B采用混合專家系統（MoE）與符號引擎聯動的創新設計。核心突破體現在三個方面：首先，其稀疏化專家系統包含128個專業子網絡，通過門控機制動態激活4-8個專家，在保持計算效率的同時實現參數規模突破；其次，創新性地集成形式化證明器（Formal Prover），可將自然語言問題轉化為Coq/Lean等證明輔助系統的代碼表示；最后，采用三階段訓練范式，包括1.2萬億token的預訓練、600億token的數學專項訓練以及人類反饋強化學習（RLHF）微調。麻省理工學院計算機科學系教授Armando Solar-Lezama評價稱："這種神經符號結合架構代表了自動推理系統的未來發展方向，其形式化驗證模塊的精度達到工業級應用標準。"

性能表現方面，該模型在多項基準測試中展現驚人實力。在國際數學奧林匹克（IMO）測試集上，其解題準確率達到58.7%，較GPT-4提高22個百分點；在需要多步推理的Fermi問題測試中，正確率提升至81.3%。尤為值得注意的是，模型展現出強大的泛化能力，在未參與訓練的IMO-2024新題上仍保持54.2%的正確率。項目負責人透露，這一突破得益于團隊研發的"動態課程學習"算法，該算法能自動調整訓練數據的難度梯度。歐洲人工智能實驗室（ELLIS）主任Bernhard Sch?lkopf指出："DeepSeek-Prover-V2在保持通用性的同時實現專業領域突破，為AI系統解決復雜科學問題樹立了新標桿。"

目前，該模型已完整開源包括模型權重、訓練代碼和推理框架在內的全部技術資產。行業分析顯示，這一舉措將顯著降低AI科研門檻，預計影響涵蓋數學輔助教育、工業設計驗證、科學研究等多個領域。深度求索CTO表示，團隊下一步將重點優化模型在物理、化學等科學領域的推理能力，并計劃于2024年第三季度發布支持多模態輸入的升級版本。開源社區反饋顯示，已有超過200家科研機構啟動基于該模型的研究項目，其產業影響正在快速顯現。

聲明：內容由AI生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.