<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      業界首個!螞蟻開源萬億參數混合線性思考模型,IMO金牌水平

      0
      分享至


      智東西
      作者 程茜
      編輯 李水青

      智東西2月13日消息,今天,螞蟻集團開源全球首個基于混合線性架構的萬億參數思考模型Ring-2.5-1T

      根據官方信息,相比螞蟻2025年10月發布的萬億級思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長時程任務執行能力三個關鍵維度上實現提升,且在長文本生成、數學推理與智能體任務執行上達到開源領先水平。

      在生成效率上,Ring-2.5-1T在32K以上長文本生成場景中,對比上代模型訪存規模降低至1/10,生成吞吐提升3倍以上。

      在深度思考能力方面,該模型在國際數學奧林匹克競賽(IMO 2025)和中國數學奧林匹克(CMO 2025)自測均達到金牌水平,IMO為35分、CMO為105分。


      目前,該模型已經適配Claude Code等智能體框架與OpenClaw個人AI助理,支持多步規劃與工具調用。

      Ring-2.5-1T的模型權重與推理代碼已在Hugging Face、ModelScope等主流開源平臺發布,官方平臺Chat體驗頁和API服務將在近期上線。

      Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

      ModelScape:https://modelscope.cn/organization/inclusionAI

      一、拿下多項開源SOTA,達IMO金牌水平

      為了評估Ring-2.5-1T的深度思考與長時任務執行能力,螞蟻研究人員選擇了具有代表性的開源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作為比較。

      螞蟻集團公布的多項權威基準測試結果顯示,Ring-2.5-1T在數學、編程和邏輯推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高難度推理任務以及Agent搜索、工具調用和軟件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等長時任務執行方面均實現了最先進的開源性能。

      此外,螞蟻還對深度思考(Heavy Thinking)模式下的模型性能進行了額外測試,Ring-2.5-1T在IMOAnswerBench、HMMT-25等數學競賽推理基準和LiveCodeBench-v6代碼生成基準中超越所有對比模型。

      其中,在IMO 2025(滿分42分)中,Ring-2.5-1T獲得35分,達到金牌水平;在CMO 2025(滿分126分)中,該模型獲得105分,超過金牌分數線78分和國家隊集訓隊選拔線87分。

      研究人員比較了Ring-2.5-1T和Ring-1T的答案發現,前者在推理邏輯的嚴謹性、高級數學證明技術的應用以及答案表述的完整性方面均有提升。

      智能體搜索任務Gaia2-search中,Ring-2.5-1T在開源模型中取得了SOTA性能。Gaia2環境強調跨應用工具協作和復雜任務執行能力,Ring-2.5-1T在規劃生成和多步工具調用方面均展現出較高的效率和準確性。

      二、三大關鍵維度提升,能快速適配Claude Code、OpenClaw

      相比螞蟻2025年10月發布的萬億級思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長時程任務執行能力三個關鍵維度上有顯著改進。

      首先在生成效率方面,通過采用高比例線性注意力機制,Ring-2.5-1T將內存訪問開銷降低至1/10,并將超過32K token序列的生成吞吐量提高了3倍以上,適用于深度思考和長時程任務執行。

      其次在深度思考層面,該模型在RLVR(基于可驗證獎勵的強化學習)基礎上引入密集獎勵機制,為推理過程提供嚴格性反饋,使Ring-2.5-1T同時達到IMO 2025和CMO 2025(自測)的金獎水平。

      最后是長程任務執行,Ring-2.5-1T通過大規模完全異步智能體RL(強化學習)訓練,增強了解決復雜任務的長時程自主執行能力,使其能快速適配Claude Code等智能體編程框架和OpenClaw個人AI助手。

      三、引入混合線性注意力架構,可提升長程推理場景吞吐量

      Ring-2.5-1T基于Ling 2.5架構,通過優化注意力機制,可提升長文本推理的效率與穩定性。

      作為實現自主模型架構的關鍵進展,Ling 2.5架構在Ling 2.0架構的基礎上引入了一種混合線性注意力架構。通過增量訓練,研究人員將Ling 2.0架構中的GQA(分組查詢注意力)升級為MLA(多頭線性注意力)+Lightning Linear結構的1:7比例。

      具體來說,基于其先前發布的Ring-flash-linear-2.0技術路線圖,研究人員將部分GQA層轉換為Lightning Linear注意力,以提升長時程推理場景中的吞吐量。

      同時為了進一步壓縮KV緩存,研究人員將剩余的GQA層近似轉換為MLA,同時針對QK Norm(查詢-核歸一化)和Partial RoPE(部分旋轉位置編碼)等特征進行針對性改進,從而增強Ling 2.5架構的表達能力。


      在此基礎上,模型激活參數規模從前代的51B提升至63B,并且在混合線性注意力架構的支持下,其推理效率相比Ling 2.0仍實現大幅提升。

      與僅具備32B激活參數的Kimi K2架構相比,在1T總參數量下,Ling 2.5架構在長序列推理任務中的吞吐表現優勢顯著,且隨著生成長度增加,效率優勢持續擴大。


      ▲在一臺配備8塊H20-3e GPU的機器上,批處理大小=64,比較不同生成長度下的解碼吞吐量


      ▲在一臺配備8塊H200 GPU的機器上,批處理大小=64,比較不同生成長度下的解碼吞吐量

      結語:從短對話到復雜規劃,大模型需突破長文本瓶頸

      隨著AI大模型應用從短對話向長文檔處理、跨文件代碼理解、復雜任務規劃等場景擴展,Ring-2.5-1T可以緩解模型在長輸出場景下計算開銷高、推理速度慢的問題。

      此前,傳統架構在面對超長文本、多模態內容、復雜業務流程時,普遍面臨算力成本高、響應延遲大、部署難度高等問題,螞蟻百靈團隊此次通過底層架構創新,或為行業提供一條兼顧性能、成本與擴展性的技術路徑。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      連續跌停!又一超級大妖股崩了?

      連續跌停!又一超級大妖股崩了?

      財經銳眼
      2026-02-12 16:35:08
      高盛:預計從6月到今年底 會有四次降息

      高盛:預計從6月到今年底 會有四次降息

      財聯社
      2026-02-13 14:06:06
      郭碧婷新加坡過年!素顏美得像幅畫,這氣質太絕了?

      郭碧婷新加坡過年!素顏美得像幅畫,這氣質太絕了?

      娛樂領航家
      2026-02-13 23:00:03
      超廣東升第一!廣廈拒青島29分逆轉 胡金秋31+8+6賽季新高

      超廣東升第一!廣廈拒青島29分逆轉 胡金秋31+8+6賽季新高

      醉臥浮生
      2026-01-27 21:23:35
      1.5米身高破格入伍,2秒放倒彪形大漢,吳京都敬畏三分

      1.5米身高破格入伍,2秒放倒彪形大漢,吳京都敬畏三分

      究竟誰主沉浮
      2026-01-30 09:47:35
      朝鮮名將方虎山,不顧勸阻把三千日軍俘虜推下冰河,他坦言:我甘愿背負罵名

      朝鮮名將方虎山,不顧勸阻把三千日軍俘虜推下冰河,他坦言:我甘愿背負罵名

      史海孤雁
      2026-02-13 10:34:08
      多地節前發文要求外賣平臺停止“內卷式”競爭:不得以份額增長為最高目標持續補貼

      多地節前發文要求外賣平臺停止“內卷式”競爭:不得以份額增長為最高目標持續補貼

      澎湃新聞
      2026-02-12 22:26:28
      2-0!6-1!中國女足雙殺越南,亞洲杯劍指衛冕,將遇三大強敵

      2-0!6-1!中國女足雙殺越南,亞洲杯劍指衛冕,將遇三大強敵

      綠茵舞著
      2026-02-13 23:00:19
      文章也沒想到,馬年開始才幾天,49歲馬伊琍就高調官宣了喜訊

      文章也沒想到,馬年開始才幾天,49歲馬伊琍就高調官宣了喜訊

      草莓解說體育
      2026-02-13 05:53:45
      【解局】從三個細節,看慕安會之“變”

      【解局】從三個細節,看慕安會之“變”

      環球網資訊
      2026-02-12 21:47:00
      巨大爭議!意大利本土選手藥檢陽性僅3周,解禁獲準參加冬奧會

      巨大爭議!意大利本土選手藥檢陽性僅3周,解禁獲準參加冬奧會

      全景體育V
      2026-02-13 19:51:38
      好慘烈的身高對比差距,中越邊境上的一張軍人合影突然火了起來

      好慘烈的身高對比差距,中越邊境上的一張軍人合影突然火了起來

      我心縱橫天地間
      2026-01-30 22:17:29
      中日開戰可能性增大,但收場太難,若真動手,中方估計半步都不退

      中日開戰可能性增大,但收場太難,若真動手,中方估計半步都不退

      百態人間
      2026-01-03 16:42:15
      慘敗!1月轎車銷量排名,燃油車霸榜前二十,新能源僅2款車破萬

      慘敗!1月轎車銷量排名,燃油車霸榜前二十,新能源僅2款車破萬

      趣味萌寵的日常
      2026-02-13 05:50:23
      這只拉布拉多從小到大一直堅持陪主人蹲坑,可是后來它卻不得不放棄了...

      這只拉布拉多從小到大一直堅持陪主人蹲坑,可是后來它卻不得不放棄了...

      愛寵物
      2026-02-13 22:21:50
      后悔把公積金都取了,沒想到退休后,公積金不取還有4個好處!

      后悔把公積金都取了,沒想到退休后,公積金不取還有4個好處!

      林子說事
      2026-02-13 07:55:36
      33歲內馬爾官宣當爺爺!4娃3母情史混亂,緋聞頻登熱搜引熱議

      33歲內馬爾官宣當爺爺!4娃3母情史混亂,緋聞頻登熱搜引熱議

      羅氏八卦
      2026-02-13 18:55:03
      宋朝官帽上的兩根長翅究竟是干嘛的?為何就連宋朝皇帝也要戴?

      宋朝官帽上的兩根長翅究竟是干嘛的?為何就連宋朝皇帝也要戴?

      瘋狂的小歷史
      2026-01-24 13:52:20
      谷愛凌連續3天遭美國網友惡評:卑鄙的叛徒!不如劉美賢 她母親只認錢

      谷愛凌連續3天遭美國網友惡評:卑鄙的叛徒!不如劉美賢 她母親只認錢

      東方不敗然多多
      2026-02-12 07:58:58
      2026-02-14 00:03:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11231文章數 116971關注度
      往期回顧 全部

      科技要聞

      獨家探訪蔡磊:答不完的卷子 死磕最后一程

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      頭條要聞

      8千元的迷你小馬一夜爆火 馬主:1天排泄次數達十幾次

      體育要聞

      這張照片背后,是米蘭冬奧最催淚的故事

      娛樂要聞

      大衣哥女兒風光出嫁,農村婚禮超樸素

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      探秘比亞迪巴西工廠 居然是這個畫風!

      態度原創

      教育
      數碼
      手機
      家居
      軍事航空

      教育要聞

      高考地理常用答題思路,很齊全!

      數碼要聞

      閃極海外推出300W充電寶Shargeek 300:配DC接口+ 2C + 1A

      手機要聞

      iPhone 16e庫存基本告罄,消息暗示17e即將到來

      家居要聞

      中古雅韻 樂韻伴日常

      軍事要聞

      多次成功應對外艦、外機挑釁 太原艦展示052D硬核實力

      無障礙瀏覽 進入關懷版