<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      業(yè)界首個(gè)!螞蟻開源萬億參數(shù)混合線性思考模型,IMO金牌水平

      0
      分享至


      智東西
      作者 程茜
      編輯 李水青

      智東西2月13日消息,今天,螞蟻集團(tuán)開源全球首個(gè)基于混合線性架構(gòu)的萬億參數(shù)思考模型Ring-2.5-1T

      根據(jù)官方信息,相比螞蟻2025年10月發(fā)布的萬億級(jí)思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長(zhǎng)時(shí)程任務(wù)執(zhí)行能力三個(gè)關(guān)鍵維度上實(shí)現(xiàn)提升,且在長(zhǎng)文本生成、數(shù)學(xué)推理與智能體任務(wù)執(zhí)行上達(dá)到開源領(lǐng)先水平。

      在生成效率上,Ring-2.5-1T在32K以上長(zhǎng)文本生成場(chǎng)景中,對(duì)比上代模型訪存規(guī)模降低至1/10,生成吞吐提升3倍以上。

      在深度思考能力方面,該模型在國際數(shù)學(xué)奧林匹克競(jìng)賽(IMO 2025)和中國數(shù)學(xué)奧林匹克(CMO 2025)自測(cè)均達(dá)到金牌水平,IMO為35分、CMO為105分。


      目前,該模型已經(jīng)適配Claude Code等智能體框架與OpenClaw個(gè)人AI助理,支持多步規(guī)劃與工具調(diào)用。

      Ring-2.5-1T的模型權(quán)重與推理代碼已在Hugging Face、ModelScope等主流開源平臺(tái)發(fā)布,官方平臺(tái)Chat體驗(yàn)頁和API服務(wù)將在近期上線。

      Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T

      ModelScape:https://modelscope.cn/organization/inclusionAI

      一、拿下多項(xiàng)開源SOTA,達(dá)IMO金牌水平

      為了評(píng)估Ring-2.5-1T的深度思考與長(zhǎng)時(shí)任務(wù)執(zhí)行能力,螞蟻研究人員選擇了具有代表性的開源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作為比較。

      螞蟻集團(tuán)公布的多項(xiàng)權(quán)威基準(zhǔn)測(cè)試結(jié)果顯示,Ring-2.5-1T在數(shù)學(xué)、編程和邏輯推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高難度推理任務(wù)以及Agent搜索、工具調(diào)用和軟件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等長(zhǎng)時(shí)任務(wù)執(zhí)行方面均實(shí)現(xiàn)了最先進(jìn)的開源性能。

      此外,螞蟻還對(duì)深度思考(Heavy Thinking)模式下的模型性能進(jìn)行了額外測(cè)試,Ring-2.5-1T在IMOAnswerBench、HMMT-25等數(shù)學(xué)競(jìng)賽推理基準(zhǔn)和LiveCodeBench-v6代碼生成基準(zhǔn)中超越所有對(duì)比模型。

      其中,在IMO 2025(滿分42分)中,Ring-2.5-1T獲得35分,達(dá)到金牌水平;在CMO 2025(滿分126分)中,該模型獲得105分,超過金牌分?jǐn)?shù)線78分和國家隊(duì)集訓(xùn)隊(duì)選拔線87分。

      研究人員比較了Ring-2.5-1T和Ring-1T的答案發(fā)現(xiàn),前者在推理邏輯的嚴(yán)謹(jǐn)性、高級(jí)數(shù)學(xué)證明技術(shù)的應(yīng)用以及答案表述的完整性方面均有提升。

      智能體搜索任務(wù)Gaia2-search中,Ring-2.5-1T在開源模型中取得了SOTA性能。Gaia2環(huán)境強(qiáng)調(diào)跨應(yīng)用工具協(xié)作和復(fù)雜任務(wù)執(zhí)行能力,Ring-2.5-1T在規(guī)劃生成和多步工具調(diào)用方面均展現(xiàn)出較高的效率和準(zhǔn)確性。

      二、三大關(guān)鍵維度提升,能快速適配Claude Code、OpenClaw

      相比螞蟻2025年10月發(fā)布的萬億級(jí)思考模型Ring-1T,Ring-2.5-1T在生成效率、推理深度和長(zhǎng)時(shí)程任務(wù)執(zhí)行能力三個(gè)關(guān)鍵維度上有顯著改進(jìn)。

      首先在生成效率方面,通過采用高比例線性注意力機(jī)制,Ring-2.5-1T將內(nèi)存訪問開銷降低至1/10,并將超過32K token序列的生成吞吐量提高了3倍以上,適用于深度思考和長(zhǎng)時(shí)程任務(wù)執(zhí)行。

      其次在深度思考層面,該模型在RLVR(基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí))基礎(chǔ)上引入密集獎(jiǎng)勵(lì)機(jī)制,為推理過程提供嚴(yán)格性反饋,使Ring-2.5-1T同時(shí)達(dá)到IMO 2025和CMO 2025(自測(cè))的金獎(jiǎng)水平。

      最后是長(zhǎng)程任務(wù)執(zhí)行,Ring-2.5-1T通過大規(guī)模完全異步智能體RL(強(qiáng)化學(xué)習(xí))訓(xùn)練,增強(qiáng)了解決復(fù)雜任務(wù)的長(zhǎng)時(shí)程自主執(zhí)行能力,使其能快速適配Claude Code等智能體編程框架和OpenClaw個(gè)人AI助手。

      三、引入混合線性注意力架構(gòu),可提升長(zhǎng)程推理場(chǎng)景吞吐量

      Ring-2.5-1T基于Ling 2.5架構(gòu),通過優(yōu)化注意力機(jī)制,可提升長(zhǎng)文本推理的效率與穩(wěn)定性。

      作為實(shí)現(xiàn)自主模型架構(gòu)的關(guān)鍵進(jìn)展,Ling 2.5架構(gòu)在Ling 2.0架構(gòu)的基礎(chǔ)上引入了一種混合線性注意力架構(gòu)。通過增量訓(xùn)練,研究人員將Ling 2.0架構(gòu)中的GQA(分組查詢注意力)升級(jí)為MLA(多頭線性注意力)+Lightning Linear結(jié)構(gòu)的1:7比例。

      具體來說,基于其先前發(fā)布的Ring-flash-linear-2.0技術(shù)路線圖,研究人員將部分GQA層轉(zhuǎn)換為L(zhǎng)ightning Linear注意力,以提升長(zhǎng)時(shí)程推理場(chǎng)景中的吞吐量。

      同時(shí)為了進(jìn)一步壓縮KV緩存,研究人員將剩余的GQA層近似轉(zhuǎn)換為MLA,同時(shí)針對(duì)QK Norm(查詢-核歸一化)和Partial RoPE(部分旋轉(zhuǎn)位置編碼)等特征進(jìn)行針對(duì)性改進(jìn),從而增強(qiáng)Ling 2.5架構(gòu)的表達(dá)能力。


      在此基礎(chǔ)上,模型激活參數(shù)規(guī)模從前代的51B提升至63B,并且在混合線性注意力架構(gòu)的支持下,其推理效率相比Ling 2.0仍實(shí)現(xiàn)大幅提升。

      與僅具備32B激活參數(shù)的Kimi K2架構(gòu)相比,在1T總參數(shù)量下,Ling 2.5架構(gòu)在長(zhǎng)序列推理任務(wù)中的吞吐表現(xiàn)優(yōu)勢(shì)顯著,且隨著生成長(zhǎng)度增加,效率優(yōu)勢(shì)持續(xù)擴(kuò)大。


      ▲在一臺(tái)配備8塊H20-3e GPU的機(jī)器上,批處理大小=64,比較不同生成長(zhǎng)度下的解碼吞吐量


      ▲在一臺(tái)配備8塊H200 GPU的機(jī)器上,批處理大小=64,比較不同生成長(zhǎng)度下的解碼吞吐量

      結(jié)語:從短對(duì)話到復(fù)雜規(guī)劃,大模型需突破長(zhǎng)文本瓶頸

      隨著AI大模型應(yīng)用從短對(duì)話向長(zhǎng)文檔處理、跨文件代碼理解、復(fù)雜任務(wù)規(guī)劃等場(chǎng)景擴(kuò)展,Ring-2.5-1T可以緩解模型在長(zhǎng)輸出場(chǎng)景下計(jì)算開銷高、推理速度慢的問題。

      此前,傳統(tǒng)架構(gòu)在面對(duì)超長(zhǎng)文本、多模態(tài)內(nèi)容、復(fù)雜業(yè)務(wù)流程時(shí),普遍面臨算力成本高、響應(yīng)延遲大、部署難度高等問題,螞蟻百靈團(tuán)隊(duì)此次通過底層架構(gòu)創(chuàng)新,或?yàn)樾袠I(yè)提供一條兼顧性能、成本與擴(kuò)展性的技術(shù)路徑。


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      熬了8年!高速收費(fèi)終于定了,2026年起,車主上高速徹底變了

      熬了8年!高速收費(fèi)終于定了,2026年起,車主上高速徹底變了

      奇思妙想草葉君
      2026-03-06 23:23:57
      2026,“蔚小理”日子誰都不好過

      2026,“蔚小理”日子誰都不好過

      汽車公社
      2026-03-08 08:36:31
      女子離婚2年,發(fā)現(xiàn)前夫最好,求復(fù)婚開口要10萬彩禮,男子:免談

      女子離婚2年,發(fā)現(xiàn)前夫最好,求復(fù)婚開口要10萬彩禮,男子:免談

      社會(huì)日日鮮
      2026-03-06 05:32:50
      股民要做好心理準(zhǔn)備了,接下來一周內(nèi)股市域?qū)⒃傺?5年歷史!

      股民要做好心理準(zhǔn)備了,接下來一周內(nèi)股市域?qū)⒃傺?5年歷史!

      風(fēng)風(fēng)順
      2026-03-08 07:08:40
      周一,世界將迎來“最漫長(zhǎng)的一天”

      周一,世界將迎來“最漫長(zhǎng)的一天”

      新浪財(cái)經(jīng)
      2026-03-08 07:44:17
      福建省委組織部公示

      福建省委組織部公示

      新浪財(cái)經(jīng)
      2026-03-07 13:17:24
      3月8日,券商給予評(píng)級(jí)并且給出目標(biāo)價(jià)的公司一覽

      3月8日,券商給予評(píng)級(jí)并且給出目標(biāo)價(jià)的公司一覽

      A股數(shù)據(jù)表
      2026-03-08 06:00:03
      《逐玉》ai換臉僵硬出戲,連田曦薇也帶不動(dòng),原演員被換原因離譜

      《逐玉》ai換臉僵硬出戲,連田曦薇也帶不動(dòng),原演員被換原因離譜

      劇芒芒
      2026-03-07 14:00:04
      離譜!67億身價(jià)的宇樹科技王興興被扒在青藤相親,網(wǎng)友急了

      離譜!67億身價(jià)的宇樹科技王興興被扒在青藤相親,網(wǎng)友急了

      雷科技
      2026-03-07 15:42:00
      路虎攬勝回應(yīng)長(zhǎng)城汽車董事長(zhǎng)魏建軍道歉:真誠和擔(dān)當(dāng)是最好的代言,堅(jiān)持原創(chuàng),祝長(zhǎng)城汽車越來越好

      路虎攬勝回應(yīng)長(zhǎng)城汽車董事長(zhǎng)魏建軍道歉:真誠和擔(dān)當(dāng)是最好的代言,堅(jiān)持原創(chuàng),祝長(zhǎng)城汽車越來越好

      中國能源網(wǎng)
      2026-03-07 15:29:05
      越扒瓜越大!魯山舅舅與亡姐結(jié)婚再添猛料,遠(yuǎn)不止吃絕戶這么簡(jiǎn)單

      越扒瓜越大!魯山舅舅與亡姐結(jié)婚再添猛料,遠(yuǎn)不止吃絕戶這么簡(jiǎn)單

      夢(mèng)史
      2026-03-07 09:26:14
      花青素主要在藍(lán)莓的果皮里 科普中國發(fā)文:不建議大家買超大藍(lán)莓

      花青素主要在藍(lán)莓的果皮里 科普中國發(fā)文:不建議大家買超大藍(lán)莓

      中國能源網(wǎng)
      2026-03-06 17:53:07
      中捷女籃今夜打響!8日19點(diǎn)30分直播有變,全明星賽CCTV5直播

      中捷女籃今夜打響!8日19點(diǎn)30分直播有變,全明星賽CCTV5直播

      老吳說體育
      2026-03-08 09:38:02
      小時(shí)候課本上猛夸的3個(gè)歷史人物,長(zhǎng)大后才發(fā)現(xiàn):他們壞到骨子里

      小時(shí)候課本上猛夸的3個(gè)歷史人物,長(zhǎng)大后才發(fā)現(xiàn):他們壞到骨子里

      收藏大視界
      2026-03-07 18:11:42
      8年謎團(tuán)終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

      8年謎團(tuán)終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

      秋姐居
      2026-03-03 17:48:27
      16GB+1TB!新機(jī)官宣:3月10日,全面開售!

      16GB+1TB!新機(jī)官宣:3月10日,全面開售!

      科技堡壘
      2026-03-07 11:00:58
      為何關(guān)閉霍爾木茲海峽就能掐全球脖子?因?yàn)橐晾试褪侨澜缱詈玫?>
    </a>
        <h3>
      <a href=風(fēng)向觀察
      2026-03-06 21:31:15
      沒有人比五糧液更懂腦血栓

      沒有人比五糧液更懂腦血栓

      老斯基財(cái)經(jīng)
      2026-03-06 17:18:30
      遼寧鐵人球迷意難平!不僅因?yàn)?-3慘敗泰山,更是因?yàn)橐韵挛妩c(diǎn)!

      遼寧鐵人球迷意難平!不僅因?yàn)?-3慘敗泰山,更是因?yàn)橐韵挛妩c(diǎn)!

      田先生籃球
      2026-03-07 20:40:14
      饒毅:中國未來最大的挑戰(zhàn),是對(duì)待真理和自然的態(tài)度

      饒毅:中國未來最大的挑戰(zhàn),是對(duì)待真理和自然的態(tài)度

      霹靂炮
      2026-02-28 22:33:30
      2026-03-08 11:19:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
      11320文章數(shù) 116989關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      頭條要聞

      媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

      頭條要聞

      媒體:伊朗問題要注意普京的動(dòng)向 其在向美以喊話

      體育要聞

      塔圖姆298天走完這段路 只用27分鐘征服這座城

      娛樂要聞

      周迅新戀情曝光,李亞鵬等人已成過去

      財(cái)經(jīng)要聞

      油價(jià)要失控?

      汽車要聞

      華為乾崑全新激光雷達(dá)落地 鴻蒙智行同步技術(shù)升級(jí)

      態(tài)度原創(chuàng)

      本地
      數(shù)碼
      時(shí)尚
      旅游
      親子

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      數(shù)碼要聞

      我喜歡限制!黃仁勛:內(nèi)存等缺貨是好事 你們只能選擇最好的NVIDA GPU

      2026春夏一定要擁有的6只包,好看又百搭

      旅游要聞

      通訊丨海上棧橋連通發(fā)展路——中國企業(yè)助力莫桑比克旅游島基礎(chǔ)設(shè)施升級(jí)

      親子要聞

      12歲孩子腸癌晚期,腫瘤年輕化不是開玩笑!

      無障礙瀏覽 進(jìn)入關(guān)懷版