網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

業(yè)界首個(gè)！螞蟻開源萬億參數(shù)混合線性思考模型，IMO金牌水平

2026-02-13 21:16:22　來源: 智東西

北京舉報(bào)

分享至

智東西
作者程茜
編輯李水青

智東西2月13日消息，今天，螞蟻集團(tuán)開源全球首個(gè)基于混合線性架構(gòu)的萬億參數(shù)思考模型Ring-2.5-1T。

根據(jù)官方信息，相比螞蟻2025年10月發(fā)布的萬億級(jí)思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和長(zhǎng)時(shí)程任務(wù)執(zhí)行能力三個(gè)關(guān)鍵維度上實(shí)現(xiàn)提升，且在長(zhǎng)文本生成、數(shù)學(xué)推理與智能體任務(wù)執(zhí)行上達(dá)到開源領(lǐng)先水平。

在生成效率上，Ring-2.5-1T在32K以上長(zhǎng)文本生成場(chǎng)景中，對(duì)比上代模型訪存規(guī)模降低至1/10，生成吞吐提升3倍以上。

在深度思考能力方面，該模型在國際數(shù)學(xué)奧林匹克競(jìng)賽（IMO 2025）和中國數(shù)學(xué)奧林匹克（CMO 2025）自測(cè)均達(dá)到金牌水平，IMO為35分、CMO為105分。

目前，該模型已經(jīng)適配Claude Code等智能體框架與OpenClaw個(gè)人AI助理，支持多步規(guī)劃與工具調(diào)用。

Ring-2.5-1T的模型權(quán)重與推理代碼已在Hugging Face、ModelScope等主流開源平臺(tái)發(fā)布，官方平臺(tái)Chat體驗(yàn)頁和API服務(wù)將在近期上線。

Hugging Face：https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape：https://modelscope.cn/organization/inclusionAI

一、拿下多項(xiàng)開源SOTA，達(dá)IMO金牌水平

為了評(píng)估Ring-2.5-1T的深度思考與長(zhǎng)時(shí)任務(wù)執(zhí)行能力，螞蟻研究人員選擇了具有代表性的開源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和閉源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作為比較。

螞蟻集團(tuán)公布的多項(xiàng)權(quán)威基準(zhǔn)測(cè)試結(jié)果顯示，Ring-2.5-1T在數(shù)學(xué)、編程和邏輯推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高難度推理任務(wù)以及Agent搜索、工具調(diào)用和軟件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等長(zhǎng)時(shí)任務(wù)執(zhí)行方面均實(shí)現(xiàn)了最先進(jìn)的開源性能。

此外，螞蟻還對(duì)深度思考（Heavy Thinking）模式下的模型性能進(jìn)行了額外測(cè)試，Ring-2.5-1T在IMOAnswerBench、HMMT-25等數(shù)學(xué)競(jìng)賽推理基準(zhǔn)和LiveCodeBench-v6代碼生成基準(zhǔn)中超越所有對(duì)比模型。

其中，在IMO 2025（滿分42分）中，Ring-2.5-1T獲得35分，達(dá)到金牌水平；在CMO 2025（滿分126分）中，該模型獲得105分，超過金牌分?jǐn)?shù)線78分和國家隊(duì)集訓(xùn)隊(duì)選拔線87分。

研究人員比較了Ring-2.5-1T和Ring-1T的答案發(fā)現(xiàn)，前者在推理邏輯的嚴(yán)謹(jǐn)性、高級(jí)數(shù)學(xué)證明技術(shù)的應(yīng)用以及答案表述的完整性方面均有提升。

在智能體搜索任務(wù)Gaia2-search中，Ring-2.5-1T在開源模型中取得了SOTA性能。Gaia2環(huán)境強(qiáng)調(diào)跨應(yīng)用工具協(xié)作和復(fù)雜任務(wù)執(zhí)行能力，Ring-2.5-1T在規(guī)劃生成和多步工具調(diào)用方面均展現(xiàn)出較高的效率和準(zhǔn)確性。

二、三大關(guān)鍵維度提升，能快速適配Claude Code、OpenClaw

相比螞蟻2025年10月發(fā)布的萬億級(jí)思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和長(zhǎng)時(shí)程任務(wù)執(zhí)行能力三個(gè)關(guān)鍵維度上有顯著改進(jìn)。

首先在生成效率方面，通過采用高比例線性注意力機(jī)制，Ring-2.5-1T將內(nèi)存訪問開銷降低至1/10，并將超過32K token序列的生成吞吐量提高了3倍以上，適用于深度思考和長(zhǎng)時(shí)程任務(wù)執(zhí)行。

其次在深度思考層面，該模型在RLVR（基于可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)）基礎(chǔ)上引入密集獎(jiǎng)勵(lì)機(jī)制，為推理過程提供嚴(yán)格性反饋，使Ring-2.5-1T同時(shí)達(dá)到IMO 2025和CMO 2025（自測(cè)）的金獎(jiǎng)水平。

最后是長(zhǎng)程任務(wù)執(zhí)行，Ring-2.5-1T通過大規(guī)模完全異步智能體RL（強(qiáng)化學(xué)習(xí)）訓(xùn)練，增強(qiáng)了解決復(fù)雜任務(wù)的長(zhǎng)時(shí)程自主執(zhí)行能力，使其能快速適配Claude Code等智能體編程框架和OpenClaw個(gè)人AI助手。

三、引入混合線性注意力架構(gòu)，可提升長(zhǎng)程推理場(chǎng)景吞吐量

Ring-2.5-1T基于Ling 2.5架構(gòu)，通過優(yōu)化注意力機(jī)制，可提升長(zhǎng)文本推理的效率與穩(wěn)定性。

作為實(shí)現(xiàn)自主模型架構(gòu)的關(guān)鍵進(jìn)展，Ling 2.5架構(gòu)在Ling 2.0架構(gòu)的基礎(chǔ)上引入了一種混合線性注意力架構(gòu)。通過增量訓(xùn)練，研究人員將Ling 2.0架構(gòu)中的GQA（分組查詢注意力）升級(jí)為MLA（多頭線性注意力）+Lightning Linear結(jié)構(gòu)的1:7比例。

具體來說，基于其先前發(fā)布的Ring-flash-linear-2.0技術(shù)路線圖，研究人員將部分GQA層轉(zhuǎn)換為L(zhǎng)ightning Linear注意力，以提升長(zhǎng)時(shí)程推理場(chǎng)景中的吞吐量。

同時(shí)為了進(jìn)一步壓縮KV緩存，研究人員將剩余的GQA層近似轉(zhuǎn)換為MLA，同時(shí)針對(duì)QK Norm（查詢-核歸一化）和Partial RoPE（部分旋轉(zhuǎn)位置編碼）等特征進(jìn)行針對(duì)性改進(jìn)，從而增強(qiáng)Ling 2.5架構(gòu)的表達(dá)能力。

在此基礎(chǔ)上，模型激活參數(shù)規(guī)模從前代的51B提升至63B，并且在混合線性注意力架構(gòu)的支持下，其推理效率相比Ling 2.0仍實(shí)現(xiàn)大幅提升。

與僅具備32B激活參數(shù)的Kimi K2架構(gòu)相比，在1T總參數(shù)量下，Ling 2.5架構(gòu)在長(zhǎng)序列推理任務(wù)中的吞吐表現(xiàn)優(yōu)勢(shì)顯著，且隨著生成長(zhǎng)度增加，效率優(yōu)勢(shì)持續(xù)擴(kuò)大。

▲在一臺(tái)配備8塊H20-3e GPU的機(jī)器上，批處理大小=64，比較不同生成長(zhǎng)度下的解碼吞吐量

▲在一臺(tái)配備8塊H200 GPU的機(jī)器上，批處理大小=64，比較不同生成長(zhǎng)度下的解碼吞吐量

結(jié)語：從短對(duì)話到復(fù)雜規(guī)劃，大模型需突破長(zhǎng)文本瓶頸

隨著AI大模型應(yīng)用從短對(duì)話向長(zhǎng)文檔處理、跨文件代碼理解、復(fù)雜任務(wù)規(guī)劃等場(chǎng)景擴(kuò)展，Ring-2.5-1T可以緩解模型在長(zhǎng)輸出場(chǎng)景下計(jì)算開銷高、推理速度慢的問題。

此前，傳統(tǒng)架構(gòu)在面對(duì)超長(zhǎng)文本、多模態(tài)內(nèi)容、復(fù)雜業(yè)務(wù)流程時(shí)，普遍面臨算力成本高、響應(yīng)延遲大、部署難度高等問題，螞蟻百靈團(tuán)隊(duì)此次通過底層架構(gòu)創(chuàng)新，或?yàn)樾袠I(yè)提供一條兼顧性能、成本與擴(kuò)展性的技術(shù)路徑。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.