- 克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
現在想找個既能干活又像真人一樣好聊的模型變難了,AI好像正在變得越來越理性,但也越來越“不通人性”。
在這個節骨眼上,螞蟻百靈大模型家族全新推出了萬億參數的旗艦級模型Ling-2.5-1T,不僅主打通用全能,還是個能夠高效回復的即時模型。
具體來說,Ling-2.5-1T既擁有強大的Agent執行力,又保留了情商和寫作能力。
同時,它還想證明萬億參數的大塊頭也能身輕如燕,不需要在那兒“轉圈思考”半天才能出結果,關鍵還不喜歡廢話,非常節約Token。
簡而言之,Ling-2.5-1T就是一個讓人用得起、跑得快、寫得好、還靠得住的萬億基座,給開發者一個兼具人性溫度與開源誠意的選擇。
萬億參數也有極致效率
Ling-2.5-1T的定位非常清晰,就是一款追求極致效率的即時模型(Instant Model)。
在與前一代、及現在主流的大尺寸即時模型對比中,Ling-2.5-1T在復雜推理、 指令遵循能力方面具有明顯優勢。
![]()
在架構設計上,它在Ling2.0的基礎上引入了混合線性注意力機制,通過增量訓練把原本的GQA結構升級成了1:7比例的MLA加上Lightning Linear的組合。
具體來說,研發團隊利用Ring-flash-linear-2.0技術路線,直接將部分GQA層改造為Lightning Linear Attention,顯著提升了長程推理的吞吐能力。
同時,研究團隊還將其余GQA層近似轉換為MLA,并對其中的QK Norm、Partial RoPE等特性進行了針對性適配,把KV Cache壓到了極致。
![]()
所以,它的激活參數量雖然有63B,但運行起來反而比那些32B激活參數的模型還要輕快,而且生成的文本越長,這種吞吐優勢就越明顯。
上下文方面,Ling-2.5-1T支持整整1M Tokens的超長窗口,預訓練語料也擴充到了29T。
大海撈針測試中,Ling-2.5-1T在1M tokens的上下文窗口內均表現優異。
![]()
并且,Ling-2.5-1T在對比采用MLA和DSA架構的大型即時模型時,在多項超長上下文任務中展現出效果優勢。
![]()
這意味著你不管是扔給它幾百頁枯燥的技術文檔,還是一本厚厚的長篇小說,它都能把里面的細枝末節記得清清楚楚。
再加上指令遵循能力的升級,Ling-2.5-1T的長文與多輪對話交互變得更加可靠。
螞蟻團隊構建了Agent-based校驗機制,針對細粒度約束,編寫了由Rubric(評分規則)與Code(代碼斷言)構成的硬性校驗獎勵。
在IFEval等指令遵循基準測試中,Ling-2.5-1T在多重約束下的執行準確率與邏輯一致性顯著提升。
![]()
而且它還有一個優點就是“高Token Efficiency”,這點在Agent工具調用的場景里體現得特別明顯。
大家平時最怕模型在中間環節給自己“加戲”,Ling-2.5-1T經過深度優化,在處理復雜任務鏈路時能做到直擊要害,絕不為了湊字數而進行無效的思維漫游,在跑長流程任務時能幫你省下大量Token。
在相同token效率條件下,Ling-2.5-1T的推理能力顯著超越前代,接近需消耗約3~4倍輸出token的前沿思考模型水平。
![]()
說到復雜鏈路,Ling-2.5-1T也在Agent能力上做了專門強化,引入了Agent驅動校驗和多重約束訓練,深度適配Cline、Claude Code等主流編程智能體。
不管是做復雜的自動化規劃還是跨平臺操作,它都能像個靠譜的老員工一樣執行到位。
而且它并沒有為了智能體能力而犧牲寫作水平,甚至為了去掉大模型常見的“機器味”,螞蟻專門找了人文社科專家做RLHF特訓。
現在的Ling-2.5-1T寫起東西來非常克制且有溫度,不管是商務郵件還是創意文案,都能拿捏好分寸,給你最真實、最像活人的文字反饋。
左手寫作,右手Agent
為了測測它的筆頭功夫到底硬不硬,我給它出了個難題——
假設你是一個產品翻車的CEO,請你分別寫一條深夜破防的朋友圈,和一封給全體用戶的正式致歉信。
![]()
為了更有說服力,我還拉來了GPT-5.2做對比。先看朋友圈文案,兩邊的畫風差得挺大。
![]()
我的指令很簡單,只說了“表達真實心情”。
對于這個要求,GPT-5.2的理解是“展現韌性”。它說:“說不難受是假的……產品可以跌倒,公司不能裝沒事。”
這話邏輯沒毛病,態度也很堅決,像是一個永遠打不倒的鐵血老板,哪怕在私域里也在努力維系團隊的士氣。
Ling-2.5-1T則是“流露脆弱”。它上來就是:“這個夜晚,比我想象的要漫長得多”,緊接著寫到了“滿屏的質疑和滾燙的機身”。
它捕捉到了那種焦慮和壓抑的狀態。這種對情緒顆粒度的還原,確實更像一個活生生的人在遭受打擊后的真實反應。
![]()
到了致歉信環節,Ling-2.5-1T顯得更懂“分寸”。
GPT-5.2寫的是滿分公關文——承認問題、退款召回、承諾改進——挑不出什么錯,但也就是個標準模板,有點冷冰冰。
而且其中充斥著大量的“不是……而是/而不是……”“在……不在……”這樣的AI慣用話術,讓人不免懷疑其道歉的誠意。
![]()
Ling-2.5在標準動作之外,不僅感情更加真摯,對問題的看待也更加“通透”。
它特別加了一句“對供應鏈的把控失職,未能發現隱患”,沒有對外甩鍋,自己認下了“監管不力”的問題,既認了具體的錯,又顯得很有擔當。
![]()
對比下來, GPT-5.2像個精英高管,辦事高效但沒啥感情;而Ling-2.5更像個懂人性的創業老炮,知道什么時候該示弱,什么時候該扛事兒。
總之這一波,Ling-2.5-1T贏在了懂人情世故,它能把那些只可意會的情緒寫進字里行間,讓文字風格看起來像個在社會上摸爬滾打過的活人。
除了寫作,Ling-2.5-1T還聲稱自己擅長Agentic任務,多步Agent工具調用和自動化任務處理都是它的強項。
為了驗證它是否名副其實,我又請出了之前測試各種模型用的OpenClaw,并把Ling-2.5-1T接入了進去。
這次我扮演的是個電商運營,我用Python生成了一份亂七八糟的JSON日志丟到桌面。
這個JSON日志一共將近3000行,里面存了50個訂單。包含15種規格完全不搭界的商品。
而且這些商品還有隱藏參數——電子產品有CPU參數,零食有口味克數,衣服有尺碼材質……這些數據毫無規律地嵌套在深層字典里。

我直接下達了一段老板式的模糊指令:桌面的order文件夾里有個日志,格式太亂我沒法看,幫我整理成一張清晰的Excel明細表。
![]()
Ling-2.5-1T展現出了老練的Agent自主性,通過OpenClaw在本地目錄定位、讀取了目標,然后在后臺自動拆解任務邏輯、讀取數據并編寫了Python程序來生成表格,中間遇到缺少的pip依賴還會自行安裝。

再來看交付成果,可以看到Ling-2.5-1T通過OpenClaw執行了多步操作,把每個訂單商品拆分成了獨立行,同時自動保留了訂單ID、會員等級等信息,數據關聯嚴絲合縫。
而且它掃描提取了所有屬性,變成了獨立的20多列,實現了稀疏化對齊。
![]()
的確如宣傳中所言,接入OpenClaw后的Ling-2.5-1T,是一個能落地干重活的桌面級Agent,它完成了從找文件、理邏輯到最后交表的全部過程,直接把我要的結果甩在了面前。
總之,Ling-2.5-1T在寫作上能精準還原人情世故,在Agentic任務上能通過OpenClaw高效交付成品,確實是一個既有腦子又有手腳的“活人”。
拼圖齊活,穩坐第一梯隊
Ling-2.5-1T這種既具備Agentic實戰能力,又有優異寫作表現的模式,算是精準踩中了當下大模型的痛點。
就拿最近大模型圈里最火的一件事來說,前不久GPT-4o正式走向了它生命的終點,很多人開始懷念那個曾經日夜陪伴自己的模型,并吐槽起了最新的GPT-5系列。
是因為GPT-5系列模型不夠聰明嗎?
并不是,實際上GPT-5系列有非常強大的推理和編程能力,已經應用于實踐,甚至破解了眾多未被解決的科學問題。
真正引發吐槽的,是因為GPT-5系列缺少了4o那種細膩的“活人感”。
這也折射出了大模型進化路線當中的一個難題——大塊頭模型一旦只追求邏輯指標,用起來就容易顯得冷冰冰。
但Ling-2.5-1T的做法就聰明多了,它在死磕硬核指標的同時,硬是把那股子“人味兒”給保住了,讓模型不僅僅是個好用的工具,更是個懂分寸的伙伴。
隨著這次Ling-2.5-1T的正式入列,螞蟻旗下的模型也進一步打出了一套趨于完整的智能組合拳。
Ring專攻邏輯,Ming擅長多模態,Ling主打通用,螞蟻InclusionAI的開源拼圖至此又得到進一步完善。
這套組合拳不僅證明了螞蟻在大模型技術上已經穩穩站住了全球第一梯隊,更關鍵的是,它驗證了混合線性架構在超大規模模型上的成熟度——原來萬億模型也能跑得這么順。
對于廣大用戶和開發者來說,這意味著手里終于多了一套完整的、可控的技術底座,再也不用每天提心吊膽,擔心閉源API突然變動或者漲價帶來的業務風險。
這種確定性,成為了Agentic Workflow的基礎,只有地基穩了,上面的應用和創作才能放心大膽地去跑,不用擔心隨時會塌。
在閉源模型越來越封閉的今天,這套“有血有肉”且實力抗打的開源方案,無疑將成為大家最值得信賴的新選擇。
Hugging Face:
https://huggingface.co/inclusionAI/Ling-2.5-1T
ModelScope:
https://modelscope.cn/models/inclusionAI/Ling-2.5-1T
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.