網易首頁 > 網易號 > 正文申請入駐

13小時編碼、5天自主運行！Kimi K2.6開源“硬剛”閉源巨頭，長程戰力能否撕開AGI工業化新賽道？

2026-04-22 14:51:33　來源: 每日經濟新聞

四川舉報

分享至

月之暗面（Moonshot AI）Kimi再次出招。

4月20日深夜，Kimi發布并開源Kimi K2.6模型。據其介紹，該模型具備行業領先（state-of-the-art）的代碼能力、長程任務執行能力與Agent（智能體）集群能力。

K2.6延續了上一代K2.5的技術路線，在編碼與智能體能力上進一步升級。其Agent集群調度能力實現量級突破，最高可支持300個子Agent并行完成4000個協作步驟，大幅提升了在復雜長流程任務中的處理效率。

當前，大模型產業的競爭焦點正從“通用對話能力”轉向長周期、多工具協同的真實工作流落地，模型的長時間穩定工作能力正成為核心賽點。

此前3月，月之暗面創始人楊植麟在2026年中關村論壇年會全體會議上指出，大模型的本質是將能源轉化為智能，規模化是AI發展的核心基礎，但規模化并非暴力堆砌算力與能源，而是以提升效率為核心。對此，Kimi圍繞三大方向構建規模化策略：Token（詞元）效率、長上下文、Agent集群，力求在有限資源下實現智能最大化。

支持13小時不間斷編碼，5天自主運行，深度檢索能力超越GPT-5.4

從多項權威基準測試結果來看，K2.6在通用智能體、編程、視覺智能三大方向上均有提升。

在博士級難度的“人類最后的考試（Humanity's Last Exam）”全工具測試中，K2.6以54.0%的得分登頂。在評估Agent深度檢索能力的DeepSearchQA測評中，以92.5%的得分領先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外，在BrowseComp、OSWorld-Verified等智能體測評中，Kimi K2.6均展現出行業前列的成績。

圖片來源：月之暗面官方微信號

但與此同時，K2.6仍在部分維度與頭部閉源模型存在一定差距。SWE-bench多語言測試中，其得分略低于Claude Opus 4.6與Gemini 3.1 Pro。Toolathlon工具調度任務以及MathVision等視覺智能測評中，其表現與GPT-5.4也存在略微差距。

從本次K2.6能力提升的方向來看，其核心價值更多體現在：開源生態中正演進出能夠勝任長周期、復雜任務的能力。而這一技術方向，也已成為當下國產大模型行業的共同選擇。

近月來，OpenClaw（俗稱“小龍蝦”）等自主Agent應用快速崛起。區別于傳統對話式交互，這類場景要求AI跨應用不間斷自主運行，主動完成任務規劃、代碼執行、跨平臺協同操作，對模型上下文承載、長期記憶連續性、多步驟推理穩定性均提出了更高要求。

針對自主Agent賽道，Kimi K2.6也增強了Agent的自主化執行能力，在OpenClaw、Hermes Agent等自動化任務場景表現突出。官方披露，其RL（Reinforcement Learning，強化學習）基礎設施團隊已基于K2.6 Agent實現連續5天不間斷自主穩定運行，充分驗證了長時工作可靠性。

楊植麟曾在發布K2.5時介紹其Agent集群能力：“在K2.5上，我們從單個Agent進化到了Agent集群，從單個專家進化成了一個專業團隊。”他具體解釋道：K2.5會創建并協調一大群專項Agent并行工作，這些專項Agent本質上都是K2.5的分身，各自承擔不同的角色和子任務，沒有任何預設規則，所有的角色分配和任務拆解都是由K2.5現場即時決定。

迭代至K2.6，Agent集群架構完成全面擴容升級：支持調度不同技能特長的Agent進行互補協作、組合各項能力。架構上擴展至最多300個子Agent并行完成4000個協作步驟（K2.5為最多100個分身，并行處理1500個步驟），實現了更大規模的并行化。

代碼能力作為本次迭代核心亮點，本次更新中，長程編碼能力的提升是主要突破：K2.6支持不間斷編碼13小時，完成超過4000行代碼的編寫或修改，覆蓋Rust、Go、Python等編程語言，以及前端、運維、性能優化等場景。通過代碼與視覺能力的深度融合，K2.6能夠交付專業級Web應用。

圖片來源：每經媒資庫

Kimi估值3個月已翻4倍楊植麟能否開辟AGI工業化新賽道？

在2026年中關村論壇年會后，楊植麟表達了他對Agent的發展洞察。他認為，與傳統對話式AI“即時問答”不同，真正受用戶信賴的Agent必須具備長時間持續工作的能力，能夠承接更復雜的任務。這背后需要突破訓練難度、數據積累、上下文承載等多重技術瓶頸。

楊植麟指出，這種能力的突破將帶來生產力的指數級提升，Agent或將成為生產力的核心載體，其產生的Token（詞元）在一定程度上等價于GDP（國內生產總值），長期甚至可能讓現有GDP實現數倍增長。

《每日經濟新聞》記者（以下簡稱“每經記者”）注意到，這一技術洞察直接體現在Kimi近期的迭代節奏中。繼K2.5首次引入Agent集群概念后，Kimi開始在更基礎的架構層面展開探索。

今年3月發布的技術報告中，團隊對大模型核心結構的殘差連接進行了重新設計，讓每一層可選擇性關注此前各層的輸出。這一改進獲得了美國企業家馬斯克“令人印象深刻”的評價，以及OpenAI前研究副總裁Jerry Tworek“深度學習2.0要來了”的點評。

此外，楊植麟在中關村論壇年會上預測了大模型訓練的下一階段：“越來越多的研究工作將由AI主導。未來每個研究員將配備海量的Token，由AI自動合成新任務、構建新環境、定義最優獎勵函數，甚至自主探索全新網絡架構。在這一趨勢下，整個AI領域的研發速度將進一步加快。”

在技術快速演進的同時，Kimi在資本市場上得到了同步反饋。

市場知情人士此前向每經記者透露，3月14日Kimi估值已攀升至180億美元，3個月內翻了4倍，且新一輪10億美元融資正在推進中。不到3個月完成3輪融資，創下國內大模型連續融資紀錄，也讓Kimi成為國內估值最快突破百億美元的獨角獸企業。

估值上升的原因有兩方面。一方面，產品迭代與付費收入出現較快增長：2026年開年以來，K2.5模型、Kimi Claw先后上線并升級，適配多辦公平臺，帶動1月底以來20天收入超過2025年全年；Stripe數據顯示，其個人訂閱訂單1月環比增長8280%，2月再增長123.8%，進入全球榜單前十。另一方面，AGI賽道整體升溫，智譜、MiniMax港股上市后市值的上漲也為行業頭部玩家提供了估值支撐。

當前，AGI行業已從參數競賽轉向技術效率與落地能力的競爭，Agent時代的競爭規則正在被重新書寫，轉向如何做得更久、更穩、更完整。Kimi以技術演進為主線，在這一過程中逐步確立自身定位。而大模型競爭格局是否因此生變，仍有待觀察各廠商后續的迭代節奏與生態建設能力。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.