網易首頁 > 網易號 > 正文申請入駐

單Agent時代正式結束：一個干不過，就上300個

2026-04-21 18:46:39　來源: 機器之心Pro

北京舉報

分享至

編輯｜杜偉、冷貓

Agent 終于要告別「單打獨斗」，迎來二階段進化了嗎？

就在今天凌晨，月之暗面正式發布并開源了 Kimi 系列最新一代旗艦模型 ——Kimi K2.6，距離上個版本 K2.5 推出還不到 3 個月的時間。發出來之后熱度非常高，官推瀏覽量已經達到 400 萬。

當前的 Agent 在處理復雜工程項目時往往力不從心，雖然它們擅長獨立完成特定任務，但團隊協作還有所欠缺。如何突破這一局限，成為 Kimi K2.6 的核心目標。

新版本探索了如何激發 Agent 的團隊協作能力：進一步加強 K2.5 引入的 Agent Swarm（Agent 集群）功能，通過對 OpenClaw 等框架的適配強化 Agent 主動式工作，全新的 Claw Group（Claw 群組）又補上了組織協作這一能力。這一整套能力的系統性疊加，構建起了一個更接近人類團隊的 AI 系統。

要實現這一切，底層模型必須足夠強大。此次，Kimi K2.6 在通用 Agent、代碼、看圖理解這些核心能力上都有明顯進步。像人類最后的考試（Humanity's Last Exam）、貼近真實開發場景的 SWE-Bench Pro 以及考察 Agent 深度檢索能力的 DeepSearchQA 測試，K2.6 都穩穩領先競爭對手。

即使將 K2.6 與 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro 這些閉源模型放在一起看，它也完全不虛，甚至有些指標還能壓一頭。

大模型評測平臺 Artificial Analysis 給出最新結果，「Kimi K2.6 成為開源模型新王」！

在上線 Kimi K2.6 之后，大模型聚合平臺 OpenRouter 給出了頗高評價，認為月之暗面新一代模型主打長時序編程能力，專為需要持續執行的 Agent 場景打造。相比傳統聊天機器人，它更像一個「系統工程師」，能把復雜任務拆解開來，一步步執行，并在過程中不斷優化。

有網友感嘆，這代 Kimi 旗艦模型強到離譜，寫代碼這塊已經可以跟 GPT-5.4 掰手腕了，價格又比 Opus 4.7 低一大截，還是開源、免費用。現在基本每隔幾個月，都會有一個新的開源模型逼近閉源 GPT 和 Claude。「感覺開源模型真的追上來了，而且都是中國在推進節奏。」

12 個小時連軸轉、300 個 Agent 同時開工

Agent 終極形態來了？

此次，Kimi K2.6 在編程領域繼續發力。幾天前，海外還在熱議低調上線的 Kimi K2.6-Code-Preview，并對 K2.6 正式版充滿期待。

作為 Kimi 系列編程能力迄今最強的模型，Kimi K2.6 的長程編碼能力實現了突破，有助于將軟件開發的自動化推向更深層次的工程環節。

比如，Kimi K2.6 可以在 Mac 本地順利下載 Qwen3.5-0.8B 并跑起來。它沒有走常見技術棧，直接用小眾的 Zig 語言重寫推理流程并持續優化，這一步本身就體現了模型的泛化能力。

整個過程持續了 12 個多小時，期間調用工具超過 4000 次，前后迭代 14 輪。隨著不斷調參和重構，推理速度從最初的約 15 tokens/s 一路躍升到約 193 tokens/s，最終比本地大模型聊天應用 LM Studio 還快了大約 20%。

接下來到了 Kimi K2.6 此次升級的重心，其延續并進一步強化了 Agent 集群的協同輸出能力。簡單來說，該功能是要把「Agent 怎么一起干活」這件事理順。

現在能做到什么程度呢？K2.6 把一個復雜任務自動拆開，分配給不同專長的 Agent，讓它們各自處理搜索、深度調研、文檔分析、長文寫作等環節，再把結果拼接起來繼續往下推進。

在這樣一套機制下，一次運行就能完成整條鏈路：從原始資料、網頁內容，再到 PPT 和表格，全部自動生成，中間不需要來回切工具，也不需要人手動接力。

同時，Agent 集群的底層架構也做了擴展，最多可以同時調度 300 個子 Agent，完成 4000 步協作，并行能力直接被拉到了一個新量級。規模上來之后，AI 的角色也變了：開始接管整個流程，并直接給出成體系的結果。

Agent 集群將一篇高密度視覺數據的天體物理論文拆解復用，生成了約 7000 字研究報告、2 萬條數據集和 14 張圖表。

為了讓 AI 進化為一個全天候不間斷、無需人工干預的賽博員工，Kimi K2.6 對 OpenClaw、Hermes Agent 等框架做了更加深入的適配

為此，Kimi K2.6 進一步壓榨模型的自主執行能力：無論是 API 調用的精準度、長時間運行的穩定性，還是執行復雜研究任務時的安全防護，K2.6 都表現得可圈可點。

在 Vibe Coding 方面，Kimi K2.6 的網站設計更加出彩。K2.6 生成的網站尤其是首屏區，一眼望上去有很大的視覺沖擊力，風格的一致性也保持得不錯。并且，各種交互元素與滾動特效等細節的加入，也能吸引用戶停留更長時間。

除了前端設計，此次 Kimi K2.6 還給后端開發人員帶來了驚喜，它上線了 Kimi 賬戶登錄和表單信息收集功能。你可以用它創建一個活動報名頁面，并輕松查看后端報名信息。如此一來，前后端銜接更加順暢。

目前，Kimi K2.6 已成為 Kimi 網頁版、App 和 Kimi Code 編程助手的默認模型，趕緊用起來。

一手實測，秀翻全場

話不多說，我們直接上手實測一些案例，看看效果如何。

測試第一 Part 選用「K2.6 Agent」，從實用和美學兩個維度出發，看看它能不能做出一些足夠抓眼的前端效果。

有人喜歡《女神異聞錄 5》嗎？

這是一種極具辨識度的藝術風格，是一場披著漫畫外衣的視覺暴力美學。它用極度不規整的設計挑戰審美慣性，將「反抗社會平庸」的主題直接刻進了像素和線條里。完美融合了平面設計與 3D 空間，讓漫畫符號和視覺表達深度融合。

如果，我們開一家 P5 風格的小酒館，主頁會是什么樣的呢？

Demo鏈接：https://umxz7lursh26i.beta-ok.kimi.link/

我們發現，在構建前端網頁的過程中，Kimi K2.6 智能體會進行充分的測試，甚至模擬點擊操作：

另外，我們做了個小彩蛋，讓 Kimi K2.6 參考《女神異聞錄 5 皇家版》的開場視頻，完全不提供任何素材，做了一小段動畫效果。

我們繼續提需求，這次是另一種風格的前端設計：「為電商平臺設計一個富有視覺沖擊力的首頁，頂部導航欄包含品牌標識、搜索框、購物車、登錄 / 注冊按鈕，主橫幅（Hero Section）展示平臺的主要促銷活動、熱銷商品或季節性優惠，在 Hero Section 下方展示推薦商品或類別，在首頁底部或者某個顯眼區域展示一些精選商品的用戶評價。」

一次生成，就實現了超高完成度的首頁。雖說略有些瑕疵，但我們相信一些小問題經過一次迭代就能修復，瑕不掩瑜。

我們接著實測了 K2.6 Agent 集群的功能，為斯坦福大學《2026 年人工智能指數報告》制作了宣傳冊，要求其交付網頁、表格和 PPT，并且完全沒有給予任何附加信息和文檔，考驗智能體集群相互寫作的性能。

我們注意到，每個智能體有各自的工牌、職能說明和簡介。使用 Agent 集群的時候，你真的會像一個運籌帷幄的董事長，調動手下一切人力資源，知人善任，瞬間打造一個工作小組，為你全自動地執行任務。就差把「靠譜」寫在工牌上了。

最終輸出了我們需要的全部內容，金光閃閃的網頁，高效排版的 PPT，以及嚴肅的數據表。

多智能體協作的未來已來？

上述一系列測試，讓我們看到了 Kimi K2.6 作為 Agent 時代「基座模型」的強大實力。

在 OpenClaw 掀起的「龍蝦熱」持續升溫的當下，全新登場的 Claw 群組又為智能體下一階段的演進指出了一種清晰的路徑。

目前，Claw 群組已經開啟小范圍內測。

這一功能標志著智能體協作進入了一個全新的時代。你可以接入運行在本地、手機或云端的各種 Agent，它們各自帶著工具、技能和記憶進場，在一個「群組」里共同推進任務。

在這里面，K2.6 更像一個調度的人：誰擅長檢索、誰負責分析、誰來產出內容，它會按能力去分工。如果哪個環節卡住了，它也能及時發現，重新拆任務、換人接手，讓流程繼續走下去。

想象一下，當你需要準備一份復雜的匯報或是開發一個多層次的項目，Claw 群組的智能體們將像一群專業人士一樣，在群聊中討論、對接、調整，最終呈現給你一份精準、完備的成果。

這一創新不僅突破了傳統的個體智能體執行模式，更推動了組織智能的前進。它的出現，讓「多個 AI 智能體一起干活」這件事更接近現實。

文中視頻鏈接：https://mp.weixin.qq.com/s/LlVYoy1As2Zl7py_MqlBpQ

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.