![]()
編輯|杜偉、冷貓
Agent 終于要告別「單打獨斗」,迎來二階段進化了嗎?
就在今天凌晨,月之暗面正式發布并開源了 Kimi 系列最新一代旗艦模型 ——Kimi K2.6,距離上個版本 K2.5 推出還不到 3 個月的時間。發出來之后熱度非常高,官推瀏覽量已經達到 400 萬。
![]()
當前的 Agent 在處理復雜工程項目時往往力不從心,雖然它們擅長獨立完成特定任務,但團隊協作還有所欠缺。如何突破這一局限,成為 Kimi K2.6 的核心目標。
新版本探索了如何激發 Agent 的團隊協作能力:進一步加強 K2.5 引入的 Agent Swarm(Agent 集群)功能,通過對 OpenClaw 等框架的適配強化 Agent 主動式工作,全新的 Claw Group(Claw 群組)又補上了組織協作這一能力。這一整套能力的系統性疊加,構建起了一個更接近人類團隊的 AI 系統。
要實現這一切,底層模型必須足夠強大。此次,Kimi K2.6 在通用 Agent、代碼、看圖理解這些核心能力上都有明顯進步。像人類最后的考試(Humanity's Last Exam)、貼近真實開發場景的 SWE-Bench Pro 以及考察 Agent 深度檢索能力的 DeepSearchQA 測試,K2.6 都穩穩領先競爭對手。
即使將 K2.6 與 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro 這些閉源模型放在一起看,它也完全不虛,甚至有些指標還能壓一頭。
![]()
大模型評測平臺 Artificial Analysis 給出最新結果,「Kimi K2.6 成為開源模型新王」!
![]()
在上線 Kimi K2.6 之后,大模型聚合平臺 OpenRouter 給出了頗高評價,認為月之暗面新一代模型主打長時序編程能力,專為需要持續執行的 Agent 場景打造。相比傳統聊天機器人,它更像一個「系統工程師」,能把復雜任務拆解開來,一步步執行,并在過程中不斷優化。
![]()
有網友感嘆,這代 Kimi 旗艦模型強到離譜,寫代碼這塊已經可以跟 GPT-5.4 掰手腕了,價格又比 Opus 4.7 低一大截,還是開源、免費用。現在基本每隔幾個月,都會有一個新的開源模型逼近閉源 GPT 和 Claude。「感覺開源模型真的追上來了,而且都是中國在推進節奏。」
![]()
12 個小時連軸轉、300 個 Agent 同時開工
Agent 終極形態來了?
此次,Kimi K2.6 在編程領域繼續發力。幾天前,海外還在熱議低調上線的 Kimi K2.6-Code-Preview,并對 K2.6 正式版充滿期待。
![]()
作為 Kimi 系列編程能力迄今最強的模型,Kimi K2.6 的長程編碼能力實現了突破,有助于將軟件開發的自動化推向更深層次的工程環節。
比如,Kimi K2.6 可以在 Mac 本地順利下載 Qwen3.5-0.8B 并跑起來。它沒有走常見技術棧,直接用小眾的 Zig 語言重寫推理流程并持續優化,這一步本身就體現了模型的泛化能力。
整個過程持續了 12 個多小時,期間調用工具超過 4000 次,前后迭代 14 輪。隨著不斷調參和重構,推理速度從最初的約 15 tokens/s 一路躍升到約 193 tokens/s,最終比本地大模型聊天應用 LM Studio 還快了大約 20%。
![]()
接下來到了 Kimi K2.6 此次升級的重心,其延續并進一步強化了 Agent 集群的協同輸出能力。簡單來說,該功能是要把「Agent 怎么一起干活」這件事理順。
現在能做到什么程度呢?K2.6 把一個復雜任務自動拆開,分配給不同專長的 Agent,讓它們各自處理搜索、深度調研、文檔分析、長文寫作等環節,再把結果拼接起來繼續往下推進。
在這樣一套機制下,一次運行就能完成整條鏈路:從原始資料、網頁內容,再到 PPT 和表格,全部自動生成,中間不需要來回切工具,也不需要人手動接力。
同時,Agent 集群的底層架構也做了擴展,最多可以同時調度 300 個子 Agent,完成 4000 步協作,并行能力直接被拉到了一個新量級。規模上來之后,AI 的角色也變了:開始接管整個流程,并直接給出成體系的結果。
![]()
Agent 集群將一篇高密度視覺數據的天體物理論文拆解復用,生成了約 7000 字研究報告、2 萬條數據集和 14 張圖表。
為了讓 AI 進化為一個全天候不間斷、無需人工干預的賽博員工,Kimi K2.6 對 OpenClaw、Hermes Agent 等框架做了更加深入的適配
為此,Kimi K2.6 進一步壓榨模型的自主執行能力:無論是 API 調用的精準度、長時間運行的穩定性,還是執行復雜研究任務時的安全防護,K2.6 都表現得可圈可點。
在 Vibe Coding 方面,Kimi K2.6 的網站設計更加出彩。K2.6 生成的網站尤其是首屏區,一眼望上去有很大的視覺沖擊力,風格的一致性也保持得不錯。并且,各種交互元素與滾動特效等細節的加入,也能吸引用戶停留更長時間。
除了前端設計,此次 Kimi K2.6 還給后端開發人員帶來了驚喜,它上線了 Kimi 賬戶登錄和表單信息收集功能。你可以用它創建一個活動報名頁面,并輕松查看后端報名信息。如此一來,前后端銜接更加順暢。
![]()
目前,Kimi K2.6 已成為 Kimi 網頁版、App 和 Kimi Code 編程助手的默認模型,趕緊用起來。
一手實測,秀翻全場
話不多說,我們直接上手實測一些案例,看看效果如何。
測試第一 Part 選用「K2.6 Agent」,從實用和美學兩個維度出發,看看它能不能做出一些足夠抓眼的前端效果。
![]()
有人喜歡《女神異聞錄 5》嗎?
這是一種極具辨識度的藝術風格,是一場披著漫畫外衣的視覺暴力美學。它用極度不規整的設計挑戰審美慣性,將「反抗社會平庸」的主題直接刻進了像素和線條里。完美融合了平面設計與 3D 空間,讓漫畫符號和視覺表達深度融合。
如果,我們開一家 P5 風格的小酒館,主頁會是什么樣的呢?
![]()
Demo鏈接:https://umxz7lursh26i.beta-ok.kimi.link/
我們發現,在構建前端網頁的過程中,Kimi K2.6 智能體會進行充分的測試,甚至模擬點擊操作:
![]()
另外,我們做了個小彩蛋,讓 Kimi K2.6 參考《女神異聞錄 5 皇家版》的開場視頻,完全不提供任何素材,做了一小段動畫效果。
![]()
![]()
我們繼續提需求,這次是另一種風格的前端設計:「為電商平臺設計一個富有視覺沖擊力的首頁,頂部導航欄包含品牌標識、搜索框、購物車、登錄 / 注冊按鈕,主橫幅(Hero Section)展示平臺的主要促銷活動、熱銷商品或季節性優惠,在 Hero Section 下方展示推薦商品或類別,在首頁底部或者某個顯眼區域展示一些精選商品的用戶評價。」
一次生成,就實現了超高完成度的首頁。雖說略有些瑕疵,但我們相信一些小問題經過一次迭代就能修復,瑕不掩瑜。
![]()
我們接著實測了 K2.6 Agent 集群的功能,為斯坦福大學《2026 年人工智能指數報告》制作了宣傳冊,要求其交付網頁、表格和 PPT,并且完全沒有給予任何附加信息和文檔,考驗智能體集群相互寫作的性能。
我們注意到,每個智能體有各自的工牌、職能說明和簡介。使用 Agent 集群的時候,你真的會像一個運籌帷幄的董事長,調動手下一切人力資源,知人善任,瞬間打造一個工作小組,為你全自動地執行任務。就差把「靠譜」寫在工牌上了。
![]()
最終輸出了我們需要的全部內容,金光閃閃的網頁,高效排版的 PPT,以及嚴肅的數據表。
![]()
![]()
![]()
多智能體協作的未來已來?
上述一系列測試,讓我們看到了 Kimi K2.6 作為 Agent 時代「基座模型」的強大實力。
在 OpenClaw 掀起的「龍蝦熱」持續升溫的當下,全新登場的 Claw 群組又為智能體下一階段的演進指出了一種清晰的路徑。
![]()
目前,Claw 群組已經開啟小范圍內測。
這一功能標志著智能體協作進入了一個全新的時代。你可以接入運行在本地、手機或云端的各種 Agent,它們各自帶著工具、技能和記憶進場,在一個「群組」里共同推進任務。
在這里面,K2.6 更像一個調度的人:誰擅長檢索、誰負責分析、誰來產出內容,它會按能力去分工。如果哪個環節卡住了,它也能及時發現,重新拆任務、換人接手,讓流程繼續走下去。
想象一下,當你需要準備一份復雜的匯報或是開發一個多層次的項目,Claw 群組的智能體們將像一群專業人士一樣,在群聊中討論、對接、調整,最終呈現給你一份精準、完備的成果。
這一創新不僅突破了傳統的個體智能體執行模式,更推動了組織智能的前進。它的出現,讓「多個 AI 智能體一起干活」這件事更接近現實。
文中視頻鏈接:https://mp.weixin.qq.com/s/LlVYoy1As2Zl7py_MqlBpQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.