月之暗面(Moonshot AI)Kimi再次出招。
4月20日深夜,Kimi發布并開源Kimi K2.6模型。據其介紹,該模型具備行業領先(state-of-the-art)的代碼能力、長程任務執行能力與Agent(智能體)集群能力。
K2.6延續了上一代K2.5的技術路線,在編碼與智能體能力上進一步升級。其Agent集群調度能力實現量級突破,最高可支持300個子Agent并行完成4000個協作步驟,大幅提升了在復雜長流程任務中的處理效率。
當前,大模型產業的競爭焦點正從“通用對話能力”轉向長周期、多工具協同的真實工作流落地,模型的長時間穩定工作能力正成為核心賽點。
此前3月,月之暗面創始人楊植麟在2026年中關村論壇年會全體會議上指出,大模型的本質是將能源轉化為智能,規模化是AI發展的核心基礎,但規模化并非暴力堆砌算力與能源,而是以提升效率為核心。對此,Kimi圍繞三大方向構建規模化策略:Token(詞元)效率、長上下文、Agent集群,力求在有限資源下實現智能最大化。
支持13小時不間斷編碼,5天自主運行,深度檢索能力超越GPT-5.4
從多項權威基準測試結果來看,K2.6在通用智能體、編程、視覺智能三大方向上均有提升。
在博士級難度的“人類最后的考試(Humanity's Last Exam)”全工具測試中,K2.6以54.0%的得分登頂。在評估Agent深度檢索能力的DeepSearchQA測評中,以92.5%的得分領先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外,在BrowseComp、OSWorld-Verified等智能體測評中,Kimi K2.6均展現出行業前列的成績。
![]()
圖片來源:月之暗面官方微信號
但與此同時,K2.6仍在部分維度與頭部閉源模型存在一定差距。SWE-bench多語言測試中,其得分略低于Claude Opus 4.6與Gemini 3.1 Pro。Toolathlon工具調度任務以及MathVision等視覺智能測評中,其表現與GPT-5.4也存在略微差距。
從本次K2.6能力提升的方向來看,其核心價值更多體現在:開源生態中正演進出能夠勝任長周期、復雜任務的能力。而這一技術方向,也已成為當下國產大模型行業的共同選擇。
近月來,OpenClaw(俗稱“小龍蝦”)等自主Agent應用快速崛起。區別于傳統對話式交互,這類場景要求AI跨應用不間斷自主運行,主動完成任務規劃、代碼執行、跨平臺協同操作,對模型上下文承載、長期記憶連續性、多步驟推理穩定性均提出了更高要求。
針對自主Agent賽道,Kimi K2.6也增強了Agent的自主化執行能力,在OpenClaw、Hermes Agent等自動化任務場景表現突出。官方披露,其RL(Reinforcement Learning,強化學習)基礎設施團隊已基于K2.6 Agent實現連續5天不間斷自主穩定運行,充分驗證了長時工作可靠性。
楊植麟曾在發布K2.5時介紹其Agent集群能力:“在K2.5上,我們從單個Agent進化到了Agent集群,從單個專家進化成了一個專業團隊。”他具體解釋道:K2.5會創建并協調一大群專項Agent并行工作,這些專項Agent本質上都是K2.5的分身,各自承擔不同的角色和子任務,沒有任何預設規則,所有的角色分配和任務拆解都是由K2.5現場即時決定。
迭代至K2.6,Agent集群架構完成全面擴容升級:支持調度不同技能特長的Agent進行互補協作、組合各項能力。架構上擴展至最多300個子Agent并行完成4000個協作步驟(K2.5為最多100個分身,并行處理1500個步驟),實現了更大規模的并行化。
代碼能力作為本次迭代核心亮點,本次更新中,長程編碼能力的提升是主要突破:K2.6支持不間斷編碼13小時,完成超過4000行代碼的編寫或修改,覆蓋Rust、Go、Python等編程語言,以及前端、運維、性能優化等場景。通過代碼與視覺能力的深度融合,K2.6能夠交付專業級Web應用。
![]()
圖片來源:每經媒資庫
Kimi估值3個月已翻4倍 楊植麟能否開辟AGI工業化新賽道?
在2026年中關村論壇年會后,楊植麟表達了他對Agent的發展洞察。他認為,與傳統對話式AI“即時問答”不同,真正受用戶信賴的Agent必須具備長時間持續工作的能力,能夠承接更復雜的任務。這背后需要突破訓練難度、數據積累、上下文承載等多重技術瓶頸。
楊植麟指出,這種能力的突破將帶來生產力的指數級提升,Agent或將成為生產力的核心載體,其產生的Token(詞元)在一定程度上等價于GDP(國內生產總值),長期甚至可能讓現有GDP實現數倍增長。
《每日經濟新聞》記者(以下簡稱“每經記者”)注意到,這一技術洞察直接體現在Kimi近期的迭代節奏中。繼K2.5首次引入Agent集群概念后,Kimi開始在更基礎的架構層面展開探索。
今年3月發布的技術報告中,團隊對大模型核心結構的殘差連接進行了重新設計,讓每一層可選擇性關注此前各層的輸出。這一改進獲得了美國企業家馬斯克“令人印象深刻”的評價,以及OpenAI前研究副總裁Jerry Tworek“深度學習2.0要來了”的點評。
此外,楊植麟在中關村論壇年會上預測了大模型訓練的下一階段:“越來越多的研究工作將由AI主導。未來每個研究員將配備海量的Token,由AI自動合成新任務、構建新環境、定義最優獎勵函數,甚至自主探索全新網絡架構。在這一趨勢下,整個AI領域的研發速度將進一步加快。”
在技術快速演進的同時,Kimi在資本市場上得到了同步反饋。
市場知情人士此前向每經記者透露,3月14日Kimi估值已攀升至180億美元,3個月內翻了4倍,且新一輪10億美元融資正在推進中。不到3個月完成3輪融資,創下國內大模型連續融資紀錄,也讓Kimi成為國內估值最快突破百億美元的獨角獸企業。
估值上升的原因有兩方面。一方面,產品迭代與付費收入出現較快增長:2026年開年以來,K2.5模型、Kimi Claw先后上線并升級,適配多辦公平臺,帶動1月底以來20天收入超過2025年全年;Stripe數據顯示,其個人訂閱訂單1月環比增長8280%,2月再增長123.8%,進入全球榜單前十。另一方面,AGI賽道整體升溫,智譜、MiniMax港股上市后市值的上漲也為行業頭部玩家提供了估值支撐。
當前,AGI行業已從參數競賽轉向技術效率與落地能力的競爭,Agent時代的競爭規則正在被重新書寫,轉向如何做得更久、更穩、更完整。Kimi以技術演進為主線,在這一過程中逐步確立自身定位。而大模型競爭格局是否因此生變,仍有待觀察各廠商后續的迭代節奏與生態建設能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.