2026年1月27日,月之暗面正式開源Kimi K2.5模型,創始人楊植麟親自出鏡解讀,宣稱這是“迄今為止最強大的開源模型”。不同于傳統堆參數的路線,K2.5主打原生多模態與智能體集群架構,基于1萬億參數的MoE基礎,融合約15萬億個“視覺+文本”混合Token預訓練,在SWE-Bench Verified編程測試中拿下76.8分,不僅碾壓DeepSeek V3.2,更逼近GPT-5.2水平,而運行成本僅為后者的幾分之一
![]()
K2.5的核心突破在于“視覺智能體智能”(Visual Agentic Intelligence)。它不僅能原生理解視頻與圖片,還能通過PARL(并行智能體強化學習)技術,動態調度最多100個智能體并行工作,支持1500次工具調用。在處理“找出100個細分領域抖音頭部博主”這類任務時,傳統單體AI需數小時,而K2.5的Agent集群僅需幾分鐘,效率提升4.5倍甚至更高。這種“團隊思維”讓AI能自主拆解任務、應對子智能體失敗并重新調度,真正實現了復雜工作流的自動化。
在編程領域,K2.5實現了對傳統VLM的降維打擊。它支持“截圖即代碼”甚至“視頻轉代碼”,能理解頁面滾動動畫、卡片翻轉等動態交互邏輯,并具備視覺調試能力——生成代碼后會渲染頁面,若發現按鈕歪斜或顏色不符,會基于視覺反饋自動修正。實測中,K2.5成功復刻了《三體》主題網站、Mac OS界面及手勢切西瓜游戲,甚至能將錄屏視頻轉化為可交互網頁,大幅降低了前端開發門檻。
針對辦公場景,K2.5的Agent集群展現了強大的批量處理能力。例如處理30家公司的季度財報時,它能自動切換美股、港股、A股數據庫,對齊多源數據,并在數據缺失時誠實標注“未找到”,最終生成帶引用鏈的Excel;在文獻綜述任務中,40篇論文可被拆解為多個子任務,由不同Agent并行撰寫,最終匯總成100頁的專業PDF。此外,它還能處理高密度辦公任務,如在Word中添加注釋、用數據透視表構建金融模型,甚至批量轉換94個Obsidian文檔格式,辦公質量較前代提升近60%。
值得注意的是,K2.5在多項權威評測中登頂開源榜首:HLE(人類最后考試)得分50.2%,BrowseComp達74.9%,mniDocBench文檔理解測試獲88.8分。外網評價其為“開源SOTA推理+視覺+智能體編碼”的集大成者。目前,K2.5已在Hugging Face和魔搭社區開源,并上線Kimi Code編程工具,支持無縫集成VSCode、Cursor等IDE。
業內分析認為,K2.5的發布標志著AI從“單點工具”進化為“協作團隊”,其樸素的實用主義取向——如視覺調試、最后一公里的代碼部署、批量臟活處理——直擊行業痛點。對于開發者而言,角色正從“碼農”轉向“AI指揮官”,需掌握任務拆解與結果驗收能力;對于行業而言,小團隊借助K2.5可干成以往50人的工作,軟件迭代速度將從“按月”加速至“按天”,AGI的落地進程或將因此大幅提前。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.