<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Kimi K2.5來了:楊植麟親自站臺,還能分身出100個Agent!

      0
      分享至


      作者 | 王兆洋
      郵箱 | wangzhaoyang@pingwest.com

      沒坐在實木茶幾前,沒坐在沙發里,背景也沒有高雅的綠植映襯,月之暗面的CEO楊植麟在視頻里站著就發布了Kimi最新的模型K2.5。

      而且還是中英文雙語的。

      “Hi 大家好,我是植麟。”楊植麟說。“K2.5是我們目前最強大的模型,它是一個全能模型,不管是視覺還是文本,對話還是agent,思考還是非思考——所有這些能力,都集中在這一個模型里。重要的是,K2.5是一個開源模型。”

      顯然,一個瘋狂的模型集體更新季到來了。

      而即便如此,在諸多新發布的模型之間,月之暗面剛剛最新發布的Kimi K2.5依然區分度明顯。

      根據Kimi的數據,K2.5在包括HLE、BrowseComp 和 DeepSearchQA等極具挑戰性的 agent 評測中取得了當前最佳表現。在編程能力測試上,它在 SWE-bench Verified 上拿到了 76.8 分,縮小了與頂尖閉源模型之間的差距。多項視覺理解評測上也實現了當前最佳效果。


      在這些能力指標之外,更重要的是,K2.5是至今為止最能充分展現月之暗面特質的一代模型:

      這家公司一直被寄予厚望的是它的算法研究和產品創新能力,而這代更全面的模型充分展示了這家公司在研究和產品設計上很強的少年氣。

      1

      先看看K2.5的幾個核心特點:

      在模型具體單點的能力上,它終于有了視覺能力,可以基于視覺,包括圖片和視頻,進行理解和推理。同時它是一個all in one架構的模型,多模態和文本、思考和快速回答、代碼和agent能力都統一于一個模型一身。

      在月之暗面一直堅信的“模型即產品”思路之下,K2.5這次做了多個很有新意的功能封裝。

      它把視覺和編碼能力結合,把模型追求的few shots甚至zero shot能力直接體現在Kimi的產品上,你可以用更簡單的自然語言和更直觀的視覺編輯的方式,比如直接給他一個你要的產品的視頻,讓它拆解后還原復刻,比如直接在生成的UI上圈圈改改,就能完成創作和開發以及修改。

      官方給出的一個用視覺能力復刻項目的例子

      除了前端設計,伴隨K2.5,Kimi還推出了Kimi Code,可以在終端里直接運行,也能集成到 VSCode、Cursor 等主流編輯器中。你可以直接輸入圖片和視頻進行編程輔助,而且它還可以自動發現并將你現有的Skills遷移到新的工作流中。

      更亮眼的則是此次發布的但依然在beta階段的多agent能力。Kimi直接通過產品把模型訓練出來的“多agent平行與串行調度能力”封裝提供了出來:

      當你選擇Agent集群模式,模型開始給你打造一個專業團隊,100個agent集群可以同時并發,串行+并行來完成復雜任務。根據Kimi介紹,這些專項 agents 本質上都是 K2.5 的“分身”但各自承擔不同的角色和子任務。

      “沒有任何預設的規則,所有的角色分配和任務拆解,都由 K2.5 現場即時決定。”依然是模型通用能力最終大過垂直打造工作流的產品思路。

      目前Agent 集群功能正在進行 Beta 測試,部分 Kimi 會員可提前試用,接下來會逐漸推廣。

      而在這一切的底座上,在模型訓練方法以及AI技術演進的方向上楊植麟繼續完善著他scale to AGI的路線。

      在訓練上,Agent集群對模型提出新的要求,Kimi為此重構了強化學習的基建,專門優化了訓練算法,以確保它能達到極致的效率和性能。

      而從K1.5開始,每一代的模型其實都在Scale一個不同的方向,K1.5 是在 token上繼續Scale,到了agent能力增強的K2,重點scale 思考的步驟,而K2.5 則是對agent的規模,也就是多agent的共同協作能力做Scale,進而保持scale的可延續。

      “Scaling Out, Not Just Up.”

      2

      這次K2.5讓Kimi變成一個全面的模型,更難得的,是這些背后都有它自己思路清晰的創新思考。

      都說scaling law不持續,我就要給你延續下去,而且是一個又一個“新花樣”的延續。

      而且這些Scale的方向后來也都成為了模型研究界在那一階段的主流。此次的多agent其實再次把agent swarm擺到了大家面前,這個“agent蜂巢”的概念提了很久,這次Kimi用一個模型來把它展示出來,接下來如何提高高并發、大批量、多樣性以及智能“分身”的能力,會成為又一個各大廠商比拼的重點。

      在此次的技術報告里,Kimi也著重分享了Agent swarm背后的創新。

      K2.5使用了一種并行智能體強化學習(PARL)的方法進行訓練,讓模型學會自我指導一個多達100個子智能體的蜂群,在最多1500個協調步驟內執行并行工作流。而這個過程里無需預定義角色或手工設計的工作流。

      PARL其實包括三個部分,一個可訓練的編排智能體,負責拆解任務,“分身”出可并行化的子任務,這些子任務由動態實例化的凍結子智能體執行。

      這個訓練過程困難重重,比如當你讓它們并行后再串聯起來時,很可能會發現編排器默認退化為了單智能體執行,于是一切都崩了。Kimi為解決此問題,給PARL采用了分階段獎勵塑形,在訓練早期鼓勵并行,并逐步將重心轉向任務成功。


      這一套創新帶來很好的效果。在Kimi的內部評估中,Agent Swarm使端到端運行時間縮短80%,并支持更復雜的長周期任務負載。


      在廣泛搜索場景下,相比單智能體執行,它將達成目標性能所需的最小關鍵步驟減少3至4.5倍,且節省效果隨目標提升而擴展——通過并行化實現高達4.5倍的實際耗時縮減。

      同時,在多模態上,它不只是給一個文本模型補上這個能力就完事了,它同樣展現了自己對這個能力究竟能給人們帶來什么價值的思考。

      眼看人們的創造都已離不開AI卻又逐漸淪陷在AI味兒的模版化里無暇逃離,它就花大力氣去訓模型的“美學品味”。

      眼看提示詞工程正變得越來越懸乎,本該簡潔的AI交互里,它(很多時候瞎熱鬧)的復雜性正被反過來用作一種新的FOMO來源,于是Kimi強化了K2.5的意圖理解能力,并且在交互上做文章——

      都知道多模態是必備能力,但Kimi覺得它不該是“目的”本身,而應該是一把利刃,加持到Coding的能力上去,這樣能讓更多人平等的享受AI帶來的編程“普惠”紅利,不用陷入提示詞陷阱里去。

      有用戶使用K2.5生成的網頁 Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.

      Kimi從成立到今天,有一個地方一直沒變,就是它是一個最有自己想法的,甚至有時候讓人感到充滿一股中二氣質和熱血感的模型公司。

      一個很有意思的地方是,當這個多agent調用時,它會給不同agent起名字,在一個案例里,這些agent的名字中二氣十足:


      比起在榜單上對閉源模型的逼近,其實今天我們更需要的沒有被困在某個階段或是困在原地的模型和公司們,它們能讓人看到繼續打破一些桎梏往前走的希望,讓人看到一些少年氣,這真的很重要。


      點個愛心,再走 吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      歷史上只有五個球員踢皇馬有滿分10分!梅西領銜!

      歷史上只有五個球員踢皇馬有滿分10分!梅西領銜!

      氧氣是個地鐵
      2026-01-29 23:34:57
      個人股東分紅,不用繳個稅了!

      個人股東分紅,不用繳個稅了!

      審計之家
      2026-01-28 19:58:41
      風向變了,委代總統軍權到手,美國立即歸還油輪,馬杜羅有救了?

      風向變了,委代總統軍權到手,美國立即歸還油輪,馬杜羅有救了?

      墨山看客
      2026-01-30 11:00:38
      不等春節?美航母或1天內開戰,中方不許3事發生,俄英法已選邊站

      不等春節?美航母或1天內開戰,中方不許3事發生,俄英法已選邊站

      阿傖說事
      2026-01-28 15:22:57
      伊朗國際互聯網服務已恢復

      伊朗國際互聯網服務已恢復

      財聯社
      2026-01-29 00:05:46
      立政客:中國必須明白,立陶宛經濟離不開中國,中立關系必須恢復

      立政客:中國必須明白,立陶宛經濟離不開中國,中立關系必須恢復

      知法而形
      2026-01-03 10:40:12
      和訊投顧鄭鎮華:突發大跌,發生了什么?調整目標在哪里?市場將有新主線!

      和訊投顧鄭鎮華:突發大跌,發生了什么?調整目標在哪里?市場將有新主線!

      和訊網
      2026-01-30 11:51:07
      那黃金有沒有可能突然有一天暴跌,然后一下套你30年呢?

      那黃金有沒有可能突然有一天暴跌,然后一下套你30年呢?

      流蘇晚晴
      2025-11-12 19:04:01
      張雨綺大瓜爆出!

      張雨綺大瓜爆出!

      微微熱評
      2026-01-27 00:09:43
      紫光國微:暫無收購英偉達的計劃

      紫光國微:暫無收購英偉達的計劃

      映射生活的身影
      2026-01-30 00:34:31
      中國陸軍火力要變天,電磁火箭炮千公里打擊真的要來了?

      中國陸軍火力要變天,電磁火箭炮千公里打擊真的要來了?

      楊風
      2026-01-28 22:30:13
      法國貓徒步5個月從西班牙回家!只為再蹭蹭主人的手

      法國貓徒步5個月從西班牙回家!只為再蹭蹭主人的手

      新歐洲
      2026-01-28 21:37:40
      新華社消息|伊朗最高領袖顧問:美若動武 伊朗將打擊“特拉維夫的心臟”

      新華社消息|伊朗最高領袖顧問:美若動武 伊朗將打擊“特拉維夫的心臟”

      新華社
      2026-01-29 09:24:27
      導彈還沒等點火,幾萬公里外的屏幕上,紅點就亮了“目標已鎖定”

      導彈還沒等點火,幾萬公里外的屏幕上,紅點就亮了“目標已鎖定”

      南權先生
      2026-01-28 15:54:10
      趙本山沒想到,愛徒宋曉峰因為女兒閨蜜的爆料,體面被撕得粉碎!

      趙本山沒想到,愛徒宋曉峰因為女兒閨蜜的爆料,體面被撕得粉碎!

      叨嘮
      2026-01-29 02:13:44
      被禁足球員李帥發文后刪除:贏球去看守所,中國足球太找樂

      被禁足球員李帥發文后刪除:贏球去看守所,中國足球太找樂

      懂球帝
      2026-01-29 13:13:07
      德央行行長:別和中國人講仁義,我們對中國仁慈,就是對歐洲殘忍

      德央行行長:別和中國人講仁義,我們對中國仁慈,就是對歐洲殘忍

      探史
      2026-01-30 11:17:25
      吉林省副省長楊安娣任吉林省政協副主席

      吉林省副省長楊安娣任吉林省政協副主席

      澎湃新聞
      2026-01-29 19:33:09
      現貨黃金日內漲幅擴大至1%,突破5440美元/盎司

      現貨黃金日內漲幅擴大至1%,突破5440美元/盎司

      每日經濟新聞
      2026-01-30 07:16:04
      中子彈有多厲害?連美國都承認它是中國殺手锏,殺傷比氫彈還強

      中子彈有多厲害?連美國都承認它是中國殺手锏,殺傷比氫彈還強

      千秋文化
      2026-01-29 21:28:25
      2026-01-30 13:11:00
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      2830文章數 10433關注度
      往期回顧 全部

      科技要聞

      單季狂賺3000億;iPhone 17 全球賣瘋了!

      頭條要聞

      英國、法國、加拿大、日本等11國聯合發聲:強烈譴責

      頭條要聞

      英國、法國、加拿大、日本等11國聯合發聲:強烈譴責

      體育要聞

      敢揍多爾特,此子必成大器?

      娛樂要聞

      金晨出事前 曾靈魂發問未收到春晚邀請

      財經要聞

      血鉛超標工人,擋在“勞動關系”門檻外

      汽車要聞

      全面科技化 新款梅賽德斯-奔馳S級發布

      態度原創

      游戲
      手機
      教育
      公開課
      軍事航空

      我榮集合!《榮耀戰魂》廣州線下賽事即將火熱開啟!

      手機要聞

      ColorOS 16正式版2月升級計劃公布,OPPO Find X5 Pro等在列

      教育要聞

      湖南科技大學就業好不好?成功創業者頻出,以創業有效帶動就業!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      中方被指支持俄生產武器 外交部回應

      無障礙瀏覽 進入關懷版