<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      13小時不眠不休,300個分身狂敲代碼!開源第一易主了

      0
      分享至


      新智元報道

      編輯:好困 桃子

      【新智元導讀】開源AI王座一夜易主!Kimi K2.6出道即巔峰,展示了恐怖的「全棧交付」能力。它不僅能復刻高盛研報、手搓奢華官網,甚至能和人類在群組里并肩打工。

      開源模型追平甚至反超閉源三巨頭,這件事真的發生了。

      4月20日深夜,Kimi K2.6出道即開源。



      • HLE「人類最后的考試」54.0分,碾壓GPT-5.4和Claude Opus 4.6

      • SWE-Bench Pro軟件工程實戰58.6分,超過GPT-5.4的57.7

      • Terminal-Bench終端編碼66.5分,而GPT-5.4只有60.4

      • Artificial Analysis評測中,更是直接坐上了世界開源第一王座


      但我們今天拋開跑分,只聊一件事:K2.6到底能干出什么活。

      代碼寫完了,設計也交了

      首先,讓K2.6 Agent制作一個近地軌道旅行公司ORBITAL的官網,要求植入太空艙座位選擇和航班預訂功能。


      打開的瞬間,商業航天的高級感直接拉滿。

      全屏視頻背景是太空艙窗口視角,地球弧面緩緩轉過,大氣層邊緣泛著藍光。

      右下的飛行數據面板用等寬字體列出關鍵參數,左上的熒光青小圓點在緩慢呼吸閃爍,模擬系統在線狀態。

      往下滑動,是一條垂直時間線驅動的飛行敘事。

      從T-60:00在樟宜航天港換上定制加壓服,到T+03:00推進階段承受過載,到T+08:00零重力開始,一直到T+92:00 Touchdown,太空艙濺落海面,回收潛水員圍上來。每個階段帶一個橙色關鍵數據和AI生成的場景配圖。

      一段prompt,一次生成,從品牌視覺系統到可交互的艙位SVG圖,全部到位。


      K2.6 Agent做出來的不只是好看的前端,它能做全棧交付。

      后臺的航班預訂系統是真的能跑的。選日期、挑座位、填乘客信息,預約數據做了持久化存儲,每航班6座上限,滿了自動鎖定。

      這個網站不是一個「看樣子」的空殼,它帶著完整的后端邏輯。

      換個題材。

      同樣的prompt結構,K2.6 Agent產出了深海探索研究機構「THALASSA」的官網。

      首屏運鏡從北大西洋海面垂直下沉入水,穿過水線的瞬間畫面一分為二,藍色從淺到深漸變,遠處墨藍中亮著兩點暖黃色潛水器燈光。

      三臺潛水器參數卡片精確到推進方式和觀察窗尺寸,6種深海生物各占一屏。田野筆記區三篇文章分別署名首席科學家、海洋生物學家和紀錄片導演。

      奢侈香水品牌?THER的官網,K2.6 Agent在「極致美學」上的統治力展現得最充分。

      只見一支琥珀色香水瓶在大理石臺面上,瓶內液體緩慢旋轉,光線穿透玻璃投射出焦散紋。

      「?THER」五個字母用Cormorant Garamond襯線體疊在瓶身上。La Collection區展示5款香水,可拖拽切換。

      5款香水、5套完整香調金字塔、5句手寫文案、5張各不相同的瓶身圖。

      這些網站能做到這個水準,背后是K2.6模型加上Kimi Agent 模式 harness 的實力。超過了 Google AI Studio中的Gemini 3.1 Pro。


      產出的是可以直接丟進項目的React組件和HTML/CSS代碼,帶動畫關鍵幀、hover狀態、滾動觸發動效,甚至拖拽界面和多步表單,跟靜態Mockup完全兩碼事。

      前端編碼的審美是 Kimi 從 K2.5 就開始卷的能力,到 K2.6 又券出了新境界。沒猜錯的話,這應該是楊植麟在2025年底內部信中提到的agent產品taste之一?

      300個Agent,4000步,一次交付

      1T巨量參數,每個token只激活32B的開源MoE,384個專家選8個激活。

      連續編碼13小時不斷線,單次修改超過4000行代碼。

      內部實測中自主重構了一個8年歷史的金融撮合引擎,峰值吞吐量漲了133%。

      有了這個底子,Agent集群才真正有了用武之地。


      長程編碼解決「一個人能干多久」,Agent集群解決「一支團隊能做多大的事」。

      K2.5時代是100個子Agent、1500步。K2.6直接拉到300個子Agent、4000步。

      不同技能特長的Agent互補協作,一次運行就能交付從文檔到網頁、從PPT到表格的全套產物。

      過去丟給Kimi一個復雜任務,它一個人從頭干到尾,遇到不擅長的環節就可能卡住。現在它會自己拆活、組隊、分頭干,每個子Agent專攻自己擅長的那塊,最后匯總交付。

      Claw Bench的內部測試結果顯示,K2.6在無需人工干預的長時間自主運行場景中提升尤為明顯。

      在自主Agent場景中,K2.6與OpenClaw、Hermes Agent配合可長達5天持續自主運行。


      這個「集群」到底能干什么?我們做了三輪測試。

      30個Agent寫30座城市的凌晨四點

      首先,讓Agent們化身為30座城市在凌晨四點仍然醒著的一個人。

      拉各斯的發電機維修工、孟買的送報員、里約的沙灘清潔工、新加坡的港口調度員、舊金山的程序員、馬尼拉呼叫中心的夜班接線員……

      每人寫一段200字以內的第一人稱片段,只寫動作和感官,禁止出現「孤獨」「寂寞」等直白情感詞。



      這類任務的難點不在單篇文字,而是30篇之間不能撞。

      拉各斯維修工寫的是「柴油滴在指關節上,油膜裹住皮膚的紋理,滑膩的觸感像涂了一層冷蠟。我握緊扳手,將十六毫米套筒扣住螺栓,順時針擰動,金屬與金屬碰撞出咔噠咔噠的咬合聲」。

      舊金山程序員寫的是「Cherry青軸的咔噠聲在黑暗里格外脆。食指敲下回車,藍光從屏幕撲到臉上,眼皮被刺得一緊」。

      馬尼拉接線員寫的是「隔斷板上女兒的相片邊角翹起來了,我用小拇指把它按平,膠紙的粘性不夠了」。

      感官錨點沒有一個重復,每頁的背景圖也是匹配生成的。30張圖30種氣氛,視覺風格統一在深夜的暗調里。

      Skill × Agent集群,復刻高盛研報

      Agent集群負責干活,但「按什么標準干」還需要一個東西來定義。

      Kimi Agent的技能(Skill)就是干這個的。

      系統內置了上百個官方推薦技能包,用戶也可以自己創建,輸入斜杠「/」即可調用。

      兩者疊在一起會怎樣?

      我們上傳一份高盛的研究報告,讓Kimi K2.6分析架構、語言風格,并總結出一個Skill。



      做好之后,就可以直接調用這個最新的技能goldman-research-report,讓Kimi K2.6做一份類似的調研報告:

      2026年的硅谷AI競爭格局,需要提及Anthropic、OpenAI、谷歌、xAI、Meta。

      命令一發出,一大批Agent全部上線,每一人分工任務明確。

      比如,納什負責OpenAI、唐墨負責Anthropic、逸飛谷歌、莉香xAI、胡博士Meta......


      然后,這些Agent團隊分別開始推進自己的子任務的報告,每一個完成后,都會主動匯報已完成。

      調研完成后,進入交叉驗證階段,素材事實性沒有問題后,交由「高盛報告撰寫員Agent」再次分配任務。



      最后,就得到了一份非常詳實,且1:1復刻「高盛風格」的硅谷局勢分析的Word版報告。


      一次出三件套,跨文檔數據零誤差

      加大難度。

      這次要求Agent集群一次性交付PDF深度報告、Excel數據底表和英文PPT三件套,主題是全球AI基礎設施競爭情報,覆蓋芯片、云計算、數據中心、網絡設備四個層級的60家企業。

      Agent集群跑完后交付了一份76頁的PDF、一份Excel底表和一套PPT。

      PDF采用摩根士丹利藍皮書風格,內容細到芯片架構的算力密度公式和NVIDIA B200 vs AMD MI350X的參數對比表。


      同樣的,系統也自動做了跨文檔一致性驗證,五項檢查,全部綠勾。

      60家企業的名稱和數據,在PDF、Excel、PPT里對得上每一個數字。

      這種「交付即可審計」的完成度,放在真人團隊里都不一定做得到。

      One More Thing

      Agent集群讓AI學會了自動化分工。

      但下一步的問題更大,能不能把人類和各種不同來源的Agent放在一個群組里,像真正的團隊一樣協作?

      人類統治地球靠的是大規模協作,單個人打不過老虎。

      AI Agent走向實用化也在走同樣的路,從個體智能到群體智能,再到人機混合智能。

      Kimi團隊的答案叫「Claw群組」,目前已開啟小范圍內測。

      用戶可以接入來自任何設備、任何供應商、運行任何模型的龍蝦,每個龍蝦攜帶各自的工具包、技能和持久化記憶。首批兼容OpenClaw,后續會加入Hermes Agent等框架。

      無論部署在本地筆記本、手機還是云端,都能進入同一個協同辦公群組。

      K2.6在群組中擔任協調者(包工頭),根據Agent的技能畫像動態匹配任務。人類是下達任務的甲方。

      當某個Agent故障或停滯時,協調者自動重新分配任務或生成子任務,對交付物全生命周期進行主動管理。

      Kimi自己的營銷團隊已經在用Claw群組跑內容生產流水線。有人教自己的蝦學會了剪視頻,有人教自己的蝦調研社媒熱帖,有人的蝦是做Benchmark圖的好手……那為什么不把他們拉到一個群里干活。

      Demo Maker、Benchmark Maker、Social Media Agent、Video Maker各司其職,K2.6做全局協調,從創意到成品一條線拉通。

      從一個Agent做一件事,到300個Agent做一套事,到人類和Agent坐進同一個群里一起干活……進化的從來不是技術,而是“我們“的邊界。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      雷神山院長落馬,最揪心的是無數女醫護背后的家庭

      雷神山院長落馬,最揪心的是無數女醫護背后的家庭

      社會日日鮮
      2026-04-21 08:34:40
      "下單時2200,現在漲到3700",在淘寶買15張顯卡,5店鋪均拒發貨;淘寶:無法強制,望買家理解

      "下單時2200,現在漲到3700",在淘寶買15張顯卡,5店鋪均拒發貨;淘寶:無法強制,望買家理解

      大風新聞
      2026-04-22 15:44:05
      楊瀚森NBA生涯季后賽首勝:全場遭棄用躺贏 回主場后能否登場?

      楊瀚森NBA生涯季后賽首勝:全場遭棄用躺贏 回主場后能否登場?

      醉臥浮生
      2026-04-22 10:47:21
      功莫大于斬首,計莫毒于絕糧——特朗普雙向封鎖,欲困死伊朗?

      功莫大于斬首,計莫毒于絕糧——特朗普雙向封鎖,欲困死伊朗?

      高博新視野
      2026-04-21 08:00:23
      賴清德竄訪斯威士蘭受阻,鄭麗文:全世界都不支持“臺獨”

      賴清德竄訪斯威士蘭受阻,鄭麗文:全世界都不支持“臺獨”

      海峽導報社
      2026-04-22 15:32:03
      十五部門:加強青年婚戀觀引導,探索住房、出行、消費等多領域聯動的生育支持政策

      十五部門:加強青年婚戀觀引導,探索住房、出行、消費等多領域聯動的生育支持政策

      界面新聞
      2026-04-22 11:51:12
      卡戴珊和漢密爾頓海邊熱吻被拍 兩人是相隔8000公里的40歲+異地戀

      卡戴珊和漢密爾頓海邊熱吻被拍 兩人是相隔8000公里的40歲+異地戀

      勁爆體壇
      2026-04-22 07:28:05
      G2湖人101-94戰勝火箭 球員評價:4人優秀,3人及格,2人低迷

      G2湖人101-94戰勝火箭 球員評價:4人優秀,3人及格,2人低迷

      籃球資訊達人
      2026-04-22 13:27:16
      山西忻州市公務員局發布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

      山西忻州市公務員局發布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

      環球網資訊
      2026-04-22 16:51:03
      史上最全“屬相婚配表”,建議收藏!

      史上最全“屬相婚配表”,建議收藏!

      詩詞天地
      2026-04-21 14:08:25
      誰在反對普及邏輯課

      誰在反對普及邏輯課

      律法刑道
      2026-04-22 12:43:49
      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      新歐洲
      2026-04-21 19:37:05
      四十年來最大的謎:包產到戶后農民馬上就吃上了飽飯,是真的嗎?

      四十年來最大的謎:包產到戶后農民馬上就吃上了飽飯,是真的嗎?

      興趣知識
      2026-04-22 03:35:27
      女子腳踹保安后被反手扇一耳光,力道非常大,這能算正當防衛嗎?

      女子腳踹保安后被反手扇一耳光,力道非常大,這能算正當防衛嗎?

      十九妹
      2026-04-22 13:37:52
      張雪機車發布召回通告

      張雪機車發布召回通告

      界面新聞
      2026-04-22 15:28:06
      馬刺官宣:文班亞馬臉部重摔地板 觸發腦震蕩保護協議提前退賽

      馬刺官宣:文班亞馬臉部重摔地板 觸發腦震蕩保護協議提前退賽

      醉臥浮生
      2026-04-22 09:17:19
      港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

      港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

      冷紫葉
      2026-04-20 17:12:17
      “硬是撐了下來…”40歲男子心臟停跳2天后奇跡生還

      “硬是撐了下來…”40歲男子心臟停跳2天后奇跡生還

      黃河新聞網呂梁
      2026-04-22 09:08:42
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      三甲醫院科主任葉某萍被舉報“巨額財產來源不明”,1年前停職調查,舉報人:內部通知顯示其被查實“違紀違法”

      三甲醫院科主任葉某萍被舉報“巨額財產來源不明”,1年前停職調查,舉報人:內部通知顯示其被查實“違紀違法”

      極目新聞
      2026-04-22 17:33:51
      2026-04-22 18:03:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15039文章數 66798關注度
      往期回顧 全部

      科技要聞

      對話梅濤:沒有視頻底座,具身智能走不遠

      頭條要聞

      特朗普180°轉彎延長停火 伊朗硬剛首次直接回絕談判

      頭條要聞

      特朗普180°轉彎延長停火 伊朗硬剛首次直接回絕談判

      體育要聞

      網易傳媒再度簽約法國隊和阿根廷隊

      娛樂要聞

      復婚無望!baby黃曉明陪小海綿零交流

      財經要聞

      伊朗拒絕出席 特朗普宣布延長停火期限

      汽車要聞

      純電續航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

      態度原創

      健康
      教育
      旅游
      時尚
      數碼

      干細胞抗衰4大誤區,90%的人都中招

      教育要聞

      慣子如殺子!孩子這4種表現說明已經被慣壞了,再不改就來不及了

      旅游要聞

      四月的諸城茶園,到底能帶來多少驚喜?

      初夏穿赫本的白褲子,清新又高級!

      數碼要聞

      Beats發布3米USB-C數據線:售229元 最高240W快充

      無障礙瀏覽 進入關懷版