![]()
新智元報道
編輯:艾倫
【新智元導讀】讓龍蝦扛 24 小時以上的長程任務,十次有九次翻車。這個困擾整個養(yǎng)蝦人群體的問題,行業(yè)里正浮現(xiàn)出一個新答案,Harness 群體多智能體。小冰之父李笛帶著原班人馬連融兩輪,月底將推出「小冰島」精神續(xù)作,每個人都能擁有一支專屬 AI 小分隊。
困擾養(yǎng)蝦人最大的問題,第一是 Token 太費錢,第二是長程任務不靠譜。
把 OpenClaw 扔進一個需要跨越 24 小時以上的長程任務里,中間撒手不管,結果往往并不樂觀。
要么是 Token 燒完了事情只干了一半,要么是某一步走偏之后一路錯到黑,交回來的東西完全不能用。
Meta 安全對齊總監(jiān) Summer Yue 的郵箱被 OpenClaw 一夜清空的故事,也是「經(jīng)典詠流傳」。
拓展閱讀:OpenClaw刪光Meta安全總監(jiān)郵箱!連喊3次停手都沒用,她狂奔去拔網(wǎng)線
![]()
https://x.com/summeryue0/status/2025774069124399363
更早之前,還有不止一個 Agent 把敏感公司數(shù)據(jù)泄露給無權限員工的案例。
這些事擺在一起,指向同一個問題。
越聰明的單體智能,一旦被放進更長的時間維度和更復雜的協(xié)作鏈條里,就越容易在關鍵節(jié)點掉鏈子。
這就像一個 IQ 很高但沒人管的實習生,前半小時讓人驚艷,后半小時就開始自己給自己出難題。
行業(yè)里的人開始意識到,光讓模型變聰明不夠,還得有個東西來管它怎么用自己的聰明。
這個東西最近有個越來越高頻的名字,Harness。
一個正在浮現(xiàn)的新共識
Harness 這個詞,字面意思是馬具。
放到 AI 語境里,它指的是連接「模型(馬匹)」和「人類需求(騎手)」的那套控制框架。
簡單地說,除去 Agent 的「大腦」(如 Claude Opus 4.6),其余部分都是 Harness。
它不參與任務執(zhí)行本身,也不讓自己變得更聰明,但它決定這匹馬往哪里跑、跑多快、什么時候該停下來。
這個判斷已經(jīng)不是某一家公司的一廂情愿。
今年 2 月,OpenAI 發(fā)了一篇官方博客,標題叫《Harness Engineering: Leveraging Codex in an Agent-First World》,用一組實驗證明,一個三人工程師小組通過 Harness Engineering,可以在五個月里讓 Agent 寫出百萬行代碼的產(chǎn)品。
![]()
https://openai.com/zh-Hans-CN/index/harness-engineering/
Anthropic 最近也推出了新的 Agent 架構 Managed Agents,技術文檔里反復強調「Agent Harness」這個概念。
![]()
也就是說,在 OpenClaw 之后,行業(yè)里的頂尖玩家?guī)缀跏峭瑫r發(fā)現(xiàn),Prompt Engineering 和 Context Engineering 都不夠用了,得有更高一層的約束系統(tǒng)。
Harness 的邏輯聽起來有點反直覺,用約束換自主。
但背后的道理其實很好理解,自主權越大的東西越容易跑偏,所以給它套上足夠好的馬具,它反而能跑得更遠。
這個共識正在快速收斂。
對普通用戶來說,接下來半年到一年里大概率會冒出一批新的 AI 產(chǎn)品,不再強調自己的模型有多大,而是強調自己會「馴服」模型。
就在這個當口,有家成立四個多月的公司已經(jīng)悄悄把兩輪重金收進口袋。
陸奇和李開復罕見同框的一家公司
公司的名字叫明日新程,英文名Nextie。
4 月 13 日,它宣布連續(xù)完成兩輪融資。
天使輪由創(chuàng)新工場和 Atypical Ventures 聯(lián)合領投,奇績創(chuàng)壇繼續(xù)跟投,參投方還包括原微軟全球副總裁 David Ku 等個人投資者。
![]()
David Ku
資金儲備可以支撐未來三到五年的持續(xù)創(chuàng)新。
放在一級市場整體降溫的背景下,這個數(shù)字本身不算特別扎眼。
真正讓業(yè)內人停下來多看一眼的,是它的投資人名單,陸奇和李開復罕見同框、同步押注同一家 Agent 初創(chuàng)公司。
![]()
陸奇
![]()
李開復
兩位被稱作 AI 圈風向標的人一起出現(xiàn)在一家只成立了一個季度的公司的股東名單上,這件事本身就是信號。
不過讓這個故事真正有分量的,除了投資人,還有帶隊的那個人。
他叫李笛,微軟亞洲互聯(lián)網(wǎng)工程院原副院長。
![]()
李笛
在 AI 圈,他有一個更響亮的身份,小冰之父。
![]()
2018 年,第 6 代小冰
理解李笛這次出來要做什么,得先理解他這幾年沒能做成什么。
2022 年底,Transformer 架構的潛力剛剛被外界徹底看懂,李笛在小冰內部提出一件事,盡快采購 GPU,加速訓練更大規(guī)模的模型。
這個提議在當時的決策框架里被擱置了。
那是后來基礎模型能力快速拉開差距的關鍵窗口期,小冰沒有搭上這班車。
2023 年 2 月,李笛的團隊推出了一個叫小冰鏈(X-CoTA)的項目。
現(xiàn)在回頭看,小冰鏈干的事幾乎就是后來震動整個行業(yè)的 CoT(思維鏈),讓模型在給出答案之前先「想一段話」,把推理過程顯化出來。
小冰鏈僅用了 GPT-3 約 2% 的參數(shù)量,就實現(xiàn)了可觀測、可追溯的思維鏈構建。
然后它只活了一個月。
當年 3 月被叫停,理由是「看不懂,不讓做」。
到了 2023 年底,小冰在日本的業(yè)務做得不錯,賬上有錢,團隊又提出要做推理模型,這個方向在當時的決策框架里再次被否掉。
李笛后來在公開訪談里把這件事稱作「到今天為止唯一一次深深的遺憾」,原話大意是,丟掉的不只是一個項目,是一年半到兩年的時間。
把這幾個節(jié)點連起來看,會發(fā)現(xiàn)小冰身上其實埋著好幾顆本來可以開花的種子。
基礎模型、思維鏈、推理能力,每一顆都精準地對上了后來幾輪行業(yè)爆發(fā)的方向。
只是這些種子在關鍵時刻都沒能長出來。
2025 年 12 月 9 日,李笛帶著微軟小冰的創(chuàng)始核心團隊成立了明日新程。
四個月之后,他的競業(yè)期正式結束。
也就是說,他腦子里已經(jīng)反復推演過幾年的那些事,終于能從頭做一遍。
220 年的學術文獻
造就高級智能
這次從頭做的那個東西,名字叫「群體智能」。
群體智能的想法,并不是最近才冒出來的。
李笛團隊內部梳理過 1800 年到 2020 年整整 220 年的人類學術文獻,目的只有一個,搞清楚人類社會作為一個群體智能系統(tǒng),是怎么一步步形成大規(guī)模高級認知協(xié)同的。
這是迄今為止,唯一被驗證過的、能持續(xù)產(chǎn)出價值的群體智能樣本。
這件事的落腳點非常具體。
明日新程今年 2 月發(fā)布的第一款產(chǎn)品叫「團子」(tuanzi.ai)。
用戶拋出一個問題之后,幾十個 Agent 會「圍坐一桌」,各自從不同視角切入、彼此補充、辯論交鋒,中間還有投票表決和同行評審這樣的專業(yè)環(huán)節(jié)。
李笛內部把這套機制叫「認知碰撞」。
這里有一個反直覺的地方。
按常識,多智能體應該比單體更燒 Token 才對,畢竟人多嘴雜。
但團子跑下來的數(shù)據(jù)是,在達到同等思考深度的情況下,整體 Token 消耗反而降低 50% 以上。
秘密藏在「協(xié)調稅」這三個字里。
傳統(tǒng)的多智能體架構,在環(huán)節(jié)越多、節(jié)點分支越廣的時候,上下文會被一層一層帶著走、復制、再傳下去,Token 消耗呈指數(shù)級增長。
明日新程的做法是,讓每一個環(huán)節(jié)都「收斂」。
辯論、質疑、反思、投票這些動作的目的不是讓信息發(fā)散,而是讓它在每一層里先收斂一次再往下傳。
這是從人類社會里偷來的經(jīng)驗。
一個開得好的會,不只是讓所有人說完所有的話,更是要讓大家吵完之后收斂出一個共識,帶著這個共識進入下一個議題。
團子的智能深度評測(IDI)指標,在長程多智能體協(xié)同、高難度研究任務和大規(guī)模群體仿真這三個場景下,均顯著高于包括 GPT-5.2 Thinking 在內的單一大模型。
不過這些還都是 B 端視角下看到的東西。
真正有意思的變化,藏在明日新程即將在 4 月底推出的那款新產(chǎn)品里。
「小冰島」要回來了?
能做更多
李笛在最近一次訪談中透露,團隊正在全力打造一款形態(tài)接近「小冰島」的新產(chǎn)品。
由于知識產(chǎn)權限制,它不會再叫這個名字,但理念內核是一致的,采用了完全不同的新技術架構。
小冰島這三個字,對老用戶來說是有感情的。
它最初的設計理念,是圍繞每一個具體的人,觀察究竟配一群怎樣的 AI 才是最合適的。
有人需要工作支持加情感陪伴,有人更需要理性決策輔助,每個人的「最優(yōu) AI 陣容」本來就不該是一樣的。
當年做小冰島的時候,技術上有很多過不去的坎。
舉一個具體場景。
用戶在島上跟某個 AI 說「我失戀了」。
按當年的技術能力,這個信息要么被粗暴地廣播給島上所有 AI,所有人一起過來安慰,用戶反而尷尬;
要么只被這一個 AI 知道,其他 AI 完全沒有上下文,無法形成真正的情感支持網(wǎng)絡。
兩種處理方式都不理想。
問題不出在單個 AI 是不是聰明,而是出在這群 AI 之間有沒有一套合理的協(xié)同機制,知道什么信息該傳、傳給誰、什么時候傳。
這正是群體智能要解決的問題。
按李笛自己的描述,新產(chǎn)品里的 Agent 會具備這種「智能判斷」,每一次用戶的交互,都會在 Agent 群體里產(chǎn)生合理的漣漪,而不是要么全員轟炸要么全員靜默。
對普通用戶來說,這件事的吸引力其實可以翻譯成一句大白話,每個人都能擁有一支屬于自己的 AI 小分隊。
這支小分隊里的成員各有分工,彼此之間知道怎么配合,能完成長時間跨度的復雜任務。
最近流行一個詞叫 OPC(一人公司),外人聽上去像科技播客里的空中樓閣。
要讓一個人真正擁有一家公司的執(zhí)行力,光有一個聊天機器人遠遠不夠,得有一整個能自主協(xié)作的團隊。
群體智能加上 Harness 架構,第一次讓這件事有了可實際上手的底座。
按官方說法,如果用戶已經(jīng)養(yǎng)了一只「龍蝦」,只需要一句話就能讓它加入這個 Agent 群體,成為小分隊里的一個特種兵。
這種開放性很關鍵,產(chǎn)品不是要用戶重新學一套生態(tài),而是可以把手里已有的工具直接納進來。
產(chǎn)品還沒發(fā)布,具體體驗如何暫時沒辦法評價。
但理念層面能看出來,明日新程的思路是先把底層的協(xié)同機制做扎實,再讓用戶在這個底座上搭出自己的個性化 Agent 群體,而不是上來就塞一個大而全的超級助理。
按計劃,這款產(chǎn)品會在 4 月底正式亮相。
屆時才是真正檢驗群體智能能不能走到 C 端的時刻。
單體的盡頭是群體
把時間軸拉長一點看,這一輪圍繞 Harness 和群體智能的集體轉向,其實是在回答一個更大的問題。
過去三年,行業(yè)對 AI 的敘事主線一直是「讓單體變得更強」。
參數(shù)更大,上下文更長,推理能力更深。
這條路徑現(xiàn)在仍然在走,但越來越多的人開始意識到,真正的瓶頸也許不在單體能力,而在協(xié)同結構。
人類社會能持續(xù)產(chǎn)出價值幾千年,靠的也不是某個超級大腦,而是大量普通大腦之間找到了一套「吵架也能吵出共識」的機制。
AI 想要接手更長、更復雜、更接近真實世界的任務,可能繞不開同一條路。
這個轉向對普通用戶的意義也許還沒到立刻可感的地步,但它已經(jīng)在悄悄改變接下來一兩年里所有 AI 產(chǎn)品的底層邏輯。
回到開頭那個問題,為什么超級聰明的單體 Agent 一遇到長程任務就拉胯。
答案現(xiàn)在看起來清楚了一些,單體本來就不是為長程任務設計的,長程任務需要的是一個群體,以及一套讓這個群體不至于陷入「群體迷思」或「群體愚蠢」的協(xié)同框架。
明日新程押的就是這個。
小冰的故事還遠沒講完,只是換了個名字繼續(xù)。
![]()
2021 年,第 9 代小冰
參考資料:
發(fā)布|本冰有個好消息~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.