最新風口Harness，李開復、陸奇已重金入場

2026-04-15 21:01:05　來源: 新智元

北京舉報

分享至

新智元報道

編輯：艾倫

【新智元導讀】讓龍蝦扛 24 小時以上的長程任務，十次有九次翻車。這個困擾整個養(yǎng)蝦人群體的問題，行業(yè)里正浮現(xiàn)出一個新答案，Harness 群體多智能體。小冰之父李笛帶著原班人馬連融兩輪，月底將推出「小冰島」精神續(xù)作，每個人都能擁有一支專屬 AI 小分隊。

困擾養(yǎng)蝦人最大的問題，第一是 Token 太費錢，第二是長程任務不靠譜。

把 OpenClaw 扔進一個需要跨越 24 小時以上的長程任務里，中間撒手不管，結果往往并不樂觀。

要么是 Token 燒完了事情只干了一半，要么是某一步走偏之后一路錯到黑，交回來的東西完全不能用。

Meta 安全對齊總監(jiān) Summer Yue 的郵箱被 OpenClaw 一夜清空的故事，也是「經(jīng)典詠流傳」。

拓展閱讀：OpenClaw刪光Meta安全總監(jiān)郵箱！連喊3次停手都沒用，她狂奔去拔網(wǎng)線

https://x.com/summeryue0/status/2025774069124399363

更早之前，還有不止一個 Agent 把敏感公司數(shù)據(jù)泄露給無權限員工的案例。

這些事擺在一起，指向同一個問題。

越聰明的單體智能，一旦被放進更長的時間維度和更復雜的協(xié)作鏈條里，就越容易在關鍵節(jié)點掉鏈子。

這就像一個 IQ 很高但沒人管的實習生，前半小時讓人驚艷，后半小時就開始自己給自己出難題。

行業(yè)里的人開始意識到，光讓模型變聰明不夠，還得有個東西來管它怎么用自己的聰明。

這個東西最近有個越來越高頻的名字，Harness。

一個正在浮現(xiàn)的新共識

Harness 這個詞，字面意思是馬具。

放到 AI 語境里，它指的是連接「模型（馬匹）」和「人類需求（騎手）」的那套控制框架。

簡單地說，除去 Agent 的「大腦」（如 Claude Opus 4.6），其余部分都是 Harness。

它不參與任務執(zhí)行本身，也不讓自己變得更聰明，但它決定這匹馬往哪里跑、跑多快、什么時候該停下來。

這個判斷已經(jīng)不是某一家公司的一廂情愿。

今年 2 月，OpenAI 發(fā)了一篇官方博客，標題叫《Harness Engineering: Leveraging Codex in an Agent-First World》，用一組實驗證明，一個三人工程師小組通過 Harness Engineering，可以在五個月里讓 Agent 寫出百萬行代碼的產(chǎn)品。

https://openai.com/zh-Hans-CN/index/harness-engineering/

Anthropic 最近也推出了新的 Agent 架構 Managed Agents，技術文檔里反復強調「Agent Harness」這個概念。

也就是說，在 OpenClaw 之后，行業(yè)里的頂尖玩家?guī)缀跏峭瑫r發(fā)現(xiàn)，Prompt Engineering 和 Context Engineering 都不夠用了，得有更高一層的約束系統(tǒng)。

Harness 的邏輯聽起來有點反直覺，用約束換自主。

但背后的道理其實很好理解，自主權越大的東西越容易跑偏，所以給它套上足夠好的馬具，它反而能跑得更遠。

這個共識正在快速收斂。

對普通用戶來說，接下來半年到一年里大概率會冒出一批新的 AI 產(chǎn)品，不再強調自己的模型有多大，而是強調自己會「馴服」模型。

就在這個當口，有家成立四個多月的公司已經(jīng)悄悄把兩輪重金收進口袋。

陸奇和李開復罕見同框的一家公司

公司的名字叫明日新程，英文名Nextie。

4 月 13 日，它宣布連續(xù)完成兩輪融資。

天使輪由創(chuàng)新工場和 Atypical Ventures 聯(lián)合領投，奇績創(chuàng)壇繼續(xù)跟投，參投方還包括原微軟全球副總裁 David Ku 等個人投資者。

David Ku

資金儲備可以支撐未來三到五年的持續(xù)創(chuàng)新。

放在一級市場整體降溫的背景下，這個數(shù)字本身不算特別扎眼。

真正讓業(yè)內人停下來多看一眼的，是它的投資人名單，陸奇和李開復罕見同框、同步押注同一家 Agent 初創(chuàng)公司。

陸奇

李開復

兩位被稱作 AI 圈風向標的人一起出現(xiàn)在一家只成立了一個季度的公司的股東名單上，這件事本身就是信號。

不過讓這個故事真正有分量的，除了投資人，還有帶隊的那個人。

他叫李笛，微軟亞洲互聯(lián)網(wǎng)工程院原副院長。

李笛

在 AI 圈，他有一個更響亮的身份，小冰之父。

2018 年，第 6 代小冰

理解李笛這次出來要做什么，得先理解他這幾年沒能做成什么。

2022 年底，Transformer 架構的潛力剛剛被外界徹底看懂，李笛在小冰內部提出一件事，盡快采購 GPU，加速訓練更大規(guī)模的模型。

這個提議在當時的決策框架里被擱置了。

那是后來基礎模型能力快速拉開差距的關鍵窗口期，小冰沒有搭上這班車。

2023 年 2 月，李笛的團隊推出了一個叫小冰鏈（X-CoTA）的項目。

現(xiàn)在回頭看，小冰鏈干的事幾乎就是后來震動整個行業(yè)的 CoT（思維鏈），讓模型在給出答案之前先「想一段話」，把推理過程顯化出來。

小冰鏈僅用了 GPT-3 約 2% 的參數(shù)量，就實現(xiàn)了可觀測、可追溯的思維鏈構建。

然后它只活了一個月。

當年 3 月被叫停，理由是「看不懂，不讓做」。

到了 2023 年底，小冰在日本的業(yè)務做得不錯，賬上有錢，團隊又提出要做推理模型，這個方向在當時的決策框架里再次被否掉。

李笛后來在公開訪談里把這件事稱作「到今天為止唯一一次深深的遺憾」，原話大意是，丟掉的不只是一個項目，是一年半到兩年的時間。

把這幾個節(jié)點連起來看，會發(fā)現(xiàn)小冰身上其實埋著好幾顆本來可以開花的種子。

基礎模型、思維鏈、推理能力，每一顆都精準地對上了后來幾輪行業(yè)爆發(fā)的方向。

只是這些種子在關鍵時刻都沒能長出來。

2025 年 12 月 9 日，李笛帶著微軟小冰的創(chuàng)始核心團隊成立了明日新程。

四個月之后，他的競業(yè)期正式結束。

也就是說，他腦子里已經(jīng)反復推演過幾年的那些事，終于能從頭做一遍。

220 年的學術文獻

造就高級智能

這次從頭做的那個東西，名字叫「群體智能」。

群體智能的想法，并不是最近才冒出來的。

李笛團隊內部梳理過 1800 年到 2020 年整整 220 年的人類學術文獻，目的只有一個，搞清楚人類社會作為一個群體智能系統(tǒng)，是怎么一步步形成大規(guī)模高級認知協(xié)同的。

這是迄今為止，唯一被驗證過的、能持續(xù)產(chǎn)出價值的群體智能樣本。

這件事的落腳點非常具體。

明日新程今年 2 月發(fā)布的第一款產(chǎn)品叫「團子」（tuanzi.ai）。

用戶拋出一個問題之后，幾十個 Agent 會「圍坐一桌」，各自從不同視角切入、彼此補充、辯論交鋒，中間還有投票表決和同行評審這樣的專業(yè)環(huán)節(jié)。

李笛內部把這套機制叫「認知碰撞」。

這里有一個反直覺的地方。

按常識，多智能體應該比單體更燒 Token 才對，畢竟人多嘴雜。

但團子跑下來的數(shù)據(jù)是，在達到同等思考深度的情況下，整體 Token 消耗反而降低 50% 以上。

秘密藏在「協(xié)調稅」這三個字里。

傳統(tǒng)的多智能體架構，在環(huán)節(jié)越多、節(jié)點分支越廣的時候，上下文會被一層一層帶著走、復制、再傳下去，Token 消耗呈指數(shù)級增長。

明日新程的做法是，讓每一個環(huán)節(jié)都「收斂」。

辯論、質疑、反思、投票這些動作的目的不是讓信息發(fā)散，而是讓它在每一層里先收斂一次再往下傳。

這是從人類社會里偷來的經(jīng)驗。

一個開得好的會，不只是讓所有人說完所有的話，更是要讓大家吵完之后收斂出一個共識，帶著這個共識進入下一個議題。

團子的智能深度評測（IDI）指標，在長程多智能體協(xié)同、高難度研究任務和大規(guī)模群體仿真這三個場景下，均顯著高于包括 GPT-5.2 Thinking 在內的單一大模型。

不過這些還都是 B 端視角下看到的東西。

真正有意思的變化，藏在明日新程即將在 4 月底推出的那款新產(chǎn)品里。

「小冰島」要回來了？

能做更多

李笛在最近一次訪談中透露，團隊正在全力打造一款形態(tài)接近「小冰島」的新產(chǎn)品。

由于知識產(chǎn)權限制，它不會再叫這個名字，但理念內核是一致的，采用了完全不同的新技術架構。

小冰島這三個字，對老用戶來說是有感情的。

它最初的設計理念，是圍繞每一個具體的人，觀察究竟配一群怎樣的 AI 才是最合適的。

有人需要工作支持加情感陪伴，有人更需要理性決策輔助，每個人的「最優(yōu) AI 陣容」本來就不該是一樣的。

當年做小冰島的時候，技術上有很多過不去的坎。

舉一個具體場景。

用戶在島上跟某個 AI 說「我失戀了」。

按當年的技術能力，這個信息要么被粗暴地廣播給島上所有 AI，所有人一起過來安慰，用戶反而尷尬；

要么只被這一個 AI 知道，其他 AI 完全沒有上下文，無法形成真正的情感支持網(wǎng)絡。

兩種處理方式都不理想。

問題不出在單個 AI 是不是聰明，而是出在這群 AI 之間有沒有一套合理的協(xié)同機制，知道什么信息該傳、傳給誰、什么時候傳。

這正是群體智能要解決的問題。

按李笛自己的描述，新產(chǎn)品里的 Agent 會具備這種「智能判斷」，每一次用戶的交互，都會在 Agent 群體里產(chǎn)生合理的漣漪，而不是要么全員轟炸要么全員靜默。

對普通用戶來說，這件事的吸引力其實可以翻譯成一句大白話，每個人都能擁有一支屬于自己的 AI 小分隊。

這支小分隊里的成員各有分工，彼此之間知道怎么配合，能完成長時間跨度的復雜任務。

最近流行一個詞叫 OPC（一人公司），外人聽上去像科技播客里的空中樓閣。

要讓一個人真正擁有一家公司的執(zhí)行力，光有一個聊天機器人遠遠不夠，得有一整個能自主協(xié)作的團隊。

群體智能加上 Harness 架構，第一次讓這件事有了可實際上手的底座。

按官方說法，如果用戶已經(jīng)養(yǎng)了一只「龍蝦」，只需要一句話就能讓它加入這個 Agent 群體，成為小分隊里的一個特種兵。

這種開放性很關鍵，產(chǎn)品不是要用戶重新學一套生態(tài)，而是可以把手里已有的工具直接納進來。

產(chǎn)品還沒發(fā)布，具體體驗如何暫時沒辦法評價。

但理念層面能看出來，明日新程的思路是先把底層的協(xié)同機制做扎實，再讓用戶在這個底座上搭出自己的個性化 Agent 群體，而不是上來就塞一個大而全的超級助理。

按計劃，這款產(chǎn)品會在 4 月底正式亮相。

屆時才是真正檢驗群體智能能不能走到 C 端的時刻。

單體的盡頭是群體

把時間軸拉長一點看，這一輪圍繞 Harness 和群體智能的集體轉向，其實是在回答一個更大的問題。

過去三年，行業(yè)對 AI 的敘事主線一直是「讓單體變得更強」。

參數(shù)更大，上下文更長，推理能力更深。

這條路徑現(xiàn)在仍然在走，但越來越多的人開始意識到，真正的瓶頸也許不在單體能力，而在協(xié)同結構。

人類社會能持續(xù)產(chǎn)出價值幾千年，靠的也不是某個超級大腦，而是大量普通大腦之間找到了一套「吵架也能吵出共識」的機制。

AI 想要接手更長、更復雜、更接近真實世界的任務，可能繞不開同一條路。

這個轉向對普通用戶的意義也許還沒到立刻可感的地步，但它已經(jīng)在悄悄改變接下來一兩年里所有 AI 產(chǎn)品的底層邏輯。

回到開頭那個問題，為什么超級聰明的單體 Agent 一遇到長程任務就拉胯。

答案現(xiàn)在看起來清楚了一些，單體本來就不是為長程任務設計的，長程任務需要的是一個群體，以及一套讓這個群體不至于陷入「群體迷思」或「群體愚蠢」的協(xié)同框架。

明日新程押的就是這個。

小冰的故事還遠沒講完，只是換了個名字繼續(xù)。

2021 年，第 9 代小冰

參考資料：

發(fā)布｜本冰有個好消息～

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.