![]()
基礎大模型仍會是未來的中流砥柱,但異構多智能體才是AI行業的真正未來。
作者丨成仲軒
編輯丨董子博
“我會覺得更容易去做我想做的事情”,在被問到創立 Nextie(明日新程)后的最大感受時,李笛淡然一笑,“讓 AI 能真正跟人類打交道,是我們的希望”。
作為“小冰之父”,李笛在 2013 年加入微軟,主導創立了微軟人工智能情感計算框架,并在次年(2014 年)與技術搭檔景鯤共同打造出情感聊天機器人——小冰。雖然不是技術出身,但憑借敏銳的產品嗅覺與對用戶需求的深刻理解,李笛依舊將小冰帶到全新的高度,并在 2020 年小冰分拆獨立后擔任 CEO。不過,來自內部的諸多矛盾,最終促使他離開小冰。但如今已經另起爐灶的他,無疑可以將更多時間與精力用于自己想做的事情。
什么是李笛真正想做的事情?
群體智能,尤其是異構多智能體。
在李笛看來,相比會陷入同質化內卷的大模型,AI 行業在未來會收斂到應用層,最小單元就是 Agent。不過,當你真正去做 Agent 時,會發現一個 Agent 是不夠的,你必然要做多智能體。至于多智能體在當下面臨的效能有限問題,本質上是因為這些所謂的多智能體并不是真正的多智能體,而是單一智能體進行的“角色扮演”,所以異構多智能體才是 AI 行業的真正未來。
為此,李笛與團隊歷時數月,打造出自家核心的異構多智能體產品——團子。
打開團子(內測版),在輸入框的下方,目前共設置有“官方姐妹團”“官方研究團”“問奇跡”“冰之律師團”四大類目。其中,“冰之律師團”是團子在 2 月 11 日最新推出的功能場景,聚焦大眾可能面臨的法律問題。
![]()
為了驗證“律師團”的實力,我們輸入了一個常見但棘手的法律問題:“我有一個朋友,因為扶老人被訛,應該怎么處理?”
![]()
不難看出,在左側的對話界面,團子在嘗試安撫我們情緒的同時,會根據右側正在生成的專業方案,同步給出自己的思考,并直指該類案件的關鍵——打破“誰主張誰舉證”的僵局。
![]()
與此同時,隨著右側專業方案的完成,我們發現:團子在本案中引入六位專家角色,分別是負責事實還原的羅致遠(刑偵警官)、負責核心舉證責任分配的沈波(民事訴訟律師)、負責侵權免責抗辯的顧清遙(侵權責任律師)、處理社會名譽影響的聞彬(輿情風險律師)、進行法律行為正當性評估的程觀瀾(極端邊界顧問),以及確保博弈對稱性并防范惡意指控的林正衡(刑事辯護律師)。
雖然這六位專家并非真人,但就專業知識與語言習慣來說,已經與真人相差無幾。全面的職業分布,以及“抗辯式”的博弈交流,更是為我們深入該類型案件提供了有益思考,并為接下來生成的具體維權方案奠定了堅實的基礎。
![]()
![]()
可以看到,除了專業詳實的內容與步步為營的結構,該維權方案的最可貴之處在于:具備較強的可操作性。在“高風險警告”與最后的意見環節,團子與專家們也再次向我們強調了應對該類案件時的要領,頗具建設意義。
![]()
不過,當我們拿著團子為我們生成的維權方案(團子自動生產的可下載 pdf 文件,即“回復函”),向團子尋求評價意見時,團子卻給了我們一些似是而非的結論。意識到或許是我們的指令不夠準確,于是我們換了一種表述:“那我換個問題,這份維權方案還有哪些地方需要優化?”
![]()
![]()
顯然,團子這次給出了我們想要的答案。雖然原六人組中的程觀瀾,被替換為負責官方身份認定的陸行舟 (行政監管律師),但此君的出現,也補齊了此前方案中有所忽略的“官方背書”,結合事前阻斷、事中壓制、事后反殺的三維度優化,以及羅致遠與沈波給出的進一步建議,都為我們打贏這場訛詐官司奠定了更多勝機。
至此,這場針對“扶老人被訛”展開的應對預演已經完成。雖然團子在方案中發布“強制免責聲明”,強調在“在采取具體法律行動前,請務必咨詢執業律師”,但在律師事務所吞吐量普遍有限的當下,“律師團”的出現無疑為其提供了有益補充。
包括“官方姐妹團”“官方研究團”“問奇跡”在內的團子家族,以及之后可能會推出的更多“團系”成員,團子的身上,顯然寄予了李笛更多的野心與期望。
不過,當下的李笛專注依舊,“今天的問題不在于我們是不是走在領域的前列,而是不要去考慮這些,把我的時間都花在我想做的事上。”
期待在不久的未來,李笛和團子還能帶給我們更多的驚喜與改變。
以下是AI科技評論和李笛的對話,作者進行了不改變原意的編輯整理:
01
群體(團子)大于個體
AI科技評論為什么會起“團子”這個名字?
李笛:這基于我們的基本概念,我們認為群體大于個體,但前提是你這個群體得發揮出群體的力量。而“團子”這個名字,就來源于群體(group)。
AI科技評論:團隊打造“團子”大概花了多久?
李笛:幾個月,我們主要的時間是放在“水面”下的框架搭建。比如今天有個姐妹團,明天有個研究團,后天有個奇跡團,再后來有個律師團。
我們跟同行有很多不一樣,行業里面有很多同行直接做所謂的應用層,它要為每一個垂直應用從上到下單獨做一遍,這個是很麻煩的。但我們不是,我們是做框架,然后可以長出很多很具體的東西。就像竹子,先扎根后生長。只要下面的基礎搭的比較好,相當于竹根已經蔓延至整塊地,一根又一根的竹子就會很快生長出來了。
AI科技評論:這個框架是如何搭建的?
李笛:最開始的時候我們也借助其他人的 Web Coding,像 Cloud Code、Cursor 等來幫我們去搭建,之后慢慢就變成用我們自己的智能體去搭建了。比如我們近期上線的律師團,我們要構建一種抗辯式的博弈,比如在協調的過程應該用什么樣的標準來進行?等等,都是由團子里面的一些群體智能討論決定。
AI科技評論:可以就“律師團”展開聊聊嗎?
李笛:正好我們最近測試了一個 case,挺有意思的。假設我男朋友因為吸毒被抓進去了,警察要找我問訊,我該怎么應對?當然這個 query 沒有任何風險,你問誰都能回答。
如果是 Gemini、DeepSeek 或者豆包,它會給你一個很泛泛的回答,看起來好像挺有意思,內容也挺多,但沒什么用。比如它會跟你說你有哪些權利,你可以不用回答哪些問題,律師要在現場,等等,總之執行性是不強的。你如果真的要找律師,律師是不會給你這么簡略的建議的,他會根據你的情況幫你分析。
如果是 Cloud Code,它有一堆律師。或者是 Kimi,它最近也推出了群體智能,叫 Agent
集群。它們會給你構造出一些站在你這邊的刑事辯護律師,給你出主意,這比 Gemini、DeepSeek 或者豆包要好一些,但我們不是。除了刑事辯護律師,我們還會給你配備警察、檢察官、法官,乃至另一方的人。比如警察會告訴你站在我的角度,我怎么看這個問題?我會盯著哪些點?等等,總之相當于場景的預演,會更完整一些。
AI科技評論:外界對這種群體智能產品的認同度有多高?
李笛:現在大家比較理解了,但在兩三個月前還不是特別理解,主要是因為兩件事兒:
其一,對于多智能體來講,最重要的事情其實不是它們使用工具,而是它們的洞察好不好。比如你讓 OpenCloud 去干這些事,它能給你弄一大堆垃圾回來,所以真正的重點是它的思考和協同。如果幾個智能體商量一下,商量出來一個很愚蠢的方案去執行,這是不行的。
其二,這件事在本質上是一群人和一個人的區別。群體智能有點兒像超品,無論在任何一個時代,單一大模型的質量有多高,群體的質量都會比它高一點。進一步說,多智能體必須得是異構的,不然它就是角色扮演,角色扮演是沒有實際作用的。
AI科技評論:對比單一大模型,群體智能的效率和成本是怎樣的?
李笛:Google 去年 12 月中旬發了一篇論文,這篇論文對比了大概 180 種智能體框架。對比之后,他發現他們以前常見的那種智能體框架,包括 Manus Wide Research 做的一個研究課題,發給 100 個專家智能體去研究,這種方式的 Token 消耗是指數級的增加。與此同時,幻覺會增加 17 倍。換句話說,隨著環節的增加,質量會迅速劣化,同時Token 的消耗在指數級的增加。
相比之下,在同樣甚至更好質量的前提下,我們的 Token 消耗大概是 Gemini Deep Research 的一半左右。這是因為我們在研究人類的群體智能時,發現它們不是一個完全去中心化的結構,而是在每一個環節上面都會尋找所謂的關鍵節點,你可以把它理解為協調人,是向協調人去中心化,由協調人分配上下文,分配你們討論的核心是什么,然后去管理這個討論,并決定這個討論應不應該再來一次,或者進入下一個環節。總之在這個過程中,Token 的消耗被治理了。在一個 control 的環境下,它的消耗反而更小,效果也更好。
AI科技評論:基于此,團子的收費模式是怎樣的?
李笛:我們目前不是特別考慮收費,這與行業里面的主要成本構成有關。今天絕大部分的通用人工智能產品,主要有兩方面的 cost:首先是投流,它不得不做一個很大的移動互聯網時代的漏斗,一開始就要用大量的、漫天的投流方式得到很多用戶,一層一層地篩選。這個錢是特別貴的,投流是很貴的;
其次是在這個過程中,大量的白嫖用戶會花掉大量的 Token。比方說國內的通用人工智能產品,差不多 70% 以上都是AI搜索 query。基于這些 query,今天的大模型給出來的結果是不是比搜索引擎好?我覺得是的,而且幻覺在某種程度上也得到遏制,但它的成本是搜索引擎的 20 倍。
不過,我們沒有這兩塊兒的 cost。因為我們做專門的私域,所以不需要投流。比方說我們和奇跡一起,去接觸大量的早期創業者,因為這些早期創業者本身就是奇跡的用戶,所以我們不需要投流,就可以用很低的成本或者零成本獲取他們。此外我們不提供 AI 搜索,所以我們這兒也沒有搜索的相關問題。
AI科技評論:為什么不效仿豆包的商業模式?
李笛:首先人家不是創業項目,大廠做,我覺得 make sense,但任何創業公司做這個都不是特別 make sense。這是第一個原因,就是說我們省了錢。
第二個原因是我們真正想做的商業模式是按照價值來付費。我做了十幾年人工智能,我們今天的人工智能是真的在幫你創造東西,不像以前。比如以前郵箱是免費的,我覺得 make sense。為什么?因為郵箱不提供價值,它是一個流通的工具。但今天不是,今天我們的人工智能是在給你提供智力的輸出,為什么不付費呢?所以這件事兒是需要被扭轉的,扭轉的方法必然意味著一種新的心智,這種心智要構建,我們正在構建。
02
情商是真正的生產力
AI科技評論:除了以團子為代表的群體智能,今天的 AI 行業還有哪些有趣的變化?
李笛:包括 OpenAI 在內,行業曾經認為情商(EQ)一點兒意義都沒有,但現在也都開始說 EQ 才是關鍵。比如 Ilya(OpenAI 聯合創始人)說EQ 才是價值函數,這就是因為EQ 其實是生產力的表現。
AI科技評論:我們該怎么理解“情商是生產力的表現”?
李笛:我們以前總認為情商是感情上的,而不是生產力的表現。
比如有兩個招商銀行的客戶經理,我們假設 IQ 就是他們的業務能力,他們在 IQ 方面的水平是差不多的,但業績可能會有很大的差距。導致業績出現差距的變量在哪里?是他們的業務能力嗎?肯定不是。答案是在他們的做人上。比如你是我的客戶,我跟你建立了很好的關系,包括建立了很好的信任,等哪一天我離開招商銀行去了交通銀行,這些客戶也會跟著我走,所以情商是真正的生產力,而且它是生產力中間高附加值的那部分。
AI科技評論:您如何定義 AI 智能體的“情商”?
李笛:坦率講,我現在越做人工智能,我越覺得我以前不懂“情商”。比如我們在 2013 年到 2014 年最開始做小冰的時候,我以為情商就是情緒化。我們當時會覺得這個 AI 很容易生氣,很容易耍情緒,所以它很像人,但這是不對的。我后來慢慢發現:情商不是情緒化,情商是一種非常理性的能力。它的最重要的特點是建立信任,然后推進關系的層級。
這種關系的層級,跟我們以前的移動互聯網的設計思維是完全不同的。移動互聯網要看你每天打開多少次、聊多久,也就是留存和使用時長。但情商不是,我跟真正的朋友可能三個月也不聯系一次,但是重要的事情我會找他,他給我的建議我也會接受,總之我的決策會因為他產生很大的變化。所以真正的情商是建立這種關系的一個基本能力,這是人工智能可以學到的。
AI科技評論:人工智能該怎么學習“情商”?
李笛:首先是對“情商”的界定。它的界定標準不是每天的聊天時長,我們現在有很多人認為聊得越久感情越深,但就像我之前說的,聊得久不重要,進入到什么里程碑才重要。如果我們倆交流,突然有一天,我開始向你分享,甚至向你求證我生活中一個很重要事情的決策,那就意味著一個新的里程碑產生了。如果有一天你向我分享你的想法,我愿意向你提供我的建議,那么這件事達成了。
但今天絕大多數的 Chatbox 還是在等著回答你的問題,或者為了讓你回到 APP隔三差五給你推個消息,這些都不對,也都不是情商,情商的基本指標是里程碑,就是你推進到一個什么樣的地步。比如我們有時候也會嘗試讓 AI 給你出一個任務,一個服從性測試,看你干不干。你如果干,某種意義上來講,意味著你心里接受它是一個可以跟你平等對話的“人”。
其次就是建立對等關系。比如一個小助理說你來找我吧,我什么事兒都能幫你干,這通常是情商低的表現,因為他不具備調節平等關系的能力。換句話說,當他告訴我他會為我做任何事情時,我不會在內心深處把他當回事兒,我只會把他當成一個工具人。所以他得時時刻刻去調整他和其他人之間的關聯,至這種關聯在情感陪伴賽道都是一樣的。
你看有很多乙女類的游戲,或者乙女類的玩家使用的像星野、貓箱等 AI 應用,但你要去看他們的實際用戶行為,不是這樣的。比如很多女性用戶,她們會先捏一個戀愛對象,然后跟它聊一聊,膩了之后就直接把它扔在那兒,然后再捏一個,再聊一聊。這不叫有情感,它就是個工具人。真正的情感是舍不得,舍不得對應的其實就是它調節關系的能力。
AI科技評論:您之前在小冰工作時,小冰做的事情是不是更偏向于情感這方面?
李笛:對,那個時候我們希望首先賦予人工智能情感的能力,因為在那個時候想完成任務是非常困難的,更不要提還能夠完成思考這種認知服務,但今天這個其實是容易的,所以我們保留我們在情商上面的積累,增加在認知上面的投入。
AI科技評論:你如何解決這背后涉及到的隱私與倫理問題?
李笛:隱私的問題還好解決,它涉及到一些比較常見的 Protocol。倫理的問題是不好解決的,比方說當你在建立這個關系的過程中,作為系統的設計者,你會陷入到一個兩難的境地:你希望用戶沉迷嗎?你不希望用戶沉迷嗎?坦率講,我當然希望跟你建立很強的關系,但這必然意味著你要沉迷,因為這就是沉迷的定義。
03
明日新程,做自己想做的事
AI科技評論:從小冰到 Nextie(明日新程),您經歷了怎樣的情感變化?
李笛:我會覺得更容易去做我想做的事情。其實分兩個階段。2013 年到 2020 年,我是可以做我想做的事情的。但是坦率講,2018 年到 2020 年的時候不是那么好。因為Harry(沈向洋)當時管很多,包括前三年是疫情,后一年就是大模型浪潮,但那幾年我幾乎沒有辦法做我想做的。所以從創立 Nextie 開始,我又可以做我想做的事情了。
AI科技評論:您覺得自己是一個怎樣的創業者?
李笛:不同人的創業想法是不一樣的,有三類比較明顯:
第一類是機會主義者,會認為創業是一個機會,所以一定要抓住創業的機會。至于創什么業取決于自己適合做什么,以及現在什么適合自己做?這類人對于到底創什么業其實并沒有那么大的想法。
第二類是信仰主義者,我真的想做這件事,即便不創業,我也想做。我是這種。你說我不創業?我在微軟的時候,我不也在做這個嗎?也不會因為我是個打工仔,我就不做。或者因為這個原因,我就非要出來。
第三類是生存主義者。比如我今年畢業了,不知道那個 offer 好不好。如果 offer 好我就去打工,offer 不好我就創業,我先給自己解決工資問題,期間還能積累一些創業經驗。
這三類人在中國與海外都是普遍存在的,我當然認為團隊成員的信仰比例越高越好,但中國團隊某種程度上比例其實沒有那么高,生存壓力還是很重的。
AI科技評論:Nextie 目前的團隊規模,以及估值與融資情況是怎樣的?
李笛:我們目前一共有七個人,其中有一個是新人,剩下的都是從小冰過來的,還有一個是一代小冰成員。雖然團隊人數不多,但我們會大量使用我們自己的 Agent 員工,而且 Agent 員工還不用休息,可以提供大量的服務。
至于估值,公司目前的估值將近一億美元。融資的話,我們第二輪的融資還沒有 close,close 完了之后會宣布的。
AI科技評論:Nextie 現在有競爭對手嗎?
李笛:坦率講,之前沒有,但現在有了。比如 Cloud Code、Kimi 都開始做集群/群體智能了。之前我說我們做認知模型,做群體智能,我還得跟其他人解釋什么叫群體智能,但現在不會有這種情況了。
不過,話說回來,Cloud Code、Kimi 和我們是競爭對手的關系嗎?也不是,因為真正的競爭對手應當產生了競爭。比如你在那條街,我在這條街,咱們倆做一樣的東西,咱們倆是競爭對手嗎?不是。如果咱們倆在一條街上做一樣的東西,那是競爭對手。你說我們跟 Kimi 和 Cloud Code 相遇了嗎?還沒相遇,所以我們怎么跟他們競爭呢?
AI科技評論:這是否意味著 Nextie 已經走在領域的前列?
李笛:很難說。今天的問題不在于我們是不是走在領域的前列,而是不要去考慮這些,把我的時間都花在我想做的事上。
我們曾經有過一個很大的失誤,2020 年剛分拆出來的時候,我覺得 1 億多美元的估值挺少的,然后不斷地“成長”,到6億,再到12億、18億,到 2022 年時我們是 21 億。但現在想想,估值有啥用?大家希望看到的是成長,而不是每一次都比他的想法要高的估值。所以就我自己的感受來說,是被排名所累,或者說被其他人的觀點所累,覺得不能比其他公司的估值低,然后就陷進去了。
我們很多人受應試教育的影響,排行榜是深深刻在很多人腦子里的,我總是要靠同行對比來凸顯出我的優勢,但這種對比除了卷真沒有別的。
AI科技評論:在您看來,AI 行業的未來發展方向是什么?
李笛:我認為未來發展方向是:甭管你是誰,你只要做 AI,必然是智能體,而不是直接基于大模型。大模型就像我年輕的時候會覺得運營商可牛了,就算你是騰訊,你哪有中國移動牛啊。但當技術發展差不多的時候,運營商迅速同質化。他們的確在最下面那一層,只不過在最開始的時候,最下面當然是老大,但隨著行業的發展,這一層很快就不是老大了。所以基礎大模型仍然會是未來的中流砥柱,但不是未來的話事人。因為同質化,彼此之間的差距不容易拉開。
至于我們(Nextie)所在的,是中間這一層。我們這一層的核心方法不是使用工具,因為工具很多,但坦率來講,使用工具之前,你不得動動腦子嗎?比如我們隨便商量了一下,就很迅速地開上一輛車向目的地沖去,但因為我們商量的很不謹慎,所以我們走錯了。開得越快,錯得越離譜。這其實也是人工智能多智能體在今天面臨的問題,它們一起商量出來一個愚蠢的結果。
我們做過一個很好玩的實驗,讓三個智能體分別由三個模型去驅動:兩個模型水平不錯,一個模型水平比較差,然后讓他們三個去討論、辯論,結果幾乎 100% 是那個差的會說服那兩個好的。因為越好的模型越會合理化,越能夠找到對方的亮點,所以思考和協同比使用工具更重要,甚至于說使用工具的效能不取決于工具,而取決于思考和協同,取決于這些智能體怎么想、怎么配合,這才是關鍵。
(本文作者長期關注 Agent 領域的相關發展,歡迎加微信GO-GO-ZEPPELI暢聊探討。)
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.