
文 | 闌夕
在AI Agent領域,晉西北已經亂成了一鍋粥。
2025年會是一個Agent大年,這個判斷倒是不新鮮,但現在說這話和在半年前說這話,語境完全不同。
這涉及到對于AI的能力感知差異:一方面,最新的大模型已經能夠摘下IMO(國際數學奧林匹克)的金牌,另一方面,關于「Strawberry」這個詞到底包含多少個「r」,各家大廠還要放在元提示詞里專門訓練,才能減少出錯的可能。
智能是溢出的,這毫無疑問,卻還沒有到AGI的程度,于是又在ChatBot交互場景產生「殺雞用牛刀」的錯配。這種沖突,最終會由Agent的方式來做緩解,證明AI具有解決復雜問題的能力,路徑本身是可預測的。
但Manus燒出的那把火,仍然成為了照亮山野的雄厚光源,以致于今年涌現出的全球AI Agent產品里,70%以上來自華人團隊,連ChatGPT Agent的發布,也在垓下之圍里顯得黯然失色。
從ARR來看,Manus接近1億美金,Genspark達到3600萬美金,Sierra超過2000萬美金,頭部的獨立產品尚且如此能打,就更不用說OpenAI、Anthropic這些「既做裁判員,又做運動員」的模型供應商了。
即便如此,大多數AI Agent產品都還只是在L3階段徘徊。但令人振奮的是,一家全國產化智能體廠商深元人工智能對此發起了挑戰——終于把AI Agent破天荒的卷到了L4級別。
準確來說,L4并不是一個AI行業的原生概念,它來自美國汽車工程師學會對于自動駕駛技術的等級劃分,其中L4被定義為「高度自動駕駛」,指的是汽車能在大多數情況不需要人為接管,可在限定區域內上路運行。
L4級別的AI Agent標準,自然也是要在全托管的情況下,能夠自主完成多樣性的工作,體現出無人值守的含金量,并且還要具備自我批判,自我改進以及自我反思能力。
作為全球首款L4級智能體產品、全國產化智能體代表——MasterAgent的最大亮點在于,它本質上不是AI Agent,而是AI Agent的開發引擎,或者說,接近于一種「創造智能的智能」。
在實測里,MasterAgent體現出的能力,是將Agent平權化,讓每個人都能打造自己的Agent,從其前端界面的主文案就能看出——「一鍵生成專業工作團隊」——這不單是生成一個,而是生成一群Agent,來為用戶服務。
![]()
這種非常具有未來感的場景已然實現,用戶輸入自己的需求,隨即出現一條流水線,不同專業的Agent分工協作,群策群力的交付各自的成果,最后組裝成用戶想要的成品。
MasterAgent的考慮也不難理解,復雜任務的難度除了考驗基座模型的能力之外,長上下文的處理和銜接更是重中之重,很多時候影響質量的因素在于丟失了上下文,以致于AI無法進行精確推理,整個流程的錯誤就像多米諾骨牌一樣,潰于一個無法察覺的錯誤。
所以MasterAgent選擇了在拆解需求之后為每一個環節單獨配置一個Agent的路線,這是工程化的典型解法,如果用戶認為Manus這樣的產品確實有用,那么MasterAgent實際上能夠為用戶定制出無數個Manus,充分滿足個性化的需求。
在生物學上,制作和使用工具曾是人類區別于其他動物的重要標志,而AI正在對整個文明的版本推送更新包,這是MasterAgent最讓人感到震撼的地方,當一個個Agent自行調用工具去為用戶盡心盡力時,一種賽博牛馬的魔幻感已經有了真實可見的畫面。
MasterAgent的開發商,是深元人工智能,自2018年起就專注于交互式3D與人工智能的底層技術研發,先后推出了X-Studio智能體開發引擎、Personal X情感多模態智能體交互系統、Virtual Human智能體創作引擎,一度供給了市面上80%以上的數字人解決方案,在大模型興起之后,又將可視化的智能體銷售和部署到了很多需要虛擬員工的場館,在文旅、教育、醫療、零售、客服等多個領域展現出廣泛應用潛力。
可以說,MasterAgent的前身,就是專業生產Agent的訓練師,在有了足夠多的積累,疊加上底層模型「每半年算力增加一倍、成本縮減一倍」的新定律之后,開始萌生出建設「母體」的念頭。
這和制造業的轉移和升級規律很類似,只要在生產上不斷精進,遲早會進入更上游的設計領域,因為開發出了足夠多的Agent,深元人工智能也有能力開始構建一個用來開發Agent的Agent,如其命名那樣,成為Agent的御主(Master)。
如果說ChatBot帶來的是最低程度的智能平權,那么Agent帶來的就是中等水平的知行平權,再往后就只有AGI這座圣杯了。
![]()
就實際體驗而言,MasterAgent的交付品質上限和下限相隔甚遠,這非常取決于使用者調用Agent的人機協作能力,所以這既可以看作是普通人上手使用的難點,但也投射出產品本身更為壯闊的想象空間。
大模型的原理是預測下一個Token,同理,Agent的原理也離不開擬合,甚至可以說,過擬合才是后訓練和數據標注的分數線,很多時候,完成任務的結果取決于拆分之后能在多大程度上與「題庫」對照。
畢竟,人類的經驗形成,就是建立在局部最優化這個基礎之上,這是生存和適應的基礎,如果每次都在遇到突發事件后重新建立一遍認知,大腦的負載早就不夠用了。
雖然AI本身的訓練也是基于獎勵模型——這難免鼓勵過擬合——但它在涌現時給人制造的驚喜,仍然是最有價值的嘗試,就像DeepSeek-Zero在論文里呈現的「啊哈」時刻,只有在這樣的稀缺里,智能的邊界才能被推得更遠。
使用MasterAgent的體感就是如此,看著自己憑空生成的「團隊」一邊配合一邊干活、還會交叉核驗以便改進工作程序,一種不必要的剝削感油然而生,神話故事里孫悟空拔毫毛變出百萬大軍的便捷性,也不過如此。
一花一世界,撒豆皆成兵。
在嘗試打開消費級市場之前,堅定全國產化路徑的MasterAgent已經在企業級市場「殺瘋了」,廣汽、海爾、中銀國際、六福珠寶等頭部企業以及政府機構都來簽了大單,其中核心原因之一就是,作為AI Agent開發引擎而非單一的AI Agent,MasterAgent的兼容性實在是太高了。
相當于它自帶外接插槽,企業可以接入自己的知識庫或是智能體,在最短的時間內和MasterAgent做適配,然后擴展成一個更強大的Agent團隊,落地成本之低,遠勝于獨立開發或是私有定制。
![]()
生成智能體均為可復用、可進化、可學習的特點,讓MasterAgent作為「母體」的價值極高,這已經由來自SaaS市場的訂單證明了,而在跨入消費級市場的判斷做出之后,率先將MasterAgent融入工作流的人,會在Agent這條賽道的起跑線上占盡優勢。
在MasterAgent的幕后,依托的是中國科學技術大學的專家團隊,擁有極強的工程化自研能力。
和同行們不同,MasterAgent堅持全國產底座,從模型自研打破模型調用再到語料訓練,全都堅定不移的扎根中國本土,「自己人」的含金量十足。而工程化的應用突破,這反映出AI Agent時代最為明顯的一次迭代,即從前的套殼和非套殼之分已經不再奏效了。
從Manus驚艷出世以來,AI Agent的套殼之說就不絕于耳,言下之意當然是套殼沒有價值,「模型即產品」將成為一條必經之路,大模型的研發商將會在市場得到驗證之后親自下場,全鏈路的收割產業。
然而,即便Claude 4實質上已經內化了部分Agent能力,以Claude為主要調用模型的第三方Agent產品依然活得滋潤無比,甚至以AI Coding市場為例,在Claude Code發布之后,Cursor們還是「該干嘛干嘛」,并沒有讓出多少顯性份額。
一方面固然是增長,只要蛋糕的體積持續做大,市場就不會排擠新入局的分羹者,考慮到通用性,AI Agent的用戶規模相比AI Coding一定只大不小。
另一方面,懂得如何最大化調用模型的工程能力往往是最容易被低估的,就像游戲的高階玩家能比游戲的開發團隊更懂技巧,在具體到發揮模型效能的層面,AI Agent的水平未必不如開發者,這本身也是「術業有專攻」的結果。
所以微軟的CEO納德拉才在今年這波AI Agent大火之前就表示,大模型被商品化是板上釘釘的事情,好的模型必須配備好的產品才有競爭力,而基礎模型商品化的最大受益者必然會是應用層公司。
這么來看,MasterAgent的卡位就非常準確了,在AI Agent的爆發前夕,提前建好了一座日夜不休的Agent制造工廠。
AI讓人類過足了「造物主」的癮,隨手就能擼出一個能夠自己干活的小微智能物種,對于生產力的解放無疑是巨大的,哪怕它目前還有著種種不足,但掛在后臺隔一會兒就能回來檢閱結果的全新體驗,將會伴隨著這一代年輕人成長起來,鋪滿AGI時代的萬古長夜。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.