回顧過去十幾年,市場對“AI助手”的想象經歷過三次大規模的預期校準。
第一次是Siri誕生時,語音控制帶來了交互的新鮮感,人們以為電影里的智能管家Jarvis就在眼前,但隨后發現它更多時候只是一個語音鬧鐘;
第二次是ChatGPT橫空出世,流暢的對話與推理能力讓人覺得AI終于有了“腦子”,但很快市場意識到,它依然只是一個在對話框里坐而論道的智者,看不到對話框之外的世界。
2025年初,Manus的出現,讓Agent的概念有了實感。這一次的沖擊不同以往——很多人第一次看到AI不僅在“說”,而且在“做”。它當著你的面打開瀏覽器、編寫代碼、調試錯誤、甚至因為網頁加載太慢而主動刷新。
當Manus的熱度隨著被收購而逐漸平息,人們才發現,無論技術外殼如何變遷,人類對AI助手的核心渴望從未改變:用戶不只想要一個僅僅能聽懂話的陪聊,也不只想要一個會在黑底白字界面里寫代碼的極客工具;大家想要的,一直都是一個更聰明、真正能把活兒干完的幫手。
隨著Manus完成它的歷史使命,Agent的下半場大幕正在拉開。
01
Manus完成了它的歷史使命:Agent的啟蒙運動
作為一家公司,Manus的最終歸宿或許存在爭議;但作為一個產品現象,Manus已經完成了它的歷史使命——它是Agent時代的啟蒙者。
在Manus之前,Agent更多停留在學術論文和極客的Python腳本里。Manus的成功之處在于,它通過可視化的交互,第一次向普通用戶展示了Claude模型背后潛藏的Agent能力。它把“拆解任務-自主執行-環境反饋-修正路徑”這一整套復雜的黑盒邏輯,變成了一個讓用戶盯著屏幕看的直觀過程。
Manus與Claude模型是典型的“互相成就”。Claude穩定的計算機使用(Computer Use)能力、代碼能力、工具調用能力是地基,而Manus是那座拔地而起的樣板房。Manus的流行,本質上是Anthropic技術愿景在應用層的一次成功落地。
然而,Anthropic自家產品Claude Code的持續破圈,影響力逐漸從技術圈外溢,也揭示了一個道理:Agent的天花板,依然由底層大模型決定。
當應用層的交互紅利被吃透后,競爭會回歸到模型本身。Manus展示了“過程”,但受限于模型對虛擬環境的適配度、API成本和推理穩定性,它依然難以成為大家日常工作的依賴。與此同時,國內外的其他基模創業公司——無論是OpenAI還是國內的DeepSeek、Kimi——都已將Agent作為發力方向:通過把Agent能力直接“內化”進模型里。
但這并不意味著第三方Agent創業者的末日,一個更有價值的方向已經浮出水面:基于獨有知識庫的深度Agent。當通用執行力被第一方產品“內化”成模型能力時,第三方Agent的核心競爭力就從“執行力”轉向了“信息不對稱”。
最典型的例子是金融研報Agent。一個能夠調取過去二十年、數百萬份非公開獨家研報數據庫,并能根據這些高價值信息進行分析的Agent,其價值遠超一個只能翻翻網頁的通用工具。在法律、醫療、審計等垂直領域,這種基于“孤島數據”構建的Agent產品,才是第三方廠商真正能守住的護城河。
現在,行業正處于一個微妙的瓶頸期:基模的Agent能力在飛速提升,不同的基模廠商會有各自希望重點突出的Agent能力側重點,但在產品形態上,大多數廠商還在摸索,試圖找到讓這些能力真正滲透進普通人日常工作流的路徑。
02
Agent的“iPhone時刻”:從炫技到日常
所有現在的AI助手,終將進化為Agent。這已是行業共識。
如果說2025年是Agent的“功能機時代”——大家還在比拼誰能多輪聯網搜索、誰調用的工具多;那么2026年,行業正在呼喚Agent的“iPhone時刻”。這場戰爭的決勝點在于兩端:一端是模型原生Agent能力的硬核比拼,另一端是產品設計的范式革命。
在國內的賽場上,這種角逐尤為激烈。
最早嗅到這一氣息并拿到“入場券”的,是Kimi。判斷一個產品是否切中剛需,有一個極具中國特色的指標——“閑魚認證”。在Kimi在25年6月上線“深度研究”功能,由于免費用戶能使用的次數有限,閑魚上出現了大量倒賣付費會員次數和代跑服務的現象。這種“求而不得”,驗證了用戶對于“AI幫我做完一件事”的真實渴望。
![]()
隨后的故事不僅發生在應用層。Kimi推出的K2模型,是國內較早旗幟鮮明主打Agentic能力的基座模型。這直接催生了Kimi的通用Agent模式。與傳統的“聊天框”不同,Kimi的Agent模式更像是想要打造一個全棧能力的虛擬工作環境。通過Agent模式,Kimi嘗試打破“對話”的邊界:從處理百萬行Excel數據到生成復雜的PPT,它不再是“聊完即走”,而是像人類一樣,從列計劃、做調研開始,一步一步去完成一個項目。
2025年雙11期間,隨著Kimi編程套餐的上線,他們也推出了Kimi CLI工具。這是一款在命令行里運行的Agent,與Anthropic的Claude Code類似,專門服務于開發者的代碼場景,但也開始外溢到非技術人員的非編碼工作場景。
與此同時,國內戰局并未大定。DeepSeek新模型主打的重點是Agent能力。智譜選擇了一條差異化的路徑,他們開源了Phone Use模型。這個模型更側重于通過視覺識別,像人手一樣去操作現有的手機App界面……
03
聊天時代結束,中國的Anthropic競賽開始
ChatGPT開啟的Chat時代也正在落幕。
未來的AI助手,衡量標準將變得非常務實:能不能幫我定位這個線上Bug,自行搜索解決方案,寫好修復代碼,跑通測試,并把補丁推上線?能不能幫我整理完這200份財報并畫出圖表?能不能幫我把本周5場產品評審會的錄音聽完,整理出所有需求變更點,同步更新到PRD文檔,并自動在項目管理軟件里創建好對應的開發任務?
在這場從“聊”到“做”的轉型中,Anthropic提供了一個參考樣本。從早期的Claude Code到最近剛剛上線、面向大眾協作的Cowork,盡管Cowork作為一個新產品,其實際體驗和用戶口碑還有待時間驗證,但它所代表的方向是清晰的:最強大的Agent,一定來自基模廠商。
在中國,誰能成為那個“中國的Anthropic”?
答案不在于誰的模型跑分更高,而在于誰能最先做出第三代AI助手。這個助手需要滿足三個嚴苛的條件:
第一、它必須具備原生的Agent能力,而不是靠外部提示詞工程堆砌出來的“偽智能”;
第二、它必須能處理長時任務(Long-horizon tasks),能像人類員工一樣,為了一個目標連續工作數小時甚至數天,而不是聊幾句就“斷片”;
第三、它必須擁有閉環的數據飛輪,讓每一次任務執行的成敗,都能成為模型進化的養料。
在這個維度上,國內的模型創業者們正在加速。行業看到,DeepSeek選擇了能把Agent推理價格持續降下去的底層方案做突破,暫時沒有在產品層發力;而Kimi依托自己的K2系列模型Agent能力,在“深度研究”“PPT””數據分析“等生產力場景上有了忠實用戶群,也初步驗證了他們的會員付費能力。智譜則通過開源AutoGLM模型,想讓會操作手機的Agent給每個人日常生活帶來幫助。
對于用戶而言,誰是“中國的Anthropic”并不重要。重要的是,當那個對話框消失,取而代之的是一個真正能獨立思考、并在后臺默默把活兒干完的幫手時,市場才算真正迎來了Agent的時代。
畢竟,最好的AI,不是讓你驚嘆技術有多強,而是能讓你覺得自己有多強。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.