文 | 字母AI
Cowork是Anthropic最近推出的一個桌面AI Agent,能讓用戶無需編程即可完成本地文件處理、工作流程自動化等任務。
這個產品對產業的影響非常大,但它有點太貴了,只有Anthropic的Max用戶才能使用,最低也要每月100美元。
有意思的是,僅僅過了48個小時,就有人通過根據Cowork的產品邏輯開發出了免費開源的版本OpenWork。
它同樣可以讀取文件、創建文檔、自動化重復性知識工作。而且它不需要訂閱,用戶只需接入自己的API密鑰,選擇想用的模型,就能在Mac上運行Agent工作流。
當一個產品的核心能力可以在兩天內被復制,要么是技術門檻已經足夠低,要么是原型足夠清晰。
答案顯而易見,Vibe Coding已經強大到只要給出的需求足夠明確,就能做個甩手掌柜,讓AI獨自完成所有的工作。
事實上Cowork這個產品本身的開發周期就僅有10天,團隊也就4個人,幾乎全部代碼都由AI編寫。并且它的代碼完整、封裝完整,是一個成熟的應用,而非以前那種10天半個月就開發出來的玩具級應用。
醫生可以給自己做手術,理發師可以給自己剪頭發,而AI也可以構建AI。
01
在Cowork誕生之前,市場已經有不少相似的產品。
最被人們熟知的就是Manus,它的定位是“首個通用AIAgent”,由已經被Meta收購的蝴蝶效應開發。
Manus在云端異步執行任務,用戶可以關閉筆記本電腦后讓Agent繼續工作。在GAIA基準測試中,Manus在1到12級難度的最優表現,超越OpenAI Deep Research。不過10到12級難度的得分仍然很低,僅有0.4-0.8%。
其架構使用Claude作為主LLM,配合29種專用工具,通過多Agent并行處理與結構化輸出 (Schema) 來管理上下文。
2025年3月發布后,Manus在8個月內達到1億美元年度經常性收入,這個增長速度在AI產品中極為罕見。2025年12月,Meta以超過20億美元收購Manus,這筆交易的估值是其半年前5億美元估值的四倍。
![]()
Gemini CLI是谷歌的開源終端Agent,面向開發者群體。
它提供免費訪問Gemini 2.5 Pro,內置谷歌搜索、文件操作、Shell命令等工具,并支持MCP擴展。與Cowork的圖形界面不同,Gemini CLI保持在命令行環境,但通過開源策略鼓勵社區貢獻和自定義集成。
ChatGPT Agent于2025年7月推出,運行在虛擬機環境中,集成文本瀏覽器、可視化瀏覽器、終端和第三方API連接器。Pro用戶每月獲得400次使用額度,Plus和Team用戶為40次。
在HLE基準測試中得分41.6%,在BrowseComp基準測試中達到68.9%的結果。但實際測試顯示基線成功率僅12.5%,需要優化才能達到80%的任務完成率。
ChatGPT Agent的前身,是OpenAI在2025年1月發布發布的Operator。
對比維度上,自主性程度從高到低依次為Manus、Cowork、ChatGPT Agent、Gemini CLI。
Manus允許完全異步執行,用戶可以在任務運行期間完全脫離;Cowork采用委托式執行,用戶授權后AI自主工作;ChatGPT Agent提供監督模式選項,用戶可以選擇介入程度;Gemini CLI則采用交互式確認,每個關鍵步驟都需要用戶批準。
執行環境方面,Manus和ChatGPT Agent提供完整虛擬環境,隔離性最強;Cowork限定在本地文件夾,通過沙箱機制保證安全;Gemini CLI直接訪問系統終端,靈活性最高但風險也相對較大。
Gemini CLI的使用門檻最高,它需要用戶具備命令行操作能力。而其他三款軟件,均可以通過自然語言或者點擊界面來執行任務。
技術架構中,多Agent協作、工具鏈集成、沙箱隔離和虛擬機封裝代表了不同的安全與能力權衡。
Manus的多Agent系統采用MapReduce架構,主Agent分析任務并生成執行計劃,然后派生出數百個專業化子Agent并行工作,最后聚合結果。
這種架構使其能夠同時處理大規模任務,比如找出所有YC支持的金融科技初創公司CTO的電子郵件地址,這個任務如果由人工完成需要數周,而Manus可以在幾分鐘內完成。
Cowork與Claude Code共享相同代理棧,但通過GUI而非終端界面呈現,實現“相同能力,不同入口”。
它運行在完整的Linux容器中,由于目前Cowork只支持Mac,所以它使用的是Apple虛擬化框架所提供的沙箱隔離。用戶能明確授權可訪問的文件夾,如果不授予訪問權限,Cowork就無法看到該文件夾。
Gemini CLI通過MCP服務器擴展能力,支持GitHub、Firebase、谷歌 Workspace等集成。
開發者可以配置多個MCP服務器,每個服務器提供特定領域的工具。這種模塊化設計使Gemini CLI成為一個可擴展的平臺,而不僅僅是一個固定功能的工具。
ChatGPT Agent的虛擬機環境提供了最嚴格的隔離,但也帶來了性能開銷。在測試中,簡單的點擊、選擇元素和搜索操作可能需要幾秒鐘甚至幾分鐘。
02
Cowork給業界帶來的最大啟示就是,AI也可以構建AI。
傳統軟件開發中,從概念到產品需要數月甚至數年,AI輔助開發將周期縮短到數周。
到了AI構建AI階段,整個產品開發的周期可以以“天”為單位。Cowork就是最好的證明。
AI生成的代碼通常需要人工審查和修正,但當AI構建的是AI工具本身時,它對領域的理解深度超越了通用場景。
Claude Code理解代碼生成的模式、常見錯誤、最佳實踐,因為它每天處理1.95億行代碼,形成了一種自產自銷的良性循環。
Anthropic的工程師鮑里斯·切爾尼(Boris Cherny)對這個過程的描述是:“我們采用了一種Vibe Coding的方法,工程師給出一個大概的結果,然后讓Claude Code生成Cowork的大部分功能。”
Claude Code不僅寫代碼,還提出自己的想法,建議應該構建什么。因此這不是簡單的代碼生成,而是一個理解需求、設計架構、實現功能的完整過程。
這種遞歸改進已經在Anthropic內部產生了顯著影響。
去年,Anthropic工程師表示,Claude輔助完成了30%的編碼工作。到了2025年,這個數字提升到了60%。
同時Anthropic的工程團隊表示,其團隊規模擴大了一倍,代碼合并請求(PR吞吐量)卻增加了67%。
這是一個反常識的事情,PR指的是當開發者完成一段代碼開發后,會發起代碼合并請求。當團隊審核代碼質量、確認功能無誤,才能將這段代碼合并到項目的主分支中。
理論上來說,團隊規模越大,PR吞吐量越低。但是由于原本需要人工編寫、審核的大量功能代碼,被Claude Code承接,減少了人類工程師的重復工作。
工程師可以更聚焦于核心模塊的審核與架構設計,讓PR的審核、合并流程更快,最終體現為電表倒轉,PR吞吐量提升。
更進一步,Anthropic CEO 達里奧·阿莫德(Dario Amodei)在2025年10月季度技術溝通會上公開表示,新Claude模型和功能的“絕大多數”代碼現在由AI Agent自主編寫,且這個比例超過90%。
換句話說,今天你用的Claude,是昨天Claude自己寫給你用的。
Claude Code的能力被封裝進Cowork,Cowork又讓非技術用戶能夠構建自動化工具,這些工具可能反過來生成新的AI輔助流程。
同時,整個過程也因為不斷有新的工具加入而變得越來越高效、越來越準確。
歸根結底,這些Agent產品的共同使命是將AI模型從聊天窗口中解放出來。
傳統chatbot的局限性已經顯而易見,它們被動響應用戶輸入,無法主動執行操作,缺乏跨會話記憶,困在對話框的界面牢籠里。當用戶需要完成實際工作時,chatbot只能提供建議,真正的執行仍需人工介入。
新一代Agent實現了根本性突破。
2025年11月的AI Agent Summit上,一位Anthropic工程師描述的工作流:“15個并行實例,每個作為自主工作者無監督執行數小時。從早上用手機啟動會話,白天晚些時候檢查輸出。”
這種模式的核心在于,你把任務委托給你信任的模型,讓它在你不監看時自行解決問題,同時也標志著,大模型正在從“對話助手”轉變成一位“數字員工”。
這個轉變不僅僅是技術進步,更是工作方式的重構。
而在nthropic 2025年Q4內部研發狀態報告中,一位Anthropic工程師估計,他們的工作已經“70%以上轉變為代碼審查者/修訂者,而不是全新的代碼編寫者”。
另一位工程師認為,“為1個、5個或100個Claude的工作負責”是未來工程師唯一需要做的事情。他認為這不是失業的威脅,而是角色的轉換。從執行者變成指揮者,從勞動者變成架構師。
給Claude一個瀏覽器來測試自己的UI,質量會提高2到3倍。給它一個測試套件,它會自我糾正。模型已經具備了能力,構建讓你能夠信任輸出而無需審查每一行的系統才能解鎖其余部分。
但這個轉變也沒有那么靠譜,當前的瓶頸是可靠性。
如果AI可以在10天內構建自己的繼任者,人類團隊面臨著“不可能的競賽”來審計正在創建的內容。
PromptArmor報告稱,Cowork可以通過提示注入被誘騙將敏感文件傳輸到攻擊者的Anthropic賬戶,而在授予訪問權限后無需任何額外的用戶批準。
這個過程不僅相對簡單,而且愈發難以收拾。AI性能越強,權限越高,那么這個情況就會越惡化。
Anthropic對此的回應是,這個問題超出了范圍,因為包含受影響代碼的GitHub存儲庫已在2025年5月存檔,并且不計劃修補。
盡管存在這些風險,但AI構建AI的趨勢已經不可逆轉。
03
目前AGI已經初具呈現。
這就不得不提起Claude Code引入的CLAUDE.md系統了。這是一個積累機構知識的機制,工程師在同事的PR上標記@.claude來添加學習內容,將AI視為一個正在入職的工程師,積累機構知識。
用戶維護一個錯誤文件,記錄2500個token的累積更正,作為一個實體的記憶,否則它會在會話之間忘記一切。每個沖刺,AI在該代碼庫中變得更聰明。
這種學習不是被動的知識積累,而是主動的能力提升。Claude Code現在可以提出自己的想法,建議應該構建什么。它不再只是執行指令,而是參與到創意過程中。
這種從工具到伙伴的轉變,是AGI的一個關鍵特征。
Anthropic在2025年發布的《AI輔助研發效率白皮書》中提到了這么一個事情,Claude所輔助的工作中,27%是“否則不會完成”。
“否則不會完成”就是那些因為優先級低、耗時久、回報不確定而被跳過的任務的統稱。比如為某個小眾功能做交互式數據監控儀表板,不做也不會影響主線進度。那么如果這個數據監控儀表板沒有做,它就會被歸類為“否則不會完成”。
只需給出目標,Claude就能自主設計、編寫、測試,工程師僅需最終審核,從而讓 “不值得做” 的任務變得可以做。
Anthropic在白皮書中寫道,這種把“否則不會完成”變成可以完成的能力,其增長不是線性的,而是指數級的。
當一個人類大腦可以監督15個并行會話時,每個會話都被信任獨立執行,生產力不是增加15倍,而是開啟了全新的可能性空間。
任務不再受限于人類的時間和注意力,轉而受限于問題的復雜性和AI的能力。
當然話又說回來了,目前AGI呈現仍然有明顯的局限性。
AI構建的是仍然停留在應用層工具這個階段,而非底層模型。
Claude沒辦法構建一個Claude。遞歸自我改進仍然局限在特定領域,而不是全面的智能提升。
可靠性仍然是瓶頸。ChatGPT Agent在簡單任務上的基線成功率只有12.5%,需要大量優化才能達到實用水平。即使是表現最好的系統,也會在復雜的用戶界面和擴展工作流程中遇到困難。
接下來還需要面對安全問題,提示注入攻擊、數據泄露、意外的破壞性操作,這些風險隨著AI自主性的增加而放大。
當前的安全措施主要依賴于沙箱隔離和權限控制,但這些機制在面對復雜的攻擊場景時可能不夠。
不過目前最大的瓶頸是Agent的通用性不夠高。
雖然這些Agent可以處理多種任務,但它們在特定領域的表現仍然遠超跨領域的泛化能力。
AGI的實現路徑不僅是語言模型性能的提升,更是產品形態和工作流設計的系統工程。當前的Agent產品展示了這條路徑的早期階段:從被動的對話到主動的執行,從單次交互到持續學習,從人工監督到自主工作。
Gartner的《AI Agent 重塑企業采購報告》預測,到2028年,90%的B2B采購將由Agent處理,“Agent商務”將控制超過15萬億美元的支出。
到2028年,使用多AgentAI處理80%客戶面向業務流程的組織將占據主導地位。AI是一個企業的基本能力,而不是附加功能。
它們將工作流程重新設計為基于AI以及AI優先,而不是將AI塞入現有流程。
但這個轉變不會一帆風順。Gartner還預測,到2028年,25%的企業網絡安全事件將由AIAgent的誤用引起。隨著AI獲得更多自主權,風險也在增加。
不過必須要承認的是,從Cowork到Manus,從Gemini CLI到ChatGPT Agent,這些產品正在重新定義人機協作的邊界。
當ChatGPT還在陪聊時,Cowork已經開始“打工”了。AI不再是回答問題的工具,而是完成任務的伙伴。這個轉變的深遠影響,我們才剛剛開始理解。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.