2026 年第一個(gè)月在科技圈刷屏的話題,是 Claude Cowork。
這是一個(gè)跑在本地的 AI Agent,一個(gè)面向大眾版的 Claude Code,能幫你點(diǎn)鼠標(biāo)、幫你整理文件、幫你完成各種操作。
緊接著,開源社區(qū)迅速跟進(jìn),各種「開源 Cowork」或「Local First」產(chǎn)品接踵而至,或許是感受到了外部的競爭壓力,Anthropic 隨后將 100 美元 Max 套餐獨(dú)享的 Cowork 功能下調(diào)至 20 美元的 Pro 檔。
MiniMax 也在這個(gè)節(jié)點(diǎn)升級了旗下的 MiniMax Agent,推出了桌面端,提供本地文件處理功能、Browser Use 功能等等,用戶只需要一句話,即可快速完成基于本地的任務(wù)。同時(shí)網(wǎng)頁端新增專家(Expert)功能,可以將常用配置保存為可復(fù)用模板——指令、模型偏好、Agent 行為,一次配置,反復(fù)使用。
「桌面 Agent」突然火了起來,行業(yè)內(nèi)已經(jīng)似乎突然形成了某種清晰的共識。
當(dāng) AI 不再只存在于網(wǎng)頁對話框和云端環(huán)境里,而是進(jìn)入你的真實(shí)工作環(huán)境,這件事究竟改變了什么?
答案很簡單:上下文擴(kuò)容。
以前跟 AI 聊天,它的視野只有對話框里的幾行字,以及你上傳的附件。但現(xiàn)在不同了,你的硬盤、你的瀏覽器、你的文件目錄、你的屏幕畫面,都成了它的視野范圍。
與此同時(shí),AI 開始從「咨詢顧問」轉(zhuǎn)向「執(zhí)行者」。它不再只是給建議、提方案,而是可以真正動手:遍歷文件夾、調(diào)用本地資源、拆解任務(wù)并把流程跑完。
也正是在這個(gè)意義上,我們開始認(rèn)真看待 MiniMax Agent Desktop。或許,桌面 Agent 的批量出現(xiàn)和流行,代表著 Agent 正在從概念,面向更大眾的群體,進(jìn)入可以被日常使用、被實(shí)際交付的階段。
MiniMax Agent Desktop 免費(fèi)體驗(yàn),還剩一天:https://agent.minimaxi.com/
??關(guān)注 Founder Park,最及時(shí)最干貨的創(chuàng)業(yè)分享
超 19000 人的「AI 產(chǎn)品市集」社群!不錯(cuò)過每一款有價(jià)值的 AI 應(yīng)用。
邀請從業(yè)者、開發(fā)人員和創(chuàng)業(yè)者,飛書掃碼加群:
進(jìn)群后,你有機(jī)會得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
01從今天起,
不用再為整理文件困擾了
先從一件普通的小事開始使用 MiniMax Agent Desktop——整理文件夾,發(fā)票和整理桌面有些簡單,我們換一種方式。
我有一個(gè)堆了很多年的電子書文件夾,里面躺著 400 多本電子書。所謂「買書如病倒,讀書如抽絲」,松鼠癥患者都是這樣。文件名五花八門,有的是 ISBN,有的是作者名加書名,有的干脆是不明意義的編號「127766.The.epub」。
我給 MiniMax Agent Desktop 的任務(wù)很簡單:
按主題整理這個(gè)文件夾,規(guī)范書名;
不確定的地方可以自行檢索;
最后給我一份 Excel 表格。
Agent 沒有立刻動手,而是先請求了訪問權(quán)限。需要我明確選中目標(biāo)文件夾,并確認(rèn)它可以讀取和修改內(nèi)容。
![]()
Minimax 請求編輯權(quán)限
這一步很重要,它明確了責(zé)任邊界,讓我心里踏實(shí)了很多。
確認(rèn)之后,它也沒有馬上改文件名,而是先給我了一份整理規(guī)劃:會有哪些分類,如何判斷主題,模糊情況怎么處理。
![]()
MiniMax 規(guī)劃整理計(jì)劃
接下來,它才進(jìn)入執(zhí)行階段。左邊是對話窗口,右邊是命令行操作。明確的書直接處理;無法從文件名判斷內(nèi)容的書,它會上網(wǎng)檢索,然后再歸類。
比如看到「傳奇中的大唐」這個(gè)文件名,它會去豆瓣查證,確認(rèn)這是劉勃的歷史隨筆集,歸入「中國歷史」。
![]()
MiniMax Agent Desktop 的工作窗口: 左邊是對話窗口,右邊是命令行操作界面
最終結(jié)果是兩個(gè)東西:一個(gè)被重新命名、分好類的文件夾;以及一份 Excel 表格,列清楚了文件路徑、規(guī)范化書名和主題。
老實(shí)說,當(dāng)看著文件夾里的文件名在瞬間自動刷新、歸位,這種視覺沖擊力遠(yuǎn)比生成一段文字要來得猛烈。那個(gè)飄在云端的 AI,第一次真正把手伸進(jìn)了我的硬盤,完成了對現(xiàn)實(shí)世界的干涉。
![]()
整理前(左)vs 整理后(右)
值得一提的是,MiniMax 還找出了重復(fù)下載的書籍。
我追問了一句:你是怎么判斷重復(fù)的?
它的回答是:目前主要基于標(biāo)題相似度。需要的話我也可以用哈希值再校驗(yàn)一遍。
我當(dāng)時(shí)的感覺仿佛是在玩一個(gè)開放世界的游戲——解決問題的路徑不止一種,你可以反復(fù)嘗試、擴(kuò)展能力的邊界,甚至解鎖隱藏內(nèi)容。
02可復(fù)用的 SOP,
讓 70 分的通才變成 95 分的專家
網(wǎng)頁端增加的專家功能值得單獨(dú)介紹下,簡單來說,它可以把一個(gè)人的方法論封裝成一個(gè)可以反復(fù)調(diào)用的執(zhí)行體,在我的理解中,這其實(shí)算是 Claude Skill 的普適版,門檻更低,更好操作,但能力沒有打折。
![]()
MiniMax 封裝了一些專家 Agent,同時(shí)用戶也可以自己創(chuàng)建專家并發(fā)布到社區(qū)
這個(gè)特性觸及到了一個(gè)非常有價(jià)值的問題:經(jīng)驗(yàn)到底能不能被復(fù)用?
我選擇了一個(gè)極具挑戰(zhàn)性的任務(wù):翻譯加西亞·馬爾克斯的《百年孤獨(dú)》開篇。
之所以選《百年孤獨(dú)》,是因?yàn)檫@段文字集合了時(shí)態(tài)穿越、魔幻現(xiàn)實(shí)主義的基調(diào)以及復(fù)雜的長句結(jié)構(gòu)。范曄的譯本已經(jīng)是許多人的心中標(biāo)準(zhǔn),許多人也許沒看過原著,但是仍然可以輕松背誦那句著名的開頭:
多年以后,面對行刑隊(duì),奧雷里亞諾·布恩迪亞上校將會回想起父親帶他去見識冰塊的那個(gè)遙遠(yuǎn)的下午。
我先用常規(guī)的 Prompt 詞調(diào)試了一個(gè)「翻譯助手」,并將范曄的譯本作為對照組,試圖看看 MiniMax 能達(dá)到什么水準(zhǔn)。
![]()
用戶可以通過自然語言對話創(chuàng)建專家,也能把行業(yè)經(jīng)驗(yàn)和 SOP 整合進(jìn)去
MiniMax 的直出譯文在準(zhǔn)確性上幾乎無可挑剔。它完美解析了原文中關(guān)于磁鐵吸鐵鍋、釘子掙扎的復(fù)雜邏輯鏈條,沒有出現(xiàn)任何事實(shí)性錯(cuò)誤。
這大概是一個(gè) 75-80 分的水平,優(yōu)于裸跑、沒優(yōu)化過的通用大模型 70 分的水準(zhǔn)。剩下的那 20 分差距,體現(xiàn)在那些微妙的「顆粒度」上。
![]()
MiniMax 的翻譯風(fēng)格偏向直譯、準(zhǔn)確,但沒有文學(xué)性
例如,形容磁鐵的神奇力量時(shí),范曄用了「魔鐵」二字,古樸且?guī)в袩捊鹦g(shù)的神秘感;而 MiniMax 譯作「魔法鐵塊」,雖然意思對了,但少了一分文學(xué)的張力。
在描寫吉普賽人帶來的新發(fā)明時(shí),范曄用了「牲口」來指代家畜,貼合農(nóng)村的語境;MiniMax 則選用了「畜生」,雖然詞義相通,但在中文語境下,這個(gè)詞通常帶有罵人的感情色彩,稍顯偏差。
這可能就是單純靠 Prompt 調(diào)優(yōu)的極限。我們確實(shí)能通過 Prompt 快速讓 AI 做到邏輯正確、語句通順。但想再往上走,達(dá)到 90-95 分的專家水準(zhǔn),光靠幾句提示詞是做不到的,因?yàn)樗狈μ囟ǖ摹鸽[性知識」。
于是,我重新配置了 Expert Agent,寫入了一套詳細(xì)的 SOP:
定義人設(shè):你不是翻譯機(jī)器,你是一位深諳拉美文學(xué)的中文小說家。
建立約束:禁止使用現(xiàn)代口語,優(yōu)先使用古樸詞匯
注入知識庫:我上傳了一份「魔幻現(xiàn)實(shí)主義詞匯表」和「馬爾克斯句式風(fēng)格指南」
![]()
注入 SOP 之后,翻譯結(jié)果呈現(xiàn)出了一種古樸的風(fēng)格化特征,明顯要比上一版本更好讀,但有時(shí)會用力過猛。
這一次,MiniMax 呈現(xiàn)出了一種文學(xué)特質(zhì),要比上一版本好讀得多。例如范曄的這一句:
湍急的河水清澈見底,河床里卵石潔白光滑宛如史前巨蛋。
MiniMax 處理成了:
河床上鋪著光滑雪白的巨石,大如史前之卵。
「大如史前之卵」明顯好于上一版本「鵝卵石」;但「光滑雪白」不如范曄的「潔白光滑」讀起來順口。
但它有時(shí)會顯得用力過猛,把吉卜賽人和馬孔多描繪得有點(diǎn)像中國古代傳奇小說(比如「方生方始」、「提及之際須以手指勾勒」),稍微偏離了拉丁美洲的魔幻現(xiàn)實(shí)主義基調(diào)。
![]()
MiniMax 甚至整理了翻譯札記
坦白說,即便加了 SOP,AI 依然無法徹底超越范曄的版本。范曄譯本中那種「史前巨蛋」的精妙比喻、「魔鐵」的煉金術(shù)色彩,依然是人類靈性的高地。
但令我感到震撼的是,僅僅在我注入那套 SOP 之后,MiniMax 就達(dá)成了肉眼可見的進(jìn)步。這才是 Expert Agents 真正性感的地方:它讓「經(jīng)驗(yàn)」變成了一種可復(fù)用的能力。
同理,如果你是一位資深行業(yè)專家,你可以將自己多年的關(guān)鍵詞挖掘邏輯、競品分析框架、SOP上傳到知識庫。當(dāng)你把這個(gè) Agent 分享給 AI 實(shí)習(xí)生時(shí),他就不再是面對一個(gè)只會說車轱轆話的通用 AI,而是在使用你的「數(shù)字分身」。這種能力的釋放,意味著我們只需要做一次「封包」動作,就能讓 AI 站在我們的肩膀上工作。
03Agent 的世界難題:
「最后一公里」
第三個(gè)實(shí)驗(yàn),我刻意選了一個(gè)更容易失敗的方向——我想驗(yàn)證,「一人公司」到底是不是一句空話。
于是我設(shè)計(jì)了一條內(nèi)容流水線:
先調(diào)研小紅書科技類目的對標(biāo)賬號,分析他們的內(nèi)容策略、爆款特征;
然后基于調(diào)研結(jié)果,批量生成選題和內(nèi)容;
最后發(fā)布到平臺上。
第一個(gè)任務(wù)「深度調(diào)研」,MiniMax 調(diào)用 Web 搜索工具,檢索最近一周的科技要聞、小紅書科技博主的對標(biāo)賬號信息。搜索完成后,它自動提取關(guān)鍵信息,生成了一份詳細(xì)的分析報(bào)告,包含賬號定位、粉絲量級、內(nèi)容類型、爆款特點(diǎn)等維度。
![]()
MiniMax 生成的深度報(bào)告及圖表信息
第二個(gè)任務(wù)「生成內(nèi)容」。基于調(diào)研結(jié)果,MiniMax 批量生成了多篇科技類選題,包括封面圖、文案、標(biāo)簽建議。
到目前為止,一切都非常絲滑,AI 展現(xiàn)出了驚人的生產(chǎn)力閉環(huán)。
說實(shí)話,看著它自動打開瀏覽器,熟練地找到發(fā)布入口,試圖填入標(biāo)題和正文,這種從「調(diào)研」到「執(zhí)行」全鏈路跑通的觀感,簡直像是在看科幻片。這是我第一次真正意義上目睹 AI 試圖獨(dú)自走完業(yè)務(wù)的全流程。
但是,當(dāng) AI 真正介入到復(fù)雜的人類世界時(shí),就會發(fā)現(xiàn)到處存在卡點(diǎn)。登錄賬號、圖片上傳、頁面校驗(yàn),這些對人來說是肌肉記憶的動作,對 Agent 卻是「高摩擦操作」。GUI 本身就是為人類設(shè)計(jì)的,讓 AI 在這種界面里高效操作,本身就違反了 AI 的「天性」;再加上平臺嚴(yán)格的風(fēng)控政策(比如驗(yàn)證碼、設(shè)備檢測),難度就更大了。
![]()
MiniMax 生成的小紅書帖子,包含小紅書標(biāo)志性的 Emoji 文風(fēng),Tag以及增加互動率的引導(dǎo)
整個(gè)過程中,MiniMax 提示我需要人工介入的有兩個(gè)環(huán)節(jié),一是登錄小紅書賬號,二是上傳 MiniMax 生成的封面圖片。
![]()
Minimax操作小紅書后臺
當(dāng)然,這不妨礙它完成前面 90% 的工作。調(diào)研、生成、素材準(zhǔn)備,這些原本需要花費(fèi)數(shù)小時(shí)甚至數(shù)天的任務(wù),它在幾分鐘內(nèi)就完成了。
最后那一步的人工介入,與其說是 Agent 的不足,不如說是一個(gè)合理的邊界劃定:涉及賬號安全、平臺規(guī)則的操作,還是需要人類的最終確認(rèn)。
這可能才是人類和 AI 協(xié)作的最理想畫面:不要期待 Agent 替你完成一切,而是要理解它的能力邊界,然后調(diào)整自己的工作流程。讓 AI 擅長的事情,讓人做人擅長的事情——這可能是一種更健康、更高效的協(xié)作模式。
![]()
在 MiniMax 操作小紅書后臺的過程中,用戶可以隨時(shí)暫停、人工介入。
04一切都關(guān)乎「上下文」
跳出具體的功能評測,MiniMax Agent Desktop 的出現(xiàn),其實(shí)引發(fā)了我對「資產(chǎn)」兩個(gè)字的重新思考。
很多公司的核心資產(chǎn)是「經(jīng)驗(yàn)」和「SOP」。但傳統(tǒng)的 SOP 是寫在文檔里的死文字,新員工看了也不一定懂,懂了也不一定照做。
MiniMax 的 Expert Agents 提供了一種新的可能:你可以把個(gè)人和團(tuán)隊(duì)的方法論「封裝」成可執(zhí)行的程序。比如你的團(tuán)隊(duì)有一套成熟的內(nèi)容生產(chǎn)流程——調(diào)研、選題、寫作、排版、發(fā)布——你可以把這套流程固化下來,讓 Agent 按照同樣的標(biāo)準(zhǔn)執(zhí)行。
這樣一來,SOP 不再是紙上的條文,而是可交接、可復(fù)用、可執(zhí)行的數(shù)字資產(chǎn)。新人不需要從零開始學(xué)習(xí),直接調(diào)用專家的「方法論」,就能交付質(zhì)量穩(wěn)定的成果。
然后是心態(tài)轉(zhuǎn)變。
以前我們用 AI 的感覺像開腦暴會。你說「幫我寫個(gè)文案」,它給你十個(gè)版本;你說「哪個(gè)更好」,它分析一通。整個(gè)過程是探索性的、發(fā)散式的,AI 是你的思考伙伴。
但用 Agent 的感覺完全不同,像帶新人。你想清楚了要干什么,然后給它下達(dá)任務(wù),用「驗(yàn)收標(biāo)準(zhǔn)」去溝通。它去執(zhí)行,你來驗(yàn)收。有問題就調(diào)整,沒問題就通過。
這種轉(zhuǎn)變意味著,你需要把自己的思維方式從「提問」轉(zhuǎn)向「管理」。不是問 AI「你覺得怎么辦」,而是告訴 AI「我要什么結(jié)果,你幫我辦」。
最后是邊界重構(gòu)。
正如開頭所說,桌面 Agent 改變的是「上下文」。但這個(gè)詞背后隱藏著一個(gè)更本質(zhì)的變化:過去是人去適應(yīng)工具,現(xiàn)在是 Agent 主動進(jìn)入人的環(huán)境。
過去三十年,我們一直在適應(yīng)軟件。鼠標(biāo)該怎么點(diǎn)、菜單在哪里、快捷鍵是什么——這些都是人要去學(xué)習(xí)、去記憶、去適應(yīng)的。但 Agent 不一樣。它不需要你學(xué)習(xí)它的操作邏輯,而是它來理解你的工作環(huán)境、適應(yīng)你的使用習(xí)慣。
這可能才是 MiniMax Agent Desktop 真正的意義:連接「本地資產(chǎn)」與「云端智能」的橋梁。你的知識、你的文件、你的工作成果都在本地;云端的 AI 能力通過 Agent 進(jìn)入你的環(huán)境,為你所用。
有了更多的上下文,Agent 的能力真的可以不一樣。
05總結(jié)
三年前,我們還在為 AI 能寫出一首打油詩而驚嘆;今天,我們已經(jīng)開始討論如何讓它接管我們的工作流。
Claude Cowork 的推出、MiniMax Agent Desktop 的這次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次對未來工作形態(tài)的預(yù)演。
它并不完美,在 GUI 操作上還有進(jìn)化的空間,但指明了方向——AI 不應(yīng)止步于聊天框,它必須深入到我們的硬盤、我們的瀏覽器、我們的具體業(yè)務(wù)場景中去。
這可能才是 2026 年真正改變的東西:不是人去適應(yīng)分散的工具,而是 Agent 主動進(jìn)入人的環(huán)境。
也是 Agent 產(chǎn)品真正走向更大眾市場的開始。
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.