最近"桌面AI代理"這個(gè)品類(lèi)突然火了。Claude在1月12號(hào)發(fā)布了Cowork,被稱(chēng)為"2026年最重要的AI產(chǎn)品發(fā)布",核心賣(mài)點(diǎn)是讓AI能操作你的電腦。但我知道我的讀者里應(yīng)該有不少人還因?yàn)楦鞣N原因沒(méi)用上,想體驗(yàn)的。
其實(shí)國(guó)內(nèi)這邊,MiniMax也推出了類(lèi)似的產(chǎn)品,定位是"AI原生工作臺(tái)"。
它有個(gè)桌面客戶端(Mac和Windows都有),能直接操作你電腦上的本地文件——讀取、修改、創(chuàng)建都行。簡(jiǎn)單說(shuō)就是:以前你用的大多數(shù)AI只能在瀏覽器里幫你寫(xiě)東西,現(xiàn)在它能真正"接管"你的電腦干活了。
![]()
而且現(xiàn)在新用戶前三天還限時(shí)免費(fèi)。讓我來(lái)測(cè)一測(cè)它究竟怎么樣。
批量處理App圖標(biāo)
我最近在做一個(gè)macOS應(yīng)用,其實(shí)代碼部分大部分讓AI開(kāi)發(fā)完成了,但是準(zhǔn)備打包上架的時(shí)候,遇到了個(gè)很痛苦的情況,我發(fā)現(xiàn)它特么比做iOS app還麻煩,居然需要這么多不同尺寸的icon圖標(biāo)...很離譜
![]()
簡(jiǎn)單來(lái)說(shuō)就是,他需要5種尺寸(16pt、32pt、128pt、256pt、512pt)的圖標(biāo),每種還要1x和2x兩個(gè)分辨率,加起來(lái)就是10張圖。
以前我為了解決這類(lèi)圖片批量處理的問(wèn)題,還專(zhuān)門(mén)給自己開(kāi)發(fā)過(guò)一個(gè)圖片處理網(wǎng)站。但面對(duì)這種場(chǎng)景,還是得一個(gè)個(gè)圖片去分別調(diào)整尺寸、導(dǎo)出、命名,實(shí)在是太麻煩了。
我決定讓這個(gè)"AI實(shí)習(xí)生"來(lái)試試。
下載了MiniMax的桌面客戶端,把我的項(xiàng)目文件夾指給它。然后截了一張Xcode里AppIcon的要求圖,直接發(fā)過(guò)去,說(shuō):
我正在開(kāi)發(fā)macOS的應(yīng)用,然后這種應(yīng)用要打包上架的話,需要一系列不同尺寸的小圖標(biāo),你可以參考我的截圖。 我們現(xiàn)在的文件夾內(nèi)已經(jīng)有我設(shè)計(jì)好的icon圖標(biāo)的,請(qǐng)幫我按照Xcode要求的尺寸格式幫我批量調(diào)整并輸出。
![]()
接著,它開(kāi)始干活了。
首先它看懂了我的截圖——這個(gè)挺關(guān)鍵的,說(shuō)明它能理解圖片內(nèi)容,知道Xcode需要哪些尺寸。然后執(zhí)行命令看了下我的文件夾,發(fā)現(xiàn)有一個(gè)icon.png源文件,是1024×1024像素的。
接下來(lái)它開(kāi)始規(guī)劃任務(wù):
太好了!源圖標(biāo)是1024×1024像素,這正好是最大尺寸的2x圖標(biāo)。我可以用它來(lái)生成所有其他尺寸的圖標(biāo)。 根據(jù)截圖,我需要生成以下尺寸: macOS 16pt: 1x=16×16, 2x=32×32 macOS 32pt: 1x=32×32, 2x=64×64 macOS 128pt: 1x=128×128, 2x=256×256 macOS 256pt: 1x=256×256, 2x=512×512 macOS 512pt: 1x=512×512, 2x=1024×1024
然后就開(kāi)始用sips命令批量生成圖標(biāo)。我能在右邊的"MiniMax視窗"里看到它在執(zhí)行什么命令,一條條綠色的命令飛過(guò)去,挺有"監(jiān)工"的感覺(jué)。
說(shuō)實(shí)話,如果是真人實(shí)習(xí)生,我可能還不好意思一直盯著人家干活。但AI嘛,盯著看完全沒(méi)有心理負(fù)擔(dān)。
大概一分鐘,10張圖標(biāo)全部生成完畢。它還貼心地做了一個(gè)表格,列出每種尺寸對(duì)應(yīng)的文件名:
![]()
但真正讓我覺(jué)得這玩意兒有點(diǎn)東西的,是接下來(lái)的操作。
它不僅生成了10張圖標(biāo),還自動(dòng)生成了一個(gè)Contents.json文件。
![]()
如果你做過(guò)iOS/macOS開(kāi)發(fā)就知道,Xcode的Assets.xcassets不只是需要圖片,還需要一個(gè)json配置文件來(lái)告訴Xcode每張圖對(duì)應(yīng)什么尺寸。以前我都是手動(dòng)一張張拖進(jìn)去,讓Xcode自己識(shí)別。
但有了這個(gè)json文件,直接把整個(gè)AppIcon.iconset文件夾拖進(jìn)Xcode的Assets.xcassets,一拖就完成所有文件的添加。Xcode會(huì)自動(dòng)識(shí)別Contents.json并正確配置所有尺寸。
![]()
它最后還告訴我使用方法:
將整個(gè)AppIcon.iconset文件夾拖入Xcode的Assets.xcassets中,替換你截圖中的空占位符即可。Xcode會(huì)自動(dòng)識(shí)別Contents.json文件并正確配置所有尺寸。
我壓根沒(méi)跟它說(shuō)要生成json配置文件這件事。它是自己"想到"的——既然目標(biāo)是讓用戶能直接用在Xcode里,那光有圖片還不夠,還得有配置文件才能一步到位。
這有點(diǎn)像一個(gè)懂行的實(shí)習(xí)生——你讓它做A,它會(huì)順手把A需要的B也做了,還告訴你怎么用。
進(jìn)階玩法:把自己的經(jīng)驗(yàn)封裝成"專(zhuān)家"
桌面端測(cè)完,我又去網(wǎng)頁(yè)版逛了逛,發(fā)現(xiàn)MiniMax還有個(gè)"專(zhuān)家社區(qū)"。
![]()
社區(qū)里已經(jīng)有不少官方和用戶創(chuàng)建的"專(zhuān)家"了——文檔處理助手、從PRD到原型圖、故事視頻生成、知識(shí)消化助手、AI Coder、公眾號(hào)寫(xiě)作達(dá)人……可以理解為封裝好的Skills,一鍵就能用。
我前幾天剛寫(xiě)了一篇Coze技能工廠的文章,介紹怎么用Skills封裝工作流程。MiniMax的"專(zhuān)家"其實(shí)是類(lèi)似的概念——把一套工作流程封裝起來(lái),下次直接調(diào)用。
但MiniMax的表達(dá)算是更人話一點(diǎn)。它不叫Skills或者Workflow,就叫"專(zhuān)家"。創(chuàng)建過(guò)程也是可視化的:你用自然語(yǔ)言描述需求,AI幫你完成實(shí)際的創(chuàng)建。比起Claude Skills需要手寫(xiě)配置,這個(gè)更適合新手。
我決定自己創(chuàng)建一個(gè)試試。
我去年寫(xiě)過(guò)一篇的文章,里面給了一套可以生成App原型的提示詞。
但用了一段時(shí)間后,我發(fā)現(xiàn)這套提示詞還是缺了幾個(gè)關(guān)鍵環(huán)節(jié)——尤其是前面幫助用戶澄清需求、表達(dá)清楚他到底想要什么的部分。
很多時(shí)候用戶說(shuō)"我想做一個(gè)播客App",但到底是像小宇宙那樣的,還是像喜馬拉雅那樣的?核心功能是什么?目標(biāo)用戶是誰(shuí)?這些不問(wèn)清楚,直接畫(huà)原型,大概率要返工。
所以我想讓MiniMax幫我基于原來(lái)的提示詞,優(yōu)化出一個(gè)更完善的"花叔的App原型設(shè)計(jì)大師"。
我把原來(lái)的提示詞貼進(jìn)去,然后告訴它需要調(diào)整的部分:
幫我創(chuàng)建一個(gè)能快速將用戶簡(jiǎn)單初步的想法加工轉(zhuǎn)化為App原型圖的專(zhuān)家,我們已經(jīng)有初步可以幫助用戶創(chuàng)建原型圖的提示詞要求,除了需要改變的部分,請(qǐng)100%維持原樣: [原有的提示詞...] 需要調(diào)整的部分是,用戶的想法可能需要做一些澄清才能被更好捕捉,所以在開(kāi)始的階段,你應(yīng)該先作為產(chǎn)品專(zhuān)家去通過(guò)1-2個(gè)問(wèn)題幫用戶挖掘出更明確的想要實(shí)現(xiàn)的想法,然后幫助其創(chuàng)建原型。
![]()
它開(kāi)始干活了。
先是檢查工作區(qū),然后說(shuō)"我來(lái)幫你創(chuàng)建這個(gè)App原型圖設(shè)計(jì)專(zhuān)家"。接著就開(kāi)始執(zhí)行命令、創(chuàng)建文件夾、寫(xiě)配置文件、生成instruction.md。

有意思的是,它還自動(dòng)為這個(gè)專(zhuān)家生成了一個(gè)圖標(biāo)。
最后產(chǎn)出了一個(gè)叫"app-prototype-designer"的專(zhuān)家,描述寫(xiě)著:"一個(gè)專(zhuān)業(yè)的App原型圖設(shè)計(jì)專(zhuān)家。當(dāng)用戶想要將初步的App想法轉(zhuǎn)化為高保真原型圖時(shí)使用此專(zhuān)家。它會(huì)先通過(guò)簡(jiǎn)短的問(wèn)題幫助用戶澄清需求,然后生成可直接用于開(kāi)發(fā)的HTML原型界面。"
它還給我總結(jié)了這個(gè)專(zhuān)家的核心工作流程。
當(dāng)然,如果你對(duì)描述、圖標(biāo)或者他的工作流程有任何不滿意也都可以去「配置」窗口自主調(diào)整。
專(zhuān)家建完之后,我去測(cè)了下,我說(shuō):"幫我設(shè)計(jì)一個(gè)結(jié)合閱讀和社交的App"。
它沒(méi)有直接開(kāi)始畫(huà)圖,而是先問(wèn)我兩個(gè)問(wèn)題:
核心功能定位:你希望這個(gè)閱讀社交App解決什么核心問(wèn)題?比如發(fā)現(xiàn)和推薦好書(shū)、閱讀過(guò)程中的社交互動(dòng)、讀書(shū)筆記整理與分享、閱讀習(xí)慣的打卡和社區(qū)激勵(lì)? 目標(biāo)用戶與場(chǎng)景:你的App主要面向什么用戶群體?深度閱讀愛(ài)好者、輕度閱讀用戶、學(xué)生群體?
![]()
說(shuō)實(shí)話,這兩個(gè)問(wèn)題問(wèn)得挺到位的。我一開(kāi)始只是模糊地想"閱讀+社交",但被它這么一問(wèn),我才認(rèn)真想了想:核心應(yīng)該是"發(fā)現(xiàn)好書(shū)"和"閱讀習(xí)慣培養(yǎng)",目標(biāo)用戶是"深度閱讀愛(ài)好者"。
這就是我之前那套提示詞缺的東西——幫用戶在動(dòng)手前先想清楚自己要什么。
我回答完之后,它開(kāi)始正式干活。有意思的是,它不是直接畫(huà)圖,而是先去調(diào)研了相關(guān)App的設(shè)計(jì)風(fēng)格,然后才開(kāi)始生成原型。
![]()
最后產(chǎn)出了一個(gè)叫"書(shū)途 BookPath"的完整原型,5個(gè)核心頁(yè)面:發(fā)現(xiàn)頁(yè)、閱讀頁(yè)、習(xí)慣頁(yè)、社區(qū)頁(yè)、個(gè)人中心。而且直接部署上線了,給我一個(gè)可以點(diǎn)擊預(yù)覽的鏈接。
![]()
這個(gè)原型的完成度挺高的——有書(shū)籍推薦、閱讀進(jìn)度、打卡日歷、成就徽章、讀書(shū)圈子,連"追風(fēng)箏的人"的封面都配上了。如果只是用來(lái)驗(yàn)證想法、和團(tuán)隊(duì)溝通,完全夠用了。
這個(gè)功能的想象空間挺大的。比如你是做SEO的,可以把自己的優(yōu)化流程封裝成一個(gè)專(zhuān)家;你是財(cái)務(wù),可以做一個(gè)專(zhuān)門(mén)處理報(bào)銷(xiāo)單的專(zhuān)家;你是自媒體,可以做一個(gè)幫你整理選題的專(zhuān)家。
相當(dāng)于把你的工作經(jīng)驗(yàn)"教"給AI,以后它就能按你的方法來(lái)干活。而且這個(gè)專(zhuān)家是可以分享的,你做好了,發(fā)布到社區(qū),別人也能用。
這讓我想到一個(gè)可能性:以后每個(gè)人的工作經(jīng)驗(yàn)都可以被"封裝"成一個(gè)AI專(zhuān)家。十年老會(huì)計(jì)的報(bào)銷(xiāo)審核經(jīng)驗(yàn)、資深HR的簡(jiǎn)歷篩選標(biāo)準(zhǔn)、老編輯的選題判斷——這些原本只存在于人腦子里的隱性知識(shí),現(xiàn)在可以變成可復(fù)用的"專(zhuān)家"。
這個(gè)實(shí)習(xí)生值多少錢(qián)?
用了整整兩天,說(shuō)說(shuō)我的判斷。
做得好的地方:
真的能操作本地文件。實(shí)打?qū)嵉刈x你的圖片、生成新文件、創(chuàng)建配置,不是在沙盒里模擬。很實(shí)用。
有"主動(dòng)思考"的能力。圖標(biāo)任務(wù)它會(huì)順手生成json配置,之前測(cè)一個(gè)發(fā)票整理任務(wù)時(shí)還發(fā)現(xiàn)它會(huì)發(fā)現(xiàn)抬頭異常——會(huì)想"用戶最終要什么",不是只會(huì)機(jī)械執(zhí)行。
能理解圖片。我直接截圖發(fā)給它,它能看懂Xcode需要哪些尺寸,不用我一個(gè)個(gè)打字說(shuō)明。
Expert功能有潛力。把工作流程封裝成可復(fù)用的"專(zhuān)家",這個(gè)思路很對(duì)。對(duì)于有固定SOP的工作場(chǎng)景,能省很多重復(fù)溝通的時(shí)間。
值多少錢(qián)?
如果按實(shí)習(xí)生的標(biāo)準(zhǔn)來(lái)算——能處理圖片批量處理、文件整理、信息提取這類(lèi)雜活,偶爾還能發(fā)現(xiàn)問(wèn)題主動(dòng)匯報(bào),而且不用管吃喝、不會(huì)請(qǐng)假、隨叫隨到、大半夜讓它干活也不用有心理負(fù)擔(dān)。
這樣的實(shí)習(xí)生,一個(gè)月給3000塊我覺(jué)得不虧。
而且說(shuō)實(shí)話,從成本角度考慮,我現(xiàn)在幾乎訂閱了我在公眾號(hào)里提到、推薦過(guò)的所有AI產(chǎn)品,但其實(shí)每個(gè)月的訂閱費(fèi)加起來(lái)基本也不到3000人民幣。這些工具加在一起,能幫我省掉的時(shí)間和精力,遠(yuǎn)比招一個(gè)真人實(shí)習(xí)生劃算。
但更重要的是,沒(méi)有情緒成本。
前段時(shí)間聽(tīng)劉飛在三五環(huán)的播客里介紹他作為低能量人能做很多事情的原因,其中一點(diǎn)是提到他不喜歡公司體制內(nèi)的很多無(wú)效溝通和情緒消耗,所以他現(xiàn)在的公司正職員工也就他和他的播客搭檔跟合伙人瀟磊。
說(shuō)實(shí)話這塊我還挺有共鳴的。作為一個(gè)所謂的「一人公司」,我現(xiàn)在也在做不少事情,但也沒(méi)給公司招任何一個(gè)全職員工。
倒不是覺(jué)得其他人幫不到我,而是作為I人,我總覺(jué)得和人的溝通上是需要照顧他人情緒和生活的。我還要關(guān)注他/她的成長(zhǎng),會(huì)覺(jué)得老讓ta干很基礎(chǔ)的工作是不是不合適。大半夜或者周末了,臨時(shí)要這位同事加班是不是不合適。我如果想法想不清楚,總要反復(fù)調(diào)整我的想法是不是不合適。
可能是作為打工人的時(shí)間太長(zhǎng)了,這種共情能力不可避免地產(chǎn)生。所以我確實(shí)覺(jué)得有個(gè)沒(méi)有情感的AI實(shí)習(xí)生去幫自己干這種臟活累活是一個(gè)挺解壓的事。
對(duì)于像我這樣的I人來(lái)說(shuō),這一點(diǎn)可能比省錢(qián)更重要。
而MiniMax現(xiàn)在是限時(shí)免費(fèi)體驗(yàn)。
國(guó)內(nèi)版指路https://agent.minimaxi.com/
最后
桌面AI代理這個(gè)賽道,2026年肯定會(huì)很熱鬧。Claude有Cowork,MiniMax有Agent,Google、微軟肯定也在做類(lèi)似的東西。
對(duì)于普通用戶來(lái)說(shuō),現(xiàn)在是嘗鮮的好時(shí)機(jī)——產(chǎn)品都在搶用戶,各種免費(fèi)體驗(yàn)。等市場(chǎng)成熟了,該收費(fèi)的都會(huì)收費(fèi)。
MiniMax Agent目前Mac和Windows都能用,注冊(cè)就能體驗(yàn)。如果你也有一堆需要處理的圖片、文件、數(shù)據(jù)、報(bào)表,不妨讓這個(gè)"實(shí)習(xí)生"試試手。
如果你也是個(gè)不太想和人打交道、但又需要有人幫忙干雜活的I人,這個(gè)AI實(shí)習(xí)生可能正好適合你(沒(méi)有說(shuō)E人就不需要的意思...
萬(wàn)一它比你想象的能干呢。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.