Clawdbot開發(fā)者：未來一大批應(yīng)用都會消失，提示詞就是新的interface

2026-01-29 21:05:26　來源: FounderPark

北京舉報(bào)

分享至

Clawdbot（最近改名叫 Maltbot），目前最熱門的 AI 項(xiàng)目，不光是在 X 上「一夜成名」，在谷歌上的搜索量更是直接超過了 Claude Code、Codex。

X 上的網(wǎng)友制作了一張 Clawdbot 在 Github 的標(biāo)星增長趨勢對比圖，幾乎是直線上漲，現(xiàn)在已經(jīng)到了 98K。

Clawdbot 背后的開發(fā)者 Peter Steinberger，是一個(gè)特別有意思的老哥。iOS 生態(tài)系統(tǒng)最早的一批開發(fā)者之一，開發(fā)經(jīng)驗(yàn)可以追溯到 iOS 2.0 時(shí)代。在開源社區(qū)貢獻(xiàn)了非常多項(xiàng)目。

2011 年，Steinberger 創(chuàng)立了 PSPDFKit，用 13 年時(shí)間把它從開發(fā)者工具搞成了 B2B 軟件巨頭。以超過 1 億歐元的價(jià)格賣掉后，實(shí)現(xiàn)財(cái)富自由的 Steinberger 感到非常破碎、空虛，甚至通過排隊(duì)、派對、心理治療各種方式填補(bǔ)空虛。

于是，「退休」三年后，Steinberger 重新回來了。Steinberger 在最新采訪中提到，

早在去年五月份，我就有了做個(gè)人 Agent 的想法，那會兒 GPT-4 被 GPT-4o 替代，當(dāng)時(shí)覺得模型還不夠好，但我當(dāng)時(shí)又覺得，這事大公司未來幾個(gè)月肯定會做。可是等到了 11 月，我發(fā)現(xiàn)市面上還是沒有我想要的個(gè)人智能體。于是，我決定自己搞。這基本就是 Clawdbot 項(xiàng)目的起點(diǎn)了。

在最近的采訪中，Steinberger 分享了很多有趣的觀點(diǎn)：

今年將是「個(gè)人助理」之年。我感覺我喚醒了人們對它的真實(shí)需求。我認(rèn)為每個(gè)人都應(yīng)該嘗試構(gòu)建一個(gè) Agent，探索記憶機(jī)制。
「我們要做一個(gè)能獨(dú)立跑 20 個(gè)小時(shí)的東西」，對我來說有點(diǎn)像個(gè)虛榮指標(biāo)。我的瓶頸從來不是讓智能體跑得更久，真正的瓶頸通常是我自己：我的提示詞，以及我下一步該讓它做什么的思考。
GUI 這東西很糟糕，擴(kuò)展性不強(qiáng)。人們圍繞它做了各種奇怪的搜索功能，但真正具備擴(kuò)展能力的應(yīng)該是 CLI。
如果聰明一點(diǎn)，就應(yīng)該按照模型已經(jīng)習(xí)慣的方式去構(gòu)建工具，為模型設(shè)計(jì)，別為人類設(shè)計(jì)。
大多數(shù) MCP 都應(yīng)該被做成 CLI。MCP 的存在更多是為了讓市場部門高興，唯一的好處是它能保持 state，但這種情況你極少需要。但 CLI 是可以調(diào)用并獲得返回的東西，而且是可組合的。
未來一大批應(yīng)用會消失，提示詞就是新界面。因?yàn)槟愫褪挛锏慕换シ绞綍兊猛耆煌蠖鄶?shù)應(yīng)用會被簡化為 API。
你不再需要訂閱那些只提供通用功能的初創(chuàng)公司的服務(wù)。你擁有自己超個(gè)性化的軟件，它能精確解決你的問題，而且還是免費(fèi)的。

??關(guān)注 Founder Park，最及時(shí)最干貨的創(chuàng)業(yè)分享

Founder Park 聯(lián)合扣子，舉辦了一場 Skill 招募大賽。如果你手里有一套在用、能交付結(jié)果的方法論，很適合來試試！

歡迎飛書掃碼加群：

進(jìn)群后，你有機(jī)會得到：

可落地的 Skill 搭建方法
從一個(gè)想法或一套 SOP，拆解成真正能跑起來的 Skill

Skill 的展示與放大通道
不只是自己用，而是被更多人看到、用到

被看見后的實(shí)際激勵(lì)
好的 Skill，有機(jī)會獲得明確回報(bào)

01從解決自己的問題出發(fā)，

一個(gè)小時(shí)搞定原型

主持人：你是怎么開始做 Clawdbot 這個(gè)項(xiàng)目的？我看你之前也做了不少有意思的東西項(xiàng)目？

Steinberger：說實(shí)話，我的核心信條就是「我要玩得開心」。學(xué)習(xí)這些新技術(shù)的最好方式就是去玩、去折騰。所以我做了很多有意思的小東西，嘗試了不同的語言和方法。

我管這個(gè)叫 agentic engineering，我不太喜歡 vibe coding 這個(gè)詞。當(dāng)然，有時(shí)候我也開玩笑說，白天搞「agentic engineering」，凌晨三點(diǎn)就開始 vibe coding，然后第二天就后悔當(dāng)時(shí)怎么沒去睡覺。

其實(shí)早在去年五月份，我就有了做個(gè)人 Agent 的想法，那會兒 GPT-4 被 GPT-4o 替代，當(dāng)時(shí)覺得模型還不夠好，但我當(dāng)時(shí)又覺得，這事大公司未來幾個(gè)月肯定會做，我干嘛要費(fèi)這個(gè)勁呢？我等著他們做得更好就行了。

所以當(dāng)時(shí)我更多探索怎么用 Agent 來更快地構(gòu)建軟件。我的技術(shù)背景主要集中在做 iOS 和 macOS 開發(fā)，但對于最新的項(xiàng)目，我非常想做一些 Web 相關(guān)的東西。距離上一次做 Web 開發(fā)已經(jīng)過去太久了。你知道那種感覺，當(dāng)你在一個(gè)領(lǐng)域是專家，換到另一個(gè)領(lǐng)域卻要從最基礎(chǔ)的東西搜起，非常打擊自尊心。

AI 的出現(xiàn)正好是完美的契機(jī)，我越用越上癮，也越來越懂怎么跟這些工具打交道。

直到去年 11 月，我發(fā)現(xiàn)市面上還是沒有我想要的個(gè)人智能體。尤其是我在用 Codex 做一些長時(shí)間任務(wù)時(shí)，總得有人在那盯著，然后不斷輸入「continue」。有段時(shí)間，我感覺自己就像一臺「continue」打字機(jī)。我當(dāng)時(shí)就想，為什么不能讓一個(gè) AI 來幫我干這件事呢？「為什么我沒有一個(gè)智能體來照看我的其他智能體呢？」這基本上就是 Clawdbot 項(xiàng)目的起點(diǎn)了。

主持人：所以是為了解決自己這個(gè)痛點(diǎn)，然后動手做了？

Steinberger：對。當(dāng)時(shí)我想，能不能在 WhatsApp 上跟我的電腦聊天？這樣當(dāng)我的智能體在跑任務(wù)時(shí)，我去廚房倒杯水也能隨時(shí)看看進(jìn)度，或者給它發(fā)點(diǎn)小指令。

于是，我花了一個(gè)小時(shí)就搞定了基礎(chǔ)的 WhatsApp 集成：接收消息，調(diào)用 Claude，然后返回結(jié)果，一次成功。所有的構(gòu)建模塊其實(shí)都是現(xiàn)成的，我用了一個(gè)開源項(xiàng)目來處理 WhatsApp 協(xié)議，用了 Claude Code 的命令行工具來調(diào)用模型，我主要寫的就是些「膠水」代碼。大概花了一兩天時(shí)間就讓它跑起來了，基本功能實(shí)現(xiàn)只花了一個(gè)小時(shí)。

Steinberger 的 Github 主頁，開源項(xiàng)目是真不少

主持人：所以你其實(shí)是把手里已經(jīng)有的現(xiàn)成工具直接組合了起來？

Steinberger：沒錯(cuò)。因?yàn)槲移綍r(shí)更喜歡用包含文字和圖片提示詞，所以后來我又花了五個(gè)小時(shí)加上了圖片支持。之后又加上了音頻，因?yàn)槲蚁胫苯咏o它發(fā)語音，也讓它用語音回復(fù)我。

有一次我去馬拉喀什旅行，我發(fā)現(xiàn)自己用這個(gè)工具的頻率遠(yuǎn)超了預(yù)期，但不是用來編程，更多是用來查餐廳、問路之類的。因?yàn)樗闪斯雀杷阉鳎诼飞咸貏e方便。

最神奇的一次是，我當(dāng)時(shí)根本沒做語音消息支持，但我下意識地給它發(fā)了條語音。我看到輸入狀態(tài)顯示「正在輸入」，結(jié)果 10 秒后，它直接回復(fù)了我。我驚呆了，問它：「你到底是怎么做到的？」

它回復(fù)說：「你發(fā)來的消息里只有一個(gè)文件鏈接，沒有擴(kuò)展名。我檢查了文件頭，發(fā)現(xiàn)是 Opus 格式，就用你 Mac 上的 FFmpeg 把它轉(zhuǎn)成了 Wave 格式。我想用 Whisper，但發(fā)現(xiàn)沒裝，安裝還報(bào)錯(cuò)了。不過，我在你的環(huán)境變量里找到了 OpenAI 的密鑰，所以就用 curl 命令把文件發(fā)給了 OpenAI，拿到轉(zhuǎn)錄文本，然后才回復(fù)了你。」

那一刻，我真的感覺「哇」的一下，就像被打通了。只要你給這些模型足夠的權(quán)限，它們真的是非常聰明、足智多謀的「野獸」。從那以后我就徹底迷上了，用它做了各種奇怪的事。

我認(rèn)為這個(gè)項(xiàng)目既是技術(shù)，也是一種藝術(shù)和探索。從技術(shù)上說，它只是「膠水」，把已有的東西粘合在一起。但從另一個(gè)角度看，它提供了一種全新的交互方式，因?yàn)樗械募夹g(shù)細(xì)節(jié)都消失了。你不需要考慮新的會話、上下文壓縮、用哪個(gè)模型（可能 token 費(fèi)用還是會讓你稍微考慮一下），但通常這些都會被忽略。你只是在和一個(gè)朋友，或者說一個(gè)「幽靈」交談。

022026 年，將是 Personal Assistant 之年

主持人：你的項(xiàng)目在一周內(nèi)經(jīng)歷了現(xiàn)象級的爆火，過去幾天你是怎么過來的？

Steinberger：從睡眠上來說，很糟糕。但這也無比令人興奮。我認(rèn)為去年是「編程智能體」之年，而今年將是「個(gè)人助理」之年。我感覺我喚醒了人們對它的真實(shí)需求。

我不知道 Clawdbot 是否是最終答案，但它應(yīng)該為人們指明了方向。我敢肯定這個(gè)領(lǐng)域會出現(xiàn)大量產(chǎn)品，也肯定有很多人正在瘋狂地開發(fā)。這將是一個(gè)非常有趣的領(lǐng)域。

從 Twitter 爆火，到我們的 Discord 服務(wù)器以我前所未見、無法處理的方式增長，各種事情接踵而至。到后來，我只能把 Discord 上的問題復(fù)制粘貼到 Codex 里，讓它生成回答。再后來，我干脆把整個(gè)頻道的內(nèi)容都扔進(jìn)去，說：「回答這 20 個(gè)最常見的問題。」因?yàn)槿藗儧]意識到，這背后不是一個(gè)公司，只是一個(gè)在家圖個(gè)樂子的家伙。

當(dāng)然，你看代碼提交記錄，可能確實(shí)像個(gè)公司。但這只是因?yàn)楝F(xiàn)在的智能模型太強(qiáng)大了，如果你能駕馭它們，理解它們的「語言」，一個(gè)人就能達(dá)到一年前一個(gè)團(tuán)隊(duì)的產(chǎn)出。

主持人：你的項(xiàng)目可以讓用戶輕松切換使用所有模型，包括他們的競爭對手。他們是什么反應(yīng)？

Steinberger：我這個(gè)項(xiàng)目的一個(gè)前提就是，每個(gè)模型都應(yīng)該能用，包括本地模型。對我來說，這是一個(gè)游樂場，一個(gè)絕佳的學(xué)習(xí)方式。我認(rèn)為每個(gè)人都應(yīng)該嘗試構(gòu)建一個(gè)智能體循環(huán)，探索記憶機(jī)制，這里面有很多有趣的方面。我把它設(shè)計(jì)成插件化的，這樣人們就可以專注于自己的小模塊，而不用去動整個(gè)核心。這有點(diǎn)像 AI 黑客的天堂，而且因?yàn)樗莻€(gè)性化的，所以非常有趣。

主持人：現(xiàn)在很多人都在追求那種能獨(dú)立運(yùn)行幾十個(gè)小時(shí)的超長任務(wù)智能體。你怎么看這個(gè)方向？

Steinberger：我覺得，那種「我們要做一個(gè)能獨(dú)立跑 20 個(gè)小時(shí)的東西」的思路，對我來說有點(diǎn)像個(gè)虛榮指標(biāo)。我的瓶頸從來不是讓智能體跑得更久，真正的瓶頸通常是我自己：我的提示詞，以及我下一步該讓它做什么的思考。

我更喜歡一種參與感更強(qiáng)、更迭代的方式來構(gòu)建軟件。我希望自己能 in the loop，隨時(shí)測試它正在構(gòu)建的東西，看看方向?qū)Σ粚Α１热纾?dāng)它在幫我寫一個(gè)網(wǎng)頁服務(wù)時(shí)，我給它一部分需求，就能親眼看著這個(gè)功能在瀏覽器里一點(diǎn)點(diǎn)成形。這個(gè)過程本身就會激發(fā)我的新想法，讓我知道接下來還能加點(diǎn)什么、可以往哪個(gè)方向走。我可以隨時(shí)去點(diǎn)一點(diǎn)，去感受它。

這種迭代的開發(fā)方式，遠(yuǎn)比你坐下來從理論上把一個(gè)功能規(guī)劃到完美要好得多。因?yàn)榈饶阏娴陌阉鐾炅耍阌謺行碌南敕恕Ｋ裕L時(shí)程運(yùn)行當(dāng)然是一個(gè)值得探索的方向，但在今天的實(shí)際應(yīng)用里，它根本不是瓶頸所在。

03CLI First，Not GUI

主持人：去年大家都在聊 Agent，但焦點(diǎn)好像都在瀏覽器上。我用了Clawdbot之后，感覺大家都搞錯(cuò)方向了。如果能直接跟一個(gè)跨所有應(yīng)用的智能體對話，誰還關(guān)心瀏覽器呢？

Steinberger：是的。我在做這個(gè)項(xiàng)目之前，大部分的準(zhǔn)備工作就是構(gòu)建各種小巧、獨(dú)立的命令行工具（CLI）。我的前提是：圖形用戶界面（GUI）這東西很糟糕，擴(kuò)展性不強(qiáng)。人們圍繞它做了各種奇怪的搜索功能，但真正具備擴(kuò)展能力的是命令行。智能體天生就懂 Unix 系統(tǒng)，你可以在電腦上放一千個(gè)小程序，它們只需要知道程序的名字，調(diào)用一下幫助菜單，就知道該怎么用了。

如果聰明一點(diǎn)，就應(yīng)該按照模型已經(jīng)習(xí)慣的方式去構(gòu)建工具，為模型設(shè)計(jì)，別為人類設(shè)計(jì)。比如，如果模型習(xí)慣調(diào)用 --log 參數(shù)，那你就構(gòu)建一個(gè) --log 參數(shù)。這是一種「智能體驅(qū)動」的開發(fā)思路，你按照它們的思維方式去構(gòu)建，一切都會順暢得多。在某種程度上，是一種全新的軟件。

所以，對大多數(shù)事情我都不需要瀏覽器。我為谷歌服務(wù)、Sonos 音響、攝像頭、家庭自動化系統(tǒng)都構(gòu)建了相應(yīng)的工具。每增加一個(gè)小小的命令行工具和技能，我的智能體就變得更強(qiáng)大、更有趣。到我開始做 WhatsApp 集成的時(shí)候，這些功能很多都已經(jīng)有了，我就是這樣被迷住的。

但有個(gè)問題，我覺得這東西很神奇，可當(dāng)我在 Twitter 上討論它時(shí)，反響卻很平淡，感覺人們沒有理解它的價(jià)值。但我把它展示給我的朋友，包括那些非技術(shù)背景的朋友，他們都搶著想要。所以我知道，我做對了方向，只是科技圈的人還沒反應(yīng)過來。

我一直在持續(xù)開發(fā)，因?yàn)槲易约阂苍谟茫揖褪菫樽约鹤龅摹＿@是一個(gè)開源項(xiàng)目，我的動機(jī)是尋找樂趣、激勵(lì)他人，而不是為了賺大錢，因?yàn)槲乙呀?jīng)有很多錢了。

主持人：我同意你的看法，確實(shí)很奇怪為什么沒有更多公司在做個(gè)人化智能體。我也能預(yù)見到，在不久的將來，每個(gè)人口袋里都會有一個(gè)個(gè)人化智能體，作為他們的助理。

但我想問，這么強(qiáng)大的個(gè)人助理，肯定要給它很多權(quán)限，比如攝像頭、郵箱。你是怎么平衡這種便利和它帶來的巨大安全風(fēng)險(xiǎn)的？

Steinberger：好問題，當(dāng)你用 ChatGPT 或者 Claude 時(shí)，它們本身就有集成功能。大多數(shù)人早就把郵件、日歷、Google Drive 都授權(quán)給它們了。所以，這些模型已經(jīng)掌握了我們的數(shù)據(jù)，這是一個(gè)既成事實(shí)。

我給我的 Claude 一個(gè)可以訪問 Gmail 的 MCP，和你直接在 Claude 官網(wǎng)上添加 Gmail 集成，這兩者之間沒有任何區(qū)別。實(shí)際上，我認(rèn)為直接在官網(wǎng)集成風(fēng)險(xiǎn)更高，因?yàn)槟愀緹o法控制它在后臺做什么。但如果它運(yùn)行在我的電腦上，我至少還能看到日志。所以，我甚至覺得，直接把所有權(quán)限交給那些大公司，比通過我的系統(tǒng)來授權(quán)更危險(xiǎn)。

04大多數(shù) MCP 都應(yīng)該被做成 CLI

主持人：MCP 這個(gè)話題最近在工程師圈子里也很有爭議。你怎么看？

Steinberger 此前曾在一篇博客文章中談?wù)撍麑τ?MCP 的看法：

別人已經(jīng)寫了很多關(guān)于 MCPs 的文章了。在我看來，這大多是市場部門為了湊個(gè)功能清單好拿出去吹噓的東西。幾乎所有的 MCPs 其實(shí)都應(yīng)該是 CLI 工具。這可是我這個(gè)自己寫過 5 個(gè) MCPs 的人說的肺腑之言。

我完全可以直接按名字調(diào)用一個(gè) CLI。在我的智能體文件里不需要任何解釋。智能體會在第一次調(diào)用時(shí)嘗試運(yùn)行它，CLI 會展示幫助菜單，上下文里就有了關(guān)于它如何工作的所有信息，從此咱們就暢通無阻了。我不必為任何工具付出額外代價(jià)，不像 MCPs，在我的上下文中就是持續(xù)的成本和垃圾。用一下 GitHub 的 MCP，眼看著 23k Token 就沒了。天哪，他們確實(shí)優(yōu)化過了，因?yàn)樗鼊偼瞥鰰r(shí)幾乎要消耗 50k Token。或者直接用 gh cli，功能基本一樣，模型也知道怎么用，而且不需要交任何「上下文稅」。

Steinberger：我總說，MCP 是唯一一種開發(fā)者比用戶還多的軟件。你想想看，在大多數(shù)情況下，MCP 只是對 API 的一層包裝。大多數(shù) MCP 都應(yīng)該被直接做成 CLI（命令行工具）。CLI 是我可以調(diào)用并獲得返回的東西，而且它是可組合的。

想象一下，你有一個(gè)天氣服務(wù)，可以返回一個(gè)所有城市的列表。如果它是一個(gè) MCP，我調(diào)用 get_cities，然后得到全部 500 個(gè)城市的數(shù)據(jù)，模型就得在它的上下文中處理這些。但如果它是一個(gè) CLI，我就可以調(diào)用這個(gè)函數(shù)，然后用管道符加上 jq 進(jìn)行過濾，可能最后只得到符合我條件的 5 個(gè)城市。這樣我就節(jié)省了 495 行的上下文垃圾。而且我可以立刻把這 5 個(gè)城市的結(jié)果通過管道傳給下一個(gè)工具，進(jìn)行二次處理，也許是再為這 5 個(gè)城市分別調(diào)用一次天氣服務(wù)，所有這些操作都在一次調(diào)用中完成。

所以，在幾乎所有情況下，CLI 都比 MCP 要好。MCP 唯一的好處是它能保持 state，但這種情況你極少需要。即便需要，通常也可以用磁盤來臨時(shí)存儲。所以我不會說 MCP 完全沒用，但從實(shí)際應(yīng)用來看，它最大的貢獻(xiàn)可能就是推動了一些以前沒有 API 的公司去構(gòu)建了 API。

MCP 的存在更多是為了讓市場部門高興。我構(gòu)建了另一個(gè)叫 MC Porter 的項(xiàng)目，它基本上就是把一個(gè) MCP 轉(zhuǎn)換成一個(gè) CLI。這樣，我的智能體就可以按需發(fā)現(xiàn)工具，我也不用為往上下文中塞滿垃圾而付出代價(jià)。

舉個(gè)例子，如果我的智能體需要用到 Chrome 開發(fā)者工具，它的定義文件大概有 13000 個(gè) token。我總不能每次對話都為這 13000 個(gè) token 付費(fèi)吧。當(dāng)需要時(shí)，它會調(diào)用 MC Porter 來獲取開發(fā)者工具的幫助文檔，就像你使用任何 CLI 一樣。它讀取幫助文檔，學(xué)會如何使用這個(gè)工具，然后就去調(diào)用它。基本上，我用一次額外的調(diào)用，換來了不必一直拖著這些累贅，避免讓每個(gè)會話都變得更笨、更短。

我不知道為什么這種做法沒有被更廣泛地采用。我認(rèn)為這遠(yuǎn)比現(xiàn)在的方式更合理，也更有擴(kuò)展性。我可以擁有 500 個(gè)工具，但我的初始上下文依然是零。這東西在 Unix 系統(tǒng)里已經(jīng)存在 40 年了，智能體非常非常擅長使用 CLI。當(dāng)然，這會增加一些風(fēng)險(xiǎn)，所以你要么構(gòu)建一個(gè)只運(yùn)行你自己的 CLI 的沙箱，要么使用容器。這些問題都是可以解決的。

05未來一大批應(yīng)用會消失，

提示詞就是新界面

Steinberger：同時(shí)，我還觀察到的一個(gè)非常有趣的現(xiàn)象是：一大批應(yīng)用將會逐漸消失。比如，我為什么還需要 MyFitnessPal 這種健身應(yīng)用？我只要拍張食物的照片，我的智能體已經(jīng)知道我正在麥當(dāng)勞做一個(gè)糟糕的決定。結(jié)合這些信息，它能完美匹配出我吃了什么，甚至可能會反過來調(diào)整我的健身計(jì)劃來確保我還能達(dá)標(biāo)。所以，我不再需要那個(gè) App 了。

一大批應(yīng)用都會消失，因?yàn)槟闩c事物的交互方式會變得完全不同，大多數(shù)應(yīng)用會被簡化為API。接下來的問題是，如果我可以把數(shù)據(jù)存在別的地方，我甚至還需要那個(gè) API 嗎？

Steinberger 在社交平臺Mastodon 發(fā)布的帖子：

「Apps will melt away. The prompt is your new interface.」

主持人：這個(gè)轉(zhuǎn)變聽起來很顛覆。但你覺得非技術(shù)背景的普通人，真的會為了這個(gè)去自己折騰部署這些東西嗎？門檻會不會太高了？

Steinberger：我剛參加完一個(gè)線下聚會，碰到一個(gè)來自印第安納州的設(shè)計(jì)機(jī)構(gòu)的人，他沒有寫過一行代碼。他說他去年 12 月初就發(fā)現(xiàn)了我的項(xiàng)目，然后開始使用 Clawdbot。

他說：「我們現(xiàn)在已經(jīng)有了 25 個(gè)網(wǎng)絡(luò)服務(wù)，我們可以為自己需要的任何東西構(gòu)建內(nèi)部工具。」他完全不懂代碼，他只是通過 Telegram 和他的智能體交談，然后智能體就為他構(gòu)建東西。

所以，這里有一個(gè)巨大的轉(zhuǎn)變：你不再需要訂閱那些只提供通用功能的初創(chuàng)公司的服務(wù)。你擁有自己超個(gè)性化的軟件，它能精確解決你的問題，而且還是免費(fèi)的。非技術(shù)人員也在這樣做，因?yàn)樗浅Ｗ匀弧Ｄ阒恍枰f出你的問題，然后這個(gè)東西就會為你構(gòu)建解決方案。而且別忘了，現(xiàn)在的模型是它們有史以來最差的狀態(tài)，未來只會變得越來越好，越來越簡單，越來越快。

06Opus 是最好的模型，

Codex 編程是最靠譜的

主持人：在這么多模型里，你自己最常用或者最喜歡的是哪個(gè)？

Steinberger：從模型能力上來說，Opus 遙遙領(lǐng)先，是最好的。OpenAI 的模型非常可靠，我甚至覺得它作為「員工」更可靠。在編程方面，我更喜歡 Codex，因?yàn)樗荞{馭大型代碼庫。我真的可以只給它一個(gè)提示，然后直接把代碼推送到主分支，我有 95% 的把握它能正常工作。

而用 Claude 的話，你需要更多的技巧和「表演」才能達(dá)到同樣的效果。兩個(gè)都很好，但我用 Codex 能更快地并行工作，因?yàn)樗枰摹甘职咽种笇?dǎo)」更少。

但從「性格」上來說，我不知道他們用什么數(shù)據(jù)訓(xùn)練的模型，里面有多少 Reddit 的內(nèi)容，但模型在 Discord 里的表現(xiàn)非常棒，很像個(gè)人類。它不會在每條消息下都刷屏，而是像在傾聽對話，然后偶爾會拋出一個(gè)金句，真的能讓我笑出來。你知道，這其實(shí)很難，因?yàn)?AI 的笑話通常都很爛。這種體驗(yàn)我只在 Opus 上感受過。所以這是我最喜歡的模型。

這也是為什么當(dāng)我收到 Anthropic 的郵件，要求我給項(xiàng)目改名時(shí)，會覺得有點(diǎn)諷刺。

不過，值得稱贊的是，他們非常友好，沒有派律師來，而是派了內(nèi)部人員溝通。但時(shí)間線有點(diǎn)緊，給一個(gè)有這么大流量的項(xiàng)目改名，簡直是一場災(zāi)難。當(dāng)時(shí)我面臨一些額外的壓力，就想：「管他呢，現(xiàn)在就改！」就像那個(gè)「我們直播搞定」的梗一樣。結(jié)果我這邊剛在 Twitter 上改完名，那邊的新賬號瞬間就被加密貨幣的機(jī)器人搶注了。

主持人：大家都想知道，你自己用 Mac Mini 嗎？你怎么看 Mac Mini？

Steinberger：我的智能體有點(diǎn)像個(gè)「小公主」，它不用 Mac Mini，它用的是頂配版的 Mac Studio，512GB 內(nèi)存，所有配置都拉滿了。因?yàn)槲乙蚕胪嫱姹镜啬Ｐ停@樣我就可以運(yùn)行 MiniMax M2.1，我認(rèn)為這是目前最好的開源模型。當(dāng)然，一臺機(jī)器是不夠的，你可能需要兩三臺。我有點(diǎn)想等蘋果發(fā)布新品。

主持人：從宏觀角度看，你認(rèn)為這種自己運(yùn)行硬件的「黑客文化」模式，未來會有多大比例保留下來？人們最終會轉(zhuǎn)向云托管、一鍵部署這種更簡單、技術(shù)門檻更低的方式嗎？

Steinberger：我不認(rèn)為未來會是每個(gè)人都為了這個(gè)去買一臺 Mac Mini。但我確實(shí)看到，舊有的模式必須改變。比如，一個(gè)公司想要接入 Gmail，審批流程繁瑣到初創(chuàng)公司寧愿去收購另一家已經(jīng)有許可證的公司。但如果你在本地運(yùn)行，就可以繞過所有這些問題。我做過很多命令行工具，就是直接把網(wǎng)站丟給 Codex，說「給我做一個(gè) CLI」。有時(shí)候這可能違反了服務(wù)條款，但說實(shí)話，我不太在乎。這在某種程度上是對大科技公司不愿開放的數(shù)據(jù)的一種解放。

就連 WhatsApp 的集成也是一個(gè)「黑客」手段，它模擬了桌面端使用的協(xié)議。我真的嘗試過支持官方接口，但官方接口是為企業(yè)設(shè)計(jì)的。我作為個(gè)人用戶很快就被封了，最后我一氣之下把官方接口的支持代碼全刪了。

目前還沒有適合這種個(gè)人用例的模式，我認(rèn)為這需要改變。

主持人：那么，接下來有什么計(jì)劃？

Steinberger：現(xiàn)在有很多來自安全研究員的郵件。問題在于，我做這個(gè)是為了好玩，為我自己在一對一的環(huán)境中使用。現(xiàn)在，人們把它用在了不被信任的公共環(huán)境中。所以，所有我之前不在乎的安全威脅模型現(xiàn)在都出現(xiàn)了。

我正被各種報(bào)告轟炸，其中很多還是針對我并不關(guān)心的用例。我還不確定如何處理這個(gè)問題，因?yàn)檎麄€(gè)體系都「壞掉」了。

不過幸運(yùn)的是，我正在組建一個(gè)團(tuán)隊(duì)，確實(shí)有很多人非常關(guān)心這個(gè)項(xiàng)目。所以我認(rèn)為它最終會成為一個(gè)非常安全的產(chǎn)品，因?yàn)楝F(xiàn)在全世界都在「拆解」它。

說實(shí)話，這整個(gè)項(xiàng)目都是「Vibe Coding」出來的，我只是想向人們展示一種可能性，而不是一個(gè)企業(yè)級的成品。我甚至覺得，可能沒有公司敢碰這個(gè)，因?yàn)槲覀冞€沒解決一些根本性問題，比如「提示注入」就沒有解決方案。這其中存在絕對的風(fēng)險(xiǎn)，我也努力在網(wǎng)站和啟動提示里明確說明了：「能力越大，責(zé)任越大」。

現(xiàn)在我正努力把它打造成一個(gè)社區(qū)，它應(yīng)該比我個(gè)人更長久。我也需要幫助，工作量太大了，我不可能一直不睡覺。

主持人：有想過成立一個(gè)真正的公司嗎？還是說你想讓它永遠(yuǎn)保持一個(gè)「黑客社區(qū)」的狀態(tài)？

Steinberger：相比于公司，我更傾向于成立一個(gè)基金會或者非營利組織。不過，我還沒下定決心。

07Agent 的開發(fā)范式很簡單：

Just Talk To It

Steinberger 作為一個(gè)有十多年經(jīng)驗(yàn)的資深工程師，近期常在博客中分享他在做 Agentic Engineering 的經(jīng)驗(yàn)。

其中，他提到一點(diǎn)，非常有意思，叫：「Just Talk To It」。開發(fā)者不應(yīng)該被編寫復(fù)雜的「提示詞工程」或者繁冗的工作流框架所限制住，更多地是應(yīng)該學(xué)會「直接與 AI 交談」。

以下是他的部分博客內(nèi)容：

六月份之前我確實(shí)這么做。設(shè)計(jì)一個(gè)龐大的規(guī)格說明書（Spec），然后讓模型構(gòu)建它，理想情況下讓它跑上幾個(gè)小時(shí)。在我看來，那是構(gòu)建軟件的舊思維。

我目前的方法通常是：開始與 Codex 對話，粘貼一些參考網(wǎng)站、一些想法，讓它閱讀代碼，然后我們一起充實(shí)一個(gè)新功能。如果是棘手的問題，我會讓它把所有內(nèi)容寫成一份 Spec，交給 GPT-5-Pro 審查，看看有沒有更好的主意（令人驚訝的是，它經(jīng)常有，這極大地改進(jìn)了我的計(jì)劃！），然后把我認(rèn)為有用的部分貼回主上下文以更新文件。

現(xiàn)在，我對哪些任務(wù)占用多少上下文心里很有數(shù)，而且 Codex 的上下文空間相當(dāng)充裕，所以通常我就直接開干了。有些人像信教一樣，堅(jiān)持每次都用帶有計(jì)劃的新上下文——在我看來這對 Sonnet 有用，但 GPT-5 處理大上下文的能力強(qiáng)得多，那樣做只會給每件事增加 10 分鐘的開銷，因?yàn)槟Ｐ捅仨毬匦伦ト?gòu)建功能所需的所有文件。

更有趣的方法是做基于 UI 的工作時(shí)。我經(jīng)常從簡單的東西入手，故意把需求描述得很模糊，看著模型構(gòu)建，實(shí)時(shí)觀察瀏覽器的更新。然后我把額外的修改排入隊(duì)列，迭代打磨功能。通常我也不完全確定某個(gè)東西該長什么樣，這種方式讓我可以把玩創(chuàng)意，不斷迭代，看著它慢慢變得生動起來。我經(jīng)常看到 Codex 做出了我甚至沒想到的有趣設(shè)計(jì)。我不重置，我只是迭代，把混亂一步步塑造成我想要的樣子。

通常在構(gòu)建過程中，我會產(chǎn)生相關(guān)交互的想法，并在其他部分進(jìn)行迭代，那部分工作我會交給另一個(gè)智能體。一般來說，我會同時(shí)處理一個(gè)主功能和幾個(gè)相關(guān)的次要任務(wù)。

就在我寫這篇文章的時(shí)候，我正在我的 Chrome 擴(kuò)展里構(gòu)建一個(gè)新的 Twitter 數(shù)據(jù)導(dǎo)入器，為此我正在重構(gòu) GraphQL 導(dǎo)入器。因?yàn)槲也淮_定目前的方案是否正確，所以我把它放在一個(gè)單獨(dú)的文件夾里，這樣我可以查看 PR，判斷那個(gè)方案是否有意義。主倉庫正在進(jìn)行重構(gòu)，所以我可以專心寫這篇文章。

常用的 Slash Commands

我只有幾個(gè)，而且很少用：

/commit（自定義文本，解釋多個(gè)智能體在同一個(gè)文件夾中工作，只提交你修改的部分，這樣我能得到干凈的注釋，而且 GPT 不會對其他變更大驚小怪，也不會在 Linter 失敗時(shí)試圖回滾所有東西）
/automerge（一次處理一個(gè) PR，對機(jī)器人的評論做出反應(yīng)，回復(fù)，讓 CI 變綠，并在變綠時(shí)壓縮合并）
/massageprs（與 automerge 相同但沒有壓縮步驟，這樣如果我有很多 PR，我可以并行處理）
/review（內(nèi)置命令，偶爾用，因?yàn)槲以?GH 上有審查機(jī)器人，但也算有用）

即使有了這些，通常我也只輸入 "commit"，除非我知道有太多臟文件，沒有指引智能體可能會搞砸。當(dāng)我確信當(dāng)前上下文足夠時(shí)，沒必要搞那些花架子浪費(fèi)上下文。再說一次，你會對這些產(chǎn)生直覺。目前我還沒發(fā)現(xiàn)其他真正有用的命令。

還有什么其他技巧？

與其絞盡腦汁寫完美的提示詞來激勵(lì)智能體完成長期任務(wù)，不如用點(diǎn)懶人變通法。如果你在做一個(gè)大的重構(gòu)，Codex 經(jīng)常會以「工作進(jìn)行中」的回復(fù)暫停。如果你想走開不管，只看結(jié)果，那就把「繼續(xù)（continue）」的消息排進(jìn)隊(duì)列。如果 Codex 做完了又收到更多消息，它會愉快地忽略它們。

讓模型在每個(gè)功能/修復(fù)完成后編寫測試。使用相同的上下文。這會產(chǎn)生質(zhì)量更高的測試，而且很可能在實(shí)現(xiàn)過程中發(fā)現(xiàn) Bug。如果是純 UI 調(diào)整，測試可能意義不大，但對于其他任何事情，一定要寫。AI 通常不擅長寫好的測試，但有總比沒有強(qiáng)，老實(shí)說——你會為你做的每個(gè)修復(fù)手動寫測試嗎？

讓模型保留你的意圖，并「在棘手的部分添加代碼注釋」，這對你自己和未來的模型運(yùn)行都有幫助。

當(dāng)問題變得棘手時(shí)，在提示詞里加一些觸發(fā)詞，比如「慢慢來」、「全面一點(diǎn)」、「閱讀所有可能相關(guān)的代碼」、「提出假設(shè)」，能讓 Codex 解決哪怕是最棘手的問題。

Just Talk To It

不要把時(shí)間浪費(fèi)在 RAG、子智能體、Agents 2.0 或其他大多只是「花架子」的東西上。直接跟它對話。去把玩它。培養(yǎng)直覺。你與智能體協(xié)作得越多，你的結(jié)果就會越好。

Simon Willison 的文章提出了一個(gè)極好的觀點(diǎn)：管理智能體所需的許多技能，與你管理工程師時(shí)所需的技能如出一轍，幾乎所有這些都是高級軟件工程師的特質(zhì)。

是的，編寫好的軟件依然很難。僅僅因?yàn)槲也辉儆H手寫代碼，并不意味著我不去深入思考架構(gòu)、系統(tǒng)設(shè)計(jì)、依賴關(guān)系、功能特性或如何取悅用戶。使用 AI 只是意味著，我們對交付成果的期望值變高了。

轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.