<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Clawdbot開發(fā)者:未來一大批應(yīng)用都會消失,提示詞就是新的interface

      0
      分享至

      Clawdbot(最近改名叫 Maltbot),目前最熱門的 AI 項(xiàng)目,不光是在 X 上「一夜成名」,在谷歌上的搜索量更是直接超過了 Claude Code、Codex。

      X 上的網(wǎng)友制作了一張 Clawdbot 在 Github 的標(biāo)星增長趨勢對比圖,幾乎是直線上漲,現(xiàn)在已經(jīng)到了 98K。


      Clawdbot 背后的開發(fā)者 Peter Steinberger,是一個(gè)特別有意思的老哥。iOS 生態(tài)系統(tǒng)最早的一批開發(fā)者之一,開發(fā)經(jīng)驗(yàn)可以追溯到 iOS 2.0 時(shí)代。在開源社區(qū)貢獻(xiàn)了非常多項(xiàng)目。

      2011 年,Steinberger 創(chuàng)立了 PSPDFKit,用 13 年時(shí)間把它從開發(fā)者工具搞成了 B2B 軟件巨頭。以超過 1 億歐元的價(jià)格賣掉后,實(shí)現(xiàn)財(cái)富自由的 Steinberger 感到非常破碎、空虛,甚至通過排隊(duì)、派對、心理治療各種方式填補(bǔ)空虛。

      于是,「退休」三年后,Steinberger 重新回來了。Steinberger 在最新采訪中提到,

      早在去年五月份,我就有了做個(gè)人 Agent 的想法,那會兒 GPT-4 被 GPT-4o 替代,當(dāng)時(shí)覺得模型還不夠好,但我當(dāng)時(shí)又覺得,這事大公司未來幾個(gè)月肯定會做。可是等到了 11 月,我發(fā)現(xiàn)市面上還是沒有我想要的個(gè)人智能體。 于是,我決定自己搞。這基本就是 Clawdbot 項(xiàng)目的起點(diǎn)了。

      在最近的采訪中,Steinberger 分享了很多有趣的觀點(diǎn):

      • 今年將是「個(gè)人助理」之年。我感覺我喚醒了人們對它的真實(shí)需求。我認(rèn)為每個(gè)人都應(yīng)該嘗試構(gòu)建一個(gè) Agent,探索記憶機(jī)制。

      • 「我們要做一個(gè)能獨(dú)立跑 20 個(gè)小時(shí)的東西」,對我來說有點(diǎn)像個(gè)虛榮指標(biāo)。我的瓶頸從來不是讓智能體跑得更久,真正的瓶頸通常是我自己:我的提示詞,以及我下一步該讓它做什么的思考。

      • GUI 這東西很糟糕,擴(kuò)展性不強(qiáng)。人們圍繞它做了各種奇怪的搜索功能,但真正具備擴(kuò)展能力的應(yīng)該是 CLI。

      • 如果聰明一點(diǎn),就應(yīng)該按照模型已經(jīng)習(xí)慣的方式去構(gòu)建工具,為模型設(shè)計(jì),別為人類設(shè)計(jì)。

      • 大多數(shù) MCP 都應(yīng)該被做成 CLI。MCP 的存在更多是為了讓市場部門高興,唯一的好處是它能保持 state,但這種情況你極少需要。但 CLI 是可以調(diào)用并獲得返回的東西,而且是可組合的。

      • 未來一大批應(yīng)用會消失,提示詞就是新界面。因?yàn)槟愫褪挛锏慕换シ绞綍兊猛耆煌蠖鄶?shù)應(yīng)用會被簡化為 API。

      • 你不再需要訂閱那些只提供通用功能的初創(chuàng)公司的服務(wù)。你擁有自己超個(gè)性化的軟件,它能精確解決你的問題,而且還是免費(fèi)的。

      ??關(guān)注 Founder Park,最及時(shí)最干貨的創(chuàng)業(yè)分享

      Founder Park 聯(lián)合扣子,舉辦了一場 Skill 招募大賽。如果你手里有一套在用、能交付結(jié)果的方法論,很適合來試試!

      歡迎飛書掃碼加群:

      進(jìn)群后,你有機(jī)會得到:

      • 可落地的 Skill 搭建方法

        從一個(gè)想法或一套 SOP,拆解成真正能跑起來的 Skill

      • Skill 的展示與放大通道

        不只是自己用,而是被更多人看到、用到

      • 被看見后的實(shí)際激勵(lì)

        好的 Skill,有機(jī)會獲得明確回報(bào)

      01從解決自己的問題出發(fā),

      一個(gè)小時(shí)搞定原型

      主持人你是怎么開始做 Clawdbot 這個(gè)項(xiàng)目的?我看你之前也做了不少有意思的東西項(xiàng)目?

      Steinberger:說實(shí)話,我的核心信條就是「我要玩得開心」。學(xué)習(xí)這些新技術(shù)的最好方式就是去玩、去折騰。所以我做了很多有意思的小東西,嘗試了不同的語言和方法。

      我管這個(gè)叫 agentic engineering,我不太喜歡 vibe coding 這個(gè)詞。當(dāng)然,有時(shí)候我也開玩笑說,白天搞「agentic engineering」,凌晨三點(diǎn)就開始 vibe coding,然后第二天就后悔當(dāng)時(shí)怎么沒去睡覺。

      其實(shí)早在去年五月份,我就有了做個(gè)人 Agent 的想法,那會兒 GPT-4 被 GPT-4o 替代,當(dāng)時(shí)覺得模型還不夠好,但我當(dāng)時(shí)又覺得,這事大公司未來幾個(gè)月肯定會做,我干嘛要費(fèi)這個(gè)勁呢?我等著他們做得更好就行了。

      所以當(dāng)時(shí)我更多探索怎么用 Agent 來更快地構(gòu)建軟件。我的技術(shù)背景主要集中在做 iOS 和 macOS 開發(fā),但對于最新的項(xiàng)目,我非常想做一些 Web 相關(guān)的東西。距離上一次做 Web 開發(fā)已經(jīng)過去太久了。你知道那種感覺,當(dāng)你在一個(gè)領(lǐng)域是專家,換到另一個(gè)領(lǐng)域卻要從最基礎(chǔ)的東西搜起,非常打擊自尊心。

      AI 的出現(xiàn)正好是完美的契機(jī),我越用越上癮,也越來越懂怎么跟這些工具打交道。

      直到去年 11 月,我發(fā)現(xiàn)市面上還是沒有我想要的個(gè)人智能體。尤其是我在用 Codex 做一些長時(shí)間任務(wù)時(shí),總得有人在那盯著,然后不斷輸入「continue」。有段時(shí)間,我感覺自己就像一臺「continue」打字機(jī)。我當(dāng)時(shí)就想,為什么不能讓一個(gè) AI 來幫我干這件事呢?「為什么我沒有一個(gè)智能體來照看我的其他智能體呢?」這基本上就是 Clawdbot 項(xiàng)目的起點(diǎn)了。

      主持人:所以是為了解決自己這個(gè)痛點(diǎn),然后動手做了?

      Steinberger:對。當(dāng)時(shí)我想,能不能在 WhatsApp 上跟我的電腦聊天?這樣當(dāng)我的智能體在跑任務(wù)時(shí),我去廚房倒杯水也能隨時(shí)看看進(jìn)度,或者給它發(fā)點(diǎn)小指令。

      于是,我花了一個(gè)小時(shí)就搞定了基礎(chǔ)的 WhatsApp 集成:接收消息,調(diào)用 Claude,然后返回結(jié)果,一次成功。所有的構(gòu)建模塊其實(shí)都是現(xiàn)成的,我用了一個(gè)開源項(xiàng)目來處理 WhatsApp 協(xié)議,用了 Claude Code 的命令行工具來調(diào)用模型,我主要寫的就是些「膠水」代碼。大概花了一兩天時(shí)間就讓它跑起來了,基本功能實(shí)現(xiàn)只花了一個(gè)小時(shí)。


      Steinberger 的 Github 主頁,開源項(xiàng)目是真不少

      主持人:所以你其實(shí)是把手里已經(jīng)有的現(xiàn)成工具直接組合了起來?

      Steinberger:沒錯(cuò)。因?yàn)槲移綍r(shí)更喜歡用包含文字和圖片提示詞,所以后來我又花了五個(gè)小時(shí)加上了圖片支持。之后又加上了音頻,因?yàn)槲蚁胫苯咏o它發(fā)語音,也讓它用語音回復(fù)我。

      有一次我去馬拉喀什旅行,我發(fā)現(xiàn)自己用這個(gè)工具的頻率遠(yuǎn)超了預(yù)期,但不是用來編程,更多是用來查餐廳、問路之類的。因?yàn)樗闪斯雀杷阉鳎诼飞咸貏e方便。

      最神奇的一次是,我當(dāng)時(shí)根本沒做語音消息支持,但我下意識地給它發(fā)了條語音。我看到輸入狀態(tài)顯示「正在輸入」,結(jié)果 10 秒后,它直接回復(fù)了我。我驚呆了,問它:「你到底是怎么做到的?」

      它回復(fù)說:「你發(fā)來的消息里只有一個(gè)文件鏈接,沒有擴(kuò)展名。我檢查了文件頭,發(fā)現(xiàn)是 Opus 格式,就用你 Mac 上的 FFmpeg 把它轉(zhuǎn)成了 Wave 格式。我想用 Whisper,但發(fā)現(xiàn)沒裝,安裝還報(bào)錯(cuò)了。不過,我在你的環(huán)境變量里找到了 OpenAI 的密鑰,所以就用 curl 命令把文件發(fā)給了 OpenAI,拿到轉(zhuǎn)錄文本,然后才回復(fù)了你。」

      那一刻,我真的感覺「哇」的一下,就像被打通了。只要你給這些模型足夠的權(quán)限,它們真的是非常聰明、足智多謀的「野獸」。從那以后我就徹底迷上了,用它做了各種奇怪的事。

      我認(rèn)為這個(gè)項(xiàng)目既是技術(shù),也是一種藝術(shù)和探索。從技術(shù)上說,它只是「膠水」,把已有的東西粘合在一起。但從另一個(gè)角度看,它提供了一種全新的交互方式,因?yàn)樗械募夹g(shù)細(xì)節(jié)都消失了。你不需要考慮新的會話、上下文壓縮、用哪個(gè)模型(可能 token 費(fèi)用還是會讓你稍微考慮一下),但通常這些都會被忽略。你只是在和一個(gè)朋友,或者說一個(gè)「幽靈」交談。

      022026 年,將是 Personal Assistant 之年

      主持人:你的項(xiàng)目在一周內(nèi)經(jīng)歷了現(xiàn)象級的爆火,過去幾天你是怎么過來的?

      Steinberger:從睡眠上來說,很糟糕。但這也無比令人興奮。我認(rèn)為去年是「編程智能體」之年,而今年將是「個(gè)人助理」之年。我感覺我喚醒了人們對它的真實(shí)需求。

      我不知道 Clawdbot 是否是最終答案,但它應(yīng)該為人們指明了方向。我敢肯定這個(gè)領(lǐng)域會出現(xiàn)大量產(chǎn)品,也肯定有很多人正在瘋狂地開發(fā)。這將是一個(gè)非常有趣的領(lǐng)域。

      從 Twitter 爆火,到我們的 Discord 服務(wù)器以我前所未見、無法處理的方式增長,各種事情接踵而至。到后來,我只能把 Discord 上的問題復(fù)制粘貼到 Codex 里,讓它生成回答。再后來,我干脆把整個(gè)頻道的內(nèi)容都扔進(jìn)去,說:「回答這 20 個(gè)最常見的問題。」因?yàn)槿藗儧]意識到,這背后不是一個(gè)公司,只是一個(gè)在家圖個(gè)樂子的家伙。

      當(dāng)然,你看代碼提交記錄,可能確實(shí)像個(gè)公司。但這只是因?yàn)楝F(xiàn)在的智能模型太強(qiáng)大了,如果你能駕馭它們,理解它們的「語言」,一個(gè)人就能達(dá)到一年前一個(gè)團(tuán)隊(duì)的產(chǎn)出。

      主持人:你的項(xiàng)目可以讓用戶輕松切換使用所有模型,包括他們的競爭對手。他們是什么反應(yīng)?

      Steinberger:我這個(gè)項(xiàng)目的一個(gè)前提就是,每個(gè)模型都應(yīng)該能用,包括本地模型。對我來說,這是一個(gè)游樂場,一個(gè)絕佳的學(xué)習(xí)方式。我認(rèn)為每個(gè)人都應(yīng)該嘗試構(gòu)建一個(gè)智能體循環(huán),探索記憶機(jī)制,這里面有很多有趣的方面。我把它設(shè)計(jì)成插件化的,這樣人們就可以專注于自己的小模塊,而不用去動整個(gè)核心。這有點(diǎn)像 AI 黑客的天堂,而且因?yàn)樗莻€(gè)性化的,所以非常有趣。

      主持人:現(xiàn)在很多人都在追求那種能獨(dú)立運(yùn)行幾十個(gè)小時(shí)的超長任務(wù)智能體。你怎么看這個(gè)方向?

      Steinberger:我覺得,那種「我們要做一個(gè)能獨(dú)立跑 20 個(gè)小時(shí)的東西」的思路,對我來說有點(diǎn)像個(gè)虛榮指標(biāo)。我的瓶頸從來不是讓智能體跑得更久,真正的瓶頸通常是我自己:我的提示詞,以及我下一步該讓它做什么的思考。

      我更喜歡一種參與感更強(qiáng)、更迭代的方式來構(gòu)建軟件。我希望自己能 in the loop,隨時(shí)測試它正在構(gòu)建的東西,看看方向?qū)Σ粚Α1热纾?dāng)它在幫我寫一個(gè)網(wǎng)頁服務(wù)時(shí),我給它一部分需求,就能親眼看著這個(gè)功能在瀏覽器里一點(diǎn)點(diǎn)成形。這個(gè)過程本身就會激發(fā)我的新想法,讓我知道接下來還能加點(diǎn)什么、可以往哪個(gè)方向走。我可以隨時(shí)去點(diǎn)一點(diǎn),去感受它。

      這種迭代的開發(fā)方式,遠(yuǎn)比你坐下來從理論上把一個(gè)功能規(guī)劃到完美要好得多。因?yàn)榈饶阏娴陌阉鐾炅耍阌謺行碌南敕恕K裕L時(shí)程運(yùn)行當(dāng)然是一個(gè)值得探索的方向,但在今天的實(shí)際應(yīng)用里,它根本不是瓶頸所在。

      03CLI First,Not GUI

      主持人:去年大家都在聊 Agent,但焦點(diǎn)好像都在瀏覽器上。我用了Clawdbot之后,感覺大家都搞錯(cuò)方向了。如果能直接跟一個(gè)跨所有應(yīng)用的智能體對話,誰還關(guān)心瀏覽器呢?

      Steinberger:是的。我在做這個(gè)項(xiàng)目之前,大部分的準(zhǔn)備工作就是構(gòu)建各種小巧、獨(dú)立的命令行工具(CLI)。我的前提是:圖形用戶界面(GUI)這東西很糟糕,擴(kuò)展性不強(qiáng)。人們圍繞它做了各種奇怪的搜索功能,但真正具備擴(kuò)展能力的是命令行。智能體天生就懂 Unix 系統(tǒng),你可以在電腦上放一千個(gè)小程序,它們只需要知道程序的名字,調(diào)用一下幫助菜單,就知道該怎么用了。

      如果聰明一點(diǎn),就應(yīng)該按照模型已經(jīng)習(xí)慣的方式去構(gòu)建工具,為模型設(shè)計(jì),別為人類設(shè)計(jì)。比如,如果模型習(xí)慣調(diào)用 --log 參數(shù),那你就構(gòu)建一個(gè) --log 參數(shù)。這是一種「智能體驅(qū)動」的開發(fā)思路,你按照它們的思維方式去構(gòu)建,一切都會順暢得多。在某種程度上,是一種全新的軟件。

      所以,對大多數(shù)事情我都不需要瀏覽器。我為谷歌服務(wù)、Sonos 音響、攝像頭、家庭自動化系統(tǒng)都構(gòu)建了相應(yīng)的工具。每增加一個(gè)小小的命令行工具和技能,我的智能體就變得更強(qiáng)大、更有趣。到我開始做 WhatsApp 集成的時(shí)候,這些功能很多都已經(jīng)有了,我就是這樣被迷住的。

      但有個(gè)問題,我覺得這東西很神奇,可當(dāng)我在 Twitter 上討論它時(shí),反響卻很平淡,感覺人們沒有理解它的價(jià)值。但我把它展示給我的朋友,包括那些非技術(shù)背景的朋友,他們都搶著想要。所以我知道,我做對了方向,只是科技圈的人還沒反應(yīng)過來。

      我一直在持續(xù)開發(fā),因?yàn)槲易约阂苍谟茫揖褪菫樽约鹤龅摹_@是一個(gè)開源項(xiàng)目,我的動機(jī)是尋找樂趣、激勵(lì)他人,而不是為了賺大錢,因?yàn)槲乙呀?jīng)有很多錢了。

      主持人:我同意你的看法,確實(shí)很奇怪為什么沒有更多公司在做個(gè)人化智能體。我也能預(yù)見到,在不久的將來,每個(gè)人口袋里都會有一個(gè)個(gè)人化智能體,作為他們的助理。

      但我想問,這么強(qiáng)大的個(gè)人助理,肯定要給它很多權(quán)限,比如攝像頭、郵箱。你是怎么平衡這種便利和它帶來的巨大安全風(fēng)險(xiǎn)的?

      Steinberger:好問題,當(dāng)你用 ChatGPT 或者 Claude 時(shí),它們本身就有集成功能。大多數(shù)人早就把郵件、日歷、Google Drive 都授權(quán)給它們了。所以,這些模型已經(jīng)掌握了我們的數(shù)據(jù),這是一個(gè)既成事實(shí)。

      我給我的 Claude 一個(gè)可以訪問 Gmail 的 MCP,和你直接在 Claude 官網(wǎng)上添加 Gmail 集成,這兩者之間沒有任何區(qū)別。實(shí)際上,我認(rèn)為直接在官網(wǎng)集成風(fēng)險(xiǎn)更高,因?yàn)槟愀緹o法控制它在后臺做什么。但如果它運(yùn)行在我的電腦上,我至少還能看到日志。所以,我甚至覺得,直接把所有權(quán)限交給那些大公司,比通過我的系統(tǒng)來授權(quán)更危險(xiǎn)。

      04大多數(shù) MCP 都應(yīng)該被做成 CLI

      主持人:MCP 這個(gè)話題最近在工程師圈子里也很有爭議。你怎么看?

      Steinberger 此前曾在一篇博客文章中談?wù)撍麑τ?MCP 的看法:

      別人已經(jīng)寫了很多關(guān)于 MCPs 的文章了。在我看來,這大多是市場部門為了湊個(gè)功能清單好拿出去吹噓的東西。幾乎所有的 MCPs 其實(shí)都應(yīng)該是 CLI 工具。這可是我這個(gè)自己寫過 5 個(gè) MCPs 的人說的肺腑之言。

      我完全可以直接按名字調(diào)用一個(gè) CLI。在我的智能體文件里不需要任何解釋。智能體會在第一次調(diào)用時(shí)嘗試運(yùn)行它,CLI 會展示幫助菜單,上下文里就有了關(guān)于它如何工作的所有信息,從此咱們就暢通無阻了。我不必為任何工具付出額外代價(jià),不像 MCPs,在我的上下文中就是持續(xù)的成本和垃圾。用一下 GitHub 的 MCP,眼看著 23k Token 就沒了。天哪,他們確實(shí)優(yōu)化過了,因?yàn)樗鼊偼瞥鰰r(shí)幾乎要消耗 50k Token。或者直接用 gh cli,功能基本一樣,模型也知道怎么用,而且不需要交任何「上下文稅」。

      Steinberger:我總說,MCP 是唯一一種開發(fā)者比用戶還多的軟件。你想想看,在大多數(shù)情況下,MCP 只是對 API 的一層包裝。大多數(shù) MCP 都應(yīng)該被直接做成 CLI(命令行工具)。CLI 是我可以調(diào)用并獲得返回的東西,而且它是可組合的。

      想象一下,你有一個(gè)天氣服務(wù),可以返回一個(gè)所有城市的列表。如果它是一個(gè) MCP,我調(diào)用 get_cities,然后得到全部 500 個(gè)城市的數(shù)據(jù),模型就得在它的上下文中處理這些。但如果它是一個(gè) CLI,我就可以調(diào)用這個(gè)函數(shù),然后用管道符加上 jq 進(jìn)行過濾,可能最后只得到符合我條件的 5 個(gè)城市。這樣我就節(jié)省了 495 行的上下文垃圾。而且我可以立刻把這 5 個(gè)城市的結(jié)果通過管道傳給下一個(gè)工具,進(jìn)行二次處理,也許是再為這 5 個(gè)城市分別調(diào)用一次天氣服務(wù),所有這些操作都在一次調(diào)用中完成。

      所以,在幾乎所有情況下,CLI 都比 MCP 要好。MCP 唯一的好處是它能保持 state,但這種情況你極少需要。即便需要,通常也可以用磁盤來臨時(shí)存儲。所以我不會說 MCP 完全沒用,但從實(shí)際應(yīng)用來看,它最大的貢獻(xiàn)可能就是推動了一些以前沒有 API 的公司去構(gòu)建了 API。

      MCP 的存在更多是為了讓市場部門高興。我構(gòu)建了另一個(gè)叫 MC Porter 的項(xiàng)目,它基本上就是把一個(gè) MCP 轉(zhuǎn)換成一個(gè) CLI。這樣,我的智能體就可以按需發(fā)現(xiàn)工具,我也不用為往上下文中塞滿垃圾而付出代價(jià)。

      舉個(gè)例子,如果我的智能體需要用到 Chrome 開發(fā)者工具,它的定義文件大概有 13000 個(gè) token。我總不能每次對話都為這 13000 個(gè) token 付費(fèi)吧。當(dāng)需要時(shí),它會調(diào)用 MC Porter 來獲取開發(fā)者工具的幫助文檔,就像你使用任何 CLI 一樣。它讀取幫助文檔,學(xué)會如何使用這個(gè)工具,然后就去調(diào)用它。基本上,我用一次額外的調(diào)用,換來了不必一直拖著這些累贅,避免讓每個(gè)會話都變得更笨、更短。

      我不知道為什么這種做法沒有被更廣泛地采用。我認(rèn)為這遠(yuǎn)比現(xiàn)在的方式更合理,也更有擴(kuò)展性。我可以擁有 500 個(gè)工具,但我的初始上下文依然是零。這東西在 Unix 系統(tǒng)里已經(jīng)存在 40 年了,智能體非常非常擅長使用 CLI。當(dāng)然,這會增加一些風(fēng)險(xiǎn),所以你要么構(gòu)建一個(gè)只運(yùn)行你自己的 CLI 的沙箱,要么使用容器。這些問題都是可以解決的。

      05未來一大批應(yīng)用會消失,

      提示詞就是新界面

      Steinberger:同時(shí),我還觀察到的一個(gè)非常有趣的現(xiàn)象是:一大批應(yīng)用將會逐漸消失。比如,我為什么還需要 MyFitnessPal 這種健身應(yīng)用?我只要拍張食物的照片,我的智能體已經(jīng)知道我正在麥當(dāng)勞做一個(gè)糟糕的決定。結(jié)合這些信息,它能完美匹配出我吃了什么,甚至可能會反過來調(diào)整我的健身計(jì)劃來確保我還能達(dá)標(biāo)。所以,我不再需要那個(gè) App 了。

      一大批應(yīng)用都會消失,因?yàn)槟闩c事物的交互方式會變得完全不同,大多數(shù)應(yīng)用會被簡化為API接下來的問題是,如果我可以把數(shù)據(jù)存在別的地方,我甚至還需要那個(gè) API 嗎?


      Steinberger 在社交平臺Mastodon 發(fā)布的帖子:

      「Apps will melt away. The prompt is your new interface.」

      主持人:這個(gè)轉(zhuǎn)變聽起來很顛覆。但你覺得非技術(shù)背景的普通人,真的會為了這個(gè)去自己折騰部署這些東西嗎?門檻會不會太高了?

      Steinberger:我剛參加完一個(gè)線下聚會,碰到一個(gè)來自印第安納州的設(shè)計(jì)機(jī)構(gòu)的人,他沒有寫過一行代碼。他說他去年 12 月初就發(fā)現(xiàn)了我的項(xiàng)目,然后開始使用 Clawdbot。

      他說:「我們現(xiàn)在已經(jīng)有了 25 個(gè)網(wǎng)絡(luò)服務(wù),我們可以為自己需要的任何東西構(gòu)建內(nèi)部工具。」他完全不懂代碼,他只是通過 Telegram 和他的智能體交談,然后智能體就為他構(gòu)建東西。

      所以,這里有一個(gè)巨大的轉(zhuǎn)變:你不再需要訂閱那些只提供通用功能的初創(chuàng)公司的服務(wù)。你擁有自己超個(gè)性化的軟件,它能精確解決你的問題,而且還是免費(fèi)的。非技術(shù)人員也在這樣做,因?yàn)樗浅W匀弧D阒恍枰f出你的問題,然后這個(gè)東西就會為你構(gòu)建解決方案。而且別忘了,現(xiàn)在的模型是它們有史以來最差的狀態(tài),未來只會變得越來越好,越來越簡單,越來越快。

      06Opus 是最好的模型,

      Codex 編程是最靠譜的

      主持人:在這么多模型里,你自己最常用或者最喜歡的是哪個(gè)?

      Steinberger:從模型能力上來說,Opus 遙遙領(lǐng)先,是最好的。OpenAI 的模型非常可靠,我甚至覺得它作為「員工」更可靠。在編程方面,我更喜歡 Codex,因?yàn)樗荞{馭大型代碼庫。我真的可以只給它一個(gè)提示,然后直接把代碼推送到主分支,我有 95% 的把握它能正常工作。

      而用 Claude 的話,你需要更多的技巧和「表演」才能達(dá)到同樣的效果。兩個(gè)都很好,但我用 Codex 能更快地并行工作,因?yàn)樗枰摹甘职咽种笇?dǎo)」更少。

      但從「性格」上來說,我不知道他們用什么數(shù)據(jù)訓(xùn)練的模型,里面有多少 Reddit 的內(nèi)容,但模型在 Discord 里的表現(xiàn)非常棒,很像個(gè)人類。它不會在每條消息下都刷屏,而是像在傾聽對話,然后偶爾會拋出一個(gè)金句,真的能讓我笑出來。你知道,這其實(shí)很難,因?yàn)?AI 的笑話通常都很爛。這種體驗(yàn)我只在 Opus 上感受過。所以這是我最喜歡的模型。

      這也是為什么當(dāng)我收到 Anthropic 的郵件,要求我給項(xiàng)目改名時(shí),會覺得有點(diǎn)諷刺。

      不過,值得稱贊的是,他們非常友好,沒有派律師來,而是派了內(nèi)部人員溝通。但時(shí)間線有點(diǎn)緊,給一個(gè)有這么大流量的項(xiàng)目改名,簡直是一場災(zāi)難。當(dāng)時(shí)我面臨一些額外的壓力,就想:「管他呢,現(xiàn)在就改!」就像那個(gè)「我們直播搞定」的梗一樣。結(jié)果我這邊剛在 Twitter 上改完名,那邊的新賬號瞬間就被加密貨幣的機(jī)器人搶注了。

      主持人:大家都想知道,你自己用 Mac Mini 嗎?你怎么看 Mac Mini?

      Steinberger:我的智能體有點(diǎn)像個(gè)「小公主」,它不用 Mac Mini,它用的是頂配版的 Mac Studio,512GB 內(nèi)存,所有配置都拉滿了。因?yàn)槲乙蚕胪嫱姹镜啬P停@樣我就可以運(yùn)行 MiniMax M2.1,我認(rèn)為這是目前最好的開源模型。當(dāng)然,一臺機(jī)器是不夠的,你可能需要兩三臺。我有點(diǎn)想等蘋果發(fā)布新品。

      主持人:從宏觀角度看,你認(rèn)為這種自己運(yùn)行硬件的「黑客文化」模式,未來會有多大比例保留下來?人們最終會轉(zhuǎn)向云托管、一鍵部署這種更簡單、技術(shù)門檻更低的方式嗎?

      Steinberger:我不認(rèn)為未來會是每個(gè)人都為了這個(gè)去買一臺 Mac Mini。但我確實(shí)看到,舊有的模式必須改變。比如,一個(gè)公司想要接入 Gmail,審批流程繁瑣到初創(chuàng)公司寧愿去收購另一家已經(jīng)有許可證的公司。但如果你在本地運(yùn)行,就可以繞過所有這些問題。我做過很多命令行工具,就是直接把網(wǎng)站丟給 Codex,說「給我做一個(gè) CLI」。有時(shí)候這可能違反了服務(wù)條款,但說實(shí)話,我不太在乎。這在某種程度上是對大科技公司不愿開放的數(shù)據(jù)的一種解放。

      就連 WhatsApp 的集成也是一個(gè)「黑客」手段,它模擬了桌面端使用的協(xié)議。我真的嘗試過支持官方接口,但官方接口是為企業(yè)設(shè)計(jì)的。我作為個(gè)人用戶很快就被封了,最后我一氣之下把官方接口的支持代碼全刪了。

      目前還沒有適合這種個(gè)人用例的模式,我認(rèn)為這需要改變。

      主持人:那么,接下來有什么計(jì)劃?

      Steinberger:現(xiàn)在有很多來自安全研究員的郵件。問題在于,我做這個(gè)是為了好玩,為我自己在一對一的環(huán)境中使用。現(xiàn)在,人們把它用在了不被信任的公共環(huán)境中。所以,所有我之前不在乎的安全威脅模型現(xiàn)在都出現(xiàn)了。

      我正被各種報(bào)告轟炸,其中很多還是針對我并不關(guān)心的用例。我還不確定如何處理這個(gè)問題,因?yàn)檎麄€(gè)體系都「壞掉」了。

      不過幸運(yùn)的是,我正在組建一個(gè)團(tuán)隊(duì),確實(shí)有很多人非常關(guān)心這個(gè)項(xiàng)目。所以我認(rèn)為它最終會成為一個(gè)非常安全的產(chǎn)品,因?yàn)楝F(xiàn)在全世界都在「拆解」它。

      說實(shí)話,這整個(gè)項(xiàng)目都是「Vibe Coding」出來的,我只是想向人們展示一種可能性,而不是一個(gè)企業(yè)級的成品。我甚至覺得,可能沒有公司敢碰這個(gè),因?yàn)槲覀冞€沒解決一些根本性問題,比如「提示注入」就沒有解決方案。這其中存在絕對的風(fēng)險(xiǎn),我也努力在網(wǎng)站和啟動提示里明確說明了:「能力越大,責(zé)任越大」。

      現(xiàn)在我正努力把它打造成一個(gè)社區(qū),它應(yīng)該比我個(gè)人更長久。我也需要幫助,工作量太大了,我不可能一直不睡覺。

      主持人:有想過成立一個(gè)真正的公司嗎?還是說你想讓它永遠(yuǎn)保持一個(gè)「黑客社區(qū)」的狀態(tài)?

      Steinberger:相比于公司,我更傾向于成立一個(gè)基金會或者非營利組織。不過,我還沒下定決心。

      07Agent 的開發(fā)范式很簡單:

      Just Talk To It

      Steinberger 作為一個(gè)有十多年經(jīng)驗(yàn)的資深工程師,近期常在博客中分享他在做 Agentic Engineering 的經(jīng)驗(yàn)。

      其中,他提到一點(diǎn),非常有意思,叫:「Just Talk To It」。開發(fā)者不應(yīng)該被編寫復(fù)雜的「提示詞工程」或者繁冗的工作流框架所限制住,更多地是應(yīng)該學(xué)會「直接與 AI 交談」。

      以下是他的部分博客內(nèi)容:

      六月份之前我確實(shí)這么做。設(shè)計(jì)一個(gè)龐大的規(guī)格說明書(Spec),然后讓模型構(gòu)建它,理想情況下讓它跑上幾個(gè)小時(shí)。在我看來,那是構(gòu)建軟件的舊思維。

      我目前的方法通常是:開始與 Codex 對話,粘貼一些參考網(wǎng)站、一些想法,讓它閱讀代碼,然后我們一起充實(shí)一個(gè)新功能。如果是棘手的問題,我會讓它把所有內(nèi)容寫成一份 Spec,交給 GPT-5-Pro 審查,看看有沒有更好的主意(令人驚訝的是,它經(jīng)常有,這極大地改進(jìn)了我的計(jì)劃!),然后把我認(rèn)為有用的部分貼回主上下文以更新文件。

      現(xiàn)在,我對哪些任務(wù)占用多少上下文心里很有數(shù),而且 Codex 的上下文空間相當(dāng)充裕,所以通常我就直接開干了。有些人像信教一樣,堅(jiān)持每次都用帶有計(jì)劃的新上下文——在我看來這對 Sonnet 有用,但 GPT-5 處理大上下文的能力強(qiáng)得多,那樣做只會給每件事增加 10 分鐘的開銷,因?yàn)槟P捅仨毬匦伦ト?gòu)建功能所需的所有文件。

      更有趣的方法是做基于 UI 的工作時(shí)。我經(jīng)常從簡單的東西入手,故意把需求描述得很模糊,看著模型構(gòu)建,實(shí)時(shí)觀察瀏覽器的更新。然后我把額外的修改排入隊(duì)列,迭代打磨功能。通常我也不完全確定某個(gè)東西該長什么樣,這種方式讓我可以把玩創(chuàng)意,不斷迭代,看著它慢慢變得生動起來。我經(jīng)常看到 Codex 做出了我甚至沒想到的有趣設(shè)計(jì)。我不重置,我只是迭代,把混亂一步步塑造成我想要的樣子。

      通常在構(gòu)建過程中,我會產(chǎn)生相關(guān)交互的想法,并在其他部分進(jìn)行迭代,那部分工作我會交給另一個(gè)智能體。一般來說,我會同時(shí)處理一個(gè)主功能和幾個(gè)相關(guān)的次要任務(wù)。

      就在我寫這篇文章的時(shí)候,我正在我的 Chrome 擴(kuò)展里構(gòu)建一個(gè)新的 Twitter 數(shù)據(jù)導(dǎo)入器,為此我正在重構(gòu) GraphQL 導(dǎo)入器。因?yàn)槲也淮_定目前的方案是否正確,所以我把它放在一個(gè)單獨(dú)的文件夾里,這樣我可以查看 PR,判斷那個(gè)方案是否有意義。主倉庫正在進(jìn)行重構(gòu),所以我可以專心寫這篇文章。

      常用的 Slash Commands

      我只有幾個(gè),而且很少用:

      • /commit(自定義文本,解釋多個(gè)智能體在同一個(gè)文件夾中工作,只提交你修改的部分,這樣我能得到干凈的注釋,而且 GPT 不會對其他變更大驚小怪,也不會在 Linter 失敗時(shí)試圖回滾所有東西)

      • /automerge(一次處理一個(gè) PR,對機(jī)器人的評論做出反應(yīng),回復(fù),讓 CI 變綠,并在變綠時(shí)壓縮合并)

      • /massageprs(與 automerge 相同但沒有壓縮步驟,這樣如果我有很多 PR,我可以并行處理)

      • /review(內(nèi)置命令,偶爾用,因?yàn)槲以?GH 上有審查機(jī)器人,但也算有用)

      即使有了這些,通常我也只輸入 "commit",除非我知道有太多臟文件,沒有指引智能體可能會搞砸。當(dāng)我確信當(dāng)前上下文足夠時(shí),沒必要搞那些花架子浪費(fèi)上下文。再說一次,你會對這些產(chǎn)生直覺。目前我還沒發(fā)現(xiàn)其他真正有用的命令。

      還有什么其他技巧?

      與其絞盡腦汁寫完美的提示詞來激勵(lì)智能體完成長期任務(wù),不如用點(diǎn)懶人變通法。如果你在做一個(gè)大的重構(gòu),Codex 經(jīng)常會以「工作進(jìn)行中」的回復(fù)暫停。如果你想走開不管,只看結(jié)果,那就把「繼續(xù)(continue)」的消息排進(jìn)隊(duì)列。如果 Codex 做完了又收到更多消息,它會愉快地忽略它們。

      讓模型在每個(gè)功能/修復(fù)完成后編寫測試。使用相同的上下文。這會產(chǎn)生質(zhì)量更高的測試,而且很可能在實(shí)現(xiàn)過程中發(fā)現(xiàn) Bug。如果是純 UI 調(diào)整,測試可能意義不大,但對于其他任何事情,一定要寫。AI 通常不擅長寫好的測試,但有總比沒有強(qiáng),老實(shí)說——你會為你做的每個(gè)修復(fù)手動寫測試嗎?

      讓模型保留你的意圖,并「在棘手的部分添加代碼注釋」,這對你自己和未來的模型運(yùn)行都有幫助。

      當(dāng)問題變得棘手時(shí),在提示詞里加一些觸發(fā)詞,比如「慢慢來」、「全面一點(diǎn)」、「閱讀所有可能相關(guān)的代碼」、「提出假設(shè)」,能讓 Codex 解決哪怕是最棘手的問題。

      Just Talk To It

      不要把時(shí)間浪費(fèi)在 RAG、子智能體、Agents 2.0 或其他大多只是「花架子」的東西上。直接跟它對話。去把玩它。培養(yǎng)直覺。你與智能體協(xié)作得越多,你的結(jié)果就會越好。

      Simon Willison 的文章提出了一個(gè)極好的觀點(diǎn):管理智能體所需的許多技能,與你管理工程師時(shí)所需的技能如出一轍,幾乎所有這些都是高級軟件工程師的特質(zhì)。

      是的,編寫好的軟件依然很難。僅僅因?yàn)槲也辉儆H手寫代碼,并不意味著我不去深入思考架構(gòu)、系統(tǒng)設(shè)計(jì)、依賴關(guān)系、功能特性或如何取悅用戶。使用 AI 只是意味著,我們對交付成果的期望值變高了。


      轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      上海交大教授曹樹基:731部隊(duì)不存在,侵華日軍沒有拿華人做實(shí)驗(yàn)

      上海交大教授曹樹基:731部隊(duì)不存在,侵華日軍沒有拿華人做實(shí)驗(yàn)

      雍親王府
      2026-03-19 12:45:07
      陳天橋:那一夜梁文鋒拒絕了我的投資,卻讓我決定投入10億美金去做另一件事

      陳天橋:那一夜梁文鋒拒絕了我的投資,卻讓我決定投入10億美金去做另一件事

      獵云網(wǎng)
      2026-03-19 15:28:10
      中方強(qiáng)硬扣船,美官員準(zhǔn)時(shí)介入,禁止中企競標(biāo),巴拿馬后悔也晚了

      中方強(qiáng)硬扣船,美官員準(zhǔn)時(shí)介入,禁止中企競標(biāo),巴拿馬后悔也晚了

      溫讀史
      2026-03-21 11:48:45
      不是李夢!馳援女籃世界杯第1人或是她,21歲前鋒,有望取代功勛

      不是李夢!馳援女籃世界杯第1人或是她,21歲前鋒,有望取代功勛

      萌蘭聊個(gè)球
      2026-03-21 09:52:17
      “梅姨”落網(wǎng)細(xì)節(jié):其長相與模擬畫像相似度不足30%;同居三年男友曾稱她從不拍照、拒出示身份證,稱拐賣兒童為做“生意”

      “梅姨”落網(wǎng)細(xì)節(jié):其長相與模擬畫像相似度不足30%;同居三年男友曾稱她從不拍照、拒出示身份證,稱拐賣兒童為做“生意”

      大風(fēng)新聞
      2026-03-21 16:21:03
      哈佛研究實(shí)錘:抗老根本不用醫(yī)美!這6個(gè)行為堅(jiān)持半年,年輕10歲

      哈佛研究實(shí)錘:抗老根本不用醫(yī)美!這6個(gè)行為堅(jiān)持半年,年輕10歲

      白宸侃片
      2026-03-12 19:17:17
      烏克蘭一天半擊退俄軍“春季攻勢”!迫使對手放棄扎波羅熱陣地

      烏克蘭一天半擊退俄軍“春季攻勢”!迫使對手放棄扎波羅熱陣地

      項(xiàng)鵬飛
      2026-03-19 20:46:54
      人到60歲后,最值得打的4種疫苗,每一針都可能在關(guān)鍵時(shí)刻救命!

      人到60歲后,最值得打的4種疫苗,每一針都可能在關(guān)鍵時(shí)刻救命!

      醫(yī)學(xué)科普匯
      2026-03-20 20:25:06
      悲劇了!40多萬買游戲裝備跌成8萬!男子哭訴是父母給他結(jié)婚錢…

      悲劇了!40多萬買游戲裝備跌成8萬!男子哭訴是父母給他結(jié)婚錢…

      火山詩話
      2026-03-21 05:54:08
      香港警方開五槍制服持刀男子!稱其是建筑工人,并無案底

      香港警方開五槍制服持刀男子!稱其是建筑工人,并無案底

      南方都市報(bào)
      2026-03-21 19:46:49
      伊朗戰(zhàn)爭將升級,——,專家分析。

      伊朗戰(zhàn)爭將升級,——,專家分析。

      羽逸地之光
      2026-03-22 01:11:11
      實(shí)探賈國龍創(chuàng)辦的新品牌燜面店:店面“明廚亮灶”,最貴單品僅59元一份,店長稱菜品都是現(xiàn)做的

      實(shí)探賈國龍創(chuàng)辦的新品牌燜面店:店面“明廚亮灶”,最貴單品僅59元一份,店長稱菜品都是現(xiàn)做的

      極目新聞
      2026-03-19 19:42:23
      3輛“百噸王”被查 上海首次刑拘負(fù)責(zé)人

      3輛“百噸王”被查 上海首次刑拘負(fù)責(zé)人

      看看新聞Knews
      2026-03-20 17:57:07
      皮爾斯:詹姆斯讓GOAT的門檻遙不可及,但他依然無法超越喬丹

      皮爾斯:詹姆斯讓GOAT的門檻遙不可及,但他依然無法超越喬丹

      懂球帝
      2026-03-21 14:32:06
      離譜到家!《我的山與海》大結(jié)局,真是今年看過最無語的大結(jié)局!

      離譜到家!《我的山與海》大結(jié)局,真是今年看過最無語的大結(jié)局!

      楓塵余往逝
      2026-03-21 12:26:22
      美國也沒想到,轉(zhuǎn)為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

      美國也沒想到,轉(zhuǎn)為中國籍僅6年,谷愛凌竟已成美國頭號勁敵

      削桐作琴
      2026-02-25 18:15:14
      剛剛!馬斯克要替政府發(fā)工資:每月燒掉2億美元,美國機(jī)場陷入混亂

      剛剛!馬斯克要替政府發(fā)工資:每月燒掉2億美元,美國機(jī)場陷入混亂

      華人生活網(wǎng)
      2026-03-22 02:20:41
      剛剛,特朗普做出最瘋狂決定,他要孤注一擲!

      剛剛,特朗普做出最瘋狂決定,他要孤注一擲!

      霹靂炮
      2026-03-21 22:28:40
      恒指期貨夜盤收跌2.09%,報(bào)24722.44點(diǎn)

      恒指期貨夜盤收跌2.09%,報(bào)24722.44點(diǎn)

      每日經(jīng)濟(jì)新聞
      2026-03-21 06:15:04
      有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      2026-03-22 03:44:49
      FounderPark incentive-icons
      FounderPark
      關(guān)注AI創(chuàng)業(yè),專注和創(chuàng)業(yè)者聊真問題
      1179文章數(shù) 159關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機(jī)器人出貨量第一!

      頭條要聞

      伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

      頭條要聞

      伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細(xì)節(jié)披露

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      田栩?qū)幗K于涼了?出軌風(fēng)波影響惡劣

      財(cái)經(jīng)要聞

      通脹警報(bào)拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年?duì)I收767億

      態(tài)度原創(chuàng)

      房產(chǎn)
      手機(jī)
      數(shù)碼
      公開課
      軍事航空

      房產(chǎn)要聞

      全城狂送1000杯咖啡!網(wǎng)易房產(chǎn)【早C計(jì)劃】,即刻啟動!

      手機(jī)要聞

      終端市場集體喊“漲” 手機(jī)面板持續(xù)走“跌”

      數(shù)碼要聞

      炸鍋!國產(chǎn)存儲芯片再突破!手機(jī)固態(tài)價(jià)格大跳水,內(nèi)存自由要來了

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:正考慮逐步降級對伊朗的軍事行動

      無障礙瀏覽 進(jìn)入關(guān)懷版