如果你今天問任何一個(gè) AI Agent:“昨天你幫我做了什么?”不用說,它大概率會(huì)“一臉茫然”,然后開始胡言亂語。
這是因?yàn)榻^大多數(shù)基于 LLM 的智能體都受困于“無狀態(tài)困境”(Stateless Dilemma):會(huì)話一旦結(jié)束,記憶即刻清零。下一次對(duì)話,永遠(yuǎn)是從零開始的冷啟動(dòng)。你反復(fù)解釋過的項(xiàng)目背景、合作伙伴的性格偏好、你曾經(jīng)表達(dá)過的觀點(diǎn),對(duì) Agent 而言都是一片虛無。這也是阻擋 Agent 從“好用的工具”進(jìn)化為“真正的助手”的障礙之一。
近日,Y Combinator(以下簡稱 YC)總裁兼 CEO Garry Tan 宣布將自己日常使用的個(gè)人知識(shí)系統(tǒng) “GBrain” 開源。他在 X 上寫道:“我希望所有人都能擁有自己的‘個(gè)人迷你AGI’。”截至目前,該項(xiàng)目在 GitHub 上已獲得超過 5,000 顆星。
![]()
(來源:X)
這并非 Garry Tan 近期的唯一動(dòng)作。一個(gè)月前,他發(fā)布的基于 Claude Code 的結(jié)構(gòu)化提示詞工作流 gstack 曾在一周內(nèi)斬獲超 69,000 顆 Star。盡管有人批評(píng)那“本質(zhì)上只是文件夾里的一堆提示詞”,但此次推出的 GBrain 瞄準(zhǔn)的是一個(gè)更底層、更核心的問題:不僅要讓 Agent 更好地執(zhí)行單次任務(wù),更要賦予其持續(xù)積累、不斷進(jìn)化的長效記憶。
![]()
(來源:GitHub)
按照 GBrain 的 README 文檔描述,整個(gè)系統(tǒng)的核心思路可以用一句話概括:讓 Agent 經(jīng)歷讀取—對(duì)話—寫入的閉環(huán)。
每當(dāng)有新信號(hào)進(jìn)入系統(tǒng):可能是一封郵件、一段會(huì)議錄音、一條推文,甚至是日歷上的某個(gè)行程變動(dòng)……Agent 會(huì)先查詢已有知識(shí)庫(讀取),在充分理解上下文之后作出回應(yīng)(對(duì)話),然后將這次交互產(chǎn)生的新知識(shí)寫回知識(shí)庫(寫入),供下一次查詢使用。
Tan 在文檔中把這稱作“大腦-Agent 循環(huán)”,他認(rèn)為這個(gè)循環(huán)的意義在于:每走一圈,Agent 就比上一圈更懂你。
這套循環(huán)到底解決什么問題?可以設(shè)想一個(gè)具體場(chǎng)景。作為 YC 的 CEO,Tan 每周可能要與數(shù)十位創(chuàng)始人、投資人和合作伙伴打交道。假設(shè)他周二下午和某位創(chuàng)始人開了一場(chǎng)產(chǎn)品評(píng)審會(huì),會(huì)議錄音被自動(dòng)轉(zhuǎn)錄后流入 GBrain,Agent 會(huì)做幾件事:首先識(shí)別出會(huì)議中提到的所有人名和公司名(實(shí)體檢測(cè)),然后去知識(shí)庫查找這些人和公司是否已有對(duì)應(yīng)頁面。
如果已有,比如這位創(chuàng)始人三個(gè)月前在另一場(chǎng)會(huì)議上已經(jīng)見過。Agent 就把新的會(huì)議要點(diǎn)追加到那個(gè)人的時(shí)間線里,同時(shí)更新頁面頂部的綜合判斷:這個(gè)人目前在做什么、關(guān)心什么、上次和你討論過什么。如果是第一次出現(xiàn)的陌生面孔,Agent 則會(huì)創(chuàng)建新頁面,并通過 Web 搜索、LinkedIn 數(shù)據(jù)、甚至 X 上的公開發(fā)言來填充背景資料。
這樣一來,兩周后當(dāng) Tan 再次見到這位創(chuàng)始人時(shí),他不需要翻郵件、查日歷、回憶上次聊了什么。Agent 已經(jīng)把所有上下文打包好了。
這種能力在處理復(fù)雜檢索時(shí)尤為顯著。例如,當(dāng)你詢問“去年 3 月那次晚宴都有誰參加”時(shí),傳統(tǒng)方式需要手動(dòng)拼湊日歷、郵件和聊天記錄;而在 GBrain 體系下,由于每次交互都已被結(jié)構(gòu)化并關(guān)聯(lián)至對(duì)應(yīng)人物頁面,查詢可快速返回完整名單。
簡言之,GBrain 解決的核心痛點(diǎn)是:讓每一次對(duì)話都建立在過往所有積累的基石之上,而非每次都從零開始。
GBrain 是基于 Tan 真實(shí)生產(chǎn)環(huán)境部署總結(jié)而來。其知識(shí)庫包含 14,700 多個(gè)“大腦頁面”(Markdown 文件)、40 多個(gè) Agent 技能以及 20 多個(gè)持續(xù)運(yùn)行的定時(shí)任務(wù)。這些數(shù)據(jù)跨度長達(dá) 13 年,涵蓋日歷、Apple Notes、郵件、會(huì)議紀(jì)要及社交關(guān)系。
當(dāng)數(shù)據(jù)規(guī)模增長至約 3,000 個(gè)人物頁面和 5,800 條筆記時(shí),傳統(tǒng)的文本搜索工具(如 grep)已徹底失效,這正是 GBrain 誕生的直接動(dòng)因。
技術(shù)實(shí)現(xiàn)層面,GBrain 選擇了一條相當(dāng)務(wù)實(shí)的路線。它默認(rèn)使用 PGLite,一個(gè)通過 WebAssembly 運(yùn)行的嵌入式 Postgres 17.5 數(shù)據(jù)庫。在本地即可完成初始化,無需 Docker、無需云服務(wù)賬號(hào),官方聲稱數(shù)據(jù)庫就緒時(shí)間約 2 秒。檢索方面,GBrain 采用混合搜索策略:關(guān)鍵詞精確匹配搭配基于 pgvector 的向量語義搜索,再通過 RRF(Reciprocal Rank Fusion,一種排序融合算法)將兩路結(jié)果合并。
GBrain 中最吸引人的環(huán)節(jié)當(dāng)屬它的“夢(mèng)境循環(huán)”(Dream Cycle)機(jī)制。
Tan 在README 中這樣描述這個(gè)機(jī)制:“Agent 在我睡覺的時(shí)候運(yùn)行。夢(mèng)境循環(huán)會(huì)掃描當(dāng)天每一段對(duì)話,充實(shí)缺失的實(shí)體信息,修復(fù)損壞的引用,合并冗余記憶。我早上醒來,大腦已經(jīng)比我睡著前更聰明了。”在 Tan 的配置中,他使用的是 OpenClaw,因此通過一個(gè) DREAMS.md 的文件承載這一邏輯。但他也補(bǔ)充,對(duì)于使用 Hermes Agent等其他框架的用戶,則可以通過設(shè)定夜間定時(shí)任務(wù)來實(shí)現(xiàn)類似效果。
GBrain 的知識(shí)模型還采用了一種“編譯真相”(Compiled Truth)架構(gòu):每個(gè)人物頁、公司頁或概念頁的頂部放置當(dāng)前最佳判斷的綜合摘要,底部則是不可修改的時(shí)間線條目,記錄原始證據(jù)。隨著新證據(jù)不斷涌入,Agent 會(huì)自動(dòng)重寫頂部的綜合判斷,但底部的證據(jù)鏈永遠(yuǎn)不會(huì)被篡改。
在 SKILLPACK 文檔的開篇,Tan 聊到了這個(gè)“第二大腦”的靈感來源——Vannevar Bush 1945 年發(fā)表在《大西洋月刊》上的經(jīng)典論文《As We May Think》中描述的 Memex 設(shè)想:一臺(tái)能夠存儲(chǔ)個(gè)人所有書籍、記錄和通信,并通過“關(guān)聯(lián)索引”進(jìn)行極速靈活檢索的設(shè)備。
![]()
(來源:The Atlantic)
但 Tan 指出了關(guān)鍵區(qū)別:Bush 的 Memex 是被動(dòng)的,需用戶手動(dòng)建立關(guān)聯(lián);而 GBrain 是主動(dòng)的,Agent 會(huì)自動(dòng)檢測(cè)實(shí)體、創(chuàng)建交叉引用并維護(hù)真相。“你不需要去建造 Memex,”Tan 寫道,“Memex 自己會(huì)建造自己。”
這一思路與 Andrej Karpathy 近期關(guān)于“LLM 知識(shí)庫”的工作異曲同工。Karpathy 主張用 LLM 充當(dāng)“全職研究館員”,取代傳統(tǒng) RAG(檢索增強(qiáng)生成)管道中低效的即時(shí)拼湊模式。在 4 月 10 日的推文中,Tan 明確提及了 Karpathy 的工作對(duì)他的啟發(fā)。
盡管愿景美好,但圍繞 GBrain 的質(zhì)疑同樣存在。DEV Community 上一篇由 Penfield Labs 發(fā)表的分析文章在倉庫上線六天后就對(duì)代碼進(jìn)行了審查,得出了不太樂觀的結(jié)論:GBrain README 中宣傳三個(gè)重要功能:編譯真相重寫、夢(mèng)境循環(huán)維護(hù)、以及每條消息上的實(shí)體檢測(cè),在代碼庫中均無對(duì)應(yīng)的程序邏輯實(shí)現(xiàn)。
文章認(rèn)為,這些功能本質(zhì)上是寫在 Markdown 文檔中的 Agent 指令,依賴 LLM 去解讀和執(zhí)行,而非通過確定性代碼實(shí)現(xiàn)。此外,項(xiàng)目 Issue #22 中記錄了 12 個(gè)關(guān)鍵 Bug,包括競(jìng)態(tài)條件、NULL 嵌入覆蓋等,安全審計(jì)甚至標(biāo)注其 S3 后端“未達(dá)到生產(chǎn)就緒”狀態(tài)。
這些質(zhì)疑觸及了一個(gè)更深層的爭論:當(dāng)一個(gè)系統(tǒng)的核心功能是通過自然語言指令讓 LLM 代為執(zhí)行,而非通過確定性代碼實(shí)現(xiàn)時(shí),它究竟算不算一個(gè)“軟件產(chǎn)品”?還是更接近于一套精心編排的提示詞工程?
此外,GBrain 文檔承認(rèn),系統(tǒng)需要前沿級(jí)別的模型(如 Claude Opus 4.6 或 GPT-5.4 Thinking)才能正常運(yùn)行,使用較小模型可能導(dǎo)致系統(tǒng)崩潰。這意味著,如果未來 LLM 的輸出一致性出現(xiàn)波動(dòng),這種高度依賴模型行為的架構(gòu)能否保持穩(wěn)定,仍是一個(gè)未知數(shù)。
對(duì)于前一個(gè)問題,或許從更寬容的角度去解讀。隨著 LLM 能力的躍升,“用自然語言取代部分硬編碼邏輯”可能正成為一種合理的架構(gòu)選擇。正如 Karpathy 所言,在這個(gè)時(shí)代,分享想法比分享代碼更有意義。因?yàn)槊總€(gè)人的Agent 可以根據(jù)同一個(gè)“想法文件”,自行構(gòu)建適合自身的實(shí)現(xiàn)。
從這個(gè)角度看,GBrain 的 SKILLPACK 文檔或許更像是一本“模式手冊(cè)”。它告訴 Agent 在何種情境下該做什么,而具體如何執(zhí)行,則交由對(duì)話當(dāng)下的 LLM 自行判斷。
1.https://x.com/garrytan
2.https://github.com/garrytan/gbrain
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.