網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

YC掌門人開源他的第二大腦：13年記憶，15000份文件，可接入龍蝦

2026-04-12 16:53:11　來源: DeepTech深科技

北京舉報(bào)

分享至

如果你今天問任何一個(gè) AI Agent：“昨天你幫我做了什么？”不用說，它大概率會(huì)“一臉茫然”，然后開始胡言亂語。

這是因?yàn)榻^大多數(shù)基于 LLM 的智能體都受困于“無狀態(tài)困境”（Stateless Dilemma）：會(huì)話一旦結(jié)束，記憶即刻清零。下一次對(duì)話，永遠(yuǎn)是從零開始的冷啟動(dòng)。你反復(fù)解釋過的項(xiàng)目背景、合作伙伴的性格偏好、你曾經(jīng)表達(dá)過的觀點(diǎn)，對(duì) Agent 而言都是一片虛無。這也是阻擋 Agent 從“好用的工具”進(jìn)化為“真正的助手”的障礙之一。

近日，Y Combinator（以下簡稱 YC）總裁兼 CEO Garry Tan 宣布將自己日常使用的個(gè)人知識(shí)系統(tǒng) “GBrain” 開源。他在 X 上寫道：“我希望所有人都能擁有自己的‘個(gè)人迷你AGI’。”截至目前，該項(xiàng)目在 GitHub 上已獲得超過 5,000 顆星。

（來源：X）

這并非 Garry Tan 近期的唯一動(dòng)作。一個(gè)月前，他發(fā)布的基于 Claude Code 的結(jié)構(gòu)化提示詞工作流 gstack 曾在一周內(nèi)斬獲超 69,000 顆 Star。盡管有人批評(píng)那“本質(zhì)上只是文件夾里的一堆提示詞”，但此次推出的 GBrain 瞄準(zhǔn)的是一個(gè)更底層、更核心的問題：不僅要讓 Agent 更好地執(zhí)行單次任務(wù)，更要賦予其持續(xù)積累、不斷進(jìn)化的長效記憶。

（來源：GitHub）

按照 GBrain 的 README 文檔描述，整個(gè)系統(tǒng)的核心思路可以用一句話概括：讓 Agent 經(jīng)歷讀取—對(duì)話—寫入的閉環(huán)。

每當(dāng)有新信號(hào)進(jìn)入系統(tǒng)：可能是一封郵件、一段會(huì)議錄音、一條推文，甚至是日歷上的某個(gè)行程變動(dòng)……Agent 會(huì)先查詢已有知識(shí)庫（讀取），在充分理解上下文之后作出回應(yīng)（對(duì)話），然后將這次交互產(chǎn)生的新知識(shí)寫回知識(shí)庫（寫入），供下一次查詢使用。

Tan 在文檔中把這稱作“大腦-Agent 循環(huán)”，他認(rèn)為這個(gè)循環(huán)的意義在于：每走一圈，Agent 就比上一圈更懂你。

這套循環(huán)到底解決什么問題？可以設(shè)想一個(gè)具體場(chǎng)景。作為 YC 的 CEO，Tan 每周可能要與數(shù)十位創(chuàng)始人、投資人和合作伙伴打交道。假設(shè)他周二下午和某位創(chuàng)始人開了一場(chǎng)產(chǎn)品評(píng)審會(huì)，會(huì)議錄音被自動(dòng)轉(zhuǎn)錄后流入 GBrain，Agent 會(huì)做幾件事：首先識(shí)別出會(huì)議中提到的所有人名和公司名（實(shí)體檢測(cè)），然后去知識(shí)庫查找這些人和公司是否已有對(duì)應(yīng)頁面。

如果已有，比如這位創(chuàng)始人三個(gè)月前在另一場(chǎng)會(huì)議上已經(jīng)見過。Agent 就把新的會(huì)議要點(diǎn)追加到那個(gè)人的時(shí)間線里，同時(shí)更新頁面頂部的綜合判斷：這個(gè)人目前在做什么、關(guān)心什么、上次和你討論過什么。如果是第一次出現(xiàn)的陌生面孔，Agent 則會(huì)創(chuàng)建新頁面，并通過 Web 搜索、LinkedIn 數(shù)據(jù)、甚至 X 上的公開發(fā)言來填充背景資料。

這樣一來，兩周后當(dāng) Tan 再次見到這位創(chuàng)始人時(shí)，他不需要翻郵件、查日歷、回憶上次聊了什么。Agent 已經(jīng)把所有上下文打包好了。

這種能力在處理復(fù)雜檢索時(shí)尤為顯著。例如，當(dāng)你詢問“去年 3 月那次晚宴都有誰參加”時(shí)，傳統(tǒng)方式需要手動(dòng)拼湊日歷、郵件和聊天記錄；而在 GBrain 體系下，由于每次交互都已被結(jié)構(gòu)化并關(guān)聯(lián)至對(duì)應(yīng)人物頁面，查詢可快速返回完整名單。

簡言之，GBrain 解決的核心痛點(diǎn)是：讓每一次對(duì)話都建立在過往所有積累的基石之上，而非每次都從零開始。

GBrain 是基于 Tan 真實(shí)生產(chǎn)環(huán)境部署總結(jié)而來。其知識(shí)庫包含 14,700 多個(gè)“大腦頁面”（Markdown 文件）、40 多個(gè) Agent 技能以及 20 多個(gè)持續(xù)運(yùn)行的定時(shí)任務(wù)。這些數(shù)據(jù)跨度長達(dá) 13 年，涵蓋日歷、Apple Notes、郵件、會(huì)議紀(jì)要及社交關(guān)系。

當(dāng)數(shù)據(jù)規(guī)模增長至約 3,000 個(gè)人物頁面和 5,800 條筆記時(shí)，傳統(tǒng)的文本搜索工具（如 grep）已徹底失效，這正是 GBrain 誕生的直接動(dòng)因。

技術(shù)實(shí)現(xiàn)層面，GBrain 選擇了一條相當(dāng)務(wù)實(shí)的路線。它默認(rèn)使用 PGLite，一個(gè)通過 WebAssembly 運(yùn)行的嵌入式 Postgres 17.5 數(shù)據(jù)庫。在本地即可完成初始化，無需 Docker、無需云服務(wù)賬號(hào)，官方聲稱數(shù)據(jù)庫就緒時(shí)間約 2 秒。檢索方面，GBrain 采用混合搜索策略：關(guān)鍵詞精確匹配搭配基于 pgvector 的向量語義搜索，再通過 RRF（Reciprocal Rank Fusion，一種排序融合算法）將兩路結(jié)果合并。

GBrain 中最吸引人的環(huán)節(jié)當(dāng)屬它的“夢(mèng)境循環(huán)”（Dream Cycle）機(jī)制。

Tan 在README 中這樣描述這個(gè)機(jī)制：“Agent 在我睡覺的時(shí)候運(yùn)行。夢(mèng)境循環(huán)會(huì)掃描當(dāng)天每一段對(duì)話，充實(shí)缺失的實(shí)體信息，修復(fù)損壞的引用，合并冗余記憶。我早上醒來，大腦已經(jīng)比我睡著前更聰明了。”在 Tan 的配置中，他使用的是 OpenClaw，因此通過一個(gè) DREAMS.md 的文件承載這一邏輯。但他也補(bǔ)充，對(duì)于使用 Hermes Agent等其他框架的用戶，則可以通過設(shè)定夜間定時(shí)任務(wù)來實(shí)現(xiàn)類似效果。

GBrain 的知識(shí)模型還采用了一種“編譯真相”（Compiled Truth）架構(gòu)：每個(gè)人物頁、公司頁或概念頁的頂部放置當(dāng)前最佳判斷的綜合摘要，底部則是不可修改的時(shí)間線條目，記錄原始證據(jù)。隨著新證據(jù)不斷涌入，Agent 會(huì)自動(dòng)重寫頂部的綜合判斷，但底部的證據(jù)鏈永遠(yuǎn)不會(huì)被篡改。

在 SKILLPACK 文檔的開篇，Tan 聊到了這個(gè)“第二大腦”的靈感來源——Vannevar Bush 1945 年發(fā)表在《大西洋月刊》上的經(jīng)典論文《As We May Think》中描述的 Memex 設(shè)想：一臺(tái)能夠存儲(chǔ)個(gè)人所有書籍、記錄和通信，并通過“關(guān)聯(lián)索引”進(jìn)行極速靈活檢索的設(shè)備。

（來源：The Atlantic)

但 Tan 指出了關(guān)鍵區(qū)別：Bush 的 Memex 是被動(dòng)的，需用戶手動(dòng)建立關(guān)聯(lián)；而 GBrain 是主動(dòng)的，Agent 會(huì)自動(dòng)檢測(cè)實(shí)體、創(chuàng)建交叉引用并維護(hù)真相。“你不需要去建造 Memex，”Tan 寫道，“Memex 自己會(huì)建造自己。”

這一思路與 Andrej Karpathy 近期關(guān)于“LLM 知識(shí)庫”的工作異曲同工。Karpathy 主張用 LLM 充當(dāng)“全職研究館員”，取代傳統(tǒng) RAG（檢索增強(qiáng)生成）管道中低效的即時(shí)拼湊模式。在 4 月 10 日的推文中，Tan 明確提及了 Karpathy 的工作對(duì)他的啟發(fā)。

盡管愿景美好，但圍繞 GBrain 的質(zhì)疑同樣存在。DEV Community 上一篇由 Penfield Labs 發(fā)表的分析文章在倉庫上線六天后就對(duì)代碼進(jìn)行了審查，得出了不太樂觀的結(jié)論：GBrain README 中宣傳三個(gè)重要功能：編譯真相重寫、夢(mèng)境循環(huán)維護(hù)、以及每條消息上的實(shí)體檢測(cè)，在代碼庫中均無對(duì)應(yīng)的程序邏輯實(shí)現(xiàn)。

文章認(rèn)為，這些功能本質(zhì)上是寫在 Markdown 文檔中的 Agent 指令，依賴 LLM 去解讀和執(zhí)行，而非通過確定性代碼實(shí)現(xiàn)。此外，項(xiàng)目 Issue #22 中記錄了 12 個(gè)關(guān)鍵 Bug，包括競(jìng)態(tài)條件、NULL 嵌入覆蓋等，安全審計(jì)甚至標(biāo)注其 S3 后端“未達(dá)到生產(chǎn)就緒”狀態(tài)。

這些質(zhì)疑觸及了一個(gè)更深層的爭論：當(dāng)一個(gè)系統(tǒng)的核心功能是通過自然語言指令讓 LLM 代為執(zhí)行，而非通過確定性代碼實(shí)現(xiàn)時(shí)，它究竟算不算一個(gè)“軟件產(chǎn)品”？還是更接近于一套精心編排的提示詞工程？

此外，GBrain 文檔承認(rèn)，系統(tǒng)需要前沿級(jí)別的模型（如 Claude Opus 4.6 或 GPT-5.4 Thinking）才能正常運(yùn)行，使用較小模型可能導(dǎo)致系統(tǒng)崩潰。這意味著，如果未來 LLM 的輸出一致性出現(xiàn)波動(dòng)，這種高度依賴模型行為的架構(gòu)能否保持穩(wěn)定，仍是一個(gè)未知數(shù)。

對(duì)于前一個(gè)問題，或許從更寬容的角度去解讀。隨著 LLM 能力的躍升，“用自然語言取代部分硬編碼邏輯”可能正成為一種合理的架構(gòu)選擇。正如 Karpathy 所言，在這個(gè)時(shí)代，分享想法比分享代碼更有意義。因?yàn)槊總€(gè)人的Agent 可以根據(jù)同一個(gè)“想法文件”，自行構(gòu)建適合自身的實(shí)現(xiàn)。

從這個(gè)角度看，GBrain 的 SKILLPACK 文檔或許更像是一本“模式手冊(cè)”。它告訴 Agent 在何種情境下該做什么，而具體如何執(zhí)行，則交由對(duì)話當(dāng)下的 LLM 自行判斷。

1.https://x.com/garrytan

2.https://github.com/garrytan/gbrain

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.