![]()
機器之心編輯部
我們常問:AGI 什么時候到來?你有沒有想過,可能它已經來了。
最近,紅杉資本合伙人 Pat Grady、Sonya Huang 聯合發表了一篇博客,指出 AGI 已經到來,就在此刻。
![]()
在他們看來,AGI 不需要一個玄乎的技術定義 —— 它的本質就是「能把事情搞清楚的能力」。而以 Claude Code 為代表的長周期智能體,正是這種能力的第一批例證。
文中舉了一個例子:一位創始人讓智能體幫他找一個開發者關系負責人。智能體先在 LinkedIn 上搜索,發現職位頭銜說明不了問題;于是轉向 YouTube 找技術演講,篩選出互動數據亮眼的演講者;再與 Twitter 交叉比對,找出真正有品味、有粉絲的人;然后檢查誰最近發帖變少了 —— 這往往意味著對現職的倦怠;最后鎖定一位剛經歷公司裁員、專業方向完全匹配的候選人,起草了一封精準的挖角郵件。
全程 31 分鐘。 沒有人告訴它該怎么做,它自己形成假設、驗證、碰壁、轉向,直到找到答案。這就是「把事情搞清楚」。而長周期智能體已經具備了這種能力。
更令人振奮的是,他們給出了一條清晰的指數曲線:長周期智能體的能力每 7 個月翻一番。按此推算,2028 年智能體能完成人類專家一天的工作,2034 年能完成一年的工作。
這意味著什么?你對 2030 年的夢想,2026 年就能實現
這個博客得到了一些從業者的認同。
![]()
![]()
但也有人認為其中忽略了一些東西,對于未來的預測過于樂觀。
![]()
![]()
大家可以讀完原文自行判斷。
以下是博客內容:
幾年前,一些頂尖研究者告訴我們,他們的目標是 AGI。我們急切地想聽到一個清晰的定義,天真地問道:「你們如何定義 AGI?」他們頓了頓,彼此試探性地對視,然后給出了一個后來成為 AI 領域某種「箴言」的回答:「嗯,我們每個人都有自己的定義,但我們看到它的時候就會知道。
這段小插曲,正是我們追尋 AGI 具體定義之旅的縮影。這個定義始終難以捉摸。
然而,盡管定義難以捉摸,現實卻并非如此。AGI 已經到來,就在此刻
編程智能體是第一個例證。更多案例正在涌現。
長周期(long-horizon)智能體在功能上就是 AGI,而 2026 年將是它們的元年。
不受細節拖累
在繼續之前,有必要承認:我們沒有資格提出 AGI 的技術定義。
我們是投資人。我們研究市場、創始人,以及兩者碰撞的產物:商業。
因此,我們給出的是一個功能性定義,而非技術性定義。新的技術能力引出了 Don Valentine(紅杉資本創始人、硅谷風險投資之父)的經典問題:So what?那又怎樣?
答案在于現實世界的影響。
AGI 的功能性定義
AGI 就是能把事情搞清楚的能力。就這么簡單。
我們深知,如此不精確的定義無法平息任何哲學爭論。但從務實的角度來說,當你想完成某件事時,你想要什么?一個能把事情搞清楚的 AI。至于它是如何做到的,遠不如它確實做到了來得重要。
一個能把事情搞清楚的人,擁有一定的基礎知識、基于這些知識進行推理的能力,以及迭代找到答案的能力。
一個能把事情搞清楚的 AI,擁有一定的基礎知識(預訓練)、基于這些知識進行推理的能力(推理時計算),以及迭代找到答案的能力(長周期智能體)。
第一個要素(知識 / 預訓練)推動了 2022 年 ChatGPT 橫空出世的時刻。第二個要素(推理 / 推理時計算)隨著 2024 年底 o1 的發布而到來。第三個要素(迭代 / 長周期智能體)則在過去幾周內到來 ——Claude Code 和其他編程智能體跨越了一個能力門檻。
具有通用智能的人可以連續自主工作數小時,發現和修正自己的錯誤,無需被告知下一步該做什么就能自行判斷。具有通用智能的智能體也能做到同樣的事情。這是全新的。
「把事情搞清楚」意味著什么?
一位創始人給他的智能體發消息:「我需要一個開發者關系負責人。技術能力要強到能贏得資深工程師的尊重,但又真正喜歡玩 Twitter。我們的客戶是平臺團隊。去吧。」
智能體從顯而易見的地方入手:在 LinkedIn 上搜索優秀開發者優先公司的「Developer Advocate」和「DevRel(高級開發者關系)」——Datadog、Temporal、Langchain。找到了數百份簡歷。但職位頭銜無法揭示誰真正擅長這份工作。
它轉向尋找信號而非資歷。它在 YouTube 上搜索技術大會演講。找到了 50 多位演講者,然后篩選出演講互動數據亮眼的那些。
它將這些演講者與 Twitter 進行交叉比對。一半人的賬號不活躍,或者只是轉發公司博客。這不是我們要的。但有十幾個人擁有真正的粉絲群 —— 他們發表真實觀點,與人互動,獲得開發者的關注。而且他們的帖子很有品味。
智能體進一步縮小范圍。它檢查誰在過去三個月發帖頻率下降。活躍度下降有時意味著對當前工作的倦怠。三個名字浮出水面。
它調研這三個人。一個剛宣布了新職位 —— 來晚了。一個是剛剛完成融資的公司創始人 —— 不會離開。第三位是一家 D 輪融資公司的 DevRel 人員,該公司剛剛在營銷部門進行了裁員。她最近的演講正好是關于這家創業公司所瞄準的平臺工程領域。她有 1.4 萬 Twitter 粉絲,發的梗圖能讓真正的工程師互動。她的 LinkedIn 兩個月沒更新了。
智能體起草了一封郵件,提到了她最近的演講、與創業公司理想客戶畫像的重合度,以及關于小團隊能提供的創作自由的具體說明。建議先隨便聊聊,不是推銷。
總耗時:31 分鐘。創始人得到的不是掛在招聘網站上的一份 JD,而是一份只有一個人的候選名單。
這就是「把事情搞清楚」的含義。在模糊中導航以達成目標 —— 形成假設,驗證假設,走進死胡同,然后轉向,直到某些東西奏效。智能體沒有遵循腳本。它運行的是一位優秀招聘者腦中同樣的循環,只不過它不知疲倦,31 分鐘就完成了,且無需被告知如何做。
需要說明的是:智能體仍然會失敗。它們會產生幻覺,丟失上下文,有時會信心滿滿地沖向完全錯誤的方向。但趨勢是明確的,而且這些失敗越來越可以被修復。
我們是如何走到這一步的?從推理模型到長周期智能體
在去年的文章中,我們將推理模型描述為 AI 最重要的新前沿。長周期智能體將這一范式推進得更遠,讓模型能夠采取行動并隨時間迭代。
讓模型思考更長時間并非易事。基礎推理模型可以思考幾秒或幾分鐘。
兩種不同的技術路徑似乎都在奏效并能良好擴展:強化學習和智能體框架。前者通過訓練過程中的不斷調整,從本質上教會模型保持更長時間的專注。后者則圍繞模型的已知局限(記憶交接、壓縮等)設計特定的腳手架。
擴展強化學習是研究實驗室的領域。他們在這方面取得了非凡進展,從多智能體系統到可靠的工具使用。
設計優秀的智能體框架是應用層的領域。當今市場上一些最受歡迎的產品正是以其精心設計的智能體框架而聞名:Manus、Claude Code、Factory 的 Droids 等。
如果要押注一條指數曲線,那就是長周期智能體的性能曲線。METR 一直在細致追蹤 AI 完成長周期任務的能力。進步速度呈指數級增長,大約每 7 個月翻一番。如果我們沿著這條指數曲線推算,到 2028 年,智能體應該能夠可靠地完成人類專家需要一整天的任務;到 2034 年完成一整年的任務;到 2037 年完成一個世紀的任務。
那又怎樣?
很快你就能「雇傭」一個智能體了。這是 AGI 的一個試金石。
你今天就可以「雇傭」GPT-5.2、Claude、Grok 或 Gemini。更多例子正在涌現:
- 醫療:OpenEvidence 的 Deep Consult 扮演專科醫生
- 法律:Harvey 的智能體扮演律師助理
- 網絡安全:XBOW 扮演滲透測試員
- 運維:Traversal 的智能體扮演 SRE
- 銷售:Day AI 扮演業務開發代表、售前工程師和收入運營負責人
- 招聘:Juicebox 扮演招聘官
- 數學:Harmonic 的 Aristotle 扮演數學家
- 芯片設計:Ricursive 的智能體扮演芯片設計師
- AI 研究:GPT-5.2 和 Claude 扮演 AI 研究員
從「說話者」到「行動者」:對創始人的啟示
這對創始人有著深遠的影響。
2023 和 2024 年的 AI 應用是「說話者」。有些是非常老練的對話者!但它們的影響力是有限的。
2026 和 2027 年的 AI 應用將是「行動者」。它們會給人同事的感覺。使用頻率將從每天幾次變成全天候、每一天,同時運行多個實例。用戶不是這里省幾個小時、那里省幾個小時 —— 而是從作為個人貢獻者工作,變成管理一個智能體團隊。
還記得那些關于「出售工作成果」的討論嗎?現在這成為可能了。
你能完成什么工作?長周期智能體的能力與模型的單次前向傳播截然不同。在你的領域,長周期智能體能解鎖哪些新能力?哪些任務需要持久性,哪些任務的瓶頸是持續的注意力?
你將如何把這些工作產品化?當工作的用戶界面從聊天機器人演進到智能體委派時,你所在領域的應用界面將如何演變?
你能可靠地完成這些工作嗎?你是否在癡迷地改進你的智能體框架?你是否有強大的反饋循環?
你如何銷售這些工作?你能否根據價值和成果來定價和打包?
揚鞭策馬!
是時候駕馭長周期智能體的指數級增長了。
今天,你的智能體大概可以可靠地工作約 30 分鐘。但它們很快就能完成一天的工作量 —— 最終是一個世紀的工作量。
當你的計劃以世紀為單位衡量時,你能實現什么?一個世紀,是 20 萬項從未被交叉引用的臨床試驗。一個世紀,是所有客戶支持工單,終于被挖掘出信號。一個世紀,是整部美國稅法,被重構得條理清晰。
你路線圖上那個雄心勃勃的版本,剛剛變成了現實可行的版本。
原文鏈接:https://x.com/HungamaHeadline/status/2011533578279272652
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.