![]()
9 月造出能獨立做科研的 AI 實習生,這次可能不是畫餅。
作者|樺林舞王
編輯|靖宇
不久前,一篇「2028 年預測」的文章瘋傳網絡,該文章指出由于 AI 的進步,2028 年將會有很大一波失業浪潮,很多人的工作,將會被 AI 取代。
文章一出,疊加中東局勢,重挫了當天美國股市。此事堪稱玄幻,畢竟那篇文章一看就是由 AI 寫的,但看起來正契合了人們對于「AI 帶來大失業」的恐懼心理,所以造成了如此大的影響。
近日,OpenAI 曝光的一則消息,則讓人們意識到,「2028 年大失業」,可能并非是空穴來風。
近期,OpenAI 首席科學家 Jakub Pachocki 在接受 MIT Technology Review 獨家專訪時說了一句讓人脊背發涼的話——他們的「北極星」,是在 2028 年之前建成一套全自動的多智能體研究系統。
今年 9 月,第一階段目標就會落地:
一個能獨立處理特定研究問題的「自主 AI 研究實習生」。
這不是產品路線圖里的占位符,也不是 Altman 在 X 上的一句隨口豪言。這是 OpenAI 在把整個公司資源押注在一個方向上。
01
「北極星」的意義
科技公司說「北極星」的時候,通常意味著兩件事:一是其他事情要為它讓路,二是公司內部已經達成共識。
從過去兩周 OpenAI 的動作來看,這個判斷基本成立。
3 月 19 日,OpenAI 宣布收購開發者工具公司 Astral,團隊并入 Codex 部門;同一時間,公司宣布整合 ChatGPT、Codex 和瀏覽器為一個統一的桌面「超級應用」,由應用主管 Fidji Simo 主導,Greg Brockman 協助推進組織改革。
碎片化產品時代宣告終結,OpenAI 正在把所有籌碼往一個方向推。
而這個方向,指向的是「讓 AI 自己做研究」。
Pachocki 的邏輯其實很清晰:推理模型、智能體、可解釋性,這三條技術路線在 OpenAI 內部原本各自為戰,現在要整合到一個目標下——造出能在數據中心里自主運行很長時間的 AI 研究員。他說,一旦這件事成了,「這是我們真正依賴的東西。」
前 OpenAI 研究員 Andrej Karpathy 的看法更直接——「所有大語言模型前沿實驗室都會這樣做,這是最終的 BOSS 戰。」他補了一句話值得細品:「規模化當然會更復雜,但做這件事只是工程問題,它會成功。」
注意他的用詞:不是「能不能」,是「什么時候」。
02
Anthropic 在行動
就在 OpenAI 宣布「北極星」的同一天,Anthropic 悄悄上線了 Claude Code Channels——一個讓開發者可以通過 Telegram 和 Discord 直接與正在運行的 Claude Code 會話交互的功能。
這件事單獨看很小,放進整體趨勢里看,就很重要。
Anthropic 的邏輯是:與其告訴開發者 AI 未來能做什么,不如現在就讓它嵌進開發者的真實工作流。Telegram 和 Discord 不是學術論文,是程序員每天工作的地方。讓 Claude Code 活在這里,意味著它從「工具」變成了「同事」。
社區里的反應印證了這個判斷。
有用戶直接說:「Claude 通過這次更新把 OpenClaw 給殺了,你不再需要買一臺 Mac Mini。」這句話背后的含義是,Anthropic 的基礎設施改進,已經讓開源替代方案失去了成本優勢。
而從更宏觀的時間線看,Anthropic 在 Claude Code 上的迭代速度確實驚人。短短數周內,它融合了文本處理、數千個 MCP 技能集成和自主 bug 修復能力。OpenAI 在通過收購 Astral 補強 Codex 的同時,Anthropic 已經把 Claude Code 直接送進了開發者的聊天窗口。
兩家公司都在奔向同一個終點,路線卻截然不同——OpenAI 在做「2028 年的全自動研究員」,Anthropic 在做「今天就能用的智能體工具」。
03
真正的難題
不過,這里有一個細節不能繞過去。
Pachocki 在專訪中做了一件很罕見的事——他主動談到了安全和可控性的挑戰,而且說得相當坦誠。
他說,他們的想法是用其他大語言模型,來「監控 AI 研究員的便簽」,在行為出問題之前就捕捉到不良行為。但緊接著他承認:「對大語言模型的理解度,不足以讓我們完全控制它們,要真正說『這個問題已經解決了』,還需要很長時間。」
一家公司的首席科學家說「我們還沒有完全的控制力」,同時宣布要在 2028 年交出全自動 AI 研究系統,這兩件事放在一起,值得所有人認真想一想。
這不是在唱衰,而是在理解這件事的真實難度。Pachocki 能說出這句話,本身說明 OpenAI 內部對這條路的艱難有清醒認知。
技術層面,有一個被研究者總結的「卡帕西循環」值得參考——成功的自動化 AI 研究框架需要三個要素:一個有權修改單個文件的智能體、一個可以客觀測試的單一指標、固定的實驗時間限制。
這套框架已經開始在實際環境中產生結果。Shopify CEO Tobias Lütke 就公開分享過一個案例:他讓 autoresearch 智能體在夜間運行,第二天早上,智能體跑了 37 次實驗,把模型性能提升了 19%。
從概念到落地,這條路比想象中要短。
04
20000 美元訂閱費的未來
「北極星」項目不僅是技術上的優勢,更是商業上的勝負手。
Paul Roetzer 的一組數字讓人想多看幾遍:他援引 OpenAI 內部預測,到 2029 年,智能體業務單獨就能帶來 290 億美元年收入,其中包括月費 2000 美元的「知識代理」和月費 20000 美元的「研究代理」。
這組數字說明,「AI 研究員」從來不只是一個技術目標,它是一條收入路線圖。
月費 20000 美元的「研究代理」,換算一下,是一個資深研究員年薪的幾分之一,但它可以 24 小時不間斷工作,同時跑 37 個實驗。這不是替代某一個具體的人,而是重新定義了「研究生產力」本身是什么。
這讓我想起 Karpathy 那句話——「這是最終的 BOSS 戰」。他說的 BOSS,不是競爭對手,而是 AI 能力的天花板本身。
一旦 AI 能夠自主推進科學研究,AI 進步的速度,將不再受限于人類研究員的數量和工時。
Pachocki 也說了同樣的意思,只是表達得更克制——「一旦系統能夠在數據中心里自主運行很長時間,這是我們真正依賴的東西。」
2026 年 9 月的 AI 研究實習生,不是終點,而是一個重要的起點。
*頭圖來源:Leading Edge Only
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你覺得 OpenAI 的「北極星」,
能替代你的工作嗎?
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.