4 月 22 日,一家名為 Core Automation 的新公司在 X 上發(fā)了第一條推文:“我們的目標(biāo):優(yōu)化并自動化工作的系統(tǒng),從研究本身開始。”CEO Jerry Tworek 是前 OpenAI 研究副總裁、o1 和 o3 推理模型的主導(dǎo)者,今年 1 月剛從 OpenAI 離開。
幾小時內(nèi),Anthropic 研究員 Rohan Anil、Google DeepMind 的 Gemini 研究員 Anmol Gulati,以及前 OpenAI 產(chǎn)品經(jīng)理、GPT-4o 之母 Joanne Jang 相繼宣布加入。一家同時從三個前沿實驗室挖人的新公司,以這種方式進(jìn)入公眾視野。
今年 1 月 5 日,Tworek 在 OpenAI 內(nèi)部信里告知團(tuán)隊,要去嘗試“在 OpenAI 里很難做的那種研究”。他在 OpenAI 待了近 7 年,2019 年加入時公司只有 30 來人,離開時是研發(fā)副總裁,主導(dǎo)過 o1 和 o3 兩代推理模型,深度參與 GPT-4 的后訓(xùn)練與 2025 年 GPT-5 的部署,也是 Codex 研究的主要貢獻(xiàn)者。
![]()
圖丨Jerry Tworek(來源:Trend Force)
幾周之后他上了 Ashlee Vance 的 Core Memory 播客,措辭還要更加直接。在談到 Gemini 3 反超 OpenAI 時,他表示:“從個人角度,這不是 Google 的反彈,是 OpenAI 自己的失誤。”他對 OpenAI 當(dāng)下處境的判斷是,所有頭部公司都在同時承受三重壓力,做出最強的模型、支付 GPU 賬單、維持用戶增長曲線,這樣的環(huán)境里,對高風(fēng)險研究的耐心會天然變薄,而這也是他創(chuàng)辦 Core Automation 的直接前因。
在它的名字里,Core 對應(yīng)它最核心的賭注,重新審視 AI 系統(tǒng)的底層;Automation 既是方法論也是產(chǎn)品主張。公司官網(wǎng)上寫道:下一次 AI 的臺階不會來自把現(xiàn)有配方繼續(xù)做大——更大的模型、更多的數(shù)據(jù)、不再學(xué)習(xí)的靜態(tài)部署。
![]()
圖丨Core Automation 官網(wǎng)(來源:Core Automation)
他們要找能取代大規(guī)模預(yù)訓(xùn)練和強化學(xué)習(xí)的新學(xué)習(xí)算法,要找可擴(kuò)展性好過 transformer 的新架構(gòu),相信下一波前沿研究將由“配備強 agent 的小團(tuán)隊”做出來。
1 月底 The Information 披露了它的融資計劃:剛成立幾周就開始談 5 億到 10 億美元融資,對應(yīng)估值超 50 億美元。按照泄露的融資材料,Tworek 的主要精力集中在一個叫 Ceres 的模型上,一個能夠持續(xù)學(xué)習(xí)的單一模型。
他給出的預(yù)期是,訓(xùn)練數(shù)據(jù)量比目前頭部模型少 100 倍,在生產(chǎn)環(huán)境里可以一邊運行一邊更新權(quán)重。梯度下降是過去幾十年神經(jīng)網(wǎng)絡(luò)訓(xùn)練的默認(rèn)底座,愿意把它列入可重做的范圍,意味著他們可能不準(zhǔn)備在現(xiàn)有框架內(nèi)做漸進(jìn)改良。
他們所走的這條路線在學(xué)界叫持續(xù)學(xué)習(xí)(continual learning),核心難題是讓模型學(xué)新東西時不把舊東西忘掉,即災(zāi)難性遺忘。transformer + 預(yù)訓(xùn)練的主流管線沒有解決這個問題,大廠的應(yīng)對是每隔幾個月重新訓(xùn)練一次再做一輪后訓(xùn)練,成本高、周期長,每次都要部分犧牲上次學(xué)到的東西。如果持續(xù)學(xué)習(xí)真走通,節(jié)省下來的訓(xùn)練成本和延遲會很可觀,對機(jī)器人、工業(yè)自動化、企業(yè)內(nèi)部工具這些需要模型長期適應(yīng)具體環(huán)境的場景尤其明顯。
至于遠(yuǎn)期愿景,其融資材料里甚至提到了“自復(fù)制工廠”、“生物機(jī)器”、“行星地貌改造”,不過這些還都太過遙遠(yuǎn),回到眼前,Core Automation 要解決的是一個具體問題:在當(dāng)下的算力和人才價格下,一家新公司怎樣才能追上已經(jīng)跑在前面的幾家。他們的回答是:不按大廠的節(jié)奏擴(kuò)編。公司官網(wǎng)上寫道:先自動化自己的工作,騰出時間做更有野心的研究,從研究里再找下一個可以自動化的東西。這套反饋回路既是他們的產(chǎn)品邏輯也是組織邏輯。
Core Automation 目前公開的人數(shù)不過十幾個,對比 OpenAI 和 Google DeepMind 數(shù)千人規(guī)模的研究團(tuán)隊差了兩個數(shù)量級。要讓這樣的團(tuán)隊跟得上幾家大廠的訓(xùn)練節(jié)奏,他們必須把研究流程自動化到一個此前沒有機(jī)構(gòu)實現(xiàn)過的程度,而 Core Automation 也的確把自己定位為“全球自動化程度最高的 AI 實驗室”。此前學(xué)界有一些這方面的早期探索,比如用 agent 系統(tǒng)自動生成研究想法、寫代碼、跑實驗、寫論文、做同行評審,不過目前還只能處理玩具級別的 ML 問題,和真正的前沿訓(xùn)練相差很遠(yuǎn)。
而在 Core Automation 之前,同樣走反主流范式路線的新實驗室已經(jīng)有好幾家。Mira Murati 的 Thinking Machines Lab 側(cè)重多模態(tài)智能體的可靠性,Ilya Sutskever 的 Safe Superintelligence 押注安全優(yōu)先的超級智能,Yann LeCun 離開 Meta 后成立的 AMI Labs 押注世界模型,Core Automation 押的是持續(xù)學(xué)習(xí)加自動化研究。它們賭的東西不同,但都認(rèn)定當(dāng)前的 scaling 路線不夠,都有一個明確的技術(shù)分叉作為立身之本。
且大多數(shù)都沒有公開產(chǎn)品,卻都在相對短的時間里拿到了大額融資。資本市場對“已經(jīng)在前沿跑過的研究員獨立創(chuàng)業(yè)”這件事,愿意按前沿實驗室的估值給錢,代價是這些團(tuán)隊要在幾年內(nèi)拿出一個能跟 GPT、Gemini、Claude 對打的東西,或者一個足夠獨特、讓前沿實驗室買不起替代品的東西。Core Automation 的時間可能還要更緊一些,因為它涉及的方向也是幾家巨頭公開在做、只是還沒有人做出可規(guī)模化結(jié)果的方向。
參考資料:
1.https://www.coreauto.com/
2.https://www.businessinsider.com/core-automation-ai-nerdsniped-anthropic-google-deepmind-researchers-2026-4
運營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.