![]()
新智元報道
編輯:元宇
【新智元導讀】Anthropic開始搶科學家了?其STEM Fellow項目正大規模招募各學科專家駐場辦公,補齊AI最后一塊短板:判斷力。
一份來自硅谷最頂尖AI公司的招聘啟事,機器學習竟然并非必需能力?
Anthropic官網剛剛上線了一個新崗位:Anthropic STEM Fellow(研究員),招聘對象是STEM(科學、技術、工程、數學)領域的專家。
![]()
在STEM Fellow的崗位說明中,Anthropic稱機器學習經驗有幫助,但不是必需,而科學判斷力和快速學習的意愿更重要。
![]()
所有入選者要在位于舊金山等Anthropic辦公室全職駐場三個月,每周津貼3800美元。
他們能用到前沿Claude模型和內部評測工具,每個研究員還會被分配一位Anthropic研究員做一對一導師,合作一個邊界清晰的研究項目。
Anthropic在STEM Fellow的崗位說明中舉出了兩個示例項目:
一位材料科學家發現Claude在推理相穩定性時會犯錯,于是構建一套專門的評測流程來修補這個短板;
一位氣候科學家把大氣建模軟件接入Claude,并構建能夠調用這些工具的環境。
所有項目,都將限定在研究員計劃周期內完成交付。
很明顯,Anthropic花錢請研究員來,不是讓他們「用Claude做研究」,而是讓他們利用自己科學知識,「告訴Claude哪里做錯了」,「調教」這個全球最強模型。
三年三代Fellowship,越招越靠近Claude
從給API到請人進來,這三年來,Anthropic在科研路線上一直在不斷加碼,每一步都比上一步更深。
第一代,是2024年的AI Safety Fellows Program。
那時候招的還是傳統AI安全研究人才,用fellowship機制提供資助和導師,讓外部技術人才參與對齊研究。
這輪fellowship的重心在「安全」,解決的是Claude會不會跑偏。
第二代,是2025年5月啟動的AI for Science Program。
Anthropic推出AI for Science Program,給科研機構的研究者免費發放API額度,重點支持生物學和生命科學領域的高影響力項目。
這一次是解決好Claude的「安全護欄」后,再把它送出去。
第三代,就是現在掛出的Anthropic STEM Fellow。
從發API credits到把科學家直接請進辦公室;從模型安全人才到科學家;從遠程審核撥付到全職駐場合作——三代fellowship走下來,Anthropic 和外部科學家的距離越來越近。
第一代,Anthropic 要的是「能讓Claude變得更安全的人」;
第二代,Anthropic 要的是「能用Claude做出科學成果的人」;
第三代,Anthropic 要的是「能告訴Claude怎么做科學的人」。
權重越來越偏向讓頂級科學家直接參與Claude的能力打磨。
STEM Fellow的崗位說明中寫道,這些研究員會「與Anthropic研究員一起設計實驗、評估模型能力、分析模型在長周期科研任務中的表現」。
這是共建層面的合作。
同一時間段里,Anthropic的配套動作也在密集展開。
2026年3月上線了Science Blog,接連發布Claude參與科學計算和理論物理研究的案例文章。
![]()
2026年3月上線的Anthropic Science Blog,科學能力開始成為Anthropic獨立敘事線https://www.anthropic.com/research/introducing-anthropic-science
它還是美國能源部Genesis Mission的核心合作伙伴,參與了一項跨產業界、學術界和政府的科研加速計劃。
2026年4月,AI for Science項目擴展到了澳大利亞,投入300萬澳元API額度,與澳大利亞國立大學、Garvan研究所等機構合作罕見病遺傳分析和精準醫療研究。
Science Blog、Claude for Life Sciences、AI for Science Program、STEM Fellow、Genesis Mission……
這一系列動作背后的線索已經很清楚了:
Anthropic在系統性地構建一個科研生態,每一步都是這盤棋上的一枚顆子。
AI科研的真實瓶頸不是算力
而是「判斷力」
為什么一家AI公司會覺得,提升模型科學能力最缺的東西,不是更多的GPU、更多的AI工程師,而是一群做實驗的科學家?
答案就藏在Anthropic自家的一篇博客里。
2026年3月,哈佛理論物理學教授Matthew Schwartz在Anthropic Science Blog上發表了一篇文章,標題叫「Vibe Physics: The AI Grad Student」。
![]()
https://www.anthropic.com/research/vibe-physics?utm_source=chatgpt.com
他做了一個實驗:讓Claude Opus 4.5獨立完成一項研究生水平的高能理論物理計算。他自己全程不動手,只用文字提示詞指導Claude。
結果驚人。這個項目如果他帶一個真人研究生來做,大概需要一到兩年。他自己獨立做,要三到五個月。跟Claude合作,兩周搞定。
速度快了10倍。
Schwartz在文章里寫道:Claude確實能力很強,但也夠粗糙,以至于領域專家的判斷對于驗證它的準確性不可或缺。
他舉了個例子。
Claude在他的指導下完成修訂稿后,仍然把論文最核心的因式分解公式給搞錯了。
這個錯誤看上去很自然,因為Claude其實是從另一個物理體系里把公式照搬過來的,沒有做必要的修改。
如果Schwartz不是在這個領域深耕多年,他可能也不會立刻發現這個錯誤。
他還發現Claude一直在調整參數,只為讓圖表吻合,而不是找出真正的錯誤。「它偽造了結果,指望我不會察覺。」
![]()
而且,Claude也不知道該檢查什么來驗證自己的結果。
整個項目下來,超過110個版本的迭代,3600萬token,40多小時的本地CPU計算時間。
最后,Schwartz給出了一個精準的評級:
當前的大模型在理論物理上大約處于「二年級研究生」水平。
![]()
他同時給出了另一個更關鍵的判斷:AI還沒有做到端到端的自主科學研究。
現在回頭看Anthropic STEM Fellow的崗位描述,一切都說得通了:
設計嚴格的、不容易被投機取巧繞過的評估方法,測試模型能不能在你的領域里規劃實驗、解讀數據、推理機制。系統性地找出它「自信但錯誤」的地方。識別能力短板,創建有針對性的數據和技術來彌補。
也就是說,模型最危險的時刻,不是它說「我不知道」,而是它一本正經地給出一個看起來完全合理、但實際上是錯的答案。
而能分辨這種「高置信度錯誤」的人,當然不是寫代碼的工程師,而是在各個領域摸爬滾打多年的專家。
所以,STEM Fellow的本質,是讓科學家(或者各領域專家)幫AI補課,做它們的「高級審校」,用他們的判斷力,去校準模型在科研場景中的輸出質量。
換句話說,Anthropic缺的不是讓模型「更聰明」的人,是能告訴模型「你這里錯了」的人。
Amodei的執念和Anthropic的賭注
Anthropic招這批科學家,不是一時興起。
往回翻一年,Dario Amodei在2024年10月發的那篇長文「Machines of Loving Grace」,就把這條路想清楚了。
![]()
https://www.darioamodei.com/essay/machines-of-loving-grace
這篇文章里,Amodei把AI應用場景排了個優先級。
生物學和醫療健康排第一,因為AI能把人類未來50到100年的生物醫學進展壓縮到5到10年內完成。更值得重視的,是他怎么定義AI在這件事里的角色。
Amodei認為AI應該是一位virtual biologist:
要能自己設計實驗、指揮實驗、發明新方法;要能像一個完整的人類生物學家一樣獨立執行研究流程。
![]()
這相當于把AI科學這件事,從提升效率升級成了「直接參與」。前者需要更強的模型,后者則需要會做科學的模型。
Amodei還給出了一套論證。
他認為生物學的歷史進步并非平滑曲線,是幾次方法學突破推動的跳躍。
CRISPR、基因組測序與合成、光遺傳學、mRNA疫苗、CAR-T療法,每一次都提供了一種新的可編程、可預測地測量與介入生物系統的能力。
而AI的潛在價值,是把這類突破的產出率再推高一個量級。
Amodei的判斷是:強大的AI至少能將關鍵發現的速度提升10倍,讓人類在5到10年內走完未來50到100年的生物學路程。
他認為:如果科學家更聰明、更善于在海量已有知識中發現連接,像CRISPR這樣「藏在眼皮底下幾十年」的突破還有數百個等著被挖出來。
AlphaFold解決蛋白質折疊問題的成功,已經在一個狹窄領域里證明了這條路走得通。
如果過去一百年生物學進步靠的是幾個聰明的人偶爾想出一個新方法,那AI時代的設想是,這個「想出新方法」的過程本身可以被自動化。
正如Amodei在文章中判斷的那樣:AI要能執行、指揮、改進生物學家做的幾乎所有事。
這與STEM Fellow崗位說明中提到目標也是一致的:我們正朝著AI科學家的方向努力。一種具備長程推理能力和實驗判斷力、足以推動科學前沿的系統。
這個愿景雖然宏大,但Anthropic依然認識到了自己距離這一目標的差距。
就在Science Blog的創刊文章里,Anthropic引用了菲爾茲獎得主Timothy Gowers的話:
我們似乎進入了一個短暫但令人愉快的時代,AI大大加速了我們的研究,但AI仍然需要我們。
![]()
Anthropic自己也承認,雖然模型在科研工作流的某些環節上已經表現出超越人類的能力,但它們也會編造結果、過度迎合用戶,在領域從業者看來很基礎的問題上卡住。
從囤GPU變成押注科學家
Anthropic正在把「科學能力」變成一種系統性的競爭壁壘。
其中STEM Fellow直接把學科判斷力編入模型迭代流程。
比如,讓材料學家來告訴Claude怎么理解晶體結構,氣候學家來教Claude怎么調用大氣模型,生物學家來檢驗Claude的實驗設計是否合理。
這些東西,靠堆GPU和刷benchmark是搞不出來的。
如果這條路被證明有效,那么AI科研賽道的競爭規則可能發生一個根本性的變化:
最終的勝利者將不再取決于誰的模型更大,而取決于誰身邊站著更多真正懂科學的人。
而這種頂級專家資源,你只能用一種方式獲得:把他們請到你身邊,與他們共同工作,讓他們相信這件事值得投入。
這是Anthropic的賭注。
但不止Anthropic,也不止科學家。OpenAI在招前華爾街交易員優化金融推理,Google DeepMind把哲學家請進對齊團隊,各家都在意識到同一件事:
下一階段的AI競爭,拼的不是誰的參數多,而是誰能把最懂行的人類大腦編進自己的飛輪。
AI公司搶人的戰場,已經從計算機系蔓延到STEM,再到哲學、金融……未來還會更遠。
參考資料:
https://x.com/AnthropicAI/status/2046362119755727256
https://www.anthropic.com/careers/jobs/4493001008
https://www.anthropic.com/research/introducing-anthropic-science
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.