henry 發自 凹非寺
量子位 | 公眾號 QbitAI
如果沒有PhD,是不是就和前沿AI研究沒關系了?
至少在Noam Brown看來,未必。
這位OpenAI 研究員、o1的核心貢獻者,剛剛分享了一串“非典型研究員”的經歷。
![]()
有人沒有論文、有人沒讀研、有人白天在麥肯錫上班,晚上在GitHub寫研究。
還有人沒事就在推特發帖、GitHub上提問的。
他們后來都去了哪?
OpenAI、DeepMind、Anthropic。
進OpenAI,并不一定要博士學位
在這篇長帖中,Noam分享了Keller JordanSholto DouglasAndy JonesKevin Wang等一批“非典型”研究員的經歷。
總體看下來,他們都有一些相同的特質。比如,主動性極強(熱愛)、公開研究,不閉門造車、工程能力在線、會PR、不執著于頭銜。
![]()
接下來,我們具體來看。
Keller Jordan:套瓷研究+推特學術
首先被Noam分享的,是Keller Jordan
他現在在OpenAI,從事預訓練相關的研究。而他的研究生涯,某種程度上,起于一段典型的“套瓷研究”。
![]()
Keller只有本科學位(UCSD),也沒有任何論文發表經歷。
畢業后,他先進入了一家做 AI 內容審核的初創公司工作。
在工作之余,他并沒有閑著。
Keller主動聯系了當時還在谷歌的Behnam Neyshabur,并向他展示了一個針對Behnam最近論文的改進想法。
或許是出于“有人真的認真讀了我論文”的成就感,Behnam同意指導他。
最終,他們與其他作者一起,完成了一篇入選ICLR 2023的論文。
![]()
對于Keller這種“套瓷+研究”的方式,Noam評價說:
- 遺憾的是,如今公開研究的空間比以前小了,但在已有論文基礎上提出改進,依然是向實驗室內部研究員證明你能力的絕佳方式,也能讓對方有信心去幫你爭取一次面試機會。
后來,一篇2024年底寫下的一篇博客Muon: An optimizer for hidden layers in neural networks,則真正為Keller拿下了一張去OpenAI的船票。
![]()
(注:Muon是專門用于神經網絡隱藏層的優化器,核心思想是把常規梯度更新“正交化”)
當時,Keller發起并持續更新了一個NanoGPT speedrun:
這個實驗是在Karpathy的NanoGPT框架下,系統性地比較不同訓練配置和優化器,目標是把預訓練速度推到極限。
而Keller自己倒騰出的Muon,正是在這一系列speedrun實驗中,脫穎而出。
這引起了大神Andrej Karpathy的關注,Keller也因此進入了OpenAI的視野。
![]()
而后續進入OpenAI也是順手推舟。
這種把研究直接攤在GitHub 上、同時在社交媒體上持續記錄的方式,一方面讓他的研究水平和產出變得異常容易衡量;
另一方面,也讓這些工作沒有淹沒在arXiv的論文海里,而是被真正看見,并最終得到了圈內大神的認可。
說到底,PR太重要了!
Sholto Douglas:在GitHub上提問吸引大佬注意力
接下來,Noam又分享了現Anthropic研究員Sholto Douglas的故事。
![]()
Sholto Douglas曾經就職于谷歌,是Gemini項目的重要推手之一。
而他,也只有本科學位。
![]()
(沒錯,他還在清華交換了一年)
Sholto本科學的雖然是機器人,但畢業后卻進了麥肯錫工作。
而這,很大的一部分原因是,Sholto沒有申請到想去的研究生項目。
由此,Sholto索性干脆一邊上班,一邊做研究。據Sholto在播客中的分享,他幾乎是:
- 每天晚上10點到凌晨2點,周末每天至少6到8個小時,全都在寫代碼、做實驗、搞研究項目。
![]()
在學習過程中,Sholto還經常在Google開源的機器學習框架JAX的官方GitHub倉庫上提問。
而這,引起了當時在谷歌,現在在Anthropic的James Bradbury的興趣。
James心想:這世界上還有我不認識的隔這提問的人?
于是,在看到了Sholto的提問以及他平時做的項目,James就主動聯系他,并邀請他前往Google DeepMind的面試。
最終,本科生,第一段工作完全不AI的Sholto進入了谷歌。
有趣的是,在進入谷歌之后,Sholto才發現,自己被招進來,其實在某種程度上是一個內部實驗
- 試試看,能不能把一個熱情和主觀能動性極強的人,和他們認識的最優秀的一批工程師配對,看看會發生什么。
andy jones:自學軟件工程和機器學習,自費發論文
andy jones現在是Anthropic的研究員,負責的RL基礎設施、沙箱系統,牽頭多模態方向,以及參與大模型訓練。
![]()
在此之前,他是一位半退休的量化分析師。
和上面幾位一樣,andy有極強的主動性:他自費租賃算力,自費發表論文
在論文《Scaling Scaling Laws with Board Games》中,andy不僅首次系統地量化train與test compute的tradeoff。
![]()
還在測試時計算擴展成為熱門概念之前,比較了擴展預訓練和擴展測試時計算的影響。
這篇論文直接讓他成為機器學習領域的炸子雞。
而后來,這一研究還直接推動了o1等模型的測試時計算范式,并被Noam放入了o1的技術報告里。
![]()
而據一位網友的補充,andy的經歷并不止如此。
他在英國完成了4年制的數學碩士,并且花9個月時間自學了軟件工程和機器學習。
后來,他又干了一年的生物信息學研究。
再后來,3年的量化交易工作已足以讓他財富自由。
![]()
盡管如此,andy并沒有停下,而是完成了一系列獨立探索,并最終進入Anthropic。
![]()
Kevin Wang:進入OpenAI的本科生
此外,Noam透露,像OpenAI這樣的實驗室,確實會直接從本科階段招聘研究員。
![]()
Kevin Wang就是其中一。
2025年,Kevin Wang在完成本科學習后,直接進入OpenAI,從本科生一步跨入一線研究團隊。
![]()
這并不是一次“破格的運氣”。
一方面,Wang擁有導師的強力推薦;但更關鍵的是,他本身就握著一篇極其扎眼的論文。
對于OpenAI來說,頂會上“水平還不錯”的論文并不稀缺。
真正稀缺的,是那種在第一眼就能被挑出來的工作。
Noam回憶,在NeurIPS 2025的5290篇論文中,他們幾乎是一眼就注意到了Wang的研究。
而后來的結果,也驗證了這個判斷——
他的第一作者論文《1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities》,最終拿下了NeurIPS 2025最佳論文
談到招聘標準時,Noam 也給出了一個很現實的評價:
- 導師的推薦分量很重。因為僅憑簡歷,甚至只看論文,本身就很難全面評估一名研究員的真實水平。
最后,Noam也分享了自己對“薪酬”的看法:
關于“薪酬”這件事:我認識一些人做量化是為了賺錢,但五年之后卻開始反問自己——我到底在用人生干什么?
我們正處在一個非常特殊的歷史時刻。做AI研究,你既有機會積極參與并引導這個時代最重要的技術發展,同時收入也相當可觀。
我本科畢業后在量化交易行業干了一年,但并不希望自己此生對人類的“貢獻”,只是讓股票市場稍微更有效率一點。
后來我選擇降薪轉去做 AI 研究——這是我這輩子做過最好的決定。放在今天,你甚至不需要降薪,也能走上這條路。
早進廠,沒啥問題
除了Noam的分享以外,現在可能越來越明顯的一點是:
想把研究做好、想進前沿AI大廠,博士學位本身,似乎已經不再是必需品了。
比如,GPT論文的一作、CLIP的一作Alec Radford,就是本科出身。
而現在OpenAI的首席研究員Mark Chen,也只有本科學歷,一開始做的甚至還是量化交易。
![]()
在 Noam 那條帖子下面,有網友一針見血地總結過:
- 一條很棒的長帖,講的是沒有PhD學位的人,是如何進入前沿AI實驗室做研究的。
PhD能給你導師和同行圈子,但它并不會自動賦予你好奇心、主動性,或者研究品味。
![]()
上面提到的Keller就是一個典型例子。
他是在完全公開的環境里做出了Muon優化器,實驗過程、結果都直接發在推特上。
甚至沒有論文,只有一篇博客。
但影響力不言自明——現在OpenAI、Kimi、DeepSeek都在使用它。
類似的故事并不少見。
比如Stability AI的80名研究員和工程師中,只有16位擁有PhD,而且其中相當一部分是直接從推特上招來的。
換句話說,你不需要 PhD,才能成為一名優秀的研究員或工程師。
你只需要真的去做事,而且讓別人看得見你在做什么。
前幾天剛上《WhyNotTV》的嘉賓——
從GPT-3.5到GPT-5都有深度參與、負責GPT post-training RL infrastructure的核心成員翁家翌,也是只有碩士學位。
在播客里他也提到:相比去讀一個 PhD,盡早進入工業界比較好
![]()
因為等PhD讀完,研究范式可能已經換了一輪;
而且博士階段往往面對的是toy benchmark,而不是真實世界的系統和約束。
與此同時,很多AI Lab真正短缺的,反而是工程能力極強的人
至于能不能進、進了之后做什么,很大程度上取決于:實驗室當下需要什么,以及你是否已經在過往經歷中證明過自己能補上那塊拼圖。
[1]https://x.com/polynoamial/status/2014084431062114744
[2]https://www.youtube.com/channel/UC5xLV_gJAP9psKcyrJ3ZIcw
[3]https://www.marketingaiinstitute.com/blog/the-marketing-ai-show-episode-74
[4]https://www.dwarkesh.com/p/sholto-douglas-trenton-bricken
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.