![]()
谷歌CEO皮查伊在X上高調(diào)宣布,Gemini 3 Deep Think在最難的挑戰(zhàn)上,取得了前所未有的成績(jī)。
這個(gè)項(xiàng)目,正是姚順宇加入谷歌后參與的第一個(gè)重量級(jí)項(xiàng)目。
作為谷歌的對(duì)手之一,xAI的創(chuàng)始人馬斯克都不由得在這條貼文里留下了一句“令人印象深刻”,皮查伊則回復(fù)給他一個(gè)“大拇指”表情。
![]()
然而,當(dāng)人們翻看姚順宇的履歷時(shí),通常都會(huì)以為自己搜錯(cuò)名字了。
但你沒(méi)有看錯(cuò),姚順宇的確沒(méi)有任何計(jì)算機(jī)背景,他本身是一位理論物理學(xué)家,他的博士研究方向是量子引力和量子信息擾亂。
正所謂遇事不決量子力學(xué)。
當(dāng)Scaling Law逐漸失效,AI產(chǎn)業(yè)正在經(jīng)歷的一場(chǎng)變革。
真正能給AI帶來(lái)突破,帶著人們走向AGI的,或許反而是那群懂得用物理,來(lái)理解“智能”這個(gè)詞本質(zhì)的人。
01
這孩子打小就喜歡物理
姚順宇小時(shí)候隨父母從寧夏來(lái)到上海,就讀于浦東新區(qū)的上南中學(xué)東校。初三時(shí),他在浦東新區(qū)物理競(jìng)賽中拿了個(gè)三等獎(jiǎng)。
有一說(shuō)一,這成績(jī)不算特別亮眼,我小時(shí)候拿過(guò)物理競(jìng)賽的一等獎(jiǎng)。
2012年,姚順宇以推薦生身份被上海市格致中學(xué)提前錄取,隨后便開(kāi)始了他開(kāi)掛般的人生。
2015年,他考入清華大學(xué)物理系。
只不過(guò)當(dāng)時(shí)沒(méi)人能想到,這個(gè)物理系新生,會(huì)在10年后給整個(gè)AI界帶來(lái)不小的震撼。
![]()
進(jìn)入清華后,姚順宇的表現(xiàn)開(kāi)始不一樣了。
大二下學(xué)期,當(dāng)大多數(shù)同學(xué)還在為基礎(chǔ)課程焦頭爛額時(shí),他已經(jīng)開(kāi)始上博士生的凝聚態(tài)物理課程。
那一年,姚順宇被周期驅(qū)動(dòng)系統(tǒng)(Floquet systems)吸引了。
這是個(gè)極其前沿的研究領(lǐng)域,涉及復(fù)雜的數(shù)學(xué)和物理概念。他和導(dǎo)師汪忠教授一起,寫了篇50多頁(yè)的長(zhǎng)文章,完成了對(duì)高維、一般對(duì)稱性下 Floquet周期驅(qū)動(dòng)系統(tǒng)的拓?fù)浞诸悺?/p>
這項(xiàng)工作為這一研究方向建立了完整的理論框架,是一項(xiàng)非常系統(tǒng)的里程碑式拓?fù)浞诸惞ぷ鳌?/p>
并且,姚順宇以第一作者身份,將這篇論文發(fā)表在了物理學(xué)頂級(jí)期刊Physical Review B上。
對(duì)一個(gè)本科生來(lái)說(shuō),這幾乎是不可能完成的成就。
物理系主任王亞愚教授后來(lái)回憶說(shuō),在這門主要面向博士生的課程中,姚順宇是十年來(lái)給自己印象最深的兩名學(xué)生之一。
但真正讓姚順宇在物理學(xué)界出名的,是他在非厄米系統(tǒng)方面的發(fā)現(xiàn)。
在清華期間,他首次在國(guó)際上給出了關(guān)于非厄米系統(tǒng)的拓?fù)淠軒Ю碚摚?zhǔn)確預(yù)測(cè)了相關(guān)現(xiàn)象。
簡(jiǎn)單說(shuō),他發(fā)現(xiàn)在開(kāi)放量子系統(tǒng)中,電子態(tài)會(huì)神奇地“擠”到材料邊界,這種現(xiàn)象被稱為“非厄米趨膚效應(yīng)”(Non-Hermitian Skin Effect)。這個(gè)發(fā)現(xiàn)顛覆了傳統(tǒng)拓?fù)湮锢淼睦碚摽蚣堋?/p>
這項(xiàng)工作發(fā)表在 Physical Review Letters 上,并獲得了編輯推薦。
這篇題為《Non-Hermitian Skin Effect and Chiral Damping in Open Quantum Systems》的論文,后來(lái)被引用近千次,成為姚順宇學(xué)術(shù)影響力最高的作品。
2018年11月8日,清華大學(xué)本科生特等獎(jiǎng)學(xué)金答辯會(huì)舉行。
這是清華授予本科生的最高榮譽(yù),每年全校不足十人,在這之中便有姚順宇。
他也成為了物理系當(dāng)年唯一獲此殊榮的學(xué)生。
2019年,姚順宇去斯坦福大學(xué)讀理論與數(shù)學(xué)物理博士。
他的導(dǎo)師是Douglas Stanford和Stephen H. Shenker。
前者被同行認(rèn)為是最有潛力改變物理發(fā)展方向的頂尖青年科學(xué)家,后者則是弦理論領(lǐng)域的傳奇人物。
在斯坦福期間,姚順宇研究量子引力和量子信息擾亂(quantum scrambling),這是理論物理中最前沿、也最抽象的領(lǐng)域之一。
博士畢業(yè)后,他在加州大學(xué)伯克利分校做博士后研究。截至目前,他的總引用次數(shù)超過(guò)5000次,h指數(shù)14。
02
一個(gè)學(xué)物理的憑什么能研究AI?
雖然很多人大學(xué)選的專業(yè),和他們畢業(yè)出來(lái)后找的工作都沒(méi)有直接關(guān)聯(lián),但是像姚順宇這樣一直在鉆研物理學(xué)的人,理論上應(yīng)該找個(gè)物理相關(guān)的工作。
但是姚順宇偏偏選擇了AI。
2024年10月,姚順宇加入Anthropic,參與大模型Claude Sonnet框架的研發(fā)。
一個(gè)研究量子引力的物理學(xué)者,憑什么能負(fù)責(zé)起世界頂尖AI公司的研發(fā)工作?
答案其實(shí)不復(fù)雜。
大模型的核心技術(shù)本質(zhì)上是數(shù)學(xué)密集型的工作。訓(xùn)練大模型需要解決高維空間中的優(yōu)化問(wèn)題,這跟物理學(xué)中的變分法、統(tǒng)計(jì)力學(xué)有很深的聯(lián)系。
姚順宇研究的拓?fù)湮锢怼⒎嵌蛎紫到y(tǒng),用的數(shù)學(xué)工具,比如概率論、線性代數(shù)、張量計(jì)算、動(dòng)力系統(tǒng)理論,它們跟深度學(xué)習(xí)高度重合。
更關(guān)鍵的是,理論物理和機(jī)器學(xué)習(xí)處理的是同一類問(wèn)題:高維、非線性、涌現(xiàn)性強(qiáng)的復(fù)雜系統(tǒng)。
統(tǒng)計(jì)物理學(xué)中的吉布斯分布,就是機(jī)器學(xué)習(xí)中概率推斷的理論基礎(chǔ)。深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程,可以看作是在高維參數(shù)空間中找能量最小值,這跟統(tǒng)計(jì)物理中的自由能最小化原理一個(gè)道理。
近年來(lái)越來(lái)越多研究表明,統(tǒng)計(jì)物理的工具可以用來(lái)理解深度學(xué)習(xí)中的很多現(xiàn)象。
量子多體系統(tǒng)和大模型在數(shù)學(xué)結(jié)構(gòu)上很相似。
在量子物理中,大量粒子相互作用時(shí),會(huì)涌現(xiàn)出單個(gè)粒子層面無(wú)法預(yù)測(cè)的集體行為。
在大模型中,數(shù)十億個(gè)神經(jīng)元參數(shù)相互作用時(shí),同樣會(huì)涌現(xiàn)出超出預(yù)期的效果。
事實(shí)上現(xiàn)在咱們常說(shuō)的思維鏈推理、上下文學(xué)習(xí)、指令遵循,也都是依靠這種涌現(xiàn)的方式才誕生的。
![]()
這種從微觀到宏觀的涌現(xiàn)現(xiàn)象,也正是物理學(xué)家最擅長(zhǎng)研究的。
因此,基于物理訓(xùn)練出來(lái)的“物理直覺(jué)”,恰恰是AI研究最需要的。
從復(fù)雜現(xiàn)象中抽象出數(shù)學(xué)模型,這是物理學(xué)家的基本功。
在AI領(lǐng)域,這意味著能理解神經(jīng)網(wǎng)絡(luò)的本質(zhì),而不是停留在調(diào)參層面。
物理學(xué)家習(xí)慣在不同尺度上思考問(wèn)題,從微觀粒子到宏觀宇宙。這種跨尺度建模的能力對(duì)應(yīng)到AI中,就是理解從單個(gè)神經(jīng)元到整體的全景圖。
姚順宇在斯坦福研究的量子信息擾亂(quantum scrambling),關(guān)注的是量子信息如何在復(fù)雜系統(tǒng)中擴(kuò)散和混亂化,這套數(shù)學(xué)框架跟神經(jīng)網(wǎng)絡(luò)中信息的傳播和處理有相似的結(jié)構(gòu)。
那么當(dāng)他轉(zhuǎn)去做AI相關(guān)的研究時(shí),這些看似抽象的物理理論,就順理成章地變成了理解大模型行為的工具。
更直接的聯(lián)系來(lái)自強(qiáng)化學(xué)習(xí)這個(gè)概念本身。
姚順宇在Anthropic主要做強(qiáng)化學(xué)習(xí)研究,而強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)本身就源于物理學(xué)。
最優(yōu)控制理論恰好是來(lái)自經(jīng)典力學(xué)的變分原理,路徑積分方法直接借鑒量子力學(xué)的費(fèi)曼路徑積分,熵正則化來(lái)自統(tǒng)計(jì)物理的自由能概念。
對(duì)一個(gè)理論物理學(xué)家來(lái)說(shuō),這些不是需要學(xué)習(xí)的新知識(shí),而是已經(jīng)內(nèi)化在思維方式里的工具。
這種從物理到AI的轉(zhuǎn)變,不是姚順宇一個(gè)人的個(gè)案。
卷積神經(jīng)網(wǎng)絡(luò)的發(fā)明者楊立昆(Yann LeCun),在進(jìn)入AI領(lǐng)域之前,學(xué)的就是工程物理教育。
深度學(xué)習(xí)的奠基人杰弗里·辛頓(Geoffrey Hinton),他提出的玻爾茲曼機(jī)(Boltzmann Machine),名字就來(lái)自統(tǒng)計(jì)物理學(xué)家路德維希·玻爾茲曼。
而這套系統(tǒng)的核心邏輯,便是用統(tǒng)計(jì)物理中的能量函數(shù)來(lái)描述神經(jīng)網(wǎng)絡(luò)的狀態(tài)分布。
事實(shí)上,姚順宇在加入Anthropic后,深度參與了Claude 3.7 Sonnet與Claude 4系列的強(qiáng)化學(xué)習(xí)模塊研發(fā),是這兩代模型能力躍升的關(guān)鍵貢獻(xiàn)者。
這不是“跨界”,而是把物理工具應(yīng)用到新領(lǐng)域。
當(dāng)AI產(chǎn)業(yè)逐漸從“暴力堆算力”的Scaling Law時(shí)代,轉(zhuǎn)向新階段時(shí),反而需要這樣的物理學(xué)者。
03
新征程
2025年9月19日,姚順宇在個(gè)人博客上發(fā)了篇文章,宣布離開(kāi) Anthropic。
在這篇文章里,他很坦誠(chéng)地說(shuō)明了離職原因,并給出了一個(gè)精確的比例:40%和60%。
40%指的是可以公開(kāi)的原因,來(lái)自于姚順宇和Anthropic之間價(jià)值觀上的沖突。
![]()
2025年9月5日,Anthropic在內(nèi)部文件中把中國(guó)列為“adversarial nations”(敵對(duì)國(guó)家),并宣布停止向“中國(guó)實(shí)體控股的公司”提供AI服務(wù)。
姚順宇在博客中寫道:“我強(qiáng)烈反對(duì) Anthropic 發(fā)表的反華言論。盡管我相信 Anthropic 的大多數(shù)人都會(huì)反對(duì)這樣的言論,但我認(rèn)為我沒(méi)有辦法繼續(xù)留在公司。”
這段話寫得很克制,但能看出他的失望和無(wú)奈。
他特別強(qiáng)調(diào)“大多數(shù)人都會(huì)反對(duì)”,說(shuō)明他理解這個(gè)政策不是來(lái)自公司內(nèi)部的普遍共識(shí),更多是外部壓力和公司高層決策的結(jié)果。
60%指的是那些涉及“內(nèi)部的機(jī)密信息”,不可公開(kāi)的信息。姚順宇因保密協(xié)議無(wú)法詳細(xì)透露。
但他強(qiáng)調(diào),自己“不希望經(jīng)驗(yàn)與知識(shí)受到特定實(shí)驗(yàn)室偏見(jiàn)的限制,尤其是在核心研究已無(wú)需依賴論文發(fā)表的當(dāng)下,更需要開(kāi)放、平等的科研環(huán)境”。
說(shuō)起來(lái)像是個(gè)笑話,但實(shí)際情況就是,在AI研究日益商業(yè)化、封閉化的今天,學(xué)術(shù)自由和開(kāi)放合作正在受到越來(lái)越多限制。
在博客結(jié)尾,他用了句意味深長(zhǎng)的話:“It was good with you, but it is better without you.”(和你在一起很好,但沒(méi)有你更好)這句話既是對(duì)過(guò)去一年工作的肯定,也是對(duì)未來(lái)道路的期待。
這件事反映了在全球AI競(jìng)爭(zhēng)的大背景下,華裔科學(xué)家面臨的復(fù)雜處境。
一方面,美國(guó)有世界上最先進(jìn)的AI研究資源和最優(yōu)秀的科研團(tuán)隊(duì)。
可另一方面,受地緣影響,很多華裔科學(xué)家的身份成了職業(yè)發(fā)展的障礙。
但故事沒(méi)有在離職中結(jié)束。離開(kāi)Anthropic僅10天后,姚順宇就加入了Google DeepMind,擔(dān)任高級(jí)研究科學(xué)家(Senior Staff Research Scientist),且直接進(jìn)入核心Gemini團(tuán)隊(duì)。
這速度之快,說(shuō)明DeepMind早就看中了他的能力。
無(wú)論是谷歌CEO皮查伊,還是DeepMind CEO哈薩比斯,他倆在國(guó)際合作方面采取了更開(kāi)放的立場(chǎng)。
尤其是后者,他一直在倡導(dǎo)國(guó)際合作,認(rèn)為AI安全問(wèn)題需要全球科學(xué)家共同努力。
因此,即便同樣受到美國(guó)出口管制約束,谷歌依然沒(méi)有完全切斷與中國(guó)研究機(jī)構(gòu)的聯(lián)系。
加入DeepMind后,姚順宇立即投入Gemini團(tuán)隊(duì)的工作。
僅僅5個(gè)多月后,谷歌就推出了Gemini 3 Deep Think的重大升級(jí)。
這是姚順宇加入谷歌后參與的首個(gè)項(xiàng)目,成績(jī)足以讓整個(gè)AI圈震驚。文章開(kāi)頭處就提到,這次更新甚至讓馬斯克也對(duì)其稱贊。
Gemini 3 Deep Think在多項(xiàng)基準(zhǔn)測(cè)試中刷新了紀(jì)錄。
比如在ARC-AGI-2測(cè)試中,它達(dá)到了84.6%的成績(jī)。ARC-AGI是專門測(cè)試 AI 的抽象推理能力,測(cè)試的目標(biāo)是檢測(cè)AI在面對(duì)從未見(jiàn)過(guò)的新問(wèn)題時(shí),能否識(shí)別模式并找到解決方案。
這種能力被認(rèn)為是真正智能的標(biāo)志,而不是簡(jiǎn)單的模式記憶。
Gemini 3 Deep Think的成績(jī),比第二名Claude Opus 4.6的68.8%高出15%,比GPT-5.2 的 52.9% 更是高出30%。
在Codeforces編程平臺(tái)上,Gemini 3 Deep Think獲得了3455分的Elo評(píng)分,達(dá)到“傳奇大師”(Legendary Grandmaster)級(jí)別,世界排名第8。
這意味著在算法競(jìng)賽和系統(tǒng)架構(gòu)方面,全世界只有7個(gè)人類程序員能超越它。
在奧林匹克競(jìng)賽水平測(cè)試中,Gemini 3 Deep Think在數(shù)學(xué)、物理、化學(xué)三個(gè)學(xué)科都達(dá)到了金牌水平。
更重要的是,Gemini 3 Deep Think還處理那些缺乏明確指導(dǎo)原則、答案不唯一、數(shù)據(jù)雜亂或不完整的現(xiàn)實(shí)挑戰(zhàn)。
這其實(shí)是當(dāng)前所有AI都面臨的短板。這些大模型雖然在標(biāo)準(zhǔn)化測(cè)試中表現(xiàn)出色,但面對(duì)真實(shí)世界的復(fù)雜問(wèn)題時(shí),往往表現(xiàn)糟糕。
雖然我們無(wú)法確切知道姚順宇在Gemini 3 Deep Think項(xiàng)目中具體負(fù)責(zé)了哪些工作,但從時(shí)間線上看,他在自己的X上,第一時(shí)間宣布了Gemini 3 Deep Think的發(fā)布。
我個(gè)人認(rèn)為,姚順宇在Anthropic積累的強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn),以及他作為物理學(xué)家對(duì)復(fù)雜系統(tǒng)的理解,為Gemini團(tuán)隊(duì)帶來(lái)了新的視角和方法。
04
兩個(gè)“Shunyu Yao”的平行宇宙
說(shuō)到Shunyu Yao,其實(shí)在AI研究圈里,有兩位知名研究者都叫Shunyu Yao,發(fā)音完全一樣,都跟在頂尖的AI公司做研究工作,也都畢業(yè)于清華大學(xué)。
每次有關(guān)于“姚順宇”的新聞,總有人問(wèn):“是哪個(gè)姚順Yu?”
跟本文的主角不同,另一位姚順雨是正兒八經(jīng)的計(jì)算機(jī)背景。
他是清華姚班畢業(yè),普林斯頓大學(xué)計(jì)算機(jī)科學(xué)博士,曾在OpenAI工作,目前已加入騰訊。
姚順雨在AI圈的名氣,要比物理學(xué)家姚順宇更大。
他提出的ReAct框架(Reasoning and Acting),是近年來(lái)最有影響力的提示工程方法之一。
這個(gè)框架的核心思想是讓AI“邊思考邊行動(dòng)”,不是先完成所有推理再執(zhí)行,而是在推理和行動(dòng)之間交替進(jìn)行,就像人類解決問(wèn)題時(shí)的思維過(guò)程。
ReAct論文發(fā)表于2022年10月,到2025年已經(jīng)被引用超過(guò)4000次,成了提示工程領(lǐng)域的經(jīng)典工作。
姚順雨的另一項(xiàng)重要貢獻(xiàn)是思維樹(shù)(Tree of Thoughts)。
如果說(shuō)思維鏈?zhǔn)亲孉I學(xué)會(huì)了“一步步思考”,那思維樹(shù)就讓 AI 學(xué)會(huì)了“探索多條思路”。
在面對(duì)復(fù)雜問(wèn)題時(shí),AI不再只沿著一條路徑推理,而是可以同時(shí)探索多個(gè)可能的解決方案,評(píng)估每條路徑的前景,然后選擇最有希望的方向深入。
姚順雨在谷歌Scholar上的引用數(shù)超過(guò)15000次,遠(yuǎn)高于物理學(xué)家姚順宇的5000次。
但我認(rèn)為這不奇怪,計(jì)算機(jī)科學(xué)領(lǐng)域的論文引用速度,本來(lái)也要比物理學(xué)快得多,而且姚順雨的工作更接近應(yīng)用層面,影響范圍更廣。
但引用數(shù)不能完全衡量一個(gè)科學(xué)家的價(jià)值,兩個(gè)Shunyu Yao都在各自領(lǐng)域做出了重要貢獻(xiàn)。
如果說(shuō)姚順宇是從“量子力學(xué)”出發(fā)來(lái)研究 AI,那姚順雨就是從“讓AI像人類一樣思考和行動(dòng)”的角度切入。
兩個(gè)人的研究方法、思維方式、甚至用的數(shù)學(xué)工具都不一樣,但他們都在用自己的方式,去實(shí)現(xiàn)AGI。
![]()
姚順雨在騰訊的工作,目前來(lái)看,是主要集中在agent上的。他發(fā)布的論文《CL-bench》,就是一個(gè)用于評(píng)估AI agent能力的基準(zhǔn)測(cè)試。
它相當(dāng)于一個(gè)給AGI研究者們明確一個(gè)方向,只要你的研究成果能在CL-bench上拿高分,那就說(shuō)明你接近AGI。
姚順宇則是更為直接,因?yàn)樗J(rèn)為真正的智能需要理解世界的底層規(guī)律。
物理學(xué)提供了描述宇宙運(yùn)行的數(shù)學(xué)語(yǔ)言,從量子力學(xué)到統(tǒng)計(jì)物理,從信息論到復(fù)雜系統(tǒng),這些都是構(gòu)建真正智能系統(tǒng)的理論基石。
那么通過(guò)物理學(xué),便可以讓AI的智能水平更上一層樓,靠近AGI。
但無(wú)論如何,沒(méi)有哪一種方法是唯一正確的,沒(méi)有哪一個(gè)學(xué)科能獨(dú)自解決所有問(wèn)題。
物理學(xué)家的理論洞察和計(jì)算機(jī)科學(xué)家的工程創(chuàng)新,都是推動(dòng)AI發(fā)展不可或缺的力量。
兩個(gè)Shunyu Yao,兩條道路,同一個(gè)目標(biāo)。
就像集齊龍珠可以召喚神龍一樣,或許有這么一家公司,集齊了所有的Shunyu Yao,那么它也就實(shí)現(xiàn)了AGI。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.