網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

姚順宇率領(lǐng)谷歌復(fù)仇Anthropic，“沒(méi)有你才更好”

2026-02-14 11:55:18　來(lái)源: 字母榜

北京舉報(bào)

分享至

谷歌CEO皮查伊在X上高調(diào)宣布，Gemini 3 Deep Think在最難的挑戰(zhàn)上，取得了前所未有的成績(jī)。

這個(gè)項(xiàng)目，正是姚順宇加入谷歌后參與的第一個(gè)重量級(jí)項(xiàng)目。

作為谷歌的對(duì)手之一，xAI的創(chuàng)始人馬斯克都不由得在這條貼文里留下了一句“令人印象深刻”，皮查伊則回復(fù)給他一個(gè)“大拇指”表情。

然而，當(dāng)人們翻看姚順宇的履歷時(shí)，通常都會(huì)以為自己搜錯(cuò)名字了。

但你沒(méi)有看錯(cuò)，姚順宇的確沒(méi)有任何計(jì)算機(jī)背景，他本身是一位理論物理學(xué)家，他的博士研究方向是量子引力和量子信息擾亂。

正所謂遇事不決量子力學(xué)。

當(dāng)Scaling Law逐漸失效，AI產(chǎn)業(yè)正在經(jīng)歷的一場(chǎng)變革。

真正能給AI帶來(lái)突破，帶著人們走向AGI的，或許反而是那群懂得用物理，來(lái)理解“智能”這個(gè)詞本質(zhì)的人。

這孩子打小就喜歡物理

姚順宇小時(shí)候隨父母從寧夏來(lái)到上海，就讀于浦東新區(qū)的上南中學(xué)東校。初三時(shí)，他在浦東新區(qū)物理競(jìng)賽中拿了個(gè)三等獎(jiǎng)。

有一說(shuō)一，這成績(jī)不算特別亮眼，我小時(shí)候拿過(guò)物理競(jìng)賽的一等獎(jiǎng)。

2012年，姚順宇以推薦生身份被上海市格致中學(xué)提前錄取，隨后便開(kāi)始了他開(kāi)掛般的人生。

2015年，他考入清華大學(xué)物理系。

只不過(guò)當(dāng)時(shí)沒(méi)人能想到，這個(gè)物理系新生，會(huì)在10年后給整個(gè)AI界帶來(lái)不小的震撼。

進(jìn)入清華后，姚順宇的表現(xiàn)開(kāi)始不一樣了。

大二下學(xué)期，當(dāng)大多數(shù)同學(xué)還在為基礎(chǔ)課程焦頭爛額時(shí)，他已經(jīng)開(kāi)始上博士生的凝聚態(tài)物理課程。

那一年，姚順宇被周期驅(qū)動(dòng)系統(tǒng)（Floquet systems）吸引了。

這是個(gè)極其前沿的研究領(lǐng)域，涉及復(fù)雜的數(shù)學(xué)和物理概念。他和導(dǎo)師汪忠教授一起，寫了篇50多頁(yè)的長(zhǎng)文章，完成了對(duì)高維、一般對(duì)稱性下 Floquet周期驅(qū)動(dòng)系統(tǒng)的拓?fù)浞诸悺?/p>

這項(xiàng)工作為這一研究方向建立了完整的理論框架，是一項(xiàng)非常系統(tǒng)的里程碑式拓?fù)浞诸惞ぷ鳌?/p>

并且，姚順宇以第一作者身份，將這篇論文發(fā)表在了物理學(xué)頂級(jí)期刊Physical Review B上。

對(duì)一個(gè)本科生來(lái)說(shuō)，這幾乎是不可能完成的成就。

物理系主任王亞愚教授后來(lái)回憶說(shuō)，在這門主要面向博士生的課程中，姚順宇是十年來(lái)給自己印象最深的兩名學(xué)生之一。

但真正讓姚順宇在物理學(xué)界出名的，是他在非厄米系統(tǒng)方面的發(fā)現(xiàn)。

在清華期間，他首次在國(guó)際上給出了關(guān)于非厄米系統(tǒng)的拓?fù)淠軒Ю碚摚?zhǔn)確預(yù)測(cè)了相關(guān)現(xiàn)象。

簡(jiǎn)單說(shuō)，他發(fā)現(xiàn)在開(kāi)放量子系統(tǒng)中，電子態(tài)會(huì)神奇地“擠”到材料邊界，這種現(xiàn)象被稱為“非厄米趨膚效應(yīng)”(Non-Hermitian Skin Effect)。這個(gè)發(fā)現(xiàn)顛覆了傳統(tǒng)拓?fù)湮锢淼睦碚摽蚣堋?/p>

這項(xiàng)工作發(fā)表在 Physical Review Letters 上，并獲得了編輯推薦。

這篇題為《Non-Hermitian Skin Effect and Chiral Damping in Open Quantum Systems》的論文，后來(lái)被引用近千次，成為姚順宇學(xué)術(shù)影響力最高的作品。

2018年11月8日，清華大學(xué)本科生特等獎(jiǎng)學(xué)金答辯會(huì)舉行。

這是清華授予本科生的最高榮譽(yù)，每年全校不足十人，在這之中便有姚順宇。

他也成為了物理系當(dāng)年唯一獲此殊榮的學(xué)生。

2019年，姚順宇去斯坦福大學(xué)讀理論與數(shù)學(xué)物理博士。

他的導(dǎo)師是Douglas Stanford和Stephen H. Shenker。

前者被同行認(rèn)為是最有潛力改變物理發(fā)展方向的頂尖青年科學(xué)家，后者則是弦理論領(lǐng)域的傳奇人物。

在斯坦福期間，姚順宇研究量子引力和量子信息擾亂（quantum scrambling），這是理論物理中最前沿、也最抽象的領(lǐng)域之一。

博士畢業(yè)后，他在加州大學(xué)伯克利分校做博士后研究。截至目前，他的總引用次數(shù)超過(guò)5000次，h指數(shù)14。

一個(gè)學(xué)物理的憑什么能研究AI?

雖然很多人大學(xué)選的專業(yè)，和他們畢業(yè)出來(lái)后找的工作都沒(méi)有直接關(guān)聯(lián)，但是像姚順宇這樣一直在鉆研物理學(xué)的人，理論上應(yīng)該找個(gè)物理相關(guān)的工作。

但是姚順宇偏偏選擇了AI。

2024年10月，姚順宇加入Anthropic，參與大模型Claude Sonnet框架的研發(fā)。

一個(gè)研究量子引力的物理學(xué)者，憑什么能負(fù)責(zé)起世界頂尖AI公司的研發(fā)工作？

答案其實(shí)不復(fù)雜。

大模型的核心技術(shù)本質(zhì)上是數(shù)學(xué)密集型的工作。訓(xùn)練大模型需要解決高維空間中的優(yōu)化問(wèn)題，這跟物理學(xué)中的變分法、統(tǒng)計(jì)力學(xué)有很深的聯(lián)系。

姚順宇研究的拓?fù)湮锢怼⒎嵌蛎紫到y(tǒng)，用的數(shù)學(xué)工具，比如概率論、線性代數(shù)、張量計(jì)算、動(dòng)力系統(tǒng)理論，它們跟深度學(xué)習(xí)高度重合。

更關(guān)鍵的是，理論物理和機(jī)器學(xué)習(xí)處理的是同一類問(wèn)題：高維、非線性、涌現(xiàn)性強(qiáng)的復(fù)雜系統(tǒng)。

統(tǒng)計(jì)物理學(xué)中的吉布斯分布，就是機(jī)器學(xué)習(xí)中概率推斷的理論基礎(chǔ)。深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程，可以看作是在高維參數(shù)空間中找能量最小值，這跟統(tǒng)計(jì)物理中的自由能最小化原理一個(gè)道理。

近年來(lái)越來(lái)越多研究表明，統(tǒng)計(jì)物理的工具可以用來(lái)理解深度學(xué)習(xí)中的很多現(xiàn)象。

量子多體系統(tǒng)和大模型在數(shù)學(xué)結(jié)構(gòu)上很相似。

在量子物理中，大量粒子相互作用時(shí)，會(huì)涌現(xiàn)出單個(gè)粒子層面無(wú)法預(yù)測(cè)的集體行為。

在大模型中，數(shù)十億個(gè)神經(jīng)元參數(shù)相互作用時(shí)，同樣會(huì)涌現(xiàn)出超出預(yù)期的效果。

事實(shí)上現(xiàn)在咱們常說(shuō)的思維鏈推理、上下文學(xué)習(xí)、指令遵循，也都是依靠這種涌現(xiàn)的方式才誕生的。

這種從微觀到宏觀的涌現(xiàn)現(xiàn)象，也正是物理學(xué)家最擅長(zhǎng)研究的。

因此，基于物理訓(xùn)練出來(lái)的“物理直覺(jué)”，恰恰是AI研究最需要的。

從復(fù)雜現(xiàn)象中抽象出數(shù)學(xué)模型，這是物理學(xué)家的基本功。

在AI領(lǐng)域，這意味著能理解神經(jīng)網(wǎng)絡(luò)的本質(zhì)，而不是停留在調(diào)參層面。

物理學(xué)家習(xí)慣在不同尺度上思考問(wèn)題，從微觀粒子到宏觀宇宙。這種跨尺度建模的能力對(duì)應(yīng)到AI中，就是理解從單個(gè)神經(jīng)元到整體的全景圖。

姚順宇在斯坦福研究的量子信息擾亂（quantum scrambling），關(guān)注的是量子信息如何在復(fù)雜系統(tǒng)中擴(kuò)散和混亂化，這套數(shù)學(xué)框架跟神經(jīng)網(wǎng)絡(luò)中信息的傳播和處理有相似的結(jié)構(gòu)。

那么當(dāng)他轉(zhuǎn)去做AI相關(guān)的研究時(shí)，這些看似抽象的物理理論，就順理成章地變成了理解大模型行為的工具。

更直接的聯(lián)系來(lái)自強(qiáng)化學(xué)習(xí)這個(gè)概念本身。

姚順宇在Anthropic主要做強(qiáng)化學(xué)習(xí)研究，而強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)本身就源于物理學(xué)。

最優(yōu)控制理論恰好是來(lái)自經(jīng)典力學(xué)的變分原理，路徑積分方法直接借鑒量子力學(xué)的費(fèi)曼路徑積分，熵正則化來(lái)自統(tǒng)計(jì)物理的自由能概念。

對(duì)一個(gè)理論物理學(xué)家來(lái)說(shuō)，這些不是需要學(xué)習(xí)的新知識(shí)，而是已經(jīng)內(nèi)化在思維方式里的工具。

這種從物理到AI的轉(zhuǎn)變，不是姚順宇一個(gè)人的個(gè)案。

卷積神經(jīng)網(wǎng)絡(luò)的發(fā)明者楊立昆（Yann LeCun），在進(jìn)入AI領(lǐng)域之前，學(xué)的就是工程物理教育。

深度學(xué)習(xí)的奠基人杰弗里·辛頓（Geoffrey Hinton），他提出的玻爾茲曼機(jī)（Boltzmann Machine），名字就來(lái)自統(tǒng)計(jì)物理學(xué)家路德維希·玻爾茲曼。

而這套系統(tǒng)的核心邏輯，便是用統(tǒng)計(jì)物理中的能量函數(shù)來(lái)描述神經(jīng)網(wǎng)絡(luò)的狀態(tài)分布。

事實(shí)上，姚順宇在加入Anthropic后，深度參與了Claude 3.7 Sonnet與Claude 4系列的強(qiáng)化學(xué)習(xí)模塊研發(fā)，是這兩代模型能力躍升的關(guān)鍵貢獻(xiàn)者。

這不是“跨界”，而是把物理工具應(yīng)用到新領(lǐng)域。

當(dāng)AI產(chǎn)業(yè)逐漸從“暴力堆算力”的Scaling Law時(shí)代，轉(zhuǎn)向新階段時(shí)，反而需要這樣的物理學(xué)者。

新征程

2025年9月19日，姚順宇在個(gè)人博客上發(fā)了篇文章，宣布離開(kāi) Anthropic。

在這篇文章里，他很坦誠(chéng)地說(shuō)明了離職原因，并給出了一個(gè)精確的比例：40%和60%。

40%指的是可以公開(kāi)的原因，來(lái)自于姚順宇和Anthropic之間價(jià)值觀上的沖突。

2025年9月5日，Anthropic在內(nèi)部文件中把中國(guó)列為“adversarial nations”（敵對(duì)國(guó)家），并宣布停止向“中國(guó)實(shí)體控股的公司”提供AI服務(wù)。

姚順宇在博客中寫道：“我強(qiáng)烈反對(duì) Anthropic 發(fā)表的反華言論。盡管我相信 Anthropic 的大多數(shù)人都會(huì)反對(duì)這樣的言論，但我認(rèn)為我沒(méi)有辦法繼續(xù)留在公司。”

這段話寫得很克制，但能看出他的失望和無(wú)奈。

他特別強(qiáng)調(diào)“大多數(shù)人都會(huì)反對(duì)”，說(shuō)明他理解這個(gè)政策不是來(lái)自公司內(nèi)部的普遍共識(shí)，更多是外部壓力和公司高層決策的結(jié)果。

60%指的是那些涉及“內(nèi)部的機(jī)密信息”，不可公開(kāi)的信息。姚順宇因保密協(xié)議無(wú)法詳細(xì)透露。

但他強(qiáng)調(diào)，自己“不希望經(jīng)驗(yàn)與知識(shí)受到特定實(shí)驗(yàn)室偏見(jiàn)的限制，尤其是在核心研究已無(wú)需依賴論文發(fā)表的當(dāng)下，更需要開(kāi)放、平等的科研環(huán)境”。

說(shuō)起來(lái)像是個(gè)笑話，但實(shí)際情況就是，在AI研究日益商業(yè)化、封閉化的今天，學(xué)術(shù)自由和開(kāi)放合作正在受到越來(lái)越多限制。

在博客結(jié)尾，他用了句意味深長(zhǎng)的話：“It was good with you, but it is better without you.”（和你在一起很好，但沒(méi)有你更好）這句話既是對(duì)過(guò)去一年工作的肯定，也是對(duì)未來(lái)道路的期待。

這件事反映了在全球AI競(jìng)爭(zhēng)的大背景下，華裔科學(xué)家面臨的復(fù)雜處境。

一方面，美國(guó)有世界上最先進(jìn)的AI研究資源和最優(yōu)秀的科研團(tuán)隊(duì)。

可另一方面，受地緣影響，很多華裔科學(xué)家的身份成了職業(yè)發(fā)展的障礙。

但故事沒(méi)有在離職中結(jié)束。離開(kāi)Anthropic僅10天后，姚順宇就加入了Google DeepMind，擔(dān)任高級(jí)研究科學(xué)家（Senior Staff Research Scientist），且直接進(jìn)入核心Gemini團(tuán)隊(duì)。

這速度之快，說(shuō)明DeepMind早就看中了他的能力。

無(wú)論是谷歌CEO皮查伊，還是DeepMind CEO哈薩比斯，他倆在國(guó)際合作方面采取了更開(kāi)放的立場(chǎng)。

尤其是后者，他一直在倡導(dǎo)國(guó)際合作，認(rèn)為AI安全問(wèn)題需要全球科學(xué)家共同努力。

因此，即便同樣受到美國(guó)出口管制約束，谷歌依然沒(méi)有完全切斷與中國(guó)研究機(jī)構(gòu)的聯(lián)系。

加入DeepMind后，姚順宇立即投入Gemini團(tuán)隊(duì)的工作。

僅僅5個(gè)多月后，谷歌就推出了Gemini 3 Deep Think的重大升級(jí)。

這是姚順宇加入谷歌后參與的首個(gè)項(xiàng)目，成績(jī)足以讓整個(gè)AI圈震驚。文章開(kāi)頭處就提到，這次更新甚至讓馬斯克也對(duì)其稱贊。

Gemini 3 Deep Think在多項(xiàng)基準(zhǔn)測(cè)試中刷新了紀(jì)錄。

比如在ARC-AGI-2測(cè)試中，它達(dá)到了84.6%的成績(jī)。ARC-AGI是專門測(cè)試 AI 的抽象推理能力，測(cè)試的目標(biāo)是檢測(cè)AI在面對(duì)從未見(jiàn)過(guò)的新問(wèn)題時(shí)，能否識(shí)別模式并找到解決方案。

這種能力被認(rèn)為是真正智能的標(biāo)志，而不是簡(jiǎn)單的模式記憶。

Gemini 3 Deep Think的成績(jī)，比第二名Claude Opus 4.6的68.8%高出15%，比GPT-5.2 的 52.9% 更是高出30%。

在Codeforces編程平臺(tái)上，Gemini 3 Deep Think獲得了3455分的Elo評(píng)分，達(dá)到“傳奇大師”(Legendary Grandmaster）級(jí)別，世界排名第8。

這意味著在算法競(jìng)賽和系統(tǒng)架構(gòu)方面，全世界只有7個(gè)人類程序員能超越它。

在奧林匹克競(jìng)賽水平測(cè)試中，Gemini 3 Deep Think在數(shù)學(xué)、物理、化學(xué)三個(gè)學(xué)科都達(dá)到了金牌水平。

更重要的是，Gemini 3 Deep Think還處理那些缺乏明確指導(dǎo)原則、答案不唯一、數(shù)據(jù)雜亂或不完整的現(xiàn)實(shí)挑戰(zhàn)。

這其實(shí)是當(dāng)前所有AI都面臨的短板。這些大模型雖然在標(biāo)準(zhǔn)化測(cè)試中表現(xiàn)出色，但面對(duì)真實(shí)世界的復(fù)雜問(wèn)題時(shí)，往往表現(xiàn)糟糕。

雖然我們無(wú)法確切知道姚順宇在Gemini 3 Deep Think項(xiàng)目中具體負(fù)責(zé)了哪些工作，但從時(shí)間線上看，他在自己的X上，第一時(shí)間宣布了Gemini 3 Deep Think的發(fā)布。

我個(gè)人認(rèn)為，姚順宇在Anthropic積累的強(qiáng)化學(xué)習(xí)經(jīng)驗(yàn)，以及他作為物理學(xué)家對(duì)復(fù)雜系統(tǒng)的理解，為Gemini團(tuán)隊(duì)帶來(lái)了新的視角和方法。

兩個(gè)“Shunyu Yao”的平行宇宙

說(shuō)到Shunyu Yao，其實(shí)在AI研究圈里，有兩位知名研究者都叫Shunyu Yao，發(fā)音完全一樣，都跟在頂尖的AI公司做研究工作，也都畢業(yè)于清華大學(xué)。

每次有關(guān)于“姚順宇”的新聞，總有人問(wèn)：“是哪個(gè)姚順Yu？”

跟本文的主角不同，另一位姚順雨是正兒八經(jīng)的計(jì)算機(jī)背景。

他是清華姚班畢業(yè)，普林斯頓大學(xué)計(jì)算機(jī)科學(xué)博士，曾在OpenAI工作，目前已加入騰訊。

姚順雨在AI圈的名氣，要比物理學(xué)家姚順宇更大。

他提出的ReAct框架（Reasoning and Acting），是近年來(lái)最有影響力的提示工程方法之一。

這個(gè)框架的核心思想是讓AI“邊思考邊行動(dòng)”，不是先完成所有推理再執(zhí)行，而是在推理和行動(dòng)之間交替進(jìn)行，就像人類解決問(wèn)題時(shí)的思維過(guò)程。

ReAct論文發(fā)表于2022年10月，到2025年已經(jīng)被引用超過(guò)4000次，成了提示工程領(lǐng)域的經(jīng)典工作。

姚順雨的另一項(xiàng)重要貢獻(xiàn)是思維樹(shù)（Tree of Thoughts）。

如果說(shuō)思維鏈?zhǔn)亲孉I學(xué)會(huì)了“一步步思考”，那思維樹(shù)就讓 AI 學(xué)會(huì)了“探索多條思路”。

在面對(duì)復(fù)雜問(wèn)題時(shí)，AI不再只沿著一條路徑推理，而是可以同時(shí)探索多個(gè)可能的解決方案，評(píng)估每條路徑的前景，然后選擇最有希望的方向深入。

姚順雨在谷歌Scholar上的引用數(shù)超過(guò)15000次，遠(yuǎn)高于物理學(xué)家姚順宇的5000次。

但我認(rèn)為這不奇怪，計(jì)算機(jī)科學(xué)領(lǐng)域的論文引用速度，本來(lái)也要比物理學(xué)快得多，而且姚順雨的工作更接近應(yīng)用層面，影響范圍更廣。

但引用數(shù)不能完全衡量一個(gè)科學(xué)家的價(jià)值，兩個(gè)Shunyu Yao都在各自領(lǐng)域做出了重要貢獻(xiàn)。

如果說(shuō)姚順宇是從“量子力學(xué)”出發(fā)來(lái)研究 AI，那姚順雨就是從“讓AI像人類一樣思考和行動(dòng)”的角度切入。

兩個(gè)人的研究方法、思維方式、甚至用的數(shù)學(xué)工具都不一樣，但他們都在用自己的方式，去實(shí)現(xiàn)AGI。

姚順雨在騰訊的工作，目前來(lái)看，是主要集中在agent上的。他發(fā)布的論文《CL-bench》，就是一個(gè)用于評(píng)估AI agent能力的基準(zhǔn)測(cè)試。

它相當(dāng)于一個(gè)給AGI研究者們明確一個(gè)方向，只要你的研究成果能在CL-bench上拿高分，那就說(shuō)明你接近AGI。

姚順宇則是更為直接，因?yàn)樗J(rèn)為真正的智能需要理解世界的底層規(guī)律。

物理學(xué)提供了描述宇宙運(yùn)行的數(shù)學(xué)語(yǔ)言，從量子力學(xué)到統(tǒng)計(jì)物理，從信息論到復(fù)雜系統(tǒng)，這些都是構(gòu)建真正智能系統(tǒng)的理論基石。

那么通過(guò)物理學(xué)，便可以讓AI的智能水平更上一層樓，靠近AGI。

但無(wú)論如何，沒(méi)有哪一種方法是唯一正確的，沒(méi)有哪一個(gè)學(xué)科能獨(dú)自解決所有問(wèn)題。

物理學(xué)家的理論洞察和計(jì)算機(jī)科學(xué)家的工程創(chuàng)新，都是推動(dòng)AI發(fā)展不可或缺的力量。

兩個(gè)Shunyu Yao，兩條道路，同一個(gè)目標(biāo)。

就像集齊龍珠可以召喚神龍一樣，或許有這么一家公司，集齊了所有的Shunyu Yao，那么它也就實(shí)現(xiàn)了AGI。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.