![]()
今年9月,姚順雨從OpenAI離職的消息傳出來的時候,就已經有很多傳聞說他會加入騰訊,甚至有人說騰訊給出了"億元年薪"。這個新聞一直沒得到肯定,也沒否定,就這么在AI圈懸著。
在今天,騰訊的一則內部公告終于讓這個從硅谷到中國的AI圈頂級人才流轉塵埃落定了。
27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學家,直接向總裁劉熾平匯報,同時兼任AI Infra部、大語言模型部負責人。年薪是不是這么夸張我們無人知曉,但騰訊確實動了真格——同時宣布升級大模型研發(fā)架構,新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。
朱嘯虎前段時間剛說「騰訊還沒真正發(fā)力」,評價騰訊往往等局面打明白后再加速追趕——從第五第六,追到第三第二,最后追到第一。今天騰訊就用一個27歲的年輕人回應了。
微信就是這么干的。2011年從零起步,一年時間追上QQ,最終成為移動互聯(lián)網時代的王者。這次騰訊要在AI領域重演這個故事,姚順雨是關鍵棋子。
但問題是...為什么是他?
騰訊為什么會有信心,讓一個27歲的年輕人,掌舵騰訊AI的下半場?
姚班出來的,都不是普通人
要說姚順雨的起點,得從2015年說起。那年他高考704分,安徽省理科探花,進了清華姚班。
AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批頂尖人才。但姚班厲害的地方,我覺得不只是招到了天才,更在于它提供了一套系統(tǒng)的訓練體系。
這讓我想到費曼說的第一性原理——真正重要的不是記住多少知識,而是學會如何思考。姚班從大一開始就讓學生接觸前沿研究,參與實際項目。培養(yǎng)的不只是編程能力,更是發(fā)現(xiàn)問題、定義問題、解決問題的能力。
姚順雨在這個環(huán)境里待了4年,建立了扎實的理論基礎和研究直覺。2019年畢業(yè)后,他去了普林斯頓讀博,導師是Karthik Narasimhan,專注語言智能體和人機交互。這個方向選擇為他后來的突破埋下了伏筆。
ReAct和Tree of Thoughts,這兩篇論文改變了什么?
普林斯頓的五年,姚順雨其實就做了一件事:把大語言模型從「對話系統(tǒng)」變成「任務執(zhí)行系統(tǒng)」。這在今天當然算不得多新鮮的概念,畢竟今年就是所謂AI Agent的元年。我們也見證過今年年初能實際執(zhí)行操作,幫用戶解決問題的Manus的誕生。
但回到兩年前,也就是2023月的時候,這還是鮮被討論的一個概念,姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡單:讓大語言模型不只能"想"(推理),還能"做"(行動),而且兩者交替進行。
傳統(tǒng)的Chain of Thought(思維鏈)只讓模型"想",但不讓它"做"。ReAct的突破在于,讓模型在推理的同時,可以調用工具、查詢信息、執(zhí)行操作,再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán),讓AI從"回答問題的系統(tǒng)"變成了"解決問題的助手"。
這篇論文在2023年的ICLR大會上被評為Oral(頂會中只有不到5%的論文能拿到的榮譽)。更重要的是,ReAct成了整個AI Agent領域的基礎框架,至今已被引用超過4300次。
2023年5月,姚順雨又發(fā)了Tree of Thoughts(思維樹)。如果說ReAct是讓AI學會"邊想邊做",那Tree of Thoughts就是讓AI學會"深思熟慮"。
有個數(shù)據(jù)很能說明問題:在Game of 24這個經典游戲里,GPT-4用傳統(tǒng)思維鏈方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飆到74%。這不是漸進式改進,是范式級的跨越。
Tree of Thoughts的核心想法是:讓AI解決問題時,不只是線性思考,而是像人類一樣,探索多個可能的推理路徑,評估每條路徑的可行性,必要時回溯重來。這種"搜索式思考"讓大語言模型真正有了規(guī)劃和決策能力。
這篇論文也在2023年的NeurIPS大會上拿了Oral。
到2024年5月答辯的時候,姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》(語言智能體:從下一個詞預測到數(shù)字自動化)。這個標題其實很精準地概括了他五年的研究成果:讓大語言模型從"預測文字"變成"執(zhí)行任務"。
現(xiàn)在的Google Scholar顯示,姚順雨論文的總引用次數(shù)達到19977次,h-index為27。這個數(shù)據(jù)在27歲這個年齡段,還真挺夸張的。
![]()
去OpenAI的8個月,他干了什么?
2024年8月,剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。
這是個關鍵轉折點。此前的姚順雨是純學術派——理論框架、基準測試、論文發(fā)表。但在OpenAI的8個月,他完成了從"學術派"到"產品派"的轉變,而且速度快得有點驚人。
他深度參與了OpenAI在2024年底推出的三個重要產品:
Computer-Using Agent:讓AI像人類一樣操作電腦,移動鼠標、點擊按鈕、瀏覽網頁
Deep Research:讓AI在互聯(lián)網上自主研究,整理信息,生成報告
Operator:OpenAI首個正式發(fā)布的Agent產品
這些產品背后,都能看到ReAct和Tree of Thoughts的影子。姚順雨在學術上提出的"推理與行動結合"框架,在這里變成了真實可用的產品功能。
8個月時間,參與3個核心產品的開發(fā)——這個速度在OpenAI這樣的頂尖公司也很罕見。說明姚順雨不只會寫論文,還有快速落地、快速迭代的產品能力。
不過,真正讓他變得被大眾所熟知的,其實是他在今年4月份發(fā)表的《AI的下半場》的文章。
![]()
這篇文章在AI圈引起了很多討論,因為它提出了一個在當時看來很大膽的判斷:
"AI正處在中場休息。"
過去幾十年,AI的主要精力都在開發(fā)新的訓練方法和模型。從DeepBlue、AlphaGo,到GPT-4、o-series,歷史性的突破都來自"如何訓練出更好的模型"。但現(xiàn)在,游戲規(guī)則在變。
他總結了一個"配方":大規(guī)模語言預訓練 + 數(shù)據(jù)和算力擴展 + "推理與行動"理念。這個配方已經基本標準化、產業(yè)化了,能解決各種各樣的任務——軟件開發(fā)、創(chuàng)意寫作、IMO級別的數(shù)學題、鍵鼠操作,甚至長篇問答。
那么,AI的下半場要做什么?
"下半場將把重心從'解決問題'轉向'定義問題'。我們不再只問'能不能訓練出一個模型解決X問題?',而是要問'我們究竟應該讓AI去做什么?又該如何衡量真正的進展?'"
姚順雨提出了一個關鍵概念:效用問題(Utility Problem)。
"AI已經在國際象棋和圍棋上擊敗了世界冠軍,在SAT和律師資格考試中超過了大多數(shù)人類,甚至在IOI和IMO上拿下了金牌。可世界并沒有發(fā)生太大改變——至少從經濟和GDP的角度來看如此。"
問題出在哪?他認為,根源在于我們的評估方式跟現(xiàn)實世界不一致。
比如,在評估中,任務"應該"自動運行:智能體接收輸入,自主執(zhí)行,得到獎勵。但現(xiàn)實中,智能體必須在任務過程中持續(xù)跟人類互動——你不會只給客服發(fā)一段超長文字,等上10分鐘,就指望對方給你一份完整回復。
再比如,評估"應該"是i.i.d.(獨立同分布)的。如果有500個任務的測試集,就會獨立運行每個任務,最后取平均。可在現(xiàn)實中,我們解決問題往往是順序進行的,不是并行。一個Google工程師處理代碼庫問題時,隨著對代碼越來越熟悉,效率會越來越高;但一個AI Agent在同一個代碼庫中解決了很多問題,卻無法獲得這種"熟悉度"。
所以,下半場的新玩法是:
"開發(fā)新的評估方式或任務,以衡量真實世界的效用。用現(xiàn)有配方去解決它們,或在配方上加入新的組件。"
這需要什么?產品經理的思維方式。
騰訊為什么選他?
騰訊不缺技術,也不缺人才。過去一年,騰訊混元發(fā)布了超過30個新模型,混元2.0在復雜推理和文本生成場景國內領先,混元3D模型保持全球領先水準。
但騰訊缺的,可能是一個能帶他們走向AI下半場的人。
姚順雨的價值,我覺得不只在學術成就,而在于他對"AI應該解決什么問題"的理解。
學術貢獻:他定義了AI Agent的基本范式——ReAct讓AI學會"邊想邊做",Tree of Thoughts讓AI學會"深思熟慮"。這些不是漸進式改進,而是范式級創(chuàng)新。
產品能力:他在OpenAI的8個月,證明了不只會寫論文,還能把理論快速轉化為產品。Computer-Using Agent、Deep Research、Operator——都是真實可用的產品,不是實驗室demo。
思想深度:《AI的下半場》不是簡單的行業(yè)預測,而是對整個AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價值"的轉折點,這是騰訊需要的戰(zhàn)略視野。
這讓我想到張小龍說的產品哲學——好的產品不是功能堆砌,而是找到真正的用戶需求。姚順雨對"效用問題"的思考,本質上就是在追問:AI到底應該為用戶創(chuàng)造什么價值?
2025年5月,姚順雨在一次和張小郡的對談中被問到:"如果你是微信一號位,會怎么做Agent?"
他說:"我可能會不急,先觀望觀望。"
這種思考方式,恰恰是騰訊最需要的——不是盲目跟風,不是簡單模仿,而是深刻理解技術本質,找到真正有價值的應用場景。
12月17日,騰訊官宣姚順雨的同時,還宣布了一系列組織架構調整:升級大模型研發(fā)架構,新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。AI Infra部負責大模型訓練和推理平臺技術能力建設,聚焦分布式訓練、高性能推理等核心技術。
這是個信號:騰訊不只是挖了個明星研究員,而是在為高強度的技術攻關補齊兵力、夯實底座。
他能給騰訊帶來什么?
短期來看,姚順雨肯定會提升混元的Agent能力。
ReAct和Tree of Thoughts已經是AI Agent領域的基礎框架,被廣泛應用。姚順雨對這些框架的理解和實踐經驗,會直接提升混元在任務執(zhí)行、多步推理、工具調用等方面的能力。
中期來看,他可能會推動微信生態(tài)的AI改造。
在那次對談中,姚順雨提到,微信既承載社交關系,也承載職業(yè)交互——購物咨詢、法律服務、客服溝通等。如果能把Agent能力深度整合到微信生態(tài),讓每個用戶都能擁有自己的AI助手,想象空間會很大。
朱嘯虎說騰訊往往是"追趕者",但歷史告訴我們,騰訊追趕能力極強。微信從零起步,一年追上QQ,最終超越QQ成為移動互聯(lián)網時代的王者。這次騰訊要在AI領域重演這個故事。
姚順雨的加入,讓這個故事有了不同可能性。他不只是執(zhí)行者,更是思想者。他對"效用問題"的理解,對"AI下半場"的預判,對"評估方式"的反思,都代表著一種新的研究范式和產品思維。
27歲,對大多數(shù)人來說,可能還在摸索職業(yè)方向。
但姚順雨已經參與定義了AI Agent的基本范式,參與了OpenAI的核心產品開發(fā),成為了騰訊AI的掌舵人。
AI的下半場,剛開始。
騰訊能不能在這場競賽中追到第一名,誰都無法預測。事實上,這也不是簡單地靠招幾個「小天才」型人物就能解決的問題。
不過你至少也借此看到騰訊的方向和決心,他們希望讓AI具備在現(xiàn)實世界現(xiàn)實場景中解決問題的能力,這是騰訊作為守位者的需要,也是姚順雨所真正擅長的。
以及,有一點可以確定的是:國內的頭部企業(yè)也具有吸引硅谷頭部人才的能力,AI圈國內與國外華人的競爭還在持續(xù)發(fā)生。
而這個27歲的年輕人,已經站在了AI下半場的舞臺中央。
參考資料:
姚順雨個人網站: https://ysymyth.github.io/
《AI的下半場》: https://ysymyth.github.io/The-Second-Half/
Latent.Space訪談: https://www.latent.space/p/shunyu
Tree of Thoughts論文: https://arxiv.org/abs/2305.10601
ReAct項目官網: https://react-lm.github.io/
騰訊新聞: https://36kr.com/p/3599367248412930
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.