網易首頁 > 網易號 > 正文申請入駐

<span class="js_title_inner">“最強攻擊者”加盟騰訊：Sea AI Lab原研究科學家龐天宇將入職混元｜甲子光年

2026-01-30 17:34:53　來源: 甲子光年

北京舉報

分享至

龐天宇加盟騰訊，混元要搞大事？

作者｜周悅

編輯｜王博

騰訊在AI賽道看似“佛系”的表象下，正在完成一場精密的人才引進與戰略調整。

「甲子光年」獲悉，原新加坡Sea AI Lab高級研究科學家、清華大學計算機系2017級直博生龐天宇即將入職騰訊，加盟騰訊混元多模態部Exploration Center，負責強化學習前沿算法探索。

根據龐天宇已更新的谷歌學術主頁顯示，其新Title為騰訊混元首席研究科學家兼多模態強化學習技術負責人（Principal Research Scientist and Tech Lead of Multimodal RL at Tencent Hunyuan）。他在社交媒體透露將于2月4日正式入職，稱：“混元這邊的scope（機會）和資源都更好一些。”

這一人事變動，恰好發生在騰訊董事會主席兼首席執行官馬化騰剛剛定調“穩扎穩打”之后。但這并非巧合，而是騰訊AI戰略進入新周期的強烈信號。

1.姚順雨“搭臺”，龐天宇“唱戲”

過去一年，騰訊混元經歷了“深度重構”。

“每個企業的基因不同、體質不同，騰訊的風格就是穩扎穩打。”在剛剛結束的騰訊2026年員工大會上，面對外界AI焦慮，騰訊董事會主席兼首席執行官馬化騰一開場，就給全員吃下“定心丸”，強調保持定力，專注自家節奏。

“姚順雨（騰訊首席AI科學家）加入之后，公司加快吸引人才的力度，重構研發團隊，以及在內部加快了 Co-design 設計。”馬化騰透露，騰訊混元去年在人才吸引、組織結構等方面“做了很大的改變”，吸引了更多的原生AI人才。

如果說姚順雨的加入是為了完成頂層設計與人才網絡的宏觀搭建，那么龐天宇的到來，則標志著騰訊的技術攻堅深入到具體的“腹地”。

從履歷來看，龐天宇本科畢業于清華大學數理基科班，師從清華大學計算機系教授、人工智能研究院副院長朱軍，博士期間曾斬獲微軟學者獎學金、百度獎學金等頂尖榮譽。他在ICML，NeurIPS，ICLR等頂會發表論文超70篇。

值得注意的是，他不僅是算法專家，其公開招募信息更強調對 Diffusion Models（擴散模型）、大規模訓練及 RL Infra（強化學習基礎設施）的工程駕馭能力。

「甲子光年」認為，騰訊正在形成“首席科學家+前沿技術負責人”的立體化領導架構。

其中，姚順雨的角色更偏向于頂層設計、技術方向與人才網絡的宏觀搭建，而龐天宇則作為前沿技術的攻堅負責人，深入到多模態、強化學習等具體且關鍵的腹地。二者共同推動混元大模型在技術深度與安全壁壘上的協同進化，這標志著騰訊AI研發從過去相對分散的探索，進入了更有組織、更具針對性的“Co-design”新階段。

在大模型賽道，多模態一直是騰訊的優勢領域。截止目前，騰訊混元的圖像、視頻衍生模型數量總數達到3000個，視頻模型社區下載量超過500萬，混元3D系列模型社區下載量超過300萬，已成為全球最受歡迎的開源模型系列之一。

2.從“攻擊者”到“守護者”

龐天宇的加入，對騰訊還有一個更為隱秘且關鍵的戰略價值：安全。

龐天宇曾多次在 NIPS、GeekPwn 等國際對抗攻防競賽中率隊奪冠。他最具代表性的學術成果之一，是發表于 CVPR 2018 的論文《Boosting Adversarial Attacks with Momentum》。

該論文首次將“動量（Momentum）”概念引入對抗攻擊，提出了 MI-FGSM 算法，證明了即使強大的防御模型也能被黑盒攻擊輕易攻破。這篇論文引用次數超4000次，成為全球研究模型魯棒性的標準基準之一。

這位曾經最懂如何“攻擊”模型的頂尖學者，如今被納入了騰訊的“防守”體系，其深意不言自明。

在微信這樣一個擁有十億級用戶的超級生態中，大模型的任何一次“幻覺”、安全漏洞或被惡意誘導（Jailbreak），都可能被指數級放大，引發不可控的連鎖反應。

相比于搜索或生產力工具，社交場景對AI安全的要求指數級增加。在微信、QQ這類高頻、私密且覆蓋全年齡段的社交場域中，AI面臨的挑戰不再是簡單的單輪問答，而是充滿了隱喻、反諷、情感誘導的復雜多輪對話。

一個在實驗室跑分中表現完美的模型，可能會在用戶的“套話”下泄露隱私，或在情感陪伴中輸出錯誤的價值觀引導。對于騰訊而言，元寶的高情商必須建立在高安全的地基之上。龐天宇的入局，正是為了解決這些極端的長尾案例，確保元寶在成為數億人的“社交搭子”時，既能接得住梗，又守得住線。

因此，騰訊對大模型的要求，正在跳出參數規模和榜單分數的“實驗室思維”，轉而將其視為一個需要長期穩定、安全運行的系統。

龐天宇在對抗攻防領域的深厚造詣，意味著騰訊正在建立一套嚴密的算法風控機制，從底層根除風險，確保AI在面對海量真人社交的復雜語境時，不僅聰明，而且可控。

3.“元寶派”等待微信時刻

有了龐天宇這樣的大神在后端構建“安全且聰明”的大腦，騰訊在前端的應用落地便不再保留。

就在龐天宇入職消息傳出的同時，馬化騰透露，騰訊元寶將推出“元寶派”AI社交新玩法。這不再是一個簡單的聊天機器人，而是脫胎于騰訊會議、能讓AI與用戶群體共同娛樂、協作的“社交空間”。

更具騰訊色彩的是，元寶針對春節推出了10億現金紅包激勵活動。馬化騰直言，希望此舉能夠“重現11年前的微信紅包時刻”。

2015年央視春晚，微信作為獨家新媒體互動伙伴推出 “搖一搖搶紅包”，用戶為參與互動自然綁定銀行卡，新增1億綁卡用戶，實現微信支付的閃電式破圈，超過支付寶多年積累的用戶規模，被馬云稱為 “珍珠港偷襲”。

這一時刻是騰訊用社交基因撬動支付生態的經典案例，成為馬化騰心中極致的產品標桿，也成了互聯網行業 “國民級應用破圈” 的標志性事件。

這是一種典型的騰訊式戰術：在后端，通過吸納姚順雨、龐天宇等頂尖科學家，系統性夯實多模態、安全可信的技術底座，確保接得住大規模流量。在前端，依托微信、QQ的基本盤，以“紅包戰術”復刻經典增長路徑，強力推動AI社交成為新的國民級入口。

由此可見，龐天宇的入職并非孤立事件，而是騰訊AI戰略拼圖中的關鍵一環。面對外界的AI焦慮，馬化騰口中的“穩扎穩打”，實則是一種后發制人的戰略定力。騰訊正在證明，在AI時代，定義下一代“國民級應用”的能力，依然掌握在這家社交巨頭手中。

（封面圖來源：龐天宇谷歌學術主頁）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.