![]()
![]()
龐天宇加盟騰訊,混元要搞大事?
作者|周悅
編輯|王博
騰訊在AI賽道看似“佛系”的表象下,正在完成一場精密的人才引進與戰略調整。
「甲子光年」獲悉,原新加坡Sea AI Lab高級研究科學家、清華大學計算機系2017級直博生龐天宇即將入職騰訊,加盟騰訊混元多模態部Exploration Center,負責強化學習前沿算法探索。
根據龐天宇已更新的谷歌學術主頁顯示,其新Title為騰訊混元首席研究科學家兼多模態強化學習技術負責人(Principal Research Scientist and Tech Lead of Multimodal RL at Tencent Hunyuan)。他在社交媒體透露將于2月4日正式入職,稱:“混元這邊的scope(機會)和資源都更好一些。”
這一人事變動,恰好發生在騰訊董事會主席兼首席執行官馬化騰剛剛定調“穩扎穩打”之后。但這并非巧合,而是騰訊AI戰略進入新周期的強烈信號。
1.姚順雨“搭臺”,龐天宇“唱戲”
過去一年,騰訊混元經歷了“深度重構”。
“每個企業的基因不同、體質不同,騰訊的風格就是穩扎穩打。”在剛剛結束的騰訊2026年員工大會上,面對外界AI焦慮,騰訊董事會主席兼首席執行官馬化騰一開場,就給全員吃下“定心丸”,強調保持定力,專注自家節奏。
“姚順雨(騰訊首席AI科學家)加入之后,公司加快吸引人才的力度,重構研發團隊,以及在內部加快了 Co-design 設計。”馬化騰透露,騰訊混元去年在人才吸引、組織結構等方面“做了很大的改變”,吸引了更多的原生AI人才。
如果說姚順雨的加入是為了完成頂層設計與人才網絡的宏觀搭建,那么龐天宇的到來,則標志著騰訊的技術攻堅深入到具體的“腹地”。
從履歷來看,龐天宇本科畢業于清華大學數理基科班,師從清華大學計算機系教授、人工智能研究院副院長朱軍,博士期間曾斬獲微軟學者獎學金、百度獎學金等頂尖榮譽。他在ICML,NeurIPS,ICLR等頂會發表論文超70篇。
值得注意的是,他不僅是算法專家,其公開招募信息更強調對 Diffusion Models(擴散模型)、大規模訓練及 RL Infra(強化學習基礎設施) 的工程駕馭能力。
![]()
「甲子光年」認為,騰訊正在形成“首席科學家+前沿技術負責人”的立體化領導架構。
其中,姚順雨的角色更偏向于頂層設計、技術方向與人才網絡的宏觀搭建,而龐天宇則作為前沿技術的攻堅負責人,深入到多模態、強化學習等具體且關鍵的腹地。二者共同推動混元大模型在技術深度與安全壁壘上的協同進化,這標志著騰訊AI研發從過去相對分散的探索,進入了更有組織、更具針對性的“Co-design”新階段。
在大模型賽道,多模態一直是騰訊的優勢領域。截止目前,騰訊混元的圖像、視頻衍生模型數量總數達到3000個,視頻模型社區下載量超過500萬,混元3D系列模型社區下載量超過300萬,已成為全球最受歡迎的開源模型系列之一。
2.從“攻擊者”到“守護者”
龐天宇的加入,對騰訊還有一個更為隱秘且關鍵的戰略價值:安全。
龐天宇曾多次在 NIPS、GeekPwn 等國際對抗攻防競賽中率隊奪冠。他最具代表性的學術成果之一,是發表于 CVPR 2018 的論文《Boosting Adversarial Attacks with Momentum》。
該論文首次將“動量(Momentum)”概念引入對抗攻擊,提出了 MI-FGSM 算法,證明了即使強大的防御模型也能被黑盒攻擊輕易攻破。這篇論文引用次數超4000次,成為全球研究模型魯棒性的標準基準之一。
這位曾經最懂如何“攻擊”模型的頂尖學者,如今被納入了騰訊的“防守”體系,其深意不言自明。
在微信這樣一個擁有十億級用戶的超級生態中,大模型的任何一次“幻覺”、安全漏洞或被惡意誘導(Jailbreak),都可能被指數級放大,引發不可控的連鎖反應。
相比于搜索或生產力工具,社交場景對AI安全的要求指數級增加。在微信、QQ這類高頻、私密且覆蓋全年齡段的社交場域中,AI面臨的挑戰不再是簡單的單輪問答,而是充滿了隱喻、反諷、情感誘導的復雜多輪對話。
一個在實驗室跑分中表現完美的模型,可能會在用戶的“套話”下泄露隱私,或在情感陪伴中輸出錯誤的價值觀引導。對于騰訊而言,元寶的高情商必須建立在高安全的地基之上。龐天宇的入局,正是為了解決這些極端的長尾案例,確保元寶在成為數億人的“社交搭子”時,既能接得住梗,又守得住線。
因此,騰訊對大模型的要求,正在跳出參數規模和榜單分數的“實驗室思維”,轉而將其視為一個需要長期穩定、安全運行的系統。
龐天宇在對抗攻防領域的深厚造詣,意味著騰訊正在建立一套嚴密的算法風控機制,從底層根除風險,確保AI在面對海量真人社交的復雜語境時,不僅聰明,而且可控。
3.“元寶派”等待微信時刻
有了龐天宇這樣的大神在后端構建“安全且聰明”的大腦,騰訊在前端的應用落地便不再保留。
就在龐天宇入職消息傳出的同時,馬化騰透露,騰訊元寶將推出“元寶派”AI社交新玩法。這不再是一個簡單的聊天機器人,而是脫胎于騰訊會議、能讓AI與用戶群體共同娛樂、協作的“社交空間”。
更具騰訊色彩的是,元寶針對春節推出了10億現金紅包激勵活動。馬化騰直言,希望此舉能夠“重現11年前的微信紅包時刻”。
2015年央視春晚,微信作為獨家新媒體互動伙伴推出 “搖一搖搶紅包”,用戶為參與互動自然綁定銀行卡,新增1億綁卡用戶,實現微信支付的閃電式破圈,超過支付寶多年積累的用戶規模,被馬云稱為 “珍珠港偷襲”。
這一時刻是騰訊用社交基因撬動支付生態的經典案例,成為馬化騰心中極致的產品標桿,也成了互聯網行業 “國民級應用破圈” 的標志性事件。
這是一種典型的騰訊式戰術:在后端,通過吸納姚順雨、龐天宇等頂尖科學家,系統性夯實多模態、安全可信的技術底座,確保接得住大規模流量。在前端,依托微信、QQ的基本盤,以“紅包戰術”復刻經典增長路徑,強力推動AI社交成為新的國民級入口。
由此可見,龐天宇的入職并非孤立事件,而是騰訊AI戰略拼圖中的關鍵一環。面對外界的AI焦慮,馬化騰口中的“穩扎穩打”,實則是一種后發制人的戰略定力。騰訊正在證明,在AI時代,定義下一代“國民級應用”的能力,依然掌握在這家社交巨頭手中。
(封面圖來源:龐天宇谷歌學術主頁)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.