![]()
![]()
“拋棄「花里胡哨」,姚順雨要帶著混元回到最「基本」的路上。”
作者丨董子博
編輯丨林覺民
早在三月,提起馬上要上線的混元 3.0,在騰訊混元工作的同學左飛就對雷峰網(wǎng)說過:“這次混元的新版本,其實團隊預期不算太高。”
一個月后,4 月 23 日晚,Hy3 的 Preview 版本正式發(fā)布,同步開源,向世界展示自己最真實的樣子。雷峰網(wǎng)獨家獲悉,Hy3 規(guī)模更大、功能更全面的閉源旗艦版本將在五六月份發(fā)布,給人留下不少想象空間。
(騰訊混元的新進展,雷峰網(wǎng)正在持續(xù)關(guān)注,歡迎添加作者微信:william_dong,交流信息,探討認知。)
說起來,騰訊 Hy3 Preview 的發(fā)布也有點“生不逢時”——前有 GPT 5.5 舉世圍觀,后有 DeepSeek V4 重磅回歸,被夾在中間的混元,還是在“9.7 減去 9.11”的小學數(shù)學題上犯了難,在社交平臺上引起了一陣圍觀。
“其實 GPT 和 DeepSeek 的發(fā)布日期在我們內(nèi)部也不是什么秘密,但為什么選擇在這個時候和他們一起發(fā)布,我也不太清楚。”左飛對雷峰網(wǎng)如是說
Hy3 之于 4 個月前的上一個版本究竟有哪些變化?在混元內(nèi)部的同學邰蘿對雷峰網(wǎng)分享道:“Hy3 基本上把之前的架構(gòu)重構(gòu)了一遍,但簡單來來說,是回到了‘基本’。”
一直以來,業(yè)界的“基本”,是使用 Transformer 架構(gòu)和 Full Attention 等一系列被驗證了的技術(shù)方案,如 OpenAI 實踐的一樣,少有花里胡哨的操作,核心是把 DATA 做到極致;
而 Hy2 的時期,騰訊卻嘗試了不少架構(gòu)上的創(chuàng)新——比如 Multi-Token Prediction、Mamba 等方案,反而把數(shù)據(jù)和 Infra 的“基礎(chǔ)題”放下了。
到了 Hy3,姚順雨則主導模型回到“基本”,重新使用經(jīng)過驗證的共識架構(gòu)。而過去沒繞過,今天也不可能繞過的數(shù)據(jù)和 Infra 問題,則成了必須下足的“苦功夫”。
騰訊同學雷甌對雷峰網(wǎng)說,在過去,不少 SFT 數(shù)據(jù)沒有經(jīng)過去重,重復、冗余的數(shù)據(jù)甚至能達到上千萬條,尤其是工期緊張的時候,數(shù)據(jù)的優(yōu)先級就被排在了很后面。
姚順雨來到騰訊,拉起了一個 20 余人的預訓練數(shù)據(jù)團隊,專門做數(shù)據(jù)審核“最臟最累”的工作,幾個月內(nèi)把冗余的 SFT 數(shù)據(jù)控制在了一萬多條的規(guī)模下。
而在 Infra 的角度,姚順雨也拎起了一個團隊,重構(gòu)過去騰訊 RL 的管線,讓萬卡集群能夠跑得穩(wěn)定、安全,有應對突發(fā)情況的能力。
之前,在騰訊 TEG,內(nèi)部使用的基礎(chǔ)設(shè)施是一個名叫“太極”的機器學習平臺。近期,太極平臺的 Feature 也在以一到兩周一次的速度進行更新,做了不少迭代工作。
于是,在騰訊內(nèi)部的 Benchmark 上,混元的性能可以達到 Kimi 2.5 的水平,超越了 MiniMax,僅次于 Gemini 和 Seed 2.0。
在混元體系的改造中,姚順雨扮演的角色不僅是一個技術(shù)領(lǐng)袖:除了數(shù)據(jù)和 Infra 進行了大量重構(gòu),混元的組織和人員也完成了不小的調(diào)整。
組織上,混元被分為了預訓練、后訓練、Baseline Infra、模型評估和 Frontier 五大板塊,除 Frontier 更偏技術(shù)探索和預研以外,四個板塊十幾個組,以十分扁平的結(jié)構(gòu),幾乎全部投入 Hy3 的研發(fā)當中,而姚順雨也被評價為十分親歷親為的領(lǐng)導角色,對技術(shù)細節(jié)相當關(guān)注,和下面同學一起開會時候不少;
人員上,姚順雨入主之后,也在推動團隊的重構(gòu),從字節(jié)、阿里、DeepSeek、Kimi 等部招攬大量核心人才,姚順雨尤其喜歡信仰 AGI、技術(shù)扎實的年輕人,不少校招生、實習生也加入團隊,給團隊注入了不少新鮮血液。
如今的姚順雨,面臨的并非與行業(yè)巨頭旗鼓相當?shù)恼娼讳h,而是一場從底層補短板、填漏洞的追趕之戰(zhàn)——騰訊的逆襲絕非一蹴而就,唯有沉下心打磨基本功,方能積蓄力量迎頭趕上,重回競逐的第一梯隊。
(騰訊等大廠在 AI 賽道上的競逐,背后內(nèi)幕不少,雷峰網(wǎng)正持續(xù)深度調(diào)查,歡迎添加作者微信:william_dong了解更多消息。)
*本文左飛、邰蘿、雷甌均為化名。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.