![]()
創新需要適當的灰度和混亂,但應對競爭需要秩序和紀律。
文丨陳佳惠 賀乾明
制圖丨黃幀昕
編輯丨賀乾明
上千人的研究團隊、投入上百億元追趕兩年,終于研發出能排在中國第一梯隊的基礎模型,迅速被只有上百人的團隊用更少資源研發的模型超過,部門負責人承認失誤,公司 CEO 在全員會上點名,本可以做得更好。
這是吳永輝 2025 年初接管字節跳動大模型研究部門 Seed 時的情況。多位 Seed 人士說,他背負著 “把模型能力做到國內第一,與國際領先模型公司競爭” 的期待。
“沉穩” 是他們對吳永輝的直觀感受。我們了解到,接管 Seed 后,吳永輝密集與 100 多位核心研究員 1on1,隨后提拔了數位模型架構方向的研究員。
接管 Seed 一年間,吳永輝聚焦兩件事:一是提升基礎模型能力,提高研究效率保證交付;二是營造研究導向的氛圍,“做第一流的研究,打造第一流的 AI 研究團隊”。
“有務實又有浪漫。” 一位接近吳永輝人士說,他像是在字節體系內成長起來的,而不是出自 Google。
吳永輝 2008 年博士畢業后加入 Google,前 7 年作為軟件工程師參與最核心的搜索排名工程;隨后轉崗到 Google Brain 從事 AI 應用研究,推動深度學習改變翻譯領域、用到搜索排名算法中;2023 年成為大模型研發部門 Google DeepMind 研究副總裁,參與 Gemini 大模型研發和早期追趕歷程。
另一位接近吳永輝的人士說,“他對技術了解很深,能迅速判斷什么方向可以出成果。” 過去一年,Seed 的文生圖、文生視頻模型在一些基準測試榜單上排在全球前列,豆包手機助手模型成為行業關注焦點。
在競爭最激烈、最重要的基礎模型方向,Seed 迭代 4 版(算上即將發布的豆包 2.0),與此前模型能力有較大提升,持續追趕海外領先模型。“但還需要補課,填上過去幾年留下來的 ‘技術債’。” 一位 Seed 人士說。
追求 “一流研究團隊” 這個長期目標的同時,吳永輝還要不斷和短期目標做平衡。
調整:組建三個虛擬團隊,打通數據、代碼庫提高效率
2025 年 1 月,Seed 組建 “Seed Edge” 虛擬團隊,設置 3 年期限的考核機制,鼓勵骨干研究更基礎、更長期的 AGI 課題。我們了解到,吳永輝參與了該團隊的組建。
隨后他又抽調研究人員組建 Focus 團隊,打破部門邊界和既有分工,負責基礎模型的攻堅,研發下一版模型需要提升的部分。剩下基礎模型的團隊劃分成 Base,包括工程、數據、測評等,研發當前一代基礎模型。
這年 3 月,時任 LLM 團隊負責人喬木被舉報暫停工作后,LLM 下屬的 Pre-train(預訓練)、Post-train(后訓練) 和 Horizon 等直接向吳永輝匯報。
兩位 Seed 人士說,在吳永輝的規劃中,可以同時推進三代模型研發,人員、課題都可以相互輪換,同時盤活內部的資源,“Edge 有了成果可以直接下放;Focus 發現長期課題可以轉入 Edge,有了成果可以用于改進當前一代模型。”
為了提高效率,吳永輝還推動內部數據、代碼庫透明,對外保密。他在內部說,這是 “改進內部反映的一些問題”。
在字節跳動,Seed 脫離各營收部門單獨設立,團隊直接向集團管理層匯報,更容易擺脫部門政治。但在 Seed 中,總是多個團隊研發方向接近,團隊之間溝通相對困難。
兩位曾在 Seed 工作的研究員說,之前他們像是一群研究小組的集合,而不是整體的研究部門,比如小組 A 的研究者想看小組 B 的文檔,要先經過文檔所有者、所有者的領導同意,“有時候部門負責人出面調解都看不了全部信息。”
更透明的信息共享提高了溝通效率,也帶來了一些麻煩。我們了解到,2025 年下半年,Seed 至少發生兩起實習生泄密事件。之后他們不再要求內部文檔公開授權。
基礎語言模型研究方向之外,Seed 依舊保持原有的組織架構。上一任 Seed 負責人朱文佳與吳永輝同時負責 Seed 部門數月后,轉向吳永輝匯報,負責大模型應用。
多模態交互和世界模型團隊由 2024 年從阿里加入字節的周暢負責,代表成果是豆包手機助手模型。過去一年,隨著視覺多模態生成負責人楊建朝休假、視覺基礎模型研究負責人馮佳時離職等變動,周暢的管理范圍持續擴大,新增文生圖 Seedream、文生視頻 Seedance 模型等。
Infra(基礎設施)團隊由項亮負責。字節跳動的 AI Lab 帶著剩下的三個研究方向——AI for Science、Robotics、Reponsible AI 并入 Seed,負責人李航向吳永輝匯報。
過去一年,Seed 整體規模維持在 1500 人左右,擴張速度比前兩年放緩,幾乎不再從外部招聘中高層技術管理者。他們更加重視招聘應屆畢業生、提拔年輕人。我們了解到,一位 2024 年從清華大學畢業的博士生,現在同時向周暢和吳永輝匯報。
![]()
![]()
成果:邊開車邊修輪子,訓出萬億參數豆包 2.0
即將發布的豆包 2.0 模型是吳永輝接管 Seed 一年最核心的產出。它是一款類似 Gemini 的多模態模型,10000 億參數,是 Seed 成立以來訓練的最大模型。
吳永輝到來后,多位 Seed 研究員明顯感受到開會的頻率提升,原本 3 個月開一次會的研究團隊現在每月就要溝通一次,核心團隊基本每兩周一次。有字節人士提到,在食堂吃飯時,經常能看到吳永輝端著餐盤坐到研究員對面,邊吃邊聊進展。
每次研究團隊匯報完畢后,吳永輝通常會提幾個簡短的問題——通常是 3 個。“他不會直接給出具體的解決方案,而是引導大家思考更本質的問題。” 一位 Seed 研究員說。
多位 Seed 人士告訴我們,這款模型訓練期間遇到基礎設施層面的挑戰。他們分析,過去兩年 Seed 持續追趕期間,相對忽視了基礎能力建設,所以訓練豆包 2.0 期間擴大參數規模時不穩定,一度難以推進。
“就像蓋房子,如果地基不穩,往上加磚頭的確容易出問題。” 一位 Seed 研究員說。
OpenAI 的 RL Infra 負責人翁家翌在一檔播客節目中說,每個模型團隊的 Infra 都有 bug,模型公司本質上拼的是 Infra 修 bug 的速度,它決定了單位時間內驗證想法的數量,而想法只要提高人才密度就能解決。OpenAI 去年開始重構使用三年的 Infra 體系,解決越積越多的 “技術債”。
過去一年,阿里、騰訊的大模型團隊都提高了對 Infra 的重視程度。Qwen 模型團隊去年中開始在內部組建 Infra 團隊,這部分工作原來主要靠阿里云的人工智能平臺 PAI。騰訊去年底宣布成立 AI Infra 部及數據計算平臺部,由大模型負責人姚順雨直接負責。
而對于 Seed 團隊,想要重整 Infra 系統難度更大。我們了解到,Seed 的 Infra 團隊有數百人,同時支撐 Seed 內部數十款模型的研發和嘗試,高層認為水平國內第一。“想要重整,需要投入大量人力、物力,還要承擔不小的信任成本。” 一位 Seed 人士說,只能 “邊開車邊修輪子”。
我們了解到,訓練豆包 2.0 遇到問題后,最終多個團隊配合,花了 3 個月時間,主要從模型架構、訓練數據等方面入手解決問題,確保模型趕在春節前上線。
難題:既要做一流研究組織,又要有短期產出
“我們致力于打造一種獨特的文化融合體:既有初創企業的專注與活力,又兼具學術界的天馬行空式思維。”Google DeepMind CEO 德米斯·哈薩比斯(Demis Hassabis)曾說。
多位 Seed 人士說這也是吳永輝的目標,“他想把 Seed 做成一流的研究品牌。”
字節跳動給他提供了環境。過去兩年,字節在 Seed 聚集了一批研究人才,就算沒有合適的位置,也傾向于 “先把人招進來”。
字節給 Seed 部門設置更寬松的考核機制,大部分取消 OKR。2025 年中,字節發放獨立于公司期權之外的 “豆包虛擬股” 激勵員工,并多次提高薪酬。
他們也在 Seed 營造一種寬松的工作氛圍,實習生能直接與最高層交流。一位 TopSeed 實習生曾在社交媒體上分享,他在開發某個項目的近兩個月里,大部分時間睡在公司,經常凌晨兩點帶著新想法興奮驚醒,寫兩小時代碼再睡,“感覺每一刻都在不斷的發現新現象”。
去年 3 月,吳永輝在部門全員會上說,Seed 做了很多不錯的工作,但外界不太了解,鼓勵研究者以論文和博客的形式發表成果。“他還建議大家 ‘裝修’ 下個人主頁。” 一位曾在 Seed 的人說。根據我們初步統計,吳永輝加入 Seed 之后的三個月,該團隊發布的論文數量就超過 2024 年全年。
能夠對外界充分展示研究成果,進一步激發了 Seed 研究者的自驅力。“篩選出來了一批非常勤奮專注,或者說熱衷于鉆研的年輕人。” 一位去年離開 Seed 的核心研究者說,他們多數人每天兩點一線,為了省事,吃飯只在公司食堂,“生活的主要樂趣就在于工作帶來的 feedback”。
我們了解到,Seed 會出現一種情況:幾個研究員決定自發研究一個方向,如果上級不同意、不分配資源,他們可以上升匯報,得到認可后,就可以從上到下推進。
“他們從前是自己領域內的 ‘小霸王’,帶著 ego 來到 Seed,每個人都想成就一番事業。” 上述人士預估,可能只有 20% 的資源是用在短期有用的課題上,“浪費有可能是對的,字節不缺資源。”
但 Seed 并不是一個脫離競爭存在的研究組織,他們需要給字節跳動提供 “彈藥”,應對騰訊、阿里等公司的競爭。團隊資源不可避免會向短期有成果的團隊傾斜。多位 Seed 人士說,去年下半年開始,有研究者做一些單點研究,“感覺不符合 Seed 的主流方向,就很少有人在意這份成果”。
我們了解到,從去年三季度開始,字節管理層對 Seed 團隊發論文有了新要求,包括 “高質量”“內容與正迭代的核心技術無關” 等,之后每月發布的論文有所減少。
“永輝想要營造研究氛圍,但很難避免 DDL 導向。” 一位 Seed 研究員說,他們團隊本來要花更多資源和時間,自研算法解決某個技術問題,但為了盡快上線,項目啟動后不久就被要求調整思路,在開源項目基礎上改進,“哪怕性能有損失”。
今年 1 月,字節跳動 CEO 梁汝波在全員會上說,字節今年關鍵詞是 “勇攀高峰”,短期內高峰是 “豆包 /Dola(豆包海外版)助手應用”,重點是 “AI 模型能力要做到行業前列,通過助手整合好已有業務”。一年前的全員會上,梁汝波說 AI 研究團隊要 “探索智能上限”。
創新需要適當的灰度和混亂,而應對競爭需要秩序和紀律。怎么平衡好這兩個目標,是吳永輝在 Seed 持續要解的管理難題。
題圖來源:《盜夢空間 Inception》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.