![]()
AI行業的競爭與聚變也體現在人才的流動上。
3月12日,繼原阿里巴巴通義實驗室千問(Qwen)大模型技術負責人林俊旸離職之后,其團隊另一位核心骨干的去向也終于浮出水面。
行業消息稱,原千問后訓練(Post-training)負責人郁博文已正式加入字節跳動,擔任Seed團隊視覺模型與多模態交互團隊后訓練負責人。
有接近字節的人士向華爾街見聞證實了上述人事變動。
這一人事變動發生在阿里千問團隊剛剛完成組織架構調整、多位核心技術人才密集出走的時間節點,引發業界對國內大模型領域人才流動與技術路線競爭的廣泛關注。
郁博文的學術與技術履歷在業內堪稱扎實。公開資料顯示,他本科畢業于中南大學,后考入中國科學院信息工程研究所攻讀研究生,2022年獲得中國科學院大學博士學位。
讀博期間,他專注于自然語言處理與信息抽取領域研究,曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文,并創新性地提出將信息抽取任務轉化為圖結構問題的思路,有效解決了實體重疊、嵌套等復雜場景下的識別難題,憑借突出的學術表現榮獲中國科學院院長獎 。
2022年博士畢業后,郁博文以阿里集團最高級別的校招項目 “阿里星”身份加入阿里巴巴達摩院,擔任算法專家(P7)。入職初期,他便深度參與通義千問大模型的早期訓練與研發工作,迅速成長為千問團隊核心骨干,并最終擔任后訓練負責人 。
郁博文的離職與阿里通義實驗室近期的組織架構調整緊密相關。
3月,阿里通義實驗室啟動組織架構調整,計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行的水平分工模塊 。這一調整直接導致郁博文的管理范圍大幅縮小,且與其一直堅持的“預訓練與后訓練必須深度耦合”的技術理念產生了明顯沖突。
此外,阿里高層對千問團隊施加的商業化考核壓力,也在一定程度上加劇了團隊內部的分歧 。
3月3日,郁博文提交辭職申請,次日正式離職,他的工作隨后由前Google DeepMind高級資深研究員周浩接任。
郁博文的下一站選擇,同樣反映出當前大模型競爭的新焦點。
字節跳動的Seed團隊近年來在大模型和多模態領域持續投入資源,此次郁博文加入后擔任視覺模型與多模態交互團隊后訓練負責人,意味著字節跳動正在強化其在多模態方向上的“后訓練”能力 。
后訓練作為大模型從通用底座走向產品化、場景化的關鍵環節,直接決定了模型在實際交互中的表現。
郁博文在千問期間積累的對話模型優化、多模態對齊、知識蒸餾等經驗,與Seed團隊當前的技術布局高度契合。尤其是在視覺與多模態交互領域,如何通過高效的后期微調和強化學習讓模型更“懂”用戶,已成為各大廠商差異化競爭的關鍵。
郁博文從阿里流向字節,是本輪AI競爭中核心人才流動的案例之一。1月,Qwen Code負責人惠彬原已離開阿里加入Meta 。更早之前,OpenAI、xAI、Meta等國際巨頭內部同樣經歷著核心人才的流動 。
這一輪人才流動背后,反映出大模型行業發展的幾個深層變化。
一方面,技術強人時代正在重塑人才與平臺的關系。 當前大模型技術仍處于快速演進階段,頂尖技術人才的個人判斷和愿景對技術路徑的影響遠超以往。
另外,算力資源與組織協同成為人才去留的關鍵變量。 單純的薪酬激勵已難以鎖定頂尖人才,企業能否提供充足的支持、能否構建與人才技術理念相匹配的組織架構,正在成為留住核心骨干的更重要因素 。
同時,多模態與后訓練正成為下一階段的人才爭奪主戰場。 隨著基礎大模型的能力逐漸趨同,如何通過后訓練技術實現差異化、如何將視覺與語言能力深度融合,已成為頭部廠商競相布局的方向。郁博文此番加入字節多模態團隊,正是這一趨勢的縮影 。
對于行業而言,核心人才的流動既是挑戰也是催化劑。它倒逼企業重新思考與頂尖人才的協同方式,也加速了技術理念的跨平臺傳播與碰撞。
在大模型仍未抵達終局的當下,人才的流向,某種程度上正繪制著未來技術競爭的版圖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.