![]()
預訓練、后訓練等核心模塊暫未有大變化。
文丨陳佳惠
編輯丨程曼祺
《晚點 LatePost》獨家獲悉,在上周林俊旸突然離職后,阿里在今天(3 月 9 日)下午有了新的管理安排:
Qwen 模型一號位由阿里云 CTO 和通義實驗室負責人周靖人代管,他會深入了解模型發展需要的資源,提升各環節協作效率,確保模型高效迭代。
負責 Qwen 預訓練的劉大一恒,則將同時代管后訓練和 Coding 團隊。劉大一恒和 Qwen 模型團隊的其他 leader 向周靖人匯報。
周靖人在 2015 年從微軟加入阿里巴巴,在 iDST 和達摩院帶過前沿技術研發,也在螞蟻、淘寶做過實際業務落地。2022 年底,周靖人開始擔任阿里云 CTO 和通義實驗室負責人。2025 年,周靖人晉升為阿里合伙人,進入阿里最高集體決策機構。在他的支持下,阿里選擇了開源模型生態,并大力建設線上模型共享平臺魔搭社區(ModelScope)。
劉大一恒是 Qwen 團隊的老成員。他本科和博士都畢業于四川大學計算機方向,2020 年入選 “天才少年” 計劃入職華為,2021 年加入阿里達摩院語言技術實驗室,從 Qwen 早期就是核心成員,負責預訓練。同事評價他有優秀的數據能力,這是在小資源下提高訓練成功率的關鍵之一。
Qwen 是阿里大模型的核心研發團隊,Qwen 的變化會影響一大批使用這個系列的學術機構、研究者和創業公司。阿里此前已明確,會繼續堅持開源策略。
相較之前 Qwen 團隊的協作模式,最新的暫時管理安排依然保留了預訓練、后訓練和 coding 這樣的核心能力在同一個團隊里的緊密協作,這部分相較過去的調整并不大。至于 Qwen 原本也在探索的視覺生成模型、語音模型和具身智能相關模型團隊會如何調整,目前暫不明確。
題圖來源:Severance Season
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.