一句“bye my beloved qwen”,藏盡不舍與決絕。
3月4日凌晨,一則英文帖子在社交媒體上悄然傳播。阿里巴巴通義千問(Qwen)的技術負責人林俊旸寫道:“me stepping down. bye my beloved qwen.”(我卸任了。再見了,我親愛的千問。)據悉,林俊旸已于3月3日下午正式遞辭,Qwen團隊內部同步消息后,有知情者透露,部分同事當場落淚。截至發稿,阿里官方沉默不語,林俊旸未披露去向,但業內風聲已起:多位投資人和頭部企業,早已向這位技術猛將拋來橄欖枝。
![]()
幾乎同時,團隊的后訓練負責人郁博文也宣布離職。而早在1月,Qwen Code的負責人惠彬原已轉投Meta。短短兩個月,這支標桿團隊的三位核心負責人相繼離開。
據多方信息證實,這一系列人事變動的直接導火索,是阿里云通義實驗室對Qwen團隊組織模式的根本性重塑。
原先,Qwen團隊是“垂直整合”的,從預訓練、后訓練到具體模態開發,都由一個團隊貫穿。這種模式溝通鏈路短,目標統一,迭代迅速。但如今,實驗室計劃將其拆解,轉向“水平分工”——未來會成立獨立的預訓練、后訓練、文本、多模態等團隊,協作關系從內部緊密耦合變為模塊化對接。
這一調整直接導致了林俊旸管理范圍的顯著縮小。作為原垂直團隊的總負責人,他需要統籌從底層基礎設施到上層模型應用的全鏈條。而組織分拆后,他的職權很可能被限制在某個特定環節。更重要的是,這種“打散”團隊的做法,與林俊旸本人長期以來秉持的技術理念存在分歧。
在過去一年中,他曾多次公開或內部表達觀點,認為在大型模型研發進入深水區的當下,預訓練、后訓練以及底層基礎設施(Infra)團隊之間需要更緊密的結合與無縫溝通,而非割裂。事實上,Qwen團隊從2024年中后期就開始嘗試組建自己的專屬Infra團隊,以更直接地支撐模型訓練需求,這部分職能原本主要由阿里云的人工智能平臺PAI統一提供。林俊旸推動的這一嘗試,本身就體現了他對“一體化”研發效率的追求。當公司決策走向相反的“水平分工”時,理念沖突成了他離開的關鍵。
一人離場,多米諾骨牌徹底倒了,回看履歷,能清晰看到他們對Qwen的烙印。
林俊旸(花名:靖舟),1993年出生,是阿里最年輕的P10之一。他的背景橫跨工科與人文:本科在北京大學攻讀計算機科學,碩士卻轉向了外國語學院的語言學與應用語言學。這種訓練塑造了他獨特的視角——將語言邏輯轉化為機器可理解的框架。2019年碩士畢業后,他加入阿里巴巴達摩院,參與了早期多模態預訓練模型M6的研發。2022年底,隨著達摩院相關團隊并入阿里云成立通義實驗室,林俊旸被正式任命為通義千問系列大模型的技術負責人。在他的主導下,Qwen系列完成了從閉源到全面開源的戰略轉身,并迅速在全球開發者社區建立起巨大影響力。
![]()
郁博文,2022年中科院博士畢業,以“阿里星”身份入達摩院,天賦與實力雙在線。作為后訓練負責人,負責的是模型在預訓練之后的關鍵精調環節,包括指令遵循、人類偏好對齊、安全倫理約束等,這直接決定了模型最終的用戶體驗和可靠性。
而惠彬原領導的Qwen Code,則是Qwen生態中專注于代碼生成與理解能力的子品牌,其離職加入Meta,也反映了國際科技巨頭對頂尖AI人才的激烈爭奪。惠彬原離職后,林俊旸曾親自接管 Qwen Code 相關工作,直至此次卸任。
核心人員的變動,發生在一個微妙的時刻。
就在林俊旸卸任前兩天,3月2日晚,阿里巴巴集團剛宣布了一項重大的品牌整合決定:將旗下所有大模型產品線統一命名為“千問”(Qwen),此前使用的“通義千問”等名稱將逐步退出。品牌統一的目的是為了減少用戶認知混亂,集中力量打造一個清晰的市場入口,這與全球AI行業趨勢一致。同日,團隊還開源了4款主打端側部署的小尺寸模型(Qwen3.5-0.8B/2B/4B/9B),甚至吸引了埃隆·馬斯克的點贊。林俊旸當時還轉發了消息致謝。品牌升級與技術發布的熱度未散,核心舵手卻突然告別,這種反差令外界倍感意外。
![]()
不可否認,在他們帶領下,千問取得了矚目成績。
從2023年8月首次開源以來,Qwen系列模型參數規模覆蓋從0.5B到萬億級別,構建了包含語言、數學、代碼及多模態的完整能力體系。截至2026年初,其在全球開源社區Hugging Face上的衍生模型數量已突破20萬款,累計下載量超過10億次,超越了Meta的Llama系列,成為全球最活躍的開源大模型生態之一。
技術里程碑同樣堅實。2025年4月發布的Qwen3混合推理模型采用了先進的MoE架構。同年發布的旗艦模型Qwen3-Max參數規模超萬億,在GPQA等專業科學測試中超越了同期國際主流模型。其增強版Qwen3-Max-Thinking在AIME、HMMT等高難度數學競賽中取得了滿分。根據2025年SuperCLUE年度中文大模型基準測評,其綜合得分位列全球第六。在LMSYS Chatbot Arena全球盲測、MMLU等綜合基準中,Qwen系列長期穩居全球前七,是中文語境下能力最全面的模型之一。
除了技術評測,商業化和國際影響力也在突破。2026年2月,國際奧委會官方宣布,基于千問大模型打造了奧運史上首個官方大模型,應用于2026年米蘭冬奧會的賽務調度、轉播信號分發及交通指揮等核心系統。2025年11月,面向消費者的“千問”App上線后,七天下載量便突破1000萬次。
眼下,通義實驗室正試圖用“水平分工”應對新挑戰。這種模式在業內并非沒有先例,旨在提升專業化與規模效率。但它也帶來新問題:各環節目標如何統一?協作損耗是否會抵消專業收益?尤其對大模型研發而言,這種調整的效果尚待觀察。
來源:星河商業觀察
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.