文 | 光錐智能,作者|魏琳華 ,編輯|王一粟
3月4日凌晨,林俊旸在 X 上發布“me stepping down. bye my beloved qwen”,那時他是否會想到如此之大的輿論震動,我們不得而知。
![]()
但在前一天宣傳模型,后一天就宣告離開的情況下,千問大模型(下稱Qwen)裂開了一條縫隙,外部得以嗅到來自阿里內部變化的氣息。
一天后,阿里集團CEO吳泳銘簽發了林俊旸的離職令,并以前所未有的姿態組建了一個由集團最高權力核心構成的“三人小組”,這個三人小組包括吳泳銘、阿里云CTO周靖人和現任餓了么董事長兼CEO的范禹,共同接管Qwen資源調度的問題。
放在今天,Qwen在中國開源生態的貢獻上有目共睹,但帶頭做出Qwen2.5、Qwen3系列模型的兩個技術負責人周暢和林俊旸,先后離開了阿里。
在這場離職風暴的中心,隱藏著一個關于“實驗室理想”與“AI帝國”如何注定分離的命題:
阿里需要的,是一個能夠證明阿里AI實力的先進模型,為阿里拿下 AI 時代的新入口;一個能在MaaS戰場上,為阿里云收割付費Token消耗的穩定引擎。而林俊旸追求的,是極致的開源精神和垂直整合的組織架構。
兩者的故事中,誰都沒錯,但林俊旸和阿里,已經逐漸來到了分道揚鑣的岔路口。
告別Qwen,周暢和林俊旸先后出走的背后
要理解這場離職風暴的深層邏輯,需要將時間撥回更久以前。
在林俊旸之前,阿里巴巴在大模型領域已經經歷了一次核心人才的變化。
第一次,以周暢為首的AI團隊跳槽,是阿里Qwen團隊技術骨干出走的一個關鍵節點。
曾作為阿里P9級別員工的周暢,選擇加入了字節跳動。據悉,加入字節后,周暢不僅獲得字節4-2職級,相當于連跳兩級,且薪資高達千萬級別,比之前翻了好幾倍。
周暢的離職,不僅是因為薪資,一部分原因也在于對個人對技術路線的偏好。據晚點LatePost報道,彼時的周暢看好多模態方向,但放在2024年,也就是大廠集中押注大語言模型的情況下,周暢看中了字節視覺團隊拋來的橄欖枝。
人才的流失,顯然引起了阿里的警覺。作為接過周暢重任、擔任阿里Qwen模型團隊的技術負責人,從校招P6級別進入阿里,到幾年內多次升職,林俊旸成為了阿里最年輕的P10級別員工。
用馬云的話說,離職無非兩種原因,一是錢沒有給到位,二是“心委屈了”。林俊旸的走,顯然屬于后一種。
3月4日凌晨,林俊旸在X上宣布離職,到第二天阿里批準離職。兩天時間內,通過阿里員工發言和媒體報道,基本已經還原出林俊旸的離開,其中難免有和阿里組織的摩擦問題。
最影響到Qwen本身發展的,可能是對團隊內部資源不足的摩擦。
一個小切口是,林俊旸需要牽頭為Qwen碼來更多資源,難免對Qwen團隊內部是否為AI Infra額外投入、投入多少的想法不同。
林俊旸本人對Infra非常看重,這一點,他也在公開場合強調過。
“今天還有一個激動人心的事情,算法和Infra聯合優化的事情是真真實實存在的。”林俊旸在AGI-Next峰會上說,“除了像DeepSeek提到的提升訓練效率、節省資源成本外,我們要完成難度高的任務,都需要Infra的相關支持。”林俊旸說。
雖然阿里有額外的機器學習平臺PAI負責提供這部分的支撐,但在林俊旸看來,還需要進一步加碼,比如在團隊中招聘更多相應人才。在林俊旸的社媒平臺中,也公開放出過招聘Infra相關人才的信息。
![]()
林俊旸在社交媒體上招RL Infra崗位人員
對Infra的看重,不只是林俊旸對阿里的判斷。落在今年對AI失意的騰訊身上,Infra也成了“天才少年”、OpenAI前研究員姚順雨加盟后的重點之一。
在光錐智能此前的文章《騰訊重構AI的1000天》中,也曾提及,在騰訊年會上,內部表示,此前模型訓練的一些問題原因可能在于基礎設施Infra的不足。在姚順雨進入騰訊后,公司單獨成立了AI Infra部門和AI Data部門,區別于之前的部門架構,TEG中和AI訓推相關的工作不再和其他業務合并,而是獨立為AI服務。
但在后期,林俊旸希望自建Infra的實現并不順遂。在晚點播客中,提及林俊旸為了達成相關目標,發生了越過周靖人向阿里集團CEO兼阿里云CEO吳泳銘尋求HeadCount(正職名額)的情況。所幸最終,林俊旸如愿以償。
至于在其它資源上的不足,在3月4日阿里內部召開的會議中,阿里也承認了這一點。據智能涌現報道,關于招聘問題、內部算力有限問題,周靖人表示,團隊處于“資源緊張狀態”,內外差異有很多歷史原因,未來會進一步規劃。
發力頂尖模型,阿里對內動刀
在“為什么做”的問題上,阿里與林俊旸之間同樣存在深刻的裂痕。
作為純技術人才,林俊旸在Qwen開源模型名氣的打響上,起到濃墨重彩的一筆。也是在AGI-Next峰會上,林俊旸曾經分享過團隊為什么會考慮做小尺寸模型,起始是因為團隊中有人曾建議開源用于預訓練試驗的1.8B小尺寸模型,會對一些開發者起到幫助。
![]()
林俊旸
林俊旸對開源政策的激進,也在公開發言中有所體現。他曾表示,自己希望推進Qwen3-Max大模型的開源,但未能如愿。
“全尺寸、多模態、重開源”的策略,幫助阿里在開源社區中建立了無可匹敵的生態優勢。以最新發布的Qwen3.5為例,除了最先開源的版本,阿里還后續發布了Qwen3.5系列的0.8B、2B、4B和9B四款小尺寸模型,在X上獲得了馬斯克的點贊。
但在阿里的視角中,從追求AGI的愿景上,阿里需要的是一個能夠領先于“六小虎”和字節、騰訊的多模態大模型;于阿里云需要靠MaaS擴張業務的情況下,集團希望有一個能打的大模型,像Kimi K2.5、字節豆包模型那樣,在API上收入進一步擴大。
在Qwen核心人員百余人、資源有限的情況下,Qwen系列的旗艦模型在國內大模型混戰中,無法做到在所有系列中都拿到最好成績。
以最新發布的Qwen 3.5旗艦模型為例,作為一個參數397B的原生多模態大模型,講究“力大磚飛”的情況下,讓它和月之暗面萬億參數級別的Kimi-K2.5放在一起比分數,似乎有些尷尬。在Coding當前更看重模型質量階段,Qwen3.5雖然做到了性價比優勢,但它不是當前“掰腕子”的核心。換言之,Qwen3.5的發力和阿里內部的期許,走偏了。
回顧之前Qwen2.5、Qwen3系列大模型,阿里當前在模型生態上的成績有目共睹,甚至被稱為“源神”。但在大模型發展如此迅速的情況下,阿里也依然很著急。
出于對AI的焦慮,挖人、組織架構的調整,就變成了順理成章的思路,這一點在大廠上,基本是必選項。
在谷歌擔任L7級別、參與Gemini研發的周浩,是阿里從硅谷挖回來的人才。據悉,周浩將接手的是Qwen團隊的后訓練負責人一職,這也對應了前后訓練負責人郁博文的離開。
人才是第一步,接下來,阿里將到對準內部,開始對組織架構動刀。據悉,這也是引爆林俊旸和阿里沖突的導火索之一。
多家媒體報道,通義實驗室近期計劃將Qwen團隊分拆,從涵蓋不同訓練流程和模態的“垂直整合”體系,變成預訓練、后訓練、文本、多模態等一個個分開的水平分工團隊。更進一步的是通義實驗室內部之間的合并,比如將Qwen負責圖像模態的部分并入負責圖像生成的通義萬相。語音模型部分并入通義百靈。
但在林俊旸之前所在的架構來說,他更堅信“垂直整合”的思路——將模型訓練的全流程,從數據處理、架構設計、預訓練、后訓練到推理部署,都控制在同一個團隊內部,形成高度協同的閉環。
而在這種整合完成、Qwen模型團隊分割成多個水平團隊后,留給林俊旸的位置和空間變得有限。在劉大一恒繼續擔任預訓練負責人、周浩擔任后訓練負責人的情況下,林俊旸原定的位置成迷,且職責范圍相比于之前“一手抓訓練、模型”的情況,壓縮到分管某個領域的位置。
可以預見的是,在完成組織架構調整后,阿里還需要一位類似姚順雨、吳永輝之類的技術大牛,來把控這個進一步擴大、拆分的組織架構。
至此,林俊旸和阿里,走到了不得不分手的岔路口。
在 AI 時代,核心頂級人才從來不缺機會,也擁有比普通人更理想的追求;但在時代的巨變前,科技巨頭需要把握根據趨勢不斷調整方向盤,以確保整體的利益最大化。這里沒有絕對的對與錯。
我們祝愿林俊旸能夠在“狂飆”的AI大模型行業中,找到自己的位置;也祝阿里在下定決心修整組織架構后,能夠做出心目中的Qwen-4,在旗艦模型中找到自己理想的生態位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.