![]()
作者 | 木子、高允毅
阿里巴巴的合伙人團隊名單里,又增加了一個熟悉的名字。
阿里云 CTO、通義實驗室負責人周靖人正式成為阿里巴巴合伙人。
![]()
合伙人團隊是阿里的最高集體決策機構,在今年 6 月大幅收縮后(從之前的 26 人降至上市以來最低的 17 人),這個團隊現在終于迎來了第一次增補。
這并不是一次簡單人事變動,此決定發生在關鍵的技術換擋窗口:大模型從“能用”走向“要落地”,云廠商從“拼算力”轉向“拼體系化 AI”。
據晚點消息,周靖人之所以成為阿里合伙人今年的首位新增成員,是因為他負責的通義實驗室過去一年努力保證了 千問(Qwen)的模型領先地位,阿里管理層高度對此成績給出高度評價。
下面來具體說說,阿里為什么在此刻要把技術人推向最高決策層?
十年,從首席科學家到合伙人
2025 年,阿里巴巴將 AI 戰略從“技術敘事”升級為“生死線”。
今年 2 月,阿里集團官宣,未來三年將投入至少 3800 億元,用于云計算與 AI 基礎設施建設,該金額超過公司過去十年在相關領域的投入總和,為 C 端業務落地奠定基礎。
馬云親自督戰,開始頻繁點名周靖人,要求他持續匯報 Qwen3 的進展,理由很直接:AI 將成為阿里未來十年的主要增量,而模型是整個體系的第一變量。
而從阿里首席科學家到合伙人這條路,周靖人一走就是十年。
我們先看看阿里合伙人的門檻有多高:
阿里選拔合伙人的要求,除了在阿里工作 5 年以上、高度認同公司文化、對公司發展有積極貢獻、愿意為公司文化和使命傳承竭盡全力,還需要75% 的合伙人贊同才能當選,也就是 17 位合伙人需要至少 13 人投贊成票。
目前阿里合伙人名單,除了眾所周知的掌舵人馬云、 CEO 吳泳銘、主席蔡崇信,還有螞蟻副總裁邵曉鋒,淘天總裁的聞佳,阿里 CPO(首席人才官)蔣芳,負責淘天的蔣凡,負責達摩院的張建鋒,負責阿里云的蔣江偉等。
![]()
周靖人 1999 年畢業于中科大少年班,2004 年獲得美國哥倫比亞大學計算機博士學位,后加入微軟擔任研發合伙人。
2015 年,他加入阿里出任阿里云首席科學家,之后轉崗多次:剛開始在阿里云負責 iDST(數據科學與技術研究院,達摩院前身),隨后負責電商的搜索推薦廣告,2020 年底轉去螞蟻,一年多之后回到阿里云擔任 CTO、兼達摩院副院長。
在技術方面,他為阿里云打造的飛天系統和神龍計算架構,讓阿里云計算躍居全球前列,尤其是在 2018 年的雙十一,他帶領的團隊每秒處理 17 億條日志,扛過了“全球最猛交易洪峰”。他還作為核心負責人主導構建iDST(阿里數據科學研究院),并主導打造全球領先的 MaxCompute 大數據引擎,讓阿里的海量數據實現商業價值轉化。
在業務層面,他將淘寶搜索重構,打造新一代語義理解引擎;又參與推動阿里媽媽的整合,打造搜廣推一體化;并參與個性化算法設計,成為阿里算法領域核心負責人之一,這些都將淘寶業務推上頂峰。
他帶領達摩院期間,成立達摩院智能計算實驗室,不僅推動圖計算、自然語言處理、多模態等前沿技術研發,還為阿里培養數百名 AI 頂尖人才,產出 50 + 頂會論文,16 項專利。
負責阿里云后,又推動 "飛天 + 神龍 + 磐久 AI 服務器" 三位一體架構,使 AI 算力利用率達 90%,訓練成本降低 30%。
在大模型浪潮中,周靖人率先提出“模型即服務”理念,并發起國內最大 AI 開源社區魔搭 ModelScope,一口氣開源了達摩院成立 5 年來研發的所有近400個模型,使魔搭成為國內外模型首發首選平臺。
可謂是,既做過前沿技術研發,也完成實際業務落地。
2023 年,他開始主導通義實驗室,推動Qwen 系列大模型技術突破。
![]()
周靖人推動 Qwen 系列完成從0.5B 到 480B的全尺寸技術布局,并同步建立覆蓋文本、圖像、語音、視頻的全模態開源矩陣。更重要的是,這套能力被放在阿里自有云上完成訓練與推理優化,形成從底層到產品的閉環體系。
現在,Qwen 已在開源生態中躍升為全球最具影響力的模型族之一,實現下載量 7 億 +,衍生模型 18 萬 +。
蘋果被曝選擇 Qwen 成為中國的大模型合作伙伴,李飛飛團隊用 Qwen 來訓練超低成本推理模型,通用 Agent 產品 Manus 也調用 Qwen 來做決策規劃,DeepSeek-R1 的部分小尺寸模型也用到了 Qwen 來訓練......
除了千問,周靖人也沒有放松對阿里云的押注。
作為全球四大“超級 AI 云”之一,阿里云今年正處在激烈膠著的競爭環境中。
在國內機場廣告位的激烈爭奪中,阿里云打出了鋒利的口號:“AI 云市場份額領先,超過第 2–4 名總和”。
對此,周靖人向媒體強調,阿里是全球極少數能在大模型與云計算兩端同時做到全棧自研的公司,而這一能力,正是它在這場長期戰中的真正護城河。
這一系列成果,使周靖人在阿里內部的角色進一步提升。他的晉升,被視為集團強化 AI 核心戰略的信號,其技術領導力與組織管理能力被寄予厚望,需在激烈競爭中帶領團隊實現更確定的成果。
在談及未來的發展目標時,周靖人的思路依然圍繞模型與云的協同。他認為大模型的每一次突破,背后是整個云計算和數據、工程平臺的全面配合和升級。
在模型方向上,阿里會繼續推進推理模型的演化,使其具備更貼近人類思考方式的能力,并在未來具備自我反思與自我糾錯的潛質;多模態被視為邁向通用智能的關鍵路徑,模型必須能夠真正理解并貫通不同模態的信息。
同時,團隊也在探索新的學習機制,讓模型能在線、持續、自主學習,而不再依賴完全離線式的版本化訓練流程。
在基礎設施層面,阿里正強化云與模型的深度融合。尤其是工程能力、整個云系統結合 AI 的性能和效率會變成核心競爭力。
在他看來,全球 AI 已進入加速期,比拼的是迭代速度和創新能力,而不是“憋大招”。阿里快節奏發布,是通義大模型體系化演進的表現。
通義實驗室和 Qwen
周靖人負責阿里巴巴的通義實驗室,起源于阿里達摩院內部的大模型與多模態 AI 團隊。
隨著阿里內部架構調整,“語言/視覺/多模態大模型 + AI 應用基礎設施” 方向從達摩院剝離,在 2023 年重組后歸屬阿里云系統并由阿里云 CTO 統籌管理。
通義實驗室的定位,既不是傳統科研機構那種“純學術、基礎研究”,也不僅是單純的產品團隊——它兼顧“研究 + 工業化 + 商業落地”。
也就是說,通義實驗室既關注大模型、前沿 AI 技術,也強調這些模型能夠服務于阿里生態內外、落地到業務和產品。
通義實驗室下的二級部門,設有:自然語言智能實驗室、語音實驗室、應用視覺實驗室、智能計算等。
團隊背后還有一批年輕的骨干:1990 年生、2017 年北大博士畢業的周暢曾主導千問基礎模型研發;而 2019 年以應屆生身份加入阿里的林俊旸,如今已以 P10 職級接任這一團隊負責人,也成為了阿里最年輕的 P10 專家。不過 2024 年,周暢從阿里離職,初期對外宣稱 “創業”,后被曝加入了字節跳動。
![]()
圖:林俊旸
要說通義實驗室的成果,目前最重要的就是通義大模型系列,主要涉及四大方向:自然語言、視覺、視頻,和語音,包括:通義千問系列、通義萬相 - 圖像生成系列、通義萬相 - 視頻生成系列、語音合成與識別系列。
![]()
APP 月活破 3000 萬,Qwen 竟還被 Meta 拿去訓練新模型
作為通義大模型“全家桶”之一,Qwen 系列目前是其中關注度最高的一個。
Qwen 從原有的多模態大模型 M6的基礎上進化而來,是一系列大規模開源的大語言模型(LLM),具備語言理解、對話、推理、多模態(文本 + 圖像 + 音頻 + 視頻)等能力,于 2023 年 4 月對企業用戶開啟內測。
它不是一個模型,而是一個“大模型家族矩陣”,目前已經更新到了第三代,即Qwen3。
最早公開的基礎版本 Qwen1,主要面向通用文本理解和生成任務;Qwen2 改進了表現和多語言能力,包含 Dense 及部分 Specialize 版本。
Qwen2.5 是一個重要迭代分支,延伸出了多個能力更細化的模型,包括 Qwen2.5-Max、Qwen2.5-VL-32B-Instruct、Qwen2.5-Omni-7B,圍繞 “多語言 + 多模態 + 指令交互” 能力展開升級。
而 Qwen3 系列既有能完成高難知識問答、內容生成、Agent 任務的模型,預訓練的自然語言種類數從 Qwen2.5 的 29 種擴展到了 119 種(含方言);也有又快又便宜的模型;還有編程專用模型和全模態實時模型 Omni,Omni 版本強調“端到端統一多模態”,而非多個模型拼接。
![]()
Qwen3 還擁有多種尺寸,既有混合專家(MoE)架構也有 Dense 架構版本;其中規模最大、能力最強Qwen3-Max參數量超萬億,預訓練數據更是達到 36 萬億 tokens。
Qwen3-Max-Thinking(思考模式)在極具挑戰性的數學推理基準測試AIME 25 和 HMMT上,均取得了滿分,也是國產大模型首次在這兩個數學評測榜單拿下滿分。
![]()
在考察 Agent 工具調用能力的 Tau2 Bench 測試中,Qwen3-Max-Instruct(指令模式)打敗了 Claude Opus4 和 DeepSeek V3.1;還在考察大模型用 coding 解決真實世界問題的 SWE-Bench 評測中也取得了亮眼成績。
![]()
Qwen3 之所以這么強,一個重要原因是它引入了“混合推理”(Thinking + 非 Thinking 模式)機制,再加上thinking budget:可以給模型一個“思考額度”(比如允許多少 thinking token),讓其動態切換模式。
它支持更強推理能力、長上下文、多語言和多模態能力,也覆蓋了從基礎通用語言、視覺、多模態到代碼 / 專業任務的多種能力矩陣。
也就是說,你不再需要單獨的一個“解題、推理模型”和一個“日常對話模型”,Qwen3 能解決一整套問題。
11 月 17 日,阿里宣布千問項目全力進軍“AI to C”市場,通義千問 Qwen App 公測版同步上線,正式與 ChatGPT 展開全面競爭,還免費開放、人人可用——當天還因為想用的人太多而崩了。
![]()
公測 23 天后,阿里發出喜報:千問月活已經突破 3000 萬。
![]()
另外有意思的是,彭博社消息顯示,Meta將在明年春季發布一個名為 Avocado(牛油果)的模型,而且“牛油果”在訓練過程中還拿了 Qwen 作參考或蒸餾源來進行優化。
據彭博社和 CNBC 消息,Meta 雖然過去主要走開源路線(如 Llama 系列),但他們的“牛油果”大概率是閉源的——也就是說,Meta 可能要用一些開源的模型(除了 Qwen 還有谷歌的 Gemma 系列、OpenAI 的 GPT-oss),搞出一個閉源的模型。
不過,對于“牛油果”在訓練過程中具體如何使用 Qwen,目前還沒有具體的公開信息。
https://help.aliyun.com/zh/model-studio/what-is-tongyi?utm\_source
https://tongyi.aliyun.com/landing?family=qwen
https://www.bloomberg.com/news/articles/2025-12-10/inside-meta-s-pivot-from-open-source-to-money-making-ai-model
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議預告
12 月 19~20 日,AICon 2025 年度收官站在北京舉辦。現已開啟 9 折優惠。
兩天時間,聊最熱的 Agent、上下文工程、AI 產品創新等等話題,與頭部企業與創新團隊的專家深度交流落地經驗與思考。2025 年最后一場,不容錯過。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.