![]()
作者 | Yoky
郵箱 | yokyliu@pingwest.com
2026年2月5日,春節前夕,阿里巴巴集團內部完成了一項看似低調卻意義深遠的調整:將旗下AI的總稱和核心品牌統一為“千問”。
直到2月16日的大年三十,阿里發布了最新的開源模型千問3.5。用一款模型整合了原生多模態,在視覺理解、復雜推理、Agent智能體等核心能力維度全面整合到統一的預訓練架構中。
Qwen3.5-Plus 總參數 3970 億,但推理時僅激活 170 億,以不到 5% 的參數撬動了全部智能。在多項基準測試中性能媲美GPT-5.2、Gemini-3-pro等閉源第一梯隊模型,甚至超越了自家上一代萬億參數的Qwen3-Max。用更小的模型,跑出了更強的性能。而成本不升反降,API價格僅為同等性能Gemini 3 Pro的1/18,部署顯存占用相比上一代降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。
你會發現這不只是一次品牌的統一,更是組織的統一、架構的統一,最終指向AI戰略的統一。
當“千問”成為一個貫穿技術、產品與商業的統一符號,當Qwen3.5用“一款模型打天下”的策略在春節檔炸場,它不再只是又一次榜單刷新,而是阿里AI戰略從分散走向協同、從單點突破走向系統作戰的集中呈現。
1
Qwen3.5憑什么再掀巨浪?
Qwen3.5的出現意味著,企業可以用過去幾分之一的成本,部署性能頂級的AI系統,參考R1曾經干的事,用更小的參數規模、更低的部署成本獲得更強的智能表現。
但這并非一夜之間的靈光乍現,而是Qwen系列一以貫之的戰略延續:從Qwen1.5到Qwen2.5,再到今天的Qwen3.5,阿里巴巴的優化方向從來不是“如何把模型做得更大”,而是“如何用更小的模型,做出頂尖的性能”。
早在Qwen1.5時代,阿里就推出了從0.5B到110B的完整參數譜系,在千億級模型上驗證了規模與效率的平衡之道。Qwen2.5延續這一思路,72B模型以不到Llama3 405B五分之一的參數規模實現性能超越,而1.5B量級的小模型在數學推理和編程等領域同樣展現出驚人的能力密度。這種“以小勝大”的能力,不是偶然的某一次爆發,而是貫穿每一代產品的穩定輸出。
正是這種貫穿每一代的戰略定力,讓Qwen3.5的突破有了更深層的意義:它不只是又一次刷新榜單,而是將“以小勝大”的能力從單一的語言智能,拓展到了更廣闊的多模態世界。
當前行業多模態模型多走“拼裝”路線,語言模型外掛視覺模塊,常導致視覺增強而語言“降智”。而Qwen3.5選擇了一條更深入,也更復雜的道路,從預訓練第一天起就在海量的文本與視覺混合數據上聯合學習,讓視覺與語言在統一參數空間深度融合,從而讓模型真正具備跨模態直覺理解力,能像素級定位圖像、理解2小時視頻時序、將手繪草圖轉前端代碼,甚至作為視覺智能體操控手機電腦。
在復雜推理與Agent能力上,Qwen3.5通過混合注意力機制、極致稀疏MoE架構、原生多Token預測及注意力門控機制等核心技術協同作用,實現動態分配計算資源、以不到5%激活參數調動397B總參數知識儲備,推理速度翻倍的同時確保訓練穩定可靠。
下面這個案例,是簡單幾步在OpenClaw里配置了Qwen3.5,讓它進行搜索過去一個月內發布的新 AI 模型,將信息匯總成一份報告,并最終自動將生成 PDF 文件直接在聊天窗口中發送回給我。
從搜索、整合信息到排版生成文件,再到跨平臺發送,最終輸出的報告不僅列出了模型,還包含了 “SWE-Bench” 基準測試對比表,顯示了各模型在解決軟件工程問題上的表現。
4000 億參數超越萬億參數,API 價格僅為同等性能 Gemini 3 Pro 的 1/18……這些數字單獨看是產品迭代,放在一起看,則意味著一個拐點的到來:頂級AI能力不再是高算力、高成本的閉環游戲,而是變成個人開發者、創業團隊、中小企業也能觸碰的基礎能力。
1
一個統一的阿里
在全球所有模型廠商里,阿里都是一個特殊的存在。大多數AI公司要么專注模型研發,要么深耕芯片設計,要么依托云基礎設施,但極少有廠商能將這三者同時握在手中,并讓它們在一個統一的戰略目標下協同運轉。
但阿里做到了。
Qwen3.5的背后,站著整個阿里云的技術體系。Qwen3.5的“極致性價比”并非孤立的技術成果,而是模型、芯片與云協同創新的產物。
在模型層面,千問大模型團隊持續迭代,從Qwen2.5到Qwen3再到Qwen3.5,每一代都在關鍵能力維度上突破開源模型的天花板,穩定輸出天花板級產品。在芯片層面,平頭哥自研的“真武”芯片針對MoE架構模型做了大量優化,可滿足千問大模型對大規模計算的需求,讓芯片與模型聯合設計,發揮極致算力潛力。
更重要的是,阿里云提供從訓練到推理的全鏈路優化,比如通過設計精巧的FP8/FP32精度應用策略,激活內存減少約50%,訓練提速10%,且這套方案被統一部署到強化學習訓練和推理的全流程中,全面降低了多模態模型擴展的成本和復雜度。在智能體訓練上,團隊還專門搭建了一套大規模強化學習框架,覆蓋純文本、多模態和多輪對話等各種場景,整體效率提升3到5倍,讓模型能在海量真實場景中反復實戰、持續進化。
這種模型、芯片和云的軟硬件緊密耦合,最終實現了“1+1+1>3”的效果,不僅能更好發揮芯片的算力潛力,提升集群的算力效率,還能有效提升模型訓練與推理的效率。得益于此,Qwen3.5的API價格進一步探底,而開源協議Apache 2.0的完全開放,讓全球開發者得以零門檻使用、研究甚至二次開發世界頂級的多模態AI能力。
放眼全球,有能力將這三者深度耦合的科技公司屈指可數,而阿里是其中之一,也是唯一走通開源路線的那個。
這種協同創新的成果,正在以驚人的速度轉化為生態效應。截至目前,千問模型的開源數量已超400個,衍生模型突破20萬個,下載量超10億次。
在中國企業級大模型調用市場中,千問位居第一,并成為阿里云新增需求的主要驅動力,帶動計算、存儲及數據庫等基礎資源消耗的增長。根據Omdia數據,2025年上半年,中國AI云整體市場規模達223億元,阿里云占比35.8%,超過第二到第四名總和;阿里云在中國云市場的整體份額也從33%提升至36%,領先優勢持續擴大。
這些數字背后是一個正在加速成型的正循環:開源吸引開發者,開發者催生應用,應用反哺云和芯片業務,業務收益再投入下一代模型研發。而當技術本身足夠高效,成本就不再是需要刻意壓縮的東西,它自然就低了。Qwen3.5讓“最強”和“最便宜”,同時出現在了一個模型上。
回看過去幾十年的科技產業史,Linux定義了服務器時代,Android定義了移動時代,它們的共同點是開源、免費、無處不在,最終成為整個產業默認的底層。
而它們的背后,都站著一個能夠調動全棧資源、保持戰略定力的推動者。今天的阿里,正在扮演這個角色。
當組織統一、戰略統一、技術協同成為常態,“千問”就不再只是一個模型系列的名稱,而是AI時代基礎設施的代名詞。
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.