網易首頁 > 網易號 > 正文申請入駐

云棲大會炸場！阿里通義全家桶來了，萬億參數國產大模型已悄然破局！

2025-09-24 18:56:18　來源: 計算雜談

北京舉報

分享至

近日，蘋果iPhone17系列憑借創新設計與性能革新，瞬間引爆了消費市場。然而，國行版本未搭載AI智能體手機助手的“短板”，卻成了眾多用戶吐槽的焦點。

當其他品牌智能手機已讓人機協作滲透至“一句話點外賣、智能識屏解析”等生活場景時，缺失AI助手的iPhone17系列則令人倍感遺憾。畢竟，對于用戶而言，手機助手早已不是“語音指令”的簡單工具，而是能秒級調整設置、AI處理文檔、個性化交互的智能設備。

當人工智能從實驗室走向千行百業，其進化速度正以“月”為單位刷新認知。9月24日，2025年云棲大會的開幕，為全球AI從業者遞上一張觀察技術前沿的“最佳觀景臺”。阿里云智能首席技術官周靖人在主論壇的發布，堪稱一場AI技術的“超級盛宴”。此次通義千問多款模型齊發，旗艦模型Qwen3-Max參數規模突破萬億，在MMLU、GSM8K、HumanEval等國際主流評測中多項指標全球領先；Qwen3-VL作為千問家族最強視覺語言模型，真正實現“看懂世界、理解世界并指導行動”；Qwen3-Omni系列打造全模態交互體驗，擬人化程度極高，已在32項開源基準測試中斬獲SOTA；Qwen3-Next則重構底層架構，在性能不減的前提下將大幅降低訓練成本，兼顧效果與效率；廣受開發者歡迎的編程模型Qwen3-Coder升級為Plus版本，推理更快、代碼更安全。

同時，通義萬相家族也正式推出通義萬相Wan2.5-preview系列模型，該系列模型全面覆蓋文生視頻、圖生視頻、文生圖以及圖像編輯四大核心模型領域。

此次發布不僅是阿里云技術實力的集中展示，更預示著AI大規模落地應用的新紀元已然開啟。

Qwen3-Max的突破：

從穩定訓練到頂尖推理

在使用大模型之前，用戶們往往都會通過各類媒介去了解其性能表現，因此測試榜單中的成績極具參考價值。

作為向來“戰績”優秀的通義千問家族而言，此次新推出的Qwen3-Max自然也再次刷榜！

在實際能力評測中，Qwen3-Max-Instruct版本展現出頂尖的代碼生成與智能體交互水平。在面向真實編程挑戰的SWE-Bench Verified測試中，它以69.6分的成績穩居全球頂尖模型行列；而在更嚴苛的智能體工具調用測試Tau2-Bench上，其74.8分的表現甚至超越了Claude Opus 4，顯示出強大的實際應用潛力。

尤為引人注目的是其深度推理版本Qwen3-Max-Thinking。該模型通過集成代碼解釋器與并行測試時計算技術，在AIME 25、HMMT等高難度數學推理基準中取得了100%的準確率，展現出接近人類專業水平的邏輯推演能力。這一突破標志著大模型不僅在知識廣度上擴展，更在思維深度上向更高層次的認知能力邁進。

Qwen3-Max作為通義千問家族的旗艦模型，憑借超過1萬億的參數規模和基于36萬億token的預訓練數據，在基礎能力上實現了顯著提升。它延續了Qwen3系列的結構設計，并采用自主研發的global-batch負載均衡損失函數，在訓練過程中展現出更佳的穩定性。

據了解，在訓練效率方面，Qwen3-Max借助PAI-FlashMoE的多級流水并行優化技術，模型訓練效率相比前代提升30%。針對長序列訓練場景，團隊進一步采用ChunkFlow策略，使訓練吞吐量達到序列并行方案的3倍，有力支撐了模型處理長達100萬token上下文的能力。同時，通過多項系統級優化，因硬件故障導致的訓練中斷時間大幅縮減至Qwen2.5-Max的五分之一，保障了超大規模訓練的連續性與可靠性。

基于此，才讓Qwen3-Max擁有了躋身全球領先的硬實力。

通義千問家族：

讓大模型從能用邁向好用

除了萬眾矚目的Qwen3-Max之外，千問3家族的其他幾款大模型也在多模態理解、智能交互、代碼生成與計算效率等方面實現了全方位突破，展現出強大的技術領先性和落地潛力。

先來看Qwen3-VL，我們平時接觸傳統意義上的視覺語言模型大都只能識別圖片等信息，若希望做更深層的識別則需要借助其他工具來完成，影響工作連續性。而Qwen3-VL則改變了這一切，它不僅能識別圖像內容，更能深度理解圖形用戶界面（GUI）中的元素，包括按鈕、菜單、圖標等，并準確判斷其功能與交互邏輯。它具備自主操作電腦和手機界面的能力，可自動調用“放大”“點擊”“滾動”等智能體（Agent）工具，在任務執行過程中持續觀察、推理與調整。

舉個例子，當輸入一張產品設計圖時，Qwen3-VL能直接生成對應的Draw.io流程圖、HTML/CSS/JS前端代碼，實現“所見即所得”的視覺編程。更進一步，它還集成了先進的3D檢測能力，可感知空間結構，精準判斷物體的方位、視角變化及遮擋關系，在OS World等國際權威GUI操作基準測試中達到世界頂尖水平，為智能助理、自動化測試、人機協同等場景提供核心引擎。

Qwen3-Omni則是家族中的全模態預訓練大模型選手，從訓練初期即融合文本、圖像、音頻、視頻等多種模態數據，實現真正的多模態對齊與協同理解。它的最大亮點在于支持實時流式響應：用戶說話的同時，模型可同步生成文字回復并合成自然流暢的語音，交互延遲極低，體驗高度擬人化，并支持深度定制。

這種“有性格、有記憶、多模態”的交互能力，使其在虛擬主播、智能客服、教育陪伴等場景中具備顛覆性潛力。

此外，更為強大的Qwen3-Coder-Plus能夠以更少的token消耗達成更優的代碼生成效果，大幅降低使用成本，并可實現多模態代碼生成能力，例如根據截圖自動生成可運行的UI代碼，該能力目前在全球范圍內處于領先地位。

Qwen3-Next則是一款注重計算效率的模型，盡管總參數量達80B，但每次推理僅激活約3B參數，性能卻可媲美參數量高達235B的Qwen3旗艦版本。對比Qwen3-32B，Qwen3-Next訓練成本下降超90%。這意味著開發者能以極低成本部署高性能模型，企業也能更高效地進行大規模訓練與推理。

整體來看，通義千問此次發布的產品矩陣覆蓋了從視覺操作、全模態交互、智能編程到高效計算的核心能力，不僅在多項國際評測中領跑，更將前沿技術轉化為可落地的產品體驗，持續推動大模型從“能用”走向“好用”乃至“不可或缺”。

據了解，通過持續的投入與研發，通義千問原生及衍生模型的數量已位居全球第一。開源模型的下載總量已經超過6億次，得到了開發者們的廣泛認可，在社區中引發了熱烈討論和廣泛傳播。

更智能化的大模型開啟新未來

大模型正展現出變革性的能力與發展潛力，其發展態勢對未來影響深遠。

當下，大模型具備了Tool Use能力，這一能力意義重大，就如同人類創造和使用工具開啟了加速進化歷程一樣，如今大模型憑借此能力能夠連接各類數字化工具，從而完成真實世界的任務。

展望未來，自然語言將成為AI時代的源代碼。人們只需用自然語言輸入需求，AI就能自行編寫邏輯、調用工具、搭建系統，完成數字世界的工作，還能通過數字化接口操作所有物理設備。屆時，或許會有超過全球人口數量的Agent和機器人與人類一起工作，對真實世界產生巨大影響。同時，AI也能連接大部分真實世界場景和數據，為未來的進化創造條件。

在相關領域的發展進程中，通義千問取得了顯著成果。通過持續的投入與研發，通義千問原生及衍生模型的數量已位居全球第一，如今已實現全模態和全尺寸的開源，開源模型的下載總量已經超過6億次，得到了開發者們的認可，在社區中引發了熱烈討論和廣泛傳播。

當消費者為iPhone 17國行版缺失AI助手而吐槽其競爭力不足時，市場的反饋已然清晰：在智能時代，AI能力早已從“加分項”變為“必選項”，成為衡量產品價值的核心標尺。而通義千問系列大模型的集中突破，恰在另一條關鍵賽道上，以技術實力重新定義了“智能”的邊界。這不僅是一場參數與性能的技術競賽，更是一次從“單點智能”到“全棧賦能”的產業更迭。

AI的真正價值，從來不止于功能的疊加，而是通過指數級放大人類的智力杠桿，徹底重構成果的獲取方式。

技術革命的浪潮永不停歇，Qwen3-Max的發布僅是中國大模型技術邁向成熟的新起點。隨著后續正式版的迭代優化，以及全模態、高效率等技術的深度落地，我們有理由相信，中國大模型將在通往通用人工智能（AGI）的道路上，邁出更穩健的步伐，最終為各行各業注入智能動能，開啟一個更智慧、更高效、更繁榮的全新紀元。

計算雜談公眾號

專業，創造價值！

與你分享來自科技的樂趣。

【計算雜談】創辦人吳叢叢，筆名云中子，先后任職于走進中關村、賽迪網、51CTO、比特網，從業20多年來重點專注服務器、存儲、云計算、數據中心、網絡、虛擬化、安全、半導體、消費數碼等相關領域。計算雜談網站已上線，敬請關注！www.jisuanzt.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.