近日,蘋果iPhone17系列憑借創新設計與性能革新,瞬間引爆了消費市場。然而,國行版本未搭載AI智能體手機助手的“短板”,卻成了眾多用戶吐槽的焦點。
當其他品牌智能手機已讓人機協作滲透至“一句話點外賣、智能識屏解析”等生活場景時,缺失AI助手的iPhone17系列則令人倍感遺憾。畢竟,對于用戶而言,手機助手早已不是“語音指令”的簡單工具,而是能秒級調整設置、AI處理文檔、個性化交互的智能設備。
當人工智能從實驗室走向千行百業,其進化速度正以“月”為單位刷新認知。9月24日,2025年云棲大會的開幕,為全球AI從業者遞上一張觀察技術前沿的“最佳觀景臺”。阿里云智能首席技術官周靖人在主論壇的發布,堪稱一場AI技術的“超級盛宴”。此次通義千問多款模型齊發,旗艦模型Qwen3-Max參數規模突破萬億,在MMLU、GSM8K、HumanEval等國際主流評測中多項指標全球領先;Qwen3-VL作為千問家族最強視覺語言模型,真正實現“看懂世界、理解世界并指導行動”;Qwen3-Omni系列打造全模態交互體驗,擬人化程度極高,已在32項開源基準測試中斬獲SOTA;Qwen3-Next則重構底層架構,在性能不減的前提下將大幅降低訓練成本,兼顧效果與效率;廣受開發者歡迎的編程模型Qwen3-Coder升級為Plus版本,推理更快、代碼更安全。
同時,通義萬相家族也正式推出通義萬相Wan2.5-preview系列模型,該系列模型全面覆蓋文生視頻、圖生視頻、文生圖以及圖像編輯四大核心模型領域。
![]()
此次發布不僅是阿里云技術實力的集中展示,更預示著AI大規模落地應用的新紀元已然開啟。
Qwen3-Max的突破:
從穩定訓練到頂尖推理
在使用大模型之前,用戶們往往都會通過各類媒介去了解其性能表現,因此測試榜單中的成績極具參考價值。
作為向來“戰績”優秀的通義千問家族而言,此次新推出的Qwen3-Max自然也再次刷榜!
![]()
![]()
在實際能力評測中,Qwen3-Max-Instruct版本展現出頂尖的代碼生成與智能體交互水平。在面向真實編程挑戰的SWE-Bench Verified測試中,它以69.6分的成績穩居全球頂尖模型行列;而在更嚴苛的智能體工具調用測試Tau2-Bench上,其74.8分的表現甚至超越了Claude Opus 4,顯示出強大的實際應用潛力。
![]()
尤為引人注目的是其深度推理版本Qwen3-Max-Thinking。該模型通過集成代碼解釋器與并行測試時計算技術,在AIME 25、HMMT等高難度數學推理基準中取得了100%的準確率,展現出接近人類專業水平的邏輯推演能力。這一突破標志著大模型不僅在知識廣度上擴展,更在思維深度上向更高層次的認知能力邁進。
Qwen3-Max作為通義千問家族的旗艦模型,憑借超過1萬億的參數規模和基于36萬億token的預訓練數據,在基礎能力上實現了顯著提升。它延續了Qwen3系列的結構設計,并采用自主研發的global-batch負載均衡損失函數,在訓練過程中展現出更佳的穩定性。
據了解,在訓練效率方面,Qwen3-Max借助PAI-FlashMoE的多級流水并行優化技術,模型訓練效率相比前代提升30%。針對長序列訓練場景,團隊進一步采用ChunkFlow策略,使訓練吞吐量達到序列并行方案的3倍,有力支撐了模型處理長達100萬token上下文的能力。同時,通過多項系統級優化,因硬件故障導致的訓練中斷時間大幅縮減至Qwen2.5-Max的五分之一,保障了超大規模訓練的連續性與可靠性。
基于此,才讓Qwen3-Max擁有了躋身全球領先的硬實力。
通義千問家族:
讓大模型從能用邁向好用
除了萬眾矚目的Qwen3-Max之外,千問3家族的其他幾款大模型也在多模態理解、智能交互、代碼生成與計算效率等方面實現了全方位突破,展現出強大的技術領先性和落地潛力。
![]()
先來看Qwen3-VL,我們平時接觸傳統意義上的視覺語言模型大都只能識別圖片等信息,若希望做更深層的識別則需要借助其他工具來完成,影響工作連續性。而Qwen3-VL則改變了這一切,它不僅能識別圖像內容,更能深度理解圖形用戶界面(GUI)中的元素,包括按鈕、菜單、圖標等,并準確判斷其功能與交互邏輯。它具備自主操作電腦和手機界面的能力,可自動調用“放大”“點擊”“滾動”等智能體(Agent)工具,在任務執行過程中持續觀察、推理與調整。
舉個例子,當輸入一張產品設計圖時,Qwen3-VL能直接生成對應的Draw.io流程圖、HTML/CSS/JS前端代碼,實現“所見即所得”的視覺編程。更進一步,它還集成了先進的3D檢測能力,可感知空間結構,精準判斷物體的方位、視角變化及遮擋關系,在OS World等國際權威GUI操作基準測試中達到世界頂尖水平,為智能助理、自動化測試、人機協同等場景提供核心引擎。
Qwen3-Omni則是家族中的全模態預訓練大模型選手,從訓練初期即融合文本、圖像、音頻、視頻等多種模態數據,實現真正的多模態對齊與協同理解。它的最大亮點在于支持實時流式響應:用戶說話的同時,模型可同步生成文字回復并合成自然流暢的語音,交互延遲極低,體驗高度擬人化,并支持深度定制。
這種“有性格、有記憶、多模態”的交互能力,使其在虛擬主播、智能客服、教育陪伴等場景中具備顛覆性潛力。
此外,更為強大的Qwen3-Coder-Plus能夠以更少的token消耗達成更優的代碼生成效果,大幅降低使用成本,并可實現多模態代碼生成能力,例如根據截圖自動生成可運行的UI代碼,該能力目前在全球范圍內處于領先地位。
Qwen3-Next則是一款注重計算效率的模型,盡管總參數量達80B,但每次推理僅激活約3B參數,性能卻可媲美參數量高達235B的Qwen3旗艦版本。對比Qwen3-32B,Qwen3-Next訓練成本下降超90%。這意味著開發者能以極低成本部署高性能模型,企業也能更高效地進行大規模訓練與推理。
整體來看,通義千問此次發布的產品矩陣覆蓋了從視覺操作、全模態交互、智能編程到高效計算的核心能力,不僅在多項國際評測中領跑,更將前沿技術轉化為可落地的產品體驗,持續推動大模型從“能用”走向“好用”乃至“不可或缺”。
據了解,通過持續的投入與研發,通義千問原生及衍生模型的數量已位居全球第一。開源模型的下載總量已經超過6億次,得到了開發者們的廣泛認可,在社區中引發了熱烈討論和廣泛傳播。
更智能化的大模型開啟新未來
大模型正展現出變革性的能力與發展潛力,其發展態勢對未來影響深遠。
當下,大模型具備了Tool Use能力,這一能力意義重大,就如同人類創造和使用工具開啟了加速進化歷程一樣,如今大模型憑借此能力能夠連接各類數字化工具,從而完成真實世界的任務。
展望未來,自然語言將成為AI時代的源代碼。人們只需用自然語言輸入需求,AI就能自行編寫邏輯、調用工具、搭建系統,完成數字世界的工作,還能通過數字化接口操作所有物理設備。屆時,或許會有超過全球人口數量的Agent和機器人與人類一起工作,對真實世界產生巨大影響。同時,AI也能連接大部分真實世界場景和數據,為未來的進化創造條件。
在相關領域的發展進程中,通義千問取得了顯著成果。通過持續的投入與研發,通義千問原生及衍生模型的數量已位居全球第一,如今已實現全模態和全尺寸的開源,開源模型的下載總量已經超過6億次,得到了開發者們的認可,在社區中引發了熱烈討論和廣泛傳播。
當消費者為iPhone 17國行版缺失AI助手而吐槽其競爭力不足時,市場的反饋已然清晰:在智能時代,AI能力早已從“加分項”變為“必選項”,成為衡量產品價值的核心標尺。而通義千問系列大模型的集中突破,恰在另一條關鍵賽道上,以技術實力重新定義了“智能”的邊界。這不僅是一場參數與性能的技術競賽,更是一次從“單點智能”到“全棧賦能”的產業更迭。
AI的真正價值,從來不止于功能的疊加,而是通過指數級放大人類的智力杠桿,徹底重構成果的獲取方式。
技術革命的浪潮永不停歇,Qwen3-Max的發布僅是中國大模型技術邁向成熟的新起點。隨著后續正式版的迭代優化,以及全模態、高效率等技術的深度落地,我們有理由相信,中國大模型將在通往通用人工智能(AGI)的道路上,邁出更穩健的步伐,最終為各行各業注入智能動能,開啟一個更智慧、更高效、更繁榮的全新紀元。
計算雜談公眾號
專業,創造價值!
與你分享來自科技的樂趣。
![]()
【計算雜談】創辦人吳叢叢,筆名云中子,先后任職于走進中關村、賽迪網、51CTO、比特網,從業20多年來重點專注服務器、存儲、云計算、數據中心、網絡、 虛擬化、安全、半導體、消費數碼等相關領域。計算雜談網站已上線,敬請關注!www.jisuanzt.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.