近日,蘋果iPhone17系列憑借創(chuàng)新設(shè)計與性能革新,瞬間引爆了消費市場。然而,國行版本未搭載AI智能體手機助手的“短板”,卻成了眾多用戶吐槽的焦點。
當其他品牌智能手機已讓人機協(xié)作滲透至“一句話點外賣、智能識屏解析”等生活場景時,缺失AI助手的iPhone17系列則令人倍感遺憾。畢竟,對于用戶而言,手機助手早已不是“語音指令”的簡單工具,而是能秒級調(diào)整設(shè)置、AI處理文檔、個性化交互的智能設(shè)備。
當人工智能從實驗室走向千行百業(yè),其進化速度正以“月”為單位刷新認知。9月24日,2025年云棲大會的開幕,為全球AI從業(yè)者遞上一張觀察技術(shù)前沿的“最佳觀景臺”。阿里云智能首席技術(shù)官周靖人在主論壇的發(fā)布,堪稱一場AI技術(shù)的“超級盛宴”。此次通義千問多款模型齊發(fā),旗艦?zāi)P蚎wen3-Max參數(shù)規(guī)模突破萬億,在MMLU、GSM8K、HumanEval等國際主流評測中多項指標全球領(lǐng)先;Qwen3-VL作為千問家族最強視覺語言模型,真正實現(xiàn)“看懂世界、理解世界并指導(dǎo)行動”;Qwen3-Omni系列打造全模態(tài)交互體驗,擬人化程度極高,已在32項開源基準測試中斬獲SOTA;Qwen3-Next則重構(gòu)底層架構(gòu),在性能不減的前提下將大幅降低訓(xùn)練成本,兼顧效果與效率;廣受開發(fā)者歡迎的編程模型Qwen3-Coder升級為Plus版本,推理更快、代碼更安全。
同時,通義萬相家族也正式推出通義萬相Wan2.5-preview系列模型,該系列模型全面覆蓋文生視頻、圖生視頻、文生圖以及圖像編輯四大核心模型領(lǐng)域。
![]()
此次發(fā)布不僅是阿里云技術(shù)實力的集中展示,更預(yù)示著AI大規(guī)模落地應(yīng)用的新紀元已然開啟。
Qwen3-Max的突破:從穩(wěn)定訓(xùn)練到頂尖推理
在使用大模型之前,用戶們往往都會通過各類媒介去了解其性能表現(xiàn),因此測試榜單中的成績極具參考價值。
作為向來“戰(zhàn)績”優(yōu)秀的通義千問家族而言,此次新推出的Qwen3-Max自然也再次刷榜!
![]()
![]()
在實際能力評測中,Qwen3-Max-Instruct版本展現(xiàn)出頂尖的代碼生成與智能體交互水平。在面向真實編程挑戰(zhàn)的SWE-Bench Verified測試中,它以69.6分的成績穩(wěn)居全球頂尖模型行列;而在更嚴苛的智能體工具調(diào)用測試Tau2-Bench上,其74.8分的表現(xiàn)甚至超越了Claude Opus 4,顯示出強大的實際應(yīng)用潛力。
![]()
尤為引人注目的是其深度推理版本Qwen3-Max-Thinking。該模型通過集成代碼解釋器與并行測試時計算技術(shù),在AIME 25、HMMT等高難度數(shù)學(xué)推理基準中取得了100%的準確率,展現(xiàn)出接近人類專業(yè)水平的邏輯推演能力。這一突破標志著大模型不僅在知識廣度上擴展,更在思維深度上向更高層次的認知能力邁進。
Qwen3-Max作為通義千問家族的旗艦?zāi)P停瑧{借超過1萬億的參數(shù)規(guī)模和基于36萬億token的預(yù)訓(xùn)練數(shù)據(jù),在基礎(chǔ)能力上實現(xiàn)了顯著提升。它延續(xù)了Qwen3系列的結(jié)構(gòu)設(shè)計,并采用自主研發(fā)的global-batch負載均衡損失函數(shù),在訓(xùn)練過程中展現(xiàn)出更佳的穩(wěn)定性。
據(jù)了解,在訓(xùn)練效率方面,Qwen3-Max借助PAI-FlashMoE的多級流水并行優(yōu)化技術(shù),模型訓(xùn)練效率相比前代提升30%。針對長序列訓(xùn)練場景,團隊進一步采用ChunkFlow策略,使訓(xùn)練吞吐量達到序列并行方案的3倍,有力支撐了模型處理長達100萬token上下文的能力。同時,通過多項系統(tǒng)級優(yōu)化,因硬件故障導(dǎo)致的訓(xùn)練中斷時間大幅縮減至Qwen2.5-Max的五分之一,保障了超大規(guī)模訓(xùn)練的連續(xù)性與可靠性。
基于此,才讓Qwen3-Max擁有了躋身全球領(lǐng)先的硬實力。
通義千問家族:讓大模型從能用邁向好用
除了萬眾矚目的Qwen3-Max之外,千問3家族的其他幾款大模型也在多模態(tài)理解、智能交互、代碼生成與計算效率等方面實現(xiàn)了全方位突破,展現(xiàn)出強大的技術(shù)領(lǐng)先性和落地潛力。
![]()
先來看Qwen3-VL,我們平時接觸傳統(tǒng)意義上的視覺語言模型大都只能識別圖片等信息,若希望做更深層的識別則需要借助其他工具來完成,影響工作連續(xù)性。而Qwen3-VL則改變了這一切,它不僅能識別圖像內(nèi)容,更能深度理解圖形用戶界面(GUI)中的元素,包括按鈕、菜單、圖標等,并準確判斷其功能與交互邏輯。它具備自主操作電腦和手機界面的能力,可自動調(diào)用“放大”“點擊”“滾動”等智能體(Agent)工具,在任務(wù)執(zhí)行過程中持續(xù)觀察、推理與調(diào)整。
舉個例子,當輸入一張產(chǎn)品設(shè)計圖時,Qwen3-VL能直接生成對應(yīng)的Draw.io流程圖、HTML/CSS/JS前端代碼,實現(xiàn)“所見即所得”的視覺編程。更進一步,它還集成了先進的3D檢測能力,可感知空間結(jié)構(gòu),精準判斷物體的方位、視角變化及遮擋關(guān)系,在OS World等國際權(quán)威GUI操作基準測試中達到世界頂尖水平,為智能助理、自動化測試、人機協(xié)同等場景提供核心引擎。
Qwen3-Omni則是家族中的全模態(tài)預(yù)訓(xùn)練大模型選手,從訓(xùn)練初期即融合文本、圖像、音頻、視頻等多種模態(tài)數(shù)據(jù),實現(xiàn)真正的多模態(tài)對齊與協(xié)同理解。它的最大亮點在于支持實時流式響應(yīng):用戶說話的同時,模型可同步生成文字回復(fù)并合成自然流暢的語音,交互延遲極低,體驗高度擬人化,并支持深度定制。
這種“有性格、有記憶、多模態(tài)”的交互能力,使其在虛擬主播、智能客服、教育陪伴等場景中具備顛覆性潛力。
此外,更為強大的Qwen3-Coder-Plus能夠以更少的token消耗達成更優(yōu)的代碼生成效果,大幅降低使用成本,并可實現(xiàn)多模態(tài)代碼生成能力,例如根據(jù)截圖自動生成可運行的UI代碼,該能力目前在全球范圍內(nèi)處于領(lǐng)先地位。
Qwen3-Next則是一款注重計算效率的模型,盡管總參數(shù)量達80B,但每次推理僅激活約3B參數(shù),性能卻可媲美參數(shù)量高達235B的Qwen3旗艦版本。對比Qwen3-32B,Qwen3-Next訓(xùn)練成本下降超90%。這意味著開發(fā)者能以極低成本部署高性能模型,企業(yè)也能更高效地進行大規(guī)模訓(xùn)練與推理。
整體來看,通義千問此次發(fā)布的產(chǎn)品矩陣覆蓋了從視覺操作、全模態(tài)交互、智能編程到高效計算的核心能力,不僅在多項國際評測中領(lǐng)跑,更將前沿技術(shù)轉(zhuǎn)化為可落地的產(chǎn)品體驗,持續(xù)推動大模型從“能用”走向“好用”乃至“不可或缺”。
據(jù)了解,通過持續(xù)的投入與研發(fā),通義千問原生及衍生模型的數(shù)量已位居全球第一。開源模型的下載總量已經(jīng)超過6億次,得到了開發(fā)者們的廣泛認可,在社區(qū)中引發(fā)了熱烈討論和廣泛傳播。
更智能化的大模型開啟新未來
大模型正展現(xiàn)出變革性的能力與發(fā)展?jié)摿Γ浒l(fā)展態(tài)勢對未來影響深遠。
當下,大模型具備了Tool Use能力,這一能力意義重大,就如同人類創(chuàng)造和使用工具開啟了加速進化歷程一樣,如今大模型憑借此能力能夠連接各類數(shù)字化工具,從而完成真實世界的任務(wù)。
展望未來,自然語言將成為AI時代的源代碼。人們只需用自然語言輸入需求,AI就能自行編寫邏輯、調(diào)用工具、搭建系統(tǒng),完成數(shù)字世界的工作,還能通過數(shù)字化接口操作所有物理設(shè)備。屆時,或許會有超過全球人口數(shù)量的Agent和機器人與人類一起工作,對真實世界產(chǎn)生巨大影響。同時,AI也能連接大部分真實世界場景和數(shù)據(jù),為未來的進化創(chuàng)造條件。
在相關(guān)領(lǐng)域的發(fā)展進程中,通義千問取得了顯著成果。通過持續(xù)的投入與研發(fā),通義千問原生及衍生模型的數(shù)量已位居全球第一,如今已實現(xiàn)全模態(tài)和全尺寸的開源,開源模型的下載總量已經(jīng)超過6億次,得到了開發(fā)者們的認可,在社區(qū)中引發(fā)了熱烈討論和廣泛傳播。
當消費者為iPhone 17國行版缺失AI助手而吐槽其競爭力不足時,市場的反饋已然清晰:在智能時代,AI能力早已從“加分項”變?yōu)椤氨剡x項”,成為衡量產(chǎn)品價值的核心標尺。而通義千問系列大模型的集中突破,恰在另一條關(guān)鍵賽道上,以技術(shù)實力重新定義了“智能”的邊界。這不僅是一場參數(shù)與性能的技術(shù)競賽,更是一次從“單點智能”到“全棧賦能”的產(chǎn)業(yè)更迭。
AI的真正價值,從來不止于功能的疊加,而是通過指數(shù)級放大人類的智力杠桿,徹底重構(gòu)成果的獲取方式。
技術(shù)革命的浪潮永不停歇,Qwen3-Max的發(fā)布僅是中國大模型技術(shù)邁向成熟的新起點。隨著后續(xù)正式版的迭代優(yōu)化,以及全模態(tài)、高效率等技術(shù)的深度落地,我們有理由相信,中國大模型將在通往通用人工智能(AGI)的道路上,邁出更穩(wěn)健的步伐,最終為各行各業(yè)注入智能動能,開啟一個更智慧、更高效、更繁榮的全新紀元。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.