云棲炸場！阿里通義全家桶來了，萬億參數(shù)國產(chǎn)大模型已悄然破局！

2025-09-24 18:19:52　來源: 計算雜談

北京舉報

分享至

近日，蘋果iPhone17系列憑借創(chuàng)新設(shè)計與性能革新，瞬間引爆了消費市場。然而，國行版本未搭載AI智能體手機助手的“短板”，卻成了眾多用戶吐槽的焦點。

當其他品牌智能手機已讓人機協(xié)作滲透至“一句話點外賣、智能識屏解析”等生活場景時，缺失AI助手的iPhone17系列則令人倍感遺憾。畢竟，對于用戶而言，手機助手早已不是“語音指令”的簡單工具，而是能秒級調(diào)整設(shè)置、AI處理文檔、個性化交互的智能設(shè)備。

當人工智能從實驗室走向千行百業(yè)，其進化速度正以“月”為單位刷新認知。9月24日，2025年云棲大會的開幕，為全球AI從業(yè)者遞上一張觀察技術(shù)前沿的“最佳觀景臺”。阿里云智能首席技術(shù)官周靖人在主論壇的發(fā)布，堪稱一場AI技術(shù)的“超級盛宴”。此次通義千問多款模型齊發(fā)，旗艦?zāi)Ｐ蚎wen3-Max參數(shù)規(guī)模突破萬億，在MMLU、GSM8K、HumanEval等國際主流評測中多項指標全球領(lǐng)先；Qwen3-VL作為千問家族最強視覺語言模型，真正實現(xiàn)“看懂世界、理解世界并指導(dǎo)行動”；Qwen3-Omni系列打造全模態(tài)交互體驗，擬人化程度極高，已在32項開源基準測試中斬獲SOTA；Qwen3-Next則重構(gòu)底層架構(gòu)，在性能不減的前提下將大幅降低訓(xùn)練成本，兼顧效果與效率；廣受開發(fā)者歡迎的編程模型Qwen3-Coder升級為Plus版本，推理更快、代碼更安全。

同時，通義萬相家族也正式推出通義萬相Wan2.5-preview系列模型，該系列模型全面覆蓋文生視頻、圖生視頻、文生圖以及圖像編輯四大核心模型領(lǐng)域。

此次發(fā)布不僅是阿里云技術(shù)實力的集中展示，更預(yù)示著AI大規(guī)模落地應(yīng)用的新紀元已然開啟。

Qwen3-Max的突破：從穩(wěn)定訓(xùn)練到頂尖推理

在使用大模型之前，用戶們往往都會通過各類媒介去了解其性能表現(xiàn)，因此測試榜單中的成績極具參考價值。

作為向來“戰(zhàn)績”優(yōu)秀的通義千問家族而言，此次新推出的Qwen3-Max自然也再次刷榜！

在實際能力評測中，Qwen3-Max-Instruct版本展現(xiàn)出頂尖的代碼生成與智能體交互水平。在面向真實編程挑戰(zhàn)的SWE-Bench Verified測試中，它以69.6分的成績穩(wěn)居全球頂尖模型行列；而在更嚴苛的智能體工具調(diào)用測試Tau2-Bench上，其74.8分的表現(xiàn)甚至超越了Claude Opus 4，顯示出強大的實際應(yīng)用潛力。

尤為引人注目的是其深度推理版本Qwen3-Max-Thinking。該模型通過集成代碼解釋器與并行測試時計算技術(shù)，在AIME 25、HMMT等高難度數(shù)學(xué)推理基準中取得了100%的準確率，展現(xiàn)出接近人類專業(yè)水平的邏輯推演能力。這一突破標志著大模型不僅在知識廣度上擴展，更在思維深度上向更高層次的認知能力邁進。

Qwen3-Max作為通義千問家族的旗艦?zāi)Ｐ停瑧{借超過1萬億的參數(shù)規(guī)模和基于36萬億token的預(yù)訓(xùn)練數(shù)據(jù)，在基礎(chǔ)能力上實現(xiàn)了顯著提升。它延續(xù)了Qwen3系列的結(jié)構(gòu)設(shè)計，并采用自主研發(fā)的global-batch負載均衡損失函數(shù)，在訓(xùn)練過程中展現(xiàn)出更佳的穩(wěn)定性。

據(jù)了解，在訓(xùn)練效率方面，Qwen3-Max借助PAI-FlashMoE的多級流水并行優(yōu)化技術(shù)，模型訓(xùn)練效率相比前代提升30%。針對長序列訓(xùn)練場景，團隊進一步采用ChunkFlow策略，使訓(xùn)練吞吐量達到序列并行方案的3倍，有力支撐了模型處理長達100萬token上下文的能力。同時，通過多項系統(tǒng)級優(yōu)化，因硬件故障導(dǎo)致的訓(xùn)練中斷時間大幅縮減至Qwen2.5-Max的五分之一，保障了超大規(guī)模訓(xùn)練的連續(xù)性與可靠性。

基于此，才讓Qwen3-Max擁有了躋身全球領(lǐng)先的硬實力。

通義千問家族：讓大模型從能用邁向好用

除了萬眾矚目的Qwen3-Max之外，千問3家族的其他幾款大模型也在多模態(tài)理解、智能交互、代碼生成與計算效率等方面實現(xiàn)了全方位突破，展現(xiàn)出強大的技術(shù)領(lǐng)先性和落地潛力。

先來看Qwen3-VL，我們平時接觸傳統(tǒng)意義上的視覺語言模型大都只能識別圖片等信息，若希望做更深層的識別則需要借助其他工具來完成，影響工作連續(xù)性。而Qwen3-VL則改變了這一切，它不僅能識別圖像內(nèi)容，更能深度理解圖形用戶界面（GUI）中的元素，包括按鈕、菜單、圖標等，并準確判斷其功能與交互邏輯。它具備自主操作電腦和手機界面的能力，可自動調(diào)用“放大”“點擊”“滾動”等智能體（Agent）工具，在任務(wù)執(zhí)行過程中持續(xù)觀察、推理與調(diào)整。

舉個例子，當輸入一張產(chǎn)品設(shè)計圖時，Qwen3-VL能直接生成對應(yīng)的Draw.io流程圖、HTML/CSS/JS前端代碼，實現(xiàn)“所見即所得”的視覺編程。更進一步，它還集成了先進的3D檢測能力，可感知空間結(jié)構(gòu)，精準判斷物體的方位、視角變化及遮擋關(guān)系，在OS World等國際權(quán)威GUI操作基準測試中達到世界頂尖水平，為智能助理、自動化測試、人機協(xié)同等場景提供核心引擎。

Qwen3-Omni則是家族中的全模態(tài)預(yù)訓(xùn)練大模型選手，從訓(xùn)練初期即融合文本、圖像、音頻、視頻等多種模態(tài)數(shù)據(jù)，實現(xiàn)真正的多模態(tài)對齊與協(xié)同理解。它的最大亮點在于支持實時流式響應(yīng)：用戶說話的同時，模型可同步生成文字回復(fù)并合成自然流暢的語音，交互延遲極低，體驗高度擬人化，并支持深度定制。

這種“有性格、有記憶、多模態(tài)”的交互能力，使其在虛擬主播、智能客服、教育陪伴等場景中具備顛覆性潛力。

此外，更為強大的Qwen3-Coder-Plus能夠以更少的token消耗達成更優(yōu)的代碼生成效果，大幅降低使用成本，并可實現(xiàn)多模態(tài)代碼生成能力，例如根據(jù)截圖自動生成可運行的UI代碼，該能力目前在全球范圍內(nèi)處于領(lǐng)先地位。

Qwen3-Next則是一款注重計算效率的模型，盡管總參數(shù)量達80B，但每次推理僅激活約3B參數(shù)，性能卻可媲美參數(shù)量高達235B的Qwen3旗艦版本。對比Qwen3-32B，Qwen3-Next訓(xùn)練成本下降超90%。這意味著開發(fā)者能以極低成本部署高性能模型，企業(yè)也能更高效地進行大規(guī)模訓(xùn)練與推理。

整體來看，通義千問此次發(fā)布的產(chǎn)品矩陣覆蓋了從視覺操作、全模態(tài)交互、智能編程到高效計算的核心能力，不僅在多項國際評測中領(lǐng)跑，更將前沿技術(shù)轉(zhuǎn)化為可落地的產(chǎn)品體驗，持續(xù)推動大模型從“能用”走向“好用”乃至“不可或缺”。

據(jù)了解，通過持續(xù)的投入與研發(fā)，通義千問原生及衍生模型的數(shù)量已位居全球第一。開源模型的下載總量已經(jīng)超過6億次，得到了開發(fā)者們的廣泛認可，在社區(qū)中引發(fā)了熱烈討論和廣泛傳播。

更智能化的大模型開啟新未來

大模型正展現(xiàn)出變革性的能力與發(fā)展?jié)摿Γ浒l(fā)展態(tài)勢對未來影響深遠。

當下，大模型具備了Tool Use能力，這一能力意義重大，就如同人類創(chuàng)造和使用工具開啟了加速進化歷程一樣，如今大模型憑借此能力能夠連接各類數(shù)字化工具，從而完成真實世界的任務(wù)。

展望未來，自然語言將成為AI時代的源代碼。人們只需用自然語言輸入需求，AI就能自行編寫邏輯、調(diào)用工具、搭建系統(tǒng)，完成數(shù)字世界的工作，還能通過數(shù)字化接口操作所有物理設(shè)備。屆時，或許會有超過全球人口數(shù)量的Agent和機器人與人類一起工作，對真實世界產(chǎn)生巨大影響。同時，AI也能連接大部分真實世界場景和數(shù)據(jù)，為未來的進化創(chuàng)造條件。

在相關(guān)領(lǐng)域的發(fā)展進程中，通義千問取得了顯著成果。通過持續(xù)的投入與研發(fā)，通義千問原生及衍生模型的數(shù)量已位居全球第一，如今已實現(xiàn)全模態(tài)和全尺寸的開源，開源模型的下載總量已經(jīng)超過6億次，得到了開發(fā)者們的認可，在社區(qū)中引發(fā)了熱烈討論和廣泛傳播。

當消費者為iPhone 17國行版缺失AI助手而吐槽其競爭力不足時，市場的反饋已然清晰：在智能時代，AI能力早已從“加分項”變?yōu)椤氨剡x項”，成為衡量產(chǎn)品價值的核心標尺。而通義千問系列大模型的集中突破，恰在另一條關(guān)鍵賽道上，以技術(shù)實力重新定義了“智能”的邊界。這不僅是一場參數(shù)與性能的技術(shù)競賽，更是一次從“單點智能”到“全棧賦能”的產(chǎn)業(yè)更迭。

AI的真正價值，從來不止于功能的疊加，而是通過指數(shù)級放大人類的智力杠桿，徹底重構(gòu)成果的獲取方式。

技術(shù)革命的浪潮永不停歇，Qwen3-Max的發(fā)布僅是中國大模型技術(shù)邁向成熟的新起點。隨著后續(xù)正式版的迭代優(yōu)化，以及全模態(tài)、高效率等技術(shù)的深度落地，我們有理由相信，中國大模型將在通往通用人工智能（AGI）的道路上，邁出更穩(wěn)健的步伐，最終為各行各業(yè)注入智能動能，開啟一個更智慧、更高效、更繁榮的全新紀元。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.