網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Qwen3，越過三重門

2025-07-26 16:28:16　來源: AI異類

北京舉報(bào)

分享至

AI圈新產(chǎn)品的發(fā)布，似乎已經(jīng)很難讓人眼前一亮了。

但是，如果是一套產(chǎn)業(yè)級的布局，和系統(tǒng)性的組合拳呢？

最近一段時(shí)間阿里云的動(dòng)作，在全球的AI社區(qū)，都引起了不小的震動(dòng)。

接連三天，三款重量級模型的密集發(fā)布，通義千問系列，亮出了新肌肉……

Qwen3，墻內(nèi)開花墻外香

海外的AI開發(fā)者圈、AI業(yè)內(nèi)人，對Qwen的評價(jià)一向不低。

都說同行相輕，但技術(shù)圈，說話還是看數(shù)據(jù)、看實(shí)力。

像海外最大的開發(fā)者社區(qū)HuggingFace的CEO Clem，就多次在X上重點(diǎn)談及Qwen3。

Perplexity的CEO，也很認(rèn)可 Qwen3-coder 的實(shí)力：

推特創(chuàng)始人 Jack Dorsey 則是公開表示：qwen3-coder性能強(qiáng)勁，是一款讓他覺得“哇”的產(chǎn)品。

再比如備受技術(shù)圈關(guān)注的Hacker News網(wǎng)站，Qwen3發(fā)布的熱度排名，高居第一。

我之前翻譯過幾次文章的a16z合伙人Marco，更是對Qwen3 Coder的效果表示驚訝！

那么，Qwen3到底好在哪？

近期發(fā)布的Qwen3家族都有哪些不一樣？

Qwen3“三重門”：跨越式升級

7月22日，阿里云率先發(fā)布了 Qwen3-235B（Non-thinking）。

這款非思考模式的旗艦?zāi)Ｐ停唤?jīng)推出便在多個(gè)國際評測中展現(xiàn)出卓越性能。

在指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等通用能力方面，Qwen3-235B表現(xiàn)出顯著提升。

具體來看，它在GPQA（知識(shí)問答）、AIME25（數(shù)學(xué)推理）、LiveCodeBench（編程能力）、Arena-Hard（人類偏好對齊）以及BFCL（Agent能力）等一系列基準(zhǔn)測試中，其性能已經(jīng)超越了國內(nèi)的Kimi-K2和DeepSeek-V3等頂級開源模型。

https://qwen.readthedocs.io/en/latest/

更值得關(guān)注的是，在某些測試維度上，Qwen3-235B的性能甚至優(yōu)于閉源的Claude Opus4非思考版本。

此次Qwen3-235B的更新，還特別強(qiáng)調(diào)了對多語言長尾知識(shí)的覆蓋能力，這意味著模型在處理非主流語言和特定領(lǐng)域知識(shí)時(shí)，表現(xiàn)更為出色。

此外，在主觀及開放性任務(wù)中，模型對用戶偏好的契合度顯著增強(qiáng)，能夠生成更符合用戶期望、質(zhì)量更高的文本。

在上下文處理方面，Qwen3-235B將長文本能力提升到了 256K tokens，這對于處理長篇文檔、代碼庫或復(fù)雜的對話歷史具有重要意義。

僅僅一天之后，7月23日，阿里云緊接著發(fā)布了 Qwen3-Coder。

這款模型被定位為通義千問家族中“最具代碼代理能力”的模型。

首批上線的旗艦版本Qwen3-Coder-480B-A35B-Instruct，采用了 480B參數(shù)的MoE架構(gòu)，其中激活參數(shù)達(dá)到35B。

與Qwen3-235B相似，Qwen3-Coder也原生支持 256K上下文長度，并且可以通過Yarn等技術(shù)擴(kuò)展至1M，為大型代碼項(xiàng)目和復(fù)雜編程任務(wù)提供了充足的處理能力。

在核心能力上，Qwen3-Coder在Agentic Coding（代理式編程）、Agentic Browser-Use（代理式瀏覽器使用）和基礎(chǔ)編程任務(wù)上，取得了開源模型中的SOTA表現(xiàn)。

官方數(shù)據(jù)顯示，其整體編程智能已能與Anthropic的 Claude Sonnet 4 相媲美。

為了進(jìn)一步提升開發(fā)者體驗(yàn)，阿里云還同步開源了一款面向代理式編程的命令行工具 Qwen Code。

這款工具基于Gemini CLI開發(fā)，并針對Qwen3-Coder增強(qiáng)了解析器和工具支持，旨在充分發(fā)揮模型在代理式編程任務(wù)中的潛力。Qwen3-Coder的發(fā)布，無疑為開發(fā)者提供了更多選擇，也預(yù)示著AI輔助編程將進(jìn)入一個(gè)更具智能化和自動(dòng)化水平的新階段。

而更引人注目的，是7月25日昨天剛發(fā)布的 Qwen3-235B（Thinking）。

這款模型被官方稱為Qwen3旗艦?zāi)Ｐ偷摹俺夁M(jìn)化”，其性能表現(xiàn)已經(jīng)達(dá)到可以 比肩Google Gemini 2.5 Pro 的水平。

作為目前全球最強(qiáng)的開源推理模型之一，Qwen3-235B（Thinking）在復(fù)雜推理任務(wù)中的能力提升，將使其在科學(xué)研究、復(fù)雜問題解決、邏輯分析等領(lǐng)域展現(xiàn)出巨大潛力。

它的推出，不僅是阿里在通用智能領(lǐng)域深耕的成果，更是對開源模型能力邊界的一次重要拓展。

這三款模型，分別在通用智能、智能編碼和復(fù)雜推理這三大AI核心方向上實(shí)現(xiàn)了突破。

它們在多個(gè)國際評測中頻頻位居榜首，無疑鞏固了阿里在“全球最強(qiáng)開源模型”領(lǐng)域的地位，并凸顯了其在AI產(chǎn)業(yè)化進(jìn)程中的技術(shù)實(shí)力。

阿里的AI策略與全棧布局

阿里云在AI領(lǐng)域的密集動(dòng)作，并非偶然。

反映的是其對AI戰(zhàn)略的長期投入和全棧部署。

當(dāng)外界還在討論單個(gè)模型的性能指標(biāo)時(shí)，阿里已經(jīng)開始以“日更”的節(jié)奏，展示其在AI基礎(chǔ)設(shè)施、模型研發(fā)、云平臺(tái)集成以及生態(tài)建設(shè)上的協(xié)同能力。

這種策略的深層邏輯在于，阿里不僅致力于開發(fā)出高性能的模型，更著眼于構(gòu)建一個(gè)完整的AI生態(tài)系統(tǒng)。

這與一些專注于單一模型或應(yīng)用的公司形成對比。

以全球市場為例，Google通過其TPU硬件、Gemini模型和搜索業(yè)務(wù)構(gòu)建了自身的AI閉環(huán)。

而阿里則通過 阿里云+通義千問+全鏈自研 的模式，正在形成中國AI的能力閉環(huán)。

這意味著從底層芯片、計(jì)算框架，到上層模型、應(yīng)用服務(wù)，阿里都具備自研能力，從而實(shí)現(xiàn)對整個(gè)AI技術(shù)棧的深度掌控和優(yōu)化。

在資本投入上，阿里也展現(xiàn)出了其對AI的決心。

官方數(shù)據(jù)顯示，阿里未來三年將投入 3800億元人民幣 用于云和AI領(lǐng)域。

這筆巨額投資，是中國企業(yè)在AI領(lǐng)域最大規(guī)模的資本下注，體現(xiàn)了阿里將AI視為核心增長引擎的戰(zhàn)略決心。

市場對于阿里的科技屬性也正在重新評估。

類似于AWS與Anthropic、Azure與OpenAI的合作模式，阿里正在構(gòu)建“阿里云+通義千問”的中國式路徑。

阿里云作為國內(nèi)領(lǐng)先的云計(jì)算平臺(tái)，為通義千問系列模型提供了強(qiáng)大的算力支持、數(shù)據(jù)存儲(chǔ)和開發(fā)環(huán)境。

同時(shí)，通義千問模型的不斷升級和開源，也反過來豐富了阿里云的AI服務(wù)能力，吸引更多開發(fā)者和企業(yè)用戶在其平臺(tái)上進(jìn)行創(chuàng)新。

這種協(xié)同效應(yīng)，使得阿里能夠提供從基礎(chǔ)設(shè)施到模型能力的端到端AI解決方案，從而提升其在企業(yè)級AI服務(wù)市場的競爭力。

相比國內(nèi)其他廠商在AI模型發(fā)布上呈現(xiàn)的“單點(diǎn)低頻”特點(diǎn)，阿里“三向齊發(fā)+高頻更新”的節(jié)奏，更反映出其在AI研發(fā)體系上的成熟度和體系化能力。

這種能力差距，使得阿里能夠更快地響應(yīng)市場需求，將最新的技術(shù)成果快速推向市場，并在全球AI競爭中保持領(lǐng)先地位。

阿里，真正的全球玩家

長期以來，西方科技巨頭在AI基礎(chǔ)模型領(lǐng)域占據(jù)主導(dǎo)地位，且多傾向于閉源發(fā)展，例如OpenAI的GPT系列。

然而，中國廠商尤其以阿里為代表，在近年來對開源的擁抱，正在逐步改變這一局面。

根據(jù)斯坦福大學(xué)2025年《AI指數(shù)》報(bào)告，中國AI與美國在性能上的差距已縮小至 0.3%，而阿里在全球AI領(lǐng)域的貢獻(xiàn)排名第三。

這些數(shù)據(jù)表明，中國在AI基礎(chǔ)研究和模型開發(fā)方面，正在快速追趕并縮小與頂尖水平的差距。

當(dāng)美國頂流模型如GPT-4等逐步走向閉源，限制了外部開發(fā)者對其內(nèi)部機(jī)制的了解和創(chuàng)新時(shí)，中國廠商卻集體加速開源進(jìn)程，以Qwen為代表的模型，不僅將模型權(quán)重和代碼開放給全球開發(fā)者，還積極構(gòu)建活躍的社區(qū)生態(tài)。

在代碼能力、推理能力、長文本上下文等關(guān)鍵指標(biāo)上，Qwen3系列的表現(xiàn)足以與全球頂尖的閉源模型相抗衡，甚至在某些方面展現(xiàn)出超越的潛力。

例如，Qwen3-Coder在Agentic Coding上的表現(xiàn)可以與Claude Sonnet 4媲美，Qwen3-235B（Thinking）則能夠比肩Gemini 2.5 Pro。

這些事實(shí)表明，中國AI企業(yè)已從“技術(shù)受限者”的角色，逐步轉(zhuǎn)變?yōu)槿駻I生態(tài)的“輸出者”和貢獻(xiàn)者。而阿里，無疑是這一轉(zhuǎn)變中的核心推動(dòng)力量。

當(dāng)AI開始走向中國創(chuàng)造

阿里云的Qwen3系列模型密集發(fā)布，無疑是本周全球AI領(lǐng)域最引人注目的事件之一。

這不僅僅是幾款高性能模型的問世，更是阿里在AI戰(zhàn)略上深耕細(xì)作、持續(xù)投入的體現(xiàn)。通過構(gòu)建全棧式的AI能力，并堅(jiān)持開源策略，阿里正在為中國乃至全球的AI發(fā)展描繪一幅新的圖景。

未來，它們有望在更廣泛的行業(yè)中落地，例如智能客服、自動(dòng)化編程、科學(xué)研究輔助、金融分析和醫(yī)療診斷等。

這場由阿里引領(lǐng)的“中國開源”浪潮，正在重塑全球AI的技術(shù)格局和商業(yè)競爭態(tài)勢。

它不僅展現(xiàn)了中國在AI技術(shù)上的崛起，也為全球AI的普惠和可持續(xù)發(fā)展提供了新的路徑。

中國創(chuàng)造，已經(jīng)從小商品走向AI！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.