AI圈新產(chǎn)品的發(fā)布,似乎已經(jīng)很難讓人眼前一亮了。
但是,如果是一套產(chǎn)業(yè)級的布局,和系統(tǒng)性的組合拳呢?
最近一段時(shí)間阿里云的動(dòng)作,在全球的AI社區(qū),都引起了不小的震動(dòng)。
接連三天,三款重量級模型的密集發(fā)布,通義千問系列,亮出了新肌肉……
![]()
Qwen3,墻內(nèi)開花墻外香
海外的AI開發(fā)者圈、AI業(yè)內(nèi)人,對Qwen的評價(jià)一向不低。
都說同行相輕,但技術(shù)圈,說話還是看數(shù)據(jù)、看實(shí)力。
像海外最大的開發(fā)者社區(qū)HuggingFace的CEO Clem,就多次在X上重點(diǎn)談及Qwen3。
![]()
Perplexity的CEO,也很認(rèn)可 Qwen3-coder 的實(shí)力:
![]()
推特創(chuàng)始人 Jack Dorsey 則是公開表示:qwen3-coder性能強(qiáng)勁,是一款讓他覺得“哇”的產(chǎn)品。
![]()
再比如備受技術(shù)圈關(guān)注的Hacker News網(wǎng)站,Qwen3發(fā)布的熱度排名,高居第一。
![]()
![]()
我之前翻譯過幾次文章的a16z合伙人Marco,更是對Qwen3 Coder的效果表示驚訝!
![]()
那么,Qwen3到底好在哪?
近期發(fā)布的Qwen3家族都有哪些不一樣?
Qwen3“三重門”:跨越式升級
7月22日,阿里云率先發(fā)布了 Qwen3-235B(Non-thinking)。
這款非思考模式的旗艦?zāi)P停唤?jīng)推出便在多個(gè)國際評測中展現(xiàn)出卓越性能。
在指令遵循、邏輯推理、文本理解、數(shù)學(xué)、科學(xué)、編程及工具使用等通用能力方面,Qwen3-235B表現(xiàn)出顯著提升。
具體來看,它在GPQA(知識(shí)問答)、AIME25(數(shù)學(xué)推理)、LiveCodeBench(編程能力)、Arena-Hard(人類偏好對齊)以及BFCL(Agent能力)等一系列基準(zhǔn)測試中,其性能已經(jīng)超越了國內(nèi)的Kimi-K2和DeepSeek-V3等頂級開源模型。
https://qwen.readthedocs.io/en/latest/
更值得關(guān)注的是,在某些測試維度上,Qwen3-235B的性能甚至優(yōu)于閉源的Claude Opus4非思考版本。
此次Qwen3-235B的更新,還特別強(qiáng)調(diào)了對多語言長尾知識(shí)的覆蓋能力,這意味著模型在處理非主流語言和特定領(lǐng)域知識(shí)時(shí),表現(xiàn)更為出色。
![]()
此外,在主觀及開放性任務(wù)中,模型對用戶偏好的契合度顯著增強(qiáng),能夠生成更符合用戶期望、質(zhì)量更高的文本。
在上下文處理方面,Qwen3-235B將長文本能力提升到了 256K tokens,這對于處理長篇文檔、代碼庫或復(fù)雜的對話歷史具有重要意義。
僅僅一天之后,7月23日,阿里云緊接著發(fā)布了 Qwen3-Coder。
![]()
這款模型被定位為通義千問家族中“最具代碼代理能力”的模型。
首批上線的旗艦版本Qwen3-Coder-480B-A35B-Instruct,采用了 480B參數(shù)的MoE架構(gòu),其中激活參數(shù)達(dá)到35B。
與Qwen3-235B相似,Qwen3-Coder也原生支持 256K上下文長度,并且可以通過Yarn等技術(shù)擴(kuò)展至1M,為大型代碼項(xiàng)目和復(fù)雜編程任務(wù)提供了充足的處理能力。
在核心能力上,Qwen3-Coder在Agentic Coding(代理式編程)、Agentic Browser-Use(代理式瀏覽器使用)和基礎(chǔ)編程任務(wù)上,取得了開源模型中的SOTA表現(xiàn)。
![]()
官方數(shù)據(jù)顯示,其整體編程智能已能與Anthropic的 Claude Sonnet 4 相媲美。
為了進(jìn)一步提升開發(fā)者體驗(yàn),阿里云還同步開源了一款面向代理式編程的命令行工具 Qwen Code。
這款工具基于Gemini CLI開發(fā),并針對Qwen3-Coder增強(qiáng)了解析器和工具支持,旨在充分發(fā)揮模型在代理式編程任務(wù)中的潛力。Qwen3-Coder的發(fā)布,無疑為開發(fā)者提供了更多選擇,也預(yù)示著AI輔助編程將進(jìn)入一個(gè)更具智能化和自動(dòng)化水平的新階段。
而更引人注目的,是7月25日昨天剛發(fā)布的 Qwen3-235B(Thinking)。
![]()
這款模型被官方稱為Qwen3旗艦?zāi)P偷摹俺夁M(jìn)化”,其性能表現(xiàn)已經(jīng)達(dá)到可以 比肩Google Gemini 2.5 Pro 的水平。
作為目前全球最強(qiáng)的開源推理模型之一,Qwen3-235B(Thinking)在復(fù)雜推理任務(wù)中的能力提升,將使其在科學(xué)研究、復(fù)雜問題解決、邏輯分析等領(lǐng)域展現(xiàn)出巨大潛力。
它的推出,不僅是阿里在通用智能領(lǐng)域深耕的成果,更是對開源模型能力邊界的一次重要拓展。
這三款模型,分別在通用智能、智能編碼和復(fù)雜推理這三大AI核心方向上實(shí)現(xiàn)了突破。
它們在多個(gè)國際評測中頻頻位居榜首,無疑鞏固了阿里在“全球最強(qiáng)開源模型”領(lǐng)域的地位,并凸顯了其在AI產(chǎn)業(yè)化進(jìn)程中的技術(shù)實(shí)力。
阿里的AI策略與全棧布局
阿里云在AI領(lǐng)域的密集動(dòng)作,并非偶然。
反映的是其對AI戰(zhàn)略的長期投入和全棧部署。
當(dāng)外界還在討論單個(gè)模型的性能指標(biāo)時(shí),阿里已經(jīng)開始以“日更”的節(jié)奏,展示其在AI基礎(chǔ)設(shè)施、模型研發(fā)、云平臺(tái)集成以及生態(tài)建設(shè)上的協(xié)同能力。
這種策略的深層邏輯在于,阿里不僅致力于開發(fā)出高性能的模型,更著眼于構(gòu)建一個(gè)完整的AI生態(tài)系統(tǒng)。
這與一些專注于單一模型或應(yīng)用的公司形成對比。
![]()
以全球市場為例,Google通過其TPU硬件、Gemini模型和搜索業(yè)務(wù)構(gòu)建了自身的AI閉環(huán)。
而阿里則通過 阿里云+通義千問+全鏈自研 的模式,正在形成中國AI的能力閉環(huán)。
這意味著從底層芯片、計(jì)算框架,到上層模型、應(yīng)用服務(wù),阿里都具備自研能力,從而實(shí)現(xiàn)對整個(gè)AI技術(shù)棧的深度掌控和優(yōu)化。
在資本投入上,阿里也展現(xiàn)出了其對AI的決心。
官方數(shù)據(jù)顯示,阿里未來三年將投入 3800億元人民幣 用于云和AI領(lǐng)域。
這筆巨額投資,是中國企業(yè)在AI領(lǐng)域最大規(guī)模的資本下注,體現(xiàn)了阿里將AI視為核心增長引擎的戰(zhàn)略決心。
市場對于阿里的科技屬性也正在重新評估。
![]()
類似于AWS與Anthropic、Azure與OpenAI的合作模式,阿里正在構(gòu)建“阿里云+通義千問”的中國式路徑。
阿里云作為國內(nèi)領(lǐng)先的云計(jì)算平臺(tái),為通義千問系列模型提供了強(qiáng)大的算力支持、數(shù)據(jù)存儲(chǔ)和開發(fā)環(huán)境。
同時(shí),通義千問模型的不斷升級和開源,也反過來豐富了阿里云的AI服務(wù)能力,吸引更多開發(fā)者和企業(yè)用戶在其平臺(tái)上進(jìn)行創(chuàng)新。
這種協(xié)同效應(yīng),使得阿里能夠提供從基礎(chǔ)設(shè)施到模型能力的端到端AI解決方案,從而提升其在企業(yè)級AI服務(wù)市場的競爭力。
相比國內(nèi)其他廠商在AI模型發(fā)布上呈現(xiàn)的“單點(diǎn)低頻”特點(diǎn),阿里“三向齊發(fā)+高頻更新”的節(jié)奏,更反映出其在AI研發(fā)體系上的成熟度和體系化能力。
這種能力差距,使得阿里能夠更快地響應(yīng)市場需求,將最新的技術(shù)成果快速推向市場,并在全球AI競爭中保持領(lǐng)先地位。
阿里,真正的全球玩家
長期以來,西方科技巨頭在AI基礎(chǔ)模型領(lǐng)域占據(jù)主導(dǎo)地位,且多傾向于閉源發(fā)展,例如OpenAI的GPT系列。
然而,中國廠商尤其以阿里為代表,在近年來對開源的擁抱,正在逐步改變這一局面。
![]()
根據(jù)斯坦福大學(xué)2025年《AI指數(shù)》報(bào)告,中國AI與美國在性能上的差距已縮小至 0.3%,而阿里在全球AI領(lǐng)域的貢獻(xiàn)排名第三。
這些數(shù)據(jù)表明,中國在AI基礎(chǔ)研究和模型開發(fā)方面,正在快速追趕并縮小與頂尖水平的差距。
當(dāng)美國頂流模型如GPT-4等逐步走向閉源,限制了外部開發(fā)者對其內(nèi)部機(jī)制的了解和創(chuàng)新時(shí),中國廠商卻集體加速開源進(jìn)程,以Qwen為代表的模型,不僅將模型權(quán)重和代碼開放給全球開發(fā)者,還積極構(gòu)建活躍的社區(qū)生態(tài)。
在代碼能力、推理能力、長文本上下文等關(guān)鍵指標(biāo)上,Qwen3系列的表現(xiàn)足以與全球頂尖的閉源模型相抗衡,甚至在某些方面展現(xiàn)出超越的潛力。
例如,Qwen3-Coder在Agentic Coding上的表現(xiàn)可以與Claude Sonnet 4媲美,Qwen3-235B(Thinking)則能夠比肩Gemini 2.5 Pro。
這些事實(shí)表明,中國AI企業(yè)已從“技術(shù)受限者”的角色,逐步轉(zhuǎn)變?yōu)槿駻I生態(tài)的“輸出者”和貢獻(xiàn)者。而阿里,無疑是這一轉(zhuǎn)變中的核心推動(dòng)力量。
當(dāng)AI開始走向中國創(chuàng)造
阿里云的Qwen3系列模型密集發(fā)布,無疑是本周全球AI領(lǐng)域最引人注目的事件之一。
這不僅僅是幾款高性能模型的問世,更是阿里在AI戰(zhàn)略上深耕細(xì)作、持續(xù)投入的體現(xiàn)。通過構(gòu)建全棧式的AI能力,并堅(jiān)持開源策略,阿里正在為中國乃至全球的AI發(fā)展描繪一幅新的圖景。
未來,它們有望在更廣泛的行業(yè)中落地,例如智能客服、自動(dòng)化編程、科學(xué)研究輔助、金融分析和醫(yī)療診斷等。
這場由阿里引領(lǐng)的“中國開源”浪潮,正在重塑全球AI的技術(shù)格局和商業(yè)競爭態(tài)勢。
它不僅展現(xiàn)了中國在AI技術(shù)上的崛起,也為全球AI的普惠和可持續(xù)發(fā)展提供了新的路徑。
中國創(chuàng)造,已經(jīng)從小商品走向AI!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.