7月21日,阿里云旗下通義千問(wèn)團(tuán)隊(duì)宣布完成旗艦?zāi)P蚎wen3的重大更新,正式推出全新版本Qwen3-235B-A22B-Instruct-2507-FP8。這一升級(jí)標(biāo)志著國(guó)產(chǎn)大模型在通用能力上實(shí)現(xiàn)新的突破,在多項(xiàng)國(guó)際權(quán)威測(cè)評(píng)中超越包括Kimi-K2、DeepSeek-V3等在內(nèi)的頂級(jí)開源模型,以及Claude-Opus4-Non-thinking等閉源模型。
![]()
就在上周五,國(guó)際權(quán)威大模型排行榜LMArena剛剛宣布月之暗面推出的萬(wàn)億參數(shù)開源模型Kimi K2登頂全球開源模型榜首。而此次阿里通義千問(wèn)的快速跟進(jìn)升級(jí),展現(xiàn)了國(guó)產(chǎn)大模型領(lǐng)域的激烈競(jìng)爭(zhēng)與快速迭代能力。新版本Qwen3在指令遵循、邏輯推理、文本理解、數(shù)學(xué)計(jì)算、科學(xué)素養(yǎng)、編程能力和工具調(diào)用等核心維度均實(shí)現(xiàn)顯著提升,在GQPA知識(shí)測(cè)評(píng)、AIME25數(shù)學(xué)競(jìng)賽、LiveCodeBench編程評(píng)測(cè)、Arena-Hard人類偏好對(duì)齊測(cè)試以及BFCL智能體能力評(píng)估等關(guān)鍵指標(biāo)上表現(xiàn)優(yōu)異。
技術(shù)升級(jí)方面,新版模型重點(diǎn)強(qiáng)化了五大核心能力:首先,在多語(yǔ)言長(zhǎng)尾知識(shí)覆蓋上取得突破性進(jìn)展,顯著提升了小語(yǔ)種和專業(yè)知識(shí)領(lǐng)域的理解能力;其次,在主觀題和開放性任務(wù)處理上,模型對(duì)用戶偏好的理解更加精準(zhǔn),回復(fù)質(zhì)量與實(shí)用性大幅提升;第三,上下文窗口擴(kuò)展至256K,大幅增強(qiáng)了長(zhǎng)文本理解和復(fù)雜任務(wù)處理能力;此外,模型在推理效率和資源消耗方面也進(jìn)行了優(yōu)化平衡。
值得關(guān)注的是,此次升級(jí)后的Qwen3-235B-Instruct版本已在魔搭社區(qū)和HuggingFace平臺(tái)正式開源。這一舉措不僅體現(xiàn)了阿里云在推動(dòng)大模型技術(shù)普惠方面的承諾,也為全球開發(fā)者提供了更強(qiáng)大的技術(shù)工具。分析人士指出,在Kimi K2登頂開源榜首僅一周后,阿里通義千問(wèn)就推出更具競(jìng)爭(zhēng)力的升級(jí)版本,顯示出中國(guó)大模型產(chǎn)業(yè)"你追我趕"的創(chuàng)新活力。隨著多模態(tài)、Agent等技術(shù)的融合發(fā)展,國(guó)產(chǎn)大模型正在全球競(jìng)爭(zhēng)中占據(jù)越來(lái)越重要的位置。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.