網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

阿里通義千問(wèn)重磅升級(jí) Qwen3-235B-Instruct登頂開源大模型

2025-07-22 16:32:54　來(lái)源: Al文體生活

湖南舉報(bào)

分享至

7月21日，阿里云旗下通義千問(wèn)團(tuán)隊(duì)宣布完成旗艦?zāi)Ｐ蚎wen3的重大更新，正式推出全新版本Qwen3-235B-A22B-Instruct-2507-FP8。這一升級(jí)標(biāo)志著國(guó)產(chǎn)大模型在通用能力上實(shí)現(xiàn)新的突破，在多項(xiàng)國(guó)際權(quán)威測(cè)評(píng)中超越包括Kimi-K2、DeepSeek-V3等在內(nèi)的頂級(jí)開源模型，以及Claude-Opus4-Non-thinking等閉源模型。

就在上周五，國(guó)際權(quán)威大模型排行榜LMArena剛剛宣布月之暗面推出的萬(wàn)億參數(shù)開源模型Kimi K2登頂全球開源模型榜首。而此次阿里通義千問(wèn)的快速跟進(jìn)升級(jí)，展現(xiàn)了國(guó)產(chǎn)大模型領(lǐng)域的激烈競(jìng)爭(zhēng)與快速迭代能力。新版本Qwen3在指令遵循、邏輯推理、文本理解、數(shù)學(xué)計(jì)算、科學(xué)素養(yǎng)、編程能力和工具調(diào)用等核心維度均實(shí)現(xiàn)顯著提升，在GQPA知識(shí)測(cè)評(píng)、AIME25數(shù)學(xué)競(jìng)賽、LiveCodeBench編程評(píng)測(cè)、Arena-Hard人類偏好對(duì)齊測(cè)試以及BFCL智能體能力評(píng)估等關(guān)鍵指標(biāo)上表現(xiàn)優(yōu)異。

技術(shù)升級(jí)方面，新版模型重點(diǎn)強(qiáng)化了五大核心能力：首先，在多語(yǔ)言長(zhǎng)尾知識(shí)覆蓋上取得突破性進(jìn)展，顯著提升了小語(yǔ)種和專業(yè)知識(shí)領(lǐng)域的理解能力；其次，在主觀題和開放性任務(wù)處理上，模型對(duì)用戶偏好的理解更加精準(zhǔn)，回復(fù)質(zhì)量與實(shí)用性大幅提升；第三，上下文窗口擴(kuò)展至256K，大幅增強(qiáng)了長(zhǎng)文本理解和復(fù)雜任務(wù)處理能力；此外，模型在推理效率和資源消耗方面也進(jìn)行了優(yōu)化平衡。

值得關(guān)注的是，此次升級(jí)后的Qwen3-235B-Instruct版本已在魔搭社區(qū)和HuggingFace平臺(tái)正式開源。這一舉措不僅體現(xiàn)了阿里云在推動(dòng)大模型技術(shù)普惠方面的承諾，也為全球開發(fā)者提供了更強(qiáng)大的技術(shù)工具。分析人士指出，在Kimi K2登頂開源榜首僅一周后，阿里通義千問(wèn)就推出更具競(jìng)爭(zhēng)力的升級(jí)版本，顯示出中國(guó)大模型產(chǎn)業(yè)"你追我趕"的創(chuàng)新活力。隨著多模態(tài)、Agent等技術(shù)的融合發(fā)展，國(guó)產(chǎn)大模型正在全球競(jìng)爭(zhēng)中占據(jù)越來(lái)越重要的位置。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.