![]()
智東西
作者|江宇
編輯|冰倩
智東西3月20日?qǐng)?bào)道,今日,阿里千問最新旗艦?zāi)P皖A(yù)覽版Qwen3.5-Max-Preview正式亮相,并登上全球大模型評(píng)測(cè)平臺(tái)LMArena。在最新榜單中,該模型拿下1464分,進(jìn)入第一梯隊(duì),同時(shí)帶動(dòng)阿里千問躋身全球大模型實(shí)驗(yàn)室前五、國內(nèi)第一。
![]()
在強(qiáng)調(diào)模型基礎(chǔ)能力對(duì)比的without style control評(píng)測(cè)條件下,其整體性能以1470分的成績,強(qiáng)勢(shì)進(jìn)入全球前列,排名全球第六、國內(nèi)第一。
![]()
從Arena Expert專家榜單來看,該模型位列第十,分?jǐn)?shù)為1498,排在GPT-5.4、Claude Opus 4.5系列、Claude Sonnet 4.6以及Gemini 3 pro等模型之后,但已經(jīng)超過GPT-5.2-chat-latest、Claude Sonnet 4.5(thinking版本)以及Gemini 3 Flash等模型,與頭部模型形成貼身競爭。
![]()
從分項(xiàng)能力表現(xiàn)來看,Qwen3.5-Max-Preview在數(shù)學(xué)和文本任務(wù)上均進(jìn)入前列。其數(shù)學(xué)能力進(jìn)入全球前五,專家級(jí)文本能力進(jìn)入前十。
從與前代模型Qwen3-Max與Qwen2.5-Max的對(duì)比數(shù)據(jù)來看,這一版本的提升在多個(gè)高頻文本與推理場景中。
Qwen3.5-Max-Preview在創(chuàng)意寫作任務(wù)上提升57分,數(shù)學(xué)能力提升49分,娛樂、體育與媒體類任務(wù)提升48分,整體文本能力提升45分,同時(shí)在寫作、文學(xué)與語言相關(guān)任務(wù)中同樣提升45分。整體能力呈現(xiàn)出較為均衡的提升。
![]()
從Qwen3-Max的參數(shù)規(guī)模推測(cè),Qwen3.5-Max很可能是阿里當(dāng)前參數(shù)規(guī)模最大的模型,且大概率仍為閉源旗艦?zāi)P汀?/p>
今年以來,阿里已陸續(xù)開源發(fā)布Qwen3.5系列模型,覆蓋從0.8B到397B不同規(guī)模,共8款不同尺寸,有較完整的開源梯度。其中,Qwen3.5-Plus采用約3970億總參數(shù)、170億激活參數(shù)的結(jié)構(gòu),在同尺寸模型中表現(xiàn)較為突出。
結(jié)語:第一輪成績落地,Qwen3.5-Max等待正式版驗(yàn)證
模型層的突破正成為阿里AI轉(zhuǎn)型的第一張王牌。
Qwen3.5-Max-Preview已經(jīng)先給出了第一輪成績單,但這一版本仍處于預(yù)覽階段。接下來,隨著正式版本發(fā)布,其能力表現(xiàn)和穩(wěn)定性是否進(jìn)一步提升,是這款旗艦?zāi)P驼嬲卮鸬膯栴}。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.