![]()
智東西
作者|江宇
編輯|冰倩
智東西3月20日報道,今日,阿里千問最新旗艦模型預覽版Qwen3.5-Max-Preview正式亮相,并登上全球大模型評測平臺LMArena。在最新榜單中,該模型拿下1464分,進入第一梯隊,同時帶動阿里千問躋身全球大模型實驗室前五、國內第一。
![]()
在強調模型基礎能力對比的without style control評測條件下,其整體性能以1470分的成績,強勢進入全球前列,排名全球第六、國內第一。
![]()
從Arena Expert專家榜單來看,該模型位列第十,分數為1498,排在GPT-5.4、Claude Opus 4.5系列、Claude Sonnet 4.6以及Gemini 3 pro等模型之后,但已經超過GPT-5.2-chat-latest、Claude Sonnet 4.5(thinking版本)以及Gemini 3 Flash等模型,與頭部模型形成貼身競爭。
![]()
從分項能力表現來看,Qwen3.5-Max-Preview在數學和文本任務上均進入前列。其數學能力進入全球前五,專家級文本能力進入前十。
從與前代模型Qwen3-Max與Qwen2.5-Max的對比數據來看,這一版本的提升在多個高頻文本與推理場景中。
Qwen3.5-Max-Preview在創意寫作任務上提升57分,數學能力提升49分,娛樂、體育與媒體類任務提升48分,整體文本能力提升45分,同時在寫作、文學與語言相關任務中同樣提升45分。整體能力呈現出較為均衡的提升。
![]()
從Qwen3-Max的參數規模推測,Qwen3.5-Max很可能是阿里當前參數規模最大的模型,且大概率仍為閉源旗艦模型。
今年以來,阿里已陸續開源發布Qwen3.5系列模型,覆蓋從0.8B到397B不同規模,共8款不同尺寸,有較完整的開源梯度。其中,Qwen3.5-Plus采用約3970億總參數、170億激活參數的結構,在同尺寸模型中表現較為突出。
結語:第一輪成績落地,Qwen3.5-Max等待正式版驗證
模型層的突破正成為阿里AI轉型的第一張王牌。
Qwen3.5-Max-Preview已經先給出了第一輪成績單,但這一版本仍處于預覽階段。接下來,隨著正式版本發布,其能力表現和穩定性是否進一步提升,是這款旗艦模型真正要回答的問題。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.