除夕夜,阿里官宣發布并開源新一代千問大模型千問 3.5(Qwen3.5-Plus)。這是繼 2025 年除夕發布 Qwen2.5-Max 后,阿里又一次在除夕帶來新一代模型。
現在,千問 APP 與 PC 端(qianwen.com)已經同步上線,用戶可在頁面頂部選擇模型新一代模型,來體驗千問 3.5 的能力。
去年除夕更新的 Qwen2.5-Max 重點在規模和性能,而這次,千問 3.5 更像是一場從純文本模型到原生多模態模型的底層架構層面重構。
![]()
圖丨現在打開千問,已經可調用新模型 Qwen3.5-Plus(來源:千問)
與前幾代的千問大語言模型相比,千問 3.5 這次帶來哪些模型性能的提升呢?
從預訓練來看,千問 3 是在純文本 Tokens 上進行,而千問 3.5 的預訓練則基于視覺和文本混合 token。也就是說,視覺理解不再像從前那樣以外掛模塊形式存在,而是同語言能力共同在底層建模“作戰”。
此外,其還大幅新增了中英文、201 種語言與方語言、STEM 和推理等數據。這意味著,打破了以往的局限性,而是嘗試讓模型在更密集的世界知識和推理邏輯。
值得關注的是,千問 3.5 以少于 40% 的參數量實現了超萬億的 Qwen3-Max 基座模型的高性能。這背后反應的不是簡單的堆參數,而是效率導向的架構優化。
![]()
(來源:千問)
在推理、編程、Agent 智能體等全方位基準評估中均表現優異:
·在指令遵循 IFBench 上,以 76.5 分刷新所有模型紀錄;
·在 MMLU-Pro 知識推理評測中超越 GPT-5.2,獲得 87.8 分得分;
·在博士級難題 GPQA 測評中得分為 88.4 分,高于 Claude 4.5,但與 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有進步的空間;
·在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中,千問 3.5 表現與 Gemini 3 Pro、GPT-5.2 相比性能更優。
![]()
(來源:千問)
總體來看,這種原生多模態訓練,為千問 3.5 的視覺能力帶來了顯著提升。千問 3.5 在多項權威測評中,均實現了最佳性能,包括多模態推理(MathVison)、通用視覺問答 VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等。
可以看到的是,千問 3.5 不再是“語言強、視覺補”,而是在統一架構下形成了一種相對完整的能力矩陣。
![]()
(來源:千問)
千問 3.5 之所以能實現性能的顯著提升,離不開性對 Transformer 經典架構的突破。
此前,千問團隊自研的門控技術成果“Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free”,獲得全球 AI 頂會 2025 NeurIPS 最佳論文。
![]()
(來源:arXiv)
本次千問 3.5 創新的混合架構中已融合該技術,團隊結合線性注意力機制和稀疏混合專家 MoE 模型架構,實現了“高參數、低激活”的結構:模型總參數規模達 397B,但每次推理僅激活 17B 參數。這種結構帶來的好處可能是,模型在保持高性能能力的同時,推理效率大幅度提升。
![]()
(來源:千問)
根據千問官網,千問 3.5 通過訓練穩定優化以及多 token 預測等系列技術,實現了 Qwen3.5 性能比肩 Qwen3-Max 模型,并在此基礎上對推理效率進一步提升:在 32K 上下文場景中,千問 3.5 推理吞吐量可提升 8.6 倍;而在 256K 超長上下文中,Qwen3.5 推理吞吐量最大能實現 19 倍的提升。
這意味著,在長文本分析、復雜推理、Agent 調度等場景中,成本和延遲大幅下降。
![]()
(來源:千問)
基于優異的視覺能力,千問 3.5 還突破性地實現了從 Agent 框架到 Agent 應用,尤其是在提升操作效率方面。例如,能夠自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流 APP 與指令,在 PC 端可處理更復雜的多步驟操作,包括跨應用數據整理、自動化流程執行等。
同時,千問團隊還構建了一個可擴展的 Agent 異步強化學習框架,基于此端到端可加速 3 到 5 倍,并將插件式智能體 Agent 支持擴展至百萬級規模。這也是標志千問從對話模型向行動模型過渡轉化。
千問透露,下一階段的重點將從模型規模轉向系統整合:構建具備跨會話持久記憶的智能體、面向真實世界交互的具身接口、自我改進機制。
放眼全球全球的大模型競爭已然不再只是比拼“更大、更準”,而是“更高效、更可執行”。千問 3.5 不僅是一次模型的更新,一場關于模型的效率革命,已經開始了。
![]()
參考資料:
https://qwen.ai/blog?id=qwen3.5
https://github.com/qiuzh20/gated_attention
排版:劉雅坤
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.