網易首頁 > 網易號 > 正文申請入駐

除夕重磅！千問開源Qwen3.5，最大吞吐量提升至19倍

2026-02-16 21:37:36　來源: DeepTech深科技

河南舉報

分享至

除夕夜，阿里官宣發布并開源新一代千問大模型千問 3.5（Qwen3.5-Plus）。這是繼 2025 年除夕發布 Qwen2.5-Max 后，阿里又一次在除夕帶來新一代模型。

現在，千問 APP 與 PC 端（qianwen.com）已經同步上線，用戶可在頁面頂部選擇模型新一代模型，來體驗千問 3.5 的能力。

去年除夕更新的 Qwen2.5-Max 重點在規模和性能，而這次，千問 3.5 更像是一場從純文本模型到原生多模態模型的底層架構層面重構。

圖丨現在打開千問，已經可調用新模型 Qwen3.5-Plus（來源：千問）

與前幾代的千問大語言模型相比，千問 3.5 這次帶來哪些模型性能的提升呢？

從預訓練來看，千問 3 是在純文本 Tokens 上進行，而千問 3.5 的預訓練則基于視覺和文本混合 token。也就是說，視覺理解不再像從前那樣以外掛模塊形式存在，而是同語言能力共同在底層建模“作戰”。

此外，其還大幅新增了中英文、201 種語言與方語言、STEM 和推理等數據。這意味著，打破了以往的局限性，而是嘗試讓模型在更密集的世界知識和推理邏輯。

值得關注的是，千問 3.5 以少于 40% 的參數量實現了超萬億的 Qwen3-Max 基座模型的高性能。這背后反應的不是簡單的堆參數，而是效率導向的架構優化。

（來源：千問）

在推理、編程、Agent 智能體等全方位基準評估中均表現優異：

·在指令遵循 IFBench 上，以 76.5 分刷新所有模型紀錄；

·在 MMLU-Pro 知識推理評測中超越 GPT-5.2，獲得 87.8 分得分；

·在博士級難題 GPQA 測評中得分為 88.4 分，高于 Claude 4.5，但與 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有進步的空間；

·在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中，千問 3.5 表現與 Gemini 3 Pro、GPT-5.2 相比性能更優。

（來源：千問）

總體來看，這種原生多模態訓練，為千問 3.5 的視覺能力帶來了顯著提升。千問 3.5 在多項權威測評中，均實現了最佳性能，包括多模態推理（MathVison）、通用視覺問答 VQA（RealWorldQA）、文本識別和文件理解（CC_OCR）、空間智能（RefCOCO-avg）、視頻理解（MLVU）等。

可以看到的是，千問 3.5 不再是“語言強、視覺補”，而是在統一架構下形成了一種相對完整的能力矩陣。

（來源：千問）

千問 3.5 之所以能實現性能的顯著提升，離不開性對 Transformer 經典架構的突破。

此前，千問團隊自研的門控技術成果“Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free”，獲得全球 AI 頂會 2025 NeurIPS 最佳論文。

（來源：arXiv）

本次千問 3.5 創新的混合架構中已融合該技術，團隊結合線性注意力機制和稀疏混合專家 MoE 模型架構，實現了“高參數、低激活”的結構：模型總參數規模達 397B，但每次推理僅激活 17B 參數。這種結構帶來的好處可能是，模型在保持高性能能力的同時，推理效率大幅度提升。

（來源：千問）

根據千問官網，千問 3.5 通過訓練穩定優化以及多 token 預測等系列技術，實現了 Qwen3.5 性能比肩 Qwen3-Max 模型，并在此基礎上對推理效率進一步提升：在 32K 上下文場景中，千問 3.5 推理吞吐量可提升 8.6 倍；而在 256K 超長上下文中，Qwen3.5 推理吞吐量最大能實現 19 倍的提升。

這意味著，在長文本分析、復雜推理、Agent 調度等場景中，成本和延遲大幅下降。

（來源：千問）

基于優異的視覺能力，千問 3.5 還突破性地實現了從 Agent 框架到 Agent 應用，尤其是在提升操作效率方面。例如，能夠自主操作手機與電腦，高效完成日常任務，在移動端支持更多主流 APP 與指令，在 PC 端可處理更復雜的多步驟操作，包括跨應用數據整理、自動化流程執行等。

同時，千問團隊還構建了一個可擴展的 Agent 異步強化學習框架，基于此端到端可加速 3 到 5 倍，并將插件式智能體 Agent 支持擴展至百萬級規模。這也是標志千問從對話模型向行動模型過渡轉化。

千問透露，下一階段的重點將從模型規模轉向系統整合：構建具備跨會話持久記憶的智能體、面向真實世界交互的具身接口、自我改進機制。

放眼全球全球的大模型競爭已然不再只是比拼“更大、更準”，而是“更高效、更可執行”。千問 3.5 不僅是一次模型的更新，一場關于模型的效率革命，已經開始了。

參考資料：

https://qwen.ai/blog?id=qwen3.5

https://github.com/qiuzh20/gated_attention

排版：劉雅坤

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.