阿里千問模型加入AI大模型“春節檔”。2月16日除夕當天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,性能媲美Gemini 3 Pro,登頂全球最強開源模型。千問3.5實現了底層模型架構的全面革新,Qwen3.5-Plus版本總參數為3970億,激活僅170億,以小勝大,性能超過萬億參數的Qwen3-Max模型,部署顯存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價格每百萬token低至0.8元,僅為Gemini 3 Pro的1/18。另外,千問性能更強的旗艦模型Qwen3.5-Max不久也將發布。
與前幾代的千問大語言模型不同,千問3.5實現了從純文本模型到原生多模態模型的代際躍遷。千問3預訓練在純文本Tokens上進行,而千問3.5則基于視覺和文本混合token上預訓練,并大幅新增中英文、多語言、STEM和推理等數據,讓張開“眼睛”的大模型學會了更密集的世界知識和推理邏輯,以不到40%的參數量獲得超萬億的Qwen3-Max基座模型的頂尖性能,在推理、編程、Agent智能體等全方位基準評估中均表現優異。
![]()
阿里開源千問Qwen3.5-Plus,性能媲美Gemini 3 Pro
原生多模態訓練也讓千問3.5的視覺能力飛躍:在多模態推理(MathVison)、通用視覺問答VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權威評測中,千問3.5均斬獲最佳性能。
據了解,千問3.5性能躍升的背后,是對Transformer經典架構的重大創新突破。千問團隊自研的門控技術成果,曾斬獲全球AI頂會2025 NeurIPS最佳論文,該前沿技術已融入千問3.5創新的混合架構中,團隊結合線性注意力機制與稀疏混合專家MoE模型架構,實現了397B總參數激活僅17B的極致模型效率;同時,千問3.5通過訓練穩定優化以及多 token 預測等系列技術,Qwen3.5性能與Qwen3-Max模型持平,并進一步提升了推理效率:在常用的32K上下文場景中,千問3.5推理吞吐量可提升8.6倍;在256K超長上下文情況下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。
![]()
千問3.5推理效率大幅提升,最大吞吐量提升至19倍。
千問3.5的原生多模態訓練,是在阿里云AI基礎設施上高效完成的。通過系列基礎技術創新,千問3.5在文本、圖像、視頻等混合數據訓練吞吐量,幾近100%持平純文本基座模型訓練,大舉降低了原生多模態訓練的難度門檻;同時,通過設計精巧的FP8、FP32精度應用策略,在訓練穩定擴展到數十萬億個token時,激活內存減少約50% ,訓練還能提速10% ,進一步節約了模型訓練成本、提升了訓練效率。
基于頂級視覺能力,千問3.5也實現了從Agent框架到Agent應用的新突破。千問3.5可自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流APP與指令,在PC端可處理更復雜的多步驟操作,如跨應用數據整理、自動化流程執行等,顯著提升操作效率。同時,千問團隊構建了一個可擴展的Agent異步強化學習框架,端到端可加速3到5倍,并將插件式智能體Agent支持擴展至百萬級規模。
連日來,國產大模型集體上新搶占“AI春節檔”。2月14日,字節跳動宣布推出豆包大模型2.0系列。豆包2.0針對大規模生產環境的使用需求進行系統性優化,旨在更好地完成真實世界的復雜任務。2月13日,MiniMax上線新一代文本模型MiniMax M2.5后,官宣該模型全球開源支持本地化部署。
更早前,字節跳動發布Seedance2.0,因為其逼真畫面、電影級運鏡在近日引發熱議。阿里也正式發布新一代圖像生成及編輯模型Qwen-Image-2.0。DeepSeek App更新新版本至1.7.4版本,網頁端也同步進行了更新。面壁智能發布并開源了新一代全模態旗艦模型 MiniCPM-o 4.5。
采寫:南都N視頻記者 林文琪
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.