網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

阿里發(fā)布千問3.5，性能媲美Gemini 3， Token價(jià)格僅為其1/18

千問3.5成本僅為谷歌大模型5%

2026-02-16 18:15:01　來源: 華爾街見聞官方

上海舉報(bào)

分享至

蛇年尾聲，阿里更強(qiáng)大的千問模型登場。

2月16日除夕當(dāng)天，阿里巴巴開源全新一代大模型千問Qwen3.5-Plus。千問3.5在文本和視覺的混合數(shù)據(jù)上預(yù)訓(xùn)練，實(shí)現(xiàn)了原生多模態(tài)的新突破，在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異，并在視覺理解能力的權(quán)威評(píng)測中斬獲數(shù)項(xiàng)性能最佳。

Qwen3.5的核心突破在于從架構(gòu)層面系統(tǒng)性破解了大型模型的“效率-精度”悖論。通過混合注意力機(jī)制，模型實(shí)現(xiàn)了對(duì)長文本的動(dòng)態(tài)聚焦，告別了全量計(jì)算的算力浪費(fèi)；而極致稀疏MoE架構(gòu)則以不足5%的激活參數(shù)調(diào)動(dòng)3970億總參數(shù)的知識(shí)儲(chǔ)備，將推理成本降至新低。

在效率躍升的同時(shí)，原生多Token預(yù)測能力讓模型從“逐字蹦”進(jìn)階為“多步規(guī)劃”，響應(yīng)速度接近翻倍。通義團(tuán)隊(duì)斬獲NeurIPS最佳論文的注意力門控等系列穩(wěn)定性優(yōu)化，則為這些激進(jìn)創(chuàng)新提供了系統(tǒng)級(jí)保障，確保超大規(guī)模訓(xùn)練真正“跑得穩(wěn)”。這四大技術(shù)共同指向一個(gè)目標(biāo)：用更少的算力，喚醒更強(qiáng)的智能。

千問APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。開發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型，或通過阿里云百煉直接獲取API服務(wù)。

性能媲美Gemini 3 Pro ，且極具性價(jià)比

據(jù)阿里介紹，阿里巴巴開源全新一代大模型千問Qwen3.5-Plus，性能媲美Gemini 3 Pro，登頂全球最強(qiáng)開源模型。千問3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新，此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億，激活僅170億，以小勝大，性能超過萬億參數(shù)的Qwen3-Max模型，部署顯存占用降低60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。

價(jià)格方面，Qwen3.5-Plus的API價(jià)格每百萬Token低至0.8元，僅為Gemini 3 pro的1/18。

四大技術(shù)突破：從架構(gòu)創(chuàng)新到系統(tǒng)穩(wěn)定

Qwen3.5的核心技術(shù)突破體現(xiàn)在四大創(chuàng)新維度。首先是混合注意力機(jī)制，它讓模型學(xué)會(huì)“有詳有略地讀”。傳統(tǒng)大模型處理長文本時(shí)，每個(gè)token需與所有上下文進(jìn)行全量注意力計(jì)算，文本越長、算力消耗越大，這是制約長上下文能力的核心瓶頸。Qwen3.5通過動(dòng)態(tài)分配注意力資源，對(duì)重要信息精讀、對(duì)次要信息略讀，實(shí)現(xiàn)了效率與精度的同步提升。

其次是極致稀疏MoE架構(gòu)。傳統(tǒng)稠密模型每次推理需激活全部參數(shù)，參數(shù)越多、算力成本越高。MoE架構(gòu)的創(chuàng)新在于根據(jù)輸入內(nèi)容僅激活最相關(guān)的“專家”子網(wǎng)絡(luò)，而Qwen3.5將這一思路推向極致——以3970億總參數(shù)、僅激活170億參數(shù)的稀疏架構(gòu)，實(shí)現(xiàn)用不足5%的算力調(diào)動(dòng)全部知識(shí)儲(chǔ)備，大幅降低推理成本。

第三是原生多Token預(yù)測能力。傳統(tǒng)模型采用逐token生成方式，推理效率受限。Qwen3.5在訓(xùn)練階段即學(xué)會(huì)對(duì)后續(xù)多個(gè)位置進(jìn)行聯(lián)合預(yù)測，使推理速度接近翻倍。這一“多步規(guī)劃”能力在長文本生成、代碼補(bǔ)全、多輪對(duì)話等高頻場景中，為用戶帶來接近“秒回”的響應(yīng)體驗(yàn)。

最后是系統(tǒng)級(jí)訓(xùn)練穩(wěn)定性優(yōu)化，確保上述架構(gòu)創(chuàng)新在超大規(guī)模訓(xùn)練中真正“跑得穩(wěn)”。以通義團(tuán)隊(duì)斬獲NeurIPS 2025最佳論文獎(jiǎng)的注意力門控機(jī)制為例，該機(jī)制在注意力層輸出端加入“智能開關(guān)”，像水龍頭一樣對(duì)信息流進(jìn)行智能調(diào)控——既防止有效信息被淹沒，也避免無效信息被過度放大，從而提升輸出精度與長上下文泛化能力。此外，歸一化策略優(yōu)化、專家路由初始化等深層改進(jìn)，分別解決不同環(huán)節(jié)的穩(wěn)定性問題，共同保障模型在大規(guī)模訓(xùn)練中的穩(wěn)健運(yùn)行。

從“應(yīng)答”到“操作”的人機(jī)交互新范式

與傳統(tǒng)聊天機(jī)器人的本質(zhì)區(qū)別在于，Qwen3.5不再滿足于應(yīng)答交互。其搭載的視覺智能體能力，使其能夠像人類一樣“觀看”手機(jī)和電腦屏幕，精準(zhǔn)理解界面元素的位置與功能，并自主執(zhí)行操作。官方演示中，用戶僅需通過自然語言下達(dá)指令，模型即可在移動(dòng)端跨應(yīng)用完成任務(wù)，或在PC端處理數(shù)據(jù)整理、多步驟流程自動(dòng)化等復(fù)雜工作，將人機(jī)協(xié)作推向全新維度。

這一能力的實(shí)現(xiàn)，源于其先進(jìn)的視覺理解技術(shù)。Qwen3.5能夠精準(zhǔn)定位屏幕元素，識(shí)別按鈕、文本框、圖標(biāo)的坐標(biāo)與功能屬性，進(jìn)而模擬點(diǎn)擊、滑動(dòng)、輸入等操作。通過對(duì)屏幕內(nèi)容的視覺編碼與語義解析，AI真正具備了與數(shù)字世界交互的“視覺”與“手部”能力。用戶可根據(jù)需求選擇本地或云端部署，在計(jì)算效率與數(shù)據(jù)可控性之間靈活平衡。

跨應(yīng)用協(xié)作則是Qwen3.5的另一突破。演示場景中，模型能夠從郵件提取信息、讀取表格數(shù)據(jù)、再通過通訊軟件完成發(fā)送，這一系列操作打通了傳統(tǒng)應(yīng)用間的數(shù)據(jù)孤島，將多步驟流程自動(dòng)化變?yōu)楝F(xiàn)實(shí)。傳統(tǒng)應(yīng)用的隔離機(jī)制在AI智能體面前不再是障礙，因?yàn)樗浴坝脩舸怼钡纳矸莺戏ā⒏咝У貐f(xié)同各應(yīng)用，為用戶創(chuàng)造無縫的數(shù)字體驗(yàn)。這種從單一工具向全能數(shù)字助手的進(jìn)化，正為人機(jī)協(xié)作開辟全新的想象空間。

6分48秒，從一張草圖到一段代碼：Qwen3.5的“讀心術(shù)”有多強(qiáng)？

更令人驚嘆的是Qwen3.5所展現(xiàn)的視覺編程能力。在一段演示視頻中，用戶僅用手指了一個(gè)網(wǎng)頁界面的草圖，模型便在6分48秒內(nèi)將其轉(zhuǎn)化為結(jié)構(gòu)清晰、可直接運(yùn)行的網(wǎng)頁代碼，甚至自動(dòng)匹配了高質(zhì)量圖片素材。這種“從草圖到產(chǎn)品”的能力，展示了模型對(duì)視覺信息的深度理解，它不僅能識(shí)別圓形代表按鈕、線條代表布局分隔，還能推斷設(shè)計(jì)意圖，理解“這是導(dǎo)航欄”“那是內(nèi)容區(qū)”，并匹配對(duì)應(yīng)的HTML、CSS和JavaScript代碼邏輯。

深入技術(shù)細(xì)節(jié)會(huì)發(fā)現(xiàn)，這種能力源于Qwen3.5的原生多模態(tài)架構(gòu)。與以往通過“視覺編碼器+語言模型”簡單拼接的方式不同，Qwen3.5在預(yù)訓(xùn)練階段就實(shí)現(xiàn)了文本與視覺的深度融合，使模型能同時(shí)理解像素級(jí)位置信息與語義層面的抽象概念。數(shù)據(jù)顯示，該模型的上下文窗口擴(kuò)展至100萬個(gè)token，可直接處理長達(dá)兩小時(shí)的視頻內(nèi)容，這意味著它能夠完整地觀看一部電影，并將劇情、人物關(guān)系、視覺風(fēng)格整理成文檔或代碼。這種跨模態(tài)的“全景”記憶能力，已經(jīng)遠(yuǎn)遠(yuǎn)超出人類單次處理的信息量。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.