蛇年尾聲,阿里更強(qiáng)大的千問模型登場。
2月16日除夕當(dāng)天,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus。千問3.5在文本和視覺的混合數(shù)據(jù)上預(yù)訓(xùn)練,實(shí)現(xiàn)了原生多模態(tài)的新突破,在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異,并在視覺理解能力的權(quán)威評(píng)測中斬獲數(shù)項(xiàng)性能最佳。
![]()
Qwen3.5的核心突破在于從架構(gòu)層面系統(tǒng)性破解了大型模型的“效率-精度”悖論。通過混合注意力機(jī)制,模型實(shí)現(xiàn)了對(duì)長文本的動(dòng)態(tài)聚焦,告別了全量計(jì)算的算力浪費(fèi);而極致稀疏MoE架構(gòu)則以不足5%的激活參數(shù)調(diào)動(dòng)3970億總參數(shù)的知識(shí)儲(chǔ)備,將推理成本降至新低。
在效率躍升的同時(shí),原生多Token預(yù)測能力讓模型從“逐字蹦”進(jìn)階為“多步規(guī)劃”,響應(yīng)速度接近翻倍。通義團(tuán)隊(duì)斬獲NeurIPS最佳論文的注意力門控等系列穩(wěn)定性優(yōu)化,則為這些激進(jìn)創(chuàng)新提供了系統(tǒng)級(jí)保障,確保超大規(guī)模訓(xùn)練真正“跑得穩(wěn)”。這四大技術(shù)共同指向一個(gè)目標(biāo):用更少的算力,喚醒更強(qiáng)的智能。
千問APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。開發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型,或通過阿里云百煉直接獲取API服務(wù)。
![]()
性能媲美Gemini 3 Pro ,且極具性價(jià)比
據(jù)阿里介紹,阿里巴巴開源全新一代大模型千問Qwen3.5-Plus,性能媲美Gemini 3 Pro,登頂全球最強(qiáng)開源模型。千問3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過萬億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。
價(jià)格方面,Qwen3.5-Plus的API價(jià)格每百萬Token低至0.8元,僅為Gemini 3 pro的1/18。
![]()
四大技術(shù)突破:從架構(gòu)創(chuàng)新到系統(tǒng)穩(wěn)定
Qwen3.5的核心技術(shù)突破體現(xiàn)在四大創(chuàng)新維度。首先是混合注意力機(jī)制,它讓模型學(xué)會(huì)“有詳有略地讀”。傳統(tǒng)大模型處理長文本時(shí),每個(gè)token需與所有上下文進(jìn)行全量注意力計(jì)算,文本越長、算力消耗越大,這是制約長上下文能力的核心瓶頸。Qwen3.5通過動(dòng)態(tài)分配注意力資源,對(duì)重要信息精讀、對(duì)次要信息略讀,實(shí)現(xiàn)了效率與精度的同步提升。
其次是極致稀疏MoE架構(gòu)。傳統(tǒng)稠密模型每次推理需激活全部參數(shù),參數(shù)越多、算力成本越高。MoE架構(gòu)的創(chuàng)新在于根據(jù)輸入內(nèi)容僅激活最相關(guān)的“專家”子網(wǎng)絡(luò),而Qwen3.5將這一思路推向極致——以3970億總參數(shù)、僅激活170億參數(shù)的稀疏架構(gòu),實(shí)現(xiàn)用不足5%的算力調(diào)動(dòng)全部知識(shí)儲(chǔ)備,大幅降低推理成本。
![]()
第三是原生多Token預(yù)測能力。傳統(tǒng)模型采用逐token生成方式,推理效率受限。Qwen3.5在訓(xùn)練階段即學(xué)會(huì)對(duì)后續(xù)多個(gè)位置進(jìn)行聯(lián)合預(yù)測,使推理速度接近翻倍。這一“多步規(guī)劃”能力在長文本生成、代碼補(bǔ)全、多輪對(duì)話等高頻場景中,為用戶帶來接近“秒回”的響應(yīng)體驗(yàn)。
最后是系統(tǒng)級(jí)訓(xùn)練穩(wěn)定性優(yōu)化,確保上述架構(gòu)創(chuàng)新在超大規(guī)模訓(xùn)練中真正“跑得穩(wěn)”。以通義團(tuán)隊(duì)斬獲NeurIPS 2025最佳論文獎(jiǎng)的注意力門控機(jī)制為例,該機(jī)制在注意力層輸出端加入“智能開關(guān)”,像水龍頭一樣對(duì)信息流進(jìn)行智能調(diào)控——既防止有效信息被淹沒,也避免無效信息被過度放大,從而提升輸出精度與長上下文泛化能力。此外,歸一化策略優(yōu)化、專家路由初始化等深層改進(jìn),分別解決不同環(huán)節(jié)的穩(wěn)定性問題,共同保障模型在大規(guī)模訓(xùn)練中的穩(wěn)健運(yùn)行。
![]()
從“應(yīng)答”到“操作”的人機(jī)交互新范式
與傳統(tǒng)聊天機(jī)器人的本質(zhì)區(qū)別在于,Qwen3.5不再滿足于應(yīng)答交互。其搭載的視覺智能體能力,使其能夠像人類一樣“觀看”手機(jī)和電腦屏幕,精準(zhǔn)理解界面元素的位置與功能,并自主執(zhí)行操作。官方演示中,用戶僅需通過自然語言下達(dá)指令,模型即可在移動(dòng)端跨應(yīng)用完成任務(wù),或在PC端處理數(shù)據(jù)整理、多步驟流程自動(dòng)化等復(fù)雜工作,將人機(jī)協(xié)作推向全新維度。
這一能力的實(shí)現(xiàn),源于其先進(jìn)的視覺理解技術(shù)。Qwen3.5能夠精準(zhǔn)定位屏幕元素,識(shí)別按鈕、文本框、圖標(biāo)的坐標(biāo)與功能屬性,進(jìn)而模擬點(diǎn)擊、滑動(dòng)、輸入等操作。通過對(duì)屏幕內(nèi)容的視覺編碼與語義解析,AI真正具備了與數(shù)字世界交互的“視覺”與“手部”能力。用戶可根據(jù)需求選擇本地或云端部署,在計(jì)算效率與數(shù)據(jù)可控性之間靈活平衡。
跨應(yīng)用協(xié)作則是Qwen3.5的另一突破。演示場景中,模型能夠從郵件提取信息、讀取表格數(shù)據(jù)、再通過通訊軟件完成發(fā)送,這一系列操作打通了傳統(tǒng)應(yīng)用間的數(shù)據(jù)孤島,將多步驟流程自動(dòng)化變?yōu)楝F(xiàn)實(shí)。傳統(tǒng)應(yīng)用的隔離機(jī)制在AI智能體面前不再是障礙,因?yàn)樗浴坝脩舸怼钡纳矸莺戏ā⒏咝У貐f(xié)同各應(yīng)用,為用戶創(chuàng)造無縫的數(shù)字體驗(yàn)。這種從單一工具向全能數(shù)字助手的進(jìn)化,正為人機(jī)協(xié)作開辟全新的想象空間。
6分48秒,從一張草圖到一段代碼:Qwen3.5的“讀心術(shù)”有多強(qiáng)?
更令人驚嘆的是Qwen3.5所展現(xiàn)的視覺編程能力。在一段演示視頻中,用戶僅用手指了一個(gè)網(wǎng)頁界面的草圖,模型便在6分48秒內(nèi)將其轉(zhuǎn)化為結(jié)構(gòu)清晰、可直接運(yùn)行的網(wǎng)頁代碼,甚至自動(dòng)匹配了高質(zhì)量圖片素材。這種“從草圖到產(chǎn)品”的能力,展示了模型對(duì)視覺信息的深度理解,它不僅能識(shí)別圓形代表按鈕、線條代表布局分隔,還能推斷設(shè)計(jì)意圖,理解“這是導(dǎo)航欄”“那是內(nèi)容區(qū)”,并匹配對(duì)應(yīng)的HTML、CSS和JavaScript代碼邏輯。
![]()
深入技術(shù)細(xì)節(jié)會(huì)發(fā)現(xiàn),這種能力源于Qwen3.5的原生多模態(tài)架構(gòu)。與以往通過“視覺編碼器+語言模型”簡單拼接的方式不同,Qwen3.5在預(yù)訓(xùn)練階段就實(shí)現(xiàn)了文本與視覺的深度融合,使模型能同時(shí)理解像素級(jí)位置信息與語義層面的抽象概念。數(shù)據(jù)顯示,該模型的上下文窗口擴(kuò)展至100萬個(gè)token,可直接處理長達(dá)兩小時(shí)的視頻內(nèi)容,這意味著它能夠完整地觀看一部電影,并將劇情、人物關(guān)系、視覺風(fēng)格整理成文檔或代碼。這種跨模態(tài)的“全景”記憶能力,已經(jīng)遠(yuǎn)遠(yuǎn)超出人類單次處理的信息量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.