為持續推動尖端AI模型創新發展,英特爾與業界創新力量深度協作,成果斐然。近日,全新升級的英特爾AI解決方案全面覆蓋PC客戶端、邊緣計算、智能駕艙等場景,并第一時間助力阿里巴巴新一代通義千問Qwen3系列大模型發布。
![]()
Qwen3系列大模型五大亮點閃耀
稀疏MoE模型優化:深度優化稀疏MoE模型,讓Qwen3在端側實現高效部署,為端側應用帶來更多可能
NPU Day 0支持:首次在NPU上實現Day 0支持大模型,顯著提升性能并降低功耗,為模型運行提供更優平臺
端側微調升級:通過端側微調技術,提升模型智能水平,全方位優化用戶體驗,讓AI更懂用戶需求
動態稀疏注意力賦能:動態稀疏注意力機制賦予Qwen3長上下文窗口能力,解鎖端側Agent新應用,拓展AI應用場景
擁抱開源生態:積極擁抱開源生態,Day 0支持魔搭社區Ollama
Qwen3系列中,30B參數規模的MoE混合專家模型(Qwen3-30B-MOE-A3B)備受矚目。其先進的動態可調混合專家架構大幅提升了計算效率,在本地設備上應用前景廣闊。然而,部署難度大、系統資源消耗高成為制約因素。
為此,英特爾與阿里緊密合作,針對MoE模型展開全面技術適配。借助OpenVINOTM工具套件,成功將Qwen模型高效部署于英特爾硬件平臺。在ARL-H 64G內存系統上,30B參數MoE模型實現33.97 token/s的吞吐量,較同等參數稠密模型有突出的性能提升。英特爾采用的軟件優化策略涵蓋算子融合、定制化調度和訪存優化以及負載均衡,為更多MOE模型在英特爾平臺高效部署提供有力支持。
![]()
此次發布的Qwen3系列模型,還聚焦中小參數量稠密架構LLM,參數規模從0.6B至32B不等,可適配更廣泛的硬件資源,滿足多樣化使用場景需求。英特爾CPU、GPU、NPU架構全面適配Qwen系列模型,通過OpenVINOTM工具套件和PyTorch社區工具,為全系列Qwen模型在英特爾酷睿Ultra平臺(酷睿Ultra 100系列/200系列)和英特爾銳炫A/B系列顯卡上的部署提供卓越性能保障。
在酷睿Ultra的iGPU平臺上,英特爾持續為模型帶來卓越性能。針對小尺寸模型,FP16精度下最高達66 token/s;針對中小尺寸模型,INT4精度下最高達35.83 token/s。開發者可根據使用場景,靈活選擇精度和性能的最佳組合。在英特爾銳炫B系列顯卡強大算力加持下,Qwen3-8B模型可實現70.67 token/s。
當然,面對有限算力資源,英特爾基于動態稀疏注意力,在保證近乎無損精度的前提下,使長上下文窗口處理速度成倍提升。Qwen3-8B模型在英特爾LNL平臺上可實現32K的上下文長度,解鎖了更多端側Agent新應用。
![]()
結合Qwen3更強的Agent和代碼能力,以及對MCP協議的加強支持,基于端側大模型調用MCP服務開發各種AI PC Agent成為可能。
![]()
![]()
而在端艙內,基于英特爾車載軟硬件解決方案,包括第一代英特爾AI增強軟件定義汽車(SDV)SOC、第二代SDV SoC NPU以及英特爾銳炫?車載獨立顯卡,Qwen3系列模型有望快速上車部署,充分發揮車端本地算力。其中,第二代SDV SOC率先采用多節點芯粒架構,生成式和多模態AI性能相比上一代最高提升十倍,讓汽車AI體驗如艙內實時對話、自然語言交互和復雜指令響應等充滿AI靈性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.