4月24日,DeepSeek-V4模型正式發布并開源,華為云首發適配。DeepSeek-V4 擁有百萬Token超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。
![]()
其中,DeepSeek-V4-Flash模型參數下降至284B,推理成本進一步降低,模型參數和激活更小,V4-Flash 能夠提供更加快捷、經濟的 API 服務,實現百萬上下文普惠。當前,華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4 -Flash API的Tokens服務。企業也可通過華為云魔坊(ModelArts)模型訓推平臺,一鍵完成推理服務部署上線。
華為云碼道(CodeArts)代碼智能體與OfficeClaw辦公智能體,現已接入DeepSeek新模型,限邀免費體驗。同時,用戶可通過華為云AgentArts智能體開發平臺,基于DeepSeek快速搭建專屬智能體或通過在華為云Flexus上部署的OpenClaw、Hermes Agent調用,進一步釋放模型能力。
在此次新模型適配過程中,華為云在系統層、算子層和集群層的關鍵能力上協同,分別從調度效率、計算效率和數據流轉效率三個維度保障新模型快速適配與高性能落地。
針對DeepSeek-V4,華為云首發適配模型分層注意力壓縮機制,實現V4注意力機制下 KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇騰高性能融合算子,搭配框架異步調度、MTP多步投機等框架優化,支持原生1M長上下文的高性能推理。DeepSeek V4通過超節點高帶寬網絡互聯,重新設計PD分離模塊,實現KVCache高效傳輸,支持DeepSeek-V4 模型推理性能達成業界領先,實測4P(Prefill)1D(Decode)部署形態下,CloudMatrix 384單卡Decode吞吐可達3300TPS。
華為云以高效的AI基礎設施為核心打造“硅基黑土地”,開放接納自研和第三方主流大模型和眾多智能體,為企業解難題,提升生產效率。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.