4月24日,DeepSeek-V4模型正式發布并開源,華為云首發適配。針對DeepSeek-V4,華為云首發適配模型分層注意力壓縮機制,實現V4注意力機制下KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇騰高性能融合算子,搭配框架異步調度、MTP多步投機等框架優化,支持原生1M長上下文的高性能推理。當前,華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4-Flash API的Tokens服務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.