北京商報訊(記者 陶鳳 王天逸)4月24日,摩爾線程發文宣布,團隊攜手智源眾智FlagOS社區,在旗艦級AI訓推一體全功能GPU MTT S5000上,率先實現對新一代大模型DeepSeek-V4-Flash的Day-0極速適配,并完成了全量核心算子的深度優化與部署支持。
據稱,DeepSeek-V4-Flash 采用混合專家(MoE)架構,總參數量高達284B,激活參數13B,支持百萬token上下文長度。其預訓練數據超32Ttoken,在最大推理力度模式(Flash-Max)下推理能力逼近Pro版本。V4模型首次采用"FP4+FP8"混合精度策略,而當前國內主流 AI 芯片仍普遍以BF16為主,摩爾線程憑借獨特的原生FP8支持優勢,能夠更高效承載 DeepSeek-V4 的前沿精度設計,為模型部署與推理優化提供了堅實的算力底座。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.