快科技12月20日消息,在今天的首屆MUSA開發者大會上,摩爾線程正式發布了新一代GPU架構"花港",并帶來了首款基于"花港"的云端AI加速GPU"華山"。
![]()
"華山"芯片可應用于超十萬卡級的AI工廠,其搭載新一代Scale-up系統,兼容MTLink 4.0和多種以太協議,適配多種Scale-up switch,支持SHARP,片間互聯速率可達1314GB/s。
據介紹,KUAE萬卡群浮點運算能力可達10 Exa - FLOPS,精度模型效果優于國際主流,大模型MFU可達60%。
此外,集群有效訓練時長達到90%,零中斷技術理論可達99%,萬卡集群訓練線性度達到了95%,性價比更是達到HXX(H20)的1.5倍。
根據官方數據,在DeepSeek R1全量模型分布式推理性能方面,MTT S5000的PD分離-分布式集群, DeepSeek Prefill Only性能單卡吞吐達到H20的2.5倍,DeepSeek Decode單卡吞吐達到1.3倍。
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.