IT之家 1 月 21 日消息,軟銀公司宣布旗下 Infrinia 團隊正式開發完成面向未來 AI 數據中心的軟件平臺“Infrinia AI Cloud OS”。
軟銀指出,隨著生成式 AI、自動化機器人、仿真計算、藥物研發以及新材料開發等領域對 GPU 加速算力的需求持續快速增長,當下 AI 計算的使用場景和需求形態正變得愈發多樣和復雜。為應對這些挑戰,軟銀旗下 Infrinia 團隊開發了 Infrinia AI Cloud OS,目標是在充分釋放 GPU 性能的同時,實現先進 GPU 云服務的快速部署與高效運維。
![]()
具體來說,Infrinia AI Cloud OS 可幫助 AI 數據中心運營方在多租戶環境中以較低成本構建 AI 服務體系,相應軟件平臺將率先部署在公司自有的 GPU 云服務中,未來計劃將其推廣至海外數據中心和云環境,推動在全球范圍內的落地應用。
在功能層面,Infrinia AI Cloud OS 提供完整的 Kubernetes 即服務能力,可在包括英偉達 GB200 NVL72 在內的 GPU 平臺上,對從 BIOS、RAID、操作系統、GPU 驅動、網絡,到 Kubernetes 控制器與存儲在內的整個技術棧進行自動化管理,大幅降低基礎設施和平臺層的運維復雜度。
同時,該系統支持基于軟件定義的動態物理互聯與內存重構能力,能夠在用戶創建、更新或刪除集群時,按需實時調整連接方式和跨節點內存配置,并依據 GPU 拓撲結構與 NVLink 域進行自動節點分配,以降低延遲并最大化 GPU 間帶寬,適用于大規模分布式 AI 任務。
官方同時強調,Infrinia AI Cloud OS 還針對多租戶場景提供了高安全性與高可運維性設計,通過加密的集群通信與隔離機制實現租戶級安全防護,并對系統監控、故障切換等運維工作進行自動化。同時平臺還提供了 API 接口,便于與 AI 數據中心門戶、客戶管理系統以及計費系統對接。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.