![]()
(AI云資訊消息)在智能體AI環境中,最大的瓶頸之一是查詢處理會生成名為KV緩存的龐大臨時內存日志以構建上下文,目前這些數據存儲在高帶寬內存(HBM)模塊中。然而,考慮到AI集群數據需求的爆炸式增長,HBM已無法承載其容量,這正是英偉達在2026年國際消費電子展上宣布將Bluefield-4數據處理器連接至新型存儲解決方案“推理內存上下文存儲”(ICMS)的原因。這項技術將極大提升數據處理能力,但也可能引發類似內存短缺的供應鏈緊張。
花旗銀行分析指出,英偉達單個Vera Rubin系統可為機架內每塊GPU配置約16TB的NAND閃存,在NVL72架構下單機柜容量達1,152TB。據花旗預估,到2027年Vera Rubin系統出貨量可能攀升至10萬臺。這意味著僅英偉達一家企業對NAND存儲的需求就可能激增至1.152億TB,相當于未來幾年全球NAND預估總需求的9.3%。搭載ICMS存儲方案的Vera Rubin系統,或將引發NAND產業尚未預見的供應鏈緊張。
可以說,在AI廠商持續追求卓越計算能力的背景下,NAND行業很可能面臨與當前內存類似的供應緊張局面。對普通消費者而言,獲取通用固態硬盤和存儲設備或將面臨新一輪挑戰。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.