周三美股存儲板塊全線走弱,美光科技錄得日線 “5連跌”,閃迪、西部數據、希捷同步下跌,市場普遍將此次異動,歸因于AI巨頭谷歌此前發布的新型內存壓縮算法TurboQuant。
![]()
據谷歌研究團隊披露,TurboQuant技術核心瞄準大語言模型與向量搜索引擎的內存占用痛點,專門解決AI系統中鍵值緩存(KV緩存)隨上下文窗口擴大形成的核心內存瓶頸。該技術無需對模型進行重新訓練或微調,即可將KV緩存壓縮至3bit精度,同時基本不影響模型準確率。
測試數據顯示,TurboQuant對Gemma、Mistral等開源模型可實現約6倍的KV緩存內存壓縮效果,在英偉達H100加速器上,相較未量化的鍵向量最高能實現8倍的性能提升,其應用場景還可延伸至支撐大規模搜索引擎的向量檢索領域。谷歌計劃在4月舉辦的國際學習表征會議(ICLR 2026)上正式展示這項技術。
盡管技術落地前景仍存未知數,但市場已提前交易AI內存需求前景轉變的預期。富國銀行TMT分析師Andrew Rocha解讀稱,KV緩存是推高AI內存需求的核心因素,TurboQuant直接壓縮了相關成本曲線,若該技術廣泛應用,市場將重新評估AI所需的內存容量規模。不過其同時指出,該技術能否從谷歌自身體系推廣至全行業、實驗室成果能否順利落地生產環境,目前仍存在較大不確定性。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.