財(cái)聯(lián)社3月25日訊(編輯 史正丞)周三美股開(kāi)盤后,在大盤情緒尚可的背景下,存儲(chǔ)板塊卻反向走弱。截至發(fā)稿,美光科技跌3.57%、閃迪跌4.12%,西部數(shù)據(jù)和希捷科技也一同下跌。
![]()
(美光科技日線圖,來(lái)源:TradingView)
對(duì)于今日的市場(chǎng)異動(dòng),有多處信源均將矛頭指向了谷歌。AI巨頭早些時(shí)候推出了一種可能降低人工智能系統(tǒng)內(nèi)存需求的壓縮算法TurboQuant。
![]()
(來(lái)源:谷歌研究)
根據(jù)谷歌介紹,TurboQuant壓縮技術(shù)旨在降低大語(yǔ)言模型和向量搜索引擎的內(nèi)存占用。該算法主要針對(duì)AI系統(tǒng)中用于存儲(chǔ)高頻訪問(wèn)信息的鍵值緩存(key-value cache)瓶頸問(wèn)題。隨著上下文窗口變大,這些緩存正成為主要的內(nèi)存瓶頸。
TurboQuant可在無(wú)需重新訓(xùn)練或微調(diào)模型的情況下,將鍵值緩存壓縮至3bit精度,同時(shí)基本保持模型準(zhǔn)確率不受影響。對(duì)包括Gemma、Mistral等開(kāi)源模型的測(cè)試顯示,該技術(shù)可實(shí)現(xiàn)約6倍的鍵值緩存內(nèi)存壓縮效果。
![]()
此外,在英偉達(dá)H100加速器上的測(cè)試結(jié)果顯示,與未量化的鍵向量相比,該算法最高可實(shí)現(xiàn)約8倍性能提升。研究人員也表示,這項(xiàng)技術(shù)的應(yīng)用不局限于AI模型,還包括支撐大規(guī)模搜索引擎的向量檢索能力。
谷歌計(jì)劃于4月的國(guó)際學(xué)習(xí)表征會(huì)議(ICLR 2026)上展示TurboQuant技術(shù)。
不難看出,雖然該技術(shù)的應(yīng)用前景目前仍需要打一個(gè)問(wèn)號(hào),但市場(chǎng)已經(jīng)開(kāi)始交易內(nèi)存需求前景轉(zhuǎn)變的預(yù)期。
對(duì)于最新變化,富國(guó)銀行TMT分析師Andrew Rocha解讀稱:“隨著上下文窗口不斷擴(kuò)大,KV緩存中的數(shù)據(jù)存儲(chǔ)規(guī)模呈爆炸式增長(zhǎng),從而推高對(duì)內(nèi)存容量的需求。而TurboQuant正是在直接壓縮這一成本曲線。如果該技術(shù)能夠得到廣泛采用,這對(duì)內(nèi)存成本曲線而言將是利好。”
Rocha同時(shí)表示,這項(xiàng)技術(shù)可能影響未來(lái)對(duì)內(nèi)存容量規(guī)格的需求判斷。
他寫道:“如果實(shí)現(xiàn)這些AI應(yīng)用所需的內(nèi)存規(guī)格被顯著降低,那么市場(chǎng)很快就會(huì)重新評(píng)估究竟還需要多少內(nèi)存容量。”
不過(guò)Rocha也指出,目前仍不清楚該技術(shù)是否僅適用于谷歌自身體系,或能否推廣至其他AI實(shí)驗(yàn)室。此外,實(shí)驗(yàn)室環(huán)境下的測(cè)試結(jié)果是否能夠順利轉(zhuǎn)化為真實(shí)生產(chǎn)環(huán)境中的應(yīng)用表現(xiàn),也仍存在不確定性。
值得一提的是,作為攪動(dòng)存儲(chǔ)板塊的事主,谷歌也沒(méi)撈著什么好處。公司股價(jià)在周三一度跌破290美元,據(jù)2月初創(chuàng)下的349美元?dú)v史高點(diǎn)已經(jīng)回撤近17%,距離20%的關(guān)鍵心理位置也只有咫尺之遙。
![]()
(谷歌-A日線圖,來(lái)源:TradingView)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.