《科創(chuàng)板日?qǐng)?bào)》2月12日訊 隨著AI計(jì)算對(duì)內(nèi)存需求不斷擴(kuò)大,全球存儲(chǔ)技術(shù)創(chuàng)新也進(jìn)入“加速期”。
據(jù)韓國(guó)經(jīng)濟(jì)日?qǐng)?bào)報(bào)道,SK海力士近日在IEEE(電氣與電子工程師協(xié)會(huì))全球半導(dǎo)體大會(huì)上發(fā)表論文,提出了一種全新的存儲(chǔ)架構(gòu)。據(jù)悉,該架構(gòu)名為“H3(hybrid semiconductor structure)”,同時(shí)采用了HBM和HBF兩種技術(shù)。
在SK海力士設(shè)計(jì)的仿真實(shí)驗(yàn)中,H3架構(gòu)將HBM和HBF顯存并置于GPU旁,由GPU負(fù)責(zé)計(jì)算。該公司將8個(gè)HBM3E和8個(gè)HBF置于英偉達(dá)Blackwell GPU旁,結(jié)果顯示,與單獨(dú)使用HBM相比,這種配置可以將每瓦性能提升高達(dá)2.69倍。
![]()
圖源:SK海力士
實(shí)驗(yàn)結(jié)果顯示,H3架構(gòu)在AI推理領(lǐng)域尤其具有優(yōu)勢(shì)。推理的核心是鍵值緩存 (KV cache),它用于臨時(shí)存儲(chǔ)數(shù)據(jù),以理解 AI 服務(wù)與用戶之間交互的流程和“上下文”。然而,隨著 AI 性能的提升,KV緩存容量不斷增長(zhǎng),以至于HBM和GPU逐漸應(yīng)接不暇。
因此,HBF被視作上述架構(gòu)的核心。與堆疊DRAM芯片的HBM類似,HBF通過堆疊NAND閃存而制成。被稱作“HBM之父”的韓國(guó)科學(xué)技術(shù)院(KAIST)教授金正浩類比道,HBM與HBF就好比書房與圖書館。前者容量雖小,但使用起來方便;后者容量更大,但也意味著延遲更高。
通過在HBF中存儲(chǔ)KV緩存,GPU和HBM可以減輕存儲(chǔ)KV緩存的負(fù)擔(dān),從而專注于它們?cè)诟咚儆?jì)算和創(chuàng)建新數(shù)據(jù)方面的優(yōu)勢(shì)。SK海力士模擬了HBF處理高達(dá)1000萬個(gè)令牌的海量鍵值緩存的場(chǎng)景,結(jié)果表明,與僅使用HBM的配置相比,該系統(tǒng)處理并發(fā)查詢的能力提升了高達(dá)18.8倍。以前需要32個(gè)GPU才能完成的工作負(fù)載,現(xiàn)在只需兩個(gè)GPU即可完成。
從產(chǎn)業(yè)層面來看,SK海力士、三星、閃迪等均在推進(jìn)HBF技術(shù)研發(fā)。SK海力士計(jì)劃最早于今年推出HBF1(第一代產(chǎn)品)樣品,該產(chǎn)品預(yù)計(jì)采用16層NAND閃存堆疊而成。三星電子和閃迪則計(jì)劃最快在2027年底或2028年初將HBF技術(shù)應(yīng)用于英偉達(dá)、AMD和谷歌的實(shí)際產(chǎn)品中。
廣發(fā)證券認(rèn)為,當(dāng)前大模型的參數(shù)規(guī)模已經(jīng)達(dá)到萬億級(jí)別,上下文長(zhǎng)度普遍超過128K,HBM的容量已難以滿足AI大模型對(duì)于內(nèi)存容量的要求。在研的HBF存儲(chǔ)容量有望達(dá)到現(xiàn)有HBM的8至16倍,有望將GPU的存儲(chǔ)容量擴(kuò)展至4TB,或成為滿足AI大模型內(nèi)存容量要求的最佳方案。
東方證券表示,利基存儲(chǔ)不僅是存量市場(chǎng),更是增量市場(chǎng),AI需求有望為利基存儲(chǔ)打開增量空間。SLC NAND有望應(yīng)用于AI SSD產(chǎn)品,以高效處理AI推理中的數(shù)據(jù);SLC NAND未來也可能應(yīng)用在HBF(高帶寬閃存)中。利基存儲(chǔ)產(chǎn)能持續(xù)被主流存儲(chǔ)擠壓,漲價(jià)有望持續(xù)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.