一、AI算力的核心需求特征
AI模型,特別是Transformer類(lèi)大模型(如DeepSeek、GPT、LLM),對(duì)芯片架構(gòu)提出了幾項(xiàng)極端要求:
大規(guī)模并行計(jì)算能力:核心操作是矩陣乘(GEMM)和張量運(yùn)算,需要千萬(wàn)級(jí)MAC單元并行;
超高內(nèi)存帶寬:模型參數(shù)巨大,權(quán)重和激活頻繁讀寫(xiě);
確定性數(shù)據(jù)流:AI計(jì)算圖結(jié)構(gòu)相對(duì)固定,可通過(guò)靜態(tài)優(yōu)化獲得高吞吐;
計(jì)算/通信比高(Compute-to-Communication Ratio):需要高效互連支撐多芯片集群。
傳統(tǒng)GPU(如NVIDIA H100)通過(guò)大規(guī)模SIMD陣列 + 高帶寬HBM + NVLink互連應(yīng)對(duì)這些挑戰(zhàn)。而可重構(gòu)架構(gòu)的核心優(yōu)勢(shì)——靈活性,恰恰與“固定大規(guī)模數(shù)據(jù)流”的AI算力場(chǎng)景存在矛盾。
二、可重構(gòu)架構(gòu)的特征與瓶頸 1. 數(shù)據(jù)流可重構(gòu) ≠ 高吞吐
可重構(gòu)芯片(CGRA、FPGA)主要依靠“可編程互連”和“邏輯塊”來(lái)動(dòng)態(tài)配置數(shù)據(jù)流。但:
互連開(kāi)銷(xiāo)巨大:數(shù)據(jù)流通路需要大量開(kāi)關(guān)矩陣(switch box),其面積和功耗隨規(guī)模呈平方增長(zhǎng);
配置延遲:重構(gòu)時(shí)需要重新映射計(jì)算單元,導(dǎo)致pipeline難以持續(xù)高效運(yùn)行;
吞吐稀釋:相比固定矩陣陣列(如GPU Tensor Core),同面積下的可重構(gòu)陣列有效計(jì)算單元利用率通常只有40~60%。
因此,在AI訓(xùn)練這種固定計(jì)算圖、重復(fù)性極高的場(chǎng)景中,可重構(gòu)能力反而成為冗余負(fù)擔(dān)。
2. 存儲(chǔ)與帶寬受限
AI大模型動(dòng)輒上千億參數(shù),對(duì)內(nèi)存帶寬要求極高。
而CGRA通常采用片上SRAM或LPDDR等外部存儲(chǔ):
SRAM面積大、帶寬低于HBM;
可重構(gòu)互連消耗布線資源,進(jìn)一步壓縮了可用于數(shù)據(jù)通路和緩存的面積;
即便采用3D封裝,其帶寬密度仍遠(yuǎn)低于GPU的多堆棧HBM3方案。
結(jié)果:存儲(chǔ)墻(Memory Wall)成為AI算力瓶頸,即使算力標(biāo)稱(chēng)TOPS高,也無(wú)法持續(xù)喂?jié)M計(jì)算單元。
3. 面積與功耗不可線性擴(kuò)展
由于互連矩陣和配置寄存器占用大量硅面積,可重構(gòu)架構(gòu)的“有效計(jì)算陣列密度”較低。當(dāng)你試圖擴(kuò)大陣列以匹配AI算力需求時(shí),會(huì)遇到:
面積爆炸(布線資源不夠);
功耗激增(信號(hào)穿越互連矩陣時(shí)能耗高);
時(shí)鐘頻率受限(跨模塊信號(hào)延遲過(guò)大)。
這意味著可重構(gòu)架構(gòu)很難像GPU/TPU那樣堆疊上千TOPS的計(jì)算陣列而保持高頻。
4. 生態(tài)與軟件棧適配難度大
AI算力的生態(tài)(PyTorch、TensorRT、CUDA、Triton)高度依賴(lài)GPU的SIMD結(jié)構(gòu)和張量指令集。而CGRA的可重構(gòu)單元缺乏統(tǒng)一編譯模型,需要:
手動(dòng)映射數(shù)據(jù)流;
重新定義算子庫(kù);
優(yōu)化編譯器進(jìn)行調(diào)度和互連映射。
維度
可重構(gòu)架構(gòu)優(yōu)勢(shì)
對(duì)AI算力的劣勢(shì)
靈活性
可針對(duì)多算法配置數(shù)據(jù)流
AI計(jì)算固定、靈活性浪費(fèi)資源
帶寬
支持一定片上復(fù)用
無(wú)法匹敵HBM帶寬需求
面積效率
支持中小規(guī)模陣列
互連占比過(guò)高,面積利用率低
能效
中等(低頻高復(fù)用)
在高并行大吞吐場(chǎng)景下效率反而下降
生態(tài)
定制算法適配性強(qiáng)
與主流AI框架脫節(jié),編譯復(fù)雜
可擴(kuò)展性
適合端側(cè)、邊緣推理
不適合大規(guī)模訓(xùn)練/推理集群
歡迎加入半導(dǎo)體學(xué)習(xí)社區(qū),每天了解一點(diǎn)知識(shí)。
歡迎加入行業(yè)交流群,備注崗位+公司,請(qǐng)聯(lián)系老虎說(shuō)芯
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.