據(jù)報(bào)道,11月21日,華為即將發(fā)布一項(xiàng)AI領(lǐng)域的突破性技術(shù),將GPU、NPU等算力資源的利用率從行業(yè)平均的30%-40%一舉提升至70%。在AI大模型軍備競(jìng)賽日益燒錢的當(dāng)下,這一數(shù)字若能實(shí)現(xiàn),可能標(biāo)志著AI基礎(chǔ)設(shè)施的構(gòu)建思路的改變。
華為魔法曝光,英偉達(dá)AMD被聯(lián)手?
長(zhǎng)期以來,AI算力集群面臨資源利用率低下痛點(diǎn)。不同框架、不同任務(wù)、不同硬件(如GPU與NPU)之間難以高效協(xié)同,導(dǎo)致大量寶貴的算力在等待、調(diào)度中被閑置。
據(jù)分析,華為此次的殺手锏是軟件創(chuàng)新。它旨在通過軟件平臺(tái),實(shí)現(xiàn)對(duì)英偉達(dá)GPU、華為自家昇騰NPU及其他第三方算力的統(tǒng)一資源管理與利用。
![]()
其本質(zhì),是構(gòu)建一個(gè)“算力抽象層”。在AI模型看來,底層的硬件差異被徹底“屏蔽”,只有一個(gè)統(tǒng)一的、高效的資源池可供調(diào)用。這使得AI訓(xùn)練和推理的資源支撐變得前所未有的高效。
英偉達(dá)格局小了,華為通吃全場(chǎng),誰的卡都能用
在提升資源效率的賽道上,英偉達(dá)是先行者。其收購(gòu)的Run:ai平臺(tái),通過動(dòng)態(tài)資源調(diào)度與智能化管理,已在優(yōu)化GPU利用率方面取得了顯著成效。NVIDIA Run:ai的核心優(yōu)勢(shì)在于對(duì)NVIDIA自家生態(tài)內(nèi)的資源進(jìn)行精細(xì)化編排,無論在公有云還是本地?cái)?shù)據(jù)中心,都表現(xiàn)出色。
![]()
然而,華為的技術(shù)似乎展現(xiàn)了更大的“野心”,其關(guān)鍵詞是“泛用性”。
如果說Run:ai是在“英偉達(dá)生態(tài)”內(nèi)做到了極致優(yōu)化,那么華為則試圖建立一個(gè)“跨生態(tài)”的“聯(lián)合國(guó)”。報(bào)道中明確提及GPU和NPU,這強(qiáng)烈暗示該技術(shù)不僅服務(wù)于華為昇騰,更致力于將不同廠商的算力“兼容并包”。
混合訓(xùn)練\推理,萬卡集群不再難,AI平權(quán)時(shí)代要來了
這種“泛用性”的真正價(jià)值,可能在于實(shí)現(xiàn)了高效的混合訓(xùn)練/推理。
在當(dāng)前的行業(yè)實(shí)踐中,為了保證集群穩(wěn)定性和效率,絕大多數(shù)訓(xùn)練/推理集群都由同一種型號(hào)的計(jì)算卡構(gòu)成。但這并非最優(yōu)解。
以大模型推理為例,其過程可大致分為Prefill和Decode兩個(gè)階段:
Prefill階段計(jì)算量大,對(duì)算力要求高。理論上,使用大算力、配GDDR或LPDDR的計(jì)算卡即可實(shí)現(xiàn)高性價(jià)比。
Decode階段計(jì)算量小,但頻繁讀寫緩存,對(duì)顯存帶寬極為敏感。理論上,使用高帶寬、算力不必頂尖的“帶寬卡”效率最高。
![]()
華為此前已在昇騰CANN 8.0基于LLM P-D分離部署方案發(fā)布LLM-DataDist組件,如果華為的新技術(shù)能將這兩種不同品牌的卡(例如,A卡負(fù)責(zé)Prefill,B卡負(fù)責(zé)Decode)高效地協(xié)同起來,進(jìn)行混合調(diào)度,就能將不同硬件的優(yōu)勢(shì)發(fā)揮到極致。
它打破了構(gòu)建大規(guī)模算力集群必須依賴單一品牌、單一型號(hào)芯片的昂貴門檻。
未來,一個(gè)AI數(shù)據(jù)中心或許可以同時(shí)部署華為昇騰、英偉達(dá)、AMD,乃至國(guó)內(nèi)的寒武紀(jì)、摩爾線程等不同品牌的GPU/NPU,并通過華為的這套軟件系統(tǒng)將其協(xié)同作戰(zhàn)。
這不僅極大地盤活了存量硬件資產(chǎn),更從根本上降低了組網(wǎng)成本和對(duì)特定供應(yīng)商的依賴。對(duì)整個(gè)AI行業(yè)而言,這無疑是一次意義重大的技術(shù)賦能與行業(yè)利好。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.