
隨著大模型的規模落地,AI發展的主戰場正從“模型訓練”轉向“行業推理”,解決推理效率瓶頸成為釋放AI產業價值的關鍵。近日,在由中國信息通信研究院組織的“存力中國行-北京站”活動中,華為數據存儲產品線副總裁樊杰在接受工信智媒體記者專訪時指出,AI大模型正從通用大模型向細分行業小模型滲透,數據的歸集、清洗、精調是關鍵,華為通過端到端的存儲技術方案,解決行業模型落地中的存力、運力、算力瓶頸,持續賦能千行百業。
![]()
華為數據存儲產品線副總裁樊杰(右)接受
工信智媒體總編劉啟誠(左)專訪
01
行業模型落地仍處于“爬坡階段”
當前,我國存力建設成效顯著,截至2024年底存力總規模已達1580EB,先進存儲占比28%,今年6月底更是增至1680EB,國產存儲在技術研發與產業應用上已具備領先實力。但行業模型的落地仍處于“爬坡階段”,高質量數據集建設、數據可信流通、跨行業應用適配等諸多領域仍需探索。
樊杰表示,與覆蓋廣泛場景、參數量動輒數十億甚至上百億的通用大模型不同,行業模型聚焦細分領域深耕細作,比如人臉識別模型的參數量僅需3B~10B,卻能在專屬場景中實現高精度應用。這種“小而專”的特性,決定了行業模型必須依賴高質量的行業數據進行訓練與精調,而數據的存取、管理與高效利用,成為行業模型落地見效的核心關鍵。
據悉,模型發展中數據處理有三個關鍵階段。
匯集階段:打破孤島,構建AI數據湖
這一階段的核心是將分散在多園區、多院區、多數據中心的異構數據進行數字化、標準化匯聚。這些數據格式各異、存儲分散,形成了“數據孤島”。要讓行業模型獲得充足的訓練素材,就必須打破這些壁壘,將各類數據歸集形成統一的“AI數據湖”,為后續的模型訓練奠定基礎。
訓練階段:突破瓶頸,提升算力利用率
數據匯集后,需經過清洗、加載、訓練、存檔的反復循環過程。傳統存儲方式難以應對這一階段的高頻數據讀寫需求,導致GPU或NPU的利用率僅能達到30%左右,70%的時間都在等待數據加載與存檔,形成了“算力閑置”的浪費。此時,單純堆砌算力已無濟于事,必須通過高性能的存儲與高速運力網絡,解決數據“供給不暢”的問題。
推理階段:優化體驗,實現高效實用
訓練成熟的模型進入實際應用后,推理階段的性能直接決定用戶體驗與商業價值。如今的推理場景已從簡單的短句問答,轉向長文檔分析、復雜業務決策等需求,比如讓AI通讀上萬字的博士論文或上百頁的醫療案卷。這不僅要求模型具備超長文本處理能力,還需解決響應延遲、并發處理、重復計算等問題,讓AI真正成為行業從業者的得力助手。
02
華為端到端解決方案:
破解全流程痛點
針對行業模型落地的核心需求,華為推出了覆蓋數據全生命周期的組合解決方案,從語料匯集到推理應用,全方位提升效率、降低成本。
比如在語料歸集環節,華為可提供AI數據服務,幫助行業客戶高效整合異構數據,打破數據孤島,實現數據的標準化與統一管理,為模型訓練提供高質量、高可用的“原料”。
在訓練階段,華為推出OceanStor A800、OceanStor A600等高性能AI存儲產品,憑借極致的性能表現破解訓練瓶頸。其中,OceanStor A800在MLPerf Storage V1.0基準測試中,以整系統性能、單機性能和單位空間性能三項指標全球第一的成績,成為全球AI數據存儲領域的標桿產品。通過這一系列高性能存儲方案,模型訓練的算力利用率從30%提升至60%,大幅縮短了訓練周期,減少了算力空轉浪費。
在推理階段,華為的“雙引擎”——UCM推理記憶數據管理技術與AI SSD,構建了軟硬件協同的優化方案,系統性解決了“內存墻”與“容量墻”難題。
據介紹,UCM并非簡單的緩存,而是智能的數據調度與管理系統,通過三大核心特性實現推理加速:一是連接生態,提供插件式靈活對接多樣引擎與多元算力;二是記憶管理,通過KV Cache動態多級管理,系統化創新加速算法;三是存儲協同,高性能數據直通與PB級容量分級,實現KV記憶數據卸載。
作為硬件支撐,華為AI SSD并非通用存儲,而是為AI工作負載深度優化的專用硬件。其中OceanDisk SP 560高性能盤的隨機寫性能最高可達1500K IOPS,隨機寫時延低于7μs,為推理數據提供極速讀寫通道。它與UCM協同構建HBM-DRAM-AI SSD三級緩存架構,將非活躍的KVCache從昂貴的顯存智能卸載至大容量AI SSD中,使推理序列長度提升2.5倍,讓模型具備處理超長文本的記憶能力。
對于不同規模的推理場景,華為方案也具備靈活適配性,比如邊緣場景如縣級醫院的小型推理需求,僅需在服務器中掛載幾塊高性能AI SSD即可滿足;大型推理場景則可采用AI存儲整機,保障大規模并發處理能力。
03
開源與生態:
推動AI推理技術普惠落地
為降低行業應用門檻,華為已將UCM核心技術在魔擎社區正式開源并在GitHub上開放下載。這一舉措不僅讓廣大開發者和企業能以更低成本、更便捷的方式獲得領先的AI推理加速能力,更推動了推理加速領域的技術標準化與接口統一,避免生態碎片化,為全產業協同創新搭建了開放平臺。
在開源基礎上,華為將進一步完善數據存儲、數據管理、AI工具鏈以及資源管理的全鏈條能力,以平臺化賦能千行百業。同時,華為也積極參與“先進存力AI推理工作組”,與產業鏈伙伴共同推進技術研究、方案落地、標準制定與生態構建,凝聚產業合力。
AI時代的到來,讓數據從“成本”轉變為“核心資產”,高質量數據的留存率大幅提升,為存儲產業帶來了蓬勃發展的機遇。未來,隨著技術的持續迭代與生態的不斷完善,存力將成為支撐金融、電信、醫療、能源等行業轉型升級的關鍵力量。華為將持續以技術創新與開放合作,降低AI推理應用門檻,讓高效、經濟的AI推理能力走進更多細分場景,助力千行百業實現智能化轉型,釋放AI產業的真正價值。
![]()
安世風波引發汽車缺芯浪潮,聞泰或將取得主動權?
沒有5G-A通感,低空經濟還能“飛”起來嗎?
比5G更快的5G-A,到底到“A”在哪兒?
作者:劉啟誠
責編/版式:王禹蓉
審校:王 濤 梅雅鑫
監制:劉啟誠
【通信世界新媒體矩陣】
央視頻 | 微軟MSN | 視頻號 | 微博 | 今日頭條 | 百家號 | 網易號 | 人民號 | 騰訊新聞
搜狐 | 新浪看點 | 雪球號 | 抖音 | 快手 | 愛奇藝 | 知乎 | 嗶哩嗶哩 | 咪咕視頻 |CSDN
【新媒體團隊】
監制|劉啟誠
審校|王濤 梅雅鑫 張鵬
編輯|王禹蓉
視頻制作|蔣雅麗 黃楊洋




特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.