![]()
從技術路徑、算力密度、降溫方向(液冷)到服務方案,服務器行業有了翻天覆地的變化。它不再是一個“裝滿顯卡的鐵盒子”,而是一個集芯片、互聯、散熱、軟件于一體的復雜系統。
文|劉青青
ID | BMR2004
當AI從“會聊天”走向“能辦事”,算力的評價標準徹底變了。
2026年新年剛過,OpenClaw在全球掀起了智能體應用的旋風,同時也引爆了Token需求焦慮——不同于傳統對話式AI,OpenClaw這類自主智能體需要指數級增長的Token消耗。
IDC數據指出,到2030年,全球活躍AI智能體將達22.16億,年度Token消耗量將從2025年的0.0005千萬億Tokens飆升至152667千萬億Tokens——增長超3億倍。
Token的需求焦慮正倒逼算力基礎設施的底層變革,浪潮信息首席AI戰略官劉軍判斷,智能體時代,AI算力的“北極星指標”已經轉移,浮點運算能力、算力峰值等正變成商業決策的噪聲,真正決定輸贏的,只有兩個指標:Token速度與Token成本。
2025年9月,浪潮信息(000977.SZ)發布面向智能體優化AI計算系統,讓AI推理進入“10毫秒、1塊錢”時代。如今,更快、更低成本的AI服務器還在持續研發創新,為噴涌的AI算力需求、智能體的規模化落地構筑基石。
與此同時,在AI服務器之外,浪潮信息全場景的AI智算產品矩陣不斷壯大。浪潮信息數據顯示,2025年,公司全球有效專利數17000+,其中發明專利占比80%。
從AI服務器產品到全場景AI智算矩陣,再到“AI+”的行業解決方案,浪潮信息秉承“計算力是生產力、智算力是創新力”的理念,推動世界智能進化。
01
造一臺AI服務器
AI服務器的不斷進化,都是為了迎接如今智能體時代的終極考驗。
從為云計算、數據庫、虛擬化、企業IT設計的普通服務器,到為大模型訓練/推理、深度學習、算力集群設計的AI服務器,AI服務器在10年間快速迭代。
早在2016年,AlphaGo戰勝圍棋世界冠軍李世石震驚世界,就讓無數企業意識到了智能時代即將到來。這一年,浪潮信息提出將“智慧計算”作為業務戰略發展方向,服務器開始“加速卡疊加”,GPU作為“計算外掛”的插件融進傳統服務器。
發布“智慧計算”戰略之后,浪潮信息在2017年又明確了其發展方向,即圍繞“計算、數據、算法”三大支柱,擴大計算生態,推進“平臺+應用”深度融合。很快,浪潮信息服務器實現變革式創新,2019年推出了第一代真正面向大規模AI訓練的旗艦服務器——NF5488M5。
據了解,AI服務器NF5488M5在業界首次實現了4U空間內集成8顆通過高速NVSwitch無阻塞全互聯的最新一代NVIDIA Tesla V100 Tensor Core 32GB GPUs,AI計算性能可達每秒1000萬億次。
這也標志著AI服務器從“通用+ GPU”走向AI原生架構,GPU中心主義+多卡高速互聯(NVLink單機高速互聯、InfiniBand 集群高速通信、PCIe 5.0高速總線)成為主流。值得一提的是,盡管GPU占據主導,但晶圓級引擎、集成LPU、存內計算、數據流架構等多元化探索還在繼續。
2022年,浪潮信息通過“all in液冷”戰略,建成亞洲最大液冷數據中心研發生產基地“天池”。很快,在AI服務器領域,傳統的風冷散熱已經走到盡頭,液冷技術從“可選”變成了“標配”。
與此同時,AI服務器行業算力密度持續翻倍。一臺服務器可搭載的GPU數量從早期4卡(4 張GPU)逐步提升至8卡;后來面向功耗極高的超大規模智算中心,16卡才能滿足超高密訓練;如今面向萬億參數大模型,內部高速互聯的64路超節點架構才能支撐起指數級提升的算力需求。
2025年8月,浪潮信息發布超節點AI服務器“元腦SD200”,將64張卡融合成統一內存、統一編址的超節點,能同時運行DeepSeek R1、Kimi K2等四大國產開源模型。可以看到,AI服務器主流架構正在經歷從“GPU為中心”向“系統級超節點”的躍遷。
現在,浪潮信息的一臺AI服務器要整合超過10000個零部件,其中包括50多類專用芯片,涉及30多個技術方向,例如材料學、熱力學、電池技術、流體力學、化學等一系列學科。
與此同時,服務器行業也已經從賣硬件、賣標準化設備,轉向賣算力方案、集群、智算中心、液冷整套系統。
如今的AI服務器,不再是一個“裝滿顯卡的鐵盒子”,而是一個集芯片、互聯、散熱、軟件于一體的復雜系統。
02
“10毫秒”時代與“1塊錢”時代
對Token交互速度的考量正在重構AI算力系統的價值評估體系。
萬億參數大模型只是AI服務器過去面臨的挑戰,現在AI服務器要應對的是即將爆發式增長的AI智能體。
據了解,傳統對話模型像在快餐店點餐——用戶提問,模型回答,交易完成,整個過程的Token消耗是離散、短暫的。但OpenClaw這類自主智能體,像雇用了一位全天候在崗的數字員工:它需要拆解目標、規劃步驟、調用工具、檢查結果……每一步都在消耗Token,每一輪對話都在放大成本。
OpenClaw開啟了自主智能體的時代,但真正支撐“數字員工”規模化運作的,不是模型排行榜上的分數,不是發布會PPT上的峰值算力,而是底層基礎設施對Token的可持續供給能力。
劉軍強調,面對未來Token消耗量指數級增長、復雜任務Token需求激增數十倍的必然趨勢,現有成本水平仍難支撐AI的普惠落地。未來,AI要真正成為如同 “水電煤” 般的基礎資源,Token成本必須在現有基礎上實現數量級跨越,成本能力將從“核心競爭力”進一步升級為“生存入場券”,直接決定AI企業在智能體時代的生死存亡。
圍繞Token速度與成本重構計算架構,浪潮信息正圍繞兩個核心方向進行破局。
一是打穿延遲瓶頸,開啟“10毫秒時代”。元腦SD200超節點AI服務器代表著浪潮信息“向上突破”的戰略方向,用極限交互速度解決“能不能算、算得快不快”的問題,為前沿AI探索提供基礎設施。
對Token交互速度的考量正在重構AI算力系統的價值評估體系。當前全球主要大模型API服務商的Token生成速度,基本維持在10—20毫秒,而國內的生成速度普遍高于30毫秒。
如今,浪潮信息推出元腦SD200超節點AI服務器,實現DeepSeek R1大模型單Token生成速度低至8.9毫秒,帶動國內AI服務器Token生成速度率先進入“10毫秒時代”。
據介紹,元腦SD200超節點AI服務器基于高帶寬、低延時、原生內存語義的開放總線協議,通過構建高性能交換單元打造3D Mesh高性能互連超擴展系統,支持64張本土AI芯片高密度算力擴展,能夠很好地滿足DeepSeek等大模型的低延遲推理需求,加快Token生成速度。
二是擊穿成本底線,開啟“1塊錢時代”。2025年9月,浪潮信息推出元腦HC1000超擴展AI服務器,將推理成本首次擊穿至1元/百萬Token。元腦HC1000超擴展AI服務器代表著浪潮信息“向下普及”的戰略方向,用極致降低成本解決“用不用得起、能不能規模化”的問題,推動智能體產業化落地。
據介紹,元腦HC1000超擴展AI服務器基于全新設計的全對稱DirectCom極速架構,采用無損超擴展設計,可高效聚合海量本土AI芯片,支持極大推理吞吐量,推理成本大幅拉低,為智能體突破Token成本瓶頸提供極致性能的創新算力系統。
03
“元腦”的“三重奏”
浪潮信息正全面推進算力、算法、數據和互連技術的創新,隨著“元腦”品牌的升級壯大,其也在加速“人工智能+”的落地。
在 “10毫秒、1塊錢”時代,除了令人矚目的元腦系列AI服務器產品,浪潮信息還構建起涵蓋浪潮計算產品的“元腦”品牌,以及共建共贏的“元腦生態”。
在2019年浪潮信息生態伙伴大會(IPF大會)上,浪潮信息正式發布“AI元腦”和“元腦生態”,即通過“AI元腦”中的AI計算平臺、AI資源平臺、AI算法工具平臺,連接元腦生態中的“左手伙伴”(技術型伙伴)和“右手伙伴”(戰略型伙伴、能力型伙伴),并迅速幫助用戶和合作伙伴形成AI原生能力。到2024年,“元腦”全面升級為包括所有計算產品的智算品牌,同時“元腦”也是生態品牌。
一方面,除了以元腦SD200、元腦HC1000為代表的AI服務器,浪潮信息的“元腦”品牌還涵蓋全場景的AI智算產品矩陣。
在算力方面,浪潮信息2025年推出了元腦R1推理服務器,業界首次實現單機支持16張標準PCIe雙寬卡;元腦CPU推理服務器挖掘通用算力潛能,適配多樣化應用場景;2024年與Intel聯合發布AI通用服務器,首款AI通用服務器NF8260G7在通用處理器平臺上首次實現單機可運行千億參數“源2.0”大模型。
在算法方面,浪潮信息2024年推出企業大模型開發平臺EPAI(Enterprise Platform of AI)“元腦企智”,為企業AI大模型落地應用提供高效、易用、安全的端到端開發平臺。
此外,在存儲層面,浪潮信息發布高端存儲HF18000G7產品,以創新的元磐架構和iTurbo7.0 智能引擎適配多種業務規模和場景。
在網絡層面,以全新開放網絡架構為突破,面向人工智能場景提供超級AI以太網、IB網絡等多樣化的網絡解決方案,為大模型訓練和推理提供領先的AI網絡性能。
浪潮信息正全面推進算力、算法、數據和互連技術的創新,隨著“元腦”品牌的升級壯大,其也在加速“人工智能+”的落地。
另一方面,浪潮信息“元腦生態”保持快速增長。目前,“元腦生態”已對接600+算法廠商、8000+系統集成商和分銷商。
早在2019年“元腦”面世時,浪潮信息就發布“元腦生態”計劃,鏈接“左手伙伴”和“右手伙伴”。2021年,“元腦生態”宣布升級,重點建設元腦生態平臺AI Store,承載“聚合器”和“孵化器”兩大功能,致力于建設從技術、方案到交付、服務的完整生態。
通過多元的算力供給、全棧的AI Infra軟件棧、豐富的大模型經驗,“元腦生態”實現“百模”與“千行”的對接,已在智能制造、智慧金融、智慧科研等領域成功落地應用。
例如,在“元腦生態+醫療”領域,佛山市南海區人民醫院(以下簡稱“南海人醫”)、浪潮信息、廣州天銳醫健信息科技有限公司(以下簡稱“天銳醫健”)三方聯合,共創基層醫療智能體。
南海人醫擁有790萬條真實病歷,這是一座沉睡的“數據金礦”;天銳醫健懂業務、有場景,但缺乏將醫療數據轉化為大模型能力的路徑;而浪潮信息提供基礎算力設施與大模型應用開發平臺元腦企智EPAl,讓數據、業務與算力平臺實現深度串聯與協同,破解大模型醫療核心落地難題。
數據顯示,該基層醫療智能體助力醫療導診效率提升20倍,病歷質控提速60%,惠及12.67萬億患者。
浪潮信息指出,AI是算法、算力、數據、互聯高度耦合的復雜系統。浪潮信息的核心戰略在于“以系統為中心”的創新,通過全局優化,解決“算得不夠快”“算效不夠高”的挑戰。
與此同時,浪潮信息堅信:“AI的終極價值在于應用。中國擁有全球最多元的產業生態,每一個領域都蘊藏著巨大的AI賦能潛力。因此,我們的核心戰略并非僅僅提供算力硬件,而是深入理解行業應用場景,將技術與業務需求深度融合。”
從AI產品“元腦”,到生態品牌“元腦”,再到涵蓋所有計算產品的智算品牌“元腦”,浪 潮信息“元腦”的“三重奏”都踩在AI時代的節奏上,助力千行百業加速AI產業創新,推動世界智能進化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.