穿透「行業」和「公司」的表象,回歸「業務場景」的算力特征。
2025 年,生成式 AI技術浪潮正從概念驗證加速駛向產業深水區。在企業摩拳擦掌、試圖借助 AI 重塑競爭力的同時,一個更為現實的挑戰浮出水面:如何將前沿技術的潛力,穩定、高效且經濟地轉化為真實的業務價值?如何避免陷入雷聲大雨點小的尷尬?
MIT 在 7 月發布的《The GenAI Divide: State of AI in Business 2025》報告,用一組數據揭示了一個關鍵的轉折點:全球企業投入 AI 轉型的 300 億至 400 億美元中,大部分項目仍處于探索階段,僅有少數先行者成功跨越了從「試點」到「規模化」的鴻溝。
而其中的分野,往往不在于模型的先進程度,而在于對算力成本與應用效率的精準把控。
更深層的問題則在于行業認知誤區:多數玩家都習慣于將 AI 轉型與模型和硬件直接掛鉤,然后得出企業擁有的GPU 算力等于權力,上馬最優秀的SOTA 模型,就等于最好的應用效果的粗暴論斷。
但一定程度上,只看見 AI,恰恰成為了這波 AI 轉型浪潮中最大的智商稅。
面對這一困局,行業已經開始集體反思:算力競賽的焦點正從單一的 AI 加速器,轉向整體基礎設施的效率。這也解釋了為何在 AI 時代,高性能 CPU的需求不降反增——CPU 作為整個算力架構的「調度中樞」與「效率基石」,在不同場景中成為平衡效率與成本的關鍵。
01
AI 時代的困局
從自動駕駛到人臉識別,從游戲到直播,從互聯網到制造業,幾乎沒有不需要 AI 加速的產業。
但現實是,同樣的 AI 轉型,落地的不同產業都有著各自的特性與需求痛點。如果只看見 AI,往往會導致技術與產業需求脫節,既無法解決產業真正的痛點,也讓 AI 本身淪為空中樓閣。
![]()
比如在自動駕駛領域,普通人或許覺得實現自動駕駛,就是把一個聰明的大模型「大腦」裝進汽車,再給車裝上「眼睛」(攝像頭)。但對小鵬這樣的玩家來說,現實遠比這復雜。
讓自動駕駛真正能用起來,首先面臨一個龐大的數據工程:為支撐智能駕駛輔助 VLA-OL 等模型迭代與 3D 高斯場景重建等仿真任務,小鵬每日需處理視頻、圖像、雷達數據等 PB 級多模態數據。從攝像頭視頻流的畸變校正到激光雷達點云的地面分割,每一步都面臨算力效率與成本控制的雙重壓力。更關鍵的是,所有原始數據均需經過轉碼這一 CPU 密集型操作才能用于訓練,而自建數據中心成本過高,上云后的實例選擇與效率優化同樣是個難題。
![]()
同樣在視頻領域,用戶覺得看視頻只是「點擊播放」那么簡單。但對微幀科技這樣的頭部視頻編碼服務商而言,現實是每月要幫 100 多家頭部企業處理超 15 億分鐘的視頻,還要保證低成本、低延遲的全球傳輸。挑戰不僅是編碼本身,更在于編碼前的降噪、畫質增強等 AI 預處理環節,這帶來了巨大的算力需求和極高的性能要求;同時,非實時任務還必須兼顧成本控制與資源利用率。
甚至,即使面臨同樣的互聯網場景高并發需求,金融場景與游戲場景的需求也天差地別。
![]()
金融安全領域的「高并發」,核心要求是「零容錯」。普通人眼中簡單的「刷臉」認證,對螞蟻集團旗下的 ZOLOZ 而言,每一次「刷臉」都是高風險的信任交付。ZOLOZ 同時在為全球 14 個國家、70 余家合作伙伴提供服務,這背后既要應對海量訪問,還必須滿足各地嚴苛的安全合規標準。真正的痛點在于「刷臉」瞬間,后臺需要并行處理活體檢測、人臉比對等多重任務,同時還要控制離線推理的成本,并保證 RAG 場景的高頻數據讀取效率。
如果說金融的痛點是數據和安全決不能錯,那游戲的痛點就是體驗和幀率決不能卡。
游戲行業的「高并發」,核心要求則是「零抖動」。玩家關心的是畫面是否酷炫,操作是否流暢。比如莉莉絲的爆款游戲《遠光 84》,要支撐的是百萬級玩家同時在線。這意味著單個核心就要承載 60-120 名玩家的高頻網絡同步,賽事場景更要求 60FPS 的穩定幀率。此外,游戲內 BOT 的 AI 尋路、彈道仿真與碰撞模擬等復雜計算,進一步加劇了算力壓力。對玩家來說 0.1 秒的卡頓就是災難,會直接影響游戲口碑。
![]()
而在傳統的家電行業,用戶的感知只是「冰箱連上了 WiFi」,但對家電企業來說,這背后遠比「連個 WiFi」復雜太多倍。就比如海爾旗下的三翼鳥平臺,如今已經服務近 1 億家庭用戶,連接超 5000 萬臺設備,日常需要支撐千萬級設備網關的長連接,并實時處理海量設備狀態上報。任何設備掉線、指令響應延遲,或是夜間流量高峰的穩定性問題,都會直接影響用戶體驗與留存。因此,高實時性、高穩定性、高并發應對能力成為了三翼鳥的核心訴求。
要如何應對 AI 時代千行百業、不同品牌的差異化需求?對每個公司都提供一套定制化方案顯然并不現實。
02
真正的分野:從「行業分類」到「場景特征」
今天我們可以清晰地看到:AI 時代的算力需求是高度分化的。如果繼續沿用傳統視角,按行業(如金融、游戲)或規模(如大企業、小企業)來劃分企業,已經無法抓住問題的本質。
![]()
正如《IDC 新一代云基礎設施實踐報告》所指出的,更有效的方式是穿透「行業」和「公司」的表象,回歸「業務場景」的算力特征。
從底層算力需求特征來看,這些復雜的需求和核心痛點可以歸納為如下三點:
1. 在線業務:以 Web、數據庫、海爾的物聯網平臺、螞蟻的實時認證為代表,核心痛點是低時延、高并發和高可用。
2. 離線業務:以數據處理、模型訓練、小鵬的數據工程為代表,核心痛點是高吞吐、高效率和成本控制。
3. 游戲/量化交易業務:以莉莉絲的游戲服為代表,核心痛點是高主頻、低抖動和復雜計算。
而英特爾與阿里云聯合推出的高性能 CPU+云+行業化解決方案,正是針對這三類賽道的核心痛點,通過軟硬協同實現了精準適配。
以微幀科技、螞蟻 ZOLOZ、海爾三翼鳥為代表的在線業務,需要在支撐千萬級實時請求、毫秒級響應的同時,保障全球服務質量一致性,以及海爾三翼鳥的設備長連接穩定性。
對應的解決方案,就要聚焦低時延硬件加速、高網絡吞吐設計與智能彈性調度,以及全球節點部署,并平衡性能與成本。
螞蟻 ZOLOZ 的在線實人認證場景需要應對高并發訪問,于是他們選用了阿里云今年新推出的 ECS g9i 企業級云實例,其中搭載的至強? 6 處理器發揮了關鍵作用:
至強? 6 的Chiplet 架構集成 3 個計算芯粒和 2 個 IO 單元芯粒,單個計算芯粒支持最多 32 個核,可將活體檢測、人臉比對等并行任務在同一計算芯粒內高效分配處理,減少跨芯粒通信延遲,確保了 ZOLOZ 服務可以保持低于 100 毫秒的響應速度。
內置于至強? 處理器中的英特爾? AMX,專門針對矩陣運算等 AI 負載進行了優化,能夠顯著提升深度學習推理任務的效率。
![]()
得益于 AMX,在安全應用方面,螞蟻數科基于「以 AI 對抗 AI」的創新理念構建的 ZOLOZ Anti-Deepfake 攻防互動系統,為 AI 推理帶來最高達 3.3 倍 的性能提升,并將每瓦性能提升高達 1.7 倍。
在 MaaS 層(模型即服務)ZOLOZ FinLLM 處理市場情緒分析、行情預測、風險評估、自動化客服等關鍵金融任務時,推理加速提升了 2.3 倍,推理消耗時長降低了 35%,算力成本降低了 72%。
而在 Pass 層,至強? 6 處理器的 504MB 超大 L3 緩存有助于提升數據訪問速度,滿足低時延要求,在承載同等規模智能體服務時,所需服務器節點數量減少了 30%,金融機構由此可降低 25% 的硬件采購與運維成本。
在線視頻領域的微幀科技同樣受益于該方案。對于每月 15 億分鐘視頻的實時 4K 編碼、的低時延傳輸需求,至強? 6 的 Chiplet 架構采用的 EMIB 多芯片互聯橋接封裝技術實現計算芯粒與 IO 芯粒間的高速數據交互,為視頻編碼數據的快速流轉提供了保障。
同時,Chiplet 架構的計算芯粒集群可并行處理視頻幀的不同片段,配合處理器中集成的 AVX-512 指令集和 AMX,可以優化 AI 降噪預處理等視頻處理流程,使 4K 處理效率提升 35%。此外,針對其全球化業務需求,阿里云全球 29 個數據中心的就近部署有效降低跨區域傳輸延遲,配合 Spot 實例彈性策略,非實時任務成本降低 60%。
海爾三翼鳥的 AIoT 平臺同樣是在線業務的典型場景,但其需求則更多元,對于安防、廚房等關鍵場景要求毫秒級響應。ECS g9i 基于CIPU 架構的軟硬一體化設計發揮關鍵作用:其提供了 100Gbps 超高網絡帶寬,同等配置下設備網關側連接能力提升 40%,使單臺服務器的設備承載量從 10 萬+提升至 14 萬+,并拓展至最高可滿足千萬級設備并發連接需求;此外,虛擬化損耗降至接近物理機水平,配合熱升級技術使故障率下降 90%,夜間高峰也能穩定運行。而對于語音指令響應,也能把延遲從 200ms 優化至 120ms 內,月活躍用戶留存率同比提升 15%,同時整體 IT 成本降低 20%。
常見需求的第二類——離線業務的效率與成本兼顧,則以小鵬為代表。解決方案需要聚焦大緩存設計、算力調度優化與硬件加速,提升效率并降低冗余成本。
至強? 6 處理器提供的 12 通道 DDR5 內存(6400MT/s)為小鵬處理海量數據讀寫提供了高帶寬保障;504MB 超大 L3 緩存使熱數據命中率有效提升;英特爾? QAT 技術則將數據壓縮/解壓縮任務中的數據從 CPU 核心卸載并加速,并將歷史上下文中的溫、冷數據壓縮后存入本地硬盤或者遠端對象存儲中,顯著減少了存儲空間占用和 IO 傳輸延遲,加速了數據預處理流程,降低了對高成本 GPU 計算周期的占用和等待。同時,實例雙單路架構實現了故障自動切換,保障了 7x24 小時不間斷的數據處理業務,避免研發進度延誤。
此外,在自動駕駛數據預訓練的相似度檢索環節,小鵬需對百萬起步的圖像特征向量進行大批量的歐氏距離計算,以篩選特定交通場景(如環島博弈、施工路段避讓)的訓練樣本。ECS g9i 在硬件層面與 SIMD 指令集深度集成,從 AVX-512 到 AMX,都為這類向量/矩陣運算提供了強大的并行計算能力,使小鵬針對圖片相似度比對、向量檢索等場景開發算法的執行效率顯著提升,無需重構代碼即可復用優化成果(如將圖像特征從 2D 轉為 3D 空間坐標),貼合自動駕駛研發中快速迭代的需求。
相比小鵬離線任務對海量數據高效、低成本處理的需求,以莉莉絲游戲為代表游戲/量化交易業務則相對成本不那么敏感,但是對高穩定性+復雜計算+低抖動的要求巨大。
要支撐百萬級玩家的并發交互、量化交易的高頻策略計算與執行,微秒級計算延遲和算力波動都需要降到最低。解決方案主要聚焦高主頻穩定性、并行計算優化與硬件級抗干擾設計。
為了支持莉莉絲《遠光 84》的百萬玩家同時在線、單核心 120 名玩家高頻同步,以及 BOT AI 尋路、彈道仿真等復雜計算,ECS g9i 搭載的至強? 6 處理器可以在 3.6GHz 全核睿頻下保證頻率抖動幾乎微不可查,配合先進散熱技術使服務器故障率降低,最大程度避免故障導致的業務中斷和數據丟失;搭配最高 96 個性能核的并行計算能力與 AMX 引擎優化,對比上一代云實例,g9i 可以使卡頓次數減少 70%、平均幀時間縮短 30%,團戰延遲極大降低。
03
變化的需求,不變的多元算力與性能、性價比需求
當然,現實場景中的客戶需求遠比抽象的總結要更復雜,而市場數據則為這套聯合解決方案的價值提供了最有力的證明:數據顯示,上線不到 100 天,g9i 就已經獲得了一萬家客戶。
進展如此神速的根本原因在于,英特爾與阿里云找到了 AI 時代企業算力需求的核心矛盾:如何在多元化算力中實現高效調度,并在性能與成本之間取得平衡。
而應對的核心,就在于高性能 CPU+CIPU 云架構的軟硬協同組合。
英特爾? 至強? 6 性能核處理器作為硬件核心,它采用 Intel 3 制程工藝,配備最高 128 個性能核、504MB L3 緩存,支持 12 通道高達 6400MT/s 的 DDR5 內存與 96 條 PCIe 5.0 通道、64 條 CXL 2.0 通道,相較上一代實現 40% 平均性能提升,更適合公有云工作負載。
![]()
阿里云 CIPU 則向下加速計算、存儲、網絡資源云化,向上通過飛天系統實現彈性調度與安全隔離。兩者協同形成算力供給-調度-優化的全鏈路能力。
雙劍合璧之后,實測數據顯示,ECS g9i 實例相較基于第五代至強? 可擴展處理器的 g8i 實例,在線游戲性能提升 15%,數據庫性能提升 17%,Web 應用性能提升 20%。
而成本側,基于至強? 6 處理器的阿里云 ECS g9i實例,在相比上一代整體提升了 20% 性能表現的同時,目錄價格卻降低了 5%。并且得益于英特爾處理器代系間完善的軟硬件生態,企業在升級至最新的 ECS g9i 時,其原有系統與應用無需進行任何改造即可平滑過渡,極大降低了升級門檻。
與此同時,針對差異化的用戶場景,阿里云+英特爾也做了不同的針對性方案。
針對大部分企業的通用需求,推出了 U 系列入門級實例;為滿足高內存帶寬需求,推出了 r8e 增強型實例;另外針對科學計算、仿真等對單核睿頻需求更高的客戶,還推出了專門的 hf 系列實例滿足他們的需求。
這種從共性需求的提取,到深入行業特性提供不同解決方案的方式,看起來并不「性感」,卻彌足重要。
它揭示了 AI 轉型中一個最樸素的道理:實現轉型價值的關鍵,不在于追逐最前沿的模型,而取決于技術能否在具體場景中解決具體的問題,并實現成本與效率的平衡。
在這個過程中,英特爾的高性能通用型算力,解決了他們對多元算力、高性能、高性價比的共性需求;而阿里云則在這個基礎上通過 CIPU 架構及彈性計算,將硬件能力轉化為可以被精準調度、按需取用的云上資源,并針對不同行業、不同用戶類型推出個性化的解決方案,讓每一種獨特需求都能被看見,被滿足。
這種「軟硬協同、深入場景」的能力,并非一蹴而就。自 2009 年以來,阿里云與英特爾的深度技術合作已歷經十五載。雙方的合作始終以挖掘極致性能和精準洞察客戶需求為核心,深度貫穿至強? 處理器家族的歷代產品迭代。正是這份日復一日的堅持,讓英特爾? 至強? 處理器與阿里云彈性計算與成為了企業數字化轉型中的可靠基石,始終為產業的升級與創新提供著堅實、可靠的底層支撐。
*頭圖來源:視覺中國
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.