![]()
AI云的新邏輯:講技術(shù),更要講價(jià)值。
作者丨鄭佳美
編輯丨馬曉寧
![]()
過(guò)去幾年,AI 幾乎成了云計(jì)算行業(yè)的統(tǒng)一敘事。
無(wú)論是阿里提出的全面 AI 化,火山云強(qiáng)調(diào)的 Token性?xún)r(jià)比,還是百度持續(xù)加碼的大模型戰(zhàn)略,廠商們都在努力用 AI 定義未來(lái)的云。但當(dāng)這些口號(hào)越來(lái)越密集時(shí),也變得越來(lái)越相似。
算力提升、模型迭代、Agent 探索,幾乎成了每一家廠商的必備動(dòng)作,差異化正在快速消解。宣傳中,各種“全球領(lǐng)先”“業(yè)內(nèi)首創(chuàng)”的表述層出不窮,但落到用戶(hù)體驗(yàn)與產(chǎn)業(yè)落地,差別并不顯著。對(duì)大多數(shù)企業(yè)來(lái)說(shuō),除了價(jià)格、服務(wù)條款和生態(tài)黏性,真正能感知到的差異其實(shí)并不多。
另一方面,AI 本身也正從“炫技”走向“應(yīng)用”。2023年 到 2024 年間,行業(yè)一度沉浸在大模型突破帶來(lái)的震撼中,但進(jìn)入 2025年,客戶(hù)的關(guān)注點(diǎn)已不再是模型參數(shù)的數(shù)量或推理速度的極限,而是如何把 AI 嵌入產(chǎn)業(yè)流程,真正帶來(lái)效率和價(jià)值。換句話(huà)說(shuō),現(xiàn)在的問(wèn)題已經(jīng)不在于 AI 能否更強(qiáng),而在于它能否更有用。
在這樣的背景下,華為云在華為全聯(lián)接大會(huì) 2025 上提出了一套新的組合:超節(jié)點(diǎn) Token 服務(wù)、液冷、企業(yè)級(jí) Agent,并將具身智能、盤(pán)古大模型納入其中,頗有一種想要突破行業(yè)現(xiàn)狀的感覺(jué)。表面上是新技術(shù)的推出,實(shí)質(zhì)上是對(duì)行業(yè)現(xiàn)實(shí)的回應(yīng)——當(dāng)成本、基建和應(yīng)用都成為瓶頸時(shí),差異化的敘事已成為廠商的必答題。
01
AI 云的困境
今天的 AI 云,幾乎都在講同樣的故事:大算力、大模型、大生態(tài)。
算力規(guī)模、訓(xùn)練速度、推理延遲被擺在最顯眼的位置,廠商之間不斷刷新極限,以此證明自己的領(lǐng)先地位。大家的焦點(diǎn)都落在技術(shù)性能的極限上,卻鮮少能回答一個(gè)更現(xiàn)實(shí)的問(wèn)題:這些技術(shù)突破如何真正改變企業(yè)的生產(chǎn)力和產(chǎn)業(yè)效率?
于是,“性能大戰(zhàn)”逐漸成了行業(yè)的默認(rèn)賽道。故事講得越來(lái)越大,但和它對(duì)應(yīng)的商業(yè)回報(bào)、客戶(hù)價(jià)值,卻沒(méi)能同步跟上。更麻煩的是,AI 云還背著“三座大山”:
第一座是成本。動(dòng)輒數(shù)十萬(wàn)卡的 GPU/NPU 集群,硬件采購(gòu)和能耗支出不斷飆升。算力價(jià)格越炒越高,廠商如果想維持領(lǐng)先,就要不停砸錢(qián)。可現(xiàn)實(shí)是,回報(bào)周期模糊,巨額前期投入很難快速收回。
第二座是基建。數(shù)據(jù)中心建設(shè)動(dòng)輒數(shù)年,PUE 要不要壓到 1.1 以下,單機(jī)柜能不能撐起更高功率,這些不只是環(huán)保指標(biāo),更決定能不能撐起百萬(wàn)級(jí)算力。但一旦方向押錯(cuò),沉沒(méi)成本會(huì)非常沉重。
第三座是應(yīng)用。大模型在推理、生成上不斷刷紀(jì)錄,可能真正復(fù)制、規(guī)模化落地的案例仍不多。很多企業(yè)的項(xiàng)目還停在演示或 POC 階段,真正嵌進(jìn)業(yè)務(wù)流程的并不多。
這使得 AI 云行業(yè)陷入一種悖論:廠商們的競(jìng)爭(zhēng)愈演愈烈,敘事越來(lái)越龐大,但客戶(hù)端感受到的價(jià)值卻不成正比。性能不斷突破,成本卻居高不下,應(yīng)用遲遲難以落地,這或許就是當(dāng)前 AI 云敘事與產(chǎn)業(yè)價(jià)值之間最大的張力所在。
![]()
如果說(shuō)敘事趨同和成本壓力是行業(yè)的共性問(wèn)題,那么客戶(hù)需求的高度分化則揭示了更深層的挑戰(zhàn):不同類(lèi)型的客戶(hù),對(duì) AI 云的訴求完全不同,幾乎不存在可以“一招通吃”的方案。
互聯(lián)網(wǎng)公司最在意的是靈活擴(kuò)容和價(jià)格可控:流量高峰要能瞬時(shí)撐起數(shù)千萬(wàn)并發(fā),低谷又要迅速收縮,否則成本就會(huì)失控。如果云廠商不給出彈性計(jì)費(fèi)和友好價(jià)格,粘性很難建立。
央國(guó)企則把合規(guī)與安全放在首位。數(shù)據(jù)主權(quán)、監(jiān)管要求、隱私保護(hù)是紅線,它們更關(guān)注模型能否“可控在域”,算力能否本地備份,能否有完整的審計(jì)與容災(zāi)機(jī)制。
新興產(chǎn)業(yè)(智能制造、教育、內(nèi)容創(chuàng)作等)強(qiáng)調(diào)快速試錯(cuò)。它們希望低門(mén)檻接入 AI,用最小的成本換機(jī)會(huì),不追求模型參數(shù)多大,而需要開(kāi)箱即用的工具、輕量化 API,甚至直接可用的場(chǎng)景模型。
智能駕駛則對(duì)實(shí)時(shí)性和穩(wěn)定性要求極高,任何延遲都可能是安全風(fēng)險(xiǎn),因此必須依賴(lài)低時(shí)延的邊緣計(jì)算和云端協(xié)同。除此之外,具身智能還面臨本體受限:功耗、電池、體積都有限,沒(méi)法把大算力塞進(jìn)機(jī)器人。如果把推理和訓(xùn)練遷到云端,就能讓機(jī)器更輕、省電,同時(shí)獲得更強(qiáng)的感知和決策能力。這也是它對(duì) AI 云最強(qiáng)的依賴(lài)。
正因?yàn)樾枨笕绱朔只珹I 云已經(jīng)很難靠單一敘事去覆蓋所有客戶(hù)。算力再大、模型再?gòu)?qiáng),也無(wú)法同時(shí)滿(mǎn)足不同的行業(yè)。這迫使廠商必須真正深入行業(yè)場(chǎng)景,基于不同客戶(hù)的特征提供差異化的解決方案,AI 云的價(jià)值正在從“統(tǒng)一的口號(hào)”,逐步轉(zhuǎn)變?yōu)?b>“多樣的答案”。
于是產(chǎn)生了一個(gè)自然的問(wèn)題:面對(duì)分化的需求,廠商們能提出怎樣的答案?華為的嘗試,就提供了一個(gè)值得觀察的樣本。
![]()
02
華為的嘗試
在華為全聯(lián)接大會(huì) 2025 上,華為云給出了一套不同于慣常“大算力、大模型”的路徑,而是通過(guò)軟硬協(xié)同、架構(gòu)創(chuàng)新,做厚算力黑土地來(lái)回應(yīng)行業(yè)的困境。
![]()
華為常務(wù)董事、華為云計(jì)算CEO張平安
算力層面,華為云基于CloudMatrix384的 AIToken 推理服務(wù)全面上線。Token 推理服務(wù)意味著可以高效地直接獲得“AI 的最終結(jié)果“, 而不必關(guān)心AI硬件的更新迭代,也不必關(guān)心推理框架、模型部署等復(fù)雜的軟件技術(shù)棧。華為云認(rèn)為,算力的競(jìng)爭(zhēng)本質(zhì)上是以?xún)?yōu)的性能、好的服務(wù)、高的質(zhì)量,來(lái)高效地滿(mǎn)足各行各業(yè)所需。
CloudMatrix384 超節(jié)點(diǎn)將資源全面池化,將計(jì)算型任務(wù)、存儲(chǔ)型任務(wù)、AI專(zhuān)家系統(tǒng)解耦,將串行任務(wù)變成分布式并行任務(wù),極大地提升了系統(tǒng)的推理性能。在在線、近線和離線等推理場(chǎng)景中,CloudMatrix384 平均單卡的推理性能達(dá)到 H20 的 3 到 4 倍。
大會(huì)期間,華為云還表示,未來(lái),CloudMatrix 超節(jié)點(diǎn)還將從384 卡升級(jí)至 8192 卡,依托MatrixLink 高速對(duì)等互聯(lián)網(wǎng)絡(luò)結(jié)合多網(wǎng)合一技術(shù),實(shí)現(xiàn)百萬(wàn)卡的超大集群,提供更澎湃的AI算力。
同時(shí)發(fā)布的EMS 彈性?xún)?nèi)存存儲(chǔ)服務(wù)被稱(chēng)為“以存強(qiáng)算”,通過(guò)內(nèi)存擴(kuò)展顯存,解決顯存不足導(dǎo)致的推理時(shí)延大幅提升的問(wèn)題。官方數(shù)據(jù)稱(chēng),多輪對(duì)話(huà)和長(zhǎng)鏈推理的首Token 時(shí)延可降低 90%,這等于直接觸及行業(yè)最敏感的用戶(hù)體驗(yàn)指標(biāo)。
基礎(chǔ)設(shè)施上,華為在貴州、內(nèi)蒙古、安徽等地同步落地的全液冷 AI 數(shù)據(jù)中心,目標(biāo)是通過(guò)冷板式液冷、AI 調(diào)優(yōu)與 IoT 運(yùn)維實(shí)現(xiàn)極致能效。PUE 壓低至 1.1,單機(jī)柜功率提升至 80kW,不只是能耗改善的數(shù)據(jù),而且意味著客戶(hù)可以“租用”到接近最優(yōu)形態(tài)的數(shù)據(jù)中心資源,而不必再背上巨額的自建負(fù)擔(dān)。
華為甚至在發(fā)布會(huì)上強(qiáng)調(diào),企業(yè)只需“一對(duì)光纖”,就能隨取隨用接入超大規(guī)模算力池,其背后折射出廠商對(duì)降低進(jìn)入門(mén)檻的努力。
![]()
平臺(tái)層,華為把重心放在企業(yè)級(jí) Agent 平臺(tái)。不同于個(gè)人用戶(hù)的輕量化 Agent,企業(yè)級(jí) Agent 必須滿(mǎn)足穩(wěn)定性、低幻覺(jué)率和可解釋性。
華為云的 Versatile 平臺(tái)由五大模塊組成:AgentSpace、AgentStudio、AgentRun、AgentOps、AgentGallery,涵蓋從自然語(yǔ)言生成 Agent 的工具鏈,到高性能沙箱的運(yùn)行環(huán)境,再到安全隔離與運(yùn)維體系。除此之外,提出的 NL2Agent 技術(shù)號(hào)稱(chēng)“像寫(xiě)文檔一樣開(kāi)發(fā) Agent”,目標(biāo)是縮短企業(yè)從需求到可運(yùn)行 Agent 的路徑。
![]()
華為高級(jí)副總裁、華為云全球Marketing與銷(xiāo)售服務(wù)總裁楊友桂
落地案例也進(jìn)入深水區(qū):在差旅管理中,慧通差旅基于 Versatile 打造了智能體“通寶”,涵蓋出差提醒、路徑規(guī)劃、智能問(wèn)答等等。在路徑規(guī)劃方面,“通寶”目前的采用率已超50%,2分鐘即可完成預(yù)訂。工業(yè)領(lǐng)域的萬(wàn)華化工,則將復(fù)雜的 SOP 審核流程交給 Versatile 平臺(tái)開(kāi)發(fā)的工作流 Agent 來(lái)完成,讓數(shù)以萬(wàn)計(jì)的 SOP 文檔實(shí)現(xiàn)自動(dòng)化質(zhì)量審核,顯著減輕了工程師的重復(fù)勞動(dòng)。
這些數(shù)據(jù)表明,企業(yè)級(jí) Agent 已不再是紙面概念,而是正在成為重塑企業(yè)生產(chǎn)方式的現(xiàn)實(shí)工具。
![]()
在機(jī)器人和具身智能領(lǐng)域,華為選擇了一條不同于業(yè)內(nèi)多數(shù)玩家的路徑:把算力遷到云端。
CloudRobo 平臺(tái)通過(guò)云端算力和智能,緩解機(jī)器本體在體積、功耗和成本上的限制,使其更輕量化,并大幅提升執(zhí)行的精度與效率。R2C(Robot to Cloud) 協(xié)議則意在統(tǒng)一多廠商、多系統(tǒng)的數(shù)據(jù)、通訊和指令接口,試圖打破長(zhǎng)期存在的生態(tài)割裂。目前已有 20 多家伙伴加入生態(tài),覆蓋制造、物流、康養(yǎng)等場(chǎng)景。
在國(guó)家地方共建人形機(jī)器人創(chuàng)新中心的案例中,結(jié)合真機(jī)與合成數(shù)據(jù)訓(xùn)練,機(jī)器人在多個(gè)場(chǎng)景下的整體分揀任務(wù)成功率可達(dá)90%以上,行業(yè)領(lǐng)先,初步證明了“云上具身智能”的可行性。
![]()
而在大模型層面,華為更是提出了“開(kāi)源+商用”的雙軌并行策略:一方面,openPangu 開(kāi)源部分 NLP 模型,降低客戶(hù)和開(kāi)發(fā)者在昇騰上的使用門(mén)檻,增強(qiáng)外部開(kāi)發(fā)者生態(tài)的活力,另一方面,商業(yè)版盤(pán)古已在 30 多個(gè)行業(yè)孵化出 200 多個(gè)專(zhuān)業(yè)模型,覆蓋 500 多個(gè)產(chǎn)業(yè)場(chǎng)景,強(qiáng)調(diào)“行業(yè)專(zhuān)用模型”在可解釋性和安全性上的優(yōu)勢(shì)。
這種組合既是技術(shù)層面的策略選擇,也是華為對(duì)過(guò)去“盤(pán)古風(fēng)波”的正面回應(yīng) —— 通過(guò)開(kāi)源表態(tài)開(kāi)放,通過(guò)商用展示落地,重建市場(chǎng)信任。
![]()
03
未定的答案
AI 云的競(jìng)爭(zhēng),已經(jīng)不是誰(shuí)喊得更 AI,而是誰(shuí)能真正把 AI 嵌進(jìn)產(chǎn)業(yè)。華為給出了一條新的路徑:在超節(jié)點(diǎn)和液冷上突破性能極限,在企業(yè)級(jí)Agent和具身智能上尋找差異化。
這套思路的價(jià)值在于,它直面了成本、基建和落地場(chǎng)景的痛點(diǎn),也體現(xiàn)了華為云試圖以全棧布局構(gòu)建長(zhǎng)期壁壘的雄心。
但這條路徑并非沒(méi)有挑戰(zhàn)。國(guó)際市場(chǎng)上,AWS 和 Azure 依然把控著最成熟的全球生態(tài)和開(kāi)發(fā)者心智,形成難以逾越的壁壘。在國(guó)內(nèi),昇騰生態(tài)仍處于培育期,要像 CUDA 那樣建立強(qiáng)粘性,需要時(shí)間和大規(guī)模開(kāi)發(fā)者的驗(yàn)證,而企業(yè)級(jí) Agent 和具身智能的落地,更注定是一個(gè)復(fù)雜而漫長(zhǎng)的過(guò)程,不僅要解決技術(shù)問(wèn)題,還要穿透行業(yè)流程,贏得客戶(hù)的長(zhǎng)期信任。
而對(duì)整個(gè)行業(yè)而言,真正的考驗(yàn)在于能否把炫技的敘事轉(zhuǎn)化為可持續(xù)的生產(chǎn)力。只有當(dāng) AI 云不再只是舞臺(tái)上的口號(hào),而是成為產(chǎn)業(yè)鏈中的基礎(chǔ)設(shè)施時(shí),這場(chǎng)競(jìng)爭(zhēng)才算真正走向了下半場(chǎng)。
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.