<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      落子“三算盤”,華為押注Token經濟時代

      0
      分享至






      內容/山南

      編輯/詠鵝

      校對/莽夫

      在AI應用遍地開花的2025年,AI推理這一細分賽道也因行業急速發展而規模膨脹。

      “現在所需的推理計算量已經比大型語言模型剛開始出現時增加了100倍,而這僅僅是個開始。”英偉達首席執行官黃仁勛在今年2月時公開表示。

      無獨有偶,摩根士丹利分析師也預估,未來幾年美國超過75%的電力和計算需求將用于推理。

      推理算力需求百倍增長的背后,是觸及到了企業AI應用落地的核心邏輯:推理性能直接決定了用戶體驗的優劣與商業模式的可行性。正因如此,AI推理這塊蛋糕,成為了基建企業勢在必得之利。

      華為近期發布的UCM推理記憶數據管理器,被業界譽為AI推理技術的一次重大革命。然而,華為落子AI推理的真正意圖,遠不止于押注單一技術的工具增益,而在于構筑一盤AI生態的大棋局。

      Part.1

      AI步入深水區

      推理成增長奇點

      AI浪潮席卷之下,產業鏈上下游機遇與挑戰并存,AI推理首當其沖,成為重要戰場與增長爆點。

      中信建投最新白皮書揭示顯著趨勢,隨著AI算力消耗從訓練向推理的結構性轉變,國內算力消耗正快速增長。以字節跳動為例,其Token消耗量每三個月近乎翻倍,5月底已達16.4萬億Token。按此增速,主流云服務商將很快感受到算力緊張,出現算力缺口——單次Agent任務平均消耗Token量級已攀升至10萬量級。

      然而,新興市場的定價邏輯往往異于常理,并不完全由需求決定價格。面對大模型藍海,巨頭、創企、運營商…各類企業蜂擁而入,ToB市場也沒能逃脫卷價格的魔咒。

      自去年5月先是阿里云打響大模型降價第一槍,后百度旋即宣布文心兩大主力模型ERNIE Speed和ERNIE Lite全面免費,再至今年6月,豆包大模型1.6發布并進一步降低價格門檻壓至2.6元/百萬Tokens。

      價格廝殺背后,Token的處理成本和質量成為大模型行業競爭的關鍵要素,AI推理能力則成為撬動增長的關鍵奇點。MiniMax創始人、CEO閆俊杰斷言:“在接下來一兩年之內,最好模型的推理成本可能還能再降低一個數量級。”

      但技術差距不容忽視。據華為數據顯示,目前國外主要大模型(OpenAI O3-mini、Google Gemini等)服務的單用戶輸出速度已達200 tokens/s區間(時延5ms),而國內普遍低于60 tokens/s(時延50—100ms)。

      OpenAI O3 mini每秒輸出的Token數約為國內某開源大模型的10倍,用戶體驗差異立現,直接感受到OpenAI的回答速度比國內大模型要快很多。由此可見,中國AI推理市場還有很大的上升空間。

      正如華為公司副總裁、數據存儲產品線總裁周躍峰所言:“AI時代,模型訓練、推理效率與體驗的量綱都以Token數為表征,Token經濟已經到來”。

      搶占Token時代先機,是華為布局AI推理最顯性的戰略落子,這是華為的第一個算盤。

      Part.2

      華為UCM

      AI推理能力橫向剖析

      聚焦華為最新推出的AI推理技術UCM,其核心競爭力與市場定位究竟如何?

      華為UCM是一款以KV Cache(鍵值緩存)為中心的推理加速套件,融合多類型緩存加速算法工具,可以分級管理推理過程中產生的KV Cache記憶數據,擴大推理上下文窗口,以實現高吞吐、低時延的推理體驗,從而降低每個Token的推理成本。

      通易而言,華為UCM就像是廚房的智能調度系統,可以把廚師做菜時需要的各種食材清單(KV Cache),用不同大小的白板、活頁夾和文件柜(多級緩存)分門別類存放,再搭配各種記憶管理工具(緩存算法工具),使大廚能輕松記住超長的菜單(擴大上下文),從而出菜更快(低延遲),能夠服務更多客人(高吞吐),同時還更省人力(降低每個Token的成本)。最終,顧客(使用AI)的體驗就是上菜快、服務好、價格實惠。

      和業界相比,華為UCM的差異化優勢體現在從單點算力模組轉向系統級優化。華為數據存儲產品線AI存儲首席架構師李國杰表示,業界有很多開源方案有類似的方向,有的是做了其中某一層或某一些組件,但是并未看到可商用的端到端完整方案,而UCM是第一個全流程、全場景且可演進的系統性方案。

      這也標志著,AI推理引擎從依賴單點算力模組,向整體系統效能優化的戰略轉變。

      此外UCM也是封鎖之下的應對之策。美國自2025年1月2日起全面禁止向中國出口HBM2E及以上級別高帶寬內存。這對依賴先進硬件的AI發展構成發展障礙。

      與普通內存(DDR)相比,HBM的傳送帶寬度是其10倍以上,并且能實現數千條微型通道并行傳輸,但弊端就是費用十分高昂。在AI服務器中,HBM的成本占比約為20%至30%。

      而UCM可根據記憶熱度在HBM、DRAM、SSD等存儲介質中實現按需流動,同時融合多種稀疏注意力算法實現存算深度協同,使長序列場景下TPS(每秒處理Token數)提升2至22倍,從而降低每個Token的推理成本。

      外媒TEKEDIA報道指出,UCM的“核心訴求”和服務賣點很明確:如果軟件能更充分地挖掘普通內存的性能潛力,那么中國的供應商(如華為等廠商)就能在不那么依賴稀缺且昂貴的高帶寬內存(HBM)的情況下,依然提供有競爭力的AI推理服務。

      “這一點至關重要。因為全球HBM市場正在迅猛增長——今年規模約340億美元,預計到2030年將達980億美元——而其供應基本被SK海力士、三星和美光這三家非中國企業壟斷,完全不受中國控制。”

      可見UCM的意義遠不止在于提升AI推理效率,其更深層的戰略意圖是為華為在內的廠商,減少對HBM內存的依賴,構建一條降低關鍵硬件對外依存度、增強供應鏈韌性與自主可控能力的技術路徑。

      這是華為在復雜國際環境下的第二個算盤。

      Part.3

      開源筑基

      “產業帝國”輪廓初顯

      “大多數初創公司在早期階段依賴于最先進的模型,這些模型通常都是封閉的生態系統,擁有自己的推理機制,但今后會有越來越多的企業開始尋找替代方案,例如訓練自己的模型,或者使用開源模型來緩解部分經濟壓力。目前市面上已經有很多強大的開源模型,未來還會有更多。”Nebius首席技術官Danila Shtan表示。

      華為宣布計劃于今年9月正式開源UCM,屆時將在魔擎社區首發,后續逐步貢獻給業界主流推理引擎社區,并共享給業內所有Share Everything(共享架構)存儲廠商和生態伙伴。

      這一開源舉措,將吸引更多的開發者和企業參與到AI推理生態的建設中來,促進框架、存儲、GPU廠商共建和成熟化整套機制,激發創新活力,加速技術的迭代和優化。

      不過,UCM開源也絕非賠錢“搞慈善”,當中國乃至全球的存儲廠商、云服務商甚至競爭對手都跑在廣泛采用UCM時,一個基于華為技術棧、自主可控的AI推理基礎設施層將強勢崛起。屆時,一張由華為主導、覆蓋算力硬件、推理框架、應用落地全棧的超級生態網絡將浮出水面,新的“產業帝國”已初見輪廓。

      據不完全統計,圍繞UCM展開的AI推理生態“關鍵盟友”包括但不限于:算力硬件層的拓維信息、神州數碼、軟通動力、恒為科技等;推理框架層的華海誠科、格靈深瞳、寒武紀、瀾起科技等;應用落地層的潤達醫療、賽意信息、云鼎科技和高瀾股份等。

      開源亦是生態投資。通過賦能伙伴、壯大生態,華為將收獲更廣泛的應用場景反饋、更強大的標準話語權以及更穩固的市場基礎。這種“以商業成功反哺技術進化”的良性循環,何嘗不是一種“以戰養戰”的智慧?而這也是華為押注AI推理的第三個算盤。

      技術革新的車輪滾滾向前,模型的“思考”與推理能力只會愈發強大。華為押注AI推理的“三個算盤”,即搶占Token經濟先機、突破HBM封鎖、構建自主生態已清晰落子。而對于其他AI廠商而言,構建自主、強大且開放的生態,同樣是不容遲疑的戰略任務。

      留給中國企業的窗口期正在收窄,構建核心競爭力的戰役,已然打響。

      王慶儒@ okokok-74

      長期關注互聯網大廠、垂直行業頭部企業,歡迎建聯溝通

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “都腺樣體了,還給他吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      “都腺樣體了,還給他吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      妍妍教育日記
      2026-01-13 16:27:54
      果然不出所料,中國送歐洲一句“能救命”的話后,特朗普態度秒變

      果然不出所料,中國送歐洲一句“能救命”的話后,特朗普態度秒變

      知鑒明史
      2026-01-22 18:25:22
      李賽鳳趁丈夫出差,和體格壯碩的干兒子發生了親密接觸

      李賽鳳趁丈夫出差,和體格壯碩的干兒子發生了親密接觸

      西樓知趣雜談
      2026-01-20 17:11:19
      人社部明確!2026養老金繼續調整,1956年到1960年出生,漲更多嗎

      人社部明確!2026養老金繼續調整,1956年到1960年出生,漲更多嗎

      有范又有料
      2026-01-21 18:39:29
      協議緊急叫停?普京萬萬沒想到,中國正式斷供俄電,俄痛失大單

      協議緊急叫停?普京萬萬沒想到,中國正式斷供俄電,俄痛失大單

      冒泡泡的魚兒
      2026-01-21 11:54:12
      猝不及防?柯文哲突然翻臉,鄭麗文霸氣發聲,蔣萬安贏了!

      猝不及防?柯文哲突然翻臉,鄭麗文霸氣發聲,蔣萬安贏了!

      小正說娛樂
      2026-01-22 14:04:39
      寧夏回族自治區衛生健康委員會原黨組書記、主任呂金捍被提起公訴

      寧夏回族自治區衛生健康委員會原黨組書記、主任呂金捍被提起公訴

      界面新聞
      2026-01-22 16:06:16
      1換1!交易達成!你好,天才十號秀!

      1換1!交易達成!你好,天才十號秀!

      籃球實戰寶典
      2026-01-22 15:30:28
      中方沒有答應;特朗普通告全球:加稅200%;美媒罕見站隊中國

      中方沒有答應;特朗普通告全球:加稅200%;美媒罕見站隊中國

      小叨娛樂
      2026-01-22 13:56:51
      16GB+1TB!新機官宣:1月22日,正式發布上市!

      16GB+1TB!新機官宣:1月22日,正式發布上市!

      科技堡壘
      2026-01-22 11:06:21
      19+8!名帥之女留洋爆發 多記干拔三分 能敲開國家隊大門嗎?

      19+8!名帥之女留洋爆發 多記干拔三分 能敲開國家隊大門嗎?

      你看球呢
      2026-01-22 15:48:48
      WTT常規賽:向鵬連輸2局!挽救局點仍8-11惜敗,卡爾伯格2-0沖8強

      WTT常規賽:向鵬連輸2局!挽救局點仍8-11惜敗,卡爾伯格2-0沖8強

      劉姚堯的文字城堡
      2026-01-22 16:44:25
      工信部下達“強制瘦身令”:不達標的新能源車,禁止“出道”

      工信部下達“強制瘦身令”:不達標的新能源車,禁止“出道”

      DearAuto
      2026-01-21 09:52:46
      從U20國青到U23,泰山雙星拉開差距:彭嘯、史松宸已不在一個段位

      從U20國青到U23,泰山雙星拉開差距:彭嘯、史松宸已不在一個段位

      球場沒跑道
      2026-01-22 12:01:20
      官方:39歲前廣東外援威姆斯加盟NBL新軍焦作文旅

      官方:39歲前廣東外援威姆斯加盟NBL新軍焦作文旅

      懂球帝
      2026-01-22 18:04:11
      我出售南京的大平層搬進女兒家,女兒以為我睡熟了,跟女婿密謀

      我出售南京的大平層搬進女兒家,女兒以為我睡熟了,跟女婿密謀

      朝暮書屋
      2026-01-21 17:26:45
      廣東名記質疑CBA裁判:廣東隊做不行,為何其他球隊做就可以

      廣東名記質疑CBA裁判:廣東隊做不行,為何其他球隊做就可以

      體育哲人
      2026-01-22 17:56:05
      山西省人民政府關于白杰飛等9人任免職務的通知

      山西省人民政府關于白杰飛等9人任免職務的通知

      錦繡太原
      2026-01-22 09:46:35
      嘲笑川普的人該補歷史課:美國購買格陵蘭是150年的國家戰略

      嘲笑川普的人該補歷史課:美國購買格陵蘭是150年的國家戰略

      斌聞天下
      2026-01-22 06:20:03
      北京首輛加長勞斯萊斯銀刺,車里帶電話,開庫里南的都羨慕

      北京首輛加長勞斯萊斯銀刺,車里帶電話,開庫里南的都羨慕

      華庭講美食
      2026-01-22 12:10:42
      2026-01-22 19:39:00
      正見TrueView incentive-icons
      正見TrueView
      去見證,用正見。
      262文章數 235關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      "光速升遷"的朝鮮副總理被罷免 金正恩諷刺"羊拉牛車"

      頭條要聞

      "光速升遷"的朝鮮副總理被罷免 金正恩諷刺"羊拉牛車"

      體育要聞

      跑個步而已,他們在燃什么?

      娛樂要聞

      車銀優賺800億 涉嫌逃稅200億!

      財經要聞

      潘功勝:繼續實施好適度寬松的貨幣政策

      汽車要聞

      配備多塊娛樂屏 極氪8X內飾曝光

      態度原創

      手機
      游戲
      藝術
      公開課
      軍事航空

      手機要聞

      真我realme手機今年4月全面接入OPPO售后服務

      LPL春季賽:為了廠長,為了國電!EDG橫掃TT

      藝術要聞

      一場雪,飄進了唐詩

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      普京:愿意向"和平委員會"提供10億美元

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 性xxxx欧美老妇胖老太性多毛| 久久亚洲精品成人无码网站夜色| 国产午夜大地久久| 亚洲成人在线网址| 色欲二区| jlzz大jlzz大全免费| 日本中文字幕久久网站| 成人国产精品秘片多多| 安新县| 国产精品国产高清国产av| 2025中文无码| A成片人| 狠狠爱网站| 亚洲自偷自拍另类第1页| 国精产品自偷自偷ym使用方法 | 伊人a?v| 动性与另类XXXXX杂性| 99热都是精品久久久久久| 国产福利微视频一区二区| 国产精品一区二区久久毛片| 亚洲男人第一无码av网站| 国产一本一道久久香蕉下载| 久久国产欧美日韩精品图片| 色二区| 亚洲精品av一二三区无码| 91一区二区| 亚洲成人精品无码| 亚洲丶国产丶欧美一区二区三区| 99这里只有精品6| 中文字幕在线日韩一区| 在线欧美日韩| 男人吃奶玩奶乳30分钟| 国产午夜福利精品视频| 日韩精品久久无码中文字幕| 婷婷综合久久狠狠色成人网| 久久九九精品99国产精品| 临颍县| 久久不见久久见免费影院www日本| 久草视频网| 亚洲中文字幕无码永久在线 | 国产欧美精品一区二区三区,|