![]()
作者 | 允毅、木子
今年的 CES 真可謂是八仙過海,黃仁勛、蘇姿豐、陳力武等“經(jīng)典面孔”齊亮相; 不過臺(tái)上談的已不只限于顯卡、算力和制程,還在于 AI 接下來要被帶去哪里。
在 AMD 的專場演講中,蘇媽甩出一個(gè)大膽判斷:
“未來五年內(nèi),將有 50 億人每天使用 AI,超過世界人口的一半。”
——什么概念?就是這個(gè)增長速度將遠(yuǎn)超互聯(lián)網(wǎng)早期階段,自 ChatGPT 在 2022 年底發(fā)布以來,AI 活躍用戶已從 100 萬暴漲至 10 億 +。
值得一提的是,這場演講還請來了“AI 教母”李飛飛。
李飛飛并不是來站臺(tái)新品的,她和蘇媽主要探討空間智能和世界模型,這也是她已耕深 20 余年的領(lǐng)域。
![]()
此外,OpenAI 總裁兼聯(lián)合創(chuàng)始人 Greg Brockman 也登臺(tái)助陣,指出行業(yè)痛點(diǎn):“計(jì)算能力,仍然是 AI 走向通用智能的最大瓶頸。世界需要的 GPU 數(shù)量,遠(yuǎn)超我們現(xiàn)在擁有的規(guī)模。”
而這正是 AMD 接下來要解決的事情,他們希望能補(bǔ)齊 AI 普及所需的算力基礎(chǔ)設(shè)施。在蘇姿豐描述的未來世界里,AI 將無處不在,算力將人人可及——她這次在 CES 上拋出的,不只是幾塊更強(qiáng)的 GPU,而是一套完整的 AI 版圖。
對于云端,基于下一代 MI455 GPU 的 Helios 機(jī)架級(jí)平臺(tái)成為全場焦點(diǎn):單機(jī)架集成 72 塊 AI GPU,算力高達(dá) 2.9 ExaFLOPS,可通過成千上萬個(gè)機(jī)架拼接成超大訓(xùn)練集群,直指千億參數(shù)大模型的核心戰(zhàn)場。
談到云端算力的未來,蘇姿豐毫不掩飾 AMD 的野心:
“全球人工智能運(yùn)行在云端,而云端運(yùn)行在 AMD 平臺(tái)上。”
另外,她還指出,下一代 Instinct 數(shù)據(jù)中心 AI 加速器平臺(tái) MI500 系列,將在 2027 年推出并全面轉(zhuǎn)向 2nm 工藝,并放出狠話:希望借此在四年內(nèi) AI 芯片性能提升 1000 倍(遠(yuǎn)超摩爾定律啊...)。
與此同時(shí),AMD 還在推動(dòng)把 AI 從云端下放到本地,而他們的一個(gè)很核心的落點(diǎn),是 AIPC。
Ryzen AI 通過內(nèi)置 NPU(神經(jīng)網(wǎng)絡(luò)處理單元,一種專門為 AI 推理設(shè)計(jì)的處理器)讓 AI 本地運(yùn)行、離線可用。
![]()
Helios 機(jī)架級(jí)平臺(tái)和 AIPC
在數(shù)據(jù)中心這一 AI 算力的核心戰(zhàn)場,AMD 開始賣“一整個(gè)機(jī)架”的算力方案 Helios,一個(gè)幾乎重新定義“數(shù)據(jù)中心硬件形態(tài)”的存在。
Helios,是 AMD 面向 YottaFLOPS 級(jí) AI 的下一代機(jī)架級(jí)平臺(tái),也是本場 AMD 發(fā)布會(huì)的“鎮(zhèn)場之作”。
所謂 YottaFLOPS 級(jí) AI,就是算力達(dá)到 102? 次浮點(diǎn)運(yùn)算 / 秒 的人工智能系統(tǒng)。直觀地說,它不只是“更快的 AI”,而是能在極短時(shí)間內(nèi)模擬、理解和優(yōu)化極其復(fù)雜的世界系統(tǒng),如全球氣候、全人類基因等,能力規(guī)模遠(yuǎn)超今天任何單一 AI 模型。
Helios 從一開始就按大模型需求設(shè)計(jì),用開放的 OCP 機(jī)架標(biāo)準(zhǔn)做底座,并與 Meta 合作開發(fā),強(qiáng)調(diào)模塊化、可擴(kuò)展、能快速堆出大集群。
Helios 的核心是一種全新的算力組織方式,能將 72 顆芯片協(xié)同工作。
其中的系統(tǒng)設(shè)計(jì)是通過高速互聯(lián)和軟件棧,把這些 GPU 組織成一個(gè)可以統(tǒng)一調(diào)度的算力池,讓它們更像一個(gè)整體,而不是“72 個(gè)獨(dú)立設(shè)備”。在 FP4 這種推理常用的低精度口徑下,單臺(tái) Helios 機(jī)架式服務(wù)器可提供高達(dá) 2.9 ExaFLOPS 的算力,并搭載 31TB 容量的 HBM4。
如果再把數(shù)千個(gè) Helios 機(jī)架互聯(lián)起來,就能搭建出面向萬億參數(shù)模型訓(xùn)練和推理的超大規(guī)模集群。
至于 Helios 的算力底座,是 AMD 最新一代 Instinct MI455 GPU,也是 AMD 歷史上跨代提升幅度最大的 Instinct GPU。
這顆芯片擁有超過 3000 億個(gè)晶體管,相比 MI300 系列提升約 70%,推理與訓(xùn)練綜合性能最高可達(dá) 10× 提升。
AMD 對 MI455 GPU 的定位非常明確:它要解決大模型訓(xùn)練和推理里最棘手的瓶頸“內(nèi)存墻”。大模型跑不動(dòng),很多時(shí)候不是算力不夠,而是數(shù)據(jù)喂不進(jìn)去、內(nèi)存帶寬跟不上。
這顆加速器芯片采用 2nm 與 3nm 混合工藝打造,再配上先進(jìn)的 3D 小芯片封裝技術(shù),并搭載新一代 HBM4 高帶寬內(nèi)存。
更重要的是,MI455 并不是孤立地“做一顆更強(qiáng)的 GPU”,它在計(jì)算托盤層面就與 EPYC 服務(wù)器 CPU、Pensando 網(wǎng)絡(luò)芯片深度集成,讓 CPU、GPU、網(wǎng)絡(luò)協(xié)同成為平臺(tái)能力,而不再是分散組件的簡單拼接。
蘇姿豐打了個(gè)生動(dòng)的比方:“Helios 是個(gè)龐然大物般的貨架,它不是普通的貨架,而是雙倍寬度的設(shè)計(jì),重量接近 7000 磅。”她指出,這個(gè)機(jī)架的重量超過兩輛小型轎車的總重量。
![]()
時(shí)至今日,AI 的推理能力已被推到聚光燈下,其特點(diǎn)是調(diào)用頻率高、負(fù)載長期持續(xù),進(jìn)一步帶來更明顯的算力缺口。
蘇姿豐分享稱,AMD 下一代 MI500 系列正在開發(fā)中,計(jì)劃全面轉(zhuǎn)向 2nm 工藝,發(fā)布時(shí)間定在 2027 年。按照 AMD 給出的路線圖,從 MI300 到 MI500 的四年周期內(nèi),其 AI 計(jì)算性能目標(biāo)提升幅度達(dá)到 1000 倍。
![]()
她將這一跨代躍遷稱為“公司歷史上幅度最大的一次性能提升規(guī)劃”,并將其視為支撐下一階段超大模型訓(xùn)練和推理需求的關(guān)鍵基礎(chǔ)。
在數(shù)據(jù)中心之外,AMD 還把另一張牌打到終端側(cè):把原本只能在云端完成的 AI 工作,搬到個(gè)人電腦上。
Ryzen AI Max 400 系列(代號(hào) Strix Halo)正是這一策略的核心載體。AMD 給它的定位并不含糊:面向 AI 開發(fā)者和高端創(chuàng)作者,做一顆“能真正干活”的本地 AI 芯片。
![]()
與 Ryzen AI 300 一樣,Ryzen AI Max 400 系列依然是 Zen 5 和 RDNA 3.5,但支持更快內(nèi)存速度。
簡單來說,Ryzen AI 400 是一顆為 AI 筆記本打造的高性能處理器,最高配備 12 核 CPU,同時(shí)集成了 更強(qiáng)的核顯 和 最高 60 TOPS 的專用 AI 引擎。再加上對高速內(nèi)存的支持,讓它在多任務(wù)、創(chuàng)作以及本地 AI 應(yīng)用中運(yùn)行得更流暢。
但相比傳統(tǒng)性能參數(shù),更關(guān)鍵的是它的系統(tǒng)設(shè)計(jì):芯片同時(shí)集成 XDNA 2 NPU,并采用統(tǒng)一內(nèi)存架構(gòu),CPU 與 GPU 之間可共享最高 128GB 內(nèi)存。
這也是能否跑大模型的前提條件。對本地 AI 來說,算力是否夠強(qiáng)是一回事,模型能不能完整裝進(jìn)內(nèi)存、數(shù)據(jù)能不能順暢流動(dòng),往往才是決定成敗的關(guān)鍵。
AMD 用一場直觀的演示給出了答案:一臺(tái)搭載 Ryzen AI 的設(shè)備,在完全離線的情況下,流暢運(yùn)行了一個(gè) 700 億參數(shù)的醫(yī)療大模型。
這意味著,開發(fā)者可以直接在筆記本上調(diào)試生成式模型;醫(yī)療、金融等行業(yè),也可以在不把數(shù)據(jù)上傳云端的前提下,完成模型推理和分析。本地終端不再只是“調(diào)用云端 AI”,而是開始真正承載模型本身。
擺數(shù)據(jù):在高端筆記本形態(tài)下,Ryzen AI Max 在 AI 與內(nèi)容創(chuàng)作類應(yīng)用中的表現(xiàn),快于最新一代 MacBook Pro;在小型工作站場景中,成本明顯低于英偉達(dá)的 DGX Spark,而且原生支持 Windows + Linux。
AMD 還貼心地發(fā)布了一個(gè)本地 AI 參考平臺(tái):Ryzen AI Halo 。
![]()
官方將其稱為“世界上最小的 AI 開發(fā)系統(tǒng)”,可在完全離線的條件下運(yùn)行多達(dá) 2000 億參數(shù)模型,面向需要隨時(shí)隨地進(jìn)行模型開發(fā)和部署的專業(yè)用戶。
那些過去只能在數(shù)據(jù)中心機(jī)房里完成的工作,正在被壓縮進(jìn)一個(gè)可以隨身攜帶的設(shè)備。
和李飛飛同臺(tái)聊空間智能
前文提到“AI 教母”李飛飛也亮相了;其實(shí)在這種聚焦硬件與平臺(tái)發(fā)布的商業(yè)舞臺(tái)上,李飛飛不常露面,她更常被視為學(xué)術(shù)界和公共討論中的“定錨者”。
李飛飛此次在 AMD 的專場講演登臺(tái),強(qiáng)調(diào) AI 不僅要生成內(nèi)容,更要理解并參與真實(shí)世界。
![]()
在這一點(diǎn)上,蘇姿豐的判斷高度一致,她表示,過去幾年,大語言模型的出圈(LLM)推動(dòng)了 AI 的爆發(fā),但無論是人類還是機(jī)器,智能并不只來自“看和說”,真正連接“感知 → 推理 → 行動(dòng)”的關(guān)鍵能力,是空間智能(Spatial Intelligence)。
過去這幾年,GPU 的快速發(fā)展已讓畫質(zhì)起飛了,但 3D 和 4D 世界卻還在慢慢搭,往往需要團(tuán)隊(duì)花費(fèi)數(shù)月甚至數(shù)年完成;而現(xiàn)在 AI 正在改變這種節(jié)奏。
李飛飛表示,她認(rèn)為 AI 正進(jìn)入一個(gè)新階段:從語言智能,邁向具備空間理解與行動(dòng)能力的生成式 AI:
“AI 在過去幾年取得了巨大突破,我在這個(gè)領(lǐng)域工作了二十多年,從未像現(xiàn)在這樣,對未來的發(fā)展感到如此興奮。”
她也介紹了自己創(chuàng)業(yè)公司 World Labs 的核心動(dòng)向:
World Labs 正在訓(xùn)練新一代世界模型(World Model)
目標(biāo)不是還原二維像素,而是直接學(xué)習(xí) 3D / 4D 結(jié)構(gòu);物體之間的空間關(guān)系;深度、尺度、物理一致性
已煉成的關(guān)鍵能力,包括僅憑幾張照片,甚至單張圖片,模型即可補(bǔ)全被遮擋區(qū)域、推斷物體背后的結(jié)構(gòu),然后生成一致、持久、可導(dǎo)航的 3D 世界。
不是照片也不是視頻,而是真正保持幾何一致性的三維空間,具備“空間補(bǔ)全與想象”能力,而非拼貼。
李飛飛指出,過去需要數(shù)月才能完成的 3D 場景建模,現(xiàn)在可以在幾分鐘內(nèi)完成。
她舉例說明潛在影響:創(chuàng)作者:實(shí)時(shí)“在世界中創(chuàng)作”;機(jī)器人 / 自動(dòng)駕駛:在物理一致的虛擬世界中訓(xùn)練,再進(jìn)入現(xiàn)實(shí);設(shè)計(jì)師 / 建筑師:直接“走進(jìn)”設(shè)計(jì),而不是看平面圖。
她還特別強(qiáng)調(diào)了一個(gè)常被忽略的點(diǎn):世界模型并不是“離線生成完就結(jié)束”,它需要實(shí)時(shí)響應(yīng)、即時(shí)編輯,連續(xù)保持空間一致性。
這意味著:極高的內(nèi)存需求,大規(guī)模并行計(jì)算,非常快的推理速度,否則世界就無法“活起來”。
談及算力,李飛飛也透露稱:World Labs 的世界模型已運(yùn)行在 AMD 的 MI325X GPU 與 ROCm 軟件棧之上,并在短短幾周內(nèi)實(shí)現(xiàn)了 超過 4 倍的推理性能提升。
她還提到,隨著 MI450 等后續(xù)平臺(tái) 推出,更大規(guī)模世界模型的訓(xùn)練與實(shí)時(shí)運(yùn)行將成為可能。
其他亮眼新品
游戲和消費(fèi)級(jí)顯卡:
在消費(fèi)級(jí)圖形領(lǐng)域,AMD 本次帶來的主要新品是 Radeon RX 9070 和 Radeon RX 9070 XT。
這兩張顯卡均搭載了 AMD 的全新 RDNA 4 架構(gòu),以及最新 AI 圖像技術(shù)(包括 FSR 4),將游戲體驗(yàn)推向“AI 加速 + 實(shí)時(shí)渲染”雙驅(qū)動(dòng)的新時(shí)代。
其中 RX 9070 XT 的 64 個(gè)計(jì)算單元、較高頻率設(shè)計(jì),讓其在多款 3A 游戲中表現(xiàn)強(qiáng)勁,在 4K 最高設(shè)置下幀率表現(xiàn)明顯領(lǐng)先前代,在 30 多款游戲中平均比 RX 7900 GRE 快 42%。
![]()
而 RX 9070 的規(guī)格稍低一些(但同樣 16 GB 顯存),其光追與 AI 能力也因較少計(jì)算單元略弱,不過仍能在高畫質(zhì)下保持流暢體驗(yàn),在 30 多款游戲中平均比 RX 7900GRE 的幀率快 21%。
![]()
綜合來看,這兩款顯卡延續(xù)了 RDNA 4 在 高效能比、AI 支持(如 FSR 4)、光追性能提升 上的特性,適用于 1440p 到 4K 游戲場景。
AI 專用 CPU:
EPYC Venice 是 AMD 為“AI 數(shù)據(jù)中心時(shí)代”打造的下一代服務(wù)器 CPU。
它采用 2nm 工藝,最多可集成 256 個(gè) Zen 6 高性能核心,定位不只是“算得更快”,而是專門為 AI 集群服務(wù)。
相比上一代 EPYC,Venice 的內(nèi)存帶寬和 GPU 帶寬都實(shí)現(xiàn)了翻倍,核心目標(biāo)只有一個(gè):在機(jī)架級(jí)規(guī)模下,持續(xù)、穩(wěn)定地把數(shù)據(jù)“喂”給 MI455X 等 AI GPU。換句話說,它不追求搶 GPU 的計(jì)算活,而是負(fù)責(zé)調(diào)度、通信和數(shù)據(jù)供給,避免 GPU 因“等數(shù)據(jù)”而空轉(zhuǎn)。
為了支撐這種規(guī)模,EPYC Venice 還配套 800G 以太網(wǎng),并結(jié)合 Pensando Volcano / Selena 網(wǎng)絡(luò)芯片,面向萬級(jí)機(jī)架規(guī)模的橫向擴(kuò)展。
在 AMD 的設(shè)計(jì)中,Venice 不只是服務(wù)器 CPU,而是 AI 機(jī)架級(jí)系統(tǒng)里的“中樞處理器”,決定整個(gè)集群能否高效運(yùn)轉(zhuǎn)。
https://www.youtube.com/watch?v=UbfAhFxDomE&list=TLGGBbam0h3MCckwNjAxMjAyNg&t=3063s
https://www.techtimes.com/articles/313772/20260105/amd-ceo-lisa-su-declares-ai-everyone-ces-2026-guests-openai-luma-ai-liquid-ai-world-labs.htm
https://www.amd.com/content/dam/amd/en/documents/corporate/events/amd-ces-2026-distribution-deck.pdf
聲明:本文為 AI前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
技術(shù)人的年度儀式感! 年度盤點(diǎn)與趨勢洞察 啟動(dòng)!
《2025 年度盤點(diǎn)與趨勢洞察》由 InfoQ 技術(shù)編輯組策劃。覆蓋大模型、Agent、具身智能、AI Native 開發(fā)范式、AI 工具鏈與開發(fā)、AI+ 傳統(tǒng)行業(yè)等方向,通過長期跟蹤、與業(yè)內(nèi)專家深度訪談等方式,對重點(diǎn)領(lǐng)域進(jìn)行關(guān)鍵技術(shù)進(jìn)展、核心事件和產(chǎn)業(yè)趨勢的洞察盤點(diǎn)。
力求以體系化視角幫助讀者理解年度技術(shù)演化的底層邏輯、創(chuàng)新方向與落地價(jià)值,并為新一年決策提供參考。內(nèi)容將在 InfoQ 媒體矩陣陸續(xù)放出,歡迎大家持續(xù)關(guān)注。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.