網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

蘇媽和李飛飛炸場CES！AMD AI全棧野心顯露：從云端到個(gè)人PC，AI芯片性能四年要飆1000倍

2026-01-06 20:52:16　來源: AI前線

北京舉報(bào)

分享至

作者 | 允毅、木子

今年的 CES 真可謂是八仙過海，黃仁勛、蘇姿豐、陳力武等“經(jīng)典面孔”齊亮相；不過臺(tái)上談的已不只限于顯卡、算力和制程，還在于 AI 接下來要被帶去哪里。

在 AMD 的專場演講中，蘇媽甩出一個(gè)大膽判斷：

“未來五年內(nèi)，將有 50 億人每天使用 AI，超過世界人口的一半。”

——什么概念？就是這個(gè)增長速度將遠(yuǎn)超互聯(lián)網(wǎng)早期階段，自 ChatGPT 在 2022 年底發(fā)布以來，AI 活躍用戶已從 100 萬暴漲至 10 億 +。

值得一提的是，這場演講還請來了“AI 教母”李飛飛。

李飛飛并不是來站臺(tái)新品的，她和蘇媽主要探討空間智能和世界模型，這也是她已耕深 20 余年的領(lǐng)域。

此外，OpenAI 總裁兼聯(lián)合創(chuàng)始人 Greg Brockman 也登臺(tái)助陣，指出行業(yè)痛點(diǎn)：“計(jì)算能力，仍然是 AI 走向通用智能的最大瓶頸。世界需要的 GPU 數(shù)量，遠(yuǎn)超我們現(xiàn)在擁有的規(guī)模。”

而這正是 AMD 接下來要解決的事情，他們希望能補(bǔ)齊 AI 普及所需的算力基礎(chǔ)設(shè)施。在蘇姿豐描述的未來世界里，AI 將無處不在，算力將人人可及——她這次在 CES 上拋出的，不只是幾塊更強(qiáng)的 GPU，而是一套完整的 AI 版圖。

對于云端，基于下一代 MI455 GPU 的 Helios 機(jī)架級(jí)平臺(tái)成為全場焦點(diǎn)：單機(jī)架集成 72 塊 AI GPU，算力高達(dá) 2.9 ExaFLOPS，可通過成千上萬個(gè)機(jī)架拼接成超大訓(xùn)練集群，直指千億參數(shù)大模型的核心戰(zhàn)場。

談到云端算力的未來，蘇姿豐毫不掩飾 AMD 的野心：

“全球人工智能運(yùn)行在云端，而云端運(yùn)行在 AMD 平臺(tái)上。”

另外，她還指出，下一代 Instinct 數(shù)據(jù)中心 AI 加速器平臺(tái) MI500 系列，將在 2027 年推出并全面轉(zhuǎn)向 2nm 工藝，并放出狠話：希望借此在四年內(nèi) AI 芯片性能提升 1000 倍（遠(yuǎn)超摩爾定律啊...）。

與此同時(shí)，AMD 還在推動(dòng)把 AI 從云端下放到本地，而他們的一個(gè)很核心的落點(diǎn)，是 AIPC。

Ryzen AI 通過內(nèi)置 NPU（神經(jīng)網(wǎng)絡(luò)處理單元，一種專門為 AI 推理設(shè)計(jì)的處理器）讓 AI 本地運(yùn)行、離線可用。

Helios 機(jī)架級(jí)平臺(tái)和 AIPC

在數(shù)據(jù)中心這一 AI 算力的核心戰(zhàn)場，AMD 開始賣“一整個(gè)機(jī)架”的算力方案 Helios，一個(gè)幾乎重新定義“數(shù)據(jù)中心硬件形態(tài)”的存在。

Helios，是 AMD 面向 YottaFLOPS 級(jí) AI 的下一代機(jī)架級(jí)平臺(tái)，也是本場 AMD 發(fā)布會(huì)的“鎮(zhèn)場之作”。

所謂 YottaFLOPS 級(jí) AI，就是算力達(dá)到 102? 次浮點(diǎn)運(yùn)算 / 秒的人工智能系統(tǒng)。直觀地說，它不只是“更快的 AI”，而是能在極短時(shí)間內(nèi)模擬、理解和優(yōu)化極其復(fù)雜的世界系統(tǒng)，如全球氣候、全人類基因等，能力規(guī)模遠(yuǎn)超今天任何單一 AI 模型。

Helios 從一開始就按大模型需求設(shè)計(jì)，用開放的 OCP 機(jī)架標(biāo)準(zhǔn)做底座，并與 Meta 合作開發(fā)，強(qiáng)調(diào)模塊化、可擴(kuò)展、能快速堆出大集群。

Helios 的核心是一種全新的算力組織方式，能將 72 顆芯片協(xié)同工作。

其中的系統(tǒng)設(shè)計(jì)是通過高速互聯(lián)和軟件棧，把這些 GPU 組織成一個(gè)可以統(tǒng)一調(diào)度的算力池，讓它們更像一個(gè)整體，而不是“72 個(gè)獨(dú)立設(shè)備”。在 FP4 這種推理常用的低精度口徑下，單臺(tái) Helios 機(jī)架式服務(wù)器可提供高達(dá) 2.9 ExaFLOPS 的算力，并搭載 31TB 容量的 HBM4。

如果再把數(shù)千個(gè) Helios 機(jī)架互聯(lián)起來，就能搭建出面向萬億參數(shù)模型訓(xùn)練和推理的超大規(guī)模集群。

至于 Helios 的算力底座，是 AMD 最新一代 Instinct MI455 GPU，也是 AMD 歷史上跨代提升幅度最大的 Instinct GPU。

這顆芯片擁有超過 3000 億個(gè)晶體管，相比 MI300 系列提升約 70%，推理與訓(xùn)練綜合性能最高可達(dá) 10× 提升。

AMD 對 MI455 GPU 的定位非常明確：它要解決大模型訓(xùn)練和推理里最棘手的瓶頸“內(nèi)存墻”。大模型跑不動(dòng)，很多時(shí)候不是算力不夠，而是數(shù)據(jù)喂不進(jìn)去、內(nèi)存帶寬跟不上。

這顆加速器芯片采用 2nm 與 3nm 混合工藝打造，再配上先進(jìn)的 3D 小芯片封裝技術(shù)，并搭載新一代 HBM4 高帶寬內(nèi)存。

更重要的是，MI455 并不是孤立地“做一顆更強(qiáng)的 GPU”，它在計(jì)算托盤層面就與 EPYC 服務(wù)器 CPU、Pensando 網(wǎng)絡(luò)芯片深度集成，讓 CPU、GPU、網(wǎng)絡(luò)協(xié)同成為平臺(tái)能力，而不再是分散組件的簡單拼接。

蘇姿豐打了個(gè)生動(dòng)的比方：“Helios 是個(gè)龐然大物般的貨架，它不是普通的貨架，而是雙倍寬度的設(shè)計(jì)，重量接近 7000 磅。”她指出，這個(gè)機(jī)架的重量超過兩輛小型轎車的總重量。

時(shí)至今日，AI 的推理能力已被推到聚光燈下，其特點(diǎn)是調(diào)用頻率高、負(fù)載長期持續(xù)，進(jìn)一步帶來更明顯的算力缺口。

蘇姿豐分享稱，AMD 下一代 MI500 系列正在開發(fā)中，計(jì)劃全面轉(zhuǎn)向 2nm 工藝，發(fā)布時(shí)間定在 2027 年。按照 AMD 給出的路線圖，從 MI300 到 MI500 的四年周期內(nèi)，其 AI 計(jì)算性能目標(biāo)提升幅度達(dá)到 1000 倍。

她將這一跨代躍遷稱為“公司歷史上幅度最大的一次性能提升規(guī)劃”，并將其視為支撐下一階段超大模型訓(xùn)練和推理需求的關(guān)鍵基礎(chǔ)。

在數(shù)據(jù)中心之外，AMD 還把另一張牌打到終端側(cè)：把原本只能在云端完成的 AI 工作，搬到個(gè)人電腦上。

Ryzen AI Max 400 系列（代號(hào) Strix Halo）正是這一策略的核心載體。AMD 給它的定位并不含糊：面向 AI 開發(fā)者和高端創(chuàng)作者，做一顆“能真正干活”的本地 AI 芯片。

與 Ryzen AI 300 一樣，Ryzen AI Max 400 系列依然是 Zen 5 和 RDNA 3.5，但支持更快內(nèi)存速度。

簡單來說，Ryzen AI 400 是一顆為 AI 筆記本打造的高性能處理器，最高配備 12 核 CPU，同時(shí)集成了更強(qiáng)的核顯和最高 60 TOPS 的專用 AI 引擎。再加上對高速內(nèi)存的支持，讓它在多任務(wù)、創(chuàng)作以及本地 AI 應(yīng)用中運(yùn)行得更流暢。

但相比傳統(tǒng)性能參數(shù)，更關(guān)鍵的是它的系統(tǒng)設(shè)計(jì)：芯片同時(shí)集成 XDNA 2 NPU，并采用統(tǒng)一內(nèi)存架構(gòu)，CPU 與 GPU 之間可共享最高 128GB 內(nèi)存。

這也是能否跑大模型的前提條件。對本地 AI 來說，算力是否夠強(qiáng)是一回事，模型能不能完整裝進(jìn)內(nèi)存、數(shù)據(jù)能不能順暢流動(dòng)，往往才是決定成敗的關(guān)鍵。

AMD 用一場直觀的演示給出了答案：一臺(tái)搭載 Ryzen AI 的設(shè)備，在完全離線的情況下，流暢運(yùn)行了一個(gè) 700 億參數(shù)的醫(yī)療大模型。

這意味著，開發(fā)者可以直接在筆記本上調(diào)試生成式模型；醫(yī)療、金融等行業(yè)，也可以在不把數(shù)據(jù)上傳云端的前提下，完成模型推理和分析。本地終端不再只是“調(diào)用云端 AI”，而是開始真正承載模型本身。

擺數(shù)據(jù)：在高端筆記本形態(tài)下，Ryzen AI Max 在 AI 與內(nèi)容創(chuàng)作類應(yīng)用中的表現(xiàn)，快于最新一代 MacBook Pro；在小型工作站場景中，成本明顯低于英偉達(dá)的 DGX Spark，而且原生支持 Windows + Linux。

AMD 還貼心地發(fā)布了一個(gè)本地 AI 參考平臺(tái)：Ryzen AI Halo 。

官方將其稱為“世界上最小的 AI 開發(fā)系統(tǒng)”，可在完全離線的條件下運(yùn)行多達(dá) 2000 億參數(shù)模型，面向需要隨時(shí)隨地進(jìn)行模型開發(fā)和部署的專業(yè)用戶。

那些過去只能在數(shù)據(jù)中心機(jī)房里完成的工作，正在被壓縮進(jìn)一個(gè)可以隨身攜帶的設(shè)備。

和李飛飛同臺(tái)聊空間智能

前文提到“AI 教母”李飛飛也亮相了；其實(shí)在這種聚焦硬件與平臺(tái)發(fā)布的商業(yè)舞臺(tái)上，李飛飛不常露面，她更常被視為學(xué)術(shù)界和公共討論中的“定錨者”。

李飛飛此次在 AMD 的專場講演登臺(tái)，強(qiáng)調(diào) AI 不僅要生成內(nèi)容，更要理解并參與真實(shí)世界。

在這一點(diǎn)上，蘇姿豐的判斷高度一致，她表示，過去幾年，大語言模型的出圈（LLM）推動(dòng)了 AI 的爆發(fā)，但無論是人類還是機(jī)器，智能并不只來自“看和說”，真正連接“感知 → 推理 → 行動(dòng)”的關(guān)鍵能力，是空間智能（Spatial Intelligence）。

過去這幾年，GPU 的快速發(fā)展已讓畫質(zhì)起飛了，但 3D 和 4D 世界卻還在慢慢搭，往往需要團(tuán)隊(duì)花費(fèi)數(shù)月甚至數(shù)年完成；而現(xiàn)在 AI 正在改變這種節(jié)奏。

李飛飛表示，她認(rèn)為 AI 正進(jìn)入一個(gè)新階段：從語言智能，邁向具備空間理解與行動(dòng)能力的生成式 AI：

“AI 在過去幾年取得了巨大突破，我在這個(gè)領(lǐng)域工作了二十多年，從未像現(xiàn)在這樣，對未來的發(fā)展感到如此興奮。”

她也介紹了自己創(chuàng)業(yè)公司 World Labs 的核心動(dòng)向：

World Labs 正在訓(xùn)練新一代世界模型（World Model）
目標(biāo)不是還原二維像素，而是直接學(xué)習(xí) 3D / 4D 結(jié)構(gòu)；物體之間的空間關(guān)系；深度、尺度、物理一致性

已煉成的關(guān)鍵能力，包括僅憑幾張照片，甚至單張圖片，模型即可補(bǔ)全被遮擋區(qū)域、推斷物體背后的結(jié)構(gòu)，然后生成一致、持久、可導(dǎo)航的 3D 世界。

不是照片也不是視頻，而是真正保持幾何一致性的三維空間，具備“空間補(bǔ)全與想象”能力，而非拼貼。

李飛飛指出，過去需要數(shù)月才能完成的 3D 場景建模，現(xiàn)在可以在幾分鐘內(nèi)完成。

她舉例說明潛在影響：創(chuàng)作者：實(shí)時(shí)“在世界中創(chuàng)作”；機(jī)器人 / 自動(dòng)駕駛：在物理一致的虛擬世界中訓(xùn)練，再進(jìn)入現(xiàn)實(shí)；設(shè)計(jì)師 / 建筑師：直接“走進(jìn)”設(shè)計(jì)，而不是看平面圖。

她還特別強(qiáng)調(diào)了一個(gè)常被忽略的點(diǎn)：世界模型并不是“離線生成完就結(jié)束”，它需要實(shí)時(shí)響應(yīng)、即時(shí)編輯，連續(xù)保持空間一致性。

這意味著：極高的內(nèi)存需求，大規(guī)模并行計(jì)算，非常快的推理速度，否則世界就無法“活起來”。

談及算力，李飛飛也透露稱：World Labs 的世界模型已運(yùn)行在 AMD 的 MI325X GPU 與 ROCm 軟件棧之上，并在短短幾周內(nèi)實(shí)現(xiàn)了超過 4 倍的推理性能提升。

她還提到，隨著 MI450 等后續(xù)平臺(tái) 推出，更大規(guī)模世界模型的訓(xùn)練與實(shí)時(shí)運(yùn)行將成為可能。

其他亮眼新品

游戲和消費(fèi)級(jí)顯卡：

在消費(fèi)級(jí)圖形領(lǐng)域，AMD 本次帶來的主要新品是 Radeon RX 9070 和 Radeon RX 9070 XT。

這兩張顯卡均搭載了 AMD 的全新 RDNA 4 架構(gòu)，以及最新 AI 圖像技術(shù)（包括 FSR 4），將游戲體驗(yàn)推向“AI 加速 + 實(shí)時(shí)渲染”雙驅(qū)動(dòng)的新時(shí)代。

其中 RX 9070 XT 的 64 個(gè)計(jì)算單元、較高頻率設(shè)計(jì)，讓其在多款 3A 游戲中表現(xiàn)強(qiáng)勁，在 4K 最高設(shè)置下幀率表現(xiàn)明顯領(lǐng)先前代，在 30 多款游戲中平均比 RX 7900 GRE 快 42%。

而 RX 9070 的規(guī)格稍低一些（但同樣 16 GB 顯存），其光追與 AI 能力也因較少計(jì)算單元略弱，不過仍能在高畫質(zhì)下保持流暢體驗(yàn)，在 30 多款游戲中平均比 RX 7900GRE 的幀率快 21%。

綜合來看，這兩款顯卡延續(xù)了 RDNA 4 在高效能比、AI 支持（如 FSR 4）、光追性能提升上的特性，適用于 1440p 到 4K 游戲場景。

AI 專用 CPU：

EPYC Venice 是 AMD 為“AI 數(shù)據(jù)中心時(shí)代”打造的下一代服務(wù)器 CPU。

它采用 2nm 工藝，最多可集成 256 個(gè) Zen 6 高性能核心，定位不只是“算得更快”，而是專門為 AI 集群服務(wù)。

相比上一代 EPYC，Venice 的內(nèi)存帶寬和 GPU 帶寬都實(shí)現(xiàn)了翻倍，核心目標(biāo)只有一個(gè)：在機(jī)架級(jí)規(guī)模下，持續(xù)、穩(wěn)定地把數(shù)據(jù)“喂”給 MI455X 等 AI GPU。換句話說，它不追求搶 GPU 的計(jì)算活，而是負(fù)責(zé)調(diào)度、通信和數(shù)據(jù)供給，避免 GPU 因“等數(shù)據(jù)”而空轉(zhuǎn)。

為了支撐這種規(guī)模，EPYC Venice 還配套 800G 以太網(wǎng)，并結(jié)合 Pensando Volcano / Selena 網(wǎng)絡(luò)芯片，面向萬級(jí)機(jī)架規(guī)模的橫向擴(kuò)展。

在 AMD 的設(shè)計(jì)中，Venice 不只是服務(wù)器 CPU，而是 AI 機(jī)架級(jí)系統(tǒng)里的“中樞處理器”，決定整個(gè)集群能否高效運(yùn)轉(zhuǎn)。

https://www.youtube.com/watch?v=UbfAhFxDomE&list=TLGGBbam0h3MCckwNjAxMjAyNg&t=3063s

https://www.techtimes.com/articles/313772/20260105/amd-ceo-lisa-su-declares-ai-everyone-ces-2026-guests-openai-luma-ai-liquid-ai-world-labs.htm

https://www.amd.com/content/dam/amd/en/documents/corporate/events/amd-ces-2026-distribution-deck.pdf

聲明：本文為 AI前線整理，不代表平臺(tái)觀點(diǎn)，未經(jīng)許可禁止轉(zhuǎn)載。

技術(shù)人的年度儀式感！年度盤點(diǎn)與趨勢洞察啟動(dòng)！

《2025 年度盤點(diǎn)與趨勢洞察》由 InfoQ 技術(shù)編輯組策劃。覆蓋大模型、Agent、具身智能、AI Native 開發(fā)范式、AI 工具鏈與開發(fā)、AI+ 傳統(tǒng)行業(yè)等方向，通過長期跟蹤、與業(yè)內(nèi)專家深度訪談等方式，對重點(diǎn)領(lǐng)域進(jìn)行關(guān)鍵技術(shù)進(jìn)展、核心事件和產(chǎn)業(yè)趨勢的洞察盤點(diǎn)。

力求以體系化視角幫助讀者理解年度技術(shù)演化的底層邏輯、創(chuàng)新方向與落地價(jià)值，并為新一年決策提供參考。內(nèi)容將在 InfoQ 媒體矩陣陸續(xù)放出，歡迎大家持續(xù)關(guān)注。

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.