網易首頁 > 網易號 > 正文申請入駐

一臺不到兩萬的小怪獸：AMD銳龍395真能撐起千億大模型嗎？| 前沿在線

2025-09-16 12:47:18　來源: 前沿在線

北京舉報

分享至

9 月 9 日，北京的一場小型媒體沙龍上，AMD 擺出了幾臺看似不起眼的“小盒子”。結果，當大家發現它能在桌面上跑起千億級模型時，現場安靜了幾秒。這就是AMD 銳龍 AI Max+ 395，一臺不到兩萬塊的 Mini AI 工作站。問題是，它真能撐起“AI Agent 元十年”的想象嗎？

編輯：前沿在線編輯部

一臺小盒子，為何引發圍觀

沙龍現場并不張揚。

沒有炫目的舞臺布景，也沒有大型展板。

幾臺黑色的小主機靜靜放在桌子上，看上去和市面常見的迷你 PC 并無二致。

直到 AMD 工程師點開演示畫面，屏幕上赫然出現了 GPT-OSS-120B 的運行界面。

動輒百億、千億參數的模型，在這樣一臺臺“小盒子”上跑了起來。

會場安靜了幾秒。隨后，有人舉起手機拍照，有記者低聲和同伴確認：“這東西真能跑起來？”

在絕大多數人的認知里，千億級模型的門檻就是“服務器”。

動輒幾十萬元，體積龐大、功耗驚人，還得配備專業的機房、電源與運維團隊。

AMD 卻拿出了一臺臺售價不到兩萬的小型工作站，把這個場景搬回了桌面。

這種“反差感”，在一個被“顯存焦慮”困擾了一整年的行業里，格外讓人震撼。

顯存焦慮，終于有人給出答案

如果給2025 年的 AI 行業做一份年度熱詞榜，“Agent” 和 “顯存” 必然高居前列。

模型的參數量不斷膨脹，從 7B 到 30B，再到 100B+；

場景的復雜度也在升級，從單一的文生文，到跨模態輸入，再到多個Agent 串聯完成復雜任務。

所有這些進展，都在吞噬顯存。

但現實極其殘酷：

消費級顯卡，大多停留在 24GB；
商用顯卡，頂多也就是 32GB；
真要跑千億級模型？直接超綱。

這就像是一條“算力分水嶺”。

誰能跨過去，誰就有機會進入 Agent 的下一階段；

誰跨不過去，就只能望而興嘆。

這便是所謂的“顯存焦慮”。

開發者知道AI Agent 的潛力，卻發現手里的硬件無法承載。

企業想要試水，卻發現成本高得難以承受。

科研機構更清楚模型的價值，卻往往被資源限制綁住了手腳。

紀朝暉（AMD 大中華區市場營銷副總裁）在現場點明了這一點：

“今天一張普通顯卡跑不了千億模型，但 395 能。”

他的話讓在場的媒體人頻頻點頭。

因為在這個節點，不僅能跑，而且還要跑得快！MoE架構的千億參數模型如GPT-OSS-120B在這些mini AI 工作站上也能跑到40個tokens每秒的推理速度！。

云算力不是萬能解藥

那么問題來了：如果本地跑不動，為什么不去用云呢？

過去兩年，云 GPU 租賃幾乎成了創業公司和科研機構的“標配”。A100、H100 被炒成算力短缺時代的「硬通貨」，誰掌握了算力，誰就掌握了研發主動權。

但真正在云上跑過大模型的人都知道：云并沒有解決根本問題，反而暴露出三大局限。

1. 成本過高，難以長期承受

算一筆簡單的賬：

一張 80GB 的 A100，租賃價格最低幾十元一小時；
長期實驗下來，一個月輕松就是十萬元級別；
如果要并行多個實驗，成本還會成倍增長。

對于需要反復迭代的中小團隊，這幾乎是不可承受之重。很多團隊并不是不想做實驗，而是被價格勸退。

2. 調度不穩，供需缺口明顯

云 GPU 的另一個痛點是“搶”。

在學術大賽、熱門 benchmark 節點，經常出現排隊數小時的情況。甚至有人遇到過模型跑到一半，云資源被系統強制回收，前功盡棄。

科研和開發需要穩定的環境，但云的波動性讓實驗隨時可能被打斷。對很多初創公司來說，這種不確定性幾乎是致命的。

3. 數據約束，合規與安全的雙重難題

AI 正快速進入垂直行業，而這些行業的數據天然敏感：

醫療影像、金融賬單、工業設計文件，都是核心知識產權；
上傳到云端，不僅要付帶寬費，還可能觸碰隱私和跨境合規風險。

很多企業 CTO 在評估云方案時，都被法務和合規部門反復攔下。

所以，云GPU 不是“不行”，而是代價太大。

成本、穩定性、數據安全三座大山，正在逼著行業追問：有沒有可能把百億模型跑在本地？

這不是一個噱頭，而是出于安全、成本、效率三重考量的必然需求。

395 的出現，正是這一追問的具象化回應。

一臺“小怪獸”，真能跑千億模型

那么，銳龍 AI Max+395 到底憑什么？

它的秘密武器很直白：96GB獨享顯存。

這并不是單純把大容量內存堆上去，而是通過AMD統一內存架構（UMA）技術，把 128GB 系統內存靈活分配給 CPU、GPU、NPU 使用。

其中，96GB 可專供顯卡。

這里的CPU 是創新的Zen 5 架構，16 核 32 線程、主頻高達5.1GHz，本來只會出現在頂級游戲本上；GPU 擁有 40CU，相當于 4060/4070 級別獨顯的性能；再加上 50+ TOPS 的 NPU，完全符合 Windows 11 AI+PC 標準。

換句話說，它等效于一張4060/4070 級別的獨立顯卡，卻帶著服務器級別的顯存空間。

這一點在本地大模型部署時尤為關鍵。

傳統顯卡常見的“瓶頸”在于：算力夠了，顯存卻不夠。

結果就是：模型放不下，跑不起來。

銳龍AIMax+ 395 通過 UMA技術打破了這道“物理門檻”：

大模型能裝下：千億參數不再是服務器專屬；

算力能調度：CPU、GPU、NPU 協同，避免資源浪費；
靈活能擴展：顯存可動態調整，更適合 Agent 長上下文與并行任務。

在演示中，根據實際估算及模型官方文檔，AMD 給出了幾組顯存占用數據：

Qwen3-30B：需要18GB 就能跑，輕松通過。
Llama4-109B：需要66GB 顯存跑通。
Mistral Large 123B：需要68GB 顯存。
GPT-OSS-120B：需要 80GB 顯存，實測達到了40+ Tok/s。

這些模型的共同點是：雖不是“671B”那樣的龐然大物，但也都是百億乃至一千億級里極具可用性的“黃金模型”。

科研需要它們，企業項目需要它們，開發者更想在本地復現實驗。

而此前，24GB/32GB 顯卡完全無力觸碰。

一句話：395 把服務器才能玩的“大模型實驗”，搬回了桌面。

它不是 PC，也不是服務器

為什么 AMD 要把它叫做“Mini AI 工作站”？

紀朝暉在現場說了一句擲地有聲的話：

“希望它能像互聯網時代的樹莓派一樣，成為 AI 時代的普及推動者。”

這并不是一句簡單的營銷口號。

樹莓派在互聯網時代的意義，從來不是性能，而是普及與可玩。

它把計算帶進了每一個極客的書桌，讓數以百萬計的人第一次真正有機會“動手試一試”。

銳龍AI Max+395 延續的正是這種邏輯：

它不是傳統 PC——性能太弱，跑不動千億模型；
它也不是服務器——價格太高，中小企業用不起；
它是夾在中間的“新物種”：一臺能被個人、團隊、小企業負擔得起的工作組級AI 工作站。

換句話說，它不是替代機房，而是讓算力下沉到更接近用戶的地方。

紀朝暉的另一句話也很關鍵：

“Windows11AI+PC 已經讓每個員工人手一個 AI 助手；

下一步，就是 Mini AI 工作站，讓團隊、小企業、超級個體都有屬于自己的 Agent 引擎。”

這既是對銳龍AI MAX+ 395 的定位，也是對市場未來的判斷。

Agent 元十年，需要這樣的機器

2025 年被業界稱為“AI Agent 元年”。

但正如 Karpathy 潑過的冷水：“真正成熟要十年。”

這意味著，我們剛剛進入的是一個“元十年”：未來十年，Agent 的每一步成長，都離不開可靠的本地算力。

Lisa Su 博士在公開發言中，曾經把 AI 定義為：

“過去 50 年里最重要的技術變革”

她強調，未來幾十年的科技創新將高度圍繞AI 展開。

從科研突破到企業流程重構，從教育到娛樂，AI 會成為每個行業的基礎設施。

在這樣的背景下，Agent 并不是一個可有可無的附加功能，而是下一代生產力的入口。

但是：

云端 Agent 面臨數據安全與合規挑戰，尤其是涉及知識產權和隱私的場景；
動輒幾十萬的 AI 一體機服務器，中小企業與開發者根本負擔不起；
小模型雖便宜，卻撐不起復雜任務，更無法滿足長上下文和多 Agent 協作。

因此，市場確實缺少一個新的定位：既能跑千億參數模型，又足夠便宜好用。

銳龍AI Max+395 恰好踩在了這個關鍵點上。

場景里的銳龍AI MAX+395，比參數更有說服力

硬件規格永遠冰冷。

真正讓人信服的，是它能不能跑起來、能不能進到真實場景。

在沙龍現場，AMD 與合作伙伴一起展示了幾個典型Demo：

1. 個人開發者

過去寫 Demo，需要會代碼。

現在借助銳龍AI MAX+ 395，哪怕是沒有編程經驗的朋友，也能在 LM Studio 作為本地大模型平臺，為 N8N 自動化工作流工具提供大模型API調用，做出一鍵分析 B 站數據的“小助手”。

或者快速用AI協助制作真實工作需要的便利小工具如 KPI 檢查工具：輸入表格，選擇對應的時間和活動，工具幫你核查邏輯合理性，輸出結論。

2. 小企業

一家制造公司，把幾千個零件的 BOM 批量分析交給 395 上的大模型。

以前人工檢查，出錯就是災難；現在 AI 不僅快，還精準。

HR 場景同樣現實：1000 份簡歷，AI 先篩一遍，再把合適的推給面試官。

3. 社區/物業

某物業服務的公開區域攝像視頻流數據，以前需要昂貴的服務器來處理抽幀、識別、報警。

借助 395 可以多模并行：YOLO 做目標檢測，VLM 做場景分析，ML 算法做預測。火情、入侵、電瓶車過熱，甚至垃圾溢滿，都能實時告警。

算力從“機房”下沉到“小盒子”，成本直接砍掉一多半。

4. 家庭

孩子踢被子、冰箱物品不足、家庭相冊智能檢索。

這些過去依賴云端的“智能家居幻想”，如今能在本地落地。

而且數據留在家里，不必擔心隱私泄露。

5. 會議室

會議是最典型的長上下文場景。

395 能處理 100K+ 上下文，配合 MCP，做會議紀要、跨語種翻譯、代辦任務分配。

過去靠秘書，現在靠Agent。

這些場景，展示了 395 從“個人到團隊，從社區到家庭”的廣闊適用性。

比起參數，這些故事更有說服力。

紀朝暉也在現場強調：

“今天市場上確實缺少一個合適的平臺。我們希望 395 成為那個解決方案。”

八家廠商押注，生態開始發芽

銳龍AIMAX+ 395 并不是孤軍作戰。

在7月的Mini AI工作站行業解決方案峰會上，AMD攜合作伙伴展出了超過20款的AMD銳龍 AI Max+395 Mini AI工作站產品。

在這場媒體沙龍上，就有八家合作廠商同臺亮相，展示了搭載銳龍 AI Max+ 395 的多樣化產品：

Abee：AI Station 395 Max

惠普：Z2 Mini G1a

希未：AideaStation R1

零刻：GTR9 Pro

首屆玲瓏：六聯智能AXB35-02-H02-BQ

極摩客：EVO-X2

天鋇：NEX395

銘凡：MS-S1 Max

在生態層面，Ripple AI、魔搭社區、Wisemodel 等伙伴則更強調軟件與社區：

Ripple AI Station已經正式上線，提供開發者套件、遠程調試、教程模板和社區互助，定位直白——把 395 打造成“AI 版樹莓派”；
魔搭社區與Wisemodel 始智 AI陸續開展了例如 MCP/Agent 挑戰賽與NPU應用開發編程賽。

紀朝暉在現場強調：

“AI 的普及，不只是賣硬件，更要讓開發者、學生、小企業有工具可用，有社區可依賴。”

這種打法和樹莓派當年的路子如出一轍：硬件、軟件、社區三位一體，推動生態滾雪球式成長。

品牌野心：從蘇媽到全棧AI

如果把這次沙龍只看成一場產品秀，那就低估了 AMD 的野心。

過去幾年，AMD 的品牌勢能正在快速上升：

過去四年，AMD品牌價值提升了 8 倍；
Lisa Su 博士去年被《時代》雜志評為年度 CEO；
今年，她又在《財富》全球商業領袖榜排名第 14 位；
在 BrandZ 最新全球最有價值品牌榜中，AMD 已經躋身前 50，排名第 47。

這意味著，AMD 已經不再是過去那個被視為“挑戰者”的角色，而是在逐漸塑造 AI 時代的領導者心智。

Lisa Su 在多個公開場合都明確表示：

“AI 是過去 50 年里最重要的技術變革，甚至超過互聯網的誕生。”

在她的帶領下，AMD 構建的 AI 版圖覆蓋了從數據中心到邊緣再到終端的完整鏈路。今天又通過mini AI 工作站覆蓋端側、邊緣側，打通AI Agent賦能實體應用的最后一公里。

而銳龍AI Max+ 395，就是這條戰略鏈路里最貼近用戶的那一環。

它的意義不只在于一臺機器，更在于心智：告訴市場，AMD 不只是芯片供應商，而是在為AI Agent 元十年鋪設地基。

未來的可能性

紀朝暉在現場總結時說：

“今天一張普通顯卡跑不了千億模型，但 395 能。我們希望它成為團隊、部門、小企業的 AI 引擎。”

這句話，道出了 395 的定位——它是算力下沉的拐點。

如果說Windows 11 AI+PC讓 AI 助手走進了每個員工的桌面，那么Mini AI 工作站的意義，就是把Agent 引擎交到團隊、小企業、超級個體的手里。

它既不像服務器那樣昂貴，也不像普通 PC 那樣捉襟見肘，而是恰好踩在了那個“空白帶”。

未來，我們或許會看到：

學生在課堂上用 395 學習 AI 原型開發，成為真正的 AI 原生人才；
開發者在家里用 395 搭建工作流，不再依賴昂貴的云服務；
小企業用 395 承載內部 Agent 系統，從簡歷篩選到業務數據分析；
家庭用 395 做智能中樞，把安全、健康、生活的瑣事交給本地 AI；
一人公司借助 395，跑起百萬級任務，構建屬于自己的業務引擎。

所有這些場景的背后，是一個共同的邏輯：算力普惠。

這場沒有大屏幕、沒有燈光秀的沙龍，留下的最大記憶點，不是熱鬧，而是冷靜的沖擊感。

當 GPT-OSS-120B 在一臺不到兩萬塊的小主機上跑起來時，所有在場的人都明白：某些東西真的變了。

紀朝暉說過一句話：

“AI Agent 元十年不會等人，但 AMD 希望把門檻降下來，讓更多人能參與其中。”

銳龍AI Max+ 395 也許不是最強大的機器，但它極有可能是最“及時”的那臺。

AI Agent 的大幕正在拉開，而AMD 用一臺小怪獸，把未來推到了我們眼前。

前沿動態前沿大會

前沿人物

點「在看」，給前前加雞腿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.