![]()
![]()
9 月 9 日,北京的一場小型媒體沙龍上,AMD 擺出了幾臺看似不起眼的“小盒子”。結果,當大家發現它能在桌面上跑起千億級模型時,現場安靜了幾秒。這就是AMD 銳龍 AI Max+ 395,一臺不到兩萬塊的 Mini AI 工作站。問題是,它真能撐起“AI Agent 元十年”的想象嗎?
編輯:前沿在線編輯部
![]()
一臺小盒子,為何引發圍觀
沙龍現場并不張揚。
沒有炫目的舞臺布景,也沒有大型展板。
![]()
幾臺黑色的小主機靜靜放在桌子上,看上去和市面常見的迷你 PC 并無二致。
直到 AMD 工程師點開演示畫面,屏幕上赫然出現了 GPT-OSS-120B 的運行界面。
動輒百億、千億參數的模型,在這樣一臺臺“小盒子”上跑了起來。
![]()
會場安靜了幾秒。隨后,有人舉起手機拍照,有記者低聲和同伴確認:“這東西真能跑起來?”
![]()
在絕大多數人的認知里,千億級模型的門檻就是“服務器”。
動輒幾十萬元,體積龐大、功耗驚人,還得配備專業的機房、電源與運維團隊。
AMD 卻拿出了一臺臺售價不到兩萬的小型工作站,把這個場景搬回了桌面。
![]()
這種“反差感”,在一個被“顯存焦慮”困擾了一整年的行業里,格外讓人震撼。
![]()
顯存焦慮,終于有人給出答案
![]()
如果給2025 年的 AI 行業做一份年度熱詞榜,“Agent” 和 “顯存” 必然高居前列。
模型的參數量不斷膨脹,從 7B 到 30B,再到 100B+;
場景的復雜度也在升級,從單一的文生文,到跨模態輸入,再到多個Agent 串聯完成復雜任務。
所有這些進展,都在吞噬顯存。
![]()
但現實極其殘酷:
消費級顯卡,大多停留在 24GB;
商用顯卡,頂多也就是 32GB;
真要跑千億級模型?直接超綱。
這就像是一條“算力分水嶺”。
誰能跨過去,誰就有機會進入 Agent 的下一階段;
誰跨不過去,就只能望而興嘆。
![]()
這便是所謂的“顯存焦慮”。
開發者知道AI Agent 的潛力,卻發現手里的硬件無法承載。
企業想要試水,卻發現成本高得難以承受。
科研機構更清楚模型的價值,卻往往被資源限制綁住了手腳。
![]()
紀朝暉(AMD 大中華區市場營銷副總裁)在現場點明了這一點:
“今天一張普通顯卡跑不了千億模型,但 395 能。”
他的話讓在場的媒體人頻頻點頭。
因為在這個節點,不僅能跑,而且還要跑得快!MoE架構的千億參數模型如GPT-OSS-120B在這些mini AI 工作站上也能跑到40個tokens每秒的推理速度!。
![]()
云算力不是萬能解藥
那么問題來了:如果本地跑不動,為什么不去用云呢?
![]()
過去兩年,云 GPU 租賃幾乎成了創業公司和科研機構的“標配”。A100、H100 被炒成算力短缺時代的「硬通貨」,誰掌握了算力,誰就掌握了研發主動權。
但真正在云上跑過大模型的人都知道:云并沒有解決根本問題,反而暴露出三大局限。
1. 成本過高,難以長期承受
算一筆簡單的賬:
![]()
一張 80GB 的 A100,租賃價格最低幾十元一小時;
長期實驗下來,一個月輕松就是十萬元級別;
如果要并行多個實驗,成本還會成倍增長。
對于需要反復迭代的中小團隊,這幾乎是不可承受之重。很多團隊并不是不想做實驗,而是被價格勸退。
2. 調度不穩,供需缺口明顯
![]()
云 GPU 的另一個痛點是“搶”。
在學術大賽、熱門 benchmark 節點,經常出現排隊數小時的情況。甚至有人遇到過模型跑到一半,云資源被系統強制回收,前功盡棄。
科研和開發需要穩定的環境,但云的波動性讓實驗隨時可能被打斷。對很多初創公司來說,這種不確定性幾乎是致命的。
3. 數據約束,合規與安全的雙重難題
![]()
AI 正快速進入垂直行業,而這些行業的數據天然敏感:
醫療影像、金融賬單、工業設計文件,都是核心知識產權;
上傳到云端,不僅要付帶寬費,還可能觸碰隱私和跨境合規風險。
很多企業 CTO 在評估云方案時,都被法務和合規部門反復攔下。
所以,云GPU 不是“不行”,而是代價太大。
![]()
成本、穩定性、數據安全三座大山,正在逼著行業追問:有沒有可能把百億模型跑在本地?
這不是一個噱頭,而是出于安全、成本、效率三重考量的必然需求。
![]()
395 的出現,正是這一追問的具象化回應。
![]()
一臺“小怪獸”,真能跑千億模型
![]()
那么,銳龍 AI Max+395 到底憑什么?
它的秘密武器很直白:96GB獨享顯存。
![]()
這并不是單純把大容量內存堆上去,而是通過AMD統一內存架構(UMA)技術,把 128GB 系統內存靈活分配給 CPU、GPU、NPU 使用。
![]()
其中,96GB 可專供顯卡。
這里的CPU 是創新的Zen 5 架構,16 核 32 線程、主頻高達5.1GHz,本來只會出現在頂級游戲本上;GPU 擁有 40CU,相當于 4060/4070 級別獨顯的性能;再加上 50+ TOPS 的 NPU,完全符合 Windows 11 AI+PC 標準。
換句話說,它等效于一張4060/4070 級別的獨立顯卡,卻帶著服務器級別的顯存空間。
這一點在本地大模型部署時尤為關鍵。
傳統顯卡常見的“瓶頸”在于:算力夠了,顯存卻不夠。
結果就是:模型放不下,跑不起來。
銳龍AIMax+ 395 通過 UMA技術打破了這道“物理門檻”:
![]()
大模型能裝下:千億參數不再是服務器專屬;
算力能調度:CPU、GPU、NPU 協同,避免資源浪費;
靈活能擴展:顯存可動態調整,更適合 Agent 長上下文與并行任務。
在演示中,根據實際估算及模型官方文檔,AMD 給出了幾組顯存占用數據:
![]()
Qwen3-30B:需要18GB 就能跑,輕松通過。
Llama4-109B:需要66GB 顯存跑通。
Mistral Large 123B:需要68GB 顯存。
GPT-OSS-120B:需要 80GB 顯存,實測達到了40+ Tok/s。
這些模型的共同點是:雖不是“671B”那樣的龐然大物,但也都是百億乃至一千億級里極具可用性的“黃金模型”。
科研需要它們,企業項目需要它們,開發者更想在本地復現實驗。
而此前,24GB/32GB 顯卡完全無力觸碰。
一句話:395 把服務器才能玩的“大模型實驗”,搬回了桌面。
![]()
它不是 PC,也不是服務器
為什么 AMD 要把它叫做“Mini AI 工作站”?
![]()
紀朝暉在現場說了一句擲地有聲的話:
“希望它能像互聯網時代的樹莓派一樣,成為 AI 時代的普及推動者。”
這并不是一句簡單的營銷口號。
![]()
樹莓派在互聯網時代的意義,從來不是性能,而是普及與可玩。
它把計算帶進了每一個極客的書桌,讓數以百萬計的人第一次真正有機會“動手試一試”。
![]()
銳龍AI Max+395 延續的正是這種邏輯:
它不是傳統 PC——性能太弱,跑不動千億模型;
它也不是服務器——價格太高,中小企業用不起;
它是夾在中間的“新物種”:一臺能被個人、團隊、小企業負擔得起的工作組級AI 工作站。
換句話說,它不是替代機房,而是讓算力下沉到更接近用戶的地方。
![]()
紀朝暉的另一句話也很關鍵:
![]()
“Windows11AI+PC 已經讓每個員工人手一個 AI 助手;
下一步,就是 Mini AI 工作站,讓團隊、小企業、超級個體都有屬于自己的 Agent 引擎。”
![]()
這既是對銳龍AI MAX+ 395 的定位,也是對市場未來的判斷。
![]()
Agent 元十年,需要這樣的機器
2025 年被業界稱為“AI Agent 元年”。
![]()
但正如 Karpathy 潑過的冷水:“真正成熟要十年。”
這意味著,我們剛剛進入的是一個“元十年”:未來十年,Agent 的每一步成長,都離不開可靠的本地算力。
![]()
Lisa Su 博士在公開發言中,曾經把 AI 定義為:
“過去 50 年里最重要的技術變革”
她強調,未來幾十年的科技創新將高度圍繞AI 展開。
從科研突破到企業流程重構,從教育到娛樂,AI 會成為每個行業的基礎設施。
![]()
在這樣的背景下,Agent 并不是一個可有可無的附加功能,而是下一代生產力的入口。
但是:
云端 Agent 面臨數據安全與合規挑戰,尤其是涉及知識產權和隱私的場景;
動輒幾十萬的 AI 一體機服務器,中小企業與開發者根本負擔不起;
小模型雖便宜,卻撐不起復雜任務,更無法滿足長上下文和多 Agent 協作。
因此,市場確實缺少一個新的定位:既能跑千億參數模型,又足夠便宜好用。
![]()
銳龍AI Max+395 恰好踩在了這個關鍵點上。
![]()
場景里的銳龍AI MAX+395,比參數更有說服力
![]()
硬件規格永遠冰冷。
真正讓人信服的,是它能不能跑起來、能不能進到真實場景。
在沙龍現場,AMD 與合作伙伴一起展示了幾個典型Demo:
1. 個人開發者
過去寫 Demo,需要會代碼。
![]()
現在借助銳龍AI MAX+ 395,哪怕是沒有編程經驗的朋友,也能在 LM Studio 作為本地大模型平臺,為 N8N 自動化工作流工具提供大模型API調用,做出一鍵分析 B 站數據的“小助手”。
![]()
或者快速用AI協助制作真實工作需要的便利小工具如 KPI 檢查工具:輸入表格,選擇對應的時間和活動,工具幫你核查邏輯合理性,輸出結論。
2. 小企業
![]()
一家制造公司,把幾千個零件的 BOM 批量分析交給 395 上的大模型。
以前人工檢查,出錯就是災難;現在 AI 不僅快,還精準。
HR 場景同樣現實:1000 份簡歷,AI 先篩一遍,再把合適的推給面試官。
3. 社區/物業
![]()
某物業服務的公開區域攝像視頻流數據,以前需要昂貴的服務器來處理抽幀、識別、報警。
借助 395 可以多模并行:YOLO 做目標檢測,VLM 做場景分析,ML 算法做預測。火情、入侵、電瓶車過熱,甚至垃圾溢滿,都能實時告警。
算力從“機房”下沉到“小盒子”,成本直接砍掉一多半。
4. 家庭
![]()
孩子踢被子、冰箱物品不足、家庭相冊智能檢索。
這些過去依賴云端的“智能家居幻想”,如今能在本地落地。
而且數據留在家里,不必擔心隱私泄露。
5. 會議室
![]()
會議是最典型的長上下文場景。
395 能處理 100K+ 上下文,配合 MCP,做會議紀要、跨語種翻譯、代辦任務分配。
過去靠秘書,現在靠Agent。
這些場景,展示了 395 從“個人到團隊,從社區到家庭”的廣闊適用性。
比起參數,這些故事更有說服力。
![]()
紀朝暉也在現場強調:
“今天市場上確實缺少一個合適的平臺。我們希望 395 成為那個解決方案。”
![]()
八家廠商押注,生態開始發芽
銳龍AIMAX+ 395 并不是孤軍作戰。
在7月的Mini AI工作站行業解決方案峰會上,AMD攜合作伙伴展出了超過20款的AMD銳龍 AI Max+395 Mini AI工作站產品。
![]()
在這場媒體沙龍上,就有八家合作廠商同臺亮相,展示了搭載銳龍 AI Max+ 395 的多樣化產品:
![]()
Abee:AI Station 395 Max
![]()
惠普:Z2 Mini G1a
![]()
希未:AideaStation R1
![]()
零刻:GTR9 Pro
![]()
首屆玲瓏:六聯智能AXB35-02-H02-BQ
![]()
極摩客:EVO-X2
![]()
天鋇:NEX395
![]()
銘凡:MS-S1 Max
![]()
在生態層面,Ripple AI、魔搭社區、Wisemodel 等伙伴則更強調軟件與社區:
Ripple AI Station已經正式上線,提供開發者套件、遠程調試、教程模板和社區互助,定位直白——把 395 打造成“AI 版樹莓派”;
魔搭社區與Wisemodel 始智 AI陸續開展了例如 MCP/Agent 挑戰賽與NPU應用開發編程賽。
紀朝暉在現場強調:
“AI 的普及,不只是賣硬件,更要讓開發者、學生、小企業有工具可用,有社區可依賴。”
這種打法和樹莓派當年的路子如出一轍:硬件、軟件、社區三位一體,推動生態滾雪球式成長。
![]()
品牌野心:從蘇媽到全棧AI
如果把這次沙龍只看成一場產品秀,那就低估了 AMD 的野心。
![]()
過去幾年,AMD 的品牌勢能正在快速上升:
過去四年,AMD品牌價值提升了 8 倍;
Lisa Su 博士去年被《時代》雜志評為年度 CEO;
今年,她又在《財富》全球商業領袖榜排名第 14 位;
在 BrandZ 最新全球最有價值品牌榜中,AMD 已經躋身前 50,排名第 47。
![]()
這意味著,AMD 已經不再是過去那個被視為“挑戰者”的角色,而是在逐漸塑造 AI 時代的領導者心智。
![]()
Lisa Su 在多個公開場合都明確表示:
“AI 是過去 50 年里最重要的技術變革,甚至超過互聯網的誕生。”
在她的帶領下,AMD 構建的 AI 版圖覆蓋了從數據中心到邊緣再到終端的完整鏈路。今天又通過mini AI 工作站覆蓋端側、邊緣側,打通AI Agent賦能實體應用的最后一公里。
而銳龍AI Max+ 395,就是這條戰略鏈路里最貼近用戶的那一環。
它的意義不只在于一臺機器,更在于心智:告訴市場,AMD 不只是芯片供應商,而是在為AI Agent 元十年鋪設地基。
![]()
未來的可能性
紀朝暉在現場總結時說:
“今天一張普通顯卡跑不了千億模型,但 395 能。我們希望它成為團隊、部門、小企業的 AI 引擎。”
![]()
這句話,道出了 395 的定位——它是算力下沉的拐點。
如果說Windows 11 AI+PC讓 AI 助手走進了每個員工的桌面,那么Mini AI 工作站的意義,就是把Agent 引擎交到團隊、小企業、超級個體的手里。
它既不像服務器那樣昂貴,也不像普通 PC 那樣捉襟見肘,而是恰好踩在了那個“空白帶”。
![]()
未來,我們或許會看到:
學生 在課堂上用 395 學習 AI 原型開發,成為真正的 AI 原生人才;
開發者在家里用 395 搭建工作流,不再依賴昂貴的云服務;
小企業用 395 承載內部 Agent 系統,從簡歷篩選到業務數據分析;
家庭用 395 做智能中樞,把安全、健康、生活的瑣事交給本地 AI;
一人公司借助 395,跑起百萬級任務,構建屬于自己的業務引擎。
所有這些場景的背后,是一個共同的邏輯:算力普惠。
![]()
這場沒有大屏幕、沒有燈光秀的沙龍,留下的最大記憶點,不是熱鬧,而是冷靜的沖擊感。
當 GPT-OSS-120B 在一臺不到兩萬塊的小主機上跑起來時,所有在場的人都明白:某些東西真的變了。
![]()
紀朝暉說過一句話:
“AI Agent 元十年不會等人,但 AMD 希望把門檻降下來,讓更多人能參與其中。”
銳龍AI Max+ 395 也許不是最強大的機器,但它極有可能是最“及時”的那臺。
AI Agent 的大幕正在拉開,而AMD 用一臺小怪獸,把未來推到了我們眼前。
![]()
前沿動態前沿大會
前沿人物
點「在看」,給前前加雞腿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.