前言:
在AI全面觸達各行各業的今天,從初學者到開發者、從極客到內容創作者,越來越多的人開始嘗試將大模型部署在本地設備上,從而擺脫云端服務的限制,實現低延遲、更私密、可控的AI應用體驗。
而在2025年,隨著AMD推出基于Strix Halo架構的銳龍 AI Max+ 395平臺,這一目標開始走入現實。這次我們體驗的極摩客 EVO-X2 Mini AI主機,就搭載了這顆旗艦級APU,以及128GB LPDDR5X內存和2TB PCIe 4.0 SSD。
![]()
當然,極摩客 EVO-X2 Mini 的定位不止于普通主機,它更像是一套完整的本地 AI 實驗平臺。其目標用戶涵蓋AI相關的學生、初創團隊、獨立開發者以及內容創作者,旨在讓他們能夠在本地進行模型適配、驗證和應用開發工作。過去許多必須“上云”才能完成的AI任務,現在在一臺Windows桌面機器上就能實現:
· 本地運行大模型:支持在本地跑32B~70B 參數規模的語言模型,大幅降低對云端GPU的依賴。
· 多模態AI推理:不僅可以運行文本生成,還能跑圖文生成、圖像識別、語音識別等多模態模型,滿足文本、圖像、語音多方面的AI創作需求。
· 多模型并行處理:可同時加載多個模型共同運行,如同時啟動語言模型+圖像生成+語音轉寫,隨時快速切換,響應依然流暢。
通過這樣的平臺化設計,EVO-X2 Mini 解決了過去「只能上云」的痛點,讓開發者在本地就可完成完整的AI開發流程:無需擔心云服務的計費和限流,無需擔心敏感數據上傳云端的風險。本地部署意味著沒有 Token 調用限制,數據完全掌握在自己手中,迭代調試也可以離線完成。這款產品真正實現了AI開發從云端回歸本地的一次飛躍。
今天我們就從外觀設計、基準性能、本地部署大模型測試、多模態生成體驗幾個維度,全方位評估這臺“桌面AI超算中心”的真正實力。
![]()
1、 設計語言:極簡科幻,桌面即是工作站
![]()
作為一款面向AI開發的桌面工作站,極摩客 EVO-X2 Mini 在外觀設計上強調“小體積,大能量”。整機采用一體化的鋁合金機身結構,銀黑配色的極簡工業風,小巧的機身尺寸約193×186×77 mm,非常適合擺放在工作室、實驗室乃至宿舍的桌面上。
![]()
全鋁外殼不僅保證了堅固質感,也有助于散熱穩定,高負載運行時機身仍能保持良好溫控。
EVO-X2 Mini 的接口擴展也相當豐富,方便開發者搭建本地服務器或高性能工作流。機身前面板提供了USB4(40Gbps)高速接口、USB 3.2 Gen2接口×2、SD卡槽和音頻接口等;
![]()
背面則配備了2.5G以太網口、更多USB接口(包括另一組USB4和USB-A)、HDMI 2.1、DP 1.4視頻輸出等。
![]()
這些接口意味著開發者可以靈活連接外接顯卡(通過USB4接口的外置GPU塢站)、AI加速模塊、高速存儲陣列甚至多顯示器,擴展出媲美服務器的I/O能力。在如此小巧的機身中集成全面的功能接口,充分體現了對開發者使用場景的友好設計——無需占用機房空間,在桌面即可搭建屬于自己的AI超級工作站。
二、性能測試:CPU、GPU、存儲全面釋放
極摩客EVO-X2 mini核心搭載了AMD 銳龍 AI Max+ 395 APU,是當前AMD面向AI PC推出的最強桌面平臺之一。
![]()
它使用16核心32線程的Zen 5 CPU架構,主頻高達5.1GHz,集成40 CU的RDNA 3.5 GPU,型號為Radeon 8060S,配備XDNA 2架構的NPU,AI算力達到50+ TOPS,總算力126 TOPS,支持最大128GB LPDDR5X內存,內存帶寬高達256GB/s。接下來我們對這臺機器進行基礎測試。
![]()
在CineBench R23的測試中,CPU單核得分為2012分,多核得分為34836分。在CineBench R24的測試中,它拿到了單核得分113分,多核得分1838分,這樣的分數表現證明這塊CPU表現可以穩穩媲美桌面級旗艦平臺,應對大模型加載、多線程推理毫無壓力。
![]()
![]()
在3Dmark圖形計算任務中,Radeon 8060S 表現超越傳統核顯甚至追平中端獨顯,TimeSpy顯卡成績為11427,綜合成績11111分。
![]()
在Fire Strike測試任務中,顯卡成績為30989分,綜合成績26714分。
![]()
而在Solar Bay中,則保持了193FPS流暢輸出,這證明了AMD Radeon 8060S能夠為圖像/視頻類AI模型提供了穩定基礎。
![]()
同時我們還使用 CrystalDiskMark 對它的存儲帶寬進行測試,它的順序讀取:7103.90 MB/s順序寫入:6431.00 MB/s,這樣的超高速SSD讓大模型文件加載、初始化過程幾乎沒有等待時間,大幅提升開發迭代效率。
![]()
三、大模型實測:從Qwen3-235B到DeepSeek V3,真正可用的“本地AI”
光看跑分還不夠,關鍵還是得看一臺機器能不能把真正的大模型跑起來。過去像 70B、32B 這種級別的語言模型,或者像 Flux 這樣的圖像生成模型,基本只能靠動輒幾萬塊的云服務器來撐起。
但 AMD Ryzen AI Max+ 395,算力強、內存大,還能靈活調度 CPU、GPU 和 NPU,讓很多原本只能云上跑的模型,在本地也能穩定運行。而且對 AI 初學者或者入門級開發者來說,這也意味著門檻一下降下來了——以前不敢想的事,現在一臺小主機就能干。
![]()
首先我們使用LM Studio,部署了來自AMD AI生態伙伴模優優團隊優化過的最新大模型Qwen3-235B,模型加載后占用了約60GB內存。
![]()
我們在模型上提問了幾個問題,例如計算地球的質量,從回答的過程和結果來看邏輯縝密,一共輸出了960tokens,速度為12.05 tok/sec,首個token輸出延遲為0.92s。
![]()
![]()
接下來我們稍微上了點強度,提問了AI測試中的中等難度數學題:“1個蘋果=2個梨,3個梨=4個橙子,6個橙子=7個香蕉,56個香蕉等于多少個蘋果?”。這道題是數量關系,但是需要做公倍數的推理。
在經過6分40秒后模型給出答案,一共輸出了2526 tokens,速度為10.10 tok/sec,首個token輸出延遲為2.87s。
![]()
同時我們觀察在實際推理時的硬件表現,GPU負載100%、CPU負載5%、內存負載37%,所有問題響應速度快,運行過程穩定。能在一臺小型主機上跑動如此規模的LLM,充分證明了Strix Halo架構強大的內存帶寬和異構算力。
![]()
之后我們重新部署了同樣量級的DeepSeek-V3,來看看它的表現如何。
![]()
我們讓DeepSeek來進行一場畫展策劃案,能夠看到它的執行方案十分清晰,本次回答總計輸出1233 tokens,速度為6.47 tok/s,首個token延遲為1.19s。
![]()
之后我們又讓DeepSeek給出一份旅行計劃,它同樣給出了十分不錯的答案。本次回答總計輸出634 tokens,速度為7.75 tok/s,首個token延遲為0.73s。
整體來看,無論是面對參數體量龐大的 Qwen3-235B,還是處理偏實用場景導向的 DeepSeek 模型,EVO-X2 Mini 都展現出了穩定、流暢的推理表現,關鍵是還能在桌面端輕松實現。硬件層面,Strix Halo 架構不光是“能跑”,而是跑得住、跑得穩,這種來自 AMD 的異構算力整合,確實讓本地 AI 部署這件事,離“普通開發者”更近了一大步。
四、圖像 & 視頻模型部署:Amuse 本地多模態體驗
![]()
除了語言模型,EVO-X2 Mini 在圖像、視頻等創意類模型的應用上也非常值得關注。接下來我們使用Amuse 3.0平臺來進行測試,該平臺整合了包括Flux(文生圖)和locomotion(文生視頻)在內的一系列生成式模型。
首先我們使用Flux1-Schnell來進行文生圖測試,生成 1024×1024 的圖像并超分到 2048×2048,迭代步數為4步,我們得到了一張非常不錯的圖片。
![]()
在生成“姜餅人卡通圖”時,我們觀察硬件表現,GPU占用率會頻繁沖到100%,CPU平均占用率為4%,內存平均占用率為22%。在多次生成后,平均單張圖像輸出時間:28.7秒,性能指標:0.1 ~ 0.2 it/s
![]()
![]()
之后我們上一點強度,我們讓Flux1-Schnell進行寫實風格“牛仔彈吉他”的照片,均成功生成,畫面雖然有AI的痕跡,但符合我們的正常觀感。
![]()
接下來我們更換為locomotion,來進行文生視頻的測試,使用提示詞“浣熊在沙灘上彈吉他”,分辨率1152x1152,生成2秒視頻,輸出時間:37.4秒,性能:0.4 it/s
![]()
同樣的,我們將視頻生成指標調整為10秒,分辨率1152x1152,關鍵詞同樣是“浣熊在沙灘上彈吉他”,耗時204.7秒,吉他雖然略有浮動,但浣熊的效果可以接受。
![]()
從圖像到視頻,EVO-X2 Mini 在面對這類計算量大、顯存占用高的創意生成任務時依然保持了不錯的穩定性和響應速度。無論是 Flux 快速出圖時 GPU 的高效調用,還是 LOCOmotion 在高分辨率視頻生成中的持續輸出表現,都離不開 AMD Ryzen AI Max+ 架構下 CPU、GPU、NPU 三者的協同調度。
總結:一顆芯片帶來的轉變,從云端回到桌面
如果說過去我們總默認,大模型、尤其是幾十億甚至上百億參數級別的 AI 模型,只能在云端大型服務器上運行,那 EVO-X2 Mini 的出現,無疑給出了一個顛覆性的答案。它不僅能把這些“高門檻任務”拉回到開發者的桌面,還讓整個 AI 工作流變得更簡單、更可控。
![]()
真正讓這種轉變成為可能的,是它所搭載的 AMDRyzen AI Max+ 395 APU。這顆芯片并不是單純追求 CPU 或 GPU 性能的堆料式升級,而是通過全新的異構設計,把 Zen 5 高性能核心、RDNA 3.5 圖形架構、以及 XDNA 2 NPU 融合為一個真正面向多模態 AI 的算力平臺。它的50+ TOPS AI 推理能力和統一共享的高帶寬內存架構,讓多模型并行、高負載任務不再是“頂配專屬”。
![]()
在實際體驗中,這不僅意味著可以運行 Qwen3 這樣體量驚人的模型,或部署 DeepSeek、Flux、LOCOmotion 等多模態生成任務,更意味著開發者可以在離線狀態下完成訓練、調試和原型設計,徹底擺脫云端限制與 Token 焦慮。這對于教育用戶、小型團隊甚至內容創作者來說,幾乎相當于多年前“獨立剪片”從工作站下放到筆記本那種解放感。
更關鍵的是,這不只是一臺機器的偶然突破,而是 AMD AI PC 生態系統的一部分。除了 EVO-X2 Mini,后面我們還能見到更多搭載 Ryzen AI Max+ 395 的設備,相信它們將會覆蓋從桌面端到移動端的完整本地 AI 應用場景。
![]()
AMD 正在讓“本地 AI”從概念變成現實,不只是性能上的領先,更是開發范式的重構。對于那些想真正掌控算力、探索多模態 AI 應用的人來說,像 EVO-X2 Mini 這樣的設備,正是一扇打開未來可能性的門。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.