作者 | 周雅
評測 | 至頂AI實驗室
過去大半年,我們一直在做端側AI算力的評測。從英偉達DGX Spark,到各家廠商的桌面AI超算,跑模型推理、測ComfyUI工作流、試各種AIGC場景。這些產品各有亮點,但測得越多,越能看清一個事實:端側硬件很強,但并非所有人、所有階段都適合直接「買一臺」來解決問題。
比如你是一個入門級AI開發者,今天的需求只是跑一個7B參數的小模型,但幾個月后你也許會想試試70B甚至更大的模型。根源是,算力需求逐級爬升,一步到位買頂配,前期利用率很低,因為你還沒入門;先買個夠用的,過不了多久又面臨升級,因為你已經入門——這個節奏很難踩準。
![]()
再比如一個逐漸普遍的現實:你的角色可能不止一種。
這兩年有個概念,叫做OPC(One Person Company),是指一個人借助AI工具,可以干傳統一整個小團隊的活,成為超級個體。似乎聽起來很美,但它對算力的要求同樣也是“一個人頂一個團隊”。上午你是AI開發者,在調模型寫代碼;下午變成內容創作者,做AI漫劇;晚上可能還想玩一把《黑神話:悟空》放松。每個角色吃的算力完全不同,一臺固定配置的機器,很難同時喂飽所有場景。
Gartner曾做過一個預測:在未來5到10年內,DaaS(桌面即服務)將成為主流,云電腦或將成為企業與組織首選的辦公計算機。它背后的邏輯,其實是算力供給模式的變革——當摩爾定律的邊際效應遞減,而AI模型的參數量卻在以摩爾定律幾倍的速度膨脹時,算力必然向云端遷移。
這就是我們開始關注云端桌面AI的原因,為此我們還在朋友圈玩起了梗,話題叫做 #辦公室的新玩具#。
最近,我們又拿到了一臺——阿里云無影個人云超算。準確說,是在線上“開通”了一臺云端的電腦,我們體驗了一周,寫了這篇上手記。
![]()
可以塞進衣服口袋的個人超算
阿里云無影,簡單來說,這是一款可以隨時隨地接入的云上電腦。
它最大的特點是實現了「算力與終端的徹底解耦」,這種解耦帶來了極大便利性。在我們的實際體驗中,無論手頭上用的是MacBook,還是Windows筆電,甚至是一臺 iPad,只要裝了無影客戶端App,就能瞬間接入同一個云端桌面。
2020年,阿里云展示了第一代無影云電腦,它的終端是一個名片夾大小的C-Key,連接顯示屏就能進入云端桌面。當時這個品類還需要反復解釋,很多人把它和遠程桌面畫等號。四年后的2024年,無影個人版亮相,個人玩家能直接跑《黑神話:悟空》,1080P下幀率穩定在60幀。
到了CES 2026,桌面AI超算成了幾乎所有PC廠商的標配,惠普把AI PC塞進了鍵盤里,聯想讓筆記本屏幕自動旋轉跟蹤人臉,一大批廠商基于DGX Spark推出了巴掌大的本地AI超算。在這個舞臺上,連續第二年參展的阿里云作為云廠商,就拿出了無影個人云超算。
單看起來,它是一個終端硬件,叫「無影魔方ultra」,巴掌大小,比一本精裝書還輕,有點像一個接口豐富的“瘦客戶機”,塞進口袋也毫不費力。
![]()
但別被尺寸騙了,它背后連著的云端配置是這樣的:兩塊RTX 5880(單卡48GB顯存,Ada Lovelace架構專業級顯卡)、64核vCPU,總共96GB GPU顯存。
![]()
96GB 顯存是什么概念?市面上頂級的消費級顯卡RTX 5090也才32G顯存,96GB是它的三倍,意味著你可以輕松加載100B以上參數大模型做推理,或者跑視頻生成任務也不成問題,不用擔心爆顯存。在本地,要搭建這樣一套硬件環境,成本至少要三萬元以上。而在無影上,這種巨大的前期投入被消解了,它變成列表里的一個圖標,躺在屏幕里任我支配,讓曾經遙不可及的超級算力變得觸手可及。
魔方本身不做任何計算,所有算力都在云端,可以理解為一個「無限算力的水龍頭」:插上電源、連上屏幕、就能打開云端那臺超級電腦、源源不斷流出更高的性能。
這是因為我們開通的是雙卡配置,頂配還可以選擇:4塊RTX 5880(合計192GB GPU顯存)、96核服務器級CPU、384GB內存,這個性能參數放到大部分場景下應該都夠用。
![]()
傳統個人電腦是一錘子買賣,而無影的算力是彈性的,今天跑輕量任務用小規格,明天做模型訓練一鍵切到頂配,數據通過無影存儲中心無縫同步,切換過程不丟進度。
打開后臺,我們可以通過「鏡像管理」,分別為「云電腦」、「AI學習機」、「工作站」一鍵鏡像多個系統,此次我們主要鏡像了Windows、Linux Ubuntu、Kylin三種不同的系統進行測試。
![]()
此外,左側列表中的「無影內容廣場」,就像是一個“AI超市”,這里有大量的第三方共享鏡像。想做圖?選“ComfyUI-含主流模型和節點”鏡像。想煉丹?選“AI-Toolkit LoRA訓練”鏡像。想跑模型推理或搞開發? PyTorch、TensorFlow基礎框架一應俱全。甚至還有ModelScope(魔搭社區)、DiffSynth-Studio等阿里達摩院的獨家生態鏡像。
![]()
![]()
光看參數只是紙上談兵,真正的考驗在于實戰,我們決定拋棄常規的辦公場景評測,直接上強度。
實測:把96GB顯存“榨干”
用目前AI圈最主流、同時也最消耗顯存的ComfyUI視頻生成工作流來進行極限壓測,運行阿里開源的Wan 2.2 14B(萬相)視頻生成模型,這是一個對顯存要求極高的任務,尤其是14B參數,在普通家用顯卡上幾乎無法全血運行。值得一提的是,wan2.2是目前最流行的開源視頻大模型,沒有之一,在開源領域的占比在40%以上。
我們設定了一個簡單明了的提示詞“馬在行走,絲帶飄動,表情靈動(A horse walking, ribbons flowing, vivid expression)”,分辨率設定為1280×720,開啟FP8矩陣乘法優化和FLOW流匹配架構,后臺日志開始飛速滾動。
![]()
模型加載階段,即便使用了FP8量化優化,光是模型權重就占用了13629MB,將近13.6G顯存。如果加上推理過程中的中間變量(KV Cache),24G顯存的本地顯卡不僅捉襟見肘,甚至直接爆顯存。
但在無影上,日志顯示當前可用顯存28969MB。對于96G的總池子來說,這就像一條大河流過一個小水壩,毫無壓力。
生成速度方面,核心采樣過程耗時1分20秒,從點擊開始到視頻生成完畢,總耗時3分34秒。日志里還有一行“lowvram patches: 357”,這是針對低顯存環境的自動優化補丁。對96G來說這幾乎是多余的,但也說明無影在軟件層面的兼容性做得足夠細致。

我們至頂AI實驗室的小伙伴實測,很明顯的兩個感受是:快、方便,因為可以直接把ComfyUI配置到自己電腦的Chrome瀏覽器上使用,可以理解為在你的瀏覽器上直接掛著ComfyUI。
更值得說的是,鏡像市場里預配好的ComfyUI環境。兩卡96G顯存可以同時加載多個大模型和LoRA權重,不需要反復卸載和重裝。這對做AI漫劇的創作者來說尤其關鍵。一條漫劇工作流往往要串聯角色一致性模型、背景生成模型、表情控制LoRA,再接上Wan 2.2做動態視頻片段,在24G顯存的本地顯卡上,光是模型切換就要反復騰挪,96G則可以全部常駐,專心調參出活。對于靠短視頻批量生產吃飯的創作者來說,這直接決定了產能,讓高端的生產力工具變得平易近人。
當然了,工作之余,這臺“怪獸”能不能用來放松?
切換到云電腦模式,無影的內容廣場里預置了《黑神話:悟空》、《鳴潮》、《我的世界》、《永劫無間》等15款熱門游戲大作,可能之后還會上線更多游戲。
![]()
不過,當我進入其中某款游戲,登陸相關賬號之后,也能直接通過賬號入口登陸更多游戲。
![]()
時延,是云游戲最敏感的指標之一。根據官方給出的網絡建議,要獲得1080p、30fps的流暢基礎體驗,需要保證15Mbps以上的帶寬,網絡延遲低于60ms。而若要追求1080p、60fps的電競級高幀率絲滑體驗,帶寬門檻則提升至25Mbps,延遲可以達到30ms以內。
![]()
這次實測下來,玩《鳴潮》這類動作游戲時操作跟手度極高,延遲基本穩定在16ms上下浮動,幾乎感覺不到是在云端。在《我的世界》這種對加載速度要求較高的游戲中,大部分時間也非常流暢,只有極少數復雜場景下,時延會短暫波動到60ms左右,也不影響操作。
前面一直在用無影客戶端做測試,但其實無影魔方ultra也支持多端接入,也就是說,當你只帶了那一塊盒子的情況下,任何一塊屏幕也都能成為入口。
這在游戲場景下特別有意思:我在辦公室用MacBook玩,回家路上用iPad接著玩,存檔和進度無縫銜接。這也就說明,當算力在云端、延遲足夠低的時候,你手里那臺設備是什么品牌、什么配置,已經不重要了。屏幕就是全部。
尤其用Mac客戶端接入的時候,有個細節讓我印象很深:本地Mac和云端無影之間可以直接拖拽文件,操作感覺就像在同一臺電腦的兩個文件夾之間挪東西,用著用著會產生一種錯覺,你的MacBook好像突然多長出了幾塊RTX 5880顯卡。
還記得前面說的OPC嗎?超級個體的一天可以是這樣的:上午用容器模式調模型寫代碼,下午切到Windows環境做AIGC內容創作,晚上打開云游戲放松。一臺固定配置的物理主機很難照顧到每個角色,但在無影上,切換身份就像切換頻道。
更進一步而言,超級算力不再是少數專業人士或機構的專屬品,而是一個能陪伴用戶從好奇、探索到精通的成長伙伴。
算好經濟賬
性能說完,必須聊錢。無影的核心優勢之一,就是將一次性的高昂硬件投資,轉化為極致可控的按需付費服務,它采用了一目了然的「核時」計費模式。
![]()
根據實測后臺數據,「開機」狀態下,無論是云電腦還是容器,平均消耗150.82核時/小時。「關機」狀態下,云電腦消耗0.06核時/小時,容器消耗0.04核時/小時。
![]()
這里有個容易被忽略的細節,如果不手動點擊「關機」,后臺會持續運行,會持續消耗核時。阿里云架構師告訴我們,無影的設計邏輯是:如果沒有手動點擊「關機」,系統會默認你可能在后臺跑長任務(比如訓練模型),它實則是在7*24小時工作狀態。想想也合理:你花了幾周配置好的煉丹環境,肯定不希望關機一次就全部清空,這些核時買的是數據安全存儲和下一次啟動的便利。
此外友情提醒,即便你手動點擊了「關機」,后臺依然會消耗極低的存儲費(即上面的0.04-0.06核時),因為你的數據(硬盤、鏡像、環境配置)依然占用著云端資源。下圖可見,夜間時段也在消耗核時。不過換算下來,關機狀態下,24小時消耗的核時總共幾毛錢。如果確定不用,點擊「銷毀」即可。
![]()
具體花費怎么算?根據阿里云官方的說法,即便是4卡RTX 5880頂配(192GB顯存),每月按量付費也僅在1000元左右。我們手上這臺雙卡配置,每天高強度用8小時,其余時間關機的話,月費大約500-600元。
作為對比,CES上同臺亮相的DGX Spark,搭載GB10 Grace Blackwell超級芯片和128GB統一內存,單臺售價3999美元起步。
但兩者設計思路完全不同:DGX Spark走本地化路線,一次買斷,性能固定,勝在離線可用、數據不出本機;無影走云端彈性路線,按需取用,隨時升降,勝在配置天花板高、無硬件折舊。
我們也注意到,在一些公開測評中,無影頂配的綜合跑分可以達到DGX Spark的數倍,而月費遠低于后者的一次性購入成本。當然,兩款產品面向的場景和取舍不同,直接比價未必公平。
比超級電腦多走一步
如果只是把傳統PC的算力搬到了云上,無影充其量是“更方便的高性能電腦”,但無影的另一個拳頭產品AgentBay,則暗示了一個更大的野心。
![]()
AgentBay是無影為AI Agent(智能體)打造的云端基礎設施。通俗來說,它讓AI助手獲得了“手和腳”,AI不再只是坐在聊天框里回答問題,而是可以在云端沙箱里操作瀏覽器、控制桌面應用、執行代碼、甚至操控手機界面。所有操作都在安全隔離的環境中獨立運行,不影響用戶自己的設備。
想象一個場景:你對AI說“幫我從這五個PDF里提取關鍵數據,整理成Excel,然后發郵件給團隊”。過去,AI只能幫你寫出提取腳本,剩下的你自己動手。有了AgentBay,AI可以在云端打開一臺完整的電腦,自己操作瀏覽器下載文件、打開Office處理數據、登錄郵箱發送,全程不需要你介入。
是不是很像最近爆火的clawdbot?沒錯,Agentbay也增加了內置Clawdbot模式,同時還擁有Clawdbot不具備的browser use能力和企業多Clawdbot部署能力。
這就是為什么我們在文章標題里用了「隱身」這個詞。無影追求的終極形態,不是讓你感覺在使用一臺更強的電腦,而是讓「電腦」這個概念本身逐漸消失,你只需要說出想做的事,算力、軟件、環境、執行,一切在看不見的地方自動發生。
這次上手最讓我印象深刻的,不是某個具體的跑分數字或者啟動速度,而是一種錯位感,手里握著一個比充電寶大不了多少的小方盒,屏幕上卻跑著需要服務器機房才能驅動的大模型。沒有風扇呼嘯,沒有機箱發熱,連一根多余的線都不需要。
好的計算也許就像好的設計:當你不再需要思考顯卡夠不夠、內存滿不滿、驅動裝沒裝的時候,就可以把全部注意力放回到你真正想做的事上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.