今年的 CES 黃仁勛主題演講上,罕見的,他沒有介紹英偉達的消費級顯卡。
目前最新的消費級 GPU,還是去年在 CES 上正式發布的 RTX 50 系列。其中必然有內存全球大漲價的原因,當前市場的內存成本,一周之內就能漲價 50%-100%,并且多個分析機構表示,漲價會持續到 2027 年。
更多的原因還是 AI,就拿 AI 訓練和部署來說。一塊 RTX 5090 顯卡的最大顯存是 32GB,隨便找一個表現不錯的開源大模型,參數都是以百億為單位,所需要的顯存容量,32G 的優勢會比較有限。
![]()
但英偉達顯然不會放棄本地計算的市場,今年不發消費級的顯卡,有了全新的消費級個人超算。
英偉達在 CES 2026 上展示了全新的 DGX Spark,并且用它完成了多個 AI 相關的任務。開發者和創作者不需要昂貴的數據中心,通過 DGX Spark,就可以在本地流暢運行、微調,甚至推理高達 100B 參數的前沿 AI 模型。
我們之前也分享過 DGX Spark 的上手體驗,下載 1200 億參數的 GPT-OSS 開源模型,或者部署 Qwen 圖片生成、Wan 2.2 視頻生成,DGX Spark 都能做到。
再回顧一下 DGX Spark 的主要情況。
![]()
- 核心架構:基于 NVIDIA Grace Blackwell 架構打造,將數據中心級別的 AI 算力,濃縮到了緊湊的桌面機箱中。
- 海量內存:單機配備 128GB 統一內存。更為獨特的是,它支持通過 200Gbps 的 ConnectX-7 網絡,將兩臺 DGX Spark 互連,組成擁有 256GB 內存的超級節點。
- 核心能力:專為大模型時代設計,支持在本地運行 100B 參數級別的模型,或者對 70B 參數的 LLM 進行分布式微調。
- 定位:它不僅是開發者的沙盒環境,而且還要做 AI 創作者的平臺,主要是讓高強度的 AI 工作負載,脫離云端依賴,在本地安全、低延遲地完成。
本次 CES 更新的最大亮點,在于通過軟件升級引入了對 NVFP4 數據格式的全面支持。NVFP4 的數據格式,能夠讓新一代模型在保持智能表現的同時,內存占用降低約 40%,吞吐量大幅提升。
具體的實測數據,在兩個 DGX Spark 配置上運行 Qwen-235B 模型時,使用 NVFP4 相比 FP8 性能提升最高可達 2.6 倍。這直接地解決了,過去使用 FP8 精度時雙系統內存耗盡、無法多任務處理的難題。
硬件在桌面上,但訪問方式可以很云端。CES 上展示的 Brev 更新,還解決了 DGX Spark 本地算力靈活性不足的問題。
![]()
現在,開發者可以通過 Brev,安全地遠程連接 DGX Spark,就像使用云服務一樣便捷。此外,Brev 支持智能路由層。用戶可以將處理郵件或專有數據等敏感任務,強制保留在本地 DGX Spark 上運行,而將一般推理任務無縫路由至云端,兼顧了隱私安全與云端算力。
Brev 的引入,解決了本地算力不僅能用,還要好用的問題。它的本地計算支持預計于 2026 年春季正式推出。
這么強的算力能用來做什么,英偉達在 CES 現場的演示也給出了答案。
對于視頻創作者,這是強大的創意生成加速器。將 AI 視頻生成任務從筆記本轉移到 DGX Spark 上,相比頂配 M4 Max 的 MacBook Pro,速度實現了高達 8 倍的提升,真正做到了讓創作流不再卡頓。
不僅是個人開發者,對于注重本地安全的企業用戶,DGX Spark 也能勝任。英偉達展示了由 Nsight 驅動的本地 CUDA 編碼助手,企業開發者可以在享受 AI 輔助的同時,確保源代碼完全存儲在本地,杜絕信息泄露風險。
更有意思的演示是和機器人的結合。通過與 Hugging Face 的合作,DGX Spark 化身 Reachy Mini 機器人的「大腦」,讓機器人具備了實時視聽交互能力。現在看起來,用 DGX Spark 來做具身智能,也不再是大廠的專屬。
![]()
Hugging Face 產品副總裁 Jeff Boudier 也提到,「開放模型賦予開發者以自己的方式構建 AI ,而 DGX Spark 將這種能力帶到桌面端……讓強大的 AI 變成真正可以互動的存在。」
![]()
為了降低開發者的門檻,英偉達還在 CES 上一口氣新增了 6 個 Playbook(實戰手冊),重點覆蓋了當下的熱門需求。
- Nemotron 3 Nano,英偉達最新的開源智能體大模型,用于本地 LLM 實驗。
- Live VLM WebUI,實時視覺語言模型分析,通過輸入網絡攝像頭畫面,直接在 DGX Spark 本地進行視頻分析。
- Isaac Sim / Lab,機器人仿真與強化學習。
- 雙系統微調,展示了如何利用兩臺 DGX Spark,分布式微調 70B 參數的 LLM。
![]()
除了 Playbook 的更新,DGX Spark 還預裝了經過優化的 NVIDIA AI 軟件和 CUDA-X 庫。這意味著開發者無需在繁瑣的驅動配置,和環境依賴上浪費時間,開箱即可獲得「即插即用」的優化能力,直接開始構建或微調 AI 模型。
DGX Spark 在 CES 2026 上的出現,意味著「大模型本地化」已經不再是一句空話。無論是為了數據安全、開發效率,還是為了探索下一代具身智能,DGX Spark 都在努力成為下一代 AI 應用構建的基座。
就像現在,已經開始有讓 AI 來玩游戲的項目了,未來需要的,可能除了一塊能流暢打《黑神話:悟空》的 5090,還會有更多的桌面級 AI 超級計算機出現。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.