網易首頁 > 網易號 > 正文申請入駐

英偉達的個人超算，可能就是下一個消費級顯卡

2026-01-07 13:57:23　來源: 愛范兒

廣東舉報

分享至

今年的 CES 黃仁勛主題演講上，罕見的，他沒有介紹英偉達的消費級顯卡。

目前最新的消費級 GPU，還是去年在 CES 上正式發布的 RTX 50 系列。其中必然有內存全球大漲價的原因，當前市場的內存成本，一周之內就能漲價 50%-100%，并且多個分析機構表示，漲價會持續到 2027 年。

更多的原因還是 AI，就拿 AI 訓練和部署來說。一塊 RTX 5090 顯卡的最大顯存是 32GB，隨便找一個表現不錯的開源大模型，參數都是以百億為單位，所需要的顯存容量，32G 的優勢會比較有限。

但英偉達顯然不會放棄本地計算的市場，今年不發消費級的顯卡，有了全新的消費級個人超算。

英偉達在 CES 2026 上展示了全新的 DGX Spark，并且用它完成了多個 AI 相關的任務。開發者和創作者不需要昂貴的數據中心，通過 DGX Spark，就可以在本地流暢運行、微調，甚至推理高達 100B 參數的前沿 AI 模型。

我們之前也分享過 DGX Spark 的上手體驗，下載 1200 億參數的 GPT-OSS 開源模型，或者部署 Qwen 圖片生成、Wan 2.2 視頻生成，DGX Spark 都能做到。

再回顧一下 DGX Spark 的主要情況。

核心架構：基于 NVIDIA Grace Blackwell 架構打造，將數據中心級別的 AI 算力，濃縮到了緊湊的桌面機箱中。
海量內存：單機配備 128GB 統一內存。更為獨特的是，它支持通過 200Gbps 的 ConnectX-7 網絡，將兩臺 DGX Spark 互連，組成擁有 256GB 內存的超級節點。
核心能力：專為大模型時代設計，支持在本地運行 100B 參數級別的模型，或者對 70B 參數的 LLM 進行分布式微調。
定位：它不僅是開發者的沙盒環境，而且還要做 AI 創作者的平臺，主要是讓高強度的 AI 工作負載，脫離云端依賴，在本地安全、低延遲地完成。

本次 CES 更新的最大亮點，在于通過軟件升級引入了對 NVFP4 數據格式的全面支持。NVFP4 的數據格式，能夠讓新一代模型在保持智能表現的同時，內存占用降低約 40%，吞吐量大幅提升。

具體的實測數據，在兩個 DGX Spark 配置上運行 Qwen-235B 模型時，使用 NVFP4 相比 FP8 性能提升最高可達 2.6 倍。這直接地解決了，過去使用 FP8 精度時雙系統內存耗盡、無法多任務處理的難題。

硬件在桌面上，但訪問方式可以很云端。CES 上展示的 Brev 更新，還解決了 DGX Spark 本地算力靈活性不足的問題。

現在，開發者可以通過 Brev，安全地遠程連接 DGX Spark，就像使用云服務一樣便捷。此外，Brev 支持智能路由層。用戶可以將處理郵件或專有數據等敏感任務，強制保留在本地 DGX Spark 上運行，而將一般推理任務無縫路由至云端，兼顧了隱私安全與云端算力。

Brev 的引入，解決了本地算力不僅能用，還要好用的問題。它的本地計算支持預計于 2026 年春季正式推出。

這么強的算力能用來做什么，英偉達在 CES 現場的演示也給出了答案。

對于視頻創作者，這是強大的創意生成加速器。將 AI 視頻生成任務從筆記本轉移到 DGX Spark 上，相比頂配 M4 Max 的 MacBook Pro，速度實現了高達 8 倍的提升，真正做到了讓創作流不再卡頓。

不僅是個人開發者，對于注重本地安全的企業用戶，DGX Spark 也能勝任。英偉達展示了由 Nsight 驅動的本地 CUDA 編碼助手，企業開發者可以在享受 AI 輔助的同時，確保源代碼完全存儲在本地，杜絕信息泄露風險。

更有意思的演示是和機器人的結合。通過與 Hugging Face 的合作，DGX Spark 化身 Reachy Mini 機器人的「大腦」，讓機器人具備了實時視聽交互能力。現在看起來，用 DGX Spark 來做具身智能，也不再是大廠的專屬。

Hugging Face 產品副總裁 Jeff Boudier 也提到，「開放模型賦予開發者以自己的方式構建 AI ，而 DGX Spark 將這種能力帶到桌面端……讓強大的 AI 變成真正可以互動的存在。」

為了降低開發者的門檻，英偉達還在 CES 上一口氣新增了 6 個 Playbook（實戰手冊），重點覆蓋了當下的熱門需求。

Nemotron 3 Nano，英偉達最新的開源智能體大模型，用于本地 LLM 實驗。
Live VLM WebUI，實時視覺語言模型分析，通過輸入網絡攝像頭畫面，直接在 DGX Spark 本地進行視頻分析。
Isaac Sim / Lab，機器人仿真與強化學習。
雙系統微調，展示了如何利用兩臺 DGX Spark，分布式微調 70B 參數的 LLM。

除了 Playbook 的更新，DGX Spark 還預裝了經過優化的 NVIDIA AI 軟件和 CUDA-X 庫。這意味著開發者無需在繁瑣的驅動配置，和環境依賴上浪費時間，開箱即可獲得「即插即用」的優化能力，直接開始構建或微調 AI 模型。

DGX Spark 在 CES 2026 上的出現，意味著「大模型本地化」已經不再是一句空話。無論是為了數據安全、開發效率，還是為了探索下一代具身智能，DGX Spark 都在努力成為下一代 AI 應用構建的基座。

就像現在，已經開始有讓 AI 來玩游戲的項目了，未來需要的，可能除了一塊能流暢打《黑神話：悟空》的 5090，還會有更多的桌面級 AI 超級計算機出現。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.