<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      全球最小的AI超級計算機:本地 大模型推理,秒殺Mac Mini

      0
      分享至


      NVIDIA 首席執行官黃仁勛親手交付全球最小 AI 超級計算機 DGX Spark——一個可置于辦公桌上、性能達千萬億次計算的機箱

      大家好,我是章北海

      Nvidia 又出新了——全球最小 AI 超級計算機 NVIDIA DGX Spark

      DGX Spark 配備 128GB 統一內存,可以在本地運行 2000 億參數規模的大模型,微調 700 億參數級別的大模型,它還支持開發者在本地創建 AI 智能體并運行先進軟件棧。


      開箱即用

      硬件方面: NVIDIA GB10 Grace Blackwell 超級芯片、NVIDIA ConnectX-7 200 Gb/s 網絡及 NVIDIA NVLink?-C2C 技術加速實現,其 CPU-GPU 一致性內存達 128GB,帶寬是第五代 PCIe 的 5 倍。

      在 GPU 方面,GB10 可提供高達1 PFLOP 的稀疏 FP4 張量性能,其 AI 能力大致介于 RTX 5070 和 5070 Ti 之間。最突出的特點是其128 GB 一致性統一系統內存,可在 CPU 和 GPU 之間無縫共享。這種統一架構使 DGX Spark 能夠直接加載和運行大型模型,無需承擔系統內存與顯存之間數據傳輸的開銷。借助其雙 QSFP 以太網端口(總帶寬 200 Gb/s),可將兩臺 DGX Spark 設備連接組成小型集群,實現更大模型的分布式推理。據 NVIDIA 稱,兩臺互聯的 DGX Spark 可處理參數規模高達4050 億的 FP4 模型


      DGX Spark 提供了令人印象深刻的連接選項:一個電源按鈕、四個 USB-C 端口(最左側支持高達 **240 瓦功率輸出** )、一個 HDMI 端口、一個 **10 千兆以太網 RJ-45 接口** ,以及**兩個由 NVIDIA ConnectX-7 網卡驅動的 QSFP 端口,最高支持 200 Gbps 速率** 。這些接口允許將兩臺 DGX Spark 設備互連,從而能夠運行更大型的 AI 模型。

      軟件方面: DGX Spark 集成了完整的 NVIDIA AI 平臺——包括 GPU、CPU、網絡、CUDA 庫及 NVIDIA AI 軟件棧,開發者能夠調用 NVIDIA AI 生態系統工具,包括各類模型、函數庫及 NVIDIA NIM?微服務,實現本地化工作流——例如定制 Black Forest Labs 的 FLUX.1 模型以優化圖像生成,運用 NVIDIA Cosmos? Reason 視覺語言模型創建視覺搜索與摘要代理,或是基于 Qwen3 構建專為 DGX Spark 優化的 AI 聊天機器人。


      全金屬機身配以優雅的香檳金涂層 測評

      lmsys 做了測試,結果雖然 DGX Spark 確實能夠加載并運行超大規模模型(如GPT-OSS 120BLlama 3.1 70B),但這些工作負載更適合用于原型設計和實驗驗證而非生產環境。DGX Spark 的真正優勢在于服務小型模型,特別是在采用批處理技術最大化吞吐量時表現尤為出色。


      具體來說在Ollama中運行GPT-OSS 20B(MXFP4)時,Spark 實現了2,053 tps 預填充/49.7 tps 解碼,是RTX Pro 6000 Blackwell是它的 5 倍** ,GeForce RTX 5090是它的 4 倍。這證實了 Spark 統一的 LPDDR5x 內存帶寬是主要限制因素。在

      但是 Spark 爆揍 Mac Mini M4 Pro 還是沒問題的,比如 gpt-oss-20b 和 deepseek-r1-14b 上,Spark 預填充速度都秒殺 Mac Mini

      Device

      Model Name

      Model Size

      Quantization

      Batch Size

      Prefill (tps)

      Decode (tps)

      NVIDIA DGX Spark

      gpt-oss

      20b

      mxfp4

      1

      2,053.98

      Mac Mini M4 Pro

      gpt-oss

      20b

      mxfp4

      1

      NVIDIA DGX Spark

      deepseek-r1

      14b

      q4_K_M

      1

      2,500.24

      Mac Mini M4 Pro

      deepseek-r1

      14b

      q4_K_M

      1


      結論

      這種統一內存架構使 DGX Spark 在原型開發模型實驗邊緣 AI 研究場景中極具價值——這些場景中流暢的內存訪問往往比原始算力更重要。

      簡而言之,DGX Spark并非設計為與完整規格的 Blackwell 或 Ada-Lovelace GPU 正面對抗,而是將 DGX 體驗濃縮至緊湊且開發者友好的形態中。

      它是以下場景的理想平臺:

      • 模型原型設計與實驗

      • 輕量級設備端推理

      • 關于內存一致性 GPU 架構的研究這是一臺設計精良、堪稱完美的迷你超級計算機,它以犧牲部分原始性能為代價,換取了更高的易用性、能效和優雅設計,在這些方面確實表現出色。

      參考: https://blogs.nvidia.com/blog/live-dgx-spark-delivery/ https://nvidianews.nvidia.com/news/nvidia-dgx-spark-arrives-for-worlds-ai-developers https://lmsys.org/blog/2025-10-13-nvidia-dgx-spark/



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      書紀文譚
      2026-02-10 18:32:15
      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      界面新聞
      2026-02-11 18:31:08
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      秋風專欄
      2025-08-13 15:54:55
      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      風過鄉
      2026-02-11 20:52:27
      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      小蔣愛嘮嗑
      2026-02-11 05:33:41
      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      東極妙嚴
      2026-02-11 12:54:31
      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      晚霧空青
      2026-02-11 08:41:59
      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      青眼財經
      2026-01-19 23:37:28
      萬斯:伊朗人民想推翻政權,那得靠他們自己

      萬斯:伊朗人民想推翻政權,那得靠他們自己

      桂系007
      2026-02-11 23:38:09
      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      墻頭草
      2026-02-09 16:37:03
      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      心靈得以滋養
      2026-02-11 21:50:42
      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      章眽八卦
      2026-02-11 12:40:57
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      球事百科吖
      2026-02-12 07:23:26
      3人共禁賽13場!這大概是年度最兇沖突了!

      3人共禁賽13場!這大概是年度最兇沖突了!

      柚子說球
      2026-02-12 07:52:13
      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      樂悠悠娛樂
      2026-02-10 12:44:32
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      達達哥
      2026-02-10 21:52:25
      2026-02-12 08:35:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      本地
      數碼
      家居
      藝術
      軍事航空

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      數碼要聞

      初音未來“變臉”耳夾式耳機預售:藍牙6.0/300mAh電池,129元

      家居要聞

      簡雅閑居 靜享時光柔

      藝術要聞

      這13個狂草字,您認出幾個?楷書練習多久就可以練行書了?

      軍事要聞

      特朗普:若美伊談判失敗 或再派一支航母打擊群

      無障礙瀏覽 進入關懷版