GTC大會上,黃仁勛穿著他標志性的黑色皮衣,站在一排閃著金屬光澤的巨型機柜前,向臺下數千名工程師和投資人展示了一張密密麻麻的系統架構圖,這是一套完整的"工廠操作系統"——英偉達稱之為DSX。
這次配合Vera Rubin GPU,英偉達正式發布了AI超級工廠的完整版設計參考和數字孿生藍圖,標志著英偉達不只是賣硬件和軟件,而是要在AI推理需求跨越拐點之際,構建最具token生產效率與成本競爭力的基礎設施。
黃仁勛正在主動改變AI競爭的規則,目的是把token生產體系綁定在一代又一代的GPU芯片上;將整個AI工廠生命周期轉變為一個無縫優化的產品級系統,亦將對未來的制造業本身產生深遠的影響。
從超級工廠到AI超級工廠
2016年,馬斯克在接受采訪時說過一句讓很多人困惑的話:
“特斯拉真正的產品不是電動車,而是生產電動車的超級工廠。制造機器的機器,在難度上指數級超過機器本身。”
當時很多人把這句話當成馬斯克一貫的大話。但幾年后,當特斯拉上海工廠以令人難以置信的速度建成投產,并以遠低于弗里蒙特工廠的成本大規模生產Model 3時,人們才開始認真對待這句話的含義。
這句話有一個精確的技術意涵:制造系統的設計能力,比制造出來的單個產品更有價值。產品是工廠的輸出,工廠才是真正的護城河。競爭對手可以拆解每一顆螺絲,卻復制不了那套極度垂直整合、持續迭代的制造系統。
黃仁勛在GTC大會上展示的DSX,正是把這個洞見推進到了下一個量級。
在理解DSX之前,需要先理解黃仁勛所說的"AI工廠"是什么意思。
傳統數據中心的定位是存儲和計算數據的基礎設施——它更像是一個倉庫。但黃仁勛把新一代AI數據中心重新定義為"AI工廠":一座像制造業工廠一樣,持續不斷生產某種產品的場所。只不過這座工廠生產的不是汽車或芯片,而是智能,更準確地說,是AI推理所產生的token。
這個比喻不是修辭,而是在描述一個現實:當一座數據中心運行著數萬顆GPU,24小時不間斷地為全球數億用戶提供AI服務時,它和一座鋼鐵廠或汽車工廠在運營邏輯上的差異,遠比我們想象的要小。兩者都需要精密的能源管理、精確的溫度控制、復雜的物流調度,以及持續的效率優化。
而且,AI工廠的規模正在迅速逼近令人眩暈的量級。英偉達預計,一座吉瓦級AI工廠用電量相當于一座中型城市,它代表著500億美元的投資和2000億美元的潛在營收。在這個量級上,哪怕效率提升1%,就意味著20億美元的價值差距。
這就是DSX要解決的問題。
DSX:建造工廠的工廠
DSX的全稱是Data Center eXperience,副標題是"基礎設施級別的極致協同設計"。但用更直白的語言來說,它是一套從零建造和運營AI工廠的完整操作系統。
在GTC大會上,黃仁勛展示了兩張圖。第一張是戰略全景圖,把DSX分成三層:最底層是物理設施(芯片、機柜、電力系統、液冷系統),中間層是軟件庫和API,最頂層是參考設計和方法論。這張圖是說給投資人和決策者聽的:我們不只賣GPU,我們賣整座工廠。
![]()
第二張圖則是工程師看的版本,密密麻麻地展示了整個系統的工作流程,分為四個階段:設計(Design)、仿真(Simulate)、建造(Build)和運營(Operate)。這四個階段首尾相連,構成一個完整的閉環。
![]()
設計階段的核心是一套叫做SimReady的規范體系。在這個階段,每一臺機柜、每一根冷卻管道、每一條供電線路,都以OpenUSD格式被精確建模——不只是幾何形狀,還包括熱力學參數、電氣特性、連接拓撲。這些數字資產的精確度,達到了可以直接用于物理仿真的程度。
仿真階段是整個DSX最具革命性的環節。在Omniverse數字孿生平臺里,一座還沒動一塊磚的AI工廠,已經可以在虛擬環境中完整運行——網絡流量仿真、熱力學仿真、電氣負載仿真、站點環境仿真,同時進行,全面驗證。更關鍵的是,英偉達引入了Physics NeMo等工具,專門訓練替代模型(Surrogate Model)——用AI來加速物理仿真本身,使得仿真速度比傳統CFD(計算流體動力學)快出幾個數量級。
建造階段則把數字設計轉化為物理建設,引入了Procore等施工管理系統,整合BIM數據、施工進度、成本控制,甚至包括現場機器人和建造自動化。英偉達的野心延伸到了磚瓦之間。
而最令人著迷的,是最后一個階段。
智能體開始管理工廠
傳統工廠有一個令人沮喪的規律:它在建成那一天是最好的狀態,之后只有磨損和老化,靠人工維護來抵抗熵增。每一次參數調整,都依賴工程師的經驗積累;每一次故障排查,都需要翻閱厚厚的運維手冊。
DSX的運營階段(Operate)提出了一個完全相反的愿景:工廠越運行越聰明。
這個愿景的核心,是一家叫做Phaidra的公司。它在DSX的系統圖上以"AI Agents(Phaidra)"的形式出現,但這個簡短的標注背后,藏著一個相當深刻的技術故事。
Phaidra由三位創始人于2019年聯合創立——Jim Gao曾主導Google DeepMind的工業AI項目,Vedavyas Panneershelvam是AlphaGo的核心工程師之一,Katherine Hoffman則來自制冷設備巨頭Trane,擁有豐富的工業控制系統經驗。這個組合的意圖非常明確:把DeepMind級別的強化學習能力,嫁接到工業控制系統的實戰場景中。
Phaidra的技術原理,和AlphaGo學習圍棋的方式如出一轍。它不依賴預先編寫的規則(如果溫度超過X就觸發Y),而是通過強化學習,在數據中心的歷史遙測數據上反復訓練,讓AI自己摸索出最優的控制策略。
更精妙的是它的訓練方式:AI agent首先在Omniverse數字孿生環境里接受訓練,經歷數以萬計的虛擬運行場景,在不損壞任何真實設備的前提下學會如何應對各種極端情況。訓練成熟后,才被部署到真實的物理系統中。
英偉達用自己的DGX SuperPOD做了一次測試——用這套系統的數字孿生體訓練了一個AI智能體,然后部署到搭載真實AI工作負載的DGX GB200系統上。結果出人意料:在仿真中訓練出的智能體,其表現顯著超越了已經由人類專家精心調校過的現有液冷控制系統。這印證了一個規律:在足夠復雜的系統里,AI能發現人類專家窮盡經驗也想不到的優化路徑。
數字說明了一切:與傳統控制系統相比,Phaidra的智能體將AI工作負載引發的液冷熱峰值降低了約80%,GPU集群熱穩定性提升70%。而在更早期的Google數據中心應用中,冷卻能耗降低了40%。以往需要數天乃至數周的故障排查,現在縮短到數分鐘。
這些數字,在吉瓦級AI工廠的量級下,意味著數以十億美元計的節省。
兩百家合作伙伴
DSX不僅是英偉達垂直整合的極致追求,也是橫向開放的結果。
在GTC大會正式宣布這一平臺時,英偉達同時公布了超過200家合作伙伴,其中點名的核心伙伴,幾乎把AI工廠全生命周期的每一個關鍵節點都占據了。
設計環節:達索系統(Dassault Systèmes)將新的參考設計集成進其CATIA軟件的MBSE平臺;PTC負責產品生命周期管理;Cadence接入其數據中心數字孿生平臺;Jacobs——全球最大的工程建設咨詢公司之一——負責設施工程設計。
仿真環節:西門子(Siemens)和施耐德電氣(Schneider Electric)基于Omniverse DSX Blueprint,構建AI工廠的高精度數字孿生,在虛擬環境中仿真氣流、功耗、網絡拓撲和熱力學行為。
建造環節:Procore Technologies負責施工管理系統,整合BIM數據、施工進度、資產清單和成本控制。NScale和Switch已宣布使用DSX藍圖建設其AI工廠。
運營環節:伊頓(Eaton)與英偉達聯合推出了專為Vera Rubin NVL72設計的模塊化數據中心平臺,支持每機柜超過130kW的功率密度,采用800V直流供電基礎設施;維諦(Vertiv)負責精密電源和冷卻;特靈科技(Trane Technologies)提供熱管理解決方案;以及前文所述的Phaidra,負責AI自主運營。
而最值得關注的,是單獨列出的能源合作伙伴:通用電氣旗下的GE Vernova、日立(Hitachi)、西門子能源(Siemens Energy)和Emerald AI。這些公司的存在,揭示了AI工廠最終極的瓶頸所在——不是算力,而是電力。
GE Vernova將數字孿生能力延伸至從電網到AI工廠的整個電力棧,與DSX參考架構對齊,統一電力和算力建模。日立利用物理AI和電力系統專業知識,為吉瓦級AI工廠規劃高效可靠的電力供給。西門子能源在其Noedra數字孿生平臺中,使用NVIDIA RAPIDS庫實時監測電網健康狀態,在故障發生前預測風險。Emerald AI則專注于可再生能源的智能調度,對應DSX系統圖里DSX Flex模塊中那個明確標注的接入節點。
這張合作伙伴地圖,本身就是一幅完整的未來制造產業圖景。
![]()
從產品到工廠,到工廠的工廠
工業系統的演變,有三個遞進的認知層級:
第一層,設計更好的產品。這是大多數制造企業的競爭方式——更好的工程設計,更好的材料,更好的功能。這個層級的競爭是透明的,也是容易被模仿的。
第二層,把工廠本身當作產品來設計。這是馬斯克的洞見。工廠的建造效率、運營效率、持續迭代能力,才是真正的競爭壁壘。這個層級的競爭是隱性的,因為外人很難完整觀察到一座工廠系統的全貌。
第三層,把"如何建造和運營工廠"的完整知識體系產品化。這是英偉達DSX的野心。它不只是建造一座AI工廠,而是把建造和運營AI工廠的所有方法論、工具鏈、仿真體系、自動化運營能力,打包成一套可以交付、可以復制、可以持續迭代的系統。
用一個更簡潔的表達:
- 傳統制造是設計產品 ,建工廠生產產品
- 馬斯克認為工廠本身是產品 ,持續迭代工廠
- 黃仁勛預見到設計、建造、運營工廠的系統是產品,DSX就是建造AI工廠的工廠
這是一個"元制造"(Meta-Manufacturing)的概念。
DSX所代表的這套方法論,已經在AI數據中心建設中初步驗證,其影響也將遠遠超出AI數據中心本身。
首先,制造知識將被徹底軟件化。傳統工廠最寶貴的資產是隱性知識——老工程師幾十年積累的調試直覺,口口相傳的工藝參數,在特定設備上才能體現的操作習慣。這些知識極難轉移,一旦人員流失就永久損失,這也是在美國已經發生的事情,制造業中的許多行業,在美國不是“外包”的問題,而是已經失傳了。DSX正在做的,是把"如何建造和運營最優AI工廠"這套知識完全編碼進軟件——SimReady規范、Omniverse數字孿生、Phaidra的強化學習模型。第一座工廠的建設經驗,可以直接復用到第一百座;工廠知識不再依附于人,而是沉淀在系統里持續迭代。
其次,"先仿真后建造"將成為復雜制造的標準范式。工業史上最大的浪費,發生在"建好了才發現設計有問題"的時刻。Omniverse數字孿生讓整座AI工廠在第一塊磚鋪下之前就已經跑通了數千次仿真。這個邏輯可以向所有復雜制造系統推廣:芯片工廠在建設前完整仿真良率,化工廠在投產前完整仿真安全邊界,制藥工廠在投產前完整仿真GMP合規性。"建了再試"的時代,將逐步被"仿真即建造"取代。
第三,工廠將從靜態系統變成持續進化的有機體。Phaidra所代表的自主運營AI,讓工廠從開機第一天就在學習——自適應負載變化、季節變化、設備老化,持續逼近能效邊界,越運行越聰明。這個特性,在任何傳感器數據足夠豐富的復雜制造場景中都適用:汽車工廠的機器人控制、半導體工廠的良率優化、精密化工的反應爐管理。
第四,能源將重塑工業地理。當DSX把算力調度和電網調度打通,工廠可以在電價低谷時跑高強度訓練任務,可以作為電網的柔性調節器消納可再生能源的波動。這意味著工業選址邏輯將從靠近市場轉向靠近廉價與穩定的能源。西弗吉尼亞、沙特、阿聯酋大量投資AI工廠,本質上是在把自然資源稟賦(煤電、油氣、光照)兌換成算力資產。這是一次工業地理的重新洗牌。
英偉達在深挖新的護城河
表面答案是GPU。深一層的答案是AI計算平臺(CUDA生態)。而DSX揭示了最深層的答案:英偉達在賣的,是建造和運營AI工廠的完整能力。
這個定位的戰略含義極為深遠。單顆GPU的性能差距,競爭對手可以用3-5年時間追平。CUDA生態的護城河更深,需要10年以上的生態積累才能動搖。但"從電力規劃到AI自主運營的全棧AI工廠系統"這套能力,競爭對手要復制,面對的是一套由200家合作伙伴、數十年工業知識、以及自我進化的AI系統共同構成的壁壘。
馬斯克說,制造機器的機器,在難度上指數級超過機器本身。
英偉達用DSX押注的,是把這個指數級的難度,封裝成一個可以交付的產品。
如果這個賭注成立,未來制造業的真正分野,將不再是誰擁有最好的設備,而是誰掌握了"設計-仿真-建造-自主運營"這套完整閉環的系統能力。這是工業文明一次真正意義上的范式躍遷——從人操作機器"到AI運營工廠",從工廠生產產品到系統生成工廠。
如果說智能體的未來,是解決當下推理所面臨的挑戰,進一步降低token的成本,加快實現贏利的進度,那么決定未來競爭優勢的,已經不再是GPU芯片,而是高效產出token的能力。把技術和市場的這一趨勢,轉變競爭戰略,再工程化、系統化、產品化,這方面的能力,沒有人能比得過黃仁勛。
這就是AI工廠,一種能持續優化的產品級的系統。AI的自回歸的優化,不僅在于模型的生成能力本身,也在于產生這個模型的整個鏈條。
參考
https://nvidianews.nvidia.com/news/nvidia-releases-vera-rubin-dsx-ai-factory-reference-design-and-omniverse-dsx-digital-twin-blueprint-with-broad-industry-support
https://build.nvidia.com/nvidia/omniverse-dsx-blueprint-for-ai-factories
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.