|未經(jīng)許可不得轉(zhuǎn)載星標(biāo)本號獲取最新頂級認(rèn)知|
![]()
整理: Web3天空之城
在2026.1.6 拉斯維加斯璀璨的燈光下,英偉達(dá)(NVIDIA)創(chuàng)始人兼首席執(zhí)行官黃仁勛拉開了2025年國際消費(fèi)電子展(CES)的序幕。黃仁勛面對全球數(shù)百萬觀眾宣布:計(jì)算機(jī)行業(yè)正在經(jīng)歷每10到15年一次的徹底重置。這一次,傳統(tǒng)的五層技術(shù)棧正在被重新發(fā)明,而英偉達(dá)正試圖通過加速計(jì)算、開源模型與物理人工智能(Physical AI),定義下一個(gè)十年的生存規(guī)則。
演講視頻完整版:
00:04:14 計(jì)算機(jī)平臺演變與推理驅(qū)動(dòng)的人工智能革命
00:17:35 人工智能智能體與多模態(tài)企業(yè)級應(yīng)用架構(gòu)
00:28:24 物理人工智能:從世界模型到自動(dòng)駕駛實(shí)踐
00:47:34 具身智能機(jī)器人與工業(yè)級物理人工智能生態(tài)
00:57:26 維拉·魯賓架構(gòu):下一代超級計(jì)算核心芯片解析
01:09:00 極端協(xié)同設(shè)計(jì)與高性能網(wǎng)絡(luò)互聯(lián)系統(tǒng)
01:21:14 語義存儲革新與超級計(jì)算工廠的效能飛躍
以下是本次主題演講的核心洞見:
? 平臺轉(zhuǎn)型 :計(jì)算行業(yè)每10-15年重置一次,當(dāng)前正處于人工智能與加速計(jì)算雙重轉(zhuǎn)型的交匯點(diǎn),傳統(tǒng)五層技術(shù)棧正在被重新發(fā)明。
? 具身智能與物理AI :2025年是具身智能的爆發(fā)年,通過 Cosmos 世界基礎(chǔ)模型和合成數(shù)據(jù)生成技術(shù),AI 開始理解物理法則并與現(xiàn)實(shí)世界互動(dòng)。
? 自動(dòng)駕駛飛躍 :發(fā)布了具備推理能力的自動(dòng)駕駛 AI “Alpamayo”,實(shí)現(xiàn)了從傳感器輸入到執(zhí)行器輸出的端到端訓(xùn)練與邏輯解釋。
? Vera Rubin架構(gòu) :新一代 6 芯片系統(tǒng)實(shí)現(xiàn)全面投產(chǎn),通過“極端代碼設(shè)計(jì)”突破了摩爾定律放緩的限制,大幅提升了 AI 訓(xùn)練與推理的能效比。
? “計(jì)算行業(yè)每10到15年重置一次,當(dāng)前我們正處于加速計(jì)算與人工智能雙重轉(zhuǎn)型的交匯點(diǎn)。”
? “2025年將是具身智能的爆發(fā)年,AI開始理解物理法則并與現(xiàn)實(shí)世界深度互動(dòng)。”
? “開源模型已經(jīng)達(dá)到前沿水平,DeepSeek R1等模型的進(jìn)步激活了全球范圍內(nèi)的AI創(chuàng)新運(yùn)動(dòng)。”
? “未來的應(yīng)用將建立在智能體(Agents)之上,它們具備推理、規(guī)劃并使用工具解決復(fù)雜問題的能力。”
? “自動(dòng)駕駛的未來在于具備推理能力的AI,它不僅是傳感器的反饋,更是對物理世界的邏輯解釋。”
? “‘Vera Rubin’架構(gòu)代表了極端的協(xié)同設(shè)計(jì),我們在摩爾定律放緩的背景下,實(shí)現(xiàn)了算力的指數(shù)級躍升。”
黃仁勛指出,計(jì)算的基礎(chǔ)形態(tài)已經(jīng)發(fā)生了根本性的重塑。過去,我們編寫代碼、預(yù)編譯程序并在CPU上運(yùn)行;而現(xiàn)在,我們訓(xùn)練軟件,并在GPU上運(yùn)行。這種轉(zhuǎn)變意味著價(jià)值十萬億美元的計(jì)算領(lǐng)域正在進(jìn)行現(xiàn)代化改造。
現(xiàn)在的應(yīng)用程序需要理解上下文,并且每一次都從零開始生成每一個(gè)像素和標(biāo)記 黃仁勛強(qiáng)調(diào)。這意味著每年數(shù)千億美元的研發(fā)預(yù)算正在從傳統(tǒng)方法轉(zhuǎn)向人工智能。在這個(gè)新世界中,人工智能不再僅僅是一個(gè)應(yīng)用程序,而是構(gòu)建所有應(yīng)用程序的基石。
開源模型的崛起與“智能體”架構(gòu)
![]()
去年是人工智能歷史上的重要節(jié)點(diǎn),尤其是開源模型的進(jìn)步。黃仁勛特別提到了DeepSeek R1的突破:“它是第一個(gè)具有推理系統(tǒng)的開源模型,讓全世界感到驚訝。開源模型已經(jīng)達(dá)到了前沿水平,這讓每個(gè)國家和企業(yè)都能參與到這場革命中。”
英偉達(dá)的角色正在發(fā)生轉(zhuǎn)變,它不僅是芯片供應(yīng)商,更是前沿人工智能模型的構(gòu)建者。黃仁勛展示了英偉達(dá)如何通過開源模型、數(shù)據(jù)和工具庫(如Nemo、Cosmos)來賦能全球生態(tài)。他認(rèn)為,未來的企業(yè)UI將不再是繁瑣的表格或命令行,而是“智能體系統(tǒng)”。
智能體系統(tǒng)就是界面,它能推理如何解決問題,而不只是機(jī)械地執(zhí)行指令。 在現(xiàn)場演示中,一個(gè)基于英偉達(dá)架構(gòu)的個(gè)人助理展示了如何跨模型協(xié)作:處理私密郵件時(shí)調(diào)用本地模型,處理復(fù)雜創(chuàng)意時(shí)調(diào)用云端前沿模型,同時(shí)控制物理機(jī)器人完成家務(wù)。這種“多模型、多云、混合云”的架構(gòu),正是未來應(yīng)用的基本框架。
物理人工智能:物理世界的“ChatGPT時(shí)刻”
![]()
如果說大語言模型讓AI學(xué)會(huì)了說話,那么物理人工智能(Physical AI)則讓AI學(xué)會(huì)了行動(dòng)。黃仁勛認(rèn)為,物理AI的“ChatGPT時(shí)刻”已經(jīng)迫近。
物理人工智能不僅是與世界互動(dòng),更是要理解物理定律。 為了教AI學(xué)會(huì)常識——如物體恒存性、因果關(guān)系和重力——英偉達(dá)構(gòu)建了三臺計(jì)算機(jī)的閉環(huán):一臺用于訓(xùn)練,一臺用于模擬(Omniverse),一臺用于執(zhí)行(機(jī)器人電腦)。
由于真實(shí)世界的物理數(shù)據(jù)極其稀缺,英偉達(dá)推出了Cosmos世界基礎(chǔ)模型。Cosmos將計(jì)算轉(zhuǎn)化為數(shù)據(jù),通過合成數(shù)據(jù)生成技術(shù),我們可以在虛擬世界中模擬數(shù)萬億英里的駕駛或機(jī)器人的各種極端操作場景。 這種“以物理定律為約束”的模擬,解決了機(jī)器人訓(xùn)練中最昂貴、最慢的數(shù)據(jù)獲取難題。
Alpamayo:賦予汽車“思考”的能力
在自動(dòng)駕駛領(lǐng)域,英偉達(dá)發(fā)布了具備推理能力的AI模型——Alpamayo。這是世界上第一個(gè)實(shí)現(xiàn)了“端到端訓(xùn)練”且具備邏輯解釋能力的自動(dòng)駕駛系統(tǒng)。
汽車不僅要學(xué)會(huì)像人類一樣自然駕駛,更要在遇到突發(fā)狀況時(shí)進(jìn)行推理,并告訴你它為什么要這么做。 黃仁勛透露,英偉達(dá)與梅賽德斯-奔馳(Mercedes-Benz)深度合作的這一系統(tǒng)將在2025年第一季度正式上路。為了確保絕對安全,英偉達(dá)采用了雙重棧架構(gòu):一個(gè)端到端訓(xùn)練的AI模型負(fù)責(zé)自然駕駛,一個(gè)基于規(guī)則的經(jīng)典安全堆棧負(fù)責(zé)兜底護(hù)欄。這種多樣性和冗余性,是英偉達(dá)對未來十年交通自動(dòng)化的承諾。
Vera Rubin架構(gòu):突破摩爾定律的極限
演講的高潮部分是全新高性能計(jì)算架構(gòu)Vera Rubin的發(fā)布。面對摩爾定律的放緩,英偉達(dá)采取了“極端協(xié)同設(shè)計(jì)”(Extreme Co-design)的策略。
Vera Rubin架構(gòu)是一個(gè)由六個(gè)芯片組成的復(fù)雜系統(tǒng),包括性能翻倍的Vera CPU和算力提升5倍的Rubin GPU。“在晶體管數(shù)量僅增加1.6倍的情況下,我們實(shí)現(xiàn)了5倍的推理性能飛躍,這完全歸功于極端的代碼設(shè)計(jì)和新型張量核心結(jié)構(gòu)。”
此外,英偉達(dá)還重塑了數(shù)據(jù)中心的基礎(chǔ)設(shè)施,推出了硅光子交換機(jī)和針對AI優(yōu)化的以太網(wǎng)Spectrum X。“我們正在用熱水冷卻超級計(jì)算機(jī),這使我們能節(jié)省全球約6%的數(shù)據(jù)中心電力。” 這種全棧式的創(chuàng)新,使得在給定時(shí)間內(nèi)訓(xùn)練超大規(guī)模模型所需的系統(tǒng)數(shù)量減少到原來的四分之一。
從設(shè)計(jì)芯片的EDA工具到制造機(jī)器人的數(shù)字化工廠,英偉達(dá)正與西門子、新思、楷登等巨頭合作,將物理AI帶入完整的工業(yè)生命周期。
“我們正處于一場新的工業(yè)革命的開端,”黃仁勛最后總結(jié)道,“人工智能正在重塑從芯片到基礎(chǔ)設(shè)施、再到應(yīng)用的所有環(huán)節(jié)。我們的任務(wù)是構(gòu)建完整的技術(shù)棧,以便你們可以為全世界創(chuàng)造出令人難以置信的應(yīng)用。”
Web3天空之城全文整理 計(jì)算機(jī)行業(yè)的平臺轉(zhuǎn)型與AI現(xiàn)代化
拉斯維加斯的朋友們,大家好!新年快樂!歡迎來到國際消費(fèi)電子產(chǎn)品展(CES)!我們這里有大約15場主題演講的內(nèi)容要塞進(jìn)來。
我很高興見到你們所有人。你們這個(gè)禮堂里有3,000人。庭院里有2,000人在觀看我們。據(jù)稱,在四樓本該是播放視頻的樓層,還有另外1,000人在觀看這次主題演講,當(dāng)然,全球還有數(shù)百萬人將觀看這次演講以開啟新的一年。
大約每10到15年,計(jì)算機(jī)行業(yè)就會(huì)重置一次。
一個(gè)新的平臺轉(zhuǎn)變會(huì)發(fā)生。從大型機(jī)到個(gè)人電腦,從個(gè)人電腦到互聯(lián)網(wǎng),從互聯(lián)網(wǎng)到云計(jì)算,再到移動(dòng)設(shè)備。每一次,應(yīng)用程序的世界都會(huì)瞄準(zhǔn)一個(gè)新的平臺。這就是為什么它被稱為平臺轉(zhuǎn)變。你為一臺新計(jì)算機(jī)編寫新的應(yīng)用程序。
只不過這一次,實(shí)際上同時(shí)發(fā)生了兩次平臺轉(zhuǎn)變。我們現(xiàn)在轉(zhuǎn)向人工智能,應(yīng)用程序?qū)⒔⒃谌斯ぶ悄苤稀F鸪酰藗冋J(rèn)為人工智能就是應(yīng)用程序,事實(shí)上,人工智能確實(shí)是應(yīng)用程序,但你將會(huì)在人工智能之上構(gòu)建應(yīng)用程序,但除此之外,軟件的運(yùn)行方式和開發(fā)方式也發(fā)生了根本性的改變。
整個(gè)計(jì)算機(jī)行業(yè)的五層技術(shù)棧正在被重新發(fā)明。你不再是編程軟件,而是訓(xùn)練軟件。你不再在中央處理器上運(yùn)行它,而是在圖形處理器上運(yùn)行。而且,過去應(yīng)用程序是預(yù)先錄制、預(yù)先編譯并在你的設(shè)備上運(yùn)行,而現(xiàn)在應(yīng)用程序需要理解上下文,并且每一次都從零開始生成每一個(gè)像素、每一個(gè)標(biāo)記。
由于加速計(jì)算和人工智能,計(jì)算的基礎(chǔ)形態(tài)已經(jīng)發(fā)生了根本性的重塑。那五層蛋糕的每一層現(xiàn)在都在被重新發(fā)明。這意味著過去十年中價(jià)值約十萬億美元的計(jì)算領(lǐng)域正在以這種新的計(jì)算機(jī)方式進(jìn)行現(xiàn)代化改造。這意味著每年數(shù)千億美元,大約兩千億美元的風(fēng)險(xiǎn)投資正在投入到現(xiàn)代化和發(fā)明這個(gè)新世界中去。這意味著價(jià)值十萬億美元的產(chǎn)業(yè),其中百分之幾是研發(fā)預(yù)算,正在轉(zhuǎn)向人工智能。
人們會(huì)問,錢從哪里來?這就是資金的來源。人工智能的現(xiàn)代化進(jìn)程,研發(fā)預(yù)算從傳統(tǒng)方法轉(zhuǎn)向現(xiàn)在的人工智能方法的轉(zhuǎn)變。大量資金涌入這個(gè)行業(yè),這解釋了我們?yōu)楹稳绱嗣β怠Hツ暌膊焕狻Hツ晔遣豢伤甲h的。去年,有一張幻燈片即將展示。這就是不練習(xí)時(shí)發(fā)生的情況。這是今年的第一次主題演講。我希望這是你今年的第一次主題演講。否則,你可能已經(jīng)相當(dāng)忙碌了。這是我們今年的第一次主題演講。年。我們要把蜘蛛網(wǎng)清干凈了。
所以2025年是不可思議的一年。這只是,似乎所有事情都同時(shí)發(fā)生了,事實(shí)上,可能確實(shí)如此。首先,當(dāng)然是損失的擴(kuò)大。2015年,我真正認(rèn)為會(huì)帶來變革的第一個(gè)語言模型產(chǎn)生了巨大的影響。它被稱為Bert。2017年出現(xiàn)了變形金剛。直到五年后,也就是2022年,才出現(xiàn)了ChatGPT時(shí)刻,它讓全世界都意識到了人工智能的可能性。一年后發(fā)生了一件非常重要的事情。
ChatGPT的第一個(gè)01模型,第一個(gè)推理模型,是完全革命性的,它發(fā)明了一個(gè)叫做測試時(shí)縮放(test time scaling)的想法,這是一個(gè)非常符合常識的東西。
我們不僅預(yù)先訓(xùn)練模型以進(jìn)行學(xué)習(xí),還使用真實(shí)的強(qiáng)化學(xué)習(xí)對其進(jìn)行后訓(xùn)練,使其能夠?qū)W習(xí)技能。現(xiàn)在我們也有了測試時(shí)縮放,換句話說就是思考。你是在實(shí)時(shí)思考。人工智能的每一個(gè)階段都需要大量的計(jì)算能力。而計(jì)算定律持續(xù)擴(kuò)展。大型語言模型持續(xù)改進(jìn)。
與此同時(shí),又出現(xiàn)了一項(xiàng)突破。這項(xiàng)突破發(fā)生在2024年。具身智能系統(tǒng)開始涌現(xiàn)。2025年,它開始涌現(xiàn)。滲透、擴(kuò)散到幾乎無處不在。那些具備推理能力、查找信息、進(jìn)行研究、使用工具、規(guī)劃未來、模擬結(jié)果的具身模型,突然間開始解決非常非常重要的問題。
我最喜歡的具身模型之一叫做Cursor(光標(biāo)),它徹底改變了我們在英偉達(dá)進(jìn)行軟件編程的方式。具身智能系統(tǒng)將從這里真正起飛。當(dāng)然,還有其他類型的人工智能。我們知道大型語言模型并非信息的唯一類型。無論宇宙中存在何種信息,無論宇宙存在何種結(jié)構(gòu),我們都可以訓(xùn)練一種大型語言模型,一種語言模型的形態(tài),去理解該信息,理解其表征,并將其轉(zhuǎn)化為人工智能。
其中一個(gè)最大、最重要的就是物理人工智能,即理解自然規(guī)律的人工智能。然后,當(dāng)然,物理人工智能是關(guān)于人工智能與世界的互動(dòng),但世界本身包含信息,編碼信息,這就被稱為人工智能物理學(xué)。在物理人工智能的案例中,你有與物理世界互動(dòng)的AI,還有人工智能物理學(xué),即理解物理定律的AI。
開源模型的崛起與物理基礎(chǔ)模型
然后是去年的最后一件,也是最重要的事情之一,即開源模型的進(jìn)步。
我們現(xiàn)在知道,當(dāng)開源、開放創(chuàng)新、全球每家公司和每個(gè)行業(yè)的創(chuàng)新同時(shí)被激活時(shí),人工智能將無處不在地?cái)U(kuò)散。開源模型去年真的騰飛了。事實(shí)上,去年我們看到了DeepSeek R1的進(jìn)步,它是第一個(gè)具有推理系統(tǒng)的開源模型。它讓全世界感到驚訝,并真正激活了整個(gè)運(yùn)動(dòng)。這是一項(xiàng)非常非常令人興奮的工作。我們對此感到非常高興。
現(xiàn)在,世界各地都有各種各樣的開源模型系統(tǒng),我們現(xiàn)在知道開源模型也已經(jīng)達(dá)到了前沿水平。仍然比前沿模型落后整整六個(gè)月,但每隔六個(gè)月,就會(huì)有新的模型出現(xiàn),而且這些模型變得越來越智能。正因?yàn)槿绱耍憧梢钥吹较螺d量已經(jīng)激增。下載量增長如此之快,是因?yàn)槌鮿?chuàng)公司想要參與人工智能革命,大公司想要,研究人員想要,學(xué)生想要,幾乎所有國家都想要。智能,即數(shù)字形式的智能,怎么可能把任何人落下?因此,開源模型去年確實(shí)徹底改變了人工智能的面貌。整個(gè)行業(yè)將因此被重塑。
現(xiàn)在,我們很早以前就有這種預(yù)感了。你可能聽說過,幾年前,我們就開始構(gòu)建和運(yùn)營自己的人工智能超級計(jì)算機(jī)了。我們稱之為DGX云。很多人問,你們是要進(jìn)軍云計(jì)算業(yè)務(wù)嗎?答案是否定的。我們正在為我們自己的用途構(gòu)建這些DGX超級計(jì)算機(jī)。事實(shí)證明,我們有數(shù)十億美元的超級計(jì)算機(jī)正在運(yùn)行,以便我們能夠開發(fā)我們的開源模型。我對我們所做的工作感到非常滿意。
由于我們在眾多不同的領(lǐng)域從事前沿人工智能模型的研發(fā)工作,這開始吸引全球和各行各業(yè)的關(guān)注。我們在蛋白質(zhì)、數(shù)字生物學(xué)領(lǐng)域所做的工作,例如La Pratina,能夠合成和生成蛋白質(zhì)。Open Fold 3,用于理解蛋白質(zhì)的結(jié)構(gòu)。Evo 2。如何理解和生成多個(gè)。多個(gè)蛋白質(zhì),否則就是細(xì)胞表征的開端。地球2,理解物理定律的人工智能,我們用ForecastNet所做的工作,我們用CoreDiv所做的工作,真正徹底改變了人們進(jìn)行天氣預(yù)測的方式。
Nemotri,我們現(xiàn)在在那里做著開創(chuàng)性的工作,第一個(gè)混合Transformer SSM模型,它速度極快,因此可以長時(shí)間思考,或者可以短時(shí)間快速思考并產(chǎn)生非常聰明、智能的答案。Nemotron 3是開創(chuàng)性的工作,您可以期待我們在不久的將來推出Neumotron 3之外的其他版本。Cosmos,一個(gè)前沿的、開放的、世界基礎(chǔ)模型,一個(gè)理解世界如何運(yùn)作的模型。Groot,一個(gè)類人機(jī)器人系統(tǒng),關(guān)節(jié)運(yùn)動(dòng)、移動(dòng)性、行走能力,這些模型,這些技術(shù)現(xiàn)在正在被整合,并且在所有這些案例中,都向全世界開放。前沿的人機(jī)和機(jī)器人模型向全世界開放。
然后今天,我們將談?wù)撘稽c(diǎn)關(guān)于Alpamio,我們一直在自動(dòng)駕駛汽車領(lǐng)域所做的工作。我們不僅開源這些模型,我們還開源用于訓(xùn)練這些模型的數(shù)據(jù)。因?yàn)橹挥型ㄟ^這種方式,你才能真正相信這些模型是如何產(chǎn)生的。我們將這些模型產(chǎn)生的一切都開源了。模型,我們幫助您基于它們創(chuàng)建衍生模型。
我們擁有一整套庫。我們稱之為 Nemo 庫,物理學(xué) Nemo 庫,以及 Clara Nemo 庫,每種都是生物 Nemo 庫。這些庫中的每一個(gè)都是人工智能的生命周期管理系統(tǒng),因此您可以處理數(shù)據(jù)、生成數(shù)據(jù)、訓(xùn)練模型、創(chuàng)建模型、評估模型、設(shè)置護(hù)欄保護(hù)模型,直到部署模型。這些庫中的每一個(gè)都極其復(fù)雜,而且所有這些都是開源的。
因此,現(xiàn)在在這個(gè)平臺之上,英偉達(dá)是一家前沿人工智能模型的構(gòu)建者,我們以一種非常特殊的方式構(gòu)建它。我們完全公開地構(gòu)建它,以便我們能夠使每家公司、每個(gè)行業(yè)、每個(gè)國家都能參與到這場人工智能革命中來。我為我們正在那里所做的工作感到非常自豪。事實(shí)上,如果您注意到圖表,圖表顯示我們對該行業(yè)的貢獻(xiàn)是首屈一指的,您會(huì)看到我們將繼續(xù)這樣做,甚至?xí)铀佟_@些模型也是世界級的。所有系統(tǒng)都宕機(jī)了。
在圣克拉拉這從沒發(fā)生過。是因?yàn)槔咕S加斯嗎?
肯定有人想在外面贏大獎(jiǎng)。所有系統(tǒng)都宕機(jī)了。
我想我的系統(tǒng)仍然宕機(jī),但沒關(guān)系。我會(huì)隨機(jī)應(yīng)變。所以這些模型不僅具有前沿能力,不僅是開放的,它們還登上了排行榜榜首。這是我們非常自豪的一個(gè)領(lǐng)域。它們在智能方面登上了排行榜榜首。
我們有一些重要的模型正在理解多模態(tài)文檔,也就是PDF文件。世界上最有價(jià)值的內(nèi)容都以PDF的形式存儲著。但需要人工智能才能發(fā)現(xiàn)其中的內(nèi)容、解釋其中的內(nèi)容并幫助您閱讀它。因此,我們的PDF檢索器、PDF解析器,我們世界一流的,我們的語音識別模型,絕對是世界一流的。我們的檢索模型,基本上是搜索、語義搜索、人工智能搜索,是現(xiàn)代人工智能時(shí)代的數(shù)據(jù)庫引擎,世界一流。所以我們一直在排行榜上名列前茅。這是我們非常自豪的一個(gè)領(lǐng)域。
人工智能代理(Agents)與個(gè)人助理演示
而所有這一切都是為了幫助您構(gòu)建人工智能代理。
這確實(shí)是一個(gè)開創(chuàng)性的發(fā)展領(lǐng)域。起初,當(dāng)ChatGPT出現(xiàn)時(shí),人們說,天哪,它產(chǎn)生了非常有趣的結(jié)果,但它產(chǎn)生了大量的幻覺。
它產(chǎn)生幻覺的原因,當(dāng)然,它過去可以記住所有事情,但它無法記住現(xiàn)在未來會(huì)發(fā)生的所有事情。
因此,它需要以研究為基礎(chǔ)。在回答問題之前,它必須進(jìn)行基礎(chǔ)研究。關(guān)于是否需要進(jìn)行研究的推理能力;是否需要使用工具;
如何將一個(gè)問題分解成步驟;這些步驟中的每一步,都是人工智能模型知道如何完成的事情,然后它們共同組合成一系列步驟,以執(zhí)行它以前從未做過的事情。
那是它從未接受過訓(xùn)練去做的事情。這就是推理的神奇能力。我們可能會(huì)遇到一個(gè)從未見過的情況,并將其分解成我們知道如何處理的情況、知識或規(guī)則,因?yàn)槲覀冞^去經(jīng)歷過。因此,現(xiàn)在的人工智能模型具備了極其強(qiáng)大的推理能力。
智能體的推理能力為所有這些不同的應(yīng)用打開了大門。我們不再需要在第一天就訓(xùn)練人工智能模型了解一切,正如我們自己也不需要在第一天就了解一切一樣,我們應(yīng)該能夠在任何情況下,推理出如何解決那個(gè)問題。大型語言模型現(xiàn)在已經(jīng)實(shí)現(xiàn)了這一根本性的飛躍。使用強(qiáng)化學(xué)習(xí)、思維鏈,以及搜索、規(guī)劃和所有這些不同的強(qiáng)化學(xué)習(xí)技術(shù)的能力,使我們能夠具備這種基本能力,而且現(xiàn)在也完全開源了。
但真正了不起的是另一件事。發(fā)生的又一個(gè)突破。我第一次看到它是在 Ervin 的 Perplexity(一個(gè)人工智能搜索公司)那里,那是一家非常出色、極具創(chuàng)新性的公司。當(dāng)我第一次意識到他們同時(shí)使用了多個(gè)模型時(shí),我覺得這完全是天才之舉。當(dāng)然我們會(huì)這樣做。當(dāng)然,一個(gè)人工智能在推理鏈的任何部分要解決它想解決的問題時(shí),也會(huì)調(diào)用世界上所有偉大的人工智能。這就是原因所在。為什么人工智能真的是多模態(tài)的,這意味著它們理解語音、圖像、文本、視頻、3D圖形和蛋白質(zhì)。它是多模態(tài)的。它也是多模態(tài)的,這意味著它們應(yīng)該能夠使用最適合任務(wù)的任何模型。
因此,它本質(zhì)上是多云的,因?yàn)檫@些人工智能模型存在于所有這些不同的地方,它也是混合云,因?yàn)槿绻闶且患移髽I(yè)公司,或者你制造了一個(gè)機(jī)器人,或者無論那個(gè)設(shè)備是什么,它有時(shí)在邊緣,有時(shí)在無線電基站,也許有時(shí)在企業(yè)里,或者可能是在一個(gè)醫(yī)院,你需要實(shí)時(shí)地將數(shù)據(jù)保存在你身邊。
無論這些應(yīng)用是什么,我們現(xiàn)在都知道這就是未來人工智能應(yīng)用的樣子。
或者從另一個(gè)角度來看,因?yàn)槲磥淼膽?yīng)用是建立在人工智能之上的,這就是未來應(yīng)用的基本框架。這種基本框架,這種能夠完成我所談?wù)摰氖虑榈纳墒饺斯ぶ悄艿幕窘Y(jié)構(gòu),它是多模型的,已經(jīng)極大地提升了所有類型人工智能的性能。現(xiàn)在,由于所有開放的模型和我們提供的所有工具,你也可以定制你的人工智能,教你的人工智能沒有人教的技能。沒有其他人以那種方式使其人工智能變得智能或聰明。你可以為自己做這件事。這就是我們用 Nemotron、Nemo 以及我們用開源模型所做的所有事情的目的所在。你在它前面放一個(gè)智能路由器,這個(gè)路由器本質(zhì)上是一個(gè)管理器,它根據(jù)你給出的提示的意圖,決定哪個(gè)模型最適合該應(yīng)用、最適合解決該問題。好的?所以現(xiàn)在,當(dāng)你考慮這種架構(gòu)時(shí),你擁有什么?
當(dāng)你考慮這種架構(gòu)時(shí),突然之間,你擁有了一個(gè)人工智能,一方面你可以完全根據(jù)自己的需求進(jìn)行定制。
你可以教它為你公司做你自己的特定技能。
一些屬于領(lǐng)域機(jī)密的東西,一些你擁有深厚領(lǐng)域?qū)I(yè)知識的東西。
也許你擁有訓(xùn)練該人工智能模型所需的所有數(shù)據(jù)。另一方面,你的人工智能在定義上始終處于前沿水平。一方面,你總是在最前沿。另一方面,你總是定制化的,而且它應(yīng)該可以直接運(yùn)行。所以我們想提供一個(gè)最簡單的示例供您使用。我們稱這個(gè)完整的框架為“藍(lán)圖”。我們的藍(lán)圖已經(jīng)集成到世界各地的企業(yè)SaaS平臺中,我們對目前的進(jìn)展感到非常滿意。但我們要做的是向您展示一個(gè)簡短的示例。這是任何人都可以做的事情。
讓我們來構(gòu)建一個(gè)個(gè)人助理。我希望它能幫我處理日歷、電子郵件、待辦事項(xiàng)列表,甚至照看我的家。我使用 brev 將我的 DGX Spark 變成一個(gè)個(gè)人云。這樣,無論我使用的是云GPU還是DGX Spark,我都可以使用相同的界面。我使用前沿模型API來輕松入門。我想讓它幫我處理電子郵件,所以我為我的代理程序創(chuàng)建了一個(gè)可以調(diào)用的電子郵件工具。
我希望我的電子郵件保持私密,所以我將添加一個(gè)在Spark上本地運(yùn)行的開源模型。現(xiàn)在,對于任何任務(wù),我都希望代理程序?yàn)檎_的任務(wù)使用正確的模型,所以我將使用一個(gè)基于意圖的模型路由器。
這樣,需要電子郵件的提示就會(huì)保留在我的Spark上,而其他所有內(nèi)容都可以調(diào)用前沿模型。我希望我的助手能夠與我的世界互動(dòng),所以我將它連接到Hugging Face的Ritchie迷你機(jī)器人。我的代理程序通過工具調(diào)用來控制Ritchie的頭部、耳朵和攝像頭。我想給Ritchie一個(gè)聲音,我非常喜歡11 Labs,所以我將連接它們的API。你好,我是Ritchie,運(yùn)行在DGX Spark上。嘿Ritchie,我今天的待辦事項(xiàng)清單上有什么?你今天的待辦事項(xiàng)清單。去買些雜貨、雞蛋、牛奶、黃油,然后把新劇本發(fā)給詹森。我們把這個(gè)更新發(fā)給詹森。告訴他們我們今天下班前會(huì)準(zhǔn)備好給他。我們會(huì)照辦的。里奇,還有個(gè)草圖。你能把它變成一個(gè)建筑效果圖嗎?
當(dāng)然可以。
這難道不令人難以置信嗎?
企業(yè)AI架構(gòu)與物理人工智能
現(xiàn)在,奇妙之處在于這現(xiàn)在是完全微不足道的。
這現(xiàn)在是完全微不足道的。然而,就在幾年前,這一切還是不可能實(shí)現(xiàn)的。絕對是無法想象的。這個(gè)基礎(chǔ)框架,這種使用語言模型構(gòu)建應(yīng)用的基礎(chǔ)方式,
使用語言模型,使用那些經(jīng)過預(yù)訓(xùn)練且專有的前沿語言模型,將其與定制的語言模型結(jié)合,融入到一個(gè)代理框架、一個(gè)推理框架中,該框架允許你訪問工具和文件,甚至可能連接到其他代理。這基本上就是...的架構(gòu):是現(xiàn)代應(yīng)用的或人工智能應(yīng)用的架構(gòu)。
而我們創(chuàng)建 these 應(yīng)用的能力是極其迅速的。請注意,如果你給它這個(gè)應(yīng)用,提供它從未見過的信息,或者提供一個(gè)與你所想結(jié)構(gòu)不完全一致的結(jié)構(gòu),它仍然可以對這些數(shù)據(jù)、這些信息進(jìn)行推理,并盡力去理解如何解決問題。人工智能。因此,這個(gè)基礎(chǔ)框架正在被整合,我剛才描述的一切,我們有幸與一些世界領(lǐng)先的企業(yè)平臺公司合作。
例如 Palantir。
他們整個(gè)的人工智能和數(shù)據(jù)處理平臺正在被集成,并由英偉達(dá)加速。Service Now,世界領(lǐng)先的客戶服務(wù)和員工服務(wù)平臺。Snowflake,世界頂級的云數(shù)據(jù)平臺,那里正在進(jìn)行著令人難以置信的工作。
CodeRabbit,我們在英偉達(dá)全方位使用 CodeRabbit。CrowdStrike 正在創(chuàng)建人工智能來檢測、發(fā)現(xiàn)人工智能威脅。
NetApp,他們的數(shù)據(jù)平臺現(xiàn)在在其之上集成了英偉達(dá)的語義人工智能和智能體系統(tǒng),供他們進(jìn)行客戶服務(wù)。
但重要的是這一點(diǎn)。
這不僅是現(xiàn)在開發(fā)應(yīng)用程序的方式,這將是您平臺的(新的)用戶界面。
所以,無論是Palantir、Service Now、Snowflake還是我們合作的許多其他公司,智能體系統(tǒng)就是界面。它不再是Excel,不再是那些讓你輸入信息的方格。也許它不再只是命令行。所有這些多模態(tài)信息現(xiàn)在都成為可能。你與你的平臺、平臺進(jìn)行交互的方式更加,如果你愿意這么說,更加簡單,就像你與人互動(dòng)一樣。這就是企業(yè)人工智能正被智能體系統(tǒng)徹底改變的地方。
接下來是物理人工智能。這是我已經(jīng)談?wù)摿撕脦啄甑囊粋€(gè)領(lǐng)域。事實(shí)上,我們已經(jīng)在這一領(lǐng)域工作了八年。問題在于,你如何將計(jì)算機(jī)內(nèi)部的智能體,那個(gè)通過屏幕和揚(yáng)聲器與你交互的東西,轉(zhuǎn)變?yōu)槟軌蚺c現(xiàn)實(shí)世界互動(dòng)的實(shí)體,這意味著它能夠理解世界運(yùn)行的基本常識。物體恒存性。
如果我移開視線再看回來,那個(gè)物體依然在那里。
因果關(guān)系。如果我推它,它就會(huì)倒下。它理解摩擦力和重力。它理解慣性。它理解在路上行駛的重型卡車需要更長的時(shí)間才能停下來。它理解一個(gè)球會(huì)一直滾動(dòng)。這些概念即使對小孩來說也是常識,但對于人工智能來說,卻是完全未知的。
因此,我們必須創(chuàng)建一個(gè)系統(tǒng),允許人工智能學(xué)習(xí)物理世界的常識,學(xué)習(xí)它的規(guī)律,當(dāng)然,也能夠從數(shù)據(jù)中學(xué)習(xí),而這些數(shù)據(jù)相當(dāng)稀缺,并且要能夠評估該人工智能是否有效,這意味著它必須在一個(gè)環(huán)境中進(jìn)行模擬。
如果人工智能不具備模擬物理世界對其行為的響應(yīng)的能力,它怎么會(huì)知道它所執(zhí)行的行為與其應(yīng)該做的行為是一致的呢?模擬其行為的響應(yīng)確實(shí)非常重要。否則,就沒有辦法評估它。它每次都不同。
因此,這個(gè)基本系統(tǒng)需要三臺計(jì)算機(jī)。一臺計(jì)算機(jī),當(dāng)然是我們知道英偉達(dá)(Nvidia)用于訓(xùn)練人工智能模型的計(jì)算機(jī)。另一臺計(jì)算機(jī)我們知道是用于模型的推理。模型的推理本質(zhì)上是一臺機(jī)器人的計(jì)算機(jī),它在汽車中運(yùn)行,或在機(jī)器人中運(yùn)行,或在工廠中運(yùn)行,在任何邊緣位置運(yùn)行。但必須有另一臺專為模擬而設(shè)計(jì)的計(jì)算機(jī)。而模擬是英偉達(dá)所做幾乎所有事情的核心。這是我們最熟悉的地方。模擬是我們用物理人工智能所做幾乎一切的基礎(chǔ)。所以我們有三臺計(jì)算機(jī),以及運(yùn)行在這些計(jì)算機(jī)上的多個(gè)堆棧、這些庫,使它們變得有用。
Omniverse 是我們基于物理學(xué)的數(shù)字孿生模擬世界。如我之前提到的,Cosmos 是我們的基礎(chǔ)模型,不是語言的基礎(chǔ)模型,而是世界的底層模型。它也與語言相協(xié)調(diào)。你可以說一些諸如“你知道球發(fā)生了什么”之類的話,它們會(huì)告訴你球正在沿著街道滾動(dòng)。所以,一個(gè)世界基礎(chǔ)模型,當(dāng)然,還有機(jī)器人 Modics 模型。我們有兩個(gè)。
其中一個(gè)叫做 Groot。另一個(gè)我將要介紹的是 Alpamio。現(xiàn)在,我們在物理人工智能方面必須做的最重要的事情之一,是首先創(chuàng)建數(shù)據(jù)來訓(xùn)練人工智能。
這些數(shù)據(jù)從哪里來呢?而不是像我們創(chuàng)建了大量文本一樣,我們認(rèn)為這些文本是人工智能可以從中學(xué)習(xí)的真實(shí)基礎(chǔ)數(shù)據(jù)。我們?nèi)绾谓倘斯ぶ悄芪锢韺W(xué)的基本事實(shí)?有很多很多的視頻。有很多很多的視頻,但還遠(yuǎn)遠(yuǎn)不足以捕捉我們所需要的多樣性和交互類型。
因此,偉大的思想家們齊聚一堂,將原本的計(jì)算轉(zhuǎn)變成了數(shù)據(jù)。現(xiàn)在,利用以物理定律為基礎(chǔ)并受其約束、以基本事實(shí)為基礎(chǔ)并受其約束的合成數(shù)據(jù)生成技術(shù),我們現(xiàn)在可以巧妙地選擇生成數(shù)據(jù),然后用這些數(shù)據(jù)來訓(xùn)練人工智能。因此,例如,進(jìn)入這個(gè)人工智能、這個(gè)宇宙人工智能世界模型(在左邊這里)的是一個(gè)交通模擬器的輸出。
現(xiàn)在,這個(gè)交通模擬器還遠(yuǎn)遠(yuǎn)不足以讓人工智能從中學(xué)習(xí)。我們可以將這個(gè)輸入到宇宙基礎(chǔ)模型中,并生成在物理上基于和物理上合理的(環(huán)境),人工智能現(xiàn)在可以從中學(xué)習(xí)。有非常多的這樣的例子。讓我向您展示宇宙(模型)能做什么。
物理人工智能的ChatGPT時(shí)刻已接近。但挑戰(zhàn)是明確的。物理世界是多樣化且不可預(yù)測的。收集真實(shí)世界的訓(xùn)練數(shù)據(jù)是緩慢且昂貴的,而且永遠(yuǎn)都不夠。答案是合成數(shù)據(jù)。它始于NVIDIA Cosmos,一個(gè)用于物理人工智能的開放前沿世界基礎(chǔ)模型,它使用互聯(lián)網(wǎng)規(guī)模的視頻、真實(shí)駕駛和機(jī)器人數(shù)據(jù)以及3D模擬進(jìn)行預(yù)訓(xùn)練。Cosmos學(xué)習(xí)了一種統(tǒng)一的世界表征,能夠?qū)R語言、圖像、3D和動(dòng)作。它執(zhí)行生成、推理和軌跡預(yù)測等物理人工智能技能。
從單張圖Cosmos可以生成逼真的視頻。
從3D場景描述,可以生成物理上一致的運(yùn)動(dòng)。來自駕駛遙測和傳感器日志、環(huán)繞視頻。
來自規(guī)劃模擬器、多攝像頭環(huán)境,或者來自場景提示,它能讓邊緣案例生動(dòng)起來。
開發(fā)者可以在Cosmos中運(yùn)行交互式的閉環(huán)模擬。當(dāng)采取行動(dòng)時(shí),世界會(huì)做出響應(yīng)。Cosmos進(jìn)行推理。它分析邊緣場景,將其分解為熟悉的物理交互,并推理接下來可能發(fā)生什么。Cosmos將計(jì)算轉(zhuǎn)化為數(shù)據(jù),為自動(dòng)駕駛汽車訓(xùn)練長尾場景,并訓(xùn)練機(jī)器人在每種場景中學(xué)習(xí)如何適應(yīng)。
這太不可思議了。Cosmos是全球領(lǐng)先的基礎(chǔ)模型。它的下載量已達(dá)數(shù)百萬次。被廣泛應(yīng)用。面向全球,為這個(gè)物理人工智能的新時(shí)代做好準(zhǔn)備。我們自己也在使用它。我們自己用它來制造我們的自動(dòng)駕駛汽車。利用它進(jìn)行場景生成和評估,我們可以實(shí)實(shí)現(xiàn)并在計(jì)算機(jī)內(nèi)部有效地行駛數(shù)十億、數(shù)萬億英里。
自動(dòng)駕駛 AI:Alpamayo 與梅賽德斯合作
我們?nèi)〉昧司薮蟮倪M(jìn)步。今天我們發(fā)布 Alpamio,世界上第一個(gè)具有思考、推理能力的自動(dòng)駕駛汽車人工智能。Alpamio 經(jīng)過端到端訓(xùn)練,字面意義上是從攝像頭輸入到執(zhí)行器輸出。
攝像頭輸入,它自己駕駛了大量的里程,我們進(jìn)行人工駕駛,使用人類演示數(shù)據(jù)。
我們還有 Cosmos 生成的大量里程數(shù)據(jù)。除此之外,還非常非常仔細(xì)地標(biāo)記了數(shù)十萬個(gè)示例,以便我們能教汽車如何駕駛。Alpamio 做了一些非常特別的事情。它不僅接收傳感器輸入并激活方向盤、剎車和加速,它還會(huì)推理出即將采取的行動(dòng),它會(huì)告訴你將要采取什么行動(dòng),得出該行動(dòng)的原因,當(dāng)然,還有軌跡。所有這些都直接耦合,并通過大量人類訓(xùn)練數(shù)據(jù)以及宇宙生成數(shù)據(jù)進(jìn)行非常具體地訓(xùn)練。其結(jié)果確實(shí)是令人難以置信的。
你的汽車不僅會(huì)像你期望的那樣駕駛,而且因?yàn)樗苯訌娜祟愌菔局袑W(xué)習(xí),所以駕駛得非常自然。但在每一種場景中,當(dāng)它遇到該場景時(shí),它會(huì)進(jìn)行推理,告訴你它將要做什么,并推理出你將要做什么。
現(xiàn)在,這之所以如此重要,是因?yàn)轳{駛的“長尾效應(yīng)”。
在那種情況下,我們不可能收集到所有國家和所有可能發(fā)生的所有人群的所有可能發(fā)生情況的每一個(gè)場景。然而,然而,它非常不可能,每一種場景如果分解成一堆其他更小的場景,對你來說都是很正常的理解。因此,這些長尾場景將被分解為汽車知道如何處理的相當(dāng)正常的情況。它只需要對此進(jìn)行推理。那么,讓我們來看一看。接下來你們將看到的一切都是一鏡到底的。這是不撒手的。
我們八年前開始研發(fā)自動(dòng)駕駛汽車。
這樣做的原因是因?yàn)槲覀兒茉缇团袛喑錾疃葘W(xué)習(xí)和人工智能將要重塑整個(gè)計(jì)算技術(shù)棧。如果我們想要理解如何實(shí)現(xiàn)自主導(dǎo)航,以及如何引導(dǎo)行業(yè)邁向這個(gè)新未來,我們就必須擅長構(gòu)建整個(gè)技術(shù)棧。正如我前面提到的,人工智能是一個(gè)五層的蛋糕。最底層是基礎(chǔ)動(dòng)力和硬件外殼。在機(jī)器人學(xué)的案例中,最底層就是汽車本身。再往上一層是芯片。圖形處理器、網(wǎng)絡(luò)芯片、中央處理器,所有這些東西。
再往上的一層是基礎(chǔ)設(shè)施。
如我之前提到物理人工智能那樣,在這種特定情況下,該基礎(chǔ)設(shè)施就是Omniverse和Cosmos。然后在它們之上是模型。
在我剛才展示的這些模型之上,這里的模型被稱為Alpamayo。而Alpamayo今天已開源。
這項(xiàng)令人難以置信的工作,耗費(fèi)了數(shù)千人。為了作一對比,我們的自動(dòng)駕駛汽車團(tuán)隊(duì)就有數(shù)千人。我們的合作伙伴Ola,我想Ola就在觀眾席中的某個(gè)地方,梅賽德斯(奔馳),在五年前同意與我們合作,來實(shí)現(xiàn)這一切。我們想象,總有一天路上行駛的十億輛汽車都將是自動(dòng)駕駛的。你可以選擇它是一個(gè)你指揮、從別人那里租來的自動(dòng)駕駛出租車,或者你可以擁有它,它自己駕駛。或者你可以決定自己駕駛。但每一輛車都將具備自動(dòng)駕駛能力。每一輛車都將由人工智能驅(qū)動(dòng)。
因此,在這種情況下,模型層是 Alpamio,其上方的應(yīng)用是梅賽德斯-奔馳。因此,整個(gè)技術(shù)棧是我們英偉達(dá)的第一個(gè)整體技術(shù)棧項(xiàng)目。
我們一直在為此付出努力,我非常高興 VDIA 的第一輛自動(dòng)駕駛汽車將在第一季度上路,然后在第二季度進(jìn)入歐洲,美國是在第一季度,然后歐洲是第二季度,我想是第三和第四季度進(jìn)入亞洲。有力的是,我們將繼續(xù)使用下一代 Alpamayo 版本和之后的版本對其進(jìn)行更新。我對此深信疑。這將是最大的機(jī)器人產(chǎn)業(yè)之一,我很高興我們參與其中。它教會(huì)了我們?nèi)绾螏椭澜缙渌貐^(qū)構(gòu)建機(jī)器人系統(tǒng)方面的海量知識。那種深刻的理解,即知道如何自己構(gòu)建它,自己構(gòu)建整個(gè)基礎(chǔ)設(shè)施,以及知道機(jī)器人系統(tǒng)需要什么樣的芯片。在這種特定情況下,是雙重的Orin,下一代的雙重Thor。
這些處理器是為機(jī)器人系統(tǒng)設(shè)計(jì)的。
并且是為最高級別的安全能力而設(shè)計(jì)的。
這輛車剛剛獲得了評級。它剛剛投入生產(chǎn)。
梅賽德斯-奔馳CLA剛剛被歐洲新車安全評鑒協(xié)會(huì)(NCAP)評為世界上最安全的汽車。據(jù)我所知,它是唯一一個(gè)擁有每一行代碼、芯片、系統(tǒng)、系統(tǒng)、每一行代碼都通過安全認(rèn)證的系統(tǒng)。整個(gè)模型系統(tǒng)基于多樣化和冗余的傳感器,軟駕駛汽車堆棧也是如此。阿爾帕米奧(Alpamio)堆棧是端到端訓(xùn)練的,并具備驚人的能力。然而,除非你永遠(yuǎn)駕駛它,否則沒人知道它是否能保證絕對安全。
因此,我們設(shè)置護(hù)欄的方式是依靠另一個(gè)軟件堆棧,一個(gè)完整的自動(dòng)駕駛(AV)堆棧作為底層支撐。整個(gè)自動(dòng)駕駛堆棧都構(gòu)建為完全可追溯,我們花了大約五年時(shí)間構(gòu)建它,實(shí)際上是花了六、七年時(shí)間來構(gòu)建第二個(gè)堆棧。這兩個(gè)軟件堆棧是相互鏡像的,然后我們有一個(gè)策略和安全評估器來決定。
這是我非常有信心并能論證其能非常安全駕駛的事情嗎?
如果是,我將讓阿爾帕米奧(Alpamio)來執(zhí)行。如果是我就沒有太大信心的情形,并且安全策略評估器決定我們要回到一個(gè)非常簡單、更安全的護(hù)欄系統(tǒng),那么它就會(huì)返回到經(jīng)典的自動(dòng)駕駛堆棧。我們是世界上唯一同時(shí)運(yùn)行這兩個(gè)自動(dòng)駕駛堆棧的汽車,而且所有安全系統(tǒng)都應(yīng)該具備多樣性和冗余性。我們的愿景是,總有一天,每一輛汽車、每一輛卡車都將實(shí)現(xiàn)自動(dòng)化,我們一直在為實(shí)現(xiàn)這個(gè)未來而努力。
當(dāng)然,在梅賽德斯-奔馳的案例中,整個(gè)堆棧是垂直集成的。我們共同構(gòu)建了整個(gè)堆棧。我們正準(zhǔn)備部署這輛車。我們正準(zhǔn)備運(yùn)營這個(gè)技術(shù)棧。我們將長期維護(hù)這個(gè)技術(shù)棧。我們將生存下去。
機(jī)器人產(chǎn)業(yè)與工業(yè)數(shù)字孿生
然而,如同我們公司所做的其他一切事情一樣,我們構(gòu)建了整個(gè)技術(shù)棧,但整個(gè)技術(shù)棧對生態(tài)系統(tǒng)是開放的。
并且與我們合作構(gòu)建L4級自動(dòng)駕駛和機(jī)器人出租車(Robotaxies)的生態(tài)系統(tǒng)正在擴(kuò)大,并且無處不在。我完全期望這會(huì)是,這對我們來說已經(jīng)是一個(gè)巨大的業(yè)務(wù)了。這對我們來說是一個(gè)巨大的業(yè)務(wù),因?yàn)樗麄冇盟鼇碛?xùn)練我們的,訓(xùn)練數(shù)據(jù)、處理數(shù)據(jù)以及訓(xùn)練他們的模型。在某些情況下,他們用它來進(jìn)行合成數(shù)據(jù)生成,在某些汽車公司中,他們幾乎只是構(gòu)建車內(nèi)所安裝的計(jì)算機(jī)和芯片。
數(shù)據(jù)生成在某些情況下,在某些汽車公司中,他們幾乎只是構(gòu)建車內(nèi)所安裝的計(jì)算機(jī)和芯片。有些公司與我們進(jìn)行全棧合作。有些公司與我們合作,(或合作)其中的一部分。所以你決定使用多少并不重要。我唯一的要求是在任何可能的地方都使用一點(diǎn)視頻。而且,但整個(gè)事情是開放的。現(xiàn)在,這將是第一個(gè)大規(guī)模、主流的、人工智能的、物理性人工智能市場。我想我們現(xiàn)在都可以同意,這已經(jīng)完全到來了。而這種從非自動(dòng)駕駛汽車過渡到自動(dòng)駕駛汽車的拐點(diǎn),很可能就發(fā)生在這個(gè)時(shí)間點(diǎn)附近。在接下來的10年里,我相當(dāng)確定,世界上將有非常非常大比例的汽車實(shí)現(xiàn)自動(dòng)駕駛或高度自動(dòng)駕駛。
但這就是我剛才描述的,使用三臺計(jì)算機(jī)、使用合成數(shù)據(jù)生成和仿真的基本技術(shù),它適用于所有形式的機(jī)器人系統(tǒng)。它可以是一個(gè)僅僅是機(jī)械臂、一個(gè)操作器的機(jī)器人。也許它是一個(gè)移動(dòng)機(jī)器人。也許它是一個(gè)完全擬人化的機(jī)器人。因此,機(jī)器人系統(tǒng)的下一次發(fā)展、下一個(gè)時(shí)代將是機(jī)器人。而這些機(jī)器人將會(huì)有各種不同的尺寸。我邀請了一些朋友。他們來了嗎?
到這邊來。以前,現(xiàn)在,其中一件事,其中一件事是,你們有“杰森一家”(Jetsons),他們里面有小小的杰森電腦。它們在“元宇宙”(Omniverse)中進(jìn)行訓(xùn)練。那這個(gè)怎么樣?讓我們向大家展示一下你們學(xué)習(xí)如何成為機(jī)器人的那個(gè)模擬器。你們想看看那個(gè)嗎?我們來看看那個(gè)。請運(yùn)行它。
我不知道。它是否都完全在機(jī)器人內(nèi)部。還有那個(gè)機(jī)器人?
那就是你們學(xué)習(xí)成為機(jī)器人的方式?你們所有的一切都是在“云端”(Omniverse)里完成的嗎?還有那個(gè)機(jī)器人?還有那個(gè)機(jī)器人,是嗎?艾薩克、Sim和艾薩克實(shí)驗(yàn)室。還有任何想制造機(jī)器人的人,沒有人會(huì)像你一樣可愛。但現(xiàn)在我們有了所有,看看我們所有正在制造機(jī)器人的朋友們。我們正在制造大的。不,就像我說的,沒有人像你們一樣可愛。但我們有神經(jīng)機(jī)器人(neurobot),我們有,我們那邊有助教機(jī)器人(adjubot)。我們這邊有樂金(LG)。他們剛剛宣布了一款新機(jī)器人。卡特彼勒(Caterpillar),他們擁有有史以來最大的機(jī)器人。然而,那個(gè)機(jī)器人是給您家里送餐的。它連接著優(yōu)步吃送餐服務(wù)(Uber Eats),它就是沖浪機(jī)器人(Surf Robot)。我喜歡那些家伙。敏捷性,波士頓動(dòng)力,令人難以置信。
你有手術(shù)機(jī)器人,你有來自法國的機(jī)械臂機(jī)器人。你有通用機(jī)器人公司的機(jī)器人,數(shù)量驚人的不同類型的機(jī)器人。
所以這是下一章。
我們將會(huì)在未來更多地談?wù)摍C(jī)器人技術(shù),但它不僅僅是關(guān)于機(jī)器人——我知道一切都與你們有關(guān)——它是關(guān)于實(shí)現(xiàn)目標(biāo),以及世界上最重要、將被物理人工智能和人工智能物理學(xué)徹底變革的行業(yè)之一,就是英偉達(dá)(Nvidia)啟動(dòng)我們所有人的那個(gè)行業(yè)。如果沒有我接下來要談到的這些公司,這一切將是不可能的,我非常高興所有這些公司,從楷登電子(Cadence)開始,都將加速一切。楷登電子(Cadence)的 CUDA X 已經(jīng)集成到他們所有的仿真和求解器中。他們將使用英偉達(dá)的物理人工智能來進(jìn)行不同的物理工廠和工廠模擬。
你將看到人工智能物理學(xué)被集成到這些系統(tǒng)中。因此,無論是 EDA 還是 STA,以及未來在機(jī)器人系統(tǒng)中,我們將擁有基本上使你們成為可能的相同技術(shù)。現(xiàn)在徹底革新這些設(shè)計(jì)堆棧,新思(Synopsys)。沒有新思,新思和楷登電子是完全。在芯片設(shè)計(jì)的世界中是完全不可或缺的。新思科技(Synopsis)在邏輯設(shè)計(jì)和知識產(chǎn)權(quán)(IP)方面處于領(lǐng)先地位。在楷登電子(Cadence)方面,他們在物理設(shè)計(jì)、布局布線、仿真和驗(yàn)證方面處于領(lǐng)先地位。
楷登電子在仿真和驗(yàn)證方面非常出色。他們兩者都在向系統(tǒng)設(shè)計(jì)和系統(tǒng)仿真領(lǐng)域邁進(jìn)。因此,在未來,我們將在新思科技內(nèi)部設(shè)計(jì)您的芯片,我們將在這些工具內(nèi)部設(shè)計(jì)您的系統(tǒng),并對所有內(nèi)容進(jìn)行仿真和模擬。這就是您的未來。您將誕生于這些平臺之中。非常了不起,因此,我們非常高興能與這些行業(yè)合作。
正如我們將英偉達(dá)(NVIDIA)集成到 Palantir 和 Service Now 中一樣,我們將英偉達(dá)集成到計(jì)算最密集的仿真行業(yè)——新思科技和楷登電子中。今天我們宣布,西門子(Siemens)也在做同樣的事情。我們將把 KutaX、物理人工智能、代理人工智能、Nemo、Nemotron 深度集成到西門子的世界中。這樣做的原因是……首先,我們將設(shè)計(jì)芯片,未來所有這些都將由英偉達(dá)加速。您對此會(huì)非常滿意。我們將擁有自主式芯片設(shè)計(jì)師和系統(tǒng)設(shè)計(jì)師與我們一起工作,幫助我們,幫助我們進(jìn)行設(shè)計(jì),正如我們今天擁有自主式軟件工程師來幫助我們的軟件工程師編寫代碼一樣。
因此,我們將擁有自主式芯片設(shè)計(jì)師和系統(tǒng)設(shè)計(jì)師。我們將在其中創(chuàng)造你。但然后我們必須制造你。我們必須建造制造你的工廠、生產(chǎn)設(shè)施。我們必須設(shè)計(jì)制造生產(chǎn)線來組裝你們所有人。而這些制造工廠本質(zhì)上將是巨大的機(jī)器人。
難以置信,我知道,我知道。
所以你將在計(jì)算機(jī)中被設(shè)計(jì)。你將在計(jì)算機(jī)中被制造出來。你將在計(jì)算機(jī)中接受測試和評估。在您必須花費(fèi)任何時(shí)間應(yīng)對重力之前很久,很久以前。我知道。你知道如何應(yīng)對重力嗎?你會(huì)跳嗎?
你會(huì)跳嗎?你會(huì)跳嗎?行了,別炫耀了。
那么現(xiàn)在這個(gè)行業(yè),成就英偉達(dá)成為可能的這個(gè)行業(yè),我非常高興的是,我們現(xiàn)在創(chuàng)造的技術(shù)的復(fù)雜性和能力已經(jīng)達(dá)到了一個(gè)新的水平,我們現(xiàn)在可以幫助他們徹底變革他們的行業(yè)。所以,從他們開始的地方,我們現(xiàn)在有機(jī)會(huì)回去幫助他們徹底變革他們的行業(yè)。讓我們來看看我們將與西門子一起做的事情。來吧。
物理人工智能的突破正使人工智能從屏幕走向我們的物理世界。而且恰逢其時(shí),在全球各地建設(shè)各種芯片、計(jì)算機(jī)、救命藥物和人工智能工廠之際。隨著全球勞動(dòng)力短缺日益加劇,我們比以往任何時(shí)候都更需要由物理人工智能和機(jī)器人技術(shù)驅(qū)動(dòng)的自動(dòng)化。人工智能與全球最大工業(yè)的交匯之處,正是英偉達(dá)和西門子合作的基礎(chǔ)。近兩個(gè)世紀(jì)以來,西門子一直在建設(shè)全球的工業(yè)。現(xiàn)在,它正在為人工智能時(shí)代對其進(jìn)行重塑。西門子已實(shí)現(xiàn)集成。
將英偉達(dá)-KudaX 庫、人工智能模型和 Omniverse 集成到其電子設(shè)計(jì)自動(dòng)化(EDA)、計(jì)算機(jī)輔助工程(CAE)和計(jì)算機(jī)輔助工程(C-A-E)以及數(shù)字孿生工具和平臺組合中。我們共同將物理人工智能帶入完整的工業(yè)生命周期。
從設(shè)計(jì)和仿真,到生產(chǎn)和運(yùn)營,再到生產(chǎn)和運(yùn)營。
我們正處于一場新的工業(yè)革命的開端,即由英偉達(dá)和西門子為下一代工業(yè)構(gòu)建的物理人工智能時(shí)代。難以置信,對吧,各位?你們怎么看?我會(huì)抓緊了,就抓緊了。所以,如果你看看全球的模型,毫無疑問。毫無疑問。開放人工智能是當(dāng)今領(lǐng)先的令牌生成器。生成的開放人工智能令牌比任何其他事物都要多。第二大群體,第二大可能是開源模型。我的猜測是,隨著時(shí)間的推移,由于有如此多的公司、如此多的研究人員、如此多的不同類型的領(lǐng)域和模式,開源模型將占據(jù)絕對的主導(dǎo)地位。
下一代計(jì)算架構(gòu): Vera Rubin
我們來談?wù)勔晃环浅L貏e的人物。你們想這么做嗎?
我們來談?wù)刅era Rubin。
她是一位美國天文學(xué)家。她是第一位觀測到。她注意到星系的尾部移動(dòng)速度與星系的中心差不多快。我知道。這說不通。這說不通。
牛頓物理學(xué)會(huì)說,就像太陽系一樣,離太陽更遠(yuǎn)的行星繞太陽公轉(zhuǎn)的速度比離太陽更近的行星慢。
因此,除非存在我們稱之為暗體、暗物質(zhì)的看不見的物質(zhì)占據(jù)空間,否則這種情況就沒有意義,盡管我們看不到它。
所以,我們以Vera Rubin的名字命名了我們的下一臺計(jì)算機(jī)。這不是個(gè)好主意嗎?
我知道。
Vera Rubin的設(shè)計(jì)旨在應(yīng)對我們面臨的這一根本性挑戰(zhàn)。人工智能所需的計(jì)算量正在急劇增加。對英偉達(dá)圖形處理器(GPU)的需求正在急劇增加。需求激增是因?yàn)槟P兔磕甓荚谝?0倍,一個(gè)數(shù)量級的速度增長。更不用說,正如我提到的,O1的推出是人工智能的一個(gè)轉(zhuǎn)折點(diǎn)。推理不再是一次性的答案,而是一個(gè)思考過程。
為了教會(huì)人工智能如何思考,在后訓(xùn)練中引入了強(qiáng)化學(xué)習(xí)和非常可觀的計(jì)算量。
這不再是監(jiān)督微調(diào),或者稱為模仿學(xué)習(xí)或監(jiān)督訓(xùn)練。你現(xiàn)在有了強(qiáng)化學(xué)習(xí),本質(zhì)上是計(jì)算機(jī)嘗試不同的迭代,它在學(xué)習(xí)如何執(zhí)行任務(wù)。結(jié)果是,預(yù)訓(xùn)練、后訓(xùn)練和測試時(shí)間擴(kuò)展所需的計(jì)算量爆炸式增長。現(xiàn)在我們進(jìn)行的每一次推理,不再是一次性的,你可以看到人工智能思考的令牌數(shù)量,我們很欣賞這一點(diǎn),它思考得越久,往往會(huì)產(chǎn)生更好的答案。因此,測試時(shí)間擴(kuò)展導(dǎo)致每年生成的令牌數(shù)量增加5倍。更不用說。
與此同時(shí),人工智能競賽正在進(jìn)行中。每個(gè)人都在努力達(dá)到下一個(gè)水平。每個(gè)人都在努力達(dá)到下一個(gè)前沿領(lǐng)域。每當(dāng)他們到達(dá)下一個(gè)前沿領(lǐng)域,上一代人工智能的代幣成本就開始下降。每年大約下降10倍。每年下降10倍實(shí)際上告訴你一些不同的信息。這說明競爭非常激烈。每個(gè)人都在努力達(dá)到下一個(gè)水平,并且有人正在達(dá)到下一個(gè)水平。
因此,所有這一切都是一個(gè)計(jì)算問題。你計(jì)算得越快,就能越早到達(dá)下一個(gè)前沿領(lǐng)域的下一層。
所有這些事情都在同時(shí)發(fā)生。所以,我們決定我們必須每年都推進(jìn)計(jì)算的最先進(jìn)水平,不能落后一年。現(xiàn)在,我們在一年前半就開始交付GB-200了。現(xiàn)在,我們正處于全面制造階段。Vera Rubin的。如果Vera Rubin能在今年內(nèi)完成,那么它現(xiàn)在必須已經(jīng)投產(chǎn)了。因此,今天我可以告訴大家,Vera Rubin已全面投產(chǎn)。你們想看看Vera Rubin嗎?請進(jìn)。請播放。
恰好趕上人工智能的下一個(gè)前沿領(lǐng)域。這是我們?nèi)绾螛?gòu)建它的故事。
這種架構(gòu)是一個(gè)由六個(gè)芯片組成的系統(tǒng),經(jīng)過精心設(shè)計(jì)以協(xié)同工作,誕生于極端的代碼設(shè)計(jì)。它始于維拉(Vera),這是一種定制設(shè)計(jì)的中央處理器(CPU),性能是上一代的兩倍,以及Rubin圖形處理器(GPU)。Vera Rubin從一開始就經(jīng)過協(xié)同設(shè)計(jì),以更快、更低延遲地實(shí)現(xiàn)雙向和一致的數(shù)據(jù)共享。然后,17000個(gè)組件聚集在Vera Rubin計(jì)算板上。高速機(jī)器人以微米級的精度放置組件,然后由兩顆 Rubin GPU 完成組裝,構(gòu)成 Vera CPU。它能夠提供 100 拍浮(Petaflops)的 AI 算力,是其前代的五倍。人工智能需要數(shù)據(jù)。快。ConnectX9 為每顆 GPU 提供每秒 1.6 太比特(terabits per second)的橫向擴(kuò)展(scale-out)帶寬。Bluefield 4DPU 卸載了存儲和安全任務(wù),使計(jì)算能夠完全專注于人工智能。Vera Rubin 計(jì)算托盤進(jìn)行了徹底重新設(shè)計(jì),取消了電纜、軟管或風(fēng)扇,配備了 Bluefield 4 DPU、8 個(gè) ConnectX9、2 個(gè) Vera CPU 和 4 個(gè) Rubin GPU。Vera Rubin 人工智能超級計(jì)算機(jī)的計(jì)算構(gòu)建模塊。
接下來是第六代 MV 鏈路交換機(jī)。傳輸?shù)臄?shù)據(jù)量超過全球互聯(lián)網(wǎng),連接 18 個(gè)計(jì)算節(jié)點(diǎn),可擴(kuò)展多達(dá) 72 顆 Rubbin GPU,作為一個(gè)整體運(yùn)行。然后是 Spectrum X 以太網(wǎng)光模塊(Photonics)。這是世界上首款擁有 512 條通道和 200 千兆位(gigabit)兼容共封裝光模塊的以太網(wǎng)交換機(jī),可橫向擴(kuò)展數(shù)千個(gè)機(jī)架,構(gòu)建成一個(gè)人工智能工廠。自設(shè)計(jì)啟動(dòng)以來歷經(jīng) 15,000 工程師年,首臺 Vera Rubin MVL 72 機(jī)架上線。六款突破性芯片,18個(gè)計(jì)算托架,9個(gè)MV-link交換模塊,220萬億晶體管,重近兩噸。邁向人工智能下一前沿的巨大飛躍。Rubin在這里。
極端協(xié)同設(shè)計(jì)與性能參數(shù)解析
你們覺得怎么樣?
這是一個(gè)Rubin計(jì)算單元,包含1152個(gè)圖形處理器(GPU)。在16個(gè)機(jī)架中。正如你們所知,每個(gè)機(jī)架包含一個(gè)72核的Vera Rubin 或72個(gè)Rubin單元。每個(gè)Rubin單元是兩個(gè)實(shí)際連接在一起的圖形處理器芯片。
我將向你們展示
但有些事情,我稍后會(huì)告訴你們。我不能馬上告訴你們所有事情。
我們設(shè)計(jì)了六種不同的芯片。首先,我們公司內(nèi)部有一條規(guī)定,而且是一條很好的規(guī)定。新一代產(chǎn)品中,芯片的更改數(shù)量不應(yīng)超過一到兩個(gè)。但問題在于此。正如您所看到的,我們描述了每個(gè)芯片中晶體管的總數(shù),而我們知道摩爾定律在很大程度上已經(jīng)放緩了。因此,我們逐年能夠獲得的晶體管數(shù)量不可能跟上。跟上大 10 倍的模型。跟不上每年生成多五倍的詞元(tokens)。
跟不上詞元成本下降會(huì)如此激進(jìn)的事實(shí)。
除非我們部署激進(jìn)、極端的代碼設(shè)計(jì),基本上同時(shí)在所有芯片、在整個(gè)技術(shù)棧中進(jìn)行創(chuàng)新,否則整個(gè)行業(yè)不可能以這種速度繼續(xù)發(fā)展,這也是我們決定在這一代產(chǎn)品中別無選擇,必須重新設(shè)計(jì)每一塊芯片的原因。現(xiàn)在,我們剛才描述的每一塊芯片本身就可以成為一場新聞發(fā)布會(huì)。在過去,可能有一整家公司專門致力于做這件事。它們每一個(gè)都是徹底的革命性的,并且是同類產(chǎn)品中的佼佼者。Vera 中央處理器,我為它感到非常自豪。在一個(gè)功耗受限的世界里,在一個(gè)受限的世界里。Gray 的中央處理器在功耗受限的世界中實(shí)現(xiàn)了兩倍的性能。它的每瓦性能是世界上最先進(jìn)的中央處理器的兩倍。它驚人的數(shù)據(jù)速率令人難以置信。它的設(shè)計(jì)初衷是用于處理超級計(jì)算機(jī)。
Vera 曾是一款出色的全球定位系統(tǒng)(GPS),Grace 曾是一款出色的圖形處理器(GPU)。現(xiàn)在,Vera 大幅提升了單線程性能,提升了內(nèi)存容量,提升了所有一切。
這是一個(gè)巨大的芯片。
這就是 Vera 中央處理器。這是一個(gè)中央處理器。這與Rubin GPU相連。看看那個(gè)東西。
它是一個(gè)巨大的芯片。現(xiàn)在真正特別的是,我會(huì)瀏覽這些,我想需要三只手,四只手才能做到這一點(diǎn)。這是Vera CPU。它有88個(gè)CPU核心。并且CPU核心被設(shè)計(jì)成多線程的。但是Vera的多線程特性被設(shè)計(jì)成使得176個(gè)線程中的每一個(gè)都能獲得其全部性能。所以這基本上就像有176個(gè)核心,但只有88個(gè)物理核心。所以這些核心是使用一種稱為空間多線程的技術(shù)設(shè)計(jì)的。但是I/O。性能令人難以置信。這是Rubin GPU。它的浮點(diǎn)性能是Blackwell的5倍。但重要的是看最終結(jié)果。最終結(jié)果是,它的晶體管數(shù)量僅是Blackwell的1.6倍。這在一定程度上說明了當(dāng)今半導(dǎo)體物理學(xué)的水平。
如果我們不對整個(gè)系統(tǒng)中的基本上每一塊芯片進(jìn)行代碼設(shè)計(jì),進(jìn)行極端的代碼設(shè)計(jì),那么我們?nèi)绾尾拍苊磕杲桓缎阅芴嵘疃嘀挥?.6倍的水平呢?因?yàn)槟鞘悄銚碛械木w管總數(shù)。即使你每個(gè)晶體管的性能提升一點(diǎn)點(diǎn),比如25%,你也不可能從你獲得的晶體管數(shù)量中實(shí)現(xiàn)100%的良率。因此,1.6倍的提升給每年的性能提升設(shè)定了一個(gè)上限,除非你采取一些極端的措施。我們稱之為極端代碼設(shè)計(jì)。
我們所做的一件事,這是一項(xiàng)偉大的發(fā)明,叫做NVFP4張量核心(tensor core)。我們芯片內(nèi)部的Transformer引擎不僅僅是簡單地將我們放入數(shù)據(jù)路徑中的4英尺、浮點(diǎn)數(shù)。它是一個(gè)完整的處理器,一個(gè)處理單元,它知道如何動(dòng)態(tài)地、自適應(yīng)地調(diào)整其精度和結(jié)構(gòu),以處理轉(zhuǎn)換器(transformer)的不同層次,這樣你就可以在任何可以損失精度的地方實(shí)現(xiàn)更高的吞吐量,并在任何需要的地方恢復(fù)到盡可能高的精度。這種動(dòng)態(tài)執(zhí)行該操作的能力。你無法在軟件中做到這一點(diǎn),因?yàn)轱@然它的運(yùn)行速度太快了。因此,你必須能夠在處理器內(nèi)部自適應(yīng)地完成它。這就是NV-FP4。當(dāng)有人提到FP4或FP8時(shí),對我們來說幾乎沒有任何意義。這樣做的原因在于張量核心結(jié)構(gòu)以及使之起作用的所有算法。MVP4,我們已經(jīng)就此發(fā)表了論文。它所能保持的吞吐量和精度的水平是完全不可思議的。這是開創(chuàng)性的工作。我不會(huì)對業(yè)界希望我們將這種格式和結(jié)構(gòu)在未來變成行業(yè)標(biāo)準(zhǔn)感到驚訝。這完全是革命性的。這就是為什么盡管我們的晶體管數(shù)量只增加了1.6倍,我們?nèi)匀荒軌驅(qū)崿F(xiàn)如此巨大的性能飛躍。
硬件工程與冷卻技術(shù)的革新
那么這就是,現(xiàn)在,一旦你擁有了一個(gè)出色的處理節(jié)點(diǎn),這就是處理器節(jié)點(diǎn),在里面,所以這,舉個(gè)例子,讓我這樣做,這是非常非常沉重的,你必須是一個(gè)身體狀況非常好的首席執(zhí)行官才能做這份工作,所以這個(gè)東西是,我猜這可能,我猜這可能,我不知道,幾百磅,我覺得這很有趣。來吧。
本可以的。每個(gè)人都在往下走。我不這么認(rèn)為。好吧。所以,所以看看這個(gè)。這是最后一個(gè)。我們徹底改造了整個(gè)MGX機(jī)箱。這個(gè)節(jié)點(diǎn),43根線纜,零線纜。六根管子,這里只有兩根,組裝這個(gè)需要兩個(gè)小時(shí)。如果你運(yùn)氣好,需要兩個(gè)小時(shí),需要兩個(gè)小時(shí)。你很可能會(huì)組裝錯(cuò)。你將不得不重新測試、測試、測試,然后重新組裝。所以裝配過程極其復(fù)雜。考慮到這是我們第一批以這種方式解構(gòu)的超級計(jì)算機(jī)之一,這是可以理解的。這個(gè),從兩個(gè)小時(shí),縮短到五分鐘。
80%液冷,100%液冷。
真是,真是個(gè)突破。這是新的計(jì)算機(jī)箱。連接所有這些設(shè)備到機(jī)架頂部交換機(jī)(即東西向流量)的是名為 Spectrum X-NIC 的設(shè)備。這是全球最好的網(wǎng)卡。毫無疑問,英偉達(dá)對很久以前加入我們的 Mellanox 的收購,他們的用于高性能計(jì)算的網(wǎng)絡(luò)技術(shù)是全球最無可匹敵。算法、芯片設(shè)計(jì)、所有的互連,以及在其上運(yùn)行的所有軟件堆棧,都具有直接內(nèi)存訪問(DMA)功能,絕對,絕對是首屈一指的,全球最好的。現(xiàn)在它具備了可編程遠(yuǎn)程直接內(nèi)存訪問(RDMA)和數(shù)據(jù)路徑加速器的能力,這樣像 AI 實(shí)驗(yàn)室這樣的合作伙伴就可以創(chuàng)建自己的算法來控制數(shù)據(jù)在系統(tǒng)內(nèi)的移動(dòng)方式。但這是完全世界級的 ConnectX。ConnectX9 和 Vero CPU 是共同設(shè)計(jì)的,我們從未透露過,直到 CX9 出現(xiàn)才發(fā)布,因?yàn)槲覀兪菫橐环N新型處理器共同設(shè)計(jì)它的。
ConnectX9,或者 CX8 和 Spectrum X,徹底改變了以太網(wǎng)在人工智能領(lǐng)域的應(yīng)用方式。
人工智能的以太網(wǎng)流量要大得多,需要更低的延遲。瞬間的流量激增與以太網(wǎng)所見過的任何情況都不同。
因此,我們創(chuàng)建了 Spectrum X,它就是人工智能以太網(wǎng)。兩年前,我們發(fā)布了 Spectrum X。
英偉達(dá)如今是世界上規(guī)模最大的網(wǎng)絡(luò)公司。因此,它非常成功,并在許多不同的部署中得到了應(yīng)用。它正在席卷人工智能領(lǐng)域。
性能令人難以置信,尤其是在您擁有一個(gè) 200 兆瓦的數(shù)據(jù)中心,或者一個(gè)千兆瓦的數(shù)據(jù)中心時(shí),這些都是價(jià)值數(shù)十億美元的。
我們假設(shè)一個(gè)千兆瓦的數(shù)據(jù)中心價(jià)值 500 億美元。如果網(wǎng)絡(luò)性能允許您在使用 SpectrumX 的情況下額外提升 10%,那么實(shí)現(xiàn) 25% 的更高吞吐量并不少見。如果我們僅僅提升 10%,那也價(jià)值 50 億美元。網(wǎng)絡(luò)方面的投入幾乎是免費(fèi)的,這就是為什么,所有人都使用 Spectrum X。這真是一件不可思議的事情。現(xiàn)在我們將發(fā)明一種新的類型,一種新的數(shù)據(jù)處理類型。因此,SpectromX 適用于東西向流量。我們現(xiàn)在有了一個(gè)名為 Bluefield 4 的新處理器。
Bluefield 4 允許我們接管一個(gè)大型的、非常大的數(shù)據(jù)中心,將其不同部分隔離,以便不同的用戶可以使用其不同的部分。
確保如果他們決定虛擬化,所有內(nèi)容都可以被虛擬化。這樣您就可以卸載大量用于南北向流量的虛擬化軟件、安全軟件和網(wǎng)絡(luò)軟件。因此,每個(gè)計(jì)算節(jié)點(diǎn)都標(biāo)配 Bluefield 4。Bluefield 4 還有第二個(gè)應(yīng)用,我馬上會(huì)講到。這是一個(gè)革命性的處理器,我對此感到非常興奮。這是 NVLink 6-6 開關(guān)。
就在這里。
這個(gè)開關(guān),這個(gè)交換芯片,在MVLink交換機(jī)內(nèi)部有四個(gè)。這些交換芯片中的每一個(gè)都擁有歷史上最快的30秒(性能)。全世界的速率才勉強(qiáng)達(dá)到200吉字節(jié)。這是一個(gè)400吉比特每秒的交換機(jī)。之所以這非常重要,是因?yàn)樗茏屛覀兯械膱D形處理器(GPU)都能在完全相同的時(shí)間與所有其他圖形處理器進(jìn)行通信。這個(gè)機(jī)架背板上的交換機(jī)使我們能夠以兩倍的速度傳輸相當(dāng)于全球互聯(lián)網(wǎng)數(shù)據(jù)兩倍的總量,即全球所有互聯(lián)網(wǎng)數(shù)據(jù)總量的兩倍。你獲取整個(gè)地球互聯(lián)網(wǎng)的橫截面帶寬。大約是每秒100太字節(jié)。這是每秒240太字節(jié)。所以這在一定程度上讓人有所認(rèn)識。這樣做的目的是讓每一個(gè)圖形處理器都能與每一個(gè)其他的圖形處理器在完全相同的時(shí)間內(nèi)協(xié)同工作。
可以嗎?然后在此之上,在此之上,所以這是一個(gè)機(jī)架。
這是一個(gè)機(jī)架。
正如你們所見,這些機(jī)架中的每一個(gè),這個(gè)機(jī)架中的晶體管數(shù)量是1.7倍。
你能幫我做這個(gè)嗎?
所以這通常是大約兩噸。
但今天它是兩噸半,因?yàn)樗麄冞\(yùn)輸?shù)臅r(shí)候忘記把里面的水排掉了。
所以我們從加利福尼亞運(yùn)送了很多水。你能聽到它在吱吱叫嗎?當(dāng)你轉(zhuǎn)動(dòng)兩噸半的物體時(shí),它會(huì)有點(diǎn)吱吱叫。
你可以做到的。我們不會(huì)讓你做兩次。好的。那么,那么,在這些后面是MV-鏈路(MV-link)主干線。基本上是兩英里的銅纜。銅是我們所知道的最好的導(dǎo)體。而且這些都是屏蔽的銅纜,結(jié)構(gòu)化的銅纜。這是有史以來在計(jì)算系統(tǒng)中用過的最多的。我們的冗余單元以每秒400吉比特的速度驅(qū)動(dòng)銅纜,從機(jī)架頂部一直到機(jī)架底部。這太不可思議了。所以這總共有兩英里的銅纜,5,000根銅纜。
這使得中壓(MV)鏈路骨干成為可能。這是真正開啟下一代交換機(jī)(NGX)系統(tǒng)的革命。
現(xiàn)在,我們決定創(chuàng)建一個(gè)行業(yè)標(biāo)準(zhǔn)系統(tǒng),以便整個(gè)生態(tài)系統(tǒng)、我們所有的供應(yīng)鏈都能在這些組件上實(shí)現(xiàn)標(biāo)準(zhǔn)化。
構(gòu)成這些MGX系統(tǒng)的組件總共有大約80,000種。如果每年都更換它,那將是徹底的浪費(fèi)。從富士康、廣達(dá)、緯創(chuàng),名單還在繼續(xù),到惠普、戴爾和聯(lián)想,所有主要的計(jì)算機(jī)公司。每個(gè)人都知道如何構(gòu)建這些系統(tǒng)。所以,盡管性能要高得多,但我們能夠?qū)ubin 集成到其中,而且非常重要的是,功耗也高了一倍。Vera Rubin的功耗是格蕾絲·布萊克威爾(Grace Blackwell)的兩倍。然而,這也是一個(gè)奇跡,它所需要的風(fēng)量,即空氣流動(dòng),大致相同。
而且非常重要的一點(diǎn)是,進(jìn)入其中的水的溫度也是一樣的,45攝氏度。使用45攝氏度的水,數(shù)據(jù)中心就不需要水冷機(jī)了。
我們基本上是用熱水來冷卻這臺超級計(jì)算機(jī),這效率高得驚人。所以這就是新的機(jī)架。晶體管數(shù)量是1.7倍,但峰值推理性能提高了五倍,峰值訓(xùn)練性能提高了三倍半。
可以嗎?它們在頂部通過Spectrum X連接。
這是世界上第一個(gè)使用臺積電(TSM)新工藝制造的芯片,我們共同創(chuàng)新的工藝稱為COOP。這是一種硅光子學(xué)、集成的硅光子學(xué)工藝技術(shù)。
這使我們能夠直接將硅光子技術(shù)應(yīng)用于芯片。這是512個(gè)端口,速率為200千兆比特每秒。這就是新的以太網(wǎng)人工智能交換機(jī),Spectrum X以太網(wǎng)交換機(jī)。再看這個(gè)巨大的芯片。但真正令人驚奇的是,它直接連接了硅光子技術(shù)。激光器進(jìn)來。激光器從這里進(jìn)來。激光器從這里進(jìn)來。光學(xué)元件在這里,它們連接到數(shù)據(jù)中心的其余部分。我馬上會(huì)向您展示這個(gè),但它在機(jī)架的頂部。這是新的。
Spectrum X,硅光子交換機(jī)。
語義存儲與 KV 緩存上下文內(nèi)存
好的?我們還有一些新的東西想告訴您。
正如我之前提到,幾年前我們推出了 Spectrum X,以便我們能夠重塑網(wǎng)絡(luò)構(gòu)建的方式。
以太網(wǎng)非常易于管理,每個(gè)人都有以太網(wǎng)協(xié)議棧,世界上每個(gè)數(shù)據(jù)中心都知道如何處理以太網(wǎng)。我們當(dāng)時(shí)唯一使用的技術(shù)是英飛凌(Infiniband),它用于超級計(jì)算機(jī)。
英飛凌的延遲非常低,但當(dāng)然,英飛凌的軟件協(xié)議棧,其整個(gè)可管理性對于使用以太網(wǎng)的人來說非常陌生。因此,我們決定首次進(jìn)入以太網(wǎng)交換機(jī)市場。Spectrum X 一經(jīng)推出便迅速獲得成功,正如我所說,它使我們成為世界上最大的網(wǎng)絡(luò)公司。下一代 SpectrumX 將延續(xù)這一傳統(tǒng)。但正如我早些時(shí)候所說,人工智能已經(jīng)重塑了整個(gè)計(jì)算堆棧,計(jì)算堆棧的每一層。可以合理地推斷,當(dāng)人工智能開始在世界各地的企業(yè)中部署時(shí),它也將重塑存儲的構(gòu)建方式。人工智能不使用 SQL。人工智能使用語義信息。當(dāng)使用人工智能時(shí),它會(huì)創(chuàng)建這種臨時(shí)知識、臨時(shí)內(nèi)存,稱為 KV 緩存,即鍵值組合,但它是一個(gè) KV 緩存。
基本上,就是那個(gè)緩存。人工智能,也就是人工智能的工作記憶。而人工智能的工作記憶存儲在HBM內(nèi)存中。對于每一個(gè)單獨(dú)的詞元(token),GPU都會(huì)讀取模型中的整個(gè)模型。它讀取整個(gè)工作記憶,然后產(chǎn)生一個(gè)詞元。然后它將這個(gè)詞元存回KV緩存中。然后下一次它執(zhí)行這個(gè)操作時(shí),它會(huì)讀取整個(gè),它會(huì)讀取整個(gè)內(nèi)存,讀取它,然后將其串流通過我們的GPU,再生成另一個(gè)詞元。它會(huì)反復(fù)地這樣做,一個(gè)接一個(gè)地產(chǎn)生詞元,顯然,如果你與該人工智能進(jìn)行長時(shí)間的對話,隨著時(shí)間的推移,這個(gè)記憶,這個(gè)上下文記憶,將會(huì)急劇增長。更不用說模型本身在增長,我們使用的輪次數(shù)量也在增加。人工智能正在增加。我們希望這個(gè)人工智能陪伴我們一生,并記住我們與它有過的每一次對話,我讓它進(jìn)行的每一次研究。當(dāng)然,將要共享這臺超級計(jì)算機(jī)的人數(shù)還會(huì)持續(xù)增加。因此,這個(gè)最初能夠容納在HBM(高帶寬內(nèi)存)中的上下文內(nèi)存,已經(jīng)不再足夠大了。
去年,我們創(chuàng)造了Grace Blackwell中非常快的內(nèi)存,我們稱之為快速上下文內(nèi)存。
這就是我們將Grace直接連接到Hopper的原因,這就是我們將Grace直接連接到Blackwell的原因,以便我們能夠擴(kuò)展上下文內(nèi)存。但即使那樣也不夠。所以下一個(gè)解決方案,當(dāng)然是連接到網(wǎng)絡(luò),即南北網(wǎng)絡(luò),連接到公司的存儲。但是,如果您同時(shí)運(yùn)行大量人工智能,該網(wǎng)絡(luò)的運(yùn)行速度將不再足夠快。所以答案非常明確,那就是采取不同的做法。因此,我們創(chuàng)建了Bluefield 4,以便我們可以在機(jī)架中直接擁有一個(gè)非常快速的KV緩存上下文內(nèi)存存儲。
所以我在一秒鐘后就會(huì)向您展示,但存在一個(gè)全新的存儲系統(tǒng)類別。
業(yè)界對此感到非常興奮,因?yàn)檫@對于當(dāng)今進(jìn)行大量 Token 生成的幾乎所有人來說都是一個(gè)痛點(diǎn),人工智能實(shí)驗(yàn)室、云服務(wù)提供商都深受由 KV 緩存(KV Cache)移動(dòng)所產(chǎn)生的網(wǎng)絡(luò)流量的影響。
因此,我們設(shè)想創(chuàng)建一個(gè)新的平臺、一個(gè)新的處理器,來運(yùn)行整個(gè) Dynamo KV 緩存上下文內(nèi)存管理系統(tǒng),并將其非常靠近機(jī)架的其他部分,這完全是革命性的。
所以,這都是計(jì)算節(jié)點(diǎn)。它們每一個(gè)都是 NVLink 72。
所以這是 Vera Rubin,MVLink 72,144 個(gè) Rubin GPU。這就是存儲在這里的上下文內(nèi)存。
在它們每一個(gè)的后面都是四個(gè)藍(lán)色區(qū)域。每個(gè)藍(lán)色區(qū)域后面是 150 GB,150 TB 的內(nèi)存,即上下文內(nèi)存。對于每個(gè) GPU,一旦你進(jìn)行分配,每個(gè) GPU 將獲得額外的 16 TB。現(xiàn)在在這個(gè)節(jié)點(diǎn)內(nèi)部,每個(gè)GPU基本上都有一個(gè)太字節(jié)的容量。現(xiàn)在,有了這個(gè)回程,你直接在同一東西向流量上以完全相同的數(shù)據(jù)速率,每秒200吉字節(jié)進(jìn)行存儲。在整個(gè)計(jì)算節(jié)點(diǎn)的結(jié)構(gòu)中,你將獲得額外的16太字節(jié)的內(nèi)存,好的?這是管理平面。這些是Spectrum X交換機(jī),它們將所有設(shè)備連接在一起。而在另一邊,末端的這些交換機(jī)將它們連接到數(shù)據(jù)中心的其余部分。好的?所以這就是Vera Rubin。
現(xiàn)在,關(guān)于它,有幾件事真的非常了不起。因此,我提到的第一件事是,整個(gè)系統(tǒng)的能源效率提高了兩倍,從某種意義上說,其溫度性能也提高了兩倍,因?yàn)楸M管功耗是兩倍高,使用的能量是兩倍高,計(jì)算量比那高出很多倍,但進(jìn)入的冷卻液仍然是45攝氏度。這使我們能夠節(jié)省全球約6%的數(shù)據(jù)中心電力。所以這是一件非常重大的事情。
第二個(gè)非常重大的進(jìn)展是,整個(gè)系統(tǒng)現(xiàn)在是機(jī)密計(jì)算安全的,這意味著所有數(shù)據(jù)在傳輸中、靜止時(shí)以及計(jì)算過程中都經(jīng)過了加密。并且每一條總線現(xiàn)在都經(jīng)過了加密。每一個(gè)PCI Express、每一個(gè)NV Link、每一個(gè),CPU和GPU之間的NV Link、GPU之間的連接。現(xiàn)在一切都經(jīng)過了加密。因此,它是機(jī)密計(jì)算安全的。這使得公司感到安全,因?yàn)榧词顾麄兊哪P褪怯善渌瞬渴鸬模步^不會(huì)被任何其他人看到。好嗎?因此,這個(gè)特定的系統(tǒng)不僅能源效率極高,而且還有另一件令人難以置信的事情。由于人工智能工作負(fù)載的性質(zhì),它會(huì)隨著一個(gè)稱為“全約簡”(all reduce)的計(jì)算層而瞬間出現(xiàn)峰值。電流的量、使用的能量,但同時(shí)是真正地超出了常態(tài)的。通常情況下,它們會(huì)激增25%。我們現(xiàn)在已經(jīng)在整個(gè)系統(tǒng)上實(shí)現(xiàn)了電源平滑處理,這樣您就不必過度配置25倍,或者如果您過度配置了25倍,您也不必浪費(fèi)或閑置25%的能源。所以現(xiàn)在你可以填滿整個(gè)功耗預(yù)算,而無需過度,無需繼續(xù),無需超出該范圍進(jìn)行配置。
訓(xùn)練效率、成本對比與結(jié)語
然后最后一件事,當(dāng)然是性能。所以我們來看看性能。這一點(diǎn)。這些圖表是只有構(gòu)建人工智能超級計(jì)算機(jī)的人才會(huì)喜歡的。這需要我們對每一塊芯片、對所有系統(tǒng)的完全重新設(shè)計(jì),以及重寫整個(gè)技術(shù)棧,才得以實(shí)現(xiàn)。基本上,這一列是訓(xùn)練人工智能模型。你訓(xùn)練人工智能模型越快,你就能越快地將下一個(gè)前沿技術(shù)推向世界。這是你的上市時(shí)間。這就是技術(shù)領(lǐng)導(dǎo)力。這是您的定價(jià)。能力。
因此,在綠色的情況下,這本質(zhì)上是一個(gè)擁有10萬億參數(shù)的模型。
我們從DeepSeek(深度探索)將其規(guī)模擴(kuò)大,DeepSeek,這就是我們稱之為DeepSeek++的原因,訓(xùn)練了一個(gè)擁有10萬億參數(shù)的模型,使用了十萬萬億個(gè)詞元。好的。這是我們對構(gòu)建下一個(gè)前沿模型所需投入的模擬預(yù)測。下一個(gè)前沿模型,埃隆已經(jīng)提到過,GROC(格羅克)的下一個(gè)版本,我認(rèn)為是GROC 5,是每錘7萬億參數(shù)。所以這是10。綠色代表Blackwell。而在Rubin的情況下,請注意,吞吐量要高得多,因此,在給定的一組系統(tǒng)(此處為訓(xùn)練所需系統(tǒng)數(shù)量)中,只需要四分之一的系統(tǒng)就能在一個(gè)月內(nèi)訓(xùn)練完模型。
好的嗎?因此,時(shí)間對每個(gè)人來說都是一樣的。
現(xiàn)在,您能多快訓(xùn)練該模型以及您能訓(xùn)練多大的模型,將決定您何時(shí)能率先達(dá)到前沿水平。第二部分是你的工廠吞吐量。Blackwell 又變綠了。工廠吞吐量之所以重要,是因?yàn)樵谇д淄叩那闆r下,你的工廠價(jià)值500億美元。
一個(gè)價(jià)值500億美元的數(shù)據(jù)中心只能消耗一千兆瓦的電力。因此,如果你的每瓦性能、每瓦吞吐量非常好,與相當(dāng)差的相比,這直接轉(zhuǎn)化為你的收入。
你數(shù)據(jù)中心的收入與第二列直接相關(guān)。在 Blackwell 的情況下,它比 Hopper 高出約10倍。在 Rubin 的情況下,它將再次提高約10倍。好的。在代幣成本方面,生成代幣的成本效益如何,Rubin 約為十分之一,正如……是的。
這就是我們將如何把所有人帶到下一個(gè)前沿,將人工智能推向新水平的方式。
當(dāng)然,還要以高能效和高成本效益來建設(shè)這些數(shù)據(jù)中心。這就是全部了。這就是今天的英偉達(dá)。
你們知道,我們提到我們制造芯片,但正如你們所知,英偉達(dá)現(xiàn)在制造的是整個(gè)系統(tǒng)。
人工智能是一個(gè)完整的技術(shù)棧。我們正在對從芯片到基礎(chǔ)設(shè)施、再到模型和應(yīng)用的方方面面進(jìn)行人工智能的重塑。我們的工作是構(gòu)建完整的技術(shù)棧,以便在座的各位可以為全世界創(chuàng)造出令人難以置信的應(yīng)用。感謝大家的到來。祝大家有一個(gè)愉快的國際消費(fèi)電子展(CES)。現(xiàn)在,在我讓大家離開之前,我們有很多幻燈片沒有用上。所以我們這里放了一些花絮片段。我想這對你們來說會(huì)很有趣。祝大家CES(國際消費(fèi)電子展)愉快。收工。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.