<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      黃仁勛:日薪兩千美元的員工,我巴不得你每天花一千去“養(yǎng)蝦”!| 閉門會2萬字實錄

      0
      分享至


      出品 | 網(wǎng)易智能

      作者 | 小小

      編輯 | 王鳳枝

      在2026年GTC兩小時主題演講引爆全場后,英偉達創(chuàng)始人兼CEO黃仁勛18日再度現(xiàn)身GTC 2026現(xiàn)場,面向金融分析師舉行了一場閉門問答會。面對諸多尖銳提問,“黃教主”不僅展現(xiàn)出對行業(yè)趨勢的深刻洞察,更罕見地披露了關(guān)于下一代架構(gòu)的萬億級市場預(yù)期。


      黃仁勛在問答中提出了一系列觀點。他認為,AI產(chǎn)業(yè)正邁入“第三個拐點”,從生成式AI向“智能體系統(tǒng)”階段演進,AI將不再僅是回答問題,而是能夠自主執(zhí)行復(fù)雜任務(wù)。

      這一轉(zhuǎn)變將徹底重塑計算產(chǎn)業(yè)形態(tài):計算機正從單純的工具演變?yōu)椤爸圃煸O(shè)備”,其核心產(chǎn)出物是具有經(jīng)濟價值的Token。他將其定義為“AI工廠”模式,并強調(diào)衡量算力優(yōu)劣的標準已轉(zhuǎn)向“單位功耗下的Token生成效率”。

      在黃仁勛看來,驅(qū)動這座“AI工廠”高速運轉(zhuǎn)的核心操作系統(tǒng),正是當下火爆的開源項目OpenClaw。他毫不諱言地指出:“今天,全球每家公司都必須確立自己的OpenClaw戰(zhàn)略。”

      黃仁勛算了一筆“經(jīng)濟賬”:他曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若這50美元能讓智能體替你從事極具生產(chǎn)力的工作,這筆投資簡直微不足道。未來的常態(tài)將是:一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)著一支龐大的智能體大軍,為每個智能體分配50美元的日預(yù)算,從而將個人生產(chǎn)力推向極致。這一場景很快便會司空見慣。

      事實上,在英偉達,他們已然將此付諸實踐。黃仁勛坦言:“對于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠超50美元。我期望他們能運籌帷幄,管理一整支智能體編隊來代勞繁雜任務(wù)。他還稱,真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。

      正是基于這種由智能體引爆的算力渴求,面對分析師對市場天花板的疑慮,黃仁勛再次重申了其預(yù)測:基于Blackwell和下一代Rubin架構(gòu),英偉達在2027年前的明確可見市場需求已超過1萬億美元。他進一步展望,傳統(tǒng)的2萬億美元軟件許可行業(yè),正加速向基于AI智能體的Token轉(zhuǎn)售模式轉(zhuǎn)型,潛在市場規(guī)模有望擴張至8萬億美元。

      這場對話不僅勾勒出英偉達的雄心,也揭示了AI底層商業(yè)邏輯即將迎來的根本性變革。

      以下為黃仁勛記者問答會全文:


      重新定義AI時代:

      計算機不再是工具,

      是制造設(shè)備

      主持人:大家早上好。希望各位喜歡昨天GTC的主題演講,雖然時間稍長,但我認為它為我們做了一次極佳的總結(jié)。接下來,我們將利用這段時間聚焦各位的需求,解答大家可能存在的其他疑問。我們將先過幾張幻燈片,隨后開放提問。現(xiàn)在,把時間交給黃仁勛。


      黃仁勛:正如我昨日所述,AI的發(fā)展正經(jīng)歷三個關(guān)鍵的轉(zhuǎn)折點:第一個是生成式AI,第二個是推理階段,而我們現(xiàn)在正處于第三個即智能體系統(tǒng)。每一次轉(zhuǎn)折都建立在上一代的基礎(chǔ)之上,但智能體系統(tǒng)的本質(zhì)突破在于“自主性”。過去,AI只是回答問題;現(xiàn)在,你可以為其設(shè)定目標,它便能真正著手執(zhí)行任務(wù)。

      任務(wù)可以是什么?最典型的一個應(yīng)用就是編寫軟件。如今,貴公司的工程師,當然也包括我們公司的,每天都在高頻使用智能體系統(tǒng)。過去,工程師上班只需一臺筆記本電腦;而現(xiàn)在,他們需要筆記本電腦,外加Token。Token預(yù)算已成為切實存在的資源。試想,如果你雇了一位年薪30萬美元的工程師,而他在工作中竟完全不消耗任何Token,你恐怕得問問他:你到底在忙些什么?所以結(jié)論很清楚:每個工程師都將消耗大量Token,而這些Token必須被生產(chǎn)出來。

      這就引發(fā)了一場根本性變革:過去計算機只是工具,而未來的計算機將是制造設(shè)備。它們和ASML的光刻機沒什么兩樣,都在生產(chǎn)某種可供出售的商品。就像很久以前的發(fā)電機生產(chǎn)電力一樣,這些都是制造系統(tǒng)。其能效與生產(chǎn)效率將直接決定你的營收與競爭力。


      第三個轉(zhuǎn)折點已經(jīng)到來。以O(shè)penClaw項目為例,很多人初見其開源版本時,還以為那是個玩具。但若你退一步,從第一性原理出發(fā)去思考,便會發(fā)現(xiàn)OpenClaw本質(zhì)上就是一臺計算機,它是AI計算機的操作系統(tǒng),也是一臺個人AI計算機。它具備計算系統(tǒng)的所有屬性:資源管理、任務(wù)調(diào)度、執(zhí)行輸入輸出、網(wǎng)絡(luò)連接等,它擁有基礎(chǔ)計算機所需的一切。那條陡峭的增長曲線已說明一切,這才是真正值得矚目的焦點。

      所以,今天每家公司都需要思考一個問題:你的OpenClaw戰(zhàn)略是什么?過去,我們必須制定Linux戰(zhàn)略、互聯(lián)網(wǎng)戰(zhàn)略、移動云戰(zhàn)略;而如今,每家軟件公司都必須確立OpenClaw戰(zhàn)略。這件事的重要性怎么強調(diào)都不為過。

      在此背景下,我想更新一下去年做出的某項預(yù)測。一年前我曾提到,我們對Blackwell和Rubin架構(gòu)到2026年的出貨量有著極高的業(yè)務(wù)可見度,包括明確的采購訂單和需求,當時的預(yù)期規(guī)模約為5000億美元。很多人當時對此有疑問,想知道最新進展。現(xiàn)在是3月,我們距離2027年底還有很長時間。正因為我們在建設(shè)的是基礎(chǔ)設(shè)施和工廠,而每個人的交付周期都很長,所以我希望他們盡早下單以確保供應(yīng)。

      今天我可以更新的數(shù)據(jù)是:我們對Blackwell加Rubin的出貨價值(僅限這兩款產(chǎn)品)突破1萬億美元,有著極強的信心與可見度。這不是一個浮動的估值,不是精確到小數(shù)點后94位的數(shù)字,我們也沒有在錙銖必較地算零頭。我的意思是,針對超過1萬億美元的Blackwell加Rubin市場,我們抱有強烈的預(yù)期。為什么只說Blackwell和Rubin?因為去年我提的時候只談了這兩款芯片。今年我們新增了Groq、獨立的CPU還有很多其他產(chǎn)品,但為了口徑一致,我今天的更新只聚焦于Blackwell和Rubin。

      所以我需要把話說清楚:我所說的這1萬億美元,只包括Blackwell和Rubin這兩款產(chǎn)品。不包括Feynman,不包括Rubin Plus或Rubin Ultra,不包括Vera Standalone,也不包括Groq。僅僅是Blackwell加Rubin,我們就已經(jīng)有了超過1萬億美元的采購訂單,這是基于高度確信的需求、清晰的可見性和扎實的預(yù)測得出的結(jié)論。

      我們一直在達成交易、完成出貨,而且從現(xiàn)在到2027年底,我們預(yù)計還會達成更多交易、預(yù)訂更多訂單、出貨更多產(chǎn)品。原因很簡單:我們會一直工作到那一天。英偉達有一個獨特的優(yōu)勢。因為我們設(shè)計和交付的是高度復(fù)雜的整體系統(tǒng),我們可以在同一個季度內(nèi)完成從贏單、預(yù)訂到出貨的全過程。如果你做的是ASIC(專用集成電路),你做不到這一點。如果你現(xiàn)在還沒看到需求,就不可能趕在2027年底前出貨。但我們不同。

      我們提前建立庫存,構(gòu)建了完整的供應(yīng)鏈,我們必須把這個優(yōu)勢用足。當前客戶對算力如饑似渴,如果他們在最后一刻突然提出“我們還需要更多”,我希望我們永遠有底氣回應(yīng):“沒問題,我們樂意效勞。”更何況,我們還在開拓新客戶、新市場、新區(qū)域,這些甚至還沒有算進這1萬億美元里。畢竟,距離2027年底還有21個月。因此,我希望大家真正理解這1萬億美元意味著什么:它絕非終點,它本身將持續(xù)增長,未來勢必會超越這一數(shù)字。


      推理經(jīng)濟學(xué):

      最貴的計算機,

      最便宜的Token

      我再補充幾點。

      2025年對我們來說是意義非凡的一年,因為它是“推理之年”。在這一年里,我們幫助市場理清了一個核心邏輯:計算機的售價與Token的成本之間并無必然聯(lián)系。人們買這些計算機是為了生產(chǎn)Token,而Token的生產(chǎn)效率至關(guān)重要。如果你買了一臺昂貴的計算機然后轉(zhuǎn)手賣掉,那它確實只是“昂貴”;但若你用它來生產(chǎn)Token,它的“貴”則源于其技術(shù)足夠先進,能以驚人的效率產(chǎn)出Token。這意味著你完全可以同時擁有“最昂貴的計算機”與“成本最低的Token”,這正是我們每天在做的事,也是我們創(chuàng)造獨特價值的根源。

      這種價值差,最終體現(xiàn)在兩個指標上:每秒生成的Token數(shù)以及每瓦功耗產(chǎn)出的Token數(shù)。我們每一代產(chǎn)品都在實現(xiàn)指數(shù)級的性能躍升,以至于客戶寧愿出高價購買我們的下一代產(chǎn)品,也不愿低價購入上一代。Vera Rubin一旦上市,他們便會立刻切換。因為盡管價格更高,其創(chuàng)造的價值卻大得多。我之所以將這兩個系統(tǒng)放在一起比較,是因為它們已成為全球事實上的標準。在無法超越這兩個系統(tǒng)之前,購買其他產(chǎn)品毫無意義。然而想要超越它們難如登天,因為摩爾定律無法再賦予你35倍的性能提升,單靠制造更快的芯片已無濟于事,你必須打造出“海量的、速度更快的芯片群”。


      作為推理之年,2025年我們也切實證明了自身在推理領(lǐng)域的領(lǐng)導(dǎo)力,從訓(xùn)練到后訓(xùn)練,再到推理,全面領(lǐng)跑。

      去年我們還完成了另一件大事:大幅拓寬了平臺的模型覆蓋廣度。我們新增了對Anthropic的支持,這是全新的舉措;新增了對Meta Superintelligence Labs的支持,這是一個擁有全新計算需求的全新實體。眾所周知,去年開源軟件與開源模型真正迎來了爆發(fā)。時至今日,若按生成的Token總量計算,位列第一的是OpenAI,第二名是所有開源模型的總和,第三是Anthropic,第四是xAI。繼續(xù)梳理下去你會發(fā)現(xiàn),英偉達正是全球開源模型的最佳運行平臺,這也解釋了為何我們在如此龐大的基數(shù)之上,依然能實現(xiàn)加速增長。

      最后我想強調(diào)一點:我們極為珍視與超大規(guī)模云廠商的合作關(guān)系,但這絕不僅僅是簡單的買賣關(guān)系。我們也在幫他們“獲客”。既然CUDA運行在他們的云端,就意味著所有CUDA開發(fā)者、AI原生初創(chuàng)企業(yè)以及與我們合作的大型企業(yè)都會隨之遷移。我們每推動一家大企業(yè)或初創(chuàng)公司落地,都會引導(dǎo)他們到某家云廠商處進行托管。從某種意義上說,我們堪稱全球各大云廠商最頂尖的銷售團隊之一。

      你去展區(qū)看看就明白了:AWS的展位規(guī)模龐大,Google Cloud、Azure、Oracle、CoreWeave的展位同樣宏大。他們?yōu)楹螀R聚于此?正是為了向我們的開發(fā)者推銷產(chǎn)品。而我們的開發(fā)者只熟悉一種編程方式,那就是CUDA。當他們完成開發(fā)并尋求落地時,自然會選擇入駐某位云服務(wù)提供商合作伙伴的云平臺。這便是我們與超大規(guī)模云廠商之間最真實的關(guān)系。


      拆解60/40客戶版圖:

      英偉達成了云廠商最好的銷售團隊

      最后,我想重點談?wù)効蛻艚Y(jié)構(gòu)的另一面。


      我們與超大規(guī)模云廠商的合作固然緊密,貢獻了約60%的業(yè)務(wù)份額。但許多人忽視了另外的40%,即來自區(qū)域云、工業(yè)、企業(yè)及本地部署的龐大需求。戴爾、聯(lián)想、惠普正在快速增長,所有的ODM也在快速增長。這部分業(yè)務(wù),正在流向圖表右側(cè)的那40%。

      這40%意味著什么?倘若沒有英偉達的全能力,沒有我們構(gòu)建完整“AI工廠”的實力,沒有全球所有開源平臺皆運行于英偉達之上這一鐵律,你根本無從觸及這片市場。左側(cè)那60%的份額中,很大一部分歸功于我們將開發(fā)者引流至云端;而右側(cè)這40%的陣地,如果僅僅是一家芯片制造商,絕對是100%無能為力的,因為這部分客戶不買芯片,他們買的是平臺。

      不知我是否將這一信息傳達清晰了?準確理解我們的業(yè)務(wù)結(jié)構(gòu)至關(guān)重要。我們將這一切深度整合,并統(tǒng)稱為“加速計算”。

      明年我們可能會換一種方式拆分業(yè)務(wù),大概就像這張圖表展示的那樣:超大規(guī)模占60%,但請記住,其中很多客戶是我們帶上云的。右側(cè)那40%,只做芯片的公司永遠夠不著。

      一張幻燈片里塞滿了三重信息,可能讓大家有些應(yīng)接不暇。我本該將其拆分為三張的,盡管那樣演講可能會拉長到七個小時,但也絕對物超所值。

      好了,就這些。謝謝。

      以下為問答環(huán)節(jié):


      OpenAI和Anthropic的收入,

      你們低估了

      問:首先感謝你們提供這次交流機會。祝賀你和你的團隊。現(xiàn)在大家都理解了推理的重要性,但我認為市場最大的疑慮是:投入到底值不值?超大規(guī)模企業(yè)能否通過API和云服務(wù)獲得足夠的收入增長,來證明當前資本支出的合理性?我自己做了一些測算,目前他們的資本支出比云API收入高出20%。Jensen,你看到的情況是什么?你曾說過,你的客戶,尤其是那些支撐Anthropic和OpenAI的超大規(guī)模企業(yè),會帶來巨大的現(xiàn)金流上行空間。那么,我們什么時候能看到這些收入真正兌現(xiàn)?我知道這個問題對您而言略顯棘手,畢竟您還要兼顧對其他公司的指引。但如果我們能看到這種上行空間,市場對你們的信心會強得多,大家才會相信這種建設(shè)是可以持續(xù)的。那么,收入上行何時出現(xiàn)?我們怎樣才能更有信心?

      黃仁勛:我多希望這些公司已經(jīng)上市,這樣大家就能真切地看到我眼中的景象了。縱觀歷史,從未有過任何一家未上市的初創(chuàng)企業(yè),能實現(xiàn)每周狂攬十億乃至二十億美元的營收增量。而他們當下正在經(jīng)歷的,正是這種堪稱恐怖的量級增長。

      記住我剛才說的是“每周”。整個IT軟件行業(yè)的規(guī)模約為2萬億美元。在我看來,這一行業(yè)不會被顛覆,而是將迎來徹底的重塑。我堅信,這2萬億美元IT版圖中的每一家企業(yè),都會將OpenAI、Anthropic及各大開源模型整合進來,接入名為OpenClaw的開源軟件中。隨后,我們會將其打造為企業(yè)級版本,也就是NeMoClaw。借此,你瞬間便能擁有一個智能體。目前已有150萬人下載了OpenClaw并搭建了專屬智能體。只需寥寥一行代碼,當你下達任務(wù)指令時,這個智能體便會自動展開學(xué)習(xí)與執(zhí)行。

      未來,這些智能體會被整合進整個IT行業(yè)。這個行業(yè)現(xiàn)在還是2萬億美元的軟件許可模式,但將來可能會變成8萬億美元規(guī)模。同時,他們還會轉(zhuǎn)售海量的Token。全球100%的IT公司,都將成為OpenAI和Anthropic的經(jīng)銷商。因此,請各位務(wù)必調(diào)高對OpenAI和Anthropic的估值預(yù)期。

      我相信,Anthropic、OpenAI,當然還有所有的IT公司,也會用開放模型來修改和定制自己的軟件。這就是英偉達開源大模型NeMotron的用途,這就是開發(fā)與部署平臺NeMo的用途。我們創(chuàng)建了所有這些工具,這就是為什么我們和每一家公司都在合作。他們都會去創(chuàng)建整合了這三個組件的智能體。我相信他們會以難以置信的速度增長。這個時刻很快就會到來,因為你可以從Anthropic和OpenAI的數(shù)字里看到,他們不是在普通地增長,他們在一個月內(nèi)就能增長出一家完整的IT公司。

      這些AI公司的營收模式在于:其能力一部分將由企業(yè)直接采購使用,另一部分則會通過IT公司分銷,深度嵌入到IT企業(yè)的產(chǎn)品線中。因為AI本身就是軟件。他們的軟件可以直接提供給企業(yè),也可以被集成、被定制,變成特定領(lǐng)域的、受管控的、安全的、易于配置的智能體系統(tǒng),連接到企業(yè)的核心系統(tǒng)。然后這些智能體系統(tǒng)會被租給客戶,而客戶在使用過程中,仍然需要通過AI工廠來消耗Token。無論這些Token來自O(shè)penAI、Anthropic還是開放模型,都需要被生成出來。

      歸根結(jié)底,傳統(tǒng)的IT公司售賣的是軟件授權(quán),而未來的IT企業(yè)出租的將是Token。他們的商業(yè)模式必將重構(gòu),企業(yè)體量將進一步膨脹,毛利率結(jié)構(gòu)亦將隨之改變,因為如今他們的成本核算中加入了Token這一銷貨成本,但相應(yīng)地,他們所能提供的價值也呈幾何級數(shù)躍升。對他們而言,這無疑是令人振奮的時代機遇。


      40%會變成70%:

      物理AI的萬億市場

      問:我想聊聊那張60/40圖的演變。你昨天談到了NeMo,又發(fā)布了Vera Rubin DSX AI工廠參考設(shè)計,這基本上是為非超大規(guī)模客戶提供了一個藍圖,讓他們有能力與超大規(guī)模企業(yè)競爭。當你把所有這些東西整合在一起,看到Token生成量的大幅飆升,你預(yù)計這張圖會如何演變?我們該怎么看待不同參與者的發(fā)展方向?

      黃仁勛:我認為該圖表的左右兩側(cè)均會保持增長,且在未來幾年內(nèi)增速將基本持平,直至物理AI的拐點真正降臨。

      一旦跨過那個拐點,工業(yè)端的計算處理就必須轉(zhuǎn)至本地,必須在邊緣側(cè)、在業(yè)務(wù)現(xiàn)場、在生產(chǎn)車間內(nèi)完成。到那時,那40%很可能會開始加速增長。我甚至認為,最終那40%會變得更大,因為與物理AI相關(guān)的全球工業(yè)規(guī)模,遠比與數(shù)字AI相關(guān)的規(guī)模大得多。

      全球工業(yè)領(lǐng)域有高達70萬億美元的經(jīng)濟活動亟需物理AI的深度介入,因為世界的運轉(zhuǎn)并非僅僅局限于我們的筆記本電腦屏幕內(nèi),而是實實在在地發(fā)生于廣袤的物理空間中。大量與原子相關(guān)的業(yè)務(wù),沒有物理AI根本處理不了。因此我堅信,也熱切期盼著,那40%的份額最終能攀升至70%。

      但無論比例如何變化,兩邊都會變得極其巨大。因為這個世界將進入一個狀態(tài):每天、每時每刻都在持續(xù)不斷地生產(chǎn)Token,永不停歇。就在我們說話的這會兒,我們所有的筆記本電腦都在持續(xù)運轉(zhuǎn),希望你們大部分人的電腦都處于閑置狀態(tài),但在未來,計算機會24小時不間斷運行,持續(xù)創(chuàng)造Token。因為你的智能體們正在替你工作。

      我曾瀏覽過一篇Reddit帖子,發(fā)帖人的Claw智能體一天內(nèi)竟消耗了5000萬個Token。聽起來猶如天文數(shù)字,但折算下來不過區(qū)區(qū)50美元。倘若你手下有一個智能體正在從事極具生產(chǎn)力的工作,這50美元簡直微不足道。你完全可以讓一位日薪數(shù)千美元的精英,統(tǒng)領(lǐng)一支龐大的智能體大軍,為每個智能體分配50美元的日預(yù)算,從而將生產(chǎn)力推向極致。這一場景很快便會司空見慣。

      在英偉達,我們已然付諸實踐。對于那些我每天支付數(shù)千美元薪酬的員工,我巴不得他們每天消耗的Token遠超50美元。我期望他們能運籌帷幄,管理一整支智能體編隊來代勞繁雜任務(wù)。說實話,我真心期盼一位日入2000美元的干將,每天能豪擲1000美元在Token消耗上。這絕非天方夜譚,此時此刻全球各地的軟件公司里,這一切正在真實上演。


      解密推理光譜:

      Groq不是來取代,

      是來補位的

      問:你們談過Rubin會在下半年開始出貨,Groq聽起來像是在第三季度推出。那么,我是否可以認為Rubin應(yīng)該和Groq一起推出?因為我不認為Groq是獨立存在的。然后,我想問一個更長遠的問題。我真的很喜歡你們前幾天放出的那張圖,它在我看來幾乎是展示了推理光譜的延伸,這為Groq創(chuàng)造了價值。你過去常說GPU是唯一的出路,我們現(xiàn)在看到像Groq這樣的架構(gòu)是必要的,以便利用不斷擴大的推理光譜,低延遲變得更加重要。我想知道的是,你如何看待這個光譜從今往后的演變?你的平臺現(xiàn)在是否擁有了未來幾年所需的所有組件?展望未來,隨著推理的發(fā)展,會出現(xiàn)哪些新型的工作負載?你是否擁有抓住這些機會所需的所有組件?

      黃仁勛:謝謝你對Groq和LPDDR的提問。我們確實溝通過,Groq也會在今年下半年開始出貨,具體時間臨近時再看,但確實是在今年。你可以說Groq在第三季度出貨,我昨天確認了,這是我們的預(yù)期。但我要說明一點:Vera Rubin會在Groq之前出貨。原因是我們已經(jīng)在生產(chǎn)Vera Rubin了,系統(tǒng)已經(jīng)在生產(chǎn)線上跑著。Vera Rubin本身便難以逾越,即便對手是Groq亦是如此,哪怕將Groq與Vera Rubin強聯(lián)手,想要擊敗純粹的Vera Rubin也并非易事。

      在計算架構(gòu)領(lǐng)域,大致可劃分為兩大流派:一派追求極致的低延遲,另一派則主攻極高的吞吐量。事實上,CPU本質(zhì)上就是一臺低延遲計算機,看看其芯片上的緩存規(guī)模便知,幾乎全由SRAM構(gòu)成。而Groq正是此類架構(gòu)的極端化產(chǎn)物:SRAM幾乎霸占了整塊芯片,任務(wù)調(diào)度完全依靠靜態(tài)完成,由編譯器精準測算數(shù)據(jù)與計算指令的位置,確保它們“如期相遇”。整個Groq系統(tǒng)猶如一臺龐大的同步機器,這賦予了它極強的確定性與極低的延遲。然而代價也顯而易見:編程門檻高、缺乏靈活性,且并非面向通用計算。

      因此我們所做的是采用了Vera Rubin,正如昨天我所描述的,它占據(jù)了大約四分之三的空間。Vera Rubin是正確的答案。我們不知道如何使它變得更好。如果我們知道如何讓它變得更好,我們就會去改進它。NVLink 72以及Vera Rubin Ultra NVLink 144、Feynman NVLink 1152,我們會繼續(xù)擴大左側(cè)那個高吞吐量至關(guān)重要的區(qū)域的范圍。同時,我們會把Groq加進來,與Vera Rubin融合,與我們的GPU融合,用Groq來處理自回歸模型的最后一個階段,也就是語言模型中那個對帶寬要求極高的最后階段。如果我們把一大堆SRAM聚集起來,比如數(shù)千個Groq芯片,比例大概是8比1。

      所以,對于最后25%的功耗以及最后25%的用例,我們都在用ChatGPT,但我們以不同的方式使用它,我們有不同的定價層級。因為你的數(shù)據(jù)中心有各種各樣的用例,不是只有一種。我們都在我那張圖里的不同波段中。我展示了零級、免費級、好、更好、最好、極致版本。對于免費、好、更好這幾個層級,Vera Rubin是無敵的,我們想不出任何接近的東西。而對于最好和極致,加上Groq,你可以提高最好層的吞吐量,甚至把極致層推得更遠。

      “極致”層級開辟了一片全新市場,但受制于吞吐量曲線,其受眾規(guī)模注定極小,你無法指望需求量呈爆發(fā)式增長,因此必須輔以極高的定價策略。然而,一個全新的高凈值客戶群已然浮出水面:那些身價不菲的資深軟件工程師。其自身的人力成本本就極為高昂,若我每天再為他們增加100美元的推理與Token成本,我也甘之如飴。哪怕在項目攻堅期暴增1000美元,他們同樣樂見其成。我描述的是一個正在成熟的市場里正在發(fā)生的事情。

      在市場莽荒期,沒人確切知曉該如何駕馭這項技術(shù),技術(shù)本身亦不夠成熟,用戶根本無法做到精準施放。100%的早期推理客戶都在免費層。但隨著技術(shù)開始達到o1和o3水平,付費層突然飆升,因為人們現(xiàn)在能用它來做有用的事情了。然后當智能體出現(xiàn)時,比如云代碼、Codex,那些Token比免費層貴得多,也比每月20美元貴得多。所以我們剛剛增加了兩個細分市場。

      這和iPhone沒什么不同,起初只有一個版本,現(xiàn)在有很多版本。和汽車行業(yè)沒什么不同,和任何行業(yè)都沒什么不同。隨著市場擴大,細分市場也在擴大。

      我展示的是一個能夠生產(chǎn)不同細分市場和不同層級Token的工廠:從非常聰明、極其快速,到高吞吐量的免費層。這描述的是一種AI工廠架構(gòu),允許你覆蓋所有需求,最終最大化工廠的總收入。我們讓你自己決定如何搭配組合。

      我的估計是,現(xiàn)在大概有25%的市場,主要針對少數(shù)幾家公司,你需要是其中之一,你需要生成大量Token才值得這么做。然后還有一大批所謂的推理服務(wù)提供商、API服務(wù)提供商,我認為他們也可以從中受益,因為他們希望有不同的Token生成細分市場。所以我稱之為一個由10家客戶組成的群體,其中那25%的客戶代表了那個蛋糕的很大一部分。通過Groq,我們可以把那25%的蛋糕的總收入提高2倍。

      問:隨著你繼續(xù)推出新版本的Groq,新一代產(chǎn)品會對市場產(chǎn)生什么影響?你是把那個邊界推得更遠,還是降低成本并增加需求?

      黃仁勛:我們始終在雙線并進:一方面不斷拉升各個層級的吞吐量上限,另一方面持續(xù)拓寬AI的智能邊界。各位留意到那張帕累托圖了嗎?我始終在將其向上推舉。剛才我向大家演示了從Hopper、Blackwell到Vera Rubin的代際演進,每一次架構(gòu)迭代,我都在將其向上推、向外拓。

      每當我向上推,你的工廠在同等價格點上的產(chǎn)量就會增加。每當我向外推,你就可以引入全新的AI層級、全新的Token層級,從而獲得全新的價格點。現(xiàn)在的價格點大概是每百萬Token 6美元左右。但我知道,大家都希望看到每百萬Token 50美元的產(chǎn)品,那是超大模型、超快速度的層級。你能想象一個10萬億參數(shù)的模型,以每秒500個Token的速度運行嗎?我們的工程師會為此付出大價錢,我也會讓我的工程師為此付出大價錢。那個世界很快就會到來,然后明年還會再來,因為模型會變得更大,它們會思考得更多,會使用更多工具。

      這就像早年的Nvidia。不知道你們有多少人記得,我們最初只有一個產(chǎn)品:Riva 128,299美元,就這一個SKU。那些美好的舊時光。然后今天我們有了5090、5080兩個不同的SKU,5070更是分出了三個。所有這些SKU的出現(xiàn),是因為市場變大了,開始出現(xiàn)細分,人們想要不同的東西。

      Token市場也完全一樣。它正變得越來越大,不同的細分市場想要不同的東西。所以我需要幫助我們的客戶、幫助我們的模型制造者,為不同的細分市場制造不同的Token。我知道它們看起來只是數(shù)字,但它們是不同的AI。

      所以答案是:我們將同時提高吞吐量并提高他們的定價。這就是Vera Rubin帶來的好處,我們每一代都是這樣做的。我們用Blackwell做到了,用Vera Rubin做到了,用帶Groq的Vera Rubin也會做到,用Vera Rubin Ultra同樣會做到。我們會持續(xù)不斷地突破那個邊界。

      最終,簡單來說,就是那張帕累托圖。一個工廠要處理大量不同的工作負載和不同的客戶,我們希望不斷地把帕累托前沿向外推、向上推,不斷地向外、向上。而要做到這一點所需要的計算機科學(xué),是所有問題中最難的。


      1萬億之外的1.25萬億

      Groq、CPU、存儲的增量空間

      問:我有兩個相關(guān)的問題。第一,在1萬億美元之外,昨天你還談到了其他產(chǎn)品:Vera CPU、其他CPU、Groq、存儲解決方案、CPX。這些增量有多少?沒有包含在這1萬億里的可尋址市場有多大?我假設(shè)它們對這1萬億是增量。第二,我想更深入了解Groq。你提到它將占據(jù)推理的25%,這是個相當重要的聲明。它是在蠶食什么嗎?隨著時間的推移,Groq的價值捕獲是怎樣的?很多人問我們,它是否會蠶食高帶寬內(nèi)存的需求?

      黃仁勛:首先,今天全球只有我們一家公司能夠在一個AI工廠里,同時優(yōu)化和整合三種內(nèi)存架構(gòu):HBM內(nèi)存是我們第一個使用LPDDR5的公司,它具有極高的帶寬和極低的功耗,這徹底改變了CPU的游戲規(guī)則;第三種是SRAM。我們現(xiàn)在可以利用所有這三種內(nèi)存類型,來打造真正完美的架構(gòu)。

      過去,我們只有一個機柜產(chǎn)品:NV Link72 Grace Blackwell。現(xiàn)在我們有了五個機柜。NVLink 72的設(shè)計目標就是運行各種大型語言模型,我們所有的推理棧都在上面跑。但你要理解智能體系統(tǒng)是什么,它正在運行的東西比如Claude Code現(xiàn)在做的,比如Codex現(xiàn)在做的。這些系統(tǒng)的內(nèi)存需求進入了KV緩存,那是在STX系統(tǒng)上處理的。這個內(nèi)存增長得實在太快了,必須被加速。我們運行時占用的內(nèi)存越多,能解決的問題就越難。這涵蓋了結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),正是我在主題演講開篇所提及的cuDFcuVS過去鮮少有人談及這些底層架構(gòu),但其未來的商業(yè)價值無可估量,因為智能體的處理速度遠超人類,它將以更為狂暴、迅猛的姿態(tài)瘋狂吞吐這些數(shù)據(jù)。

      然后是工具使用,比如網(wǎng)頁瀏覽器。網(wǎng)頁瀏覽器運行在CPU上,所以你需要一個CPU來讓智能體訪問工具。然后它會衍生出子智能體:其中一個可能是Co-opt,由GPU加速;另一個可能是Omniverse,同樣由GPU加速。所以我們在數(shù)據(jù)中心里需要那種GPU。

      所以,理解Vera Rubin的正確方式是:Vera Rubin作為一個系統(tǒng),它的能力被極大地擴展了,我們從處理那90%的工作負載擴展到了處理所有這些任務(wù)。這就是AI。這是ChatGPT開始的地方,但這是它現(xiàn)在所處的位置。

      這就是一個智能體。那么,剛剛在我們的數(shù)據(jù)中心里發(fā)生了什么?畢竟,沒人希望數(shù)據(jù)中心被東拼西湊成“科學(xué)怪人”般的縫合怪,它渴求的是極其優(yōu)雅的供電與液冷系統(tǒng)。所以我們把所有這些計算機都放進了MGX機柜,為其中每一個組件都設(shè)計了完美的處理器,然后直接裝上機架。如果你要把存儲放進去,如果你要把那東西放在和計算同一條走廊的東西向網(wǎng)絡(luò)上,你最好別搞成弗蘭肯斯坦那樣。你不能一邊用著液冷的NVLink 72機柜,另一邊用著風冷的;不能這里用300千瓦,那里用50千瓦。所以我們把所有這些統(tǒng)一到一個單一的機柜架構(gòu)里。如果你想建一個能運行那個智能體的集群,你只需要把它們?nèi)窟B接起來:同樣的供電,同樣的冷卻系統(tǒng),全部100%液冷,全部針對工作負載做了完全優(yōu)化,全部完全加速。

      所以回到你的問題。為了運行這個智能體,為了提供我們剛才討論的所有這些東西,你的資本支出會增加,你的GPU計算支出會增加25%。你把Groq加到那25%的工作負載里,你購買八倍數(shù)量的芯片,價格大概和NVLink 72機柜差不多。所以25%乘以2,就是25%的增量?對,你的計算支出增加了25%。這是第一點,而這部分不在那1萬億美元里面。所以如果那1萬億美元中的100%都加上Groq,那就變成1.25萬億美元。

      然后我們還有存儲。這個量很大,因為世界上存儲量本來就很大,它是第二大計算支出。第三是用于工具使用的CPU,但我不預(yù)期CPU會占很多,大概5%左右。所以如果你要問,Grace Blackwell機柜和Vera Rubin機柜之間的全部差異,如果它增加了另外50%的機會,我認為這很可能差不多。

      這就是Grace Blackwell上市和Vera Rubin上市的根本區(qū)別:在Grace Blackwell時代,我們要解決的是推理,我們要成為推理之王;而Vera Rubin,我們解決的是這個。這就是為什么我說OpenClaw是完全變革性的,終于我們有了一個統(tǒng)一的軟件可以運行在這整個架構(gòu)上,一個開源軟件。它就是這張圖的操作系統(tǒng)。現(xiàn)在,世界上的每一家公司都可以去構(gòu)建這個了。

      問:能談?wù)勀銈內(nèi)绾问褂矛F(xiàn)金來建立業(yè)務(wù)戰(zhàn)略優(yōu)勢嗎?你們在投資生態(tài)伙伴,有組件的采購承諾,也在向股東返還現(xiàn)金。你們?nèi)绾纹胶膺@些優(yōu)先事項?

      黃仁勛:優(yōu)先事項必須這樣安排:第一,必須為我們的增長提供資金。我們與供應(yīng)鏈的合作非常緊密,我們今天與供應(yīng)鏈的關(guān)系處于良好狀態(tài)是有原因的,因為我們和他們進行非常長期的合作。我們幫助他們規(guī)劃業(yè)務(wù),把業(yè)務(wù)授予他們來支持他們的增長,我們甚至?xí)A(yù)付款項,有時甚至?xí)Y助他們擴充產(chǎn)能。我們正在為未來幾年那超過1萬億美元的需求做準備。

      第二,我們投資于我們的生態(tài)系統(tǒng),因為CUDA開發(fā)者和這個階段AI原生公司的增長非常重要。在這之后,我們?nèi)匀粫a(chǎn)生大量的自由現(xiàn)金流。這個問題我讓CFO科萊特·克雷斯(Colette Kress)來回答。

      克雷斯:隨著我們未來1萬億美元的強勁增長,這自然為我們的自由現(xiàn)金流創(chuàng)造了非常有利的局面。黃仁勛剛才也提到了一些關(guān)鍵點:首先,我們要確保供應(yīng)商以及構(gòu)建所需的一切都井然有序,這當中可能涉及一些預(yù)付款。其次是我們?nèi)栽诼男械耐顿Y承諾,這些是去年做出的,需要今年上半年完成。一旦我們把這些事情推進并落實,我們就有機會進行股票回購,把重心真正放在向股東返還資本上。這依然是我們接下來工作的重要部分。去年我們做得不錯,在向股東返還資本這件事上,今年我們也會交出出色的成績。

      關(guān)于資本返還,我們現(xiàn)在討論的情況,還沒有把那個“加號”考慮進去。如果不算那個“加號”,我們目前的計劃是:將自由現(xiàn)金流的50%用于股票回購和股息加總。這是我們現(xiàn)在的起點。但那個“加號”是真實存在的,它會給我們帶來額外的機會,讓我們有能力做得更多。至于具體的時間安排,需要考慮的是,我們今年上半年還有一些現(xiàn)有的承諾需要處理。但請保持關(guān)注。


      利潤率問題的正面回擊:

      買便宜的設(shè)備,

      還是賺更多的錢?

      問:有人認為你們從生態(tài)系統(tǒng)中獲取了太多價值,長期來看無法維持這樣的利潤率。你如何回應(yīng)這種擔憂?我知道你在網(wǎng)上也看到一些關(guān)于"必須投資生態(tài)系統(tǒng)"的評論,有些人用消極的方式解讀。你能談?wù)勀銈內(nèi)绾尉S持利潤率嗎?

      黃仁勛:首先,我昨天告訴大家的幾乎都是全新的視角。每個人都必須理解Token經(jīng)濟學(xué)。這個世界需要重新認識:計算機已經(jīng)變成了什么。如果我們能持續(xù)每年交付每瓦每秒Token數(shù)量的成倍增長,如果我們能持續(xù)通過引入新的Token細分市場,讓客戶的平均售價也成倍增長,那客戶有什么理由不繼續(xù)和我們合作?

      還有一點,我以前也說過,這在數(shù)學(xué)上絕對清晰。我會挑戰(zhàn)每一家云服務(wù)提供商的CEO,讓他們?yōu)樽约寒嫵瞿菑垐D,我會幫他們畫。然后你選你最喜歡的其他配置,無論是第三方芯片還是自研芯片,忠實地把它放進那個模型里。然后你自己決定:你是想要更高的收入,還是更低的?想要更高的平均售價,還是更低的?想要更高的利潤率,還是更低的?這才是全部的意義所在。

      臺積電的晶圓堪稱全球最貴,但其性價比同樣冠絕全球,我極其樂意為此買單。ASML的系統(tǒng)造價不菲,但絕對物超所值,這毫無爭議。所以問題很簡單:你是想賺更多錢,還是想買最便宜的設(shè)備?

      我剛才拋出的本質(zhì)上是一個前沿概念:我將計算機系統(tǒng)視作臺積電的晶圓廠,視作ASML的光刻機來對待。而在過去,人們的認知并非如此。如果我有兩個CPU,一個是256核,另一個也是256核,哪個更好?更便宜的那個更好,因為我按核租賃。但Token不是這樣創(chuàng)造的。你不是按核租賃,你是通過每秒Token數(shù)量來實現(xiàn)收益的。這是一種完全不同的經(jīng)濟模式,你不是在租核心,不是在租節(jié)點,你是在生產(chǎn)Token。這就是為什么一切都變了。

      任何散布此類言論的人,純粹是外行。他們滿腦子只想采購最廉價的設(shè)備。“我的設(shè)備便宜30%”,但這筆賬算到整座工廠頭上,究竟意味著什么?這才是觸及靈魂的拷問。如果有人跑來向你推銷“我的芯片便宜50%”,請務(wù)必將這番話置于“AI工廠”的宏大語境下審視,這番說辭恰恰暴露了他對AI的一竅不通。

      問:你昨天幾次提到,預(yù)計到2027年產(chǎn)能都會緊張。能詳細說明一下你具體在哪里看到這些短缺嗎?另外,你稱自己為“首席收入破壞者”,微軟CEO薩蒂亞·納德拉也評論過說不想過度依賴某一代產(chǎn)品,因為知道很快就會有下一代。這種行為是微軟獨有的嗎?這些限制是否反而保護了您的其他客戶?還是說他們也持有類似的心態(tài)?

      黃仁勛:納德拉也會告訴你這話是誰跟他說的,是我告訴他的:買你今年需要的,因為明年會有更好的。我不希望你們過于細致地揣測我們的用詞。

      世界在某種程度上是否供應(yīng)緊張?是的。我們可以達成共識,說相反的話反而奇怪。世界上汽車緊張嗎?你看到汽車了,但如果我把需求提高三倍呢?一切都某種程度上是緊張的,這完全取決于具體情況。

      因為我們建設(shè)的規(guī)模如此之大,我們的生活并不簡單。我們正在多個維度上與多個供應(yīng)商合作,確保一切和諧運轉(zhuǎn)。不能太多,不能太少,要能夠滿足我們的需求甚至更多。我們想要滿足需求甚至更多,是因為未來21個月總有新需求出現(xiàn)。我還有很多新需求要來,所以我必須為此做好準備。這里有各種各樣的參數(shù),并不簡單。如果我告訴你們我們在某個特定項目上供應(yīng)緊張,那我知道你們接下來會做什么了。

      所以我認為系統(tǒng)是和諧的:沒有太多,也沒有太少。我們沒有太多電力,也沒有太少電力。我們沒有太多建筑工人,也沒有太多水管工。我們沒有太多電纜,也沒有太少光模塊。就是剛好差不多。我們會每天努力維持這種平衡。但那一萬億美元訂單,我們是可以滿足的。

      問:我收到了很多關(guān)于昨天演示的問題:CPO從哪里開始,銅纜到哪里結(jié)束?你概述了NVLink 576,有一張幻燈片上還有NVLink 1152。所以我很好奇你目前關(guān)于同時提供這兩者的想法,以及隨著我們擴展到Vera Rubin Ultra,這會如何演變?

      黃仁勛:首先,請善待我的合作伙伴們,他們都做得很好。我這里說的任何話都不意味著他們的業(yè)務(wù)會走向另一條路,他們所有的業(yè)務(wù)都會因為我們而增長。我們會讓銅纜業(yè)務(wù)增長,也會讓光模塊業(yè)務(wù)大幅增長。我說的有沒有完全合乎邏輯?答案是肯定的。讓我告訴你為什么。

      我們應(yīng)該盡可能用銅纜擴展,能撐多遠就撐多遠。但在一米左右,銅纜有其物理極限。你們已經(jīng)看到我們從NVLink 72發(fā)展到現(xiàn)在的Rubin Ultra NVLink 144,背板設(shè)計就是為了支持這一點。我們會繼續(xù)研究,如果能從144擴展到288,我們非常樂意這么做,因為你應(yīng)該盡可能使用銅纜。銅纜更容易制造,更可靠,人類制造和使用銅纜已經(jīng)很長時間了。

      這道理好比呼吸空氣:只要條件允許,你就應(yīng)該大口呼吸自然空氣,直到氧氣耗盡。在那之后,你或許不得不依靠壓縮液態(tài)空氣續(xù)命。但在此之前,自然空氣不僅免費,而且極其安全。

      所以第一原則是:盡可能用銅纜擴展。如你們所知,我們也把以太網(wǎng)帶到了結(jié)構(gòu)化電纜背板,這是增量的增長機會。我們要把以太網(wǎng)的背板變成這些脊柱,因為這些結(jié)構(gòu)化電纜非常容易使用。現(xiàn)在我們掌握了如何制造和使用的技術(shù),我們可以創(chuàng)造這些東西,使其容易維護,容易運輸,容易布線,不會出錯。

      然而,同時我們想擴展到72以上,到144,到1152,甚至未來可能更遠。銅纜能走多遠是有限度的。所以你可以看到這樣的演進路徑:目前是100%銅纜。下一代Ultra會有兩個選擇:你可以用銅纜,或者銅纜加CPO。這是從現(xiàn)在起一年后。兩年后,到1152,就全是CPO了,因為銅纜的物理距離極限到了。所以會有一個自然的過渡。

      但即使當NVLink變成了CPO,Spectrum X也變成了CPO,我們在機架上的以太網(wǎng)scale-up仍然會使用銅纜,我們的存儲也仍然會使用銅纜。因為我們有五個不同的機柜。所以銅纜的使用量會繼續(xù)維持在高位,因為即使scale-up在兩三年后轉(zhuǎn)向CPO,隨著所有其他機柜的需求和總產(chǎn)能持續(xù)增長,銅纜連接器的總消耗量也會持續(xù)增長。


      細分市場的終局猜想:

      法拉利沒有免費版,

      Token也一樣

      問:你之前談到Token成本,聽到高端占25%非常有幫助。你如何看待市場隨時間演變,低端或免費層與高端層的增長率會如何?在一個以Token成本大幅下降為前提的市場中,你認為這一趨勢會如何發(fā)展?是否會開始放緩或趨于平緩?

      黃仁勛:Token成本會持續(xù)下降,每年都在下降。從Grace Blackwell到Rubin,Token成本會再次下降,Rubin Ultra還會繼續(xù)下降。與此同時,每個Token背后的智能程度,會隨著我們把那條曲線向右推而持續(xù)上升。同時,我們會不斷提高吞吐量。

      這一切都繞不開一個核心命題:任何人都不應(yīng)盲目盯著“每秒Token數(shù)”看,你必須始終將其與功耗相除進行歸一化。邏輯很簡單,你的數(shù)據(jù)中心容量存在物理天花板。你的數(shù)據(jù)中心是一個吉瓦,你不會有第二個;如果是200兆瓦,你也不會有第三個。所以你必須始終將其歸一化到功耗。否則,你無法比較任何架構(gòu)。摩爾定律也總是要除以某個東西。所以你必須看的是:每瓦每秒Token數(shù)。任何向你兜售其他衡量標準的人,要么是AI門外漢,要么就是心懷鬼胎。這正是SemiAnalysis(半導(dǎo)體研究機構(gòu))之所以能看透本質(zhì)的原因,一切指標都必須歸一化至單位功耗。

      我們將不斷提高吞吐量。所以無論Token價格是多少,無論平均售價是多少,我們都在提高吞吐量。同時,無論那個細分市場是什么,我們都在降低成本。下端基本上是你們的細分產(chǎn)品市場,那是吞吐量、產(chǎn)量、成本的問題。這就是為什么這兩條曲線如此重要。現(xiàn)在我把這兩條曲線結(jié)合在一起,這條曲線本質(zhì)上就是帕累托前沿。

      目前世界大部分地區(qū)還在這里,這是Hopper的世界。Blackwell把它擴展了,并增加了一些新的細分市場。這非常有價值,因為這里和這里的平均售價差異可能達到5倍、10倍,模型更大,速度更快。

      那么我如何看待需求曲線的變化?昨天我用了25%在這里,25%在這里,25%在那里,25%在另一邊。但一個制造商的不同產(chǎn)品細分市場的分布,完全取決于具體情況。法拉利全是高端,沒有免費層;而其他品牌則完全不同。我認為這里也一樣。

      如果你的業(yè)務(wù)是搜索,你主要會在免費層,因為沒人會為搜索付費。如果你是代碼生成、智能體代碼,你會大量集中在這里。如果你的客戶是企業(yè)員工,平均工資可能是5萬或7萬美元,你可能在這里,你希望你的產(chǎn)品定價也在相應(yīng)的位置。這取決于你的客戶、你為他們做的工作,以及競爭格局。AI Token是一種產(chǎn)品,一種新商品,它會以這種方式被營銷。不同的供應(yīng)商、不同的品牌、不同的目標市場,會有完全不同的形狀分布。我昨天只是隨便選了一個平均分布做示例。

      問:你認為未來哪個細分市場增長更快?

      黃仁勛:目前它們都會增長得非常快,都在呈指數(shù)級增長。我們還處在開始階段,增長率是被一個很小的基數(shù)相除后得到的結(jié)果。

      問:我們的實地調(diào)研告訴我們,AI工程師對狀態(tài)空間模型感到興奮,因為它們解決了內(nèi)存需求問題。在主題演講中,你展示了NeMotron 3在頂級模型中的基準測試,我相信那是一個混合了混合專家和狀態(tài)空間的模型。智能體AI是否創(chuàng)造了對新AI模型的需求?這就是你通過NeMotron和混合模型所做的嗎?狀態(tài)空間為NeMotron 3帶來了什么,是純混合專家模型沒有的?如果發(fā)生向新型AI模型的轉(zhuǎn)變,這對Nvidia的競爭環(huán)境有何影響?

      黃仁勛:我們運行所有AI模型,無論是純Transformer、離散Token、連續(xù)模型、擴散模型、狀態(tài)空間模型,還是混合模型。我們架構(gòu)的美妙之處在于,它能處理所有模型。舉個例子,Groq做不了擴散模型,但我們什么都能做。我之所以拿Groq開玩笑,絕非刻意針對,畢竟它現(xiàn)在已歸我麾下。只是客觀而言,每種架構(gòu)都各有其主戰(zhàn)場。

      英偉達之所以如此全能,之所以被如此廣泛地自由使用,是因為無論你的研究科學(xué)家明天想出什么創(chuàng)新,我向你保證:它在CUDA上會運行得很好。原因很簡單,我們擁有執(zhí)行所有這些任務(wù)所需的所有計算元素。

      NeMotron 3的設(shè)計初衷,是為了讓你能夠處理極長的上下文。將來,你與你的AI的對話,希望能持續(xù)你的一生。所以問題來了:如何處理上下文?如何處理相關(guān)的對話記憶?一方面,如果你記住了所有東西,隨著時間的推移,我們談?wù)撨^很多事情,當記憶太多時,你該調(diào)用哪個版本?可能會變得混亂。這些都是研究的前沿領(lǐng)域。

      但我認為,混合架構(gòu)將是一件非常重要的事情。因為它允許你處理極長的上下文,而不必遭受計算量二次爆炸的痛苦。這就是我們發(fā)明它的原因。我們把它開源,希望每個人都能使用它。它的目的就是推動AI進步,而不是與任何人競爭。我們只是想推動AI向前發(fā)展。

      問:我想試著理解你下游的AI市場目前有多集中,以及未來會如何演變。你那張圖顯示60%是超大規(guī)模企業(yè)。但我感覺另外40%里,大部分是二級云提供商,而他們中的很多人實際上是在把產(chǎn)能轉(zhuǎn)售或租賃給超大規(guī)模企業(yè)或前沿實驗室。所以如果把超大規(guī)模企業(yè)和前沿實驗室合在一起,可能80%的實際基礎(chǔ)設(shè)施使用者都在里面了。而這些模型,比如Anthropic的模型、OpenAI的模型,似乎只有極少數(shù)真正處在最前沿。你認為這是對今天情況的準確描述嗎?你如何看待這種情況的演變?這對價值鏈上的賺錢能力、發(fā)展方向以及AI的進一步加速意味著什么?

      黃仁勛:我會把它拆成三個維度來看。

      第一個維度是:最終運行的是什么模型?我之前說過,OpenAI是最大的,第二大類是所有開放模型的總和,絕對穩(wěn)居第二,第三是Anthropic,然后依次往下排。長尾其實相當長。所以如果你看模型消費的世界,哪怕只看語言模型,也應(yīng)該這樣思考。我們運行所有這些模型,我們參與其中每一個。

      在這個模型的子維度里,你還必須加上物理AI模型,也就是機器人技術(shù)。你看到的所有機器人,它們運行的是視覺模型、語言模型、動作模型。這些和純語言模型完全不同。舉個例子,控制電機是連續(xù)的,不是離散的“點、點、點”;物理世界是連續(xù)的,生物學(xué)里的基因組遵循的是幾何規(guī)律。所以有很多不同類型的模型。但重點是,你首先要搞清楚正在運行的是哪些類型的模型,這有助于你思考如何開展業(yè)務(wù)。

      第二個維度是:根據(jù)公司的結(jié)構(gòu)、意圖或利益,計算的位置在哪里?他們是想要自研芯片的公司,那我們必須和他們競爭?他們是想要在自己的云里托管Nvidia客戶的公司,顯然CUDA只在Nvidia上運行?他們是像NCPs這樣的公司,他們不能只買芯片,他們真的需要買系統(tǒng),所以他們是真正的基礎(chǔ)設(shè)施客戶?還是那些想要本地部署的公司?因此,我們的分銷渠道需要通過戴爾、惠普和聯(lián)想,因為必須整合一大堆其他企業(yè)計算組件,而戴爾和惠普不自研芯片。或者是在邊緣,也許是無線網(wǎng)絡(luò)、機器人系統(tǒng)、自動駕駛汽車,甚至是衛(wèi)星?現(xiàn)在你得決定計算在哪里進行。

      當你把這些全部細分完之后,再回到我展示的那張60/40圖。在那40%里,他們本質(zhì)上需要的是計算平臺。不管他們運行什么模型,可能是OpenAI的模型,可能是Anthropic的模型,Nvidia支持機密計算,這讓OpenAI和Anthropic有可能在右側(cè)那部分運行。那一邊,他們想要完整的平臺,想要機密計算,想要在世界不同地方部署計算機,而不僅僅是在云里。

      即使在云里,我們也和那60%CSP圖中的某一部分存在競爭關(guān)系,但我們也把客戶帶到另一部分。所以在那60%的CSP圖里,有一部分我們必須競爭。我們的工作就是比世界上任何人都更好地交付那張圖的價值,我們做得非常好,實際上我們的地位還在日益增強。而在另一部分,我們把客戶帶給他們,他們只有感激。

      我把所有這些維度壓縮成兩個餅圖。你可以用這個壓縮后的圖來檢驗:他們是否設(shè)計自己的芯片?我們是否在芯片層面和他們競爭?我不認為OCI會設(shè)計自己的芯片,我認為他們這樣做不明智。顯然Coreweave也不會設(shè)計自己的芯片。所以我們在哪里競爭?我們在哪里為云服務(wù)提供商帶來客戶?他們云收入的很大一部分,顯然OCI幾乎是100%,是因為Nvidia。


      黃仁勛的組織哲學(xué):

      60個人管1萬億

      問:展望未來,12個月的創(chuàng)新飛輪是你競爭優(yōu)勢的關(guān)鍵部分。但當我看到員工人數(shù)時,增長其實非常緩慢,相對緩慢。然而,你們承擔的任務(wù)量比這增長得快得多。你如何管理這一點?如何管理這可能給業(yè)務(wù)帶來的風險?

      黃仁勛:我的直接匯報團隊有60人。我們需要60人,是因為公司的架構(gòu)就是為了交付這種產(chǎn)品架構(gòu)而設(shè)計的。組織的架構(gòu)應(yīng)該反映他們構(gòu)建的產(chǎn)品。每家公司不應(yīng)該看起來都一樣。打造法拉利與流水線生產(chǎn)福特的方式截然不同,前者是圍繞底盤調(diào)動技師,后者則是讓車輛在流水線上流轉(zhuǎn)穿梭。這完全取決于你渴望締造怎樣的結(jié)果,而組織架構(gòu)理應(yīng)成為這一愿景的映射。

      你看看我的管理團隊,構(gòu)建Vera Rubin整個工廠所需技術(shù)的每一個方面,都在那里,百分之百具備。每個人都代表一個關(guān)鍵領(lǐng)域,所有專業(yè)知識都坐在同一張桌子上,共同決策。

      第二件事是,我們有紀律去開發(fā)整個軟件棧。如果你不能把它啟用起來,你就無法每年構(gòu)建我們所構(gòu)建的東西。如果不能啟用,你怎么測試它?如果你從其他人那里拼湊新技術(shù),你怎么能做到每年啟用一次?這根本不現(xiàn)實,不可能。

      所以我們讓我們所有的芯片與平臺對齊,所有七款芯片都只有一個流片時間表。我不會拼湊每個人的流片時間表然后算出系統(tǒng)什么時候出來。系統(tǒng)需要在它該來的時候來,每個人都對齊到那個時間點。而軟件棧,我們完全擁有每一部分。存儲是我們自己開發(fā)的,網(wǎng)絡(luò)當然也是,甚至工廠操作系統(tǒng)Dynamo也是我們創(chuàng)造的。這樣我們就可以交付每一個基準測試,測試到極限,測試可靠性。

      英偉達構(gòu)建NeMotron的原因,就是為了我們能做預(yù)訓(xùn)練、后訓(xùn)練,現(xiàn)在還能做推理。我們擁有所有的軟件,這樣我們就可以每年啟用所有的系統(tǒng),這基本上意味著你一直在啟用。

      如果你不擁有所有東西,你毫無機會,是絕對的零概率事件。人們談?wù)撍麄兊男翯PU,但他們的scale-up結(jié)構(gòu)從哪里來?那要怎么工作?我們之前討論的那個完整的智能體系統(tǒng),就是未來的計算機。所以我們公司的組織、公司的使命、公司的能力,都與我向市場交付承諾的目標完全一致。這就是為什么我們能持續(xù)做到。

      區(qū)區(qū)一張PPT是絕對造不出那套系統(tǒng)的。僅憑一張畫著兩根柱狀圖的幻燈片,也絕無可能忽悠別人砸給你500億美元。當你真正將其全面工程化,并在數(shù)據(jù)中心內(nèi)部成功落地時,我們早已遙遙領(lǐng)先了兩個身位。這正是我們倒逼整個行業(yè)滾滾向前的獨特模式,一條鋪滿荊棘的極難之路。我們之所以能披荊斬棘,全憑我剛才詳述的種種底蘊。

      我們的每一個系統(tǒng)都與CUDA兼容,所以第一天,昨天的軟件就能完美地在今天的系統(tǒng)上運行。我擁有所有的scale-up交換機、所有的scale-out交換機、所有的軟件。第一天,我把昨天的軟件放到新系統(tǒng)上。如果它不工作,那還有什么意義?然后一旦我們啟用了所有東西,因為我們擁有整個軟件棧,我們就可以把它推向極限。擁有CUDA兼容性,我們有這個叫DOCA的兼容層。我們擁有所有的編譯器,我們擁有所有的軟件棧,這非常非常重要。你不能把這外包給別人。別人為你構(gòu)建芯片,但他們不會為你啟用系統(tǒng),不會為你做驗證。


      99%的算力應(yīng)該用在推理上

      問:這次活動上我們談了很多關(guān)于推理的內(nèi)容。我希望你能花幾分鐘談?wù)動?xùn)練。你認為計算強度會如何增長?未來幾年,驅(qū)動因素是什么?仍然是越來越大的模型,還是你看到地平線上有其他東西?如果從三到五年的角度來看,你對訓(xùn)練與推理在計算需求上的比例有何看法?

      黃仁勛:訓(xùn)練已經(jīng)從預(yù)訓(xùn)練發(fā)展到了后訓(xùn)練階段。

      預(yù)訓(xùn)練的本質(zhì)是記憶和泛化。你記憶得越多,泛化能力就越強,你擁有的基礎(chǔ)就越好。有了這個基礎(chǔ),也就是預(yù)訓(xùn)練模型,它有點像AI的幼兒園,或者更準確地說,是AI的高中,它掌握了基本的詞匯、語法,甚至隱含了很多推理能力。這樣當我教它新技能時,它才能理解我在說什么。如果你連我的意思都聽不懂,怎么可能去執(zhí)行任務(wù)?所以預(yù)訓(xùn)練做的就是這件事。

      后訓(xùn)練則是教模型各種各樣的技能:強化學(xué)習(xí)、帶可執(zhí)行基礎(chǔ)的強化學(xué)習(xí)、帶可驗證反饋的強化學(xué)習(xí)、面向批處理的強化學(xué)習(xí)技術(shù)、工具使用,無論是基于結(jié)構(gòu)的API,還是非結(jié)構(gòu)化的工具使用。領(lǐng)域太多了。這部分的計算強度,我猜可能比預(yù)訓(xùn)練大一百萬倍。我可能差個1.2倍,但肯定是非常大的量級。原因是有太多技能需要學(xué)習(xí),而所有這些技能的學(xué)習(xí)周期都非常非常長。所以模型必須變得越來越大。當你把這些技能都掌握之后,你生成的大量合成數(shù)據(jù),其中一部分又會回流到下一輪的預(yù)訓(xùn)練中。

      因此,過去的預(yù)訓(xùn)練皆以互聯(lián)網(wǎng)數(shù)據(jù)為起點,當下的預(yù)訓(xùn)練依然以此為主力。但假以時日,再歷經(jīng)幾代迭代,合成數(shù)據(jù)將全面接管預(yù)訓(xùn)練的半壁江山。同時,你還在增加多模態(tài)能力,增加運動能力,讓模型能夠在物理世界中長時間執(zhí)行動作。因為有很多常識是與認知邏輯相關(guān)的,如果你能在物理世界中互動,即使在抽象世界中,你也能更容易地處理那個概念,因為你擁有了在物理世界中接地的經(jīng)驗。

      請注意我剛才描述的計算量。我們未來所需的訓(xùn)練計算量是百萬倍、十億倍級別的,再加上持續(xù)學(xué)習(xí)。幾乎每個人的模型都會被最后訓(xùn)練、被微調(diào),以便它也能為每個人做記憶和泛化。所以在未來,推理從哪里開始、從哪里結(jié)束,訓(xùn)練從哪里開始、從哪里結(jié)束,會變得越來越模糊。你什么時候在學(xué)習(xí),什么時候在應(yīng)用你的智慧?對大多數(shù)人來說,現(xiàn)在是持續(xù)不斷的。

      至于推理與訓(xùn)練的比例,我的希望是:世界上99%的計算都用于推理。因為推理環(huán)節(jié),才是我們將生成的Token兌現(xiàn)為真金白銀的變現(xiàn)場。世界上沒人會為你的學(xué)習(xí)過程買單,也沒人會替你的訓(xùn)練成本掏錢,你必須自掏腰包搞訓(xùn)練,而真正能榨出商業(yè)價值的,唯有推理。我希望這個世界能夠把這些Token用于有價值的成果:醫(yī)療保健、制造業(yè)、金融服務(wù)、工程等等。我們希望未來99%的Token都用于產(chǎn)生經(jīng)濟效益,而AI模型則在不斷學(xué)習(xí)。

      有一個很好的理由可以解釋為什么Nvidia去年全力以赴投入推理,因為我們看到了這個未來:推理和訓(xùn)練、預(yù)訓(xùn)練和學(xué)習(xí),所有這些都只是一個大的連續(xù)統(tǒng)一體。不妨回味一下兩年前坊間流傳的論調(diào):“英偉達確實擅長訓(xùn)練,但推理簡直是小菜一碟,阿貓阿狗的公司都能做。”諸位還記得嗎?時至今日,真相大白,推理簡直難如登天。端詳一下這張圖表,它難到了極點,且未來將呈地獄級難度遞增。推理的本質(zhì)就是深度思考、硬核工作、真刀真槍地干活。這種苦差事,怎么可能“容易”?

      所以我認為人們完全把它搞反了,他們只是想編造故事來合理化他們自己的機會,這沒問題。但你得從第一性原理來推理。我花很長時間回答你們的問題,而不是用一個高度篩選、精心選擇、精準調(diào)整動詞和名詞的簡短回答,是因為我希望你們學(xué)會如何通過這些來推理。這樣當你們自己看到某些說法時,你會想“不,那沒道理”或者“那有道理”。因為你們是分析師,你們需要能夠理解這些事情。

      ——社群推薦——

      與前沿大腦同步在線,讓思維時刻領(lǐng)先。

      歡迎掃描下方二維碼,加入你的科技同行圈。

      —— END ——

      排版 | 北北 審核 | 北辰

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      中央定調(diào),2026年養(yǎng)老金調(diào)整方式或有變,取消工齡掛鉤可行嗎?

      中央定調(diào),2026年養(yǎng)老金調(diào)整方式或有變,取消工齡掛鉤可行嗎?

      另子維愛讀史
      2026-03-21 18:39:50
      不是李夢!馳援女籃世界杯第1人或是她,21歲前鋒,有望取代功勛

      不是李夢!馳援女籃世界杯第1人或是她,21歲前鋒,有望取代功勛

      萌蘭聊個球
      2026-03-21 09:52:17
      雷軍:續(xù)航達到902公里,只用96.3度電;王興興、何小鵬、王傳福現(xiàn)身新一代SU7發(fā)布會

      雷軍:續(xù)航達到902公里,只用96.3度電;王興興、何小鵬、王傳福現(xiàn)身新一代SU7發(fā)布會

      大風新聞
      2026-03-19 20:15:21
      伊朗戰(zhàn)爭最黑暗的終局正在襲來

      伊朗戰(zhàn)爭最黑暗的終局正在襲來

      荷蘭豆愛健康
      2026-03-21 08:27:54
      我不太相信內(nèi)塔尼亞胡了!摧毀伊朗海軍里海艦隊,炸翻俄羅斯記者

      我不太相信內(nèi)塔尼亞胡了!摧毀伊朗海軍里海艦隊,炸翻俄羅斯記者

      鷹眼Defence
      2026-03-20 18:10:24
      獨立百年的蒙古國,正在把中國人40年的努力悄悄毀掉

      獨立百年的蒙古國,正在把中國人40年的努力悄悄毀掉

      犀利辣椒
      2026-03-19 06:40:31
      比輸球更絕望!利物浦核心崩盤,賽后一句話讓球迷破防

      比輸球更絕望!利物浦核心崩盤,賽后一句話讓球迷破防

      瀾歸序
      2026-03-22 02:03:45
      中紀委:四川醫(yī)療系統(tǒng)500余位“一把手”被查處!

      中紀委:四川醫(yī)療系統(tǒng)500余位“一把手”被查處!

      梅斯醫(yī)學(xué)
      2026-03-21 07:53:46
      五常驅(qū)逐艦對比:美國71艘,俄羅斯剩6艘,中國把英法甩得看不見

      五常驅(qū)逐艦對比:美國71艘,俄羅斯剩6艘,中國把英法甩得看不見

      起喜電影
      2026-03-22 05:29:32
      一男子失業(yè)拿了50萬賠償回村里,逢人說欠了30萬外債,誰料第二天叔伯兄弟,都上門來“送溫暖”了

      一男子失業(yè)拿了50萬賠償回村里,逢人說欠了30萬外債,誰料第二天叔伯兄弟,都上門來“送溫暖”了

      不二大叔
      2026-03-19 21:29:20
      李干杰在云南調(diào)研

      李干杰在云南調(diào)研

      國家民委
      2026-03-21 18:06:45
      趙心童請客鬧烏龍?江西菜館點兩份烤鴨,這波招待太真實!

      趙心童請客鬧烏龍?江西菜館點兩份烤鴨,這波招待太真實!

      草莓解說體育
      2026-03-22 02:48:45
      完成CBA首秀,吳澤昊:感覺沒有想象的緊張,給自己表現(xiàn)打六分

      完成CBA首秀,吳澤昊:感覺沒有想象的緊張,給自己表現(xiàn)打六分

      懂球帝
      2026-03-21 22:08:26
      “我是小偷,快來抓我!”男子盜竊后連發(fā)42條視頻和圖片挑釁民警,還要開直播……在杭州一酒店內(nèi)被抓

      “我是小偷,快來抓我!”男子盜竊后連發(fā)42條視頻和圖片挑釁民警,還要開直播……在杭州一酒店內(nèi)被抓

      都市快報橙柿互動
      2026-03-21 17:39:49
      玉昆4-0大勝泰山,喬迪一針見血點評比賽原因

      玉昆4-0大勝泰山,喬迪一針見血點評比賽原因

      民哥臺球解說
      2026-03-22 01:38:34
      為什么國家衛(wèi)健委不建立一個統(tǒng)一電子病歷系統(tǒng)?網(wǎng)友回答真相了!

      為什么國家衛(wèi)健委不建立一個統(tǒng)一電子病歷系統(tǒng)?網(wǎng)友回答真相了!

      另子維愛讀史
      2026-03-20 19:19:48
      國際觀察丨步步驚心!軍事專家推演美軍奪取哈爾克島的三種可能

      國際觀察丨步步驚心!軍事專家推演美軍奪取哈爾克島的三種可能

      環(huán)球網(wǎng)資訊
      2026-03-21 19:10:34
      加州州長選舉:共和黨民調(diào)超民主黨

      加州州長選舉:共和黨民調(diào)超民主黨

      奇思妙想生活家
      2026-03-21 15:08:43
      讓韓佳人驚嘆的中國網(wǎng)紅美貌:萬幸我出道早…

      讓韓佳人驚嘆的中國網(wǎng)紅美貌:萬幸我出道早…

      奮斗在韓國
      2026-03-20 14:44:59
      《寒戰(zhàn)1994》炸場!周潤發(fā)郭富城領(lǐng)銜,英國演員直接演主線

      《寒戰(zhàn)1994》炸場!周潤發(fā)郭富城領(lǐng)銜,英國演員直接演主線

      草莓解說體育
      2026-03-22 06:07:17
      2026-03-22 06:43:00
      星海情報局 incentive-icons
      星海情報局
      關(guān)注“中國制造”的星辰大海
      1195文章數(shù) 2019關(guān)注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細節(jié)披露

      頭條要聞

      伊朗發(fā)射3800公里射程的導(dǎo)彈 最令美軍戰(zhàn)栗的細節(jié)披露

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      田栩?qū)幗K于涼了?出軌風波影響惡劣

      財經(jīng)要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態(tài)度原創(chuàng)

      數(shù)碼
      家居
      親子
      健康
      軍事航空

      數(shù)碼要聞

      炸鍋!國產(chǎn)存儲芯片再突破!手機固態(tài)價格大跳水,內(nèi)存自由要來了

      家居要聞

      時空交織 空間綺夢

      親子要聞

      帶娃寶媽用什么素顏霜,快速提氣色不用卸妝?

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      軍事要聞

      特朗普:正考慮逐步降級對伊朗的軍事行動

      無障礙瀏覽 進入關(guān)懷版