來源:華夏基石e洞察
![]()
4月15日,英偉達CEO黃仁勛接受播客主持人Dwarkesh Patel的深度訪談,就英偉達如何掌控日益緊張的先進芯片供應鏈?TPU能否打破英偉達在AI計算領域的壟斷地位?為什么英偉達不成為超大規模數據中心運營商?美國是否應該向中國出售 AI 芯片?為什么英偉達不生產多種不同的芯片架構?等熱點話題,做了詳細的解答。
在談到中國市場上,黃仁勛指出,中國擁有豐富的能源、大量的芯片以及絕大多數的人工智能研究人員,把中國變成敵人,可能并非最佳方案,開展對話和研究性對話或許是最穩妥的做法。如果建立兩個生態系統——一個是只能運行在外國技術棧上的開源生態系統,另一個是運行在美國技術棧上的封閉生態系統——那將是極其愚蠢的。“我認為這對美國來說將是一個糟糕的結果。”
黃仁勛表示,中國的計算能力非常龐大。“如果他們想整合計算資源,完全可以滿足需求。黃仁勛講到了他所提出的AI五層蛋糕的說法,“人工智能的本質就像一個五層蛋糕,最底層是能源。能源充足時,芯片就足夠了;芯片充足時,能源就足夠了。例如,美國能源匱乏,這就是為什么英偉達必須不斷改進我們的架構,并進行這種極致的協同設計。但如果你的瓦數完全充足,而且是免費的,你又何必在意每瓦性能呢?你已經綽綽有余了。你可以用舊芯片來做。所以7nm芯片已經足夠好了,充足的能源是中國的優勢。”
黃仁勛指出,中國擁有世界上最頂尖的AI研究人員,由于計算能力有限,反而創造出了極其智能的算法。“我們必須承認,人工智能的大部分進步都源于算法的進步,而不僅僅是硬件的改進。既然大部分進步都來自算法、計算機科學和編程,那么他們龐大的人工智能研究人員隊伍難道不是他們最根本的優勢嗎?我們都看到了這一點。DeepSeek 絕非無關緊要的進步。如果DeepSeek先在華為平臺上發布,那對我們國家來說將是災難性的。”
以下為訪談全文:
英偉達最大的護城河是其對稀缺供應鏈的控制嗎?
Q:我們已經看到許多軟件公司的估值暴跌,因為人們預期人工智能會使軟件商品化。有一種可能過于天真的想法是:你看,英偉達把GDS2文件發給臺積電。臺積電制造邏輯芯片,制造交換機芯片,然后將它們與SK海力士、美光和三星生產的HBM內存封裝在一起。之后,臺積電將封裝好的芯片發給臺灣的ODM廠商,由他們組裝成機架。從本質上講,英偉達制造的是其他人制造的軟件,如果軟件商品化了,英偉達也會商品化嗎?
黃仁勛:最終,總得有某種機制將電子轉化為tokens。將電子轉化為tokens,并隨著時間的推移提升這些tokens的價值,這很難完全商品化。從電子到tokens的轉化是一個不可思議的旅程。制造tokens就像讓一個分子比另一個分子更有價值,讓一個tokens比另一個更有價值。顯然,我們正在實時見證著tokens價值的提升,其中蘊含著大量的藝術、工程、科學和發明創造。這種轉化、制造以及所有相關的科學原理,我們遠未被完全理解,這段旅程也遠未結束。我懷疑它最終能否實現。
我們當然會提高效率。你提出的問題正是我對我們公司的理解。輸入是電子,輸出是tokens。英偉達位于中間。我們的工作是在必要范圍內盡可能少地干預,從而以驚人的能力實現這種轉型。我所說的“盡可能少地干預”,是指任何我不需要親自完成的事情,我都會與其他合作伙伴一起,將其納入我的生態系統。
如果你看看今天的英偉達,我們可能擁有規模最大的合作伙伴生態系統,涵蓋供應鏈的上下游,包括所有計算機公司、應用開發商和模型構建者。人工智能就像一個五層蛋糕,我們的生態系統遍布所有五個層面。我們盡量少做,但事實證明,我們必須做的那部分工作極其困難。我認為這部分工作無法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)
事實上,我也不認為企業軟件公司、工具制造商……如今大多數軟件公司都是工具制造商。當然,也有一些公司不是,它們開發的是工作流程編碼系統。但對很多公司來說,它們確實是工具制造商。例如,Excel 是工具,PowerPoint 是工具,Cadence開發工具,Synopsys也開發工具。實際上,我看到的恰恰與人們的看法相反。我認為代理的數量和工具用戶的數量都將呈指數級增長。所有這些工具的實例數量很可能會激增。
Synopsys Design Compiler的實例數量很可能會激增,使用平面規劃器、布局工具和設計規則檢查器的代理數量也會隨之大幅增長。如今,我們受限于工程師的數量。未來,這些工程師將得到大量agent的支持。我們將以前所未有的方式探索設計空間,并繼續使用我們今天使用的工具。
我認為工具的使用將推動軟件公司蓬勃發展。之所以目前還沒有出現這種情況,是因為agents還不擅長使用這些工具。要么這些公司會自行開發代理商,要么agents會變得足夠熟練,能夠使用這些工具。我認為最終會是兩者的結合。
Q:在你們最新的文件中,你們與代工廠、內存和封裝廠商簽訂了近1000億美元的采購承諾。SemiAnalysis報道稱,你們這類采購承諾的總額將達到2500億美元。一種解讀是,英偉達的護城河實際上在于你們鎖定了未來幾年這些稀缺組件的供應。其他廠商或許擁有加速器,但他們真的能獲得所需的內存嗎?他們真的能獲得所需的邏輯芯片嗎?這真的是英偉達未來幾年最大的護城河嗎?
黃仁勛:這是我們能做到而別人很難做到的事情之一。我們在上游投入了大量資源。有些是明確的,比如你提到的這些承諾。有些則是隱性的。例如,我們供應鏈上的許多上游投資都是由他們進行的,因為我曾對各位CEO說:“讓我告訴你們這個行業將會發展到多大的規模,讓我解釋一下原因,讓我和你們一起分析,讓我向你們展示我所看到的。”
通過與上游各行各業的CEO們溝通、啟發和協調,他們才愿意進行投資。為什么他們愿意為我而不是為其他人投資呢?原因在于,他們知道我有能力購買他們的產品,并通過我的下游渠道銷售。事實上,英偉達的下游供應鏈和我們的下游需求都非常龐大,因此他們愿意進行上游投資。
如果你看看GTC大會,人們都會驚嘆于它的規模和參會人員之多。它涵蓋了人工智能領域的方方面面,可謂包羅萬象。他們齊聚一堂,是因為彼此需要交流。我把他們聚集在一起,是為了讓下游企業了解上游,上游企業了解下游,讓所有人都能了解人工智能的最新進展。更重要的是,他們還能與人工智能領域的專家、正在蓬勃發展的人工智能初創公司以及所有令人驚嘆的成果見面,親眼見證我所講述的一切。我花費大量時間,直接或間接地向我們的供應鏈、合作伙伴和生態系統傳達我們面前的機遇。
有些人總是說:“Jensen,大多數主題演講都是一個接一個的公告。”但我們的主題演講總會有一部分內容讓人感覺有點“折磨”,因為它幾乎像是在進行教育。事實上,這正是我所關注的。我需要確保整個供應鏈,從上到下,整個生態系統,都了解即將發生的事情,它為什么會發生,何時發生,規模有多大,并且能夠像我一樣系統地思考和分析它。
關于您所描述的護城河,我們有能力為未來做好準備。如果未來幾年我們的規模達到萬億美元,我們擁有相應的供應鏈。如果沒有我們的影響力,我們業務的發展速度……就像現金流、供應鏈和客戶流失一樣,如果業務流失率很低,沒有人會為一個架構構建供應鏈。我們之所以能夠維持如此龐大的規模,完全是因為下游需求巨大。他們看到了這一點,聽到了相關信息,預見到了這一切。這使我們能夠以如此大的規模去做我們能夠做的事情。
Q:我確實想更具體地了解上游能否跟上步伐。多年來,你們的收入每年都翻一番。你們提供給全球的Flops數每年都增長三倍以上。
黃仁勛:現在以這種規模翻倍真的太不可思議了。
Q:沒錯。但你再看看邏輯。你是臺積電N3工藝節點的最大客戶,也是N2工藝節點的最大客戶之一。今年人工智能整體將占N3工藝節點的60%,根據SemiAnalysis的預測,明年將達到86%。如果你已經占據了大部分市場份額,如何才能實現翻番?又該如何逐年實現這一目標?我們現在是否正處于一個由于上游工藝的限制,人工智能計算增長速度不得不放緩的階段?你認為有什么辦法可以解決這個問題?最終,我們如何才能實現每年兩倍的晶圓廠建設量?
黃仁勛:在某種程度上,瞬時需求大于全球上下游的供應。在任何時刻,我們都可能面臨plumbers數量不足的限制,而這種情況實際上也時有發生。
Q:plumbers受邀參加明年的GTC大會。
黃仁勛:順便說一句,這主意不錯。但這只是個好條件。你想要的是一個瞬時需求大于行業總供給的行業。反之則顯然不好。如果我們之間的距離太遠,如果某個特定組件的供應量太少,整個行業就會蜂擁而至。例如,你會發現現在人們很少再談論CoWoS了。
原因在于,過去兩年我們全力以赴,實現了超負荷的產能擴張。我們連續數次加倍,每次都翻倍。現在我認為我們形勢相當不錯。臺積電現在也意識到,CoWoS的供應必須跟上邏輯電路和存儲器的需求。他們正以與邏輯電路相同的速度擴展CoWoS和未來的封裝技術。這非常棒,因為長期以來,CoWoS和HBM存儲器都屬于小眾技術。但現在它們不再是小眾技術了。人們現在意識到它們已經成為主流的計算技術。
當然,我們現在更有能力影響供應鏈的更大范圍。在人工智能革命之初,我五年前就說過現在我說的這些話。有些人相信它并進行了投資,例如Sanjay和美光團隊。我仍然清楚地記得那次會議,會上我清楚地闡述了將會發生什么、為什么會發生以及今天的預測。他們確實加倍投入。我們在LPDDR和HBM內存領域與他們展開了合作,他們也確實投入了大量資金。這顯然對公司產生了巨大的影響。有些人加入得晚一些,但現在他們都在這里了。
這些瓶頸問題都受到了高度重視。現在,我們正在提前數年預先解決這些瓶頸問題。例如,過去幾年我們對Lumentum 、Coherent以及硅光子生態系統的投資,真正重塑了供應鏈。我們圍繞臺積電構建了一條完整的供應鏈。我們與他們合作開發了COUPE 項目,發明了大量技術,并將這些專利授權給供應鏈,以保持其開放性和高效性。
我們正在通過發明新技術、新工作流程、新型測試設備(例如雙面探針測試)來構建供應鏈,同時投資于相關企業并幫助它們擴大產能。可以看出,我們正努力塑造整個生態系統,使供應鏈能夠支持規模化發展。
Q:似乎有些瓶頸比其他瓶頸更容易解決。例如,擴展 CoWoS 與其他擴展方式相比。
黃仁勛:順便說一句,我碰到的是難度最高的那一個。
Q:哪個?
黃仁勛:水管工和電工。這就是我對那些描述工作終結和職業消亡的末日論者感到擔憂的原因之一。如果我們勸阻人們成為軟件工程師,我們就會面臨軟件工程師短缺的問題。十年前也出現過同樣的預測。一些末日論者告誡人們:“無論如何,千萬別當放射科醫生。”你可能還會在網上看到一些這樣的視頻,說放射科醫生將是第一個消失的職業,世界將不再需要更多的放射科醫生。猜猜我們現在缺什么?放射科醫生。
Q:回到之前關于有些東西可以規模化生產,而有些東西卻不行這一點……你究竟如何才能每年生產兩倍的邏輯電路?歸根結底,存儲器和邏輯電路的瓶頸都在于極紫外光刻(EUV)。你如何才能逐年獲得兩倍的極紫外光刻設備?
黃仁勛:這些都不是無法快速擴展的。所有這些都可以在兩三年內輕松實現。你只需要一個需求信號。一旦你能造出一個,你就能造出十個;一旦你能造出十個,你就能造出一百萬個。這些都不難復制。
Q:你會追溯到供應鏈的哪個環節?你會去找ASML說:“嘿,如果我展望三年后,英偉達的年收入達到兩萬億美元,我們需要更多的EUV光刻機”嗎?
黃仁勛:有些我必須直接說服,有些需要間接,還有一些……如果我能說服臺積電,ASML也會被說服。我們必須考慮關鍵的瓶頸。但如果臺積電被說服了,幾年后你們就會有很多EUV光刻機可用了。
我的意思是,所有瓶頸都不會持續超過兩三年,一個都不會。與此同時,我們的計算效率提高了10倍、20倍,以Hopper到Blackwell為例,甚至提高了30倍到50倍。由于CUDA的靈活性,我們不斷開發新的算法。我們正在開發各種新技術,以提高效率,同時提升產能。這些我都不擔心。真正讓我擔憂的是下游的問題。那些阻礙能源發展的能源政策……沒有能源,就無法建立任何產業。沒有能源,就無法建立一個全新的制造業。
我們希望重振美國工業。我們希望恢復芯片制造、計算機制造和封裝產業。我們希望研發電動汽車和機器人等新產品。我們希望建設人工智能工廠。所有這些都離不開能源,而且這些項目都需要很長時間。增加芯片產能,這需要兩到三年的時間。增加CoWoS產能,也需要兩到三年的時間。
Q:有意思。我感覺有時候客人會跟我說完全相反的話。這種情況下,我確實缺乏相關的專業知識來判斷。
黃仁勛:最妙的是,你是在和專家對話。
TPU能否打破英偉達在 AI 計算領域的壟斷地位?
Q:我想問問你們的競爭對手。如果你看看TPU ,可以說全球排名前三的模型中,有兩款——Claude和Gemini——都是用TPU訓練的。這對英偉達未來的發展意味著什么?
黃仁勛:我們打造的是截然不同的東西。英偉達打造的是加速計算,而不是張量處理單元。加速計算的應用范圍非常廣泛:分子動力學、量子色動力學、數據處理、數據幀、結構化數據和非結構化數據。它也用于流體動力學和粒子物理學。此外,我們還將其應用于人工智能領域。
加速計算的范疇遠比這廣泛得多。雖然人工智能是當今的熱門話題,而且顯然非常重要且影響深遠,但計算的范疇遠不止于此。英偉達徹底革新了計算方式,從通用計算轉向加速計算。我們的市場覆蓋范圍遠遠超過任何TPU或ASIC芯片所能企及的范圍。從我們的市場地位來看,我們是唯一一家能夠加速所有類型應用程序的公司。我們擁有龐大的生態系統。因此,各種框架和算法都可以在英偉達平臺上運行。
因為我們的計算機設計之初就考慮到了由他人操作,所以任何具備操作能力的人都可以購買我們的系統。而大多數自建系統則需要用戶自行操作,因為它們的設計初衷并非為了方便他人操作。由于任何人都可以操作我們的系統,因此我們的產品已部署在包括 Google、Amazon、Azure 和 OCI 在內的所有云平臺上。
如果您想以租賃方式運營,最好擁有一個涵蓋多個行業的龐大客戶生態系統,以便他們成為承購方。如果您想自行運營,我們當然有能力幫助您,就像我們之前為埃隆·馬斯克提供的 xAI 服務一樣。而且,由于我們能夠賦能任何公司和任何行業的運營者,您可以利用這項技術為禮來公司構建一臺用于科學研究和藥物研發的超級計算機。我們可以幫助他們運營自己的超級計算機,并將其用于我們所加速的各個藥物研發和生物科學領域。
我們能夠解決很多TPU無法解決的應用問題。英偉達打造CUDA的目的不僅在于使其成為一個出色的張量處理單元,它還能處理數據處理、計算、人工智能等各個生命周期。我們的市場機會更大,覆蓋范圍也更廣。因為我們現在支持全球所有應用,所以無論你在哪里構建英偉達系統,都無需擔心找不到客戶。這完全是兩碼事。
Q:這將是一個很長的問題。你們的營收非常驚人,但你們每季度600億美元的收入并非來自制藥和量子計算領域。你們之所以能做到這一點,是因為人工智能是一項前所未有的技術,而且它正以前所未有的速度發展。
那么問題就變成了:哪種方案最適合人工智能?我不太了解細節,但我跟我的人工智能研究朋友聊過,他們說:“你看,我用TPU的時候,它是一個大型的脈動陣列,非常適合做矩陣乘法,而GPU則非常靈活。當你需要處理大量分支或不規則的內存訪問時,它就非常棒。”
但人工智能究竟是什么?它不過是不斷重復進行這些非常可預測的矩陣乘法運算。你無需為線程束調度器或線程與內存庫之間的切換而犧牲任何芯片面積。而且,TPU 針對當前計算領域收入增長和應用場景的大量需求進行了優化。我想知道你對此有何看法。
黃仁勛:矩陣乘法是人工智能的重要組成部分,但并非全部。如果你想提出新的注意力機制、以不同的方式進行分解,或者發明一種全新的架構——例如混合SSM——你需要一個通用的可編程架構。如果你想創建一個融合擴散和自回歸技術的模型,你同樣需要一個通用的可編程架構。我們幾乎可以運行你所能想象的一切。這就是它的優勢所在。由于它是一個可編程系統,因此可以更輕松地發明新的算法。
人工智能之所以能如此快速發展,真正的原因在于其不斷發明新算法的能力。與其他任何事物一樣,TPU(技術處理單元)也受到摩爾定律的影響,而摩爾定律的年增長率約為25%。要想真正實現10倍甚至100倍的飛躍,唯一的辦法就是每年從根本上改變算法及其計算方式。
這就是英偉達的根本優勢。我們之所以能讓 Blackwell 的能效比 Hopper 高出 50 倍,唯一的原因是……當初我宣布 Blackwell 的能效將比 Hopper 高出 35 倍時,沒人相信。后來Dylan寫了篇文章說我故意隱瞞,但實際上能效是 Hopper 的 50 倍。單憑摩爾定律是無法實現這一點的。我們解決這個問題的方法是采用新的模型,例如MoE(模塊化執行單元),這些模型可以并行化、解耦并分布在整個計算系統中。如果沒有能力真正深入研究并利用 CUDA 開發新的內核,這一切都很難做到。
這得益于我們架構的可編程性,以及英偉達作為一家極致的協同設計公司的優勢。我們甚至可以將部分計算任務卸載到架構本身(例如NVLink )或網絡(例如Spectrum-X)中。我們可以同時對處理器、系統、架構、庫和算法進行更改。如果沒有 CUDA,我真不知道該從何入手。
Q:這引出了一個關于英偉達客戶群的有趣問題。你們60%的收入都來自五大超大規模數據中心運營商。如果換個時代,面對不同的客戶群體——比如說進行實驗的教授——他們需要CUDA。他們無法使用其他加速器。他們只需要用CUDA運行PyTorch ,并且所有功能都得到優化。
但這些超大規模數據中心運營商擁有編寫自有內核的資源。事實上,為了獲得其特定架構所需的最后 5% 的性能提升,他們必須這樣做。Anthropic 和 Google 大多運行著自己的加速器,或者使用 TPU 和Trainium 。即使是使用 GPU 的 OpenAI,也使用Triton ,因為他們需要自己的內核。甚至在 CUDA C++ 方面,他們也沒有使用cuBLAS和NCCL ,而是擁有自己的技術棧,該技術棧還可以編譯到其他加速器上。如果你的大多數客戶能夠并且確實找到了 CUDA 的替代方案,那么 CUDA 在多大程度上真的能夠推動 Nvidia 平臺上的前沿 AI 應用?
黃仁勛:CUDA 擁有豐富的生態系統。如果您想先在任何計算機上進行構建,那么首先基于 CUDA 進行構建是非常明智的選擇。正因為其生態系統如此豐富,我們才能支持所有框架。如果您想創建自定義內核……例如,我們為 Triton 做出了巨大貢獻。因此,Triton 的后端使用了大量的 Nvidia 技術。
我們很高興能夠幫助每個框架發揮其最大潛力。框架種類繁多,例如Triton、vLLM 、SGLang等等。現在又涌現出許多新的強化學習框架,例如verl和NeMo RL 。隨著訓練后處理和強化學習的不斷發展,整個領域正經歷著爆炸式增長。因此,如果您想基于某個架構進行開發,那么基于 CUDA 無疑是最佳選擇,因為 CUDA 的生態系統非常完善。
你知道,如果出了問題,更有可能出在你的代碼里,而不是底層那堆積如山的代碼里。構建這些系統時,別忘了你要處理的代碼量有多大。如果出了問題,是你的問題還是電腦的問題?你肯定希望問題總是出在你身上,并且能夠信任電腦。當然,我們自己也存在很多 bug,但我們的系統已經過充分測試,至少你可以在這個基礎上繼續開發。這就是第一點:生態系統的豐富性、可編程性和強大功能。
第二點是,如果你是一名開發者,無論開發什么軟件,你最看重的就是用戶基數。你希望你編寫的軟件能夠在大量的其他計算機上運行。你開發軟件并非僅僅為了自己,而是為了你的服務器群,或者其他所有人的服務器群,因為你是一名框架構建者。英偉達的 CUDA 生態系統最終是其最大的財富。
現在市面上已經有數億個GPU。每個云平臺都配備了GPU。從A10 、A100 、H100 、H200 ,到L系列、P系列等等,種類繁多,尺寸和形狀也各不相同。如果你是一家機器人公司,你肯定希望CUDA協議棧能夠直接在機器人上運行。我們的產品幾乎無處不在。龐大的用戶群意味著,一旦你開發出軟件或模型,它就能在任何地方使用。這簡直太有價值了。
最后,我們能夠覆蓋所有云平臺,這使我們真正獨樹一幟。如果您是一家人工智能公司或開發者,您可能并不確定應該與哪家云服務提供商合作,或者在哪里運行。我們幾乎可以在任何地方運行,如果您愿意,我們也可以為您提供本地部署服務。豐富的生態系統、龐大的用戶群以及我們靈活的部署方式,共同造就了 CUDA 的無可比擬的價值。
Q:這很有道理。我好奇的是,這些優勢對你的主要客戶來說是否重要。對很多人來說,這些優勢可能很重要。能夠構建自己軟件棧的那類人貢獻了你的大部分收入。尤其是在人工智能越來越擅長那些具有嚴格驗證循環、可以進行強化學習的領域……如何編寫一個內核,使其在規模化應用中能夠最高效地處理注意力機制或多層感知器(MLP)?這是一個非常容易驗證的反饋循環。
所有超大規模數據中心運營商都能自行編寫這些定制內核嗎?英偉達的性價比依然很高,所以他們可能仍然更傾向于使用英偉達的產品。但問題在于,最終會不會演變成誰能以最低的價格提供最佳的規格、浮點運算能力和內存帶寬?歷史上,英偉達憑借CUDA的護城河,在人工智能領域(包括硬件和軟件)一直保持著最高的利潤率,高達70%。而問題是,如果大多數客戶能夠負擔得起自行構建,而不是依賴CUDA的護城河,英偉達還能維持這樣的利潤率嗎?
黃仁勛:我們為這些人工智能實驗室配備了數量驚人的工程師,他們與這些實驗室合作,優化他們的技術棧。原因在于,沒有人比我們更了解我們的架構。這些架構不像CPU那樣通用。CPU有點像凱迪拉克,它是一款舒適的巡航車,速度不會太快,每個人都能輕松駕馭。它配備了巡航控制,一切都很簡單。但在很多方面,英偉達的GPU和加速器就像F1賽車。我估計每個人都能以每小時一百英里的速度駕駛它,但要將其性能發揮到極致,則需要相當豐富的專業知識。我們運用了大量的人工智能技術來創建我們的內核。
我非常肯定,在相當長的一段時間內,我們仍然會被需要。我們的專業知識通常能幫助我們的人工智能實驗室合作伙伴輕松地將他們的技術棧性能提升兩倍。我們完成技術棧優化或特定內核優化后,他們的模型速度提升三倍、兩倍甚至五成的情況并不少見。這是一個巨大的數字,尤其考慮到他們龐大的設備基數,包括他們所有的 Hopper 和 Blackwell 等計算單元。性能提升一倍,收入也會翻倍。這直接轉化為實際收益。
英偉達的計算堆棧是全球性價比最高的,沒有之一。目前世界上沒有任何一個平臺能證明它的性能/總擁有成本比更高。沒有一家公司能做到。事實上,現有的基準測試,比如Dylan的InferenceMAX ,人人都能用,但沒有任何一家公司能做到……TPU不會推出,Trainium也不會推出。
我鼓勵他們使用 InferenceMAX 來展示他們驚人的推理成本。這真的很難。沒人愿意來。MLPerf 。我倒是很想聽聽 Trainium 展示一下他們一直聲稱的 40% 的成本優勢。我很想聽聽他們如何證明 TPU 的成本優勢。在我看來,這完全說不通。一點道理都沒有。從根本上來說,這根本說不通。
所以我認為我們如此成功的原因很簡單,就是我們的總體擁有成本 (TCO) 非常低。其次,您提到我們 60% 的客戶是前五大企業,但其中大部分業務都是外部業務。例如,AWS 上的英偉達產品大部分是為外部客戶而非內部用戶提供的。Azure 上的所有客戶也都是外部客戶。OCI 上的所有客戶也都是外部客戶,而非內部用戶。他們之所以青睞我們,是因為我們的覆蓋范圍非常廣。我們可以為他們帶來全球所有優秀的客戶。這些客戶都基于英偉達的產品。而所有這些公司之所以都基于英偉達的產品,正是因為我們覆蓋范圍廣、功能多樣。
所以我認為真正的飛輪效應在于用戶基數、我們架構的可編程性、我們生態系統的豐富性,以及全球人工智能公司數量眾多這一事實。現在有成千上萬家人工智能公司。如果你是其中一家人工智能初創公司,你會選擇哪種架構?你會選擇最普及的架構。而我們的架構是全球最普及的。你會選擇用戶基數最大的架構。而我們的用戶基數最大。你還會選擇擁有豐富生態系統的架構。
這就是飛輪效應。原因在于:首先,我們的每美元性能如此之高,以至于他們的tokens成本最低。其次,我們的每瓦性能是全球最高的。因此,如果我們的合作伙伴建造了一個1吉瓦的數據中心,那么這個1吉瓦的數據中心必須能夠產生最大的收益和tokens數量,這直接轉化為收入。您希望它產生盡可能多的代幣,從而最大化數據中心的收益。我們擁有全球最高的每瓦代幣產量架構。最后,如果您的目標是租用基礎設施,我們擁有全球最多的客戶。這就是飛輪效應發揮作用的原因。
Q:有意思。我想問題的關鍵在于,實際的市場結構究竟如何?因為即便還有其他公司……原本可能存在成千上萬家人工智能公司,它們大致平分計算資源。但即便通過這五家超大規模數據中心,真正使用亞馬遜計算資源的仍然是 Anthropologie、OpenAI 以及那些有能力且能夠自行部署不同加速器的大型基金會實驗室。
黃仁勛:不,我認為你的前提是錯誤的。
Q:也許吧。不過,我想問你一個稍微不同的問題。如果價格、性能、每瓦性能等等這些說法都是真的,那么你認為為什么像 Anthropic 這樣的公司會在幾天前宣布他們與 Broadcom 和 Google 達成了一項數吉瓦的 TPU 協議,用于他們的大部分計算呢?
顯然,對谷歌來說,TPU占據了大部分計算資源。所以,如果我觀察這些大型人工智能公司,會發現它們的很多計算資源……曾經有一段時間它們都依賴英偉達的加速器,但現在情況并非如此。因此,我很好奇,如果這些說法在理論上成立,它們為什么會選擇其他加速器呢?
黃仁勛:Anthropic 是一個特例,而非一種趨勢。如果沒有 Anthropic,TPU 又怎會增長?它完全是 Anthropic 的功勞。如果沒有 Anthropic,Trainium 又怎會增長?它也完全是 Anthropic 的功勞。我認為這一點已廣為人知。ASIC 的機會并不多,Anthropic 只有一個。
Q:但OpenAI 與 AMD 達成了協議……他們正在打造自己的Titan加速器。
黃仁勛:是的,但我想我們都應該承認,它們很大程度上是英偉達的競品。我們仍然會繼續合作。我不介意其他人使用其他產品或嘗試其他技術。如果他們不去嘗試,又怎么知道我們的產品有多好呢?有時候,我們需要有人提醒自己這一點。我們必須不斷地努力才能保住現在的地位。
總是有很多夸張的說法。看看有多少ASIC項目被取消就知道了。就算你打算造ASIC……你還得造出比英偉達更好的產品。造出比英偉達更好的產品可沒那么容易。實際上,這根本不現實。英偉達肯定漏掉了什么,真的。因為我們的規模和速度,我們是世界上唯一一家每年都能持續產出新產品的公司。每年都有巨大的飛躍。
Q:我猜他們的邏輯是,“嘿,它不需要更好。它只需要比原來的差不超過70%就行了”,因為他們付給你的是70%的利潤率。
黃仁勛:不,別忘了,即使是ASIC芯片,利潤率也相當高。比如說,英偉達的利潤率是70%。但ASIC芯片的利潤率只有65%。你到底能省多少錢?
Q:哦,你是說博通之類的公司嗎?
黃仁勛:當然,總得付錢給別人吧。就我所知,ASIC的利潤率非常高。他們自己也這么認為,而且他們對ASIC驚人的利潤率相當自豪。
所以,你問了為什么。很久以前,我們確實沒有能力做到這一點。當時,我并沒有深刻意識到建立像 OpenAI 和 Anthropic 那樣的基礎性人工智能實驗室有多么困難,也沒有意識到他們需要供應商投入巨資。我們當時根本無力向 Anthropic 投資數十億美元,讓他們使用我們的計算資源。但谷歌和 AWS 有。他們一開始就投入了巨資,作為回報,Anthropic 可以使用他們的計算資源。而我們當時確實沒有能力做到這一點。
我覺得我的錯誤在于,我沒有真正理解他們其實別無選擇,風險投資家絕不會把50億到100億美元投資到一個人工智能實驗室,指望它能像Anthropic那樣成功。所以這是我的失誤。但即便我當時理解了這一點,我想我們當時也沒有能力這么做。但我不會再犯同樣的錯誤了。
我很高興能投資 OpenAI,也很高興能幫助他們擴大規模,而且我認為這樣做至關重要。后來,當 Anthropic 找到我們時,我也很高興能成為他們的投資者,幫助他們擴大規模。只是當時我們力不從心。如果一切可以重來——如果英偉達當時就能達到現在的規模——我絕對會非常樂意這么做。
為什么英偉達不成為超大規模數據中心運營商?
Q:這確實很有意思。多年來,英偉達一直是人工智能領域最賺錢的公司,賺了很多錢。現在你們開始投資人工智能了。據報道,你們在OpenAI投資了高達300億美元,在Anthropic投資了100億美元。現在它們的估值都提高了,我相信還會繼續增長。
所以,如果你這些年來一直為他們提供計算資源,并且預見到它的發展方向,而幾年前——甚至在某些情況下,一年前——他們的價值只有現在的十分之一,而你又手握大量現金——那么,英偉達完全可以轉型為基金會實驗室,進行巨額投資來實現這一目標,或者更早地以現在的估值完成你現在達成的這些交易。而且你當時也有足夠的資金這樣做。所以我很想知道,為什么你沒有更早地這樣做呢?
黃仁勛:我們盡早完成了這件事。如果可以,我甚至會更早去做。當時Anthropic需要我們做這件事的時候,我們卻無能為力。這樣做也不符合我們的本性。
Q:怎么會這樣?是現金交易之類的嗎?
黃仁勛:是的,投資規模的問題。當時我們從未在公司外部投資過,而且投資額也不大。我們當時沒意識到需要投資。我一直以為他們可以像其他公司一樣,直接去風投那里融資,我的天哪。但他們想做的事情,風投是做不到的。OpenAI想做的事情,風投是做不到的。我現在明白了。當時我并不知道。
但這就是他們的過人之處。這就是他們聰明的原因。他們當時意識到自己必須做這樣的事。我很高興他們這么做了。盡管我們導致Anthropic不得不轉投他人,但我仍然為此感到高興。Anthropic的存在對世界意義重大。我為此感到欣慰。
Q:我猜你仍然賺了很多錢,而且每個季度都在賺得更多。
黃仁勛:有遺憾也是正常的。
Q:所以問題依然存在。既然我們已經到了這里,而且你們也一直在賺這筆錢,那么英偉達應該怎么用呢?一個答案是,現在已經出現了一個完整的中間商生態系統,可以將這些實驗室的資本支出轉化為運營支出,以便他們能夠租用計算資源。因為芯片非常昂貴,而且由于人工智能模型不斷改進,它們在其生命周期內能帶來巨額利潤。因此,它們創造的價值,也就是它們的代幣,正在不斷增長,但搭建這些系統成本很高。英偉達有足夠的資金來承擔這些資本支出。事實上,據報道,你們為CoreWeave項目提供了高達63億美元的支持,并且已經投資了20億美元。
為什么英偉達不自己做云服務商?為什么不自己做超大規模云服務商,把計算資源出租出去?他們有這么多錢可以這么做。
黃仁勛:這是公司的理念,我認為很明智。我們應該盡可能少地投入,只做必要的事情。這意味著,如果我們不去構建我們的計算平臺,我相信這項工作就無法完成。如果我們不承擔現在承擔的風險——如果我們不以現在的方式構建 NVLink,如果我們不構建整個技術棧,如果我們不以現在的方式創建生態系統,如果我們不投入 20 年的時間,即使大部分時間都在虧損,也要致力于 CUDA 的發展——如果我們不去做,其他人就不會去做。
如果我們當初沒有創建所有CUDA-X 庫,使它們都針對特定領域……十五年前,我們開始大力開發領域特定庫,因為我們意識到,如果我們不創建這些領域特定庫,無論是光線追蹤、圖像生成,甚至是早期人工智能的模型,無論是數據處理、結構化數據處理還是矢量數據處理,如果我們不創建它們,就不會有人創建。我對此深信不疑。我們創建了一個名為cuLitho的計算光刻庫。如果我們不創建它,就不會有人創建。因此,如果我們不做這些,加速計算就不會發展到今天這樣的程度。
所以我們應該這樣做。我們應該傾盡全力,全心全意地投入到這項工作中。然而,世事難料。如果我不做,也會有人去做。因此,我們公司至今仍然秉持著“盡可能多做,但盡可能少做”(doing as much as needed but as little as possible)的理念。我所做的每一件事,都遵循著這個原則。
就云計算而言,如果我們當初不支持CoreWeave ,這些 neoclouds、這些 AI 云就不會存在。如果我們當初沒有幫助 CoreWeave 發展,它們也不會存在。如果我們當初沒有支持Nscale ,它們就不會有今天的成就。如果我們當初沒有支持Nebius ,它們也不會有今天的成就。如今,它們發展得非常出色。
這算是一種商業模式嗎?我們應該盡可能多地做事,盡可能少地干預。所以我們投資于我們的生態系統,因為我希望我們的生態系統蓬勃發展。我希望架構和人工智能能夠與盡可能多的行業、盡可能多的國家連接起來,使整個地球能夠基于人工智能和美國的技術棧而運轉。這正是我們正在追求的愿景。
您剛才提到的一點是……有很多非常優秀的基金會模式公司,我們盡量投資所有這些公司。這也是我們所做的。我們不挑選贏家。我們需要支持所有公司。這是我們投資的樂趣所在,也是我們業務的必要組成部分。但我們也會刻意避免挑選贏家。所以,當我投資一家公司時,我也會投資所有相關的公司。
Q:你為什么刻意不去挑選贏家?
黃仁勛:第一,這不是我們的職責。第二,英偉達創立之初,有60家3D圖形公司。我們是唯一一家存活下來的。如果你把這60家圖形公司都列出來,問問自己哪家會成功,英偉達肯定排在失敗名單的首位。
這事發生在你很久以前,但英偉達的圖形架構一開始確實是錯的,不是一點點錯,而是我們創造了一個徹頭徹尾的錯誤架構,開發者根本無法維護。它注定失敗。我們當初的出發點是好的,但最終卻得到了錯誤的解決方案。所有人都認為我們會失敗。而我們現在卻成功了。
所以我足夠謙遜,能夠認識到這一點。不要人為地挑選贏家。要么讓他們各自發展,要么就幫助他們所有人。
Q:有一點我不明白,你說:“我們優先發展這些NeoCloud項目,并非僅僅因為它們是NeoCloud,我們想扶持它們。”但你又列舉了一堆NeoCloud項目,說如果沒有NVIDIA,它們根本不會存在。這兩件事怎么能自相矛盾呢?
黃仁勛:首先,他們必須有創業的意愿,并且主動來尋求我們的幫助。當他們有創業意愿,并且擁有商業計劃、專業知識和熱情時……他們顯然也必須具備一定的自身能力。但如果最終他們需要一些投資才能啟動項目,我們也會全力支持。不過,他們越早啟動自己的發展引擎越好……
你的問題是:“我們是否想涉足融資業務?”答案是否定的。融資業務已經存在,我們更愿意與他們合作,而不是自己成為融資者。我們的目標是專注于我們自身的核心業務,盡可能簡化我們的商業模式,并支持我們的生態系統。
像 OpenAI 這樣的公司,在上市前就需要 300 億美元的投資,而我們深信他們,我也深信他們將會成為……嗯,他們現在就已經是一家非凡的公司了。他們將會成為一家了不起的公司。世界需要他們,世界希望他們存在,我也希望他們存在。他們現在順風順水。讓我們支持他們,讓他們發展壯大。我們會進行這些投資,因為他們需要我們這樣做。但我們并非試圖盡可能多地投資,而是試圖盡可能少地干預。
Q:這可能是一個顯而易見的問題,但我們已經在 GPU 短缺的情況下生活了很多年,而且隨著模型性能的提高,這種情況現在變得更加嚴重了。
黃仁勛:我們缺少GPU。
Q:是的。眾所周知,英偉達在分配稀缺資源方面并非只看出價,而是會考慮“我們想確保這些新云平臺能夠存在。所以我們給CoreWeave分配一些,給Crusoe分配一些,給Lambda分配一些。”這對英偉達有什么好處呢?首先,你是否同意這種將市場分割的說法?
黃仁勛:不,不。你的前提完全錯誤。我們對這些事情非常重視。首先,如果沒有采購訂單,再多的討論也無濟于事。在拿到采購訂單之前,我們能做什么?所以,首要任務是與所有人密切合作,努力完成預測,因為這些項目需要很長時間才能建成,數據中心的建設更是如此。我們通過預測來確保供需平衡等等。明白嗎?這是首要任務。
第二,我們已盡力與盡可能多的人進行預測,但最終您仍然需要下單。或許由于某種原因,您尚未下單。我能怎么辦?在某些情況下,我們會遵循先到先得的原則。但除此之外,如果您因為數據中心尚未準備就緒,或者某些組件尚未到位而無法搭建數據中心,我們可能會優先服務其他客戶。這只是為了最大限度地提高我們工廠的產能。我們可能會對此進行一些調整。
除此之外,優先級是先進先出。你必須下訂單。如果你不下訂單……當然,這方面有很多傳聞。比如,這一切都源于一篇關于拉里和埃隆和我共進晚餐的文章,文章里他們懇求我提供GPU 。這事根本沒發生過(That never happened)。我們確實一起吃了頓飯。我們確實一起吃了頓飯,而且那是一頓非常棒的晚餐。他們從來沒有懇求我提供GPU。他們只需要下訂單。一旦他們下訂單,我們會盡力滿足他們的產能需求。我們的流程很簡單。
Q:好的。聽起來好像有個排隊機制,然后根據你的數據中心是否準備就緒以及你何時下訂單,你才能在特定時間獲得資源。但這仍然不像是價高者得。這樣做有什么原因嗎?
黃仁勛:我們從來不那樣做。
Q:為什么不直接選擇價高者得呢?
黃仁勛:因為這是糟糕的商業做法。你定好價格,然后讓別人決定買不買。我知道芯片行業的其他公司會在需求旺盛時調整價格,但我們不會。這從來都不是我們的行事方式。您可以信賴我們。我更愿意做一個可靠的人,成為行業的基石。您無需猜測。如果我報了價,那就是我們報的價格。就是這樣。如果需求激增,那就順其自然。
Q:另一方面,這就是為什么你和臺積電保持著良好的合作關系,對吧?
黃仁勛:是的,英偉達和他們合作已經快30年了。英偉達和臺積電之間沒有正式的法律合同。所以總會有些不公平的待遇。有時候我判斷對,有時候我判斷錯。有時候我能拿到更好的價格,有時候會拿到更差的價格。但總的來說,我們之間的關系非常棒。我完全信任他們,完全可以依靠他們。
選擇英偉達,有一點可以肯定:今年,Vera Rubin將會非常出色。明年,Vera Rubin Ultra將問世。后年,Feynman將橫空出世。再后年,我還沒公布名字呢。每年,你都可以信賴我們。你得去全世界找找其他 ASIC 團隊——隨便挑一個——才能找到一個可以讓你說:“我可以把我的全部家產都押上,我可以把我的整個公司都押上,你們每年都會為我服務。你們的token成本每年都會下降一個數量級,我可以像信賴時鐘一樣信賴你們。”(“I can bet the farm, I can bet my entire business that you will be here for me every single year. Your token cost will decrease by an order of magnitude every single year. I can count on it like I can count on the clock.”)
我剛才提到了臺積電。歷史上沒有任何其他代工廠能做到這一點。但如今,你可以這樣評價英偉達。每年你都可以信賴我們。如果你想購買價值十億美元的AI工廠計算資源,沒問題。如果你想購買價值一億美元的,沒問題。你想購買價值一千萬美元的,或者僅僅是一個機架,都沒問題。或者僅僅是一張顯卡,好的,沒問題。如果你想訂購價值一千億美元的AI工廠,沒問題。我們是當今世界上唯一一家可以這樣說的公司。
臺積電的情況也一樣。我想買一臺,買十億臺,都沒問題。我們只需要按部就班地做好規劃,做所有成熟企業都會做的事情。所以我認為,英偉達能夠成為全球人工智能產業的基石,是我們花了二十多年才取得的成就。這需要巨大的投入和奉獻。公司的穩定性、公司的持續發展,對我們來說至關重要。
我們應該向中國出售人工智能芯片嗎?
Q:好的。我想問問關于中國的問題。其實我也不知道對向中國出售芯片到底好不好有什么看法,但我喜歡和嘉賓唱反調。所以,上次達里奧做客“誰支持出口管制”節目時,我問他,為什么美國和中國不能都擁有數據中心領域的天才人才呢?不過既然你持相反觀點,那我就反過來問你。
換個角度來看,Anthropic Games幾天前發布了Mythos Preview 。他們甚至沒有公開發布這款Mythos模型,因為他們說它擁有如此強大的網絡攻擊能力,在確保所有零日漏洞都被修復之前,世界還沒有做好準備。但他們表示,Mythos在所有主流操作系統和瀏覽器中都發現了數千個高危漏洞。他們甚至在OpenBSD中也發現了一個漏洞,而OpenBSD正是專門設計用來避免零日漏洞的操作系統。他們發現的這個漏洞已經存在了27年。
因此,如果中國能夠獲得人工智能芯片,訓練像 Claude Mythos 這樣具有網絡攻擊能力的模型,并利用更強大的計算能力運行數百萬個實例,這會構成威脅嗎?
黃仁勛:首先,Mythos的訓練所用的計算能力和計算量都相當普通,但訓練所用的卻是一家非常優秀的公司。這種計算能力和計算類型在中國非常普遍。所以你首先需要明白,芯片在中國是存在的。
他們生產了全球60%的主流芯片,甚至可能更多。對他們來說,這是一個非常龐大的產業。他們擁有一些世界上最頂尖的計算機科學家。眾所周知,所有這些人工智能實驗室中的大多數人工智能研究人員都是中國人。他們擁有全球50%的人工智能研究人員。所以問題是,考慮到他們已經擁有的所有資源——他們擁有豐富的能源、大量的芯片、以及絕大多數的人工智能研究人員——如果你擔心他們,那么創造一個安全世界的最佳方法是什么?
將他們視為受害者,把他們變成敵人,可能并非最佳方案。他們是對手。我們希望美國獲勝。但我認為,開展對話和研究性對話或許是最穩妥的做法。由于我們目前將中國視為對手的態度,這方面明顯缺失。我們的人工智能研究人員和他們的人工智能研究人員必須進行真正的對話。我們必須努力就人工智能的用途達成共識。
至于查找軟件漏洞,這當然是人工智能的職責所在。它會在很多軟件中發現漏洞嗎?當然會。軟件漏洞數不勝數。人工智能軟件中也存在大量漏洞。這正是人工智能的職責所在,我很高興人工智能已經發展到能夠幫助我們大幅提高生產力的水平。
網絡安全、人工智能網絡安全、人工智能安全、人工智能隱私和人工智能保障等領域的生態系統非常豐富,但卻常常被忽視。一個龐大的人工智能初創企業生態系統正在努力為我們創造這樣的未來:一個功能強大的人工智能代理被成千上萬個其他人工智能代理環繞,共同守護著它的安全。這樣的未來必將到來。
讓人工智能代理在無人監管的情況下四處運行,這簡直是瘋了。我們非常清楚,這個生態系統需要蓬勃發展。事實證明,這個生態系統需要開源。這個生態系統需要開放的模型。他們需要開放的技術棧,這樣所有的人工智能研究人員和優秀的計算機科學家才能構建強大且安全的AI系統。因此,我們必須確保開源生態系統的活力。這一點不容忽視。很多開源項目都來自中國。我們不應該扼殺它。
關于中國,我們當然希望美國擁有盡可能多的計算能力。我們受限于能源,但我們已經投入大量資源來解決這個問題。我們絕不能讓能源成為國家發展的瓶頸。但我們也希望確保全世界的人工智能開發者都基于美國的技術棧進行開發,并將人工智能的貢獻和進步——尤其是在開源的情況下——貢獻給美國生態系統。如果建立兩個生態系統——一個是只能運行在外國技術棧上的開源生態系統,另一個是運行在美國技術棧上的封閉生態系統——那將是極其愚蠢的。我認為這對美國來說將是一個糟糕的結果。
Q:由于事情很多,我先簡單概括一下。我認為,回到黑客攻擊中提到的浮點運算能力差距問題,沒錯,他們的確擁有計算能力,但他們實際能夠生產的浮點運算能力只有美國的十分之一。
那么,他們最終能否訓練出像 Mythos 這樣的模型呢?答案是肯定的。但問題在于,由于失敗案例更多,美國實驗室能夠率先達到這種能力水平。因為 Anthropic 公司搶先一步,他們會說:“好吧,我們先保留一個月,讓所有美國公司都有機會使用。他們會修復所有漏洞,然后我們再發布。”
此外,即便他們訓練出了這樣的模型,大規模部署的能力也至關重要……如果一個網絡黑客擁有上百萬個這樣的模型,那肯定比只有一千個要危險得多。所以推理計算能力真的非常重要。事實上,他們擁有如此多優秀的AI研究人員,這才是真正令人擔憂的地方,因為是什么讓這些工程師研究人員如此高效?答案是計算能力。
如果你和美國的任何一家人工智能實驗室交談,他們都會說瓶頸在于計算能力。無論是DeepSeek的創始人,還是Qwen的領導層,都說過類似的話。他們都認為瓶頸在于計算能力。那么問題來了,難道不應該讓美國公司憑借更強大的計算能力率先達到Mythos級別,為我們的社會做好準備,趕在中國之前,因為中國計算能力較弱,這樣做不是更好嗎?
黃仁勛:我們應該永遠爭第一,永遠擁有更多。但要讓你描述的結果成真,就必須走極端。他們必須完全沒有計算能力。如果他們有一些計算能力,問題在于需要多少?
中國的計算能力非常龐大。要知道,中國可是全球第二大計算市場。如果他們想整合計算資源,完全可以滿足需求。
而且,他們擁有的能源量簡直驚人,不是嗎?人工智能本質上就是一個并行計算問題,不是嗎?既然能源是免費的,為什么他們不能把芯片的數量增加4倍、10倍甚至更多呢?他們擁有如此多的能源。他們的數據中心空空蕩蕩,電力卻依然充足。你知道他們有“鬼城”,他們的數據中心也一樣空置。他們的基礎設施容量如此龐大。如果他們愿意,他們完全可以把更多的芯片集中起來,哪怕是更落后工藝的芯片
他們的芯片制造能力位居世界前列。半導體行業都知道他們壟斷了主流芯片市場。他們的產能過剩。因此,認為中國無法制造人工智能芯片的說法完全是無稽之談。
當然,如果你問我,如果全世界完全沒有計算能力,美國會不會更領先?但這根本不可能。這并非現實。他們現在的計算能力已經非常充足了。你所擔心的那個問題,他們所需的計算能力閾值,他們早已達到,甚至超過了。
所以我認為你誤解了人工智能的本質,它就像一個五層蛋糕,最底層是能源。能源充足時,芯片就足夠了;芯片充足時,能源就足夠了。例如,美國能源匱乏,這就是為什么英偉達必須不斷改進我們的架構,并進行這種極致的協同設計,以便在我們出貨的芯片數量有限的情況下——因為能源供應極其有限——實現每瓦吞吐量的驚人水平。
但如果你的瓦數完全充足,而且是免費的,你又何必在意每瓦性能呢?你已經綽綽有余了。你可以用舊芯片來做。所以7nm芯片本質上就是Hopper。Hopper的能力……我必須告訴你,如今的模型大多都是基于Hopper算法訓練的,也就是Hopper算法的生成。所以7nm芯片已經足夠好了。充足的能源是中國的優勢。
Q:但問題在于,他們是否真的能夠生產出足夠的芯片。
黃仁勛:但他們的確做到了。證據是什么?華為剛剛經歷了公司歷史上業績最好的一年。
Q:最先進的HBM一定需要EUV?
黃仁勛:不對。完全不對。你可以把它們組合起來,就像我們把它們和NVL72組合起來一樣。他們已經展示了硅光子學技術,可以將所有這些計算能力連接起來,形成一臺巨型超級計算機。你的前提完全錯誤。
事實上,他們的AI研發進展順利。世界上最頂尖的AI研究人員,由于計算能力有限,反而創造出了極其智能的算法。別忘了,我剛才說過摩爾定律每年大約推進25%。然而,憑借卓越的計算機科學,我們仍然可以將算法性能提升10倍。我的意思是,卓越的計算機科學才是關鍵所在。
毫無疑問,MoE 是一項偉大的發明。毫無疑問,所有令人驚嘆的注意力機制都減少了計算量。我們必須承認,人工智能的大部分進步都源于算法的進步,而不僅僅是硬件的改進。既然大部分進步都來自算法、計算機科學和編程,那么他們龐大的人工智能研究人員隊伍難道不是他們最根本的優勢嗎?我們都看到了這一點。DeepSeek 絕非無關緊要的進步。如果 DeepSeek 先在華為平臺上發布,那對我們國家來說將是災難性的。
Q:為什么會這樣?因為目前像 DeepSeek 這樣的模型,只要是開源的,就可以在任何加速器上運行。為什么將來情況會改變呢?
黃仁勛:假設并非如此。假設它是針對華為優化的,假設它是針對他們的架構優化的。那將使我們處于劣勢。你描述的情況在我看來是好消息。一家公司開發了一款軟件,開發了一個人工智能模型,而它在美式技術棧上運行效果最佳。我認為這是好消息。但你卻把它設定為壞消息。現在我要告訴你壞消息:世界各地的人工智能模型都是在非美國硬件上開發的,而它們在非美國硬件上運行效果最佳。這對我們來說是壞消息。
Q:我感覺并沒有證據表明存在如此巨大的差異,足以阻止你更換加速器。美國實驗室正在所有云平臺、所有不同的加速器上運行他們的模型。
黃仁勛:我就是證據。你拿一個針對英偉達顯卡優化的模型,然后試圖在其他顯卡上運行它,這是行不通的。
Q:但美國實驗室確實會這樣做。
黃仁勛:它們的運行效果并沒有更好。英偉達的成功就是最好的證明。人工智能模型是在我們的技術棧上創建的,在我們的技術棧上運行效果也最好,這難道不合邏輯嗎?
Q:Anthropic 的模型可以在 GPU 上運行,可以在 Trainium 上運行,也可以在 TPU 上運行。
黃仁勛:要改變現狀,需要付出很多努力。但看看全球南方國家,看看中東地區。如果所有人工智能模型在別人的技術棧上運行效果最佳,那么你現在提出的“這對美國來說是件好事”的說法就太荒謬了。
Q:但我不太明白這個論點。假設中國公司率先開發出下一代Mythos系統。他們率先發現了美國軟件的所有安全漏洞,但他們可以在英偉達硬件上運行,然后把產品運往全球南方國家。他們用英偉達硬件開發,這有什么好處呢?好吧,它的確能在英偉達硬件上運行——
黃仁勛:這不好,這不好,我們不能讓它發生。
Q:你為什么認為它(指代英偉達GPU)是完全可替代的,即使你不向他們供貨,華為也能完全替代?他們落后了,對吧?他們的芯片比你的差。
黃仁勛:完全是這樣……現在就有證據。他們的芯片產業規模龐大。
Q:你只要對比H200和華為910C的浮點運算能力、帶寬或內存容量就知道了,它們的性能大概只有前者的一半到三分之一。
黃仁勛:他們用量更多。他們用的量是原來的兩倍。
Q:你的論點似乎是,他們擁有巨大的能源,他們需要用芯片來填充這些能源。
黃仁勛:而且他們很擅長制造業。
Q:我相信最終他們肯定能在生產能力上勝過所有人。但現在還有這關鍵的幾年。
黃仁勛:你所說的關鍵年份是指哪一年?如果未來幾年至關重要,那么我們必須確保在這關鍵的幾年里,全世界所有的人工智能模型都建立在美國的技術棧之上。
人工智能產業有五個層面,每個層面都必須成功。而最需要成功的層面實際上是人工智能應用。你為什么如此執著于那個人工智能模型?那家公司?究竟是出于什么原因?
能源、芯片以及人工智能研究人員的生態系統使這一切成為可能。
Q:如果美國的計算能力存在瓶頸,那么向中國出口芯片又如何能使美國保持領先地位呢?
黃仁勛:我認為美國理應領先。美國的計算能力是世界其他任何地方的100倍。美國理應領先。好吧。美國確實領先。
英偉達致力于研發最先進的技術。我們確保美國實驗室能夠第一時間獲悉這些技術,并擁有優先購買權。如果他們資金不足,我們甚至會投資扶持他們。美國理應領先。我們希望竭盡所能確保美國保持領先地位。這一點您同意嗎?我們正在為此竭盡全力。
你認為英偉達是一家美國公司?好的。首先,為什么我們不制定一個更平衡的監管政策,讓英偉達能夠在全球范圍內取得成功,而不是讓美國放棄全球市場?你為什么要讓美國放棄全球市場?
芯片產業是美國生態系統的一部分,是美國技術領先地位的一部分,也是人工智能生態系統的一部分,更是人工智能領先地位的一部分。為什么你們的政策和理念會導致美國放棄世界市場的大部分份額?
將人工智能與你剛才提到的任何東西相提并論都是荒謬的。
Q:所以關鍵在于,現在賣芯片對我們長遠發展有何幫助?特斯拉長期以來一直向中國銷售性能卓越的電動汽車。iPhone在中國也暢銷,而且質量極佳。特斯拉并沒有造成中國市場的壟斷。中國仍然會生產自己的電動汽車,并且占據主導地位。他們的智能手機也占據主導地位。
黃仁勛:今天我們開始對話時,您也承認英偉達的處境非常特殊。您用了“護城河”這樣的詞。對我們公司而言,最重要的就是我們生態系統的豐富性,而這離不開開發者。全球50%的人工智能開發者都在中國。美國不應該放棄這塊寶地。
Q:但是我們在美國有很多英偉達的開發者,但這并不妨礙美國實驗室未來使用其他加速器。事實上,他們現在就在使用其他加速器,這很好,也很棒。如果你向中國銷售英偉達芯片,我不明白為什么在中國就不能這樣做,就像谷歌可以使用TPU和英偉達芯片一樣。
黃仁勛:我們必須不斷創新,而且正如你可能知道的,我們的市場份額正在增長,而不是下降。那種認為即使我們在中國競爭,最終也會失去那個市場的想法……你不是在跟一個醒來就覺得自己是個失敗者的人說話。那種失敗者的態度,那種失敗者的假設,在我看來毫無道理。
我們不是汽車。我們不是汽車。我可以今天買這個牌子的車,明天再買另一個牌子的車,這很容易。但計算機領域并非如此。x86 架構的存在是有原因的。ARM架構如此根深蒂固也是有原因的。這些生態系統難以替代。這需要耗費大量的時間和精力,而且大多數人都不愿意這樣做。因此,我們的職責是繼續培育這個生態系統,不斷推進技術發展,從而在市場競爭中保持優勢。
如果按照你描述的那種前提來劃分市場,我根本無法接受。這完全說不通。因為我不認為美國是失敗者,我們的行業也不是失敗者。這種失敗論調,這種失敗心態,在我看來毫無道理。
Q:但他們之所以從你這里購買是有原因的。我們有來自中國公司創始人的引述,他們表示公司在計算能力方面遇到了瓶頸。
黃仁勛:因為我們的芯片更好。總的來說,我們的芯片更好。這一點毋庸置疑。如果沒有我們的芯片……您能承認華為今年的業績創下紀錄嗎?您能承認一大批芯片公司都上市了嗎?您能承認嗎?
您是否也承認,我們過去在該市場占據了很大的份額,而現在份額已經大幅下降?我們也可以承認,中國占據了全球科技產業約40%的份額。為了美國科技產業的利益而放棄這個市場,是對我們國家的損害,是對我們國家安全的損害,也是對我們科技領導地位的損害。這一切僅僅是為了一家公司的利益。這在我看來毫無道理。
Q:我有點糊涂了。感覺你好像在說兩件事。一是如果我們能參與競爭,我們的芯片性能會遠勝華為,所以我們肯定能贏下這場與華為的競爭。二是就算沒有我們,他們也會做同樣的事情。這兩件事怎么可能同時成立呢?
黃仁勛:這顯然是事實。如果沒有更好的選擇,你只能選擇唯一的選擇。這怎么會不合邏輯呢?這明明很合乎邏輯。
Q:他們想要英偉達芯片的原因是,英偉達芯片性能更好。
黃仁勛:是的
Q:更好的模型需要更多的計算資源。更多的計算資源意味著你可以訓練出更好的模型。
黃仁勛:不,它就是更好。它更好,因為它更容易編程。我們擁有更好的生態系統。但無論“更好”指的是什么,無論“更好”指的是什么……當然,我們會把計算資源輸送給他們。那又怎樣?事實是我們能從中受益。別忘了,我們能享受到美國技術領先地位帶來的好處。我們能享受到開發者們在美國技術棧上工作的益處。隨著這些人工智能模型擴散到世界各地,我們也能享受到美國技術棧因此成為最佳選擇帶來的好處。我們可以繼續推進和推廣美國技術。我認為這是一件好事。這是美國技術領先地位中非常重要的一部分。
現在,你所倡導的政策導致美國電信行業基本上被排擠出了世界市場,以至于我們甚至無法掌控自己的電信業務。我認為這并不明智。這種做法有些目光短淺,而且導致了一些意想不到的后果,我現在正在向你描述這些后果,但你似乎很難理解。
Q:好的,我們先退一步。問題的關鍵似乎在于,這里既有潛在的收益,也有潛在的成本。我們正在努力弄清楚的是,收益是否值得付出成本?我想讓你們意識到潛在的成本。計算是訓練強大模型的輸入。強大的模型確實擁有強大的攻擊能力,例如網絡攻擊。美國公司率先達到 Mythos 級別的能力是一件好事,現在他們決定暫緩發布這些能力,以便美國公司和美國政府能夠在正式發布該級別能力之前,更好地保護他們的軟件。
如果中國擁有更強大的計算能力或更多的眾包計算資源,如果他們能夠更早地開發出類似 Mythos 那樣的計算模型并進行廣泛部署,那將會非常糟糕。這種情況沒有發生的原因之一是,由于像英偉達這樣的美國公司,我們擁有了更強大的計算能力。這是將計算資源轉移到中國所要付出的代價。所以,我們暫且不談好處。您是否意識到這是一種潛在的代價?
黃仁勛:我還要告訴你,潛在的代價是,我們允許人工智能技術棧中最重要的一層——芯片層——拱手讓出整個市場——全球第二大市場——讓他們得以發展規模,建立自己的生態系統,從而使未來的人工智能模型以與美國技術棧截然不同的方式進行優化。隨著人工智能在全球擴散,他們的標準和技術棧將會超越我們,因為他們的模型是開放的。
Q:我想我只是對英偉達的內核工程師和CUDA工程師有足夠的信心,相信他們能夠進行優化——
黃仁勛:如你所知,人工智能不僅僅是內核優化。
中國是全球最大的開源軟件貢獻國。這是事實。中國也是全球最大的開放模型貢獻國。這是事實。如今,它建立在美國的技術棧之上,也就是英偉達的技術棧。這是事實。
人工智能技術棧的五個層面都至關重要。美國應該力爭拿下所有五個層面。它們都不可或缺。當然,最重要的層面是人工智能應用層。這一層會滲透到社會各個角落,被應用最為廣泛,也將從這場工業革命中獲益最多。但我的觀點是,每一層都必須成功。
如果我們嚇唬全國人民,讓他們覺得人工智能就像核彈一樣,讓每個人都憎恨人工智能、害怕人工智能,我不知道這對美國有什么好處。這只會害了美國。如果我們嚇得所有人都不敢從事軟件工程工作,因為人工智能會扼殺所有軟件工程崗位——結果導致我們一個軟件工程師都沒有——那我們也是在害美國。
如果我們因為計算機視覺完全免費,人工智能的工作能力不會比放射科醫生差,就嚇跑所有人,讓大家都不想當放射科醫生,那我們就誤解了工作和任務之間的區別。放射科醫生的工作是照護病人,而任務是解讀掃描結果。如果我們對這一點理解如此深刻,嚇跑所有人去讀放射科,那么我們將面臨放射科醫生短缺和醫療資源匱乏的問題。
所以我的意思是,當你設定一個如此極端的前提,一切都從零到無窮大,最終只會嚇到人們,而這根本不是事實。生活并非如此。我們希望美國領先嗎?當然希望。我們需要在各個層面都保持領先地位嗎?當然需要。當然需要。今天你談到Mythos,是因為Mythos很重要。沒錯。太好了。
但幾年后,我預言,當我們想要推廣美國技術體系,當我們希望美國技術走向世界——走向印度、走向中東、走向非洲、走向東南亞——當我們的國家想要出口,因為我們想要出口我們的技術,我們想要出口我們的標準時,我希望你我再次進行同樣的對話。我會詳細地告訴你今天的對話,告訴你你的政策和你的設想是如何導致美國毫無理由地拱手讓出世界第二大市場。
我們不應該放棄。如果輸了,那就輸了。但我們為什么要放棄呢?現在沒人主張非此即彼。沒人主張非此即彼,也就是說我們應該一直把所有東西都運到中國去。沒人主張那樣。我們應該始終擁有最先進的技術。我們應該始終擁有最多的技術,并且是第一。但我們也應該努力在全球范圍內競爭并取得勝利。這兩件事可以同時進行。這需要一些細致入微的思考,一些成熟的態度,而不是絕對的。世界本來就不是絕對的。
Q:因為受到各種限制(例如拿不到EUV光刻機),中國的芯片真的能出口到世界各地,從而確立行業標準嗎?
黃仁勛:那我們直接看事實吧?Blackwell的光刻技術真的比Hopper先進50倍嗎?真的有50倍嗎?差遠了。我一直在重復這句話:摩爾定律已經失效了。從晶體管本身的性能來看,Hopper和Blackwell之間的差距大概是75%。兩者相隔三年,差距高達75%。Blackwell爾的性能是Hopper的50倍。
我的觀點是,架構至關重要。計算機科學至關重要。半導體物理固然重要,但計算機科學才是重中之重。人工智能的影響很大程度上源于計算棧,這也是CUDA如此高效、如此受人喜愛的原因。它是一個生態系統,一種計算架構,它提供了極大的靈活性,以至于如果你想徹底改變架構——比如創建類似MoE的架構、類似擴散的架構、或者創建解耦架構——你都能做到。這很容易。
所以事實是,人工智能不僅關乎底層架構,也關乎上層技術棧。如果我們擁有針對自身技術棧和生態系統進行優化的架構和軟件棧,那當然是好事,因為我們今天一開始就討論了英偉達生態系統的豐富性。為什么人們總是喜歡先寫CUDA?確實如此。中國的研究人員也是如此。
但如果我們被迫離開中國,首先,這是一個政策錯誤。顯然,這會引發強烈反彈。這對美國來說后果很嚴重。它促進了中國的芯片產業發展,加速了其人工智能生態系統的轉型升級,迫使其人工智能生態系統專注于內部架構。現在亡羊補牢,為時未晚,但事已至此。
未來你會看到,他們顯然不會止步于于此。他們的制造工藝很出色,他們會繼續在現有及更先進的工藝基礎上發展。先進工藝的差距有10倍嗎?答案是否定的。架構很重要,網絡也很重要。這就是英偉達收購Mellanox的原因。網絡很重要,能源也很重要。所有這些都很重要。事情并不像你試圖簡化的那樣簡單。
為什么英偉達不生產多種不同的芯片架構?
Q:我們之前討論過臺積電在內存等方面的瓶頸問題。
所以,如果我們身處這樣一個世界:你已經占據了N3的大部分份額——而且在某個時候你會進入N2時代,并占據N2的大部分份額——你是否認為你可以回到N7時代,也就是利用舊工藝節點的剩余產能,然后說:“嘿,人工智能的需求如此巨大,而我們擴展前沿技術的能力卻無法滿足,所以我們要制造一個Hopper或Ampere架構的處理器,但要運用我們目前掌握的所有數值計算知識以及你提到的所有其他改進”?你認為這種情況會在2030年之前發生嗎?
黃仁勛:沒必要。原因在于,每一代產品的架構都不僅僅局限于晶體管的尺寸。它還涉及到大量的工程設計、封裝、堆疊、數值計算和系統架構。
當產能耗盡時,想要輕易地回到之前的制程節點……那需要投入大量的研發資源,誰也負擔不起。我們有能力向前發展,但我認為我們負擔不起回頭路。現在,假設有一天,我們突然意識到:“我們再也無法擁有更多的產能了。”我會選擇回到7nm制程嗎?當然會毫不猶豫地選擇它。
Q:我之前和人討論時,有人問過我一個問題:為什么英偉達不同時開展多個架構完全不同的芯片項目?比如,可以開發類似Cerebras的晶圓級芯片,也可以開發類似Dojo 的大型封裝芯片,還可以開發不使用 CUDA 的芯片。英偉達擁有足夠的資源和工程人才來并行開發所有這些芯片。考慮到人工智能和架構的未來發展方向難以預測,為什么要把所有雞蛋都放在一個籃子里呢?
黃仁勛:哦,我們當然可以。只是我們沒有更好的辦法。我們能做所有這些事情,但效果并不理想。我們在模擬器里模擬了所有情況,結果證明更糟。所以我們不會這么做。我們現在做的正是我們想做的項目。如果工作負載發生巨大變化——我指的不是算法,而是工作負載本身,而這取決于市場格局——我們可能會考慮增加其他加速器。
例如,我們最近新增了Groq ,并且計劃將其整合到我們的 CUDA 生態系統中。我們現在這樣做是因為token價值飆升,可以采用不同的定價策略。就在幾年前token要么是免費的,要么價格非常低廉。但現在,我們的客戶群體各不相同,他們需要不同的解決方案。因為客戶收入很高——例如我們的軟件工程師——如果我能為他們提供響應速度更快的代幣,從而讓他們比現在更高效,我愿意為此付費。
但這個市場是最近才出現的。所以我認為我們現在有能力基于響應時間,將同一個模型劃分成不同的細分市場。這就是我們決定擴展帕累托前沿,并創建一個響應時間更快、但吞吐量更低的推理細分市場的原因。在此之前,更高的吞吐量總是更好的。我們認為,未來可能會出現平均售價(ASP)非常高的代幣,即使工廠的吞吐量較低,ASP 也能彌補這一點。
這就是我們這么做的原因。但除此之外,從架構角度來看,如果我有更多資金,我會加大對英偉達架構的投入。
Q:最后一個問題。假設深度學習革命沒有發生,英偉達會做什么?
黃仁勛:加速計算,這和我們一直以來所做的一模一樣。我們公司的理念是摩爾定律將會……通用計算在很多方面都很出色,但對于很多計算任務來說,它并非理想之選。
因此,我們將一種名為GPU(CUDA)的架構與CPU結合起來,從而加速CPU的工作負載。不同的代碼內核或算法可以卸載到GPU上執行。這樣一來,應用程序的運行速度就能提升100倍、200倍。這項技術有哪些應用呢?顯然,它適用于工程、科學、物理、數據處理、計算機圖形學、圖像生成等各個領域。即使人工智能今天尚未出現,英偉達的規模也會非常龐大。
原因相當根本,那就是通用計算的擴展能力已基本達到極限。而唯一的方法……或者說,實現這一目標的方法之一,就是通過領域特定加速。我們最初關注的領域之一是計算機圖形學,但還有許多其他領域。種類繁多,包括粒子物理和流體動力學、結構化數據處理,以及各種各樣能夠從 CUDA 中受益的算法。
我們的使命是真正將加速計算帶給全世界,推進通用計算無法勝任的應用,并擴展到足以幫助某些科學領域取得突破的水平。早期的一些應用包括分子動力學、用于能源勘探的地震數據處理、圖像處理等等,所有這些領域通用計算的效率都太低,無法勝任。
如果沒有人工智能,我會非常難過。但正因為我們在計算機領域取得了進步,深度學習才得以普及。我們讓任何研究人員、任何科學家、任何學生,無論身處何地,都能使用個人電腦或GeForce顯卡,開展令人驚嘆的科學研究。這一根本承諾從未改變,絲毫未變。
如果你看過GTC,就會發現它最初的部分完全與人工智能無關。無論是計算光刻、量子化學,還是數據處理等等,都與人工智能無關。而且這些內容仍然非常重要。我知道人工智能非常有趣,也很令人興奮,但還有很多人在做著與人工智能無關的重要工作,張量也不是唯一的計算方法。我們希望能夠幫助到所有人。
文 / 黃仁勛 美國工程院院士、NVIDIA創始人兼首席執行官
來源:C114通信網
文章僅代表作者本人觀點
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.