![]()
凌晨,英偉達(dá)CEO黃仁勛接受了知名科技主持人Dwarkesh Patel的專訪,長達(dá)1小時(shí)45分鐘。
這位油管百萬大V以遞進(jìn)式的提問方式和極其鋒利的選題而出名,這次也不例外地選擇了直白開場,一上來就直戳英偉達(dá)的“肺管子”,問黃仁勛:“如果軟件被商品化了,那英偉達(dá)會不會也被商品化?”
有網(wǎng)友評價(jià)這次訪談:很少見黃仁勛這么“生氣”。
![]()
在這次訪談中,黃仁勛深度回答了關(guān)于AI時(shí)代的競爭本質(zhì)、英偉達(dá)如何鎖住供應(yīng)鏈、為什么不做AI云,以及中國與AI芯片等問題。
我們整理了這次訪談,內(nèi)容亮點(diǎn)都在下面。
![]()
01
英偉達(dá)真正的護(hù)城河不是芯片,是供應(yīng)鏈
Dwarkesh:現(xiàn)在市場上有一種看法是,AI會讓軟件逐漸商品化,很多軟件公司的估值已經(jīng)因此下滑了。
從一個(gè)可能比較天真的角度來看:你們把設(shè)計(jì)交給晶圓廠,比如把GDS文件交給TSMC(臺積電),再由他們制造芯片,然后再和像SK Hynix、Micron、Samsung做的HBM封裝在一起,最后送到ODM廠組裝成整機(jī)。
所以本質(zhì)上,英偉達(dá)做的是軟件,只不過由別人來制造。如果軟件被商品化了,那英偉達(dá)會不會也被商品化?
黃仁勛:歸根結(jié)底,總有一件事必須發(fā)生:把電子變成Token。不僅僅是變成Token,還要讓這些Token越來越有價(jià)值。我認(rèn)為這件事很難被完全商品化。
把電子轉(zhuǎn)化為Token本身就是一段非常復(fù)雜的旅程,就像讓一個(gè)分子比另一個(gè)分子更有價(jià)值一樣,這里面包含了大量的藝術(shù)、工程、科學(xué)和發(fā)明。我們現(xiàn)在正在親眼見證這一切發(fā)生,而這個(gè)過程遠(yuǎn)沒有被完全理解,也遠(yuǎn)沒有結(jié)束。所以我不認(rèn)為它會被商品化——當(dāng)然,我們會讓這個(gè)過程變得更高效。
如果用剛才的方式來理解英偉達(dá),已經(jīng)接近我對公司的心智模型了:輸入是電子,輸出是Token,中間就是英偉達(dá)。我們的工作是用盡可能少的東西,完成這個(gè)轉(zhuǎn)化過程,并把能力做到極致。
所謂“盡可能少”,意思是能不做的事情,我們就不做。我們會把這些事情交給合作伙伴,讓它成為整個(gè)生態(tài)的一部分。如果你看今天的英偉達(dá),我們在上下游都有極其龐大的合作生態(tài),所以我們盡量少做,但我們必須做的那一部分是極其困難的。我不認(rèn)為這部分會被商品化。
Dwarkesh:那企業(yè)軟件公司呢?很多人覺得它們會被AI沖擊。
黃仁勛:現(xiàn)在很多軟件公司,本質(zhì)上是“工具制造商”。比如Excel、PowerPoint,或者像Cadence、Synopsys。當(dāng)然也有一些是流程系統(tǒng),但很大一部分是工具。但我看到的趨勢是完全相反的:未來Agent的數(shù)量會指數(shù)級增長,使用這些工具的用戶也會指數(shù)級增長。也就是說工具的使用量,會暴漲。
舉個(gè)例子:像Synopsys Design Compiler這種工具,未來它的實(shí)際用量很可能會暴漲。今天我們被工程師數(shù)量限制住了,但未來,每個(gè)工程師都會有一堆Agent輔助。這些Agent會去探索設(shè)計(jì)空間,探索的程度會遠(yuǎn)遠(yuǎn)超過今天。而它們會用的,正是今天這些工具。
所以我認(rèn)為工具的使用量,會推動這些軟件公司的增長,而不是壓垮它們。這件事之所以現(xiàn)在還沒有發(fā)生,是因?yàn)锳gent還不夠會用工具。接下來會發(fā)生兩件事:要么這些軟件公司自己去做Agent;要么Agent變得足夠強(qiáng)大,可以使用這些工具。最終很可能是兩者同時(shí)發(fā)生。
Dwarkesh:在你們最近的財(cái)報(bào)里,我看到英偉達(dá)已經(jīng)有接近1000億美元的采購承諾,還有分析認(rèn)為這個(gè)數(shù)字可能會達(dá)到2500億美元。有一種解讀是這樣的:英偉達(dá)的護(hù)城河在于你們鎖定了未來幾年關(guān)鍵的稀缺資源,比如晶圓、內(nèi)存、封裝。別人即使有芯片設(shè)計(jì)能力,也不一定能拿到這些資源。這是你們未來幾年的核心優(yōu)勢嗎?
黃仁勛:這是我們能做到、但別人不太容易做到的一件事情。原因其實(shí)很簡單:我們之所以能在上游做出這么大的承諾,是因?yàn)槲覀冇心芰Π堰@些產(chǎn)能買下來,并且賣出去。
那些承諾有些是顯性的,比如我們直接簽的采購合同;但也有很多是隱性的,比如我們的供應(yīng)鏈伙伴會自己去做投資。因?yàn)槲視退麄兊腃EO溝通,我會告訴他們這個(gè)行業(yè)會變多大、為什么會變大、我們是如何推理出來的。在這個(gè)過程中,我其實(shí)是在對齊整個(gè)上游生態(tài)的認(rèn)知。
那為什么他們愿意為我們投資,而不是為別人?原因很簡單:他們知道我有能力把他們的產(chǎn)能買下來,并賣給下游。英偉達(dá)的下游需求非常大,正是因?yàn)橛羞@種下游需求的規(guī)模,才讓他們愿意在上游投入。
如果你去看GTC大會,你會發(fā)現(xiàn)很多人對它的規(guī)模感到驚訝。這是一個(gè)360度的AI生態(tài),整個(gè)AI世界的人都在一個(gè)地方,而他們來這里,是因?yàn)樗麄冃枰舜恕I嫌涡枰吹较掠危掠涡枰吹缴嫌巍K麄円残枰吹紸I的發(fā)展,以及那些AI原生公司和創(chuàng)業(yè)公司。
我花了很多時(shí)間,不斷去告知和影響我們的供應(yīng)鏈和生態(tài)伙伴,讓他們理解機(jī)會是什么、為什么會發(fā)生、什么時(shí)候會發(fā)生、規(guī)模會有多大。很多人會覺得我的Keynote有點(diǎn)像上課,甚至有點(diǎn)折磨,但這是故意的。因?yàn)?strong>我需要讓整個(gè)生態(tài),像我一樣去理解未來。
03
沒有任何一個(gè)瓶頸,會持續(xù)超過2到3年
Dwarkesh:我想更具體地理解一個(gè)問題:上游供應(yīng)鏈真的能跟得上嗎?你們過去幾年基本是收入翻倍增長,同時(shí)提供給全球的算力也在大幅增長。現(xiàn)在這個(gè)規(guī)模已經(jīng)很大了,比如你們是TSMC先進(jìn)制程(N3、N2)的最大客戶之一,甚至有分析說,今年AI會占到N3產(chǎn)能的60%,明年可能到80%以上。
那問題來了,如果你已經(jīng)是最大客戶了,你還怎么繼續(xù)“翻倍”?這個(gè)增長會不會被上游限制住?
黃仁勛:在某一個(gè)時(shí)間點(diǎn)上,需求超過供給,是很正常的事情——甚至,這是一種好狀態(tài)。你希望一個(gè)行業(yè)的即時(shí)需求是大于總供給的。當(dāng)然,也可能會在某一個(gè)具體環(huán)節(jié)被卡住,比如說,有時(shí)候真的會被“水管工”卡住(笑)。
Dwarkesh:水管工?
黃仁勛:對,真的。你可能在某個(gè)時(shí)間點(diǎn),被某個(gè)完全意想不到的環(huán)節(jié)限制住。但這并不是壞事,因?yàn)楫?dāng)某一個(gè)瓶頸出現(xiàn)的時(shí)候,整個(gè)行業(yè)會迅速“圍攻”它。
舉個(gè)例子:前幾年大家一直在討論CoWoS,但現(xiàn)在你已經(jīng)很少聽到有人談這個(gè)問題了。因?yàn)檫^去兩年,整個(gè)行業(yè)對它進(jìn)行了極端投入,連續(xù)擴(kuò)產(chǎn),現(xiàn)在基本已經(jīng)解決了。TSMC現(xiàn)在也已經(jīng)意識到,CoWoS的供給必須和邏輯芯片和內(nèi)存的需求同步擴(kuò)展。以前,CoWoS和HBM是“特殊技術(shù)”,但現(xiàn)在已經(jīng)不是了,它們已經(jīng)變成了主流計(jì)算的一部分。
我們現(xiàn)在比以前更有能力去影響更大范圍的供應(yīng)鏈。我現(xiàn)在說的這些其實(shí)5年前我就已經(jīng)在說了,有些公司當(dāng)時(shí)相信并且投資了,比如Micron,我還記得當(dāng)時(shí)和他們CEO的那次會面,我當(dāng)時(shí)非常明確地告訴他們,未來會發(fā)生什么、為什么會發(fā)生。他們當(dāng)時(shí)真的投入了,而且投入得很深。從LPDDR到HBM,他們都做了很多投資,結(jié)果當(dāng)然也非常好。有些公司后來才跟上,但現(xiàn)在大家基本都已經(jīng)在這個(gè)節(jié)奏里了。
所以我的看法是:沒有任何一個(gè)瓶頸,會持續(xù)超過兩到三年,每一代都會有新的瓶頸,但也都會被解決。現(xiàn)在大家已經(jīng)開始提前幾年去預(yù)判這些瓶頸,并提前投資。比如硅光(silicon photonics),比如新的封裝技術(shù)、新的測試設(shè)備……我們在過去幾年做了很多這樣的事情,本質(zhì)上是在“重塑供應(yīng)鏈”,讓它為未來的規(guī)模做好準(zhǔn)備。
Dwarkesh:聽起來有些瓶頸比其他更容易擴(kuò)展,比如CoWoS和封裝可以擴(kuò),但有些東西,比如制造能力本身,可能更難。
黃仁勛:我剛才其實(shí)已經(jīng)說到最難的那個(gè)了:水管工,還有電工。這是最難擴(kuò)展的。
這也是為什么我對現(xiàn)在很多末日論者“AI會終結(jié)工作”的說法感到擔(dān)憂。如果我們?nèi)衲贻p人不要做軟件工程師,那未來我們就會缺軟件工程師。10年前,有人說“千萬不要做放射科醫(yī)生”,說這是第一個(gè)會被AI取代的職業(yè),這些視頻現(xiàn)在網(wǎng)上還能找到。結(jié)果呢?我們現(xiàn)在缺放射科醫(yī)生。
Dwarkesh:回到剛才的問題,制造能力這邊,你如何讓晶圓產(chǎn)能每年翻倍?如何讓EUV設(shè)備每年翻倍?
黃仁勛:這些都不是問題,它們都可以在2到3年內(nèi)擴(kuò)展。關(guān)鍵只有一個(gè),那就是需求信號(demand signal)。一旦有明確的需求,能做1臺,就能做10臺;能做10臺,就能做100萬臺……這些東西并不難復(fù)制。
Dwarkesh:那你會不會直接去跟ASML說:“未來三年我們需要更多EUV機(jī)器”?
黃仁勛:有些事情我會直接做,有些是間接做。如果我能說服TSMC,那ASML自然也會被說服,所以要找到真正的關(guān)鍵節(jié)點(diǎn)。但這些都不讓我擔(dān)心——真正讓我擔(dān)心的是能源,你不可能在沒有能源的情況下建立一個(gè)新產(chǎn)業(yè)。無論是想重建制造業(yè)、建AI工廠、做電動車、做機(jī)器人,這些都需要能源,而能源是一個(gè)長期問題。相比之下,芯片產(chǎn)能和封裝只是2到3年的問題。
Dwarkesh:我聽過一些完全相反的說法,所以我不確定該相信誰(笑)。
黃仁勛:你現(xiàn)在是在跟專家對話(笑)。
04
AI只是計(jì)算的一部分,而計(jì)算遠(yuǎn)不止AI
Dwarkesh:我想再回到競爭問題,比如Google TPU。現(xiàn)在世界上最強(qiáng)的模型里,有相當(dāng)一部分是在TPU上訓(xùn)練的,這對英偉達(dá)意味著什么?
黃仁勛:我們做的東西是完全不同的。英偉達(dá)做的是加速計(jì)算(accelerated computing),而不是一個(gè)“張量處理單元”。加速計(jì)算被用在各種各樣的領(lǐng)域,比如分子動力學(xué)、數(shù)據(jù)處理、流體力學(xué)……當(dāng)然,也包括AI。
AI現(xiàn)在是最熱門的討論方向,但計(jì)算遠(yuǎn)不止AI。我們做的是重新發(fā)明計(jì)算方式,從通用計(jì)算走向加速計(jì)算。我們的覆蓋范圍比任何TPU都要大得多,因?yàn)槲覀兛梢约铀偎袘?yīng)用。
Dwarkesh:但現(xiàn)實(shí)情況是,你們現(xiàn)在的收入絕大多數(shù)還是來自AI,而不是來自藥物發(fā)現(xiàn)或者量子計(jì)算。而AI的核心計(jì)算,很多人認(rèn)為就是矩陣乘法。TPU在這方面是高度優(yōu)化的,雖然GPU更通用。那問題是,對于當(dāng)前這波AI需求來說,TPU是不是更適合?
黃仁勛:矩陣乘法確實(shí)很重要,但它不是全部。如果你想發(fā)明新的attention機(jī)制,想用不同方式做計(jì)算分解,或者想設(shè)計(jì)全新的模型架構(gòu),比如混合SSM模型,融合diffusion和autoregressive模型……你需要的是一個(gè)完全可編程的系統(tǒng)。
AI進(jìn)步的核心是算法。摩爾定律大概每年提升25%,但我們卻在實(shí)現(xiàn)10倍甚至100倍的提升。這些提升來自新的算法、新的模型結(jié)構(gòu)、新的計(jì)算方式,而如果沒有可編程性,你甚至不知道從哪里開始做這些創(chuàng)新。
Dwarkesh:那我們聊一個(gè)更現(xiàn)實(shí)的問題。你的客戶,比如Amazon、Google、Microsoft,他們有能力寫自己的kernel,甚至做自己的軟件棧。那CUDA還重要嗎?
黃仁勛:CUDA是一個(gè)非常豐富的生態(tài)系統(tǒng)。如果你要開發(fā)系統(tǒng),從CUDA開始是非常合理的。我們支持所有框架,如果你要寫自定義kernel也可以。我們甚至在Triton里投入了大量技術(shù)。
但你要考慮,當(dāng)系統(tǒng)出問題時(shí),是你的代碼有問題,還是底層系統(tǒng)有問題?你當(dāng)然會希望問題出在你自己這里,CUDA的價(jià)值就在于,你可以信任底層。
另外一個(gè)關(guān)鍵點(diǎn)是安裝基數(shù)(install base),作為開發(fā)者,你最想要的是你的軟件可以運(yùn)行在大量機(jī)器上。我們現(xiàn)在有數(shù)億GPU,在所有云平臺上,各種型號,各種規(guī)模。這意味著,你開發(fā)一次,就可以在全世界運(yùn)行。
Dwarkesh:但如果你的主要客戶是這些超大公司,他們完全可以為自己的系統(tǒng)優(yōu)化,甚至支持多個(gè)硬件平臺。你的優(yōu)勢還成立嗎?
黃仁勛:我們有大量工程師直接和這些AI公司合作。而且你要理解,GPU不是CPU:CPU就像一輛巡航車,誰都能開;但GPU更像F1賽車,你可以開,但要開到極限,需要專業(yè)能力。我們用大量AI來優(yōu)化kernel,很多時(shí)候,我們幫客戶優(yōu)化之后,性能提升2倍,有時(shí)候3倍……哪怕提升50%都是巨大的。而對于一個(gè)擁有巨大算力集群的公司來說,性能提升,直接意味著收入提升。
Dwarkesh:如果這些客戶可以自己做優(yōu)化,競爭是不是會變成誰的價(jià)格更低、性能更高?
黃仁勛:我們在這些AI實(shí)驗(yàn)室里有大量工程師在幫他們優(yōu)化,沒有人比我們更了解我們的架構(gòu)。GPU不像CPU那樣完全通用,它更復(fù)雜,我們可以幫他們從系統(tǒng)里再挖出2倍性能。而且我們的系統(tǒng),在整個(gè)行業(yè)里擁有最好的TCO(總擁有成本),沒有任何一家公司可以證明自己在TCO上比我們更好,無論是訓(xùn)練還是推理。
Dwarkesh:但還是有公司在用其他方案。比如Anthropic最近宣布和Broadcom以及Google合作,很多計(jì)算在TPU上。
黃仁勛:這是一個(gè)非常特殊的例子。如果沒有Anthropic,TPU的增長幾乎不存在,他們是一個(gè)極端案例。
Dwarkesh:但OpenAI也在和AMD合作,甚至在做自己的芯片。
黃仁勛:但他們絕大多數(shù)計(jì)算還是在英偉達(dá)上,我們也會繼續(xù)和他們合作。我不介意別人嘗試其他方案。如果他們不嘗試,怎么知道我們有多好?我們必須持續(xù)證明自己。
你看看歷史上那些做ASIC的項(xiàng)目,有多少最后是做不下去、被砍掉的。做一個(gè)比英偉達(dá)更好的系統(tǒng)并不容易。
Dwarkesh:他們的邏輯是不需要比你更好,只要不比你差太多,但成本更低就可以。
黃仁勛:ASIC的利潤率其實(shí)也很高,大概是65%,英偉達(dá)是70%。差距沒有你想的那么大。
Dwarkesh:那回到一個(gè)問題,為什么英偉達(dá)沒有更早投資這些AI公司?
黃仁勛:我們在能做的時(shí)候,就做了。在更早的時(shí)候,我們沒有能力做那種級別的投資(幾十億美元),那在當(dāng)時(shí)不是我們的模式。
而且我當(dāng)時(shí)沒有意識到,這些公司其實(shí)沒有其他融資路徑——我當(dāng)時(shí)以為他們可以像普通公司一樣去找VC(風(fēng)險(xiǎn)投資)融資,但后來我才意識到,他們要做的事情,VC根本投不了。這是我的誤判。
Dwarkesh:現(xiàn)在你們有大量現(xiàn)金。為什么不自己做云?成為像AWS那樣的公司?
黃仁勛:這是我們的公司哲學(xué):做必須做的事情,盡量少做其他事情。如果我們不做某件事,這個(gè)世界就不會有,那我們就必須做。但云這件事,如果我們不做,會有很多公司來做。所以我們不做。
05
對中國的態(tài)度:算法才是關(guān)鍵
Dwarkesh:很多分析認(rèn)為,中國在先進(jìn)制程上落后。比如他們很多還是在7nm,沒有EUV設(shè)備。在算力上,有人估算,他們大概只有美國的十分之一,在HBM帶寬上,差距可能接近一個(gè)數(shù)量級。那是不是意味著美國可以先達(dá)到這些能力,先部署,先修補(bǔ)漏洞,從而獲得安全優(yōu)勢?
黃仁勛:如果你要讓這個(gè)邏輯成立,那你必須假設(shè)他們沒有算力,但這不是現(xiàn)實(shí)。他們已經(jīng)有大量算力。中國是全球第二大計(jì)算市場,如果他們愿意集中資源,他們完全可以聚合足夠的算力。
Dwarkesh:但他們在帶寬、內(nèi)存等方面還是落后。
黃仁勛:那他們就用更多芯片。AI本質(zhì)上是并行計(jì)算問題。如果你有足夠的能源,你可以用更多節(jié)點(diǎn)來彌補(bǔ)差距。他們有大量能源,他們有很多已經(jīng)建好的數(shù)據(jù)中心,甚至有空置的。他們可以用更多芯片,把系統(tǒng)拼起來,而且他們的芯片制造能力本身就很強(qiáng)。所以“他們沒有AI芯片”這個(gè)說法是錯(cuò)誤的。
Dwarkesh:但先進(jìn)芯片確實(shí)存在差距,比如帶寬差距可能接近一個(gè)數(shù)量級。
黃仁勛:那他們就用更多節(jié)點(diǎn)連接起來。就像我們用NVLink一樣,他們也已經(jīng)在做類似的事情。比如華為,他們已經(jīng)在把大量計(jì)算節(jié)點(diǎn)連接成一個(gè)系統(tǒng),通過硅光(silicon photonics)等技術(shù)把大量計(jì)算資源連接在一起。所以如果你只看單個(gè)芯片,你會低估整個(gè)系統(tǒng)。
而且不要忘了,算法才是關(guān)鍵。他們有大量優(yōu)秀研究者,這才是他們最大的優(yōu)勢。很多AI進(jìn)步來自算法,而不是硬件。如果你在算力上受限,你反而會被逼去做更好的算法,比如DeepSeek——這不是一個(gè)無關(guān)緊要的進(jìn)展。它代表的是一種能力:在算力受限的情況下,依然能做出非常強(qiáng)的模型。
Dwarkesh:那如果DeepSeek這樣的模型在華為芯片上首先優(yōu)化、首先跑起來呢?
黃仁勛:那就是一個(gè)很糟糕的結(jié)果。如果一個(gè)強(qiáng)大的模型,在非美國技術(shù)棧上運(yùn)行得更好,那對美國來說是壞消息。
06
即使沒有AI,英偉達(dá)也會是一個(gè)非常大的公司
Dwarkesh:剛才我們在討論TSMC和內(nèi)存這些瓶頸。那如果未來是這樣一個(gè)世界:你們已經(jīng)占據(jù)了N3的大部分產(chǎn)能,未來還會占據(jù)N2的大部分產(chǎn)能。那有沒有一種可能,你們會回到更舊的制程,比如7nm,利用那些“閑置產(chǎn)能”,重新做類似Hopper或者Ampere這樣的架構(gòu),但結(jié)合今天在數(shù)值計(jì)算、系統(tǒng)設(shè)計(jì)等方面的進(jìn)步。你覺得這種情況,會不會在2030年前發(fā)生?
黃仁勛:沒有必要這樣做。因?yàn)槊恳淮軜?gòu)的進(jìn)步,不只是晶體管規(guī)模。它還包括大量工程優(yōu)化、封裝、堆疊、數(shù)值計(jì)算(numerics)、系統(tǒng)架構(gòu)等等,如果你想回到舊制程,那意味著你要重新做一整套研發(fā)。這是一個(gè)幾乎沒有人負(fù)擔(dān)得起的研發(fā)成本。
我們可以向前推進(jìn),但我不認(rèn)為我們能向后回退。當(dāng)然,如果我們做一個(gè)思想實(shí)驗(yàn):如果有一天,世界真的說“我們再也不會有更多先進(jìn)產(chǎn)能了”,那我會不會立刻用7nm?當(dāng)然會。毫不猶豫。
Dwarkesh:還有一個(gè)問題,是別人問我的。為什么英偉達(dá)不同時(shí)做多個(gè)完全不同的芯片項(xiàng)目?比如類似Cerebras那種超大芯片、類似TeslaDojo那樣的系統(tǒng),甚至做一個(gè)完全不依賴CUDA的架構(gòu)。你們有資源、有工程能力,為什么不把賭注分散?畢竟AI未來的架構(gòu)方向還不確定。
黃仁勛:我們當(dāng)然可以這么做。只是我們沒有看到一個(gè)更好的方案。這些東西我們都在仿真系統(tǒng)里模擬過,它們的效果其實(shí)更差。所以我們不會去做。我們現(xiàn)在做的,就是我們認(rèn)為最正確的架構(gòu)。
當(dāng)然,如果未來工作負(fù)載本身發(fā)生變化——我說的不是算法變化,而是工作負(fù)載的形態(tài)變化,那我們可能會增加新的加速器。比如最近,我們引入了Grok相關(guān)的方向,并且會把它整合進(jìn)CUDA生態(tài)。
這是因?yàn)門oken的價(jià)值變高了。幾年前,Token幾乎是免費(fèi)的,或者非常便宜。但現(xiàn)在不一樣了,現(xiàn)在不同客戶對Token有不同需求。比如,如果我是軟件工程師,我愿意為更快響應(yīng)的Token付錢,因?yàn)樗茏屛腋咝А_@個(gè)市場是最近才出現(xiàn)的。
所以我們現(xiàn)在可以做一件事:同一個(gè)模型根據(jù)響應(yīng)時(shí)間,劃分出不同市場。這也是為什么我們決定擴(kuò)展推理的“帕累托前沿”(Pareto frontier)做一個(gè)響應(yīng)更快、但吞吐更低的推理形態(tài)。
過去大家都認(rèn)為吞吐越高越好,但現(xiàn)在可能出現(xiàn)一種市場:Token價(jià)格很高(ASP高),即使吞吐低,整體收益仍然更高。如果是這樣那我們就會去做。但從架構(gòu)角度來說,如果我有更多資源,我更愿意把它投入到現(xiàn)有架構(gòu)上,而不是分散。
Dwarkesh:這個(gè)高價(jià)Token市場的想法非常有意思。
黃仁勛:是的,本質(zhì)是市場分層(segmentation)。
Dwarkesh:最后一個(gè)問題。假設(shè)深度學(xué)習(xí)革命沒有發(fā)生,英偉達(dá)今天會在做什么?
黃仁勛:還是同一件事:加速計(jì)算。我們公司的基本假設(shè)一直是,摩爾定律會放緩,通用計(jì)算不會適用于所有問題。所以我們把GPU和CPU結(jié)合,讓GPU去加速特定計(jì)算。
不同的算法、不同的kernel,可以被卸載到GPU上執(zhí)行,從而讓應(yīng)用加速100倍、200倍。這些應(yīng)用在幾乎所有地方:科學(xué)計(jì)算、工程、物理、數(shù)據(jù)處理、圖形計(jì)算、圖像生成……即使沒有AI,英偉達(dá)也會是一個(gè)非常大的公司。
因?yàn)檫@是一個(gè)更基礎(chǔ)的問題,通用計(jì)算的擴(kuò)展已經(jīng)接近極限,而解決方案就是領(lǐng)域?qū)S眉铀伲╠omain-specific acceleration)。我們從圖形開始,但其實(shí)有無數(shù)其他領(lǐng)域,像分子動力學(xué)、地震數(shù)據(jù)處理、能源勘探、圖像處理……這些都是通用計(jì)算無法高效解決的問題。我們的使命一直是把加速計(jì)算帶給世界,推動那些通用計(jì)算無法突破的領(lǐng)域。
當(dāng)然,如果沒有AI,我會很難過。但正是因?yàn)槲覀冊谟?jì)算上的這些進(jìn)展,讓深度學(xué)習(xí)更加普及,讓任何人都可以用一張GPU卡做出很厲害的事情。這一點(diǎn),從來沒有改變。
如果你去看GTC,前面很大一部分內(nèi)容其實(shí)都不是AI。比如計(jì)算光刻、量子化學(xué)、數(shù)據(jù)處理,這些都是非常重要的工作,只是沒有AI那么火。
世界上有很多重要的事情并不依賴AI,而Tensor也不是唯一的計(jì)算方式。我們希望幫助所有人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.