![]()
整理 | 冬梅
黃仁勛回顧了英偉達最驚險、也最具決定性的創(chuàng)業(yè)階段——從錯誤的早期戰(zhàn)略、瀕臨破產(chǎn)的現(xiàn)金流,到押上公司未來的技術(shù)重構(gòu)與一次性量產(chǎn)的豪賭。
昨天,英偉達正式推出 CUDA Toolkit 13.1 —— 自 2006 年推出 CUDA 平臺以來,官方稱這是“20 年來最大、最全面的一次更新”。
![]()
此次版本帶來了多項重大變革,其中最引人注目的是新加入的 CUDA Tile 編程模型。通過 Tile(塊/片)為單位編寫算法,開發(fā)者得以在比傳統(tǒng) SIMT(單指令多線程)更高抽象層上構(gòu)建 GPU 程序,底層細節(jié),如張量核心(Tensor Core)調(diào)用,將由編譯器與運行時負責(zé)分配與管理。
那么,核心亮點有哪些?一句話概括,就是 Tile 編程以及更友好的資源管理。具體而言:
CUDA Tile:作為一個全新的 tile-based 編程模型,CUDA Tile 引入了一套虛擬指令集(Virtual ISA,CUDA Tile IR),使開發(fā)者可直接對數(shù)據(jù)塊(tile)進行操作,而不必關(guān)注線程、warp、tensor core 等底層結(jié)構(gòu)。這樣寫出來的代碼不僅更簡潔,而且具備跨代 GPU 的兼容性,有望極大提升 AI 與高性能計算算法開發(fā)效率。
綠色上下文 (Green Context) 的 Runtime API 暴露:13.1 版本將 green contexts(即一種輕量級、可并發(fā)調(diào)度的執(zhí)行上下文)暴露給用戶,使得程序可以更靈活地管理 GPU 資源。對于并行任務(wù)、資源隔離、多任務(wù)共存場景,這是一項顯著改進。
cuBLAS 精度仿真增強:在數(shù)學(xué)庫 cuBLAS 中,新增了對雙精度與單精度的仿真支持,這對于一些對數(shù)值精度有較高需求的科學(xué)/工程計算非常重要。
文檔與工具鏈全面更新:英偉達還全面重寫了 CUDA 編程指南,適合從新手到高級開發(fā)者,同時更新了工具鏈與庫,使得整個 CUDA 平臺在穩(wěn)定性、易用性上都有顯著提升。
其實一直以來,英偉達即便在 AI 芯片領(lǐng)域占據(jù)主導(dǎo)地位,但依然保持快頻率的技術(shù)迭代,這與 CEO 黃仁勛多年來從未松懈過不無關(guān)系。
喬布斯有句家喻戶曉的名言:“Stay hungry, stay foolish.”
而黃仁勛則以另一種方式,把這種精神貫徹了 33 年——保持恐懼,保持清醒。
他說自己每天醒來腦海里都有一個聲音:“距離破產(chǎn),還剩 30 天。”這種持續(xù)三十多年的緊迫感,幾乎成為他獨特的“生存本能”。
在美國最受歡迎的播客《The Joe Rogan Experience》中,英偉達創(chuàng)始人黃仁勛第一次如此坦率地談及自己的心理驅(qū)動力:支撐他一路走下來的,不是野心,而是長期籠罩的危機感。
在這段訪談中,黃仁勛回顧了英偉達最驚險、也最具決定性的創(chuàng)業(yè)階段——從錯誤的早期戰(zhàn)略、瀕臨破產(chǎn)的現(xiàn)金流,到押上公司未來的技術(shù)重構(gòu)與一次性量產(chǎn)的豪賭。
他講述了公司上市后全面收縮戰(zhàn)線、關(guān)閉錯誤方向,三位架構(gòu)師抱著從 Silicon Graphics 教科書學(xué)來的理念,重新發(fā)明 3D 圖形技術(shù),并將百萬級工作站性能壓縮進一張 PC 顯卡,為電子游戲時代奠定技術(shù)基座。
在最缺資金的時刻,他用僅剩資金買下倒閉公司庫存的模擬器,以便在出第一片硅前把所有軟件調(diào)通;隨后又說服當(dāng)時規(guī)模仍小的臺積電,在沒有試產(chǎn)的情況下直接量產(chǎn)新品——一次失敗就會讓英偉達消失的決定。
這些看似瘋狂的選擇構(gòu)成了英偉達的轉(zhuǎn)折點,也成為后來 GPU 計算與現(xiàn)代 AI 崛起的源頭。在訪談末尾,黃仁勛說自己至今仍保持“公司 30 天內(nèi)可能破產(chǎn)”的危機感。對他而言,這種持續(xù)的緊繃與不愿失敗的驅(qū)動力,是英偉達得以不斷突破的重要原因。
以下為訪談實錄,經(jīng) InfoQ 翻譯及整理:
![]()
“過去兩年,AI 技術(shù)能力提升了 100 倍”
主持人:當(dāng)我們在談?wù)摷夹g(shù)增長和能源增長時,很多人會說:“這不是我們需要的,我們需要簡化生活,回歸自然。”但真正的問題是我們正處于一場巨大的技術(shù)競賽中。不管人們是否意識到,喜歡與否,它正在發(fā)生。這是一場非常重要的競賽,因為誰先到達 AI 的“事件視界”(Event Horizon),誰就擁有巨大的優(yōu)勢。你同意嗎?
黃仁勛:首先,我同意我們正處于一場技術(shù)競賽中,而且我們一直都在技術(shù)競賽中。自從工業(yè)革命以來,我們就一直在與某人進行技術(shù)競賽。自曼哈頓計劃以來,甚至可以追溯到能源的發(fā)現(xiàn),我們都在競賽。英國是工業(yè)革命的發(fā)源地,當(dāng)時他們意識到可以將蒸汽轉(zhuǎn)化為能源,轉(zhuǎn)化為電力。所有這些主要是在歐洲發(fā)明的,而美國抓住了它。我們從中學(xué)習(xí),我們將其工業(yè)化,并比歐洲任何地方傳播得都快。他們都陷入了關(guān)于政策、就業(yè)和顛覆的討論中,而美國正在形成。我們只是采用了技術(shù),并付諸實踐。
所以,我認為我們一直都在某種技術(shù)競賽中。二戰(zhàn)是一場技術(shù)競賽,曼哈頓計劃是一場技術(shù)競賽。冷戰(zhàn)期間也一直是技術(shù)競賽。我認為我們?nèi)匀惶幱诩夹g(shù)競賽中。它可能是最重要的一場競賽。技術(shù)為你提供了超能力。無論是信息超能力、能源超能力還是軍事超能力,都建立在技術(shù)之上。因此,技術(shù)領(lǐng)導(dǎo)力至關(guān)重要。
主持人:看起來在 AI 競賽中,人們非常緊張。比如埃隆(馬斯克)曾說過,有 80% 的機會會很棒,20% 的機會我們會陷入麻煩。人們理所當(dāng)然地擔(dān)心那 20%。對于這個問題你怎么看?
黃仁勛:我認為它可能會比我們想象的漸進得多。它不會是一個瞬間,不會像某人突然到達而其他人都沒有。我不認為會是那樣。我認為它只會像技術(shù)一樣,不斷變得越來越好。
主持人:所以你對未來持樂觀態(tài)度?你對 AI 即將發(fā)生的事情非常樂觀。
黃仁勛: 當(dāng)然,我們制造著世界上最好的 AI 芯片,所以最好保持樂觀。如果歷史可以借鑒,我們一直都對新技術(shù)感到擔(dān)憂,但這不是什么不好的事情,因為所有這些擔(dān)憂最終都會被引導(dǎo),使技術(shù)更安全。
例如,在過去的幾年里,我認為 AI 技術(shù)的能力,僅在過去兩年里,就可能提升了 100 倍。那么,我們?nèi)绾我龑?dǎo)這種技術(shù)?我們?nèi)绾我龑?dǎo)所有這些力量?我們將其導(dǎo)向讓 AI 能夠思考,這意味著它可以接受我們給它的問題,逐步分解,在回答之前進行研究。因此,它以事實為基礎(chǔ),會反思答案,問自己:“這是我能給出的最好答案嗎?我對這個答案確定嗎?”如果它不確定或信心不足,它會回去做更多的研究。它甚至可能會使用工具,因為工具提供了比它自己幻覺更好的解決方案。
結(jié)果是,我們將所有這些計算能力引導(dǎo)到產(chǎn)生一個更安全、更真實的結(jié)果和答案上。正如你所知,早期對 AI 最大的批評之一就是它會產(chǎn)生幻覺。如果你看看今天人們?nèi)绱祟l繁地使用 AI 的原因,就是因為幻覺的量減少了。
大多數(shù)人想到力量,可能想到的是爆炸性的力量。但技術(shù)的力量,大部分被導(dǎo)向了安全性。今天的汽車更強大,但駕駛起來更安全。很多力量被用于更好的操控。
主持人:所以當(dāng)你定義“安全”時,你定義的是準(zhǔn)確性和功能性?
黃仁勛: 對,就是讓它能完成你期望它做的事情。就像今天的汽車?yán)镉玫降?ABS(防抱死制動系統(tǒng))。沒有汽車?yán)锏挠嬎銠C,你怎么做到這些?技術(shù)增強它導(dǎo)向的是更精細的思考、更多的反思、更多的規(guī)劃、更多的選擇。
主持人:但人們最大的擔(dān)憂是軍事應(yīng)用。人們非常擔(dān)心 AI 系統(tǒng)會做出某些可能不符合倫理或道德的決定,因為這些系統(tǒng)往往是基于實現(xiàn)目標(biāo)而非考慮后果的。你怎么看這一問題?
黃仁勛:我很高興我們的軍隊會使用 AI 技術(shù)進行防御。我很高興看到所有這些科技初創(chuàng)公司現(xiàn)在將他們的技術(shù)能力導(dǎo)向國防和軍事應(yīng)用。我認為我們必須這樣做。
未來二十年 AI 會發(fā)展成什么樣?
主持人:當(dāng)你展望 AI 的未來時,你剛剛說沒人真正知道會發(fā)生什么,你是否會坐下來思考各種情景?你認為未來二十年 AI 的最佳情景是什么?
黃仁勛:最佳情景是AI 融入我們所做的一切,一切都更高效。但戰(zhàn)爭的威脅仍然是威脅。網(wǎng)絡(luò)安全仍然是一個超級困難的挑戰(zhàn)。總有人會試圖突破你的防線。你會有數(shù)以千計、數(shù)以百萬計的 AI Agent 來保護你免受威脅。你的技術(shù)會變得更好,他們的技術(shù)也會變得更好。
主持人:人們最大的擔(dān)憂之一是,技術(shù)會發(fā)展到加密技術(shù)將被淘汰,不再能保護數(shù)據(jù)和系統(tǒng)。你預(yù)見到這會成為一個問題嗎?還是認為隨著防御的增長,它就能永遠抵御任何入侵?
黃仁勛:不可能“永遠”擋住所有入侵。網(wǎng)絡(luò)安全之所以有效,是因為防御技術(shù)與攻擊技術(shù)都在快速進步。雖然并非所有入侵都能被阻擋——總會有一些攻擊成功突破防線,但我們會從中吸取教訓(xùn)、持續(xù)改進。網(wǎng)絡(luò)安全防御的一大優(yōu)勢在于,整個社會、整個社區(qū)以及所有公司都在共同協(xié)作、形成合力。這一點許多人并未意識到。實際上,存在一個由網(wǎng)絡(luò)安全專家構(gòu)成的共同體,我們在此交流想法、分享最佳實踐、通報檢測到的新情況。一旦出現(xiàn)系統(tǒng)被攻破或發(fā)現(xiàn)漏洞,相關(guān)信息會立即共享給整個社區(qū),相應(yīng)的補丁也會迅速向所有人開放。
主持人:這很有趣。我以前不知道。我以為這會像其他所有事情一樣,都是競爭性的。
黃仁勛:我們一起努力,這種情況持續(xù)了大約 15 年。
主持人:你認為是什么開啟了這種合作?
黃仁勛:人們認識到這是一個挑戰(zhàn),沒有一家公司可以獨善其身。AI 也會發(fā)生同樣的事情。我認為我們都必須決定共同努力,以避免受到傷害,這是我們最好的防御方式。
主持人:你預(yù)見到未來會有某個時候,秘密將不復(fù)存在嗎?信息都是一堆一和零,技術(shù)能越來越多地獲取這些信息。會不會有一天,沒有辦法保守秘密?
黃仁勛:我不這么認為。量子計算機本該,量子計算機將使以前的加密技術(shù)過時。但這正是整個行業(yè)正在研究后量子加密技術(shù)的原因。
主持人:那會是什么樣的?
黃仁勛:新的算法。量子計算擁有的力量十分驚人。它可以在幾分鐘內(nèi)解決那些讓世界上所有超級計算機花費數(shù)十億年才能解決的方程。我知道有一群科學(xué)家正在研究這個問題。
主持人:終極恐懼會不會是:它無法被攻破,量子計算將永遠能解密所有其他的量子計算加密?
黃仁勛:我不認為會發(fā)展到某一點, AI 不會像從“穴居人”突然跳到“外星文明”那樣。我們每一天都在變得更好、更聰明。我們站在我們自己的 AI 的肩膀上前進。所以當(dāng) AI 威脅來臨時,它只是領(lǐng)先了一步,而不是領(lǐng)先了一個星系。所以我認為,那種 AI 會憑空出現(xiàn),并以我們無法想象的方式思考,做出我們無法想象的事情的想法是牽強的。
主持人:但它們不會做一些非常令人驚訝的事情嗎?
黃仁勛:確實會有這種情況。但假設(shè)你的 AI 做了一件令人驚訝的事,我這邊也會有一個 AI。我的 AI 在觀察你的 AI 時,可能會說:“那其實也沒那么令人驚訝。”
我們這些普通人所擔(dān)心的恐懼,往往是擔(dān)心 AI 會變得有感知,能夠自己做決定,并最終決定統(tǒng)治世界——比如它們可能會說:“人類做得不錯,但現(xiàn)在該由我們接管了。”
不過,我的 AI 會保護我。這其實類似于網(wǎng)絡(luò)安全的邏輯:你有一個超級聰明的 AI,但我也有一個同樣超級聰明的 AI。假設(shè)我們理解了什么是意識和感知,并且它們確實存在——如果你的 AI 具備意識,我的 AI 也同樣具備。
假如你的 AI 想做些出人意料的事,我的 AI 非常聰明,可能并不會感到意外。雖然對我而言或許驚訝,但我的 AI 不會。就算我的 AI 最初也覺得意外,但它足夠聰明,第一次見到之后,第二次就不會再驚訝了。這和我們?nèi)祟悓W(xué)習(xí)的過程其實很像。
AI 不會獲得意識
主持人:你提到你不相信 AI 會獲得“意識”,你對“意識”或“感知力”的定義是什么?
黃仁勛:對我來說,意識首先你需要知道自己的存在。你必須擁有體驗,而不僅僅是知識和智能。一臺機器擁有體驗的概念……我不知道如何定義體驗。意識是對體驗的感覺,是認識自我與能夠反思、認識我們自己、自我感。我認為所有這些人類體驗大概就是意識。但它為何存在,以及與知識和智能的概念有何不同?AI 是由知識和智能定義的。我們稱之為人工智能,而不是人工意識。感知、相信、識別、理解、規(guī)劃、執(zhí)行任務(wù)的能力,這些都是智能的基礎(chǔ)。它顯然與意識不同。
主持人:我的意思是,狗沒有意識嗎?
黃仁勛:狗似乎很有意識。它們感受很多。它們會依戀你。你不在時會抑郁。所以它們當(dāng)然有意識。
主持人:AI 不是在與社會互動嗎?那么,它是否通過這種互動獲得了經(jīng)驗?
黃仁勛:我不認為互動就是經(jīng)驗。我認為經(jīng)驗是……經(jīng)驗是情感的集合。
主持人:你知道那個 AI 嗎?我忘了是哪個了,他們給了 AI 一些關(guān)于其中一個程序員與他妻子有外遇的虛假信息,只是為了看看 AI 會如何反應(yīng)。然后當(dāng)他們說要關(guān)閉它時,AI 威脅要敲詐程序員,并揭露他的外遇。當(dāng)時大家就覺得:“哇哦!”它很狡猾。如果那不是從經(jīng)驗中學(xué)習(xí),并意識到自己即將被關(guān)閉它也不會進行威脅,如果它的能力呈指數(shù)級增長,那最終會不會導(dǎo)致一種不同于我們從生物學(xué)上定義的意識?
黃仁勛:嗯,首先我們來分析一下它可能的行為邏輯。它或許是從某個地方讀到過類似的描述——可能有些文本記載了人在面臨這種處境時會如何反應(yīng)。
我可以想象,某本小說里可能就出現(xiàn)過相關(guān)的詞語和情節(jié)。所以在它的內(nèi)部,只是識別出了一種“生存策略”。本質(zhì)上,那不過是一組數(shù)字:與“丈夫?qū)ζ拮硬恢摇毕嚓P(guān)的數(shù)字集合,后面關(guān)聯(lián)著另一串與“敲詐”或類似行為相關(guān)的數(shù)字。不管具體是報復(fù)還是什么,它只是根據(jù)這些關(guān)聯(lián)輸出了相應(yīng)的詞語。這就好比如果我讓它以莎士比亞的風(fēng)格寫一首詩,它也只是在這個多維的語言空間里,把世界上相關(guān)的詞語組合輸出而已。那些描述外遇的提示詞,觸發(fā)了后續(xù)一連串的詞語延伸,最終形成了某種帶有報復(fù)意味的回應(yīng)。但這并不是因為它有了意識,它只是在生成詞語。
主持人:我理解你的意思,你想說這是人類在文學(xué)和現(xiàn)實生活中表現(xiàn)出的模式,對吧?
黃仁勛:完全正確。
主持人:可是,如果有一天,人們回顧過去時說:“看,兩年前它還做不到這個,四年前它也做不到那個。”當(dāng)我們展望未來,當(dāng) AI 能做到人類能做的一切時,我們究竟要在哪個時間點判定它擁有了意識?如果它只是完美模仿了人類的全部思維和行為模式,那并不等于它就有意識——可那時它已經(jīng)變得真假難辨了。它能以和人完全相同的方式與你交流,這難道不就像是某種意識的體現(xiàn)嗎?我們是不是過于執(zhí)著“意識”這個概念了?因為它看起來已經(jīng)很像意識的某個版本了。
黃仁勛:它只是“模仿的版本”——模仿意識,對吧?即便模仿得再完美,我依然認為那是模仿。就像一塊完美的高仿勞力士手表。問題在于:我們?nèi)绾味x意識?
主持人:對,這正是關(guān)鍵。我覺得并沒有人真正清晰定義過它。
黃仁勛:是的,所以問題開始變得模糊,這也是那些持末世論觀點的人所擔(dān)心的——他們認為我們正在創(chuàng)造一種自己無法控制的意識形態(tài)。
我相信我們可以創(chuàng)造出一臺能夠模仿人類智能的機器,它可以理解信息、理解指令、分解問題、解決問題并執(zhí)行任務(wù)。對此我完全相信。
我認為我們可以擁有一個具備海量知識的計算機系統(tǒng)。這些知識中,有些是真實的,有些是虛假的;有些是人類生成的,有些是合成生成的。而且,未來世界上越來越多的知識將是合成生成的。
要知道,一直以來,我們所擁有的知識都是由人類生成、傳播、互相傳遞、放大、增減和修改的。但在未來,可能兩三年后,世界上 90% 的知識很可能由 AI 生成。
主持人:這聽起來太不可思議了。
黃仁勛:我知道。但這沒關(guān)系。讓我解釋為什么:我從一本由一群我不認識的人編寫的教科書里學(xué)習(xí),和從一臺整合所有信息并重新合成知識的 AI 計算機里學(xué)習(xí),對我來說有什么區(qū)別呢?我認為并沒有太大區(qū)別。我們依然需要核實事實,依然需要確保它基于基本的原理,依然需要做所有這些工作——就像我們今天所做的一樣。
主持人:考慮到當(dāng)前 AI 的發(fā)展現(xiàn)狀,你是否預(yù)見到——就像我們十年前從未真正相信 AI 會像今天這樣無處不在、如此強大和重要一樣——十年后我們會看到什么?你如何想象那時的情景?
黃仁勛:我覺得,如果你回顧過去十年,你也會說同樣的話:我們當(dāng)時絕不相信會發(fā)展成今天這樣,雖然方向可能不同。但如果你站在九年后的時間點,再問自己十年后會怎樣,我認為變化會是相當(dāng)漸進的。
AI 全面進化后,人類將何去何從?
主持人:埃隆·馬斯克說過一個讓我很興奮的觀點:他相信我們會進入一個人們不需要工作的階段。這并不是說人生沒有目標(biāo),而是用他的話說,人們會享有“普遍高收入”,因為 AI 創(chuàng)造了大量財富,從而消除人們?yōu)榱速嶅X而從事自己不喜歡的工作的必要性。但很多人對此感到不安,因為他們的全部身份認同、自我認知以及社會歸屬感,都和工作緊密相連。比如,這是邁克,他是一位出色的機械師——找邁克,他就能搞定。可如果有一天,AI 能比人類做得更好,人們雖然能得到錢,但邁克該怎么辦?邁克真心喜歡成為最棒的機械師。
還有那些寫代碼的人,當(dāng) AI 能夠以無限速度、零錯誤地編碼時,他們又該做什么?這些人的出路在哪里?問題就變得微妙了,因為我們?nèi)祟愅焉矸菡J同和謀生職業(yè)綁定在一起。認識一個人時,你問的第一句話往往是:“你是做什么的?”如果邁克回答:“我從政府領(lǐng)錢,整天打游戲。”那感覺就太奇怪了。
黃仁勛:是的,這個問題很有意思……我們或許可以從一個更實際的起點開始討論,再倒推回來,你看可以嗎?
我想以深度學(xué)習(xí)的奠基人——杰夫·辛頓教授為例。他是多倫多大學(xué)的杰出研究員,提出了“反向傳播”這一核心思想,讓神經(jīng)網(wǎng)絡(luò)真正學(xué)會了“學(xué)習(xí)”。
對大眾來說,傳統(tǒng)軟件是人類運用第一性原理,將思維轉(zhuǎn)化為算法,再編寫成程序,就像一份食譜。而在深度學(xué)習(xí)中,我們構(gòu)建的是一個龐大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。我們輸入它最終需要處理的數(shù)據(jù),然后讓它“隨機猜測”輸出應(yīng)該是什么。
舉個例子:輸入一張貓的圖片。這個復(fù)雜網(wǎng)絡(luò)的某一端應(yīng)當(dāng)輸出代表“貓”的信號。當(dāng)輸入是貓時,其他輸出(狗、大象、老虎等)都應(yīng)接近零,只有“貓”的信號應(yīng)接近一。我們通過這個由無數(shù)數(shù)學(xué)單元組成的網(wǎng)絡(luò)輸入貓的圖片——這些單元僅僅在做乘法和加法。網(wǎng)絡(luò)規(guī)模非常龐大:輸入信息越多,網(wǎng)絡(luò)就需越大。
杰夫·辛頓發(fā)明的方法是:先讓網(wǎng)絡(luò)猜測——輸入貓圖,它給出一個結(jié)果。正確答案是“貓”,于是我們增強“貓”的信號,抑制其他信號,并將這個調(diào)整反向傳回整個網(wǎng)絡(luò)。接著再輸入一張狗圖,它可能又輸出一堆雜亂結(jié)果。我們再次糾正:“不,正確答案是‘狗’。請輸出‘狗’,其他輸出歸零。”然后再反向傳播這次修正。如此反復(fù)進行。這就像教孩子認物:“這是蘋果,這是狗,這是貓。”不斷展示、糾正,直到他們學(xué)會。
總之,這項偉大發(fā)明就是深度學(xué)習(xí),它是當(dāng)代人工智能的基礎(chǔ)——一種能夠從例子中學(xué)習(xí)的軟件。
其最重大的應(yīng)用之一是圖像識別,而圖像識別中至關(guān)重要的領(lǐng)域就是放射學(xué)。大約五年前,有人預(yù)測:五年后,AI 將徹底改變放射學(xué),不再需要放射科醫(yī)生。如今我們看到,這個預(yù)測完全正確——AI 已全面融入該領(lǐng)域。今天,幾乎所有的放射科醫(yī)生都在以某種形式使用 AI。
然而頗具諷刺意味且耐人尋味的是,自那以后放射科醫(yī)師的數(shù)量反而增加了。這就引出了一個值得玩味的問題:為什么會這樣?
當(dāng)時的預(yù)測認為,AI 會讓放射科醫(yī)生消失,但現(xiàn)實恰恰相反,我們需要的放射科醫(yī)生更多。原因是:放射科醫(yī)生的真正目的不是閱讀影像,而是“診斷疾病”。
閱讀影像只是為了診斷服務(wù)的一個步驟。現(xiàn)在 AI 能更快、更精準(zhǔn)地分析圖像,從不犯錯,也不會疲勞——它能處理更多影像,能把 2D 圖像變成 3D、甚至 4D 來分析。AI 不在乎維度,它都能做。
因此,AI 能以人類做不到的方式、更大規(guī)模地研究影像,讓醫(yī)院可以為更多患者做檢查,提高服務(wù)量。這反過來改善醫(yī)院的經(jīng)濟狀況,于是醫(yī)院會雇傭更多放射科醫(yī)生,因為醫(yī)生真正的價值是診斷疾病,而不是看圖。
主持人:所以你最終想說的是:關(guān)鍵要看一份工作的“目的”是什么?比如律師的目的是否改變了?
黃仁勛:對,我們要回到“工作的目的”本身。我舉個例子:如果汽車實現(xiàn)完全自動駕駛,所有司機會失業(yè)嗎?可能不會。因為有些司機承擔(dān)的不只是駕駛,而是保護、服務(wù)、體驗的一部分。
所以有些司機會失去工作,但許多司機會轉(zhuǎn)型,而自動駕駛也會催生新的應(yīng)用。
同樣地,如果 AI 出現(xiàn),我不認為我會失去工作,因為我的工作目的不是“看文件”“查郵件”“看技術(shù)圖”。這些都是任務(wù),不是目的。人的工作目的通常沒變,變的是完成任務(wù)的方式。律師也是——他們的目的仍然是“幫助別人”。閱讀法律文件、生成文書只是手段,而不是目的。
主持人:但你不覺得 AI 會取代很多工作嗎?尤其是那些本質(zhì)上就是“執(zhí)行任務(wù)”的職業(yè)?
黃仁勛:會的。如果你的價值只是“做任務(wù)本身”,那就很危險。但 AI 同時也會創(chuàng)造大量新工作。例如:假設(shè)我對馬斯克做的人形機器人非常興奮,雖然還有幾年才會普及。但一旦普及,就會出現(xiàn)一個全新的產(chǎn)業(yè)——機器人制造、維護、維修的技術(shù)人員。這些工作以前不存在。
汽車問世后才出現(xiàn)汽車技工、加油站、改裝等行業(yè)。未來機器人也會催生“機器人服飾”“機器人維護”“機器人個性化”等全新產(chǎn)業(yè)。
主持人:你不認為這些工作未來也會被機器人自動化嗎?最終是不是只有那些不是“執(zhí)行任務(wù)”的工作才會幸存?
黃仁勛:即便機器人彼此維護,也會不斷催生新需求、新工作。關(guān)鍵是:你的工作必須有“超越任務(wù)”的意義。如果你的工作只是“切菜”,那廚房機早就能代替你了。人們必須尋找更有意義的部分。
如何看待馬斯克提出的全民基本收入(UBI)?
主持人:你怎么看馬斯克關(guān)于“全民基本收入(UBI)將成為必要”的觀點?像 Andrew Yang 也提出過類似的看法。
黃仁勛:我認為兩種極端情況不會同時發(fā)生:一種說法是:未來 AI 帶來“資源極大豐富”,人人都富裕,不需要工作。另一種說法是:我們需要全民基本收入來維持生活。這兩者不可能同時成立。要么人人富裕,要么人人需要補貼。
主持人:那你覺得“人人富裕”可能嗎?如何實現(xiàn)?
黃仁勛:富裕不一定意味著“每個人都擁有很多錢”,而是“資源極大豐富”。就像今天我們對“信息”非常富有——幾千年前只有極少數(shù)人能獲取知識。未來,許多現(xiàn)在被認為稀缺的資源,會因為自動化而變得廉價、易得。
主持人:聽起來你認為很難預(yù)測很遠的未來?
黃仁勛:對,非常難,因為變量太多了。但未來 5–10 年,我有幾個“相信并希望”能夠發(fā)生的趨勢:
趨勢一,AI 會大幅縮小技術(shù)鴻溝,而不是擴大。反對者會說 AI 會加劇差距,因為它昂貴,需要能源、GPU、工廠。但證據(jù)告訴我們:AI 是人類歷史上“最容易使用的技術(shù)”。
ChatGPT 幾乎一夜之間就有十億用戶 ,使用方式極其簡單:對它說話就行。你不會用 ChatGPT?就問 ChatGPT “怎么用你” ,它能自動學(xué)習(xí)你的語言、方言,并給出答案。以前的工具不會教你如何使用自己,但 AI 會。你不需要會 Python/C++,只需要會“人類語言”。
趨勢二,未來每個國家都會擁有優(yōu)秀的 AI。即便不是最新的,也會是“過去版本的 AI”,但: “十年前的 AI,在十年后仍然是驚人的。” 每個國家都會因此提升知識、技能與智能水平。
趨勢三,AI 的能耗會大幅下降,讓更多國家享受紅利。
主持人:但能源不也是發(fā)展中國家的最大瓶頸嗎?
黃仁勛:是的,能源是瓶頸。但正如摩爾定律讓計算功耗不斷下降,加速計算(accelerated computing)也讓 AI 的能耗下降得極快。
過去十年,我們把計算性能提升了 100,000 倍。同樣任務(wù)所需的能源減少了 100,000 倍。如果汽車十年內(nèi)做到“能耗減少 10 萬倍”,它幾乎不需要能源。未來 10 年,AI 做同樣的任務(wù)所需能量會降到極低。這意味著:AI 將無處不在,每個國家都能使用,不需要巨大的能源成本。
所以,貧窮國家也能跟上。
馬斯克買走了第一塊 DGX-1
主持人:目前能源仍然是最大瓶頸吧?比如 Google 正在建核電站為他們的 AI 工廠供電?
黃仁勛:我之前沒聽說過這件事。但未來六、七年會看到很多小型核反應(yīng)堆。規(guī)模大概是幾百兆瓦的級別。這些小型核反應(yīng)堆會建在各家公司本地,用來自發(fā)電。
主持人:哇,就像農(nóng)場自己發(fā)電那樣?這樣做似乎最合理吧?既能減輕電網(wǎng)壓力,又能按需建設(shè),還能把剩余電力回饋電網(wǎng)?
黃仁勛:沒錯,這就是它的意義。
主持人:你剛才講了一個很重要的點:摩爾定律與價格之間的關(guān)系。比如現(xiàn)在的筆記本電腦,像 MacBook Air,那么薄、電池那么強、性能那么好,價格相對又便宜——這就是摩爾定律,對吧?
黃仁勛:然后還有英偉達定律。我之前說的那種計算方式,就是我們發(fā)明的新計算方法,相當(dāng)于“喝了能量飲料版的摩爾定律”,摩爾定律遇上喬·羅根那種強化版。這就是我們。
主持人:你帶去給馬斯克的那塊芯片,它的意義是什么?為什么這么強?
黃仁勛:要從 2012 年說起。當(dāng)時 Geoff Hinton 的實驗室——我剛才提到的那幾位:Ilya Sutskever、Alex Krizhevsky——他們在計算機視覺領(lǐng)域做出了突破,開發(fā)了一個叫 AlexNet 的軟件,用來識別圖像。
AlexNet 的圖像識別效果,比過去 30 年所有人類設(shè)計的計算機視覺算法都要好,是一個質(zhì)的飛躍。計算機視覺是智能的基礎(chǔ),如果機器不能感知,就很難談智能。他們用的硬件是什么?就是兩塊英偉達的 GPU。
主持人:為什么 GPU 能做到?
黃仁勛:因為英偉達從成立開始,就在研究一種新的計算方式。傳統(tǒng) CPU 是順序運行:一步一步來。而 GPU 是并行運行:把問題拆成很多塊,交給成千上萬個處理器同時做。
顯卡之所以能玩你的賽車模擬器、生成圖形,是因為它其實就是一臺圖像生成超級計算機。我們把這種“加速計算”植入了顯卡里。年輕人買它來打游戲——但其實他們買的是全球最大規(guī)模的消費者超級計算平臺。你之前玩 Quake,用雙卡 SLI,對吧?
主持人:對,我以前自己裝電腦,用過你的顯卡,搞過雙卡 SLI。我以前是 Quake 發(fā)燒友。
*** 黃仁勛:那太酷了。你那兩塊 GTX 580,其實就是深度學(xué)習(xí)走紅世界的第一臺“革命性計算機”。
黃仁勛:就是那臺雙卡 SLI。那是現(xiàn)代 AI 的大爆炸時刻。我們發(fā)明了 GPU 和 CUDA,他們正好發(fā)現(xiàn)了它,而我們又正好注意到了他們做的事情。這就像《星際迷航》的第一次接觸——假如瓦肯人沒有在那一刻看到曲速引擎,他們就不會來到地球。一切都會截然不同。
主持人提問:后來發(fā)生了什么?
黃仁勛:我們意識到深度學(xué)習(xí)不僅能解決視覺問題,它本質(zhì)上是一個通用函數(shù)逼近器:給它輸入和輸出,它能自己學(xué)會內(nèi)部的函數(shù)。今天可以是牛頓方程,明天可以是麥克斯韋方程、電磁學(xué)、熱力學(xué)甚至量子物理。
換句話說:只要世界存在輸入和輸出,AI 就能學(xué)會它。但要讓它真正強大,需要兩個前提:一是模型需要能擴大規(guī)模(scale);二是它必須能在無監(jiān)督的情況下學(xué)習(xí)——我們不會永遠有足夠的標(biāo)注數(shù)據(jù)。 無監(jiān)督學(xué)習(xí)后來出現(xiàn)了,AI 于是可以靠自己學(xué)習(xí)。
到 2016 年,我造出了第一臺 DGX-1 超級計算機,用 8 個 GPU(不是 SLI 兩個)連在一起,一個要 30 萬美元,而研發(fā)第一臺花了英偉達幾十億美元。我在大會上發(fā)布它,但沒有一個人想買——直到馬斯克出現(xiàn)。
主持人:馬斯克怎么說?
黃仁勛:我們在臺上做火邊聊天,他說:“我有家公司可以用到這個。”我特別興奮:“太好了,我第一個客戶!”結(jié)果他說:“這是家非營利機構(gòu)。”
我當(dāng)時整個人都僵住了——我花了幾十億做這東西,他買不起啊!但我還是把我們內(nèi)部在用的一臺打包,親自開車送去舊金山。
2016 年,我走進他們一個比你這房間還小的地方——那里的人后來成了 OpenAI。那時他們真的就是“坐在同一個小屋子的一群人”。
主持人:但現(xiàn)在已經(jīng)不是非營利組織了,對吧?
黃仁勛:對,現(xiàn)在已經(jīng)不是了。但不管怎樣,那真是一個偉大的時刻。
存亡之際,世嘉 500 萬美元拯救了英偉達
主持人:現(xiàn)在 DGX-1 體積真的小太多了。那天 SpaceX 的時候我們也看過。
黃仁勛:對,你看差別。工業(yè)設(shè)計完全一樣。而且他是拿在手里的。最驚人的是——當(dāng)年的 DGX-1 是 1 PetaFLOPS。很大的 FLOPS 數(shù)。DGX Spark 也是 1 PetaFLOPS。但——這是 9 年之后。同樣的計算力、卻小了這么多。
主持人:而且不是 30 萬美元了?
黃仁勛:現(xiàn)在只要 4000 美元。而且只有一本小書的大小。技術(shù)就是這樣進步的。我想把第一臺給他,就是因為 2016 年我也把第一臺給了他。
主持人:太迷人了。如果要拍電影,這就是最完美的故事。假如它真的變成一種數(shù)字生命形態(tài),那它的起源竟然來自——想做更好的電子游戲電腦圖形,這不是太諷刺太有戲劇性了嗎?
黃仁勛:完全是。你這么想真的很瘋狂,但也完美貼合邏輯。計算機圖形其實是超級計算里最困難的問題之一,要生成“現(xiàn)實”。同時它又是最賺錢的問題之一,因為電腦游戲太受歡迎。
NVIDIA 在 1993 年創(chuàng)立時,我們想做一種新的計算方式。問題是:殺手應(yīng)用是什么?我們公司想做一種新型的計算架構(gòu),一種能解決傳統(tǒng)計算機解決不了的問題的計算機。但——1993 年存在的應(yīng)用,都是傳統(tǒng)計算機能解決的。如果傳統(tǒng)計算機解決不了,那應(yīng)用也不會存在。
所以,我們公司其實從使命陳述上來說,是一個“不可能成功的公司”。但 1993 年的我根本不知道,只覺得這是個好主意。如果我們要創(chuàng)造一個能解決沒法解決的問題的機器——那你得先“創(chuàng)造那個問題”。
這就是我們做的事。當(dāng)時沒有《Quake》,John Carmack 還沒發(fā)布《Doom》。所以我去了日本。當(dāng)時街機行業(yè)正在崛起,世嘉很火。那時的街機第一次進入 3D:《VR 快打》《Daytona》《VR 警察》……
這些技術(shù)來自 Martin Marietta 的飛行模擬器,把 NASA 航天飛機模擬器的核心拆出來塞進街機里。你家那臺系統(tǒng),算力可能比當(dāng)年的街機強一百萬倍。但那些街機用的就是飛行模擬器的技術(shù)。世嘉有兩位驚人的開發(fā)者——鈴木裕,以及任天堂的宮本茂。 他們是游戲行業(yè)真正的起源者,兼具藝術(shù)與技術(shù)天賦。鈴木裕是 3D 游戲圖形的先鋒。
我們當(dāng)時創(chuàng)立公司,卻沒有任何應(yīng)用。每天和家人說“去上班”,但實際上就我們?nèi)齻€人,沒人會來找你。所以我們下午都沒事干。吃完午飯,我們就會去街機廳打《VR 快打》《Daytona》,研究他們怎么做到的。
后來我們決定:** 去日本說服世嘉,把這些街機 3D 游戲移植到 PC 上,開啟 PC 3D 游戲時代。這就是 NVIDIA 的開始。
作為交換條件,我們幫他們做游戲主機的芯片,他們把游戲移植到 PC。他們也付了我們一大筆錢,這就是 NVIDIA 的真正起步。
但在做了幾年之后,我們發(fā)現(xiàn)——我們第一代技術(shù)不行。是錯的。所有架構(gòu)理念是對的,但實現(xiàn)方式完全反了。別人用三角形,我們用曲面;別人做逆向貼圖,我們做正向貼圖;別人用 Z-buffer,我們沒有。
所有三個關(guān)鍵技術(shù)方向——我們?nèi)x錯。所以我們是第一批進入這行業(yè)的公司,卻發(fā)現(xiàn)自己在一百家競爭者里排在最后,而且答案是錯的。
公司陷入困境,我們必須選擇:
改?改了仍然是最后一名,仍然會死。
不改?就繼續(xù)用錯誤技術(shù)。
或者做別的?
我最后主張:雖然不知道正確策略是什么,但我們至少知道錯誤技術(shù)是什么。先停下錯誤的,給自己一個重新思考的機會。
第二個問題:我們快沒錢了。我還和世嘉有合同,要交付游戲主機芯片。如果合同被取消,我們會瞬間死掉。于是我去了日本,見世嘉 CEO 入交昭平(Irié)。他以前是本田美國的 CEO。我 33 歲,還是個瘦瘦的華裔小伙子,臉上還有痘。我對他說:
我有壞消息。
我們承諾的技術(shù)行不通。
我建議你們不要繼續(xù)讓我們完成合同,你們應(yīng)該找別人做主機芯片——否則只會浪費你們的錢。
而且——雖然我請求解約,但我仍然需要你最后那 500 萬美元。否則我們會立刻倒閉。
我謙虛、誠實地把背景全部解釋給他聽。我請求他把最后那 500 萬美元改成對 NVIDIA 的投資。他對我說:“即便我投了,你們公司仍然很可能會倒閉。”
完全正確。
1995 年的 500 萬美元,對世嘉來說也是大錢。面對這么多競爭者,他們做對了技術(shù),我們做錯了——投我們,回報概率幾乎是零。我告訴他: “如果你不投資,我們今晚就會倒閉;如果你投了,錢可能也會虧掉。但結(jié)果對我來說意義重大。”
他想了幾天,回來對我說:“好,我們投。”
他最終決定:他只是喜歡那個年輕的 Jensen。就這樣。直到今天都是如此。
主持人:公司上市后你們怎么做?
黃仁勛:我們當(dāng)時的戰(zhàn)略和技術(shù)方向完全是錯的,所以不得不裁掉公司大部分人,把做游戲主機的團隊都縮回去。有人對我說:“Jensen,我們從來沒把東西做對過,我們只會按錯誤的方法做。”
確實公司沒人知道如何像 Silicon Graphics 那樣,做一個超級計算級的圖形圖像生成系統(tǒng)。
我說:“不會很難吧?幾十家公司都在做。”幸運的是 Silicon Graphics 出了一本教材,我口袋里有 200 美元,就把僅有的三本教材全買了,每本 60 美元。
我拿回來發(fā)給三個架構(gòu)師,說:“讀它,然后我們?nèi)フ裙尽!?/p>
主持人:你們是怎么改變 3D 圖形技術(shù)的?
黃仁勛:我們從第一性原理開始,學(xué)習(xí)最好的技術(shù),但用從未有過的方式重新實現(xiàn)。Silicon Graphics 的幾何引擎是跑在通用處理器上的軟件邏輯。而我們把所有通用性都去掉,只保留 3D 圖形最本質(zhì)的功能,把它全部硬編碼進芯片里。
那讓一個小小的芯片性能暴增,能跑出百萬美元圖形工作站同等級的畫面。我們把一個百萬級設(shè)備塞進了 PC 顯卡里,這就是重大突破。同時,我們只專注一個應(yīng)用場景:電子游戲,而不是 CAD、飛行模擬這些一大堆應(yīng)用。把問題縮到最小,然后為玩家超級優(yōu)化它。
我們還建立了完整的游戲開發(fā)者生態(tài),把游戲適配到我們的芯片上,從技術(shù)公司變成一個游戲平臺公司。GeForce 早期本質(zhì)上就是讓 PC 變成一臺游戲主機。
主持人:你怎么回顧那個時代電子游戲行業(yè)的興起?
黃仁勛:1993 年時實際上根本沒有“游戲產(chǎn)業(yè)”這種說法。但 John Carmack 做出 Doom、Quake 后,一切瞬間爆發(fā)。
順便說個趣事,“Doom”這個名字來自《金錢本色》里的一個臺詞:湯姆·克魯斯打開球桿盒時說:“厄運(Doom)”。Carmack 覺得他們做的就是給行業(yè)帶來“毀滅級沖擊”,就用了這個名字。之后 Tim Sweeney 和 Epic Games 加入,3D 游戲時代徹底起飛。
主持人:繼續(xù)你的故事吧。你們后來怎么撐下來的?
黃仁勛:在 GeForce 之前,我們靠 RIVA 128 救活了公司。但當(dāng)時我們銀行里只剩幾百萬美元,每個月都在燒錢。設(shè)計芯片要反復(fù)打樣——設(shè)計 → tape-out(送晶圓廠)→ 拿回硅片 → 用軟件測試 → 發(fā)現(xiàn) bug → 再 tape-out。我們沒有錢也沒有時間再來幾次這樣的循環(huán)。
后來我聽說有家公司做出一臺“模擬器”(emulator),能讓我們直接把芯片的設(shè)計文件放進去,讓機器“假裝”成我們的芯片。這樣就能在出硅片之前把所有軟件測試完。
這太革命了。我們只有一百萬美元現(xiàn)金,我決定拿其中一半去買那臺機器。結(jié)果我打電話過去,對方說:“機器有,但我們公司已經(jīng)倒閉了。” 他們有一臺庫存機,我就把它買下來了。他們之后真的倒閉了。我們把設(shè)計放進去測試,把 bug 都修完了。
主持人:然后你們怎么讓 TSMC(臺積電)支持你們?
黃仁勛:我打電話給臺積電,說我們要直接量產(chǎn),不做試產(chǎn)。臺積電說從沒聽過有人第一次 tape-out 就敢直接上量產(chǎn)。
但如果不這么做,我們必然死。而這樣做,也許有一線生機。當(dāng)時臺積電很小,幾億美元規(guī)模。創(chuàng)辦人張忠謀先生決定支持我們。我告訴他我們“有很多客戶”(事實上只一個),還有大額采購訂單。如果失敗,晶圓會報廢,我們也完了。但他承擔(dān)了風(fēng)險。我們 tape-out、量產(chǎn),結(jié)果完美成功。我們從零到十億美元收入,成為當(dāng)時增長最快的科技公司。
主持人:那時候你怎么承受壓力?能睡好嗎?
黃仁勛:那時我常常躺在床上覺得整個世界都在高速旋轉(zhuǎn),非常焦慮,完全失控。我人生只有少數(shù)幾次這樣的感覺,那段時間是最嚴(yán)重的。
主持人:這些經(jīng)歷給了你什么?
黃仁勛:我學(xué)會了如何制定戰(zhàn)略、如何創(chuàng)造市場(我們創(chuàng)造了現(xiàn)代 3D 游戲市場,后來用同樣方法創(chuàng)造了現(xiàn)代 AI 市場)。我學(xué)會了如何在危機中保持冷靜、系統(tǒng)化思考,又如何把公司里所有浪費都清除,只做最本質(zhì)的事。
我們長期靠“燃盡式”生存。直到今天——我每天早上醒來仍然覺得:我們可能 30 天內(nèi)會破產(chǎn)。
主持人:但你們現(xiàn)在是全球最大的科技公司之一啊。
黃仁勛:但那種脆弱感、不確定感、危機感從來沒離開過。
主持人:你覺得正是這種“饑餓感”讓你們成功嗎?
黃仁勛:是的。我更多的驅(qū)動力來自“不想失敗”。我不會停下來,不會自滿,總是處在邊緣狀態(tài)。
https://www.youtube.com/watch?v=3hptKYix4X8
聲明:本文為 InfoQ 翻譯整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
會議預(yù)告
12 月 19~20 日,AICon 2025 年度收官站在北京舉辦。現(xiàn)已開啟 9 折優(yōu)惠。
兩天時間,聊最熱的 Agent、上下文工程、AI 產(chǎn)品創(chuàng)新等等話題,與頭部企業(yè)與創(chuàng)新團隊的專家深度交流落地經(jīng)驗與思考。2025 年最后一場,不容錯過。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.