<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      專訪黃仁勛(下):雇一個年薪10萬美金的 AI agent,比雇50萬美金年薪的員工劃算太多了

      0
      分享至

      :“老黃現在真是忙啊,這幾天各種演講不斷,最近一個多月更是穿梭于大陸、美國和臺 灣 之間,還說要在臺 北市新建 Nvidia海外總部。而美國政府剛剛同阿聯酋和沙特簽下了AI+綠色能源的大單子,未來會在中東建設規模龐大的數據中心,這普遍被認為是要繼續擠壓中國公司能拿到的 Nvidia顯卡,以及打壓包括華 為在內的中國企業在中東地區的影響力,進一步遏制中國的AI產業在國際上的競爭力。值此之際,老黃的重要性愈發凸顯。而從本次訪談其實可以看出,老黃的心里其實門兒清:打壓中國,其實反而幫了中國,還順帶削弱了美國百年來一直倡導的自由競爭的氛圍,更重要的是:減少了英偉達的利潤”

      以下為本次訪談的主題目錄,本篇只包含后三部分,。

      1、Arab AI and the Chip Diffusion Rule(阿拉伯AI產業與芯片擴散規則)

      2、Nvidia and China(Nvidia 與中國)

      3、AI GDP Growth(AI 驅動 GDP 增長)

      4、Dynamo and Full-Stack Nvidia(Dynamo 與 Nvidia 全棧方案)

      5、Enterprise AI and Pragmatism(企業級AI 與務實主義)

      6、Whither Gaming(游戲業務何去何從)

      下篇技術術語較多,我把部分英文原文附在后面方便理解。

      訪談綜述:本次訪談,首先聚焦于政治層面的新難題,Nvidia上周與沙特阿拉伯、阿聯酋達成的合作、對中國 H20 芯片禁售,以及為何美國在芯片管制上的做法會威脅到美國,乃至 Nvidia的長期優勢。

      老黃還闡述了 AI 將在近期推動 GDP 增長、甚至可能縮小貿易逆差的理由。

      最近老黃有兩場演講,本月的 Computex 主題演講、以及上月 GTC 的演講。兩場演講迥然不同,原因或許在于受眾不同。

      今天在臺 灣的聽眾,是本地 OEM、組件廠商及其企業客戶,而上月則是美國的超大型云服務商。但關鍵是要明白,Nvidia 想同時向兩類客戶銷售。

      為此,我們討論了為何“Nvidia全棧解決方案full-stack Nvidia solution”能最大化效用,包括 Dynamo如何提升推理性能,以及 Nvidia的軟硬件架構為何能讓客戶按需選配。

      最后,也是順理成章的,我們談到了游戲業務。

      (注:由于我已多次精譯Ben Thompson的文章,我將從本次訪談開始,親切地稱呼他為阿笨,也由于他實在太喜歡用復雜長難句解釋概念了,有一些直男般的鐵憨憨,不過既然他看透問題直擊本質的能力太強,讀透這種刻意的復雜長難又是十分值得的。)

      四、Dynamo 與 Nvidia 全棧


      阿笨:咱們聊聊 GTC 大會吧,那是我最愛的一場主題演講,多年來我每一場都追著看。演講里有滿滿的 “黃教授Professor Jensen” 的味道,你解釋了數據中心的瓶頸,然后又說為什么Nvidia就是答案。

      我把那場演講理解成某種“反ASIC宣言anti-ASIC message”,一方面,你亮出路線圖roadmap,好像在說“你們盡管來追Try to keep up with this”,另一方面,你引入了“延遲-帶寬latency versus bandwidth”的帕累托曲線,說明了正因為GPU可編程,同一套 GPU就可以覆蓋整條曲線,而真正會去造ASIC的反而是那些 hyperscalers(超大規模云服務商)。

      我這樣理解對嗎?

      老黃:你的理解沒問題,但我當時的主要意圖并不完全如此,我只是想幫大家弄清楚,該怎么建一座新的數據中心。問題在于,數據中心的能耗就是那點兒:100 兆瓦就是 100 兆瓦,250 兆瓦就是 250 兆瓦。

      把數據中心當成工廠,你的首要任務就是讓“單位能耗吞吐overall throughput-per-watt”最高,而這吞吐最終體現在了token 輸出,既有“免費 token”這種低成本輸出,也有用戶愿意付費的高質量token,比如一月一千美元、甚至一萬美元。

      阿笨:你之前還提到“”?(前面老黃說的是:hire a robot for $100,000 a year)

      老黃:對,如果讓我雇一名年薪 10 萬美元的 AI agent?我會毫不猶豫。畢竟我們天天雇的真人,成本遠高于此,要是能用 10 萬美元把一位 50 萬美元年薪的員工“強化amplify”一下,那可太值了。

      這座“工廠”產出的 token 質量,千差萬別,既要滿足免費場景,也得輸出高質量內容,因此必須覆蓋整條帕累托曲線。若只針對某一種場景設計芯片或系統,必然閑置浪費。

      問題是,如何讓同一套系統既能跑“免費token”,又能隨時切到高質量token 模式?

      架構一旦切得太碎,負載workload在不同單元間的遷移,就會困難。所以大家如果仔細想想就知道了,一臺系統若專攻“高token速率 high token rate”,整體吞吐往往很低low overall throughput,但如果追求極高吞吐,就常常交互性較差low interactivity,單用戶每秒 token不夠 tokens-per-second per user is low。

      只沿著X 軸或 Y 軸去做,都比較容易,填滿整塊區域才難。這正是我們的創新所在,它是多重要素的協同加成:

      • Blackwell 架構FP4 和NVLink 72 的高速互連

      • 高帶寬內存及其容量HBM memory and its capacity 之間的平衡配比

      • 浮點運算能力顯存容量/帶寬floating-point and the memory capacity and bandwidth之間的平衡配比;

      • Dynamo 解耦流生態(解耦式流式推理服務生態與硬件系統disaggregated streaming serving ecosystem, hardware system)

      阿笨:我正想聊聊Dynamo,今天發布會沒提,但我覺得它太有意思了。

      老黃:極其重要。

      阿笨:給我們展開講講,我記得你稱它為“數據中心的操作系統operating system for data centers”。

      老黃:核心就是,Transformer 的推理流程分為多個階段,各階段可按用戶需求、具體模型、上下文情境,進行差異化處理。于是,我們把大語言模型的計算流程拆分了。

      第一階段是pre-fill,就是上下文處理,先想想你接下來會問我什么。

      比如來到這里,我會先想想以前和笨笨你聊過什么,比如你是偏好那種深度的、對話式的播客風格。這樣一來,當我們直接開始深入談論行業和技術時,完全不會感到不自在。

      阿笨:對,你現在可不是在給晚間新聞錄個十秒快訊什么的。

      老黃:沒錯,我知道你能聽懂,所以我不會有對牛彈琴的感覺,所以我們聊這些很自在。

      當聊天機器人答復用戶時,它需要這類上下文記憶,甚至得讀幾份 PDF,這就是pre-fill階段,這個階段對浮點運算量的需求極高very floating-point intensive。

      接下來是 Decode,這一階段真正負責“生成思考”,它要推理即將輸出的內容、預測下一個 token,于是整條思維鏈會產生更多 token,再回寫到上下文中,進而觸發更多 token 的生成。

      就這樣一步步推理,可能還要檢索額外資料。當代的 AI,尤其對于代理式AI agentic AI、推理式AI reasoning AI而言,decode 階段需要密集的浮點運算和極高的帶寬,在任何情形下都是如此,有時需求高得離譜,但未來還會更高。

      阿笨:它會波動。

      老黃:對,視具體情況而定。

      阿笨:decode 階段,不需要高精度浮點運算。

      老黃:對,如果是 one-shot 推理,而且 KV 緩存已經很強,那么對浮點運算的需求并不高。

      不過,一旦你給模型加載大量上下文,就必須投入更多浮點算力。

      Dynamo會把整個推理流程徹底解耦,再把負載在數據中心內進行智能分配,精細計量各處理器的工作量,這可不是件簡單的事。

      阿笨:這也解釋了你說的,把整座數據中心當一塊 GPU,Dynamo 就是那個把它當單芯片調度的軟件。

      老黃:對,Dynamo 本質上就是AI 工廠的操作系統

      阿笨:展望未來,這些“思考模型”“推理模型”的應用——你的預測一向以精準著稱——你覺得它們主要用于代理式工作流嗎?

      缺點是,得等它想完,人們得等待結果?或許,可以并行跑一堆代理來彌補?

      又或者,它們更重要的價值在于:生成訓練數據?從而提升 one-shot 效果,這可以成為更常見的交互形式?

      老黃:這得看成本。

      我預測推理模型會成為默認基準baseline,因為處理速度會快得驚人。比如,啟用 Grace-Blackwell 后,速度能提升 40 倍,再往下一代,再快 40 倍,而模型本身也在不斷進化。

      所以,從現在算起五年內,代理式模型agentic models整體提速10 萬倍,在我看來完全合理。

      阿笨:這就是計算性能的發展歷史the history of computing

      老黃:沒錯,它剛剛思考了“山一樣多的內容”,只是你沒看到罷了,如今,連“慢思考”都快極了even slow thinking is fast。

      阿笨:那本書,《思考,快與慢》……若讓AI來讀,它一秒就能讀完,書名可要被“打臉”了。

      老黃:哈哈,的確如此。

      五、企業級 AI 與務實主義

      阿笨:回到政治話題,簡單提一下。

      你談到每瓦性能(performance-per-watt)時,是否這更多是美國中心的思維?在美國,我們很難新建電力設施,電力成了最大瓶頸,但是比如像海灣國家,能源更加容易獲取,電力也更容易建設。

      而在中國,如果電力不是最大限制因素,那么很多 Nvidia 解決的問題,其實都能被解決。是不是這也是為什么 GTC 會選擇在美國舉辦的原因之一?這是不是傳遞給美國的一個信息?

      老黃:哦,我沒這么想過。我認為不管怎么說,工廠的規模總是有限的。即使你所在的國家有更多能源,但你的數據中心并不一定有。因此,我認為“每瓦性能”始終很重要。

      阿笨:這始終很重要,但重要性可能會有所不同。

      老黃:對,沒錯。但問題在于,如果你一開始就知道自己選的架構只有別人一半的性能,你也許會說,那我就多買一倍土地,多拉一倍電力,從頭按兩倍規模建。

      可真把所有因素加在一起,問題就來了。打個比方,給1 GW(a gigawatt)機房配套的話,簡單估算,光是機房外殼、供電、土地、運維等基礎設施,就要 300 億美元;再加上計算、網絡、存儲,可能得500 億美元。

      現在,因為效能低下,你得建兩座同樣的機房,光那300 億就得翻倍變 600 億,這時你就得找到“極其便宜的計算資源”,才能把賬算平。所以在 AI 工廠的世界里我常說,如果某套架構性能不行,有時即便“免費”,也不夠便宜。

      阿笨:但 如果是唯一的選擇,你就會努力讓它發揮作用。

      老黃:對,沒錯。

      阿笨:那我們來對比一下當下的情況。

      你今天說過幾次,“如果你買我所有東西我很開心,但我也很高興你買我任何東西”。之前我沒完全明白,直到現在我才意識到,這聽起來像是一場企業級的主題演講,當然這是我自己的理解,不是你的說法,我感覺到了務實主義,你現在聽起來像是個企業軟件公司的 CEO,非常務實。

      在你的話語體系里,如果客戶要建一座完整的 AI 工廠,全用 Nvidia 當然最好,但很多客戶只會買其中一部分。對這些客戶來說,也許你希望他們全買,但只要買了哪怕一點,未來大概率也會一直跟你買。

      所以,從戰略上看,他們也是很重要的基本盤,對嗎?

      老黃:滿足客戶需求,本來就是聰明做法。如果你看 Nvidia 的市場策略,我們一直是以完全集成的方式構建產品,軟件必須與硬件緊密結合。

      但我們也有足夠的紀律性,可以將軟件與硬件解耦,你可以選擇不使用我們的軟件,你完全可以選擇不使用。如果你看我們設計系統的方式,我們實際上已經以一種足夠有紀律的方式解耦了系統,所以如果你想更換某些部分,也是可以的。

      目前,Grace Blackwell 在全球不同的云平臺中,都在被集成和部署,所有這些平臺基于我們的標準,雖然它們各有不同,但我們能適應它們。

      我認為這就是 Nvidia 商業模式的真正挑戰,它與我們想要成為計算平臺公司(computing platform company)的目標,是相輔相成的。最重要的是,如果 Nvidia 的棧(計算棧compute stack)被采用,那當然太好了。但如果我的網絡棧networking stack被采用,我同樣非常高興。

      事實上我對我們網絡棧的看法,與對計算棧的看法一樣強烈。如果這兩個棧都被采用,那簡直是不可思議。

      阿笨:好吧,很多人提到你們的 NVLink Fusion,你可以只買 NVLink,也可以與 ASIC 集成,這與我理解的 GTC 信息正好相反,但我理解了你此刻的立場。

      畢竟,誰是客戶誰說了算?

      老黃:我依然深信,Nvidia 正在構建一個更好的系統,我完全相信這一點。如果我不相信這一點,那顯然我們做錯了什么事,得趕緊找出原因并糾正。

      所以我完全相信,Nvidia 是全球最大規模的加速計算公司,我們是全球最大規模的 AI 計算公司。沒有哪家 36000 到 38000 人的公司,能像我們一樣專注于這一件事。

      如果有一個 14 人的小團隊,能夠做得比我們更好,那我得承認,我的內心一定很痛苦,所以我們會繼續努力做得更好。

      阿笨:然而,你也相信規模,而獲得規模的一種好方法,就是根據客戶需求去銷售產品,無論客戶想要什么方式。

      老黃:對,完全正確,確實如此。我有我的偏好,但我們想確保我們能夠按照客戶的需求去服務每個客戶。

      六、游戲何去何從

      阿笨:接著這個話題聊下去,也許是相關的。

      我問了我一個朋友,他的兒子堅持讓我問這個問題。有些游戲圈的人認為,雖然你今天的主題演講中只有10%講的是 GeForce,但對我們依然很重要。

      是不是還可以認為,GeForce對我們依然重要,因為這是一切的基礎,我們做的還是 GPU?或者,我應該怎么告訴我朋友的兒子,關于 Nvidia和游戲的事?

      老黃:你看,我真希望我說過——沒有 GeForce,RTX PRO 做不出來,沒有 GeForce,就沒有 Omniverse,任何我們看到的視頻里的像素都離不開 GeForce,機器人也做不出來,沒有 GeForce,Newton 也無法實現。

      所以,GeForce 本身在 GTC 上不那么突出,是因為 GTC 更側重高性能計算、企業級應用和 AI 等領域。

      我們為游戲開發者舉辦了單獨的大會,所以每次在 GTC 演講時,我總覺得有些產品發布并不那么核心,雖然在 GTC 的聽眾群體中,可能不完全適合,但他們也明白,GeForce在我們做的一切工作中扮演著至關重要的角色。

      阿笨:是不是有些游戲玩家,至今還沒有完全意識到,GeForce 現在遠遠不止是圖形渲染引擎這么簡單?

      老黃:(笑)對,沒錯。正如我今天說的,我們只渲染 1/10 的像素,這個數字非常令人震驚。假設我給你一個拼圖,只給你 1/10 的拼塊,其他的拼塊我根本不給你,你必須自己把它拼出來。

      阿笨:我有個新角度,可以將游戲與其他業務聯系起來。你剛才說過,你很有紀律性地保持各個領域的分離,且能夠將它們分開管理,軟件也能處理好這些。

      這聽起來有點像 Windows 上的驅動問題,老實說,這就是你們的一項核心技能。

      老黃:是的,驅動程序太低級了,涉及的內容太多,寄存器registers太多,而““驅動抽象driver abstraction”實際上是一次革命,微軟在這方面發揮了重要作用。如果沒有驅動的概念concept of a driver,Windows 就不會有今天的地位。它創造了一個 API 抽象層abstraction of an API,而在硬件下面可以有較大的變化。

      我們現在的驅動程序是開源的,坦白說,我并沒有看到很多人對此做出貢獻。原因很簡單:一旦我推出了新的 GPU,上一個驅動的工作幾乎就被拋棄了。

      所以,沒有像 Nvidia 這樣龐大的工程師團隊,別人很難做這件事。但如果我們為每一款 GPU 優化每個驅動程序,并與之配套,就能創造出一個完美的隔離層isolation layer,一個抽象層an abstraction layer,無論是 CUDA 還是 DirectX,開發者都可以在其之上進行開發。

      阿笨:這就是我給我朋友兒子的答案,我在前面不得不問你關于政府的事,你也為你的觀點提供了很好的、充滿熱情的辯護,但當我問到關于游戲驅動的問題時,你的眼睛真的亮了起來。

      老黃:哦,真的嗎?

      阿笨:所以我覺得一切都很好。

      老黃:great,其實我真的很喜歡 GeForce。

      阿笨:這就是面對面交流的好處,老黃,非常感謝你。

      (完)

      以上就是這次老黃專訪的下篇,,下周會開始更新一個OpeaAI成長編年史的系列,包含公司架構、商業模式、估值和財務數據,還有超干的技術細節,需要三篇文章才能更完,歡迎關注本號。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      再見,利物浦!5000萬“名將”正式同意轉投國米!欽點9000萬強援

      再見,利物浦!5000萬“名將”正式同意轉投國米!欽點9000萬強援

      頭狼追球
      2026-02-01 16:47:34
      當C羅遇上金臀卡戴珊:一場跨越綠茵與沙發的宇宙級聯動

      當C羅遇上金臀卡戴珊:一場跨越綠茵與沙發的宇宙級聯動

      羅氏八卦
      2025-12-17 12:57:50
      走私犯梁耀華,如何用美女拿下原公安部副部長李紀周?過程精彩

      走私犯梁耀華,如何用美女拿下原公安部副部長李紀周?過程精彩

      揚平說史
      2026-01-29 21:29:24
      大爆發!韓旭18+6+3+3帽創近28天新高 率隊大勝升聯賽第二

      大爆發!韓旭18+6+3+3帽創近28天新高 率隊大勝升聯賽第二

      醉臥浮生
      2026-02-01 17:46:43
      進入2月,財神加持,三大星座財運亨通,事業大展宏圖,別錯過

      進入2月,財神加持,三大星座財運亨通,事業大展宏圖,別錯過

      小晴星座說
      2026-02-01 18:11:07
      中國存在“兩大威脅”,一個臺灣,另一個則曾需百萬大軍才鎮住

      中國存在“兩大威脅”,一個臺灣,另一個則曾需百萬大軍才鎮住

      無情有思ss
      2026-01-23 08:30:45
      實探中國最北宜家閉店前一日:家居展區幾乎被搬空,食品已售罄,仍有不少顧客前來“撿漏”打卡留念

      實探中國最北宜家閉店前一日:家居展區幾乎被搬空,食品已售罄,仍有不少顧客前來“撿漏”打卡留念

      極目新聞
      2026-02-01 13:10:29
      500萬獎金,230萬年收入!陳幸同用堅持證明:天才+汗水=破局之力

      500萬獎金,230萬年收入!陳幸同用堅持證明:天才+汗水=破局之力

      葉赫那拉菲菲
      2026-02-01 07:02:23
      10歲女童雙眼被挖,喉嚨割斷,可兇手卻因法律的一項規定免于死刑

      10歲女童雙眼被挖,喉嚨割斷,可兇手卻因法律的一項規定免于死刑

      清澈之玹
      2024-03-27 21:43:07
      婚姻下半場,拼的根本不是愛,而是……

      婚姻下半場,拼的根本不是愛,而是……

      詩詞中國
      2025-12-19 20:16:27
      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      歸史
      2025-12-09 11:10:44
      劉惠怒懟錢城引關注!直言其瞧不上郭德綱等人,質問你哪來的能耐

      劉惠怒懟錢城引關注!直言其瞧不上郭德綱等人,質問你哪來的能耐

      一盅情懷
      2026-02-01 20:01:55
      蓄發哥剪發在望?曼聯取得英超3連勝,后兩場對陣熱刺西漢姆

      蓄發哥剪發在望?曼聯取得英超3連勝,后兩場對陣熱刺西漢姆

      懂球帝
      2026-02-02 00:39:38
      事發句容,王某被騙1萬余元!警方提醒

      事發句容,王某被騙1萬余元!警方提醒

      句容發布
      2026-02-01 16:40:13
      6歲女孩隨家人回老家打掃衛生,吸入大量霉變粉塵,確診煙曲霉感染,發燒17天,腦子被“啃”20多個洞

      6歲女孩隨家人回老家打掃衛生,吸入大量霉變粉塵,確診煙曲霉感染,發燒17天,腦子被“啃”20多個洞

      觀威海
      2026-02-01 10:14:08
      兩部委定調,2026養老金怎么漲?企退漲幅可能比事退更高嗎?

      兩部委定調,2026養老金怎么漲?企退漲幅可能比事退更高嗎?

      云鵬敘事
      2026-02-01 16:54:06
      令人窒息的高鐵站媽媽手撕青春期女兒事件,揭開了普通家庭的痛

      令人窒息的高鐵站媽媽手撕青春期女兒事件,揭開了普通家庭的痛

      菁媽育兒
      2026-01-07 15:30:31
      全國人大法工委:關于業主未實際入住使用的物業費交納問題的意見

      全國人大法工委:關于業主未實際入住使用的物業費交納問題的意見

      微法官
      2025-11-23 08:21:32
      剛退休,20年沒見的前同事竟帶全家到我家門口,叫我給她們20萬塊

      剛退休,20年沒見的前同事竟帶全家到我家門口,叫我給她們20萬塊

      小秋情感說
      2025-12-16 13:57:41
      烏克蘭全境被炸,20萬烏軍逃亡,澤連斯基請求去莫斯科與普京和談

      烏克蘭全境被炸,20萬烏軍逃亡,澤連斯基請求去莫斯科與普京和談

      墨印齋
      2026-01-31 17:42:00
      2026-02-02 03:47:00
      柳胖胖 incentive-icons
      柳胖胖
      36氪、虎嗅、鈦媒體專欄作者
      208文章數 386關注度
      往期回顧 全部

      科技要聞

      10億元寶紅包突襲 復刻微信支付還是微視?

      頭條要聞

      愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

      頭條要聞

      愛潑斯坦追逐女孩、安德魯跪爬女子身上畫面全公布

      體育要聞

      德約大度祝賀阿卡 幽默互動逗笑納達爾

      娛樂要聞

      春晚第三次聯排陣容曝光:全是實力派

      財經要聞

      黃仁勛臺北"夜宴":匯聚近40位臺企高管

      汽車要聞

      嵐圖汽車1月交付10515輛 同比增長31%

      態度原創

      教育
      房產
      時尚
      家居
      軍事航空

      教育要聞

      鼓樓、玄武、建鄴、秦淮多區教育局發布提醒!

      房產要聞

      藏不住的小城大事,海澄新城執掌自貿港風口,進階兌現美好生活新篇

      “多巴胺風”又又又火了!這樣穿時髦又減齡

      家居要聞

      藍調空舍 自由與個性

      軍事要聞

      伊朗民眾:伊朗不會屈服于美國霸權

      無障礙瀏覽 進入關懷版