全文 3,000字 | 閱讀約 8 分鐘
![]()
(黃仁勛談推理Token經濟學)
當AI 圈還在爭論有沒有泡沫,黃仁勛已經在算“推理(Reasoning)”能賺多少錢。
2026 年 1 月 8 日,播客 No Priors 上,他這樣說:
就算 ChatGPT 沒出現,NVIDIA也會贏。
這份自信,源于對計算產業的真實判斷。
過去十年,摩爾定律逐漸失效,算力不再自動變便宜。所以加速計算從高端選項變成了“產業標配”。
當主持人問起 “2025 年 AI 最讓你驚訝”的進展,黃仁勛沒講多模態、也沒講大模型,答案是:模型推理能力的進化,和它如何成為一門可以定價、可以收費的生意。
這意味著,AI 的戰場已經從做大模型轉向了賣推理能力。
推理到底怎么賺錢?
誰在為推理付費?
這個窗口還能開多久?
過去,AI 的強,主要指兩個方向:會寫、會說。
從 ChatGPT 到各種聊天機器人,只要能輸出連貫、像人寫的內容,就算是好模型。
但到了企業場景,標準變了。他們不在乎會不會聊天,在乎的是:這個 AI 能給我省多少錢、賺多少錢?
要讓 AI 輸出值錢,黃仁勛的回答是:推理能力。
這個能力不是模型參數再翻幾倍,而是:
根據上下文找準問題,
在數據不全時推出合理結論,
給出能被醫生、律師、工程師放心使用的答案。
有了這種能力,AI 給出的結果就能明碼標價了。
他舉了幾個例子:
OpenEvidence 做醫療搜索,推理Token的毛利率達到了90%;
Harvey 為律師事務所服務,已經在多個大型律所落地使用;
甚至 Claude 企業版,企業也愿意為它付費。
這說明什么?過去 AI 輸出不穩定,企業不敢付高價;現在推理讓答案可控,按結果收費成為可能。
這個變化有兩個信號值得特別注意:
模型本身不再是唯一賣點。會寫文章、會對話只是起點,能推理、能接任務、能給出可驗證的答案,才是企業考慮是否付費的關鍵。
企業愿意為推理質量付更高的價。OpenEvidence的高毛利率不是靠壓低成本,而是因為醫生真的把它當可信賴資源在用。當AI從助手變成專業工具,定價邏輯就變了。
在這個過程中,最早跑出來的不是消費級產品,而是高度專業場景。
醫療、法律、科研、工程……這些地方對答案質量要求極高,恰好讓推理有了明確價格。
我們第一次看到,推理從模型的一個小能力,變成了能單獨收費的產品。
第二節|真正賺錢的是AI工廠,電工工資翻倍了
推理能收費了,但這些能賣錢的Token,是怎么產出來的?
黃仁勛把這個生產場所叫作:AI 工廠。
這些工廠 24 小時不停地運算、生成推理結果。但要讓 Token 持續產出,背后得有三樣東西支撐:
芯片廠:造出最關鍵的計算芯片
超級計算中心:搭建大模型運行需要的硬件
AI數據中心:一天24小時不停地產生推理結果
這三類工廠,正在美國各地大量建設。
而建設這些工廠,需要的不只是技術,更是人。
黃仁勛說,他第一次看到電工、技術員、水管工的需求漲得這么快。電工資格證成了熱門證書。有人專門接 AI 工廠的活,一出差就是一個月。建筑工人也被拉到這些新工地,很多州開始出現搶人的現象。
這是實實在在的變化: 不是模型參數增長,不是論文數量增長, 而是數據中心大量開工、光纜加速鋪設、電費暴漲、崗位激增。
AI 不再只是代碼和算法,而是開始像傳統工業一樣,有產線、有工人、有產能指標。
這場基礎設施建設確實在創造大量就業。但隨之而來的問題是:當AI真正投入使用后,會不會反過來取代人的工作?
黃仁勛認為恰恰相反。他舉了放射科醫生的例子:
“八年前,AI 教父 Hinton 預言 AI 會徹底改變放射學,放射科醫生將不再被需要。他說對了一半,現在 100% 的放射學應用都是 AI 驅動的。但放射科醫生的數量不減反增。”
原因在于:
AI 接管的是任務(研究掃描片),但放射科醫生的目的是診斷疾病、做研究、服務更多病人。
當 AI 幫他們更快看完掃描片,他們就能接更多病例、做更深入的研究,醫院效率提高了,反而需要雇更多放射科醫生。
這個邏輯不只適用于醫生,也適用于所有使用 AI 推理能力的行業:
律師用 AI 處理合同,能接更多案子;
工程師用 AI 寫代碼,能開發更多產品;
企業用 AI 做決策,能拓展更多業務。
所以 AI 提高了效率,但也釋放了需求。不是 AI 取代人,而是 AI 讓人能做更多以前做不了的事。
這也是為什么基礎設施建設本身,就是 2026 年最確定的商業機會之一。
而對于那些想用 AI 做應用的人來說,真正的問題是:推理能收費了,接下來該怎么做?
第三節|成本每年降10倍,小公司也有機會
既然推理能賣錢,那誰能抓住這個機會?
這聽起來像只有大公司才做得到的事。但黃仁勛指出:
“生成推理的成本,每年下降10倍。”
“落后 6 個月也不怕,成本降了就能趕上。”
于是出現了兩種玩法:
一方面,大公司還在籌建下一批超算集群,爭奪供應鏈;另一方面,小公司已經在開源模型上搭建出垂直服務,開始接單賺錢。
比如:
生物領域有公司在做端到端分子設計
工業領域有公司在做機器人抓取放置系統
材料科學有公司在做化學構象預測
這些小公司都不做萬能助手,而是只解決一類人的剛需問題。
黃仁勛形容這是“在一個小池塘里先做到極致”。這種專注一個場景做到能收錢的方式,才是接下來五年里,大多數AI創業者最現實的路徑。
而讓這條路徑成為可能的,是開源。
黃仁勛說:
“沒有開源,初創公司、教育、研究都沒法做。傳統企業也做不了AI 轉型。”
他甚至說,中國 AI 公司 DeepSeek 去年開源的訓練方法,是“對美國AI最大的單一貢獻”。因為它讓硅谷所有初創公司都能學到最前沿的技術,大幅降低了進入門檻。
降低門檻意味著:
不需要從頭訓練大模型,在開源基礎上做垂直優化就夠了;不需要燒掉幾億美元,用更小的成本就能驗證需求。
但能做,不等于能做成。關鍵在于:
你得知道推理在你的場景里值多少錢,
你得愿意去一個小市場快速驗證、快速迭代。
不是沒模型就做不了AI,而是你得想清楚:你要解決誰的問題?你怎么把推理包裝成一個值得付費、值得信賴的數字員工?
如果還不確定方向,黃仁勛提到了 2026 年三個值得關注的領域:
第一,數字生物學將迎來它的 ChatGPT 時刻。
蛋白質理解、多蛋白質生成、化學構象……這些領域正在匯聚合成數據、多模態、推理三大能力。Nvidia 最近開源的模型就是為多蛋白質理解設計的。
第二,汽車不再只是感知加規劃,而是會變成推理汽車。
當車遇到從未見過的情況時,它能把復雜場景分解成已知情況,通過推理系統導航通過。Nvidia的自動駕駛堆棧剛剛拿到安全評級第一名。
第三,人形機器人或多具身機器人將有巨大突破。
黃仁勛說“我們開始得太早了”,自動駕駛經歷了四個時代,而機器人正在用現成的端到端模型加推理系統起步,可能不需要10年就能落地。
這三個方向的共同點是:推理能力已經成熟,接下來就是誰先把它變成產品。
你不需要幾億美元,但你需要找對一個細分場景,一個真實的痛點。
窗口期很短,但機會還在。
結語|模型再強,不如結果能賣
過去講 AI,是講性能、講模型、講誰更像人。
現在講 AI,有個很清楚的衡量標準:能不能讓人愿意付錢?
推理開始值錢,標志著三個轉變:
模型不再只是看起來厲害,而是能落地、能計價;
企業不再只問能不能用,而是問值不值錢;
創業者不能再幻想做通用助手,得先做個實用工具。
AI 行業的競爭重點變了。
模型再強,不如結果好賣。
識自AI
本文由AI深度研究院出品,內容翻譯自黃仁勛在播客No Priors的訪談等網上公開素材,屬翻譯編譯性質。內容為合理翻譯與編輯整理,未逐字復制原訪談材料。未經授權,不得轉載。
星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標
參考資料:
https://www.youtube.com/watch?v=k-xtmISBCNE
https://podcasts.apple.com/us/podcast/no-priors-artificial-intelligence-technology-startups/id1668002688?l=fr-FR
https://techcrunch.com/2025/01/07/nvidia-ceo-says-his-ai-chips-are-improving-faster-than-moores-law/?utm_source=chatgpt.com
來源:官方媒體/網絡新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.