作者 | 小小
出品 | 網易科技
免費的,往往才是最貴的。
這個道理你我都懂,但黃仁勛布下的這個“局”,實在是太“香”了。
就在扎克伯格反悔了,準備關上“開源大門”的時候,英偉達卻突然大手一揮:自家的頂級模型、核心數據,統統免費送!
![]()
面對這份價值連城的厚禮,哪怕是再不懂行的人也看呆了:這可是價值連城的寶貝,英偉達瘋了嗎?
并沒有。這是一場精心設計的“陽謀”: 就像送你免費的咖啡機,是為了讓你一輩子買他的咖啡膠囊。老黃把軟件門檻降到地板價,就是為了讓你對他的芯片上癮。你以為薅了英偉達的羊毛,其實早已成了他生態圈里的“打工人”。
![]()
(圖片由AI生成)
這正如AI創企高管盧卡斯·阿特金斯(Lucas Atkins)的一語道破: 黃仁勛正在下一盤遠超賣硬件的超級大棋——他不僅僅是在銷售GPU,更是在用軟件瘋狂圈地,目標是讓整個AI生態系統對英偉達產生無法戒斷的“平臺級依賴”。
![]()
通過發布包括5000億參數在內的頂級開源模型,并史無前例地公開3萬億Token的訓練數據,英偉達成功地讓所有開發者都能以極低的門檻構建和優化自定義模型。
結果會怎樣?
所有的開發者都需要更好的數據來跑更好的模型,所有的模型都需要更多的算力來跑更長的推理,而所有這些算力,最終都指向一個名字:英偉達的GPU。
這正是英偉達企業生成式AI軟件副總裁卡里·布里斯基所強調的:“大語言模型和生成式AI是未來設計軟件的方式,這是新的開發平臺。”
英偉達CEO黃仁勛此前表示:“開放創新是AI進步的基礎。通過Nemotron,我們正在將先進AI轉化為一個開放平臺。”
![]()
當Meta的Llama影響力減弱,中國軍團(DeepSeek、Qwen、Kimi以及Z.ai、MiniMax)崛起之際,英偉達的這步棋,不僅是要對沖大客戶“自研芯片”的風險,更是要“一魚兩吃”,用軟件吞噬開源王座,再用硬件收割市場紅利。
一、Meta“大撤退”:Llama停滯與“Avocado”轉向
這場“王座更迭”的背景,是曾經的開源明星Meta“大撤退”。
2023年,Meta首次推出Llama,其快速、強大的性能,以及對研究人員開放部分代碼的做法,曾是閉源巨頭(OpenAI、谷歌)壟罩下的里程碑事件。Llama一度主導了開發者對開源技術的關注度。
然而,到了2025年,形勢急轉直下。Meta于4月推出的第四代Llama反響平平,在LMSYS廣受歡迎的LMArena排行榜上,Llama模型已跌出前100名,被谷歌的Gemini、xAI Grok等專有模型以及中國公司的Qwen、DeepSeek、Kimi等開源新秀所取代。
更致命的是,行業觀察者直指Meta戰略的搖擺。風險投資公司Menlo Ventures的報告甚至將企業開源使用率的下滑(從去年的19%降至11%)歸咎于Llama的“停滯不前”。
隨后,彭博社的報道猶如投下一顆重磅炸彈:Meta即將進行的代號為“牛油果”的項目,可能會作為“封閉”模型推出,一個可被嚴格控制、并可出售訪問權限的模型。 這一轉向,無疑是Meta對其多年開源戰略的最大背離。
![]()
英偉達副總裁布里斯基的回應充滿自信和洞察力:“我同意Llama在衰退,但我不認同開源的衰退。”
她指出,開源領域的需求并未消失,只是領導者正在更迭,阿里巴巴的Qwen和DeepSeek等中國模型正在快速填補空缺。英偉達正是看準了這個“真空期”,果斷出手,志在收割Meta留下的市場領導權。
Nemotron 3:從“賣芯片”到“造平臺”的三大野心
英偉達發布的Nemotron 3系列模型,不僅僅是一組新的LLM,它是一份針對企業AI應用痛點開出的“三位一體”解決方案,完美服務于英偉達鞏固其平臺霸權的戰略目標。
![]()
(圖片由AI生成)
新系列模型涵蓋了從300億參數的Nano、1000億參數的Super到5000億參數的Ultra,規模空前強大。Nemotron 3 Nano在準確性和每秒Token生成數上甚至超越了OpenAI的GPT-OSS等頂尖模型。
![]()
1. 解決“最后一公里”定制化痛點
布里斯基強調,企業客戶面臨的一大挑戰是對AI模型進行“專業化定制”,以應對從網絡安全到電子設計自動化、醫療保健等各類垂直領域的任務。前沿的閉源模型雖然強大,但企業“不想把所有數據都發送給它們”。
![]()
(圖片由AI生成)
因此,能夠在“本地”運行的開源技術至關重要,它能真正幫助專家為特定領域的“最后一公里”需求進行專業化定制。Nemotron 3的多規格模型組合,就是為了覆蓋從輕量級到重量級的廣泛定制需求。
2. 直擊“Token爆炸”的成本地雷
第三個挑戰是Token成本的爆炸式增長。隨著應用越來越復雜,如“長思考”或“推理”模型,LLM的調用次數和Token需求正在指數級上升。布里斯基指出,現在人們提出一個復雜問題,可能需要100次LLM調用,這在成本上是不可持續的。
![]()
(圖片由AI生成)
為了優化成本和效率,Nemotron 3采用了新的“潛在專家混合”(MOE)架構。這種方法在不犧牲延遲和帶寬的前提下,將內存使用效率提升了四倍,大大降低了運行模型的實際計算成本。更高效地使用GPU,意味著開發者可以跑更多模型,最終仍然需要更多的英偉達GPU。
3. 透明度“亮劍”:碾壓Llama的開源底氣
英偉達的最強殺手锏在于對透明度的極致強調,這使其站在了所有美國競爭對手的對立面。
當前,企業客戶的一大顧慮是模型訓練數據的來源。麻省理工學院的研究指出,真正的開源正在減少,許多模型只是“開源權重”而非“開源”。英偉達則徹底反擊了這一趨勢。
![]()
在HuggingFace上發布的Nemotron 3不僅包含模型權重,還包括用于預訓練、后訓練和強化學習的3萬億Token訓練數據。布里斯基直言不諱地指出,Meta的團隊“一直不夠開放”,“Llama根本沒有發布他們的數據集;他們只發布了權重。”她甚至透露,在去年英偉達與Meta合作將Llama 3.1模型轉換為更小的Nemotron模型時,Meta曾拒絕向英偉達提供一小部分數據集以幫助模型“蒸餾”優化。
![]()
(圖片由AI生成)
英偉達的策略是:如果你不知道模型的來龍去脈,你就無法信任它,更無法基于它構建你的核心業務。
這種將數據集、源代碼和訓練配方全盤托出的開放姿態,極大地降低了企業的信任門檻和定制難度,將Nemotron打造成了AI構建者心目中更可靠、更透明的基石。
三、“精明”的商業閉環:GPU的“永動機”
歸根結底,英偉達的慷慨,是一場極度精明的商業布局。
作為全球市值最高的公司之一,英偉達要持續證明其巨額營收增長的合理性。它面臨的挑戰是,OpenAI、谷歌和Anthropic等大客戶都在開發自有芯片,試圖擺脫對英偉達技術的過度依賴。
英偉達的Nemotron 3策略正是對此風險的完美對沖:通過在軟件層打造一個開放、高效、低門檻的平臺,它確保了無論開發者是使用閉源還是開源模型,無論他們是選擇巨頭的前沿模型還是Nemotron的定制模型,最終他們都將不可避免地使用英偉達的GPU生態系統。
![]()
(圖片由AI生成)
開源的Nemotron降低了所有人的入門門檻,更多人構建模型, 更多模型需要運行,更復雜的推理需要更多的LLM調用,對GPU算力需求的爆炸式增長。
這便是黃仁勛的“永動機”商業閉環。他用“開放創新”的華麗外衣,掩蓋了對全球算力市場的絕對壟斷和收割。正如他所言:“只要我們還活著,我們就會支持它。”
![]()
這句承諾,與其說是對開源社區的表態,不如說是對英偉達GPU平臺不可替代性的堅定宣示。
在Meta戰略收縮、中國軍團強勢崛起的關鍵時刻, Nemotron 3的開源,本質上是英偉達為了對抗大客戶“去英偉達化”而修筑的護城河。它降低了所有人的門檻,卻也提高了所有人的依賴。在這個新時代,英偉達不再僅僅是基礎設施的提供者,它正在成為規則的制定者。
對于開發者而言,這是一場盛宴;對于競爭對手而言,這是一場噩夢。
![]()
(圖片由AI生成)
