![]()
Nemotron 3 系列包括基于混合潛在專家混合(MoE)架構的 Nano、Super 和 Ultra 型號的大語言模型。
NVIDIA 周一宣布了 NVIDIA Nemotron 3 系列開放模型、數據集和庫,旨在支持各行業透明高效多智能體 AI 系統的開發。
NVIDIA Nemotron 3 系列真面目
Nemotron 3系列包括基于混合潛在專家混合(MoE)架構構建的Nano、Super和Ultra模型,NVIDIA稱其旨在降低推理成本、限制上下文漂移并改善多個AI代理之間的協調。
NVIDIA創始人兼首席執行官黃仁勛一貫表示,開放創新是人工智能進步的基石。“通過Nemotron,我們將先進的人工智能轉變為一個開放平臺,為開發者提供大規模構建代理系統所需的透明度和效率。”
3款大模型中,Nemotron 3 Nano 現已上市。它是一個擁有300億參數的模型,每個任務激活多達30億個參數,并針對低成本推理用例進行了優化,如軟件調試、匯總和人工智能助手。NVIDIA表示,該模型的令牌吞吐量是Nemotron 2 Nano的4倍,且推理令牌生成減少了多達60%。
Nemotron 3 Nano可在Hugging Face上使用,也可以通過Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter和Together AI等推理服務商訪問。該模型也作為 NVIDIA NIM 微服務提供,部署于 NVIDIA 加速基礎設施上。
Nemotron 3 Nano 也將在未來幾個月通過亞馬遜 Bedrock 在 AWS 上發布,并在多個云平臺上支持。
Nemotron 3 Super是一個約 1000 億參數的模型,設計用于需要低延遲的多智能體應用,而 Nemotron 3 Ultra 則擁有約 5000 億參數,旨在深度推理和長期規劃任務。
Super和Ultra都使用NVIDIA的4位NVFP4訓練格式,在Blackwell GPU上降低內存需求。這些型號預計將在2026年上半年上市。
除了這些模型,NVIDIA還發布了三萬億個預訓練、訓練后和強化學習數據集,其中包括用于評估多智能體系統的智能安全數據集。公司還開源了NeMo Gym、NeMo RL和NeMo Evaluator,以支持智能人工智能的培訓、定制和評估。
NVIDIA推出Nemotron 3的三大期望
大家好奇的是英偉達作為GPU供應商,為什么要推出LLM?
首先,英偉達希望接推出多個模型,協同工作,以處理復雜的工作流程,引領AI發展方向。
此次發布正值企業從單一AI聊天機器人向協作智能體系統邁進之際,多個模型協同工作,處理復雜的工作流程。
據英偉達介紹,Nemotron 3允許開發者在同一工作流程中將任務路由到前沿專有模型和開放Nemotron模型之間,以平衡推理能力和成本效益。
其次,通過開放LLM,然不同的國家發展主權大模型。
NVIDIA表示,Nemotron 3系列還與其主權人工智能戰略相契合,允許政府和企業部署針對本地數據、法規和政策需求的模型。公司表示,歐洲和韓國的組織正在采用開放模式。
第三,希望開源大模型帶動企業AI的應用。
包括埃森哲、德勤、安永、甲骨文云基礎設施、Palantir、Perplexity、ServiceNow、西門子、Synopsys和Zoom在內的多家企業客戶和合作伙伴,正在將Nemotron模型整合進涵蓋制造、網絡安全、軟件開發和通信的AI工作流程中。
Perplexity首席執行官Aravind Srinivas表示,公司正在其代理路由系統中使用Nemotron以優化性能。他說:“我們可以將工作負載引導到像Nemotron 3 Ultra這樣微調的開放模型上,或者在任務需要時使用專有模型。”
![]()
算力銷售、技術生態、市場競爭力助力英偉達成功
另外,英偉達推出Nemotron 3系列開源大模型后,其相關應用從算力銷售、技術生態、市場競爭力等多個維度為自身發展提供強勁推力。
拉動核心算力硬件銷量。Nemotron 3不同版本適配從輕量化到高精度的多樣任務,而這類開源大模型的訓練、微調與推理,都高度依賴英偉達GPU等算力硬件。比如企業用Ultra版本開發自動駕駛相關多智能體系統,初創公司基于Nano版本搭建醫療篩查原型,均需匹配對應的英偉達算力設備。目前已有安永、西門子等12家領軍企業啟動該模型集成,海量開發者和企業的應用需求,將直接帶動英偉達GPU及相關計算硬件的持續熱銷,鞏固其算力硬件市場的主導地位。
完善AI技術生態并反哺技術迭代。開源模式吸引了全球開發者和企業參與到Nemotron 3的優化中。開發者在醫療、制造、網絡安全等不同場景應用模型時,會反饋大量實際問題與優化建議,這些來自真實場景的需求能幫助英偉達針對性完善模型的混合潛在專家架構等核心技術,還能積累多領域的應用數據。同時,該模型開源降低了AI開發門檻,讓更多主體加入其技術生態,進一步擴大英偉達在AI領域的技術影響力,強化其生態壁壘。
強化行業話語權并開拓新場景。Nemotron 3開源后成為多智能體AI系統開發的標桿方案,其在多智能體協作中的通信協議優化、上下文管理等技術設計,有望成為行業參考標準。而且模型在制造業質量檢測、醫療診斷、審計自動化等場景的落地應用,幫助英偉達將技術影響力滲透到更多垂直行業。這既開拓了算力和模型服務的新市場,也讓英偉達在AI行業標準制定中擁有更多話語權,拉開與行業競爭者的差距。
提振市場信心并提升品牌價值。開源大模型的動作獲得了市場的積極反饋,模型發布后英偉達美股盤前漲幅就擴大至1.5%,體現出投資者對其戰略的認可。同時,Nemotron 3助力初創公司降低70%開發成本,幫助企業大幅提升工作效率,這類應用成果會強化英偉達在AI領域的技術領先形象,提升品牌美譽度,進而吸引更多合作伙伴與投資,形成良性發展循環。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.