
作者 | Robert Krzaczyński
譯者 | 劉雅夢
策劃 | 丁曉昀
英偉達(NVIDIA)發布 了一套涵蓋語言、智能體系統、機器人技術、自動駕駛和生物醫學研究的開放模型、數據集和開發工具。此次更新擴展了多個現有的 NVIDIA 模型家族,并通過 GitHub、Hugging Face 和 NVIDIA 的開發者平臺提供了相應的訓練數據和參考實現。
在代理式 AI 領域,NVIDIA 擴展了 Nemotron 模型家族,為語音識別、檢索增強生成和安全提供了新的組件。Nemotron Speech 包括針對低延遲、實時用例優化的自動語音識別模型。Nemotron RAG 引入了用于多模態文檔搜索和檢索流程的嵌入和重排視覺語言模型。Nemotron Safety 增加了用于內容過濾和敏感或個人身份信息檢測的更新模型。NVIDIA 還發布了用于選定 Nemotron 模型的數據集和訓練代碼,包括在公共基準上評估的嵌入模型。
對于機器人技術和物理 AI,NVIDIA 引入了新的 Cosmos 世界基礎模型,這些模型支持在真實環境中的感知、推理和合成數據生成。Cosmos Reason 2 是一個多模態推理模型,旨在增強智能體在物理環境中操作的場景理解。Cosmos Transfer 2.5 和 Cosmos Predict 2.5 專注于在不同環境和條件下生成合成視頻數據,支持仿真和數據增強工作流程。基于 Cosmos,NVIDIA 發布了 Isaac GR00T N1.6,這是一個用于人形機器人的開放視覺 - 語言 - 動作模型,支持全身控制并將視覺感知與動作規劃集成。
公告的一個組成部分是 NVIDIA Alpamayo,一個用于基于推理的自動駕駛的新開放模型家族。Alpamayo 結合了感知、規劃和可解釋性,采用視覺 - 語言 - 動作架構,并與仿真工具和大規模駕駛數據集相匹配。NVIDIA 還引入了 AlpaSim,這是一個用于自動駕駛汽車模型閉環評估的開源仿真框架。
據 NVIDIA 汽車部門負責人吳信洲 表示,Alpamayo 和相關工具反映了跨研究、模擬、數據工程、安全和集成團隊多年的開發努力。吳指出,這項工作涉及廣泛的道路測試、使用 Cosmos 等平臺進行持續的大規模模擬,以及與包括梅賽德斯 - 奔馳在內的汽車合作伙伴的緊密合作,計劃在即將推出的量產車輛中進行初步部署。
醫療保健和生命科學更新通過新的 NVIDIA Clara 模型提供。這些包括用于原子級蛋白質設計的 La-Proteina,用于合成感知藥物設計的 ReaSyn v2,用于早期安全和相互作用預測的 KERMT,以及用于 RNA 結構建模的 RNAPro。NVIDIA 還發布了一個包含 45.5 萬個合成蛋白質結構的數據集,以支持該領域的訓練和評估。
所有模型和數據集均在開放許可下發布,可通過 GitHub 和 Hugging Face 訪問。NVIDIA 表示,許多模型還被打包為 NIM 微服務,以便在從本地推理環境到云基礎設施的 NVIDIA 加速系統上部署。
https://www.infoq.com/news/2026/01/nvidia-open-models/
聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.