NVIDIA 為 gpt-oss-120b 帶來業界領先性能,在單個 NVIDIA Blackwell 系統上實現每秒 150 萬個 Token。
![]()
OpenAI 發布了兩個全新開放權重 AI 邏輯推理模型,為全球各個行業、規模的開發者、愛好者、企業、初創公司及政府機構帶來前沿 AI 開發技術。
由 NVIDIA 與 OpenAI 共同開發的開放模型 gpt-oss-120b 和 gpt-oss-20b,展現了由社區驅動創新的力量,并凸顯 NVIDIA 在推動全球 AI 普及中的關鍵作用。
任何人都可以使用這兩個模型開發生成式 AI、邏輯推理 AI 和物理 AI 以及醫療和制造領域的突破性應用,甚至在 AI 驅動的新一輪工業革命發展過程中開拓新的行業領域。
OpenAI 新發布的靈活、開放權重的文本推理大語言模型 (LLM) 在 NVIDIA Hopper 架構 GPU 上訓練而成,能夠在全球數億顆運行 NVIDIA CUDA 平臺的 GPU 上實現極佳推理性能。
這些模型現已作為 NVIDIA NIM 的形式提供,可輕松地部署在任何 GPU 加速基礎設施上,并同時具有靈活性、數據隱私和提供企業級安全等特性。
憑借專為 NVIDIA Blackwell 平臺開發的軟件優化措施,這兩個模型可在 NVIDIA GB200 NVL72 系統上實現每秒 150 萬個 Token 的卓越推理性能,極大提升推理效率。
NVIDIA 創始人兼首席執行官黃仁勛表示:“OpenAI 向世界展示了基于 NVIDIA AI 開發的技術,現在他們正在推動開源軟件領域的創新。新發布的 gpt-oss 模型使全球各地的開發者都能夠在先進的開源基礎上進行開發,而這一切都要依托領先的 AI 計算基礎設施。”
NVIDIA Blackwell 提供先進的推理技術
隨著 gpt-oss 等先進邏輯推理模型所生成 Token 的數量指數級增長,對計算基礎設施的需求也大幅增加。NVIDIA Blackwell 驅動的專用 AI 工廠能夠滿足這一需求,該架構旨在提供超高性能推理所需的規模、效率和投資回報。
NVIDIA Blackwell 包含 NVFP4 4 位精度等創新技術,可在大幅降低功耗和顯存需求的同時,實現極高的推理效率和準確性。這使得實時部署萬億參數級的大語言模型 (LLM) 成為可能,進而為企業創造數十億美元的價值。
幫助全球數百萬 AI 構建者實現開放式開發
NVIDIA CUDA 是全球廣泛使用的計算基礎設施。無論是在強大的 NVIDIA DGX Cloud 平臺,還是 NVIDIA GeForce RTX 和 NVIDIA RTX PRO 驅動的 PC 和工作站,用戶都可以任意部署和運行 AI 模型。
截至目前,NVIDIA CUDA 的下載量已超過 4.5 億次。龐大的 CUDA 開發者社區現已能夠使用這兩個最新模型,并在其自身使用的 NVIDIA 技術棧上運行。
為進一步推動軟件開源,OpenAI 與 NVIDIA 還攜手頂級開源框架提供商,為 FlashInfer、Hugging Face、llama.cpp、Ollama 和 vLLM 等框架以及 NVIDIA Tensor-RT LLM 等庫提供模型優化方案,使開發者能夠選擇自己常用的框架進行開發。
建立在開源基礎上的長期合作
新發布的模型展現了 NVIDIA 的全棧技術如何將全球前沿的 AI 項目帶給盡可能廣泛的用戶群體。
這個故事可追溯到 NVIDIA 與 OpenAI 的初期合作。2016 年,黃仁勛親自將首臺 NVIDIA DGX-1 AI 超級計算機送至 OpenAI 位于舊金山的總部。
自那時起,兩家公司就一直共同推動 AI 技術的邊界,為用戶提供大規模訓練所需的核心技術與專業知識。
如今,全球 250 個國家 / 地區共有 650 萬開發者正在使用 900 多種 NVIDIA 軟件開發套件和 AI 模型進行開發,這一數字仍在持續增長。通過對 OpenAI 的 gpt-oss 模型進行 NVIDIA Blackwell 和 RTX GPU 適配優化以及推出豐富的軟件堆棧,NVIDIA 正在為這些開發者提供更加快速、更具有經濟效益的先進 AI 技術。
您可通過閱讀 NVIDIA 技術博客及 NVIDIA RTX AI Garage 博客系列的最新文章了解更多詳情,并開始使用 gpt-oss 模型進行開發。
NVIDIA 技術博客:
https://developer.nvidia.com/blog/delivering-1-5-m-tps-inference-on-nvidia-gb200-nvl72-nvidia-accelerates-openai-gpt-oss-models-from-cloud-to-edge/
NVIDIA RTX AI Garage 博客系列:
https://blogs.nvidia.com/blog/rtx-ai-garage-openai-oss
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.