就在剛剛,OpenAI 自 2019 年發布 GPT-2 以來,推出了其首批開放權重的大型語言模型——GPT-OSS。與通過 OpenAI 網頁界面調用的閉源模型不同,這些新模型可免費下載、在筆記本電腦及其他本地設備上運行,甚至允許用戶進行修改。
此次發布的模型包含兩個版本:1200 億參數版和200 億參數版。其中,較大版本可在單個 NVIDIA GPU 上運行,性能與 OpenAI 當前的 o4-mini 模型相當;較小版本性能接近 o3-mini,僅需 16GB 內存即可部署。兩款模型已通過 Hugging Face、Databricks、Azure 和 AWS 等平臺發布,并采用 Apache 2.0 許可證,允許廣泛修改并可用于商業用途。
![]()
官方介紹稱:GPT-OSS-120b和 GPT-OSS-20b是兩款先進的開放權重語言模型,能夠在低成本條件下提供強大的實際性能。它們在推理任務上的表現優于同規模的現有開源模型,具備出色的工具調用能力,并針對消費級硬件的高效部署進行了深度優化。
PART 01
硬剛中國模型?
多年來,OpenAI 一直未推出開放權重的大型語言模型,部分用戶因此戲稱其為“ClosedAI”。過去幾個月,這些備受期待的模型兩次推遲發布,進一步加劇了社區的失望情緒。而此次發布,標志著 OpenAI 正在努力重塑其在開放模型社區中的品牌形象。
據《麻省理工科技評論》分析,OpenAI 此舉背后,是美國在應對中國于開放模型領域日益增強的主導地位所面臨的壓力。
值得注意的是,Meta 曾憑借其 Llama 系列在美國開放模型市場占據主導地位,但近期似乎正轉向更封閉的發布策略。與此同時,中國的開放模型如 DeepSeek、Kimi K2 以及阿里巴巴的 Qwen 系列,正越來越受到全球開發者的青睞。
今年早些時候,CEO Sam Altman 曾表示,安全問題是未及時發布開放模型的主要原因。然而,隨著開發者紛紛轉向成本更低、可定制性更強的開源模型,繼續缺席這一領域被視為“站在了歷史的錯誤一邊”。
對此,OpenAI 研究項目經理 Casey Dvorak 在發布新聞發布會上表示:“我們絕大多數的企業和初創客戶已經在廣泛使用各類開放模型。此前,OpenAI 缺乏具有競爭力的開放產品,而現在,我們希望填補這一空白,真正讓客戶全面使用我們的技術。”
PART 02
可商用的GPT-OSS
開放模型具備多個關鍵應用場景:一些組織希望根據自身需求定制模型,或通過在本地設備運行以降低長期云服務成本,盡管前期硬件投入較高;而醫院、律所、政府等對數據敏感的機構,則需要能夠在本地部署、確保數據不出域的解決方案。
此次 OpenAI 選擇采用寬松的 Apache 2.0 許可證發布 GPT-OSS,支持商業用途,正是為了推動上述應用場景的發展。這一舉措值得肯定,也符合當前主流開源模型的授權慣例。
從更深層看,OpenAI 此舉也是為了重新確立其在 AI 研究生態中的領導地位。一旦研究人員廣泛采用 GPT-OSS 作為基礎模型,OpenAI 有望吸收社區創新成果,反哺自身模型生態。
在安全方面,OpenAI 表示,GPT-OSS 是其迄今為止經過最嚴格安全測試的模型,并已與外部安全機構合作,評估其在網絡安全、生物風險等領域的潛在濫用可能。公司還強調,該模型的“思維鏈”(chain-of-thought)將被顯式展示,以便監控其是否存在欺騙、越獄或不當行為。輸出為純文本格式,且與 OpenAI 所有模型一致,其訓練數據不會公開。
目前,OpenAI 尚未公布 GPT-OSS 與 Llama、DeepSeek或谷歌 Gemma 等同類模型的基準對比數據,也未承諾未來版本的發布計劃。但其目標明確:吸引希望更好掌控數據使用方式的中小型開發者和企業用戶。
OpenAI 始終相信:只要降低技術門檻,創新便會自然涌現。如今,GPT-OSS 的發布,正是這一信念的又一次實踐。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.