網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

為了“不站在歷史錯(cuò)誤的一邊”，OpenAI又開(kāi)源了

2025-08-06 18:35:16　來(lái)源: 財(cái)經(jīng)AI湃

北京舉報(bào)

分享至

當(dāng)下開(kāi)源相對(duì)閉源更容易出現(xiàn)“贏家通吃”的情況，但所有人都在“卷”開(kāi)源模型的狀態(tài)可能不會(huì)持續(xù)太久

文｜《財(cái)經(jīng)》研究員周源吳俊宇黃思韻

編輯｜謝麗容

最早引領(lǐng)全球人工智能大模型風(fēng)潮的明星創(chuàng)業(yè)公司OpenAI近期有了大的產(chǎn)品邏輯和戰(zhàn)略轉(zhuǎn)變。

8月5日，OpenAI宣布開(kāi)源兩款權(quán)重模型——參數(shù)量為1170億的gpt-oss-120b和參數(shù)量210億的gpt-oss-20b，分別針對(duì)云端高推理與邊緣低延遲兩大場(chǎng)景。這是自2019年開(kāi)源GPT-2以來(lái)，OpenAI再次在開(kāi)源領(lǐng)域發(fā)力。

OpenAI在2015年成立，2022年11月30日，該公司發(fā)布的ChatGPT憑借“能流暢對(duì)話(huà)、寫(xiě)代碼、創(chuàng)作內(nèi)容”迅速紅遍全球，5天內(nèi)用戶(hù)破百萬(wàn)，2個(gè)月破億，是全球互聯(lián)網(wǎng)歷史上最快達(dá)到這一規(guī)模的產(chǎn)品（此前TikTok用了9個(gè)月）。

時(shí)至今日，OpenAI在全球消費(fèi)級(jí)市場(chǎng)的優(yōu)勢(shì)其實(shí)仍然難以撼動(dòng)。根據(jù)今年八月最新數(shù)據(jù)，ChatGPT 周活躍用戶(hù)已達(dá)7億，同比增長(zhǎng)4倍，日均消息量突破30億條。其付費(fèi)用戶(hù)數(shù)從2024年的300萬(wàn)增至500萬(wàn)，Pro會(huì)員和企業(yè)版用戶(hù)貢獻(xiàn)了超60%的收入。這一增長(zhǎng)速度遠(yuǎn)超同期谷歌Gemini App（月活 4.5 億）和 Anthropic Claude（安卓版首周下載僅1萬(wàn)+）。

但在更加廣闊的企業(yè)級(jí)市場(chǎng)，OpenAI份額正在面臨可能進(jìn)一步被Anthropic（預(yù)計(jì)今年四季度達(dá)35%）和谷歌（20%）蠶食的現(xiàn)實(shí)挑戰(zhàn)。另外，還有更多來(lái)自其他走開(kāi)源路線(xiàn)的潛在競(jìng)爭(zhēng)對(duì)手在悄然蠶食OpenAI的競(jìng)爭(zhēng)優(yōu)勢(shì)。

開(kāi)源還是閉源，至少在當(dāng)下，可能會(huì)決定這家公司未來(lái)增長(zhǎng)潛力和方向。

其實(shí)，OpenAI成立之初，秉承的是開(kāi)源理念。2018年發(fā)布GPT-1模型，以及2019年發(fā)布的GPT-2模型，在一定程度上都體現(xiàn)了其開(kāi)源的理念。

真正標(biāo)志著OpenAI走向閉源路線(xiàn)的時(shí)間節(jié)點(diǎn)是2020年。2020年5月，OpenAI將GPT-3以論文形式發(fā)布，至此，OpenAI不再公開(kāi)模型的權(quán)重、代碼或訓(xùn)練數(shù)據(jù)，開(kāi)發(fā)者無(wú)法只能通過(guò)OpenAI提供的API接口按規(guī)則調(diào)用OpenAI的模型。

閉源的商業(yè)模式為OpenAI帶來(lái)不少批評(píng)之聲，認(rèn)為這偏離了該公司所宣稱(chēng)的“造福全人類(lèi)”的初衷，甚至有人調(diào)侃OpenAI應(yīng)改名“CloseAI”。該公司首席執(zhí)行官山姆?奧特曼（Sam Altman）對(duì)此公開(kāi)解釋稱(chēng)，OpenAI的核心使命是確保人工智能的安全，在決定是否開(kāi)源時(shí)，需要謹(jǐn)慎權(quán)衡開(kāi)源可能帶來(lái)的安全風(fēng)險(xiǎn)。

2025年初，中國(guó)AI創(chuàng)業(yè)公司DeepSeek（深度求索）推出開(kāi)源模型DeepSeek R1，引發(fā)全球AI產(chǎn)業(yè)的高度關(guān)注。前谷歌CEO Eric Schmidt在媒體采訪(fǎng)時(shí)警告：“如果我們不對(duì)此采取行動(dòng)，中國(guó)最終將成為開(kāi)源領(lǐng)域的領(lǐng)導(dǎo)者，而世界的其他地方將走向閉源。”

今年2月，在美國(guó)社交平臺(tái)Reddit的一次公開(kāi)活動(dòng)上，有用戶(hù)問(wèn)DeepSeek的崛起是否會(huì)改變OpenAI對(duì)未來(lái)模型開(kāi)源的計(jì)劃。奧特曼不僅承認(rèn)DeepSeek的模型“非常好”，并表示他個(gè)人認(rèn)為OpenAI在開(kāi)源問(wèn)題上“站在了歷史的錯(cuò)誤一邊”，需要制定一個(gè)不同的開(kāi)源策略。

多大程度的開(kāi)源？

奧特曼稱(chēng)OpenAI新推出的開(kāi)源模型為“全球最強(qiáng)開(kāi)放模型”。

據(jù)介紹，兩款gpt-oss模型均采用Transformer架構(gòu)，并利用專(zhuān)家混合（MoE）來(lái)減少處理輸入所需的活躍參數(shù)數(shù)量。

其中，gpt-oss-120b 專(zhuān)為生產(chǎn)環(huán)境、通用應(yīng)用和高推理需求而設(shè)計(jì)，其每個(gè)token激活5.1億參數(shù)，雖然總參數(shù)量高達(dá)1170億，但卻能夠在單個(gè)英偉達(dá)專(zhuān)業(yè)數(shù)據(jù)中心GPU上運(yùn)行，該模型既能部署在數(shù)據(jù)中心，也能在高端臺(tái)式機(jī)和筆記本電腦上運(yùn)行。

gpt-oss-20b則更側(cè)重于本地化和專(zhuān)業(yè)化使用場(chǎng)景，激活36億參數(shù)，僅需16GB內(nèi)存就能運(yùn)行，大多數(shù)現(xiàn)代臺(tái)式機(jī)和筆記本電腦都能夠輕松駕馭。

OpenAI兩款開(kāi)源模型一經(jīng)發(fā)布立即引發(fā)高度關(guān)注，在全球知名AI開(kāi)源社區(qū)“抱抱臉”（Hugging Face）上，兩款模型的下載量激增，以至于Hugging Face首席技術(shù)官公開(kāi)請(qǐng)求大家不要急著第一時(shí)間下載，否則其服務(wù)器會(huì)“崩潰”。

Agent公司圖靈集市首席技術(shù)官陳俊哲告訴我們，盡管OpenAI這次開(kāi)源模型的性能很吸引他，但對(duì)于許多應(yīng)用場(chǎng)景而言，20B規(guī)模的模型成本過(guò)高，其顯存開(kāi)銷(xiāo)是主流參數(shù)模型7B-8B模型的3倍。

陳俊哲所在公司使用的是阿里Qwen系列8B開(kāi)源模型。他表示，對(duì)于中小創(chuàng)業(yè)公司而言，小尺寸開(kāi)源模型更具有吸引力，盡管中國(guó)市場(chǎng)也存在30B甚至70B等更大規(guī)模的開(kāi)源模型，但7B-8B模型因其低成本和高靈活性而備受青睞。

兩款開(kāi)源模型均遵循寬松的Apache 2.0開(kāi)源許可協(xié)議，為商業(yè)和研究使用提供了極大的自由度。

這也是OpenAI繼GPT-2模型之后首次推出開(kāi)放權(quán)重（open-weight）的語(yǔ)言模型。所謂開(kāi)放權(quán)重，是指開(kāi)發(fā)者在使用開(kāi)源的權(quán)重模型時(shí)，不必通過(guò)OpenAI官方提供的應(yīng)用程序接口（API）來(lái)調(diào)用模型功能。

API 接口就像是一個(gè)“中間商”，過(guò)去開(kāi)發(fā)者若想使用OpenAI的模型，得通過(guò)這個(gè)接口連接到OpenAI的服務(wù)器，按調(diào)用次數(shù)付費(fèi)，且所有數(shù)據(jù)處理和計(jì)算都在OpenAI的系統(tǒng)中完成，開(kāi)發(fā)者受限于OpenAI的調(diào)用規(guī)則、費(fèi)用標(biāo)準(zhǔn)和數(shù)據(jù)隱私政策。

而當(dāng)模型權(quán)重開(kāi)源后，開(kāi)發(fā)者可以把完整的模型文件下載到自己的服務(wù)器、電腦等硬件設(shè)備上。此時(shí)，運(yùn)行模型、處理數(shù)據(jù)、生成結(jié)果等一系列操作都在本地完成，無(wú)需再與OpenAI的服務(wù)器產(chǎn)生連接，自然也就不用依賴(lài)其API 接口了。

這一變化的意義較大，它讓開(kāi)發(fā)者在使用模型時(shí)更自由，能自主控制數(shù)據(jù)處理流程，降低對(duì)外部平臺(tái)的依賴(lài)，還能節(jié)省API調(diào)用的費(fèi)用，尤其適合有大量處理需求或?qū)?shù)據(jù)隱私有高要求的場(chǎng)景。

但OpenAI官方明確表態(tài)，不會(huì)開(kāi)源訓(xùn)練數(shù)據(jù)與完整訓(xùn)練代碼。

從技術(shù)層面來(lái)看，訓(xùn)練數(shù)據(jù)如同模型的“學(xué)習(xí)素材”，完整訓(xùn)練代碼則是模型構(gòu)建的“操作指南”。不開(kāi)源訓(xùn)練數(shù)據(jù)，使得外界難以知曉gpt-oss模型究竟“學(xué)了什么”，模型在訓(xùn)練過(guò)程中所使用的數(shù)據(jù)來(lái)源、數(shù)據(jù)處理方式等關(guān)鍵信息被隱藏。

訓(xùn)練代碼的缺失，意味著開(kāi)發(fā)者無(wú)法復(fù)刻模型的訓(xùn)練過(guò)程，不能根據(jù)自身需求重新訓(xùn)練模型。例如無(wú)法對(duì)訓(xùn)練代碼進(jìn)行修改，來(lái)適配不同的硬件環(huán)境，或是嘗試新的訓(xùn)練算法以提升模型性能。

多位行業(yè)人士向我們表示，這一做法是OpenAI維護(hù)自身優(yōu)勢(shì)的重要手段。因?yàn)橛?xùn)練數(shù)據(jù)和完整訓(xùn)練代碼是其核心資產(chǎn)，倘若開(kāi)源，競(jìng)爭(zhēng)對(duì)手可能利用這些資源，快速提升自家模型性能，削弱OpenAI 在市場(chǎng)中的領(lǐng)先地位。

但硬幣的另一面是，這種做法意味著開(kāi)發(fā)人員無(wú)法獲取訓(xùn)練數(shù)據(jù)和代碼，限制了對(duì)模型的深入研究，缺少這些關(guān)鍵要素，降低了模型的可驗(yàn)證性與可重現(xiàn)性，無(wú)法充分發(fā)揮開(kāi)源的優(yōu)勢(shì)。

為了成為更大的贏家？

市場(chǎng)普遍認(rèn)為，OpenAI此次開(kāi)源的主要目的是為了擴(kuò)大自家模型在全球市場(chǎng)的影響力。

近一年，開(kāi)源模型的市場(chǎng)影響力不斷擴(kuò)張。因?yàn)殚_(kāi)源模型任何人都能下載、部署、使用。開(kāi)源模型就像種子，不斷被散播并生根發(fā)芽，被全球開(kāi)發(fā)者二次訓(xùn)練或部署使用。

對(duì)于OpenAI來(lái)說(shuō)，開(kāi)源模型的推廣渠道和此前大不一樣。8月6日，OpenAI這兩款開(kāi)源模型很快登陸了亞馬遜AWS。這意味著OpenAI獲得了全球最大云廠(chǎng)商的“帶貨能力”，企業(yè)客戶(hù)可以直接在亞馬遜AWS上使用這兩款模型。且企業(yè)自己也可以把OpenAI這兩款模型部署到谷歌云、阿里云等其他云平臺(tái)上，而不是像過(guò)去只能在微軟Azure上使用OpenAI的模型。

2024年之前，大模型領(lǐng)域一個(gè)曾經(jīng)的共識(shí)是，開(kāi)源模型和閉源模型的性能存在差距。不過(guò)，近一年，開(kāi)源模型正在不斷縮小和閉源模型之間的差距。尤其是中國(guó)AI創(chuàng)業(yè)公司DeepSeek旗下的DeepSeek-R1、阿里旗下的Qwen 3系列都打破了這一刻板印象。

比如DeepSeek-R1和阿里Qwen 3借助開(kāi)源策略，下載量、調(diào)用量、衍生模型數(shù)量都在全球領(lǐng)先。截至今年7月，阿里Qwen系列已開(kāi)源300余個(gè)模型，全球下載量超4億次，Qwen衍生模型數(shù)超14萬(wàn)個(gè)，是目前全球開(kāi)源模型的領(lǐng)頭羊。

今年6月，阿里云CTO、通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人在魔搭開(kāi)發(fā)者大會(huì)群訪(fǎng)環(huán)節(jié)曾對(duì)我們表示，一個(gè)成功的開(kāi)源模型生態(tài)，其價(jià)值絕不止于模型本身，而在于圍繞模型構(gòu)建起的價(jià)值網(wǎng)絡(luò)——包括豐富的應(yīng)用案例、活躍的社區(qū)交流氛圍。通過(guò)開(kāi)源，模型廠(chǎng)商可以獲得來(lái)自全球數(shù)千萬(wàn)開(kāi)發(fā)者的寶貴反饋，包括使用體驗(yàn)、Bug報(bào)告和功能建議，這種良性的互動(dòng)對(duì)于模型的快速迭代和優(yōu)化至關(guān)重要。

OpenAI重回開(kāi)源這一舉措也意味著，未來(lái)AI巨頭將更多采取開(kāi)源閉源兩手抓模式，即開(kāi)源部分基礎(chǔ)模型，同時(shí)保留更先進(jìn)、更具商業(yè)價(jià)值的模型作為核心競(jìng)爭(zhēng)力。

不過(guò)，也只有頭部企業(yè)或者極少數(shù)能持續(xù)融資的創(chuàng)業(yè)公司能堅(jiān)持開(kāi)源。因?yàn)殚_(kāi)源模型無(wú)法直接獲得收入。例如，OpenAI在亞馬遜AWS上的開(kāi)源模型，企業(yè)客戶(hù)并不需要為OpenAI支付模型使用和API調(diào)用費(fèi)用，只需要為亞馬遜AWS支付算力費(fèi)用。無(wú)法直接獲得收入，這是很多企業(yè)猶豫是否要開(kāi)源的重要原因。

從營(yíng)收來(lái)看，OpenAI有長(zhǎng)期打“開(kāi)源牌”的商業(yè)基礎(chǔ)。

此前有媒體報(bào)道，截至今年7月末，OpenAI預(yù)計(jì)將實(shí)現(xiàn)120億美元的年度經(jīng)常性收入（ARR，Annual Recurring Revenue）。這一營(yíng)收規(guī)模使得OpenAI成為全球最大的AI創(chuàng)業(yè)公司，且遠(yuǎn)超它的最大競(jìng)爭(zhēng)對(duì)手Anthropic。截至今年7月末，Anthropic的年度經(jīng)常性收入預(yù)計(jì)僅為50億美元。

OpenAI重新開(kāi)源開(kāi)放勢(shì)必影響到全球開(kāi)源模型競(jìng)爭(zhēng)格局。

當(dāng)下AI產(chǎn)業(yè)的一大現(xiàn)象是，越來(lái)越多中國(guó)科技公司參與到全球開(kāi)源模型競(jìng)速中。7月31日，全球知名AI開(kāi)源社區(qū)“抱抱臉”（Hugging Face）趨勢(shì)熱門(mén)榜單前10名中，中國(guó)大模型占據(jù)8席。活躍其中的角色，分別是頭部互聯(lián)網(wǎng)公司阿里、騰訊，和“AI六小虎”中的智譜、月之暗面（更多信息參見(jiàn)）

至少在當(dāng)下，相比閉源，開(kāi)源更容易出現(xiàn)“贏家通吃”的情況。

但一位頭部科技公司技術(shù)負(fù)責(zé)人告訴我們，大家都在“卷”開(kāi)源模型的狀態(tài)不會(huì)持續(xù)太久，“大模型還處于比較早期的階段，且大公司還沒(méi)有拿到絕對(duì)優(yōu)勢(shì)，大家都有機(jī)會(huì)成為贏家”。

注添加微信煩勞注明來(lái)意、姓名及職業(yè)，

歡迎一切良性業(yè)務(wù)探討及線(xiàn)索提供！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.