![]()
![]()
當(dāng)下開(kāi)源相對(duì)閉源更容易出現(xiàn)“贏家通吃”的情況,但所有人都在“卷”開(kāi)源模型的狀態(tài)可能不會(huì)持續(xù)太久
文|《財(cái)經(jīng)》研究員周源吳俊宇黃思韻
編輯|謝麗容
最早引領(lǐng)全球人工智能大模型風(fēng)潮的明星創(chuàng)業(yè)公司OpenAI近期有了大的產(chǎn)品邏輯和戰(zhàn)略轉(zhuǎn)變。
8月5日,OpenAI宣布開(kāi)源兩款權(quán)重模型——參數(shù)量為1170億的gpt-oss-120b和參數(shù)量210億的gpt-oss-20b,分別針對(duì)云端高推理與邊緣低延遲兩大場(chǎng)景。這是自2019年開(kāi)源GPT-2以來(lái),OpenAI再次在開(kāi)源領(lǐng)域發(fā)力。
OpenAI在2015年成立,2022年11月30日,該公司發(fā)布的ChatGPT憑借“能流暢對(duì)話(huà)、寫(xiě)代碼、創(chuàng)作內(nèi)容”迅速紅遍全球,5天內(nèi)用戶(hù)破百萬(wàn),2個(gè)月破億,是全球互聯(lián)網(wǎng)歷史上最快達(dá)到這一規(guī)模的產(chǎn)品(此前TikTok用了9個(gè)月)。
時(shí)至今日,OpenAI在全球消費(fèi)級(jí)市場(chǎng)的優(yōu)勢(shì)其實(shí)仍然難以撼動(dòng)。根據(jù)今年八月最新數(shù)據(jù),ChatGPT 周活躍用戶(hù)已達(dá)7億,同比增長(zhǎng)4倍,日均消息量突破30億條。其付費(fèi)用戶(hù)數(shù)從2024年的300萬(wàn)增至500萬(wàn),Pro會(huì)員和企業(yè)版用戶(hù)貢獻(xiàn)了超60%的收入。這一增長(zhǎng)速度遠(yuǎn)超同期谷歌Gemini App(月活 4.5 億)和 Anthropic Claude(安卓版首周下載僅1萬(wàn)+)。
但在更加廣闊的企業(yè)級(jí)市場(chǎng),OpenAI份額正在面臨可能進(jìn)一步被Anthropic(預(yù)計(jì)今年四季度達(dá)35%)和谷歌(20%)蠶食的現(xiàn)實(shí)挑戰(zhàn)。另外,還有更多來(lái)自其他走開(kāi)源路線(xiàn)的潛在競(jìng)爭(zhēng)對(duì)手在悄然蠶食OpenAI的競(jìng)爭(zhēng)優(yōu)勢(shì)。
開(kāi)源還是閉源,至少在當(dāng)下,可能會(huì)決定這家公司未來(lái)增長(zhǎng)潛力和方向。
其實(shí),OpenAI成立之初,秉承的是開(kāi)源理念。2018年發(fā)布GPT-1模型,以及2019年發(fā)布的GPT-2模型,在一定程度上都體現(xiàn)了其開(kāi)源的理念。
真正標(biāo)志著OpenAI走向閉源路線(xiàn)的時(shí)間節(jié)點(diǎn)是2020年。2020年5月,OpenAI將GPT-3以論文形式發(fā)布,至此,OpenAI不再公開(kāi)模型的權(quán)重、代碼或訓(xùn)練數(shù)據(jù),開(kāi)發(fā)者無(wú)法只能通過(guò)OpenAI提供的API接口按規(guī)則調(diào)用OpenAI的模型。
閉源的商業(yè)模式為OpenAI帶來(lái)不少批評(píng)之聲,認(rèn)為這偏離了該公司所宣稱(chēng)的“造福全人類(lèi)”的初衷,甚至有人調(diào)侃OpenAI應(yīng)改名“CloseAI”。該公司首席執(zhí)行官山姆?奧特曼(Sam Altman)對(duì)此公開(kāi)解釋稱(chēng),OpenAI的核心使命是確保人工智能的安全,在決定是否開(kāi)源時(shí),需要謹(jǐn)慎權(quán)衡開(kāi)源可能帶來(lái)的安全風(fēng)險(xiǎn)。
2025年初,中國(guó)AI創(chuàng)業(yè)公司DeepSeek(深度求索)推出開(kāi)源模型DeepSeek R1,引發(fā)全球AI產(chǎn)業(yè)的高度關(guān)注。前谷歌CEO Eric Schmidt在媒體采訪(fǎng)時(shí)警告:“如果我們不對(duì)此采取行動(dòng),中國(guó)最終將成為開(kāi)源領(lǐng)域的領(lǐng)導(dǎo)者,而世界的其他地方將走向閉源。”
今年2月,在美國(guó)社交平臺(tái)Reddit的一次公開(kāi)活動(dòng)上,有用戶(hù)問(wèn)DeepSeek的崛起是否會(huì)改變OpenAI對(duì)未來(lái)模型開(kāi)源的計(jì)劃。奧特曼不僅承認(rèn)DeepSeek的模型“非常好”,并表示他個(gè)人認(rèn)為OpenAI在開(kāi)源問(wèn)題上“站在了歷史的錯(cuò)誤一邊”,需要制定一個(gè)不同的開(kāi)源策略。
![]()
多大程度的開(kāi)源?
奧特曼稱(chēng)OpenAI新推出的開(kāi)源模型為“全球最強(qiáng)開(kāi)放模型”。
據(jù)介紹,兩款gpt-oss模型均采用Transformer架構(gòu),并利用專(zhuān)家混合(MoE)來(lái)減少處理輸入所需的活躍參數(shù)數(shù)量。
其中,gpt-oss-120b 專(zhuān)為生產(chǎn)環(huán)境、通用應(yīng)用和高推理需求而設(shè)計(jì),其每個(gè)token激活5.1億參數(shù),雖然總參數(shù)量高達(dá)1170億,但卻能夠在單個(gè)英偉達(dá)專(zhuān)業(yè)數(shù)據(jù)中心GPU上運(yùn)行,該模型既能部署在數(shù)據(jù)中心,也能在高端臺(tái)式機(jī)和筆記本電腦上運(yùn)行。
gpt-oss-20b則更側(cè)重于本地化和專(zhuān)業(yè)化使用場(chǎng)景,激活36億參數(shù),僅需16GB內(nèi)存就能運(yùn)行,大多數(shù)現(xiàn)代臺(tái)式機(jī)和筆記本電腦都能夠輕松駕馭。
![]()
OpenAI兩款開(kāi)源模型一經(jīng)發(fā)布立即引發(fā)高度關(guān)注,在全球知名AI開(kāi)源社區(qū)“抱抱臉”(Hugging Face)上,兩款模型的下載量激增,以至于Hugging Face首席技術(shù)官公開(kāi)請(qǐng)求大家不要急著第一時(shí)間下載,否則其服務(wù)器會(huì)“崩潰”。
Agent公司圖靈集市首席技術(shù)官陳俊哲告訴我們,盡管OpenAI這次開(kāi)源模型的性能很吸引他,但對(duì)于許多應(yīng)用場(chǎng)景而言,20B規(guī)模的模型成本過(guò)高,其顯存開(kāi)銷(xiāo)是主流參數(shù)模型7B-8B模型的3倍。
陳俊哲所在公司使用的是阿里Qwen系列8B開(kāi)源模型。他表示,對(duì)于中小創(chuàng)業(yè)公司而言,小尺寸開(kāi)源模型更具有吸引力,盡管中國(guó)市場(chǎng)也存在30B甚至70B等更大規(guī)模的開(kāi)源模型,但7B-8B模型因其低成本和高靈活性而備受青睞。
兩款開(kāi)源模型均遵循寬松的Apache 2.0開(kāi)源許可協(xié)議,為商業(yè)和研究使用提供了極大的自由度。
這也是OpenAI繼GPT-2模型之后首次推出開(kāi)放權(quán)重(open-weight)的語(yǔ)言模型。所謂開(kāi)放權(quán)重,是指開(kāi)發(fā)者在使用開(kāi)源的權(quán)重模型時(shí),不必通過(guò)OpenAI官方提供的應(yīng)用程序接口(API)來(lái)調(diào)用模型功能。
API 接口就像是一個(gè)“中間商”,過(guò)去開(kāi)發(fā)者若想使用OpenAI的模型,得通過(guò)這個(gè)接口連接到OpenAI的服務(wù)器,按調(diào)用次數(shù)付費(fèi),且所有數(shù)據(jù)處理和計(jì)算都在OpenAI的系統(tǒng)中完成,開(kāi)發(fā)者受限于OpenAI的調(diào)用規(guī)則、費(fèi)用標(biāo)準(zhǔn)和數(shù)據(jù)隱私政策。
而當(dāng)模型權(quán)重開(kāi)源后,開(kāi)發(fā)者可以把完整的模型文件下載到自己的服務(wù)器、電腦等硬件設(shè)備上。此時(shí),運(yùn)行模型、處理數(shù)據(jù)、生成結(jié)果等一系列操作都在本地完成,無(wú)需再與OpenAI的服務(wù)器產(chǎn)生連接,自然也就不用依賴(lài)其API 接口了。
這一變化的意義較大,它讓開(kāi)發(fā)者在使用模型時(shí)更自由,能自主控制數(shù)據(jù)處理流程,降低對(duì)外部平臺(tái)的依賴(lài),還能節(jié)省API調(diào)用的費(fèi)用,尤其適合有大量處理需求或?qū)?shù)據(jù)隱私有高要求的場(chǎng)景。
但OpenAI官方明確表態(tài),不會(huì)開(kāi)源訓(xùn)練數(shù)據(jù)與完整訓(xùn)練代碼。
從技術(shù)層面來(lái)看,訓(xùn)練數(shù)據(jù)如同模型的“學(xué)習(xí)素材”,完整訓(xùn)練代碼則是模型構(gòu)建的“操作指南”。不開(kāi)源訓(xùn)練數(shù)據(jù),使得外界難以知曉gpt-oss模型究竟“學(xué)了什么”,模型在訓(xùn)練過(guò)程中所使用的數(shù)據(jù)來(lái)源、數(shù)據(jù)處理方式等關(guān)鍵信息被隱藏。
訓(xùn)練代碼的缺失,意味著開(kāi)發(fā)者無(wú)法復(fù)刻模型的訓(xùn)練過(guò)程,不能根據(jù)自身需求重新訓(xùn)練模型。例如無(wú)法對(duì)訓(xùn)練代碼進(jìn)行修改,來(lái)適配不同的硬件環(huán)境,或是嘗試新的訓(xùn)練算法以提升模型性能。
多位行業(yè)人士向我們表示,這一做法是OpenAI維護(hù)自身優(yōu)勢(shì)的重要手段。因?yàn)橛?xùn)練數(shù)據(jù)和完整訓(xùn)練代碼是其核心資產(chǎn),倘若開(kāi)源,競(jìng)爭(zhēng)對(duì)手可能利用這些資源,快速提升自家模型性能,削弱OpenAI 在市場(chǎng)中的領(lǐng)先地位。
但硬幣的另一面是,這種做法意味著開(kāi)發(fā)人員無(wú)法獲取訓(xùn)練數(shù)據(jù)和代碼,限制了對(duì)模型的深入研究,缺少這些關(guān)鍵要素,降低了模型的可驗(yàn)證性與可重現(xiàn)性,無(wú)法充分發(fā)揮開(kāi)源的優(yōu)勢(shì)。
![]()
為了成為更大的贏家?
市場(chǎng)普遍認(rèn)為,OpenAI此次開(kāi)源的主要目的是為了擴(kuò)大自家模型在全球市場(chǎng)的影響力。
近一年,開(kāi)源模型的市場(chǎng)影響力不斷擴(kuò)張。因?yàn)殚_(kāi)源模型任何人都能下載、部署、使用。開(kāi)源模型就像種子,不斷被散播并生根發(fā)芽,被全球開(kāi)發(fā)者二次訓(xùn)練或部署使用。
對(duì)于OpenAI來(lái)說(shuō),開(kāi)源模型的推廣渠道和此前大不一樣。8月6日,OpenAI這兩款開(kāi)源模型很快登陸了亞馬遜AWS。這意味著OpenAI獲得了全球最大云廠(chǎng)商的“帶貨能力”,企業(yè)客戶(hù)可以直接在亞馬遜AWS上使用這兩款模型。且企業(yè)自己也可以把OpenAI這兩款模型部署到谷歌云、阿里云等其他云平臺(tái)上,而不是像過(guò)去只能在微軟Azure上使用OpenAI的模型。
2024年之前,大模型領(lǐng)域一個(gè)曾經(jīng)的共識(shí)是,開(kāi)源模型和閉源模型的性能存在差距。不過(guò),近一年,開(kāi)源模型正在不斷縮小和閉源模型之間的差距。尤其是中國(guó)AI創(chuàng)業(yè)公司DeepSeek旗下的DeepSeek-R1、阿里旗下的Qwen 3系列都打破了這一刻板印象。
比如DeepSeek-R1和阿里Qwen 3借助開(kāi)源策略,下載量、調(diào)用量、衍生模型數(shù)量都在全球領(lǐng)先。截至今年7月,阿里Qwen系列已開(kāi)源300余個(gè)模型,全球下載量超4億次,Qwen衍生模型數(shù)超14萬(wàn)個(gè),是目前全球開(kāi)源模型的領(lǐng)頭羊。
今年6月,阿里云CTO、通義實(shí)驗(yàn)室負(fù)責(zé)人周靖人在魔搭開(kāi)發(fā)者大會(huì)群訪(fǎng)環(huán)節(jié)曾對(duì)我們表示,一個(gè)成功的開(kāi)源模型生態(tài),其價(jià)值絕不止于模型本身,而在于圍繞模型構(gòu)建起的價(jià)值網(wǎng)絡(luò)——包括豐富的應(yīng)用案例、活躍的社區(qū)交流氛圍。通過(guò)開(kāi)源,模型廠(chǎng)商可以獲得來(lái)自全球數(shù)千萬(wàn)開(kāi)發(fā)者的寶貴反饋,包括使用體驗(yàn)、Bug報(bào)告和功能建議,這種良性的互動(dòng)對(duì)于模型的快速迭代和優(yōu)化至關(guān)重要。
OpenAI重回開(kāi)源這一舉措也意味著,未來(lái)AI巨頭將更多采取開(kāi)源閉源兩手抓模式,即開(kāi)源部分基礎(chǔ)模型,同時(shí)保留更先進(jìn)、更具商業(yè)價(jià)值的模型作為核心競(jìng)爭(zhēng)力。
不過(guò),也只有頭部企業(yè)或者極少數(shù)能持續(xù)融資的創(chuàng)業(yè)公司能堅(jiān)持開(kāi)源。因?yàn)殚_(kāi)源模型無(wú)法直接獲得收入。例如,OpenAI在亞馬遜AWS上的開(kāi)源模型,企業(yè)客戶(hù)并不需要為OpenAI支付模型使用和API調(diào)用費(fèi)用,只需要為亞馬遜AWS支付算力費(fèi)用。無(wú)法直接獲得收入,這是很多企業(yè)猶豫是否要開(kāi)源的重要原因。
從營(yíng)收來(lái)看,OpenAI有長(zhǎng)期打“開(kāi)源牌”的商業(yè)基礎(chǔ)。
此前有媒體報(bào)道,截至今年7月末,OpenAI預(yù)計(jì)將實(shí)現(xiàn)120億美元的年度經(jīng)常性收入(ARR,Annual Recurring Revenue)。這一營(yíng)收規(guī)模使得OpenAI成為全球最大的AI創(chuàng)業(yè)公司,且遠(yuǎn)超它的最大競(jìng)爭(zhēng)對(duì)手Anthropic。截至今年7月末,Anthropic的年度經(jīng)常性收入預(yù)計(jì)僅為50億美元。
![]()
OpenAI重新開(kāi)源開(kāi)放勢(shì)必影響到全球開(kāi)源模型競(jìng)爭(zhēng)格局。
當(dāng)下AI產(chǎn)業(yè)的一大現(xiàn)象是,越來(lái)越多中國(guó)科技公司參與到全球開(kāi)源模型競(jìng)速中。7月31日,全球知名AI開(kāi)源社區(qū)“抱抱臉”(Hugging Face)趨勢(shì)熱門(mén)榜單前10名中,中國(guó)大模型占據(jù)8席。活躍其中的角色,分別是頭部互聯(lián)網(wǎng)公司阿里、騰訊,和“AI六小虎”中的智譜、月之暗面(更多信息參見(jiàn))
至少在當(dāng)下,相比閉源,開(kāi)源更容易出現(xiàn)“贏家通吃”的情況。
但一位頭部科技公司技術(shù)負(fù)責(zé)人告訴我們,大家都在“卷”開(kāi)源模型的狀態(tài)不會(huì)持續(xù)太久,“大模型還處于比較早期的階段,且大公司還沒(méi)有拿到絕對(duì)優(yōu)勢(shì),大家都有機(jī)會(huì)成為贏家”。
![]()
![]()
![]()
注添加微信煩勞注明來(lái)意、姓名及職業(yè),
歡迎一切良性業(yè)務(wù)探討及線(xiàn)索提供 !
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.