網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

開源與閉源，有限與無限的游戲

2025-06-30 22:14:09　來源: 胡說成理

河南舉報

分享至

技術(shù)的偉大不在于它被誰擁有，而在于它如何被使用。

——Linux之父Linus Torvalds

把開源和閉源對立，很幼稚

隨著百度在6月30日正式開源文心4.5系列的模型，一場關(guān)于大模型開源和閉源的討論再次開始。

值得一提的是，百度這次的開源是“真開源”，體現(xiàn)在開源模型數(shù)量多、技術(shù)水平高。

從數(shù)量上來說，百度正式開源的文心大模型4.5系列模型，涵蓋了47B、3B激活參數(shù)的混合專家（MoE）模型，與0.3B參數(shù)的稠密型模型等10款模型。

非常值得關(guān)注的是，這次開源實現(xiàn)了預訓練權(quán)重和推理代碼的完全開源，也就是說，開發(fā)者不但會知道百度在做什么，還知道怎么做。

這是諸多開源形式中最徹底、最充分的一種形式，足見百度對這個版本開源的決心之大、期望之高。

同樣需要提及的是，文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。在大語言模型的預訓練中，模型FLOPs利用率（MFU）達到47%。

圖：文心大模型4.5系列開源模型

有飛槳和無飛槳，效果兩個樣，這個話題我們?nèi)蘸笤僬劇?/p>

有趣的是，圍繞百度開源，業(yè)內(nèi)開始再次辯論開源和閉源的優(yōu)越性。

事實上，把開源和閉源看作是完全對立的，很幼稚。

而之所以會產(chǎn)生這種幼稚的看法，是因為一個長期以來的刻板印象——開源就是免費，閉源就是收費；開源就是做奉獻，閉源就是為了牟取暴利。

事實上，開源和閉源只是一種階段性的戰(zhàn)略選擇，這個我們稍后細講。

先說的絕對一點，這世界上從來沒有只有開源模式或只有閉源模式的頭部AI公司。

例如，Meta 開源的 Llama 2 在社區(qū)貢獻下，推理速度提升了 47%，這是一個世界級的標志性現(xiàn)象，也是很多開源支持者津津樂道的一個案例。因為，很多開源支持者認為，能夠取得這樣的成績，核心原因是開源開發(fā)者通過社區(qū)協(xié)作，集合全球開發(fā)者的智慧，從而顯著提升了模型迭代速度。

但是，Meta所謂的開源并不是無保留的。事實上，開源的Llama系列依然保留了核心算法。同時，其一方面以開源姿態(tài)，通過生態(tài)合作（如Hugging Face）擴大影響力；同時，仍有部分閉源模型針對用于商業(yè)化，如Meta AI企業(yè)服務(wù)。

再看一個例子，今年2月，Grok3正式發(fā)布，這款被馬斯克宣稱為“地球上最聰明的AI”，引起了廣泛關(guān)注。

然而，馬斯克并未如外界所猜測那樣，當場宣布開源。

眾所周知，AI大模型業(yè)界，馬斯克被認為是開源的最核心支持者之一，尤其是在openAI轉(zhuǎn)向閉源之后，馬斯克甚至發(fā)起過訴訟。

但從馬斯克及其xAI的真實產(chǎn)品布局看，馬斯克并未如外界所設(shè)想的一樣，走“全開源”路線。實際上，準確的描述是，馬斯克只是宣布將在后續(xù)對上一代大模型即Grok2進行開源，最新的Grok3 則仍然走了閉源路線。

某種程度上，模型開源+保留核心算法，或模型開源但綁定收費云服務(wù)，才是業(yè)內(nèi)通行的做法。

客觀來講，這種做法有助于在維護市場普及率，保持技術(shù)領(lǐng)先性和加強商業(yè)競爭力等三個需要兼顧的要素之間取得平衡——也就是通過對非最新一代（或即將迭代）的模型進行開源，以實現(xiàn)擴大用戶基礎(chǔ)、收集多樣化數(shù)據(jù)，從而推動AI模型的持續(xù)迭代的目的；另一方面，對于最新的或高端的模型，通過直接或間接的方式來收費或與收費服務(wù)綁定，來平衡成本。

畢竟，大模型是一種非常昂貴的造物，其訓練過程中需要的海量算力和數(shù)據(jù)集客觀上需要大量的集中式投入，如果沒有一種相對平衡的成本回收機制，任何一家財雄勢大的AI公司都無法持續(xù)的提供開源，這是一個典型的“雞生蛋還是蛋生雞”的悖論。

所以，你說這種主流做法，到底算是開源，還是閉源？

所以我造了一個詞，叫“混合開閉源”模式，這其實才是真正的主流AI公司的常態(tài)。

如果把眼界再開闊一點，我們還可以進一步得出一個結(jié)論——成熟的軟件企業(yè)，很大程度上是開源和閉源雙軌制的。

微軟可以是說歷史上最堅持閉源，甚至是對開源深惡痛絕的企業(yè)，其來自Windows和Office的滾滾財富，正是基于閉源的基礎(chǔ)之上。其前首席執(zhí)行官鮑爾默甚至抱怨稱開源的Linux“就像是癌癥病毒”。

但曾經(jīng)抵觸，不表示永久抵觸。事實上，意識到軟件行業(yè)的結(jié)構(gòu)發(fā)生深層次變化后，微軟于2018年以75億美元的巨資收購GitHub，后者作為全球最大的開源代碼托管平臺，擁有超過2800萬開發(fā)者用戶和1.2億代碼倉庫，是開發(fā)者社區(qū)的核心樞紐，也可以說是微軟“死對頭”的聚集地。

微軟買下了曾經(jīng)被它稱為“癌癥病毒”的開源社區(qū)，是因為后者能夠有效的服務(wù)于微軟的長期策略。

在鮑爾默執(zhí)掌微軟的后期，這家企業(yè)其實已經(jīng)意識到，售賣操作系統(tǒng)和辦公軟件已經(jīng)是上一個時代的核心商業(yè)模式，微軟正在云計算時代掉隊。

而購買GitHub后，則意味著其最突出的優(yōu)勢——代碼托管功能，可以與微軟的Azure云服務(wù)深度整合。說的更具體一點，無論開發(fā)者通過GitHub上要部署什么應(yīng)用，也無論其開源或閉源屬性，微軟的Azure都將是默認的首選。

從此，微軟成為GitHub的最大開源貢獻者之一，并通過GitHub支持了大量開源項目（如.NET框架、VS Code等），進而重塑了上個世紀以來積累深重的“創(chuàng)新破壞者”的負面企業(yè)形象，進而吸引了大量開發(fā)者群體，客觀上成為了開源時代最重要的“賣水人”之一。

這個例子有力的說明了，單純的用支持開源或不支持開源來判斷一個企業(yè)的戰(zhàn)略是不準確的，成功的企業(yè)必然會將兩者的優(yōu)勢集中起來，在不同的場景和商業(yè)模型下使用。

有限與無限

如果上一章我們是在一個非常宏觀的層面論述了在一個企業(yè)體系內(nèi)必然會兼容開源和閉源這兩種形態(tài)，那么接下來要討論的則是，大模型企業(yè)會在什么樣的具體情況下選擇開源或閉源？

基本的答案是，企業(yè)會根據(jù)具體的賽道場景和競爭需求來加以靈活的選擇。

紐約大學宗教歷史學教授詹姆斯·卡斯在著名的哲學思維著作《有限與無限的游戲》提供了一個認知世界的新觀點，他將世界比作“游戲”，并區(qū)分為有限游戲和無限游戲。有限游戲以取勝為目的，無限游戲以延續(xù)游戲為目的。

或許我們可以打一個這樣的比喻——有限游戲就好比短跑，需要在有限的時間內(nèi)釋放出最大的爆發(fā)力；而無限游戲就好比馬拉松，比拼的是如何在一個漫長的競爭過程中熬過重重難關(guān)并最終取勝。

所以，聰明的公司在面對需要短期內(nèi)制勝（效率導向）的時候，會選擇有限游戲模式；在面對長期性的目標或長尾型的目標（終局模式）時，則采取無限游戲模式。

閉源是典型的有限模式，它通常在目標明確的時候被采用。例如，文心 4.0推出后，面臨的緊迫任務(wù)是盡快的降低推理成本，這時候集中優(yōu)質(zhì)資源打硬仗的“有限游戲”就成為了好的戰(zhàn)略選擇。事實也是如此，通過集中優(yōu)化和連續(xù)壓強式的工作，百度快速把這一版本的推理成本降到最初的1%，并明顯提升了性能。這種情況下，顯然必須依靠閉源模式來集中兵力打硬仗。

然而，這次開源文心4.5的歷史背景已經(jīng)發(fā)生了很大的變化，這一版本被寄托的任務(wù)是加強滲透率和下載量，提高整個文心模型的普及率。這是一個非常長周期、長尾型的任務(wù)，在這種背景下，百度就自然會傾向于無限模式，這也是這次開源的深層次原因。

事實上，這樣根據(jù)任務(wù)的不同屬性來靈活決定某一個版本的開源屬性的方式，已經(jīng)成為AI特別是大模型領(lǐng)域的主流。

以開源著稱的通義千問系列為例，其中7B、14B、72B等中小規(guī)模模型已開源，魔搭社區(qū)里更是提供了成百上千的版本供開發(fā)者自由下載和二次開發(fā)。

但與此同時，300B等大規(guī)模模型（如通義千問Max、Qwen3-235B-A22B等）則作為企業(yè)級云服務(wù)產(chǎn)品，因為其特性是通過API或私有化部署提供給企業(yè)客戶，而且能夠用到這種強大模型的機構(gòu)，對私有化部署中的安全性、定制化和高性能都非常敏感，所以一定會選擇閉源模式。

圖：文心多模態(tài)后訓練模型（支持思考、關(guān)閉思考）

在多個多模態(tài)基準測試中達到SOTA水平

與之類似的還有如谷歌開源了Gemini 2B/7B模型以對抗Meta，這是一場長期競爭，所以選擇了開源模式；但對于數(shù)據(jù)、安全訴求都處于高敏感區(qū)間的如醫(yī)療、自動駕駛等領(lǐng)域，谷歌則提供了最高層次的閉源Gemini Ultra模型。

當然，商業(yè)訴求僅僅是企業(yè)選擇開閉源的決策要素之一而非全部，更長久影響某個模型開閉源的主要因素，來自于其要完成的利益使命。

從對模型充分發(fā)展的意義上來講，開源的優(yōu)勢非常明顯，它可以集中智慧，顯著降低參與門檻，吸引大量開發(fā)者、嘗試者，從某種程度上提高某一系列模型整體上的“市場占有率”，DeepSeek R1就是最好的例子；但開源也有重要缺點，就是其貢獻沒有強制機制，導致其穩(wěn)定性欠佳。

例如，有研究者就指出，開源代碼的貢獻者并不都是想象中那么“無私”——仍以GitHub為例，其社區(qū)中幾乎每天都有開源項目因缺乏持續(xù)維護而被淘汰，而被淘汰的原因并非技術(shù)上的難以為繼，而是因為開發(fā)者憑借已經(jīng)開發(fā)的版本拿到了巨頭的收購offer，進而停止了對開源項目的維護。

這個例子非常生動的告訴我們，不用也沒有必要把開源或閉源的選擇過于理想化，甚至提升到情懷層面。在真實世界里，無論是大企業(yè)還是個人開發(fā)者，其選擇開閉源的主要理由都是由現(xiàn)實的利益和競爭的需求所決定的。

百度4.5開源，打開了一個新時代

百度斷然決定把4.5版本在6月30日開源，是一個重要且敏捷的決定。

幾個月前，DeepSeek的發(fā)布，的確讓國內(nèi)的AI領(lǐng)域有一種瞬間“萬馬齊喑”的感覺，特別是多年重度投入AI的大廠們更是受到了重重追問。

帶著文心4.5 Turbo和文心X1 Turbo這兩個具有很強競爭優(yōu)勢的新模型回歸，百度用這種方式表達了自己的生存哲學——不但要跟進，還要打到終局模式。

客觀來講，DeepSeek的開源（盡管其也有閉源版本），對公眾而言，是在開源和閉源的天秤上，在“開源”這一側(cè)放下了一顆重重的砝碼。

可以說，從這一刻開始，大模型競爭從單純的對比參數(shù)、打榜、發(fā)論文，變成了真刀真槍的PK自家模型的行業(yè)滲透率和普及率。

我曾經(jīng)寫過，百度AI的生存哲學，核心就是競爭與創(chuàng)新。你也可以理解為，百度視AI核心業(yè)務(wù)的發(fā)展為一個非常長期的競爭過程，而技術(shù)創(chuàng)新是其生存競爭優(yōu)勢得以存在的重要保證。

既需要拉升滲透率，又需要持續(xù)的投入一場創(chuàng)新和競爭的馬拉松，顯而易見，這是一場“無限游戲”，所以百度毅然選擇了開源模式。而且筆者甚至還猜測，在未來，對若干具有市場競爭力的大版本持續(xù)開源，或?qū)⒊蔀榘俣鹊囊环N新的模式。

之所以產(chǎn)生這樣的結(jié)果，最大的時代背景是——大模型已經(jīng)從“嘗新期”進入成熟期，已經(jīng)從“炫技”變成“應(yīng)用為王”，目前各大勢力的核心目標都已經(jīng)不再是飆指標，而是希望迅速進入千行百業(yè)的實際應(yīng)用場景中，通過占據(jù)場景來“分蛋糕”。這種情況下，開源部分具有明顯優(yōu)勢的核心版本，是最有效、最及時的辦法。

百度本身就是國內(nèi)罕有的四層架構(gòu)俱全的全棧型AI公司，加之其擁有被成為“大模型的操作系統(tǒng)”的深度學習框架飛槳，這都讓百度有了維持一場長期的，同時既比拼模型性能也比拼生態(tài)厚度的競爭的前提條件，這也是4.5版本開源的另一個宏觀戰(zhàn)略背景。

更具體的說，一方面，文心4.5的開源，以其優(yōu)異的性能，顯然能夠吸引更多開發(fā)者參與到這一版模型的優(yōu)化與創(chuàng)新中來，從而匯聚各方智慧，加速模型性能的提升。

而另一方面，大模型的應(yīng)用普及期已經(jīng)開啟，通過開源，百度可以與上下游企業(yè)、科研機構(gòu)以及廣大開發(fā)者建立更緊密的合作關(guān)系，共同探索大模型在更多領(lǐng)域的應(yīng)用，推動整個行業(yè)的發(fā)展，從而切下更大的一塊“蛋糕”。

而除了以上的宏觀意義之外，從微觀層面來看，百度此次開源，也將帶來更強的商業(yè)化效率。例如，一方面堅持開源基礎(chǔ)模型（文心4.5）吸引用戶，另一方面，通過千帆平臺企業(yè)版（MaaS服務(wù)），以及重點行業(yè)的私有化部署、定制化需求等實現(xiàn)高端盈利。

結(jié)語

百戰(zhàn)歸來，仍是少年

作為一個長期跟蹤百度AI戰(zhàn)略的行業(yè)研究者，我當然難以忘卻百度在前幾年對閉源模式的偏愛，以及其背后的原因，如認為閉源模式更有效率等等。

所以，我也一度認為，百度雖然必然會在某個時刻、某個版本上轉(zhuǎn)向開源，但“偶像包袱”和“面子問題”，都會引發(fā)爭議和困惑。

但是沒想到，說轉(zhuǎn)就轉(zhuǎn)了，可謂快速決策，靈活轉(zhuǎn)身。

我為百度的干脆感到高興，從更深層次來說，這不僅說明了百度求真務(wù)實、洞察時代潮流變化的戰(zhàn)略洞察力，也說明百度及其領(lǐng)導者身上仍然具有創(chuàng)業(yè)企業(yè)的靈活性和活力，對于一家創(chuàng)立了25年的公司來說，能保留這種初心和活力，本身就是一種競爭力。

或許，此前百度的追求中，除了發(fā)展AI技術(shù)創(chuàng)新以外，也有對自己是行業(yè)領(lǐng)頭羊的內(nèi)心驕傲。但現(xiàn)在看來，百度的追求變得更加務(wù)實和接地氣——在認定“應(yīng)用”是目前的頭等大事后，百度可以說方方面面的努力都是服務(wù)于“應(yīng)用”。但這種“服務(wù)”的本質(zhì)，是苦心經(jīng)營自己的底層核心競爭力、提升自家基礎(chǔ)大模型的核心能力和成本優(yōu)勢后，對行業(yè)能夠更好、更便宜的去應(yīng)用AI資源的一種最好的支持。

而這種努力的具象，就是眼前的這次開源；我認為這次開源是百度的一道關(guān)口，過了這道關(guān)，百度會放下很多歷史包袱，會以更加靈活和充滿活力的姿態(tài)，參與AI賽道的長跑，去爭取無盡游戲的終局勝利。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.