技術(shù)的偉大不在于它被誰擁有,而在于它如何被使用。
——Linux之父Linus Torvalds
01
把開源和閉源對立,很幼稚
隨著百度在6月30日正式開源文心4.5系列的模型,一場關(guān)于大模型開源和閉源的討論再次開始。
值得一提的是,百度這次的開源是“真開源”,體現(xiàn)在開源模型數(shù)量多、技術(shù)水平高。
從數(shù)量上來說,百度正式開源的文心大模型4.5系列模型,涵蓋了47B、3B激活參數(shù)的混合專家(MoE)模型,與0.3B參數(shù)的稠密型模型等10款模型。
非常值得關(guān)注的是,這次開源實現(xiàn)了預訓練權(quán)重和推理代碼的完全開源,也就是說,開發(fā)者不但會知道百度在做什么,還知道怎么做。
這是諸多開源形式中最徹底、最充分的一種形式,足見百度對這個版本開源的決心之大、期望之高。
同樣需要提及的是,文心大模型4.5開源系列均使用飛槳深度學習框架進行高效訓練、推理和部署。在大語言模型的預訓練中,模型FLOPs利用率(MFU)達到47%。
![]()
圖:文心大模型4.5系列開源模型
有飛槳和無飛槳,效果兩個樣,這個話題我們?nèi)蘸笤僬劇?/p>
有趣的是,圍繞百度開源,業(yè)內(nèi)開始再次辯論開源和閉源的優(yōu)越性。
事實上,把開源和閉源看作是完全對立的,很幼稚。
而之所以會產(chǎn)生這種幼稚的看法,是因為一個長期以來的刻板印象——開源就是免費,閉源就是收費;開源就是做奉獻,閉源就是為了牟取暴利。
事實上,開源和閉源只是一種階段性的戰(zhàn)略選擇,這個我們稍后細講。
先說的絕對一點,這世界上從來沒有只有開源模式或只有閉源模式的頭部AI公司。
例如,Meta 開源的 Llama 2 在社區(qū)貢獻下,推理速度提升了 47%,這是一個世界級的標志性現(xiàn)象,也是很多開源支持者津津樂道的一個案例。因為,很多開源支持者認為,能夠取得這樣的成績,核心原因是開源開發(fā)者通過社區(qū)協(xié)作,集合全球開發(fā)者的智慧,從而顯著提升了模型迭代速度。
但是,Meta所謂的開源并不是無保留的。事實上,開源的Llama系列依然保留了核心算法。同時,其一方面以開源姿態(tài),通過生態(tài)合作(如Hugging Face)擴大影響力;同時,仍有部分閉源模型針對用于商業(yè)化,如Meta AI企業(yè)服務(wù)。
再看一個例子,今年2月,Grok3正式發(fā)布,這款被馬斯克宣稱為“地球上最聰明的AI”,引起了廣泛關(guān)注。
然而,馬斯克并未如外界所猜測那樣,當場宣布開源。
眾所周知,AI大模型業(yè)界,馬斯克被認為是開源的最核心支持者之一,尤其是在openAI轉(zhuǎn)向閉源之后,馬斯克甚至發(fā)起過訴訟。
但從馬斯克及其xAI的真實產(chǎn)品布局看,馬斯克并未如外界所設(shè)想的一樣,走“全開源”路線。實際上,準確的描述是,馬斯克只是宣布將在后續(xù)對上一代大模型即Grok2進行開源,最新的Grok3 則仍然走了閉源路線。
某種程度上,模型開源+保留核心算法,或模型開源但綁定收費云服務(wù),才是業(yè)內(nèi)通行的做法。
客觀來講,這種做法有助于在維護市場普及率,保持技術(shù)領(lǐng)先性和加強商業(yè)競爭力等三個需要兼顧的要素之間取得平衡——也就是通過對非最新一代(或即將迭代)的模型進行開源,以實現(xiàn)擴大用戶基礎(chǔ)、收集多樣化數(shù)據(jù),從而推動AI模型的持續(xù)迭代的目的;另一方面,對于最新的或高端的模型,通過直接或間接的方式來收費或與收費服務(wù)綁定,來平衡成本。
畢竟,大模型是一種非常昂貴的造物,其訓練過程中需要的海量算力和數(shù)據(jù)集客觀上需要大量的集中式投入,如果沒有一種相對平衡的成本回收機制,任何一家財雄勢大的AI公司都無法持續(xù)的提供開源,這是一個典型的“雞生蛋還是蛋生雞”的悖論。
所以,你說這種主流做法,到底算是開源,還是閉源?
所以我造了一個詞,叫“混合開閉源”模式,這其實才是真正的主流AI公司的常態(tài)。
如果把眼界再開闊一點,我們還可以進一步得出一個結(jié)論——成熟的軟件企業(yè),很大程度上是開源和閉源雙軌制的。
微軟可以是說歷史上最堅持閉源,甚至是對開源深惡痛絕的企業(yè),其來自Windows和Office的滾滾財富,正是基于閉源的基礎(chǔ)之上。其前首席執(zhí)行官鮑爾默甚至抱怨稱開源的Linux“就像是癌癥病毒”。
但曾經(jīng)抵觸,不表示永久抵觸。事實上,意識到軟件行業(yè)的結(jié)構(gòu)發(fā)生深層次變化后,微軟于2018年以75億美元的巨資收購GitHub,后者作為全球最大的開源代碼托管平臺,擁有超過2800萬開發(fā)者用戶和1.2億代碼倉庫,是開發(fā)者社區(qū)的核心樞紐,也可以說是微軟“死對頭”的聚集地。
微軟買下了曾經(jīng)被它稱為“癌癥病毒”的開源社區(qū),是因為后者能夠有效的服務(wù)于微軟的長期策略。
在鮑爾默執(zhí)掌微軟的后期,這家企業(yè)其實已經(jīng)意識到,售賣操作系統(tǒng)和辦公軟件已經(jīng)是上一個時代的核心商業(yè)模式,微軟正在云計算時代掉隊。
而購買GitHub后,則意味著其最突出的優(yōu)勢——代碼托管功能,可以與微軟的Azure云服務(wù)深度整合。說的更具體一點,無論開發(fā)者通過GitHub上要部署什么應(yīng)用,也無論其開源或閉源屬性,微軟的Azure都將是默認的首選。
從此,微軟成為GitHub的最大開源貢獻者之一,并通過GitHub支持了大量開源項目(如.NET框架、VS Code等),進而重塑了上個世紀以來積累深重的“創(chuàng)新破壞者”的負面企業(yè)形象,進而吸引了大量開發(fā)者群體,客觀上成為了開源時代最重要的“賣水人”之一。
這個例子有力的說明了,單純的用支持開源或不支持開源來判斷一個企業(yè)的戰(zhàn)略是不準確的,成功的企業(yè)必然會將兩者的優(yōu)勢集中起來,在不同的場景和商業(yè)模型下使用。
02
有限與無限
如果上一章我們是在一個非常宏觀的層面論述了在一個企業(yè)體系內(nèi)必然會兼容開源和閉源這兩種形態(tài),那么接下來要討論的則是,大模型企業(yè)會在什么樣的具體情況下選擇開源或閉源?
基本的答案是,企業(yè)會根據(jù)具體的賽道場景和競爭需求來加以靈活的選擇。
紐約大學宗教歷史學教授詹姆斯·卡斯在著名的哲學思維著作《有限與無限的游戲》提供了一個認知世界的新觀點,他將世界比作“游戲”,并區(qū)分為有限游戲和無限游戲。有限游戲以取勝為目的,無限游戲以延續(xù)游戲為目的。
或許我們可以打一個這樣的比喻——有限游戲就好比短跑,需要在有限的時間內(nèi)釋放出最大的爆發(fā)力;而無限游戲就好比馬拉松,比拼的是如何在一個漫長的競爭過程中熬過重重難關(guān)并最終取勝。
所以,聰明的公司在面對需要短期內(nèi)制勝(效率導向)的時候,會選擇有限游戲模式;在面對長期性的目標或長尾型的目標(終局模式)時,則采取無限游戲模式。
閉源是典型的有限模式,它通常在目標明確的時候被采用。例如,文心 4.0推出后,面臨的緊迫任務(wù)是盡快的降低推理成本,這時候集中優(yōu)質(zhì)資源打硬仗的“有限游戲”就成為了好的戰(zhàn)略選擇。事實也是如此,通過集中優(yōu)化和連續(xù)壓強式的工作,百度快速把這一版本的推理成本降到最初的1%,并明顯提升了性能。這種情況下,顯然必須依靠閉源模式來集中兵力打硬仗。
然而,這次開源文心4.5的歷史背景已經(jīng)發(fā)生了很大的變化,這一版本被寄托的任務(wù)是加強滲透率和下載量,提高整個文心模型的普及率。這是一個非常長周期、長尾型的任務(wù),在這種背景下,百度就自然會傾向于無限模式,這也是這次開源的深層次原因。
事實上,這樣根據(jù)任務(wù)的不同屬性來靈活決定某一個版本的開源屬性的方式,已經(jīng)成為AI特別是大模型領(lǐng)域的主流。
以開源著稱的通義千問系列為例,其中7B、14B、72B等中小規(guī)模模型已開源,魔搭社區(qū)里更是提供了成百上千的版本供開發(fā)者自由下載和二次開發(fā)。
但與此同時,300B等大規(guī)模模型(如通義千問Max、Qwen3-235B-A22B等)則作為企業(yè)級云服務(wù)產(chǎn)品,因為其特性是通過API或私有化部署提供給企業(yè)客戶,而且能夠用到這種強大模型的機構(gòu),對私有化部署中的安全性、定制化和高性能都非常敏感,所以一定會選擇閉源模式。
![]()
![]()
圖:文心多模態(tài)后訓練模型(支持思考、關(guān)閉思考)
在多個多模態(tài)基準測試中達到SOTA水平
與之類似的還有如谷歌開源了Gemini 2B/7B模型以對抗Meta,這是一場長期競爭,所以選擇了開源模式;但對于數(shù)據(jù)、安全訴求都處于高敏感區(qū)間的如醫(yī)療、自動駕駛等領(lǐng)域,谷歌則提供了最高層次的閉源Gemini Ultra模型。
當然,商業(yè)訴求僅僅是企業(yè)選擇開閉源的決策要素之一而非全部,更長久影響某個模型開閉源的主要因素,來自于其要完成的利益使命。
從對模型充分發(fā)展的意義上來講,開源的優(yōu)勢非常明顯,它可以集中智慧,顯著降低參與門檻,吸引大量開發(fā)者、嘗試者,從某種程度上提高某一系列模型整體上的“市場占有率”,DeepSeek R1就是最好的例子;但開源也有重要缺點,就是其貢獻沒有強制機制,導致其穩(wěn)定性欠佳。
例如,有研究者就指出,開源代碼的貢獻者并不都是想象中那么“無私”——仍以GitHub為例,其社區(qū)中幾乎每天都有開源項目因缺乏持續(xù)維護而被淘汰,而被淘汰的原因并非技術(shù)上的難以為繼,而是因為開發(fā)者憑借已經(jīng)開發(fā)的版本拿到了巨頭的收購offer,進而停止了對開源項目的維護。
這個例子非常生動的告訴我們,不用也沒有必要把開源或閉源的選擇過于理想化,甚至提升到情懷層面。在真實世界里,無論是大企業(yè)還是個人開發(fā)者,其選擇開閉源的主要理由都是由現(xiàn)實的利益和競爭的需求所決定的。
03
百度4.5開源,打開了一個新時代
百度斷然決定把4.5版本在6月30日開源,是一個重要且敏捷的決定。
幾個月前,DeepSeek的發(fā)布,的確讓國內(nèi)的AI領(lǐng)域有一種瞬間“萬馬齊喑”的感覺,特別是多年重度投入AI的大廠們更是受到了重重追問。
帶著文心4.5 Turbo和文心X1 Turbo這兩個具有很強競爭優(yōu)勢的新模型回歸,百度用這種方式表達了自己的生存哲學——不但要跟進,還要打到終局模式。
客觀來講,DeepSeek的開源(盡管其也有閉源版本),對公眾而言,是在開源和閉源的天秤上,在“開源”這一側(cè)放下了一顆重重的砝碼。
可以說,從這一刻開始,大模型競爭從單純的對比參數(shù)、打榜、發(fā)論文,變成了真刀真槍的PK自家模型的行業(yè)滲透率和普及率。
我曾經(jīng)寫過,百度AI的生存哲學,核心就是競爭與創(chuàng)新。你也可以理解為,百度視AI核心業(yè)務(wù)的發(fā)展為一個非常長期的競爭過程,而技術(shù)創(chuàng)新是其生存競爭優(yōu)勢得以存在的重要保證。
既需要拉升滲透率,又需要持續(xù)的投入一場創(chuàng)新和競爭的馬拉松,顯而易見,這是一場“無限游戲”,所以百度毅然選擇了開源模式。而且筆者甚至還猜測,在未來,對若干具有市場競爭力的大版本持續(xù)開源,或?qū)⒊蔀榘俣鹊囊环N新的模式。
之所以產(chǎn)生這樣的結(jié)果,最大的時代背景是——大模型已經(jīng)從“嘗新期”進入成熟期,已經(jīng)從“炫技”變成“應(yīng)用為王”,目前各大勢力的核心目標都已經(jīng)不再是飆指標,而是希望迅速進入千行百業(yè)的實際應(yīng)用場景中,通過占據(jù)場景來“分蛋糕”。這種情況下,開源部分具有明顯優(yōu)勢的核心版本,是最有效、最及時的辦法。
百度本身就是國內(nèi)罕有的四層架構(gòu)俱全的全棧型AI公司,加之其擁有被成為“大模型的操作系統(tǒng)”的深度學習框架飛槳,這都讓百度有了維持一場長期的,同時既比拼模型性能也比拼生態(tài)厚度的競爭的前提條件,這也是4.5版本開源的另一個宏觀戰(zhàn)略背景。
更具體的說,一方面,文心4.5的開源,以其優(yōu)異的性能,顯然能夠吸引更多開發(fā)者參與到這一版模型的優(yōu)化與創(chuàng)新中來,從而匯聚各方智慧,加速模型性能的提升。
而另一方面,大模型的應(yīng)用普及期已經(jīng)開啟,通過開源,百度可以與上下游企業(yè)、科研機構(gòu)以及廣大開發(fā)者建立更緊密的合作關(guān)系,共同探索大模型在更多領(lǐng)域的應(yīng)用,推動整個行業(yè)的發(fā)展,從而切下更大的一塊“蛋糕”。
而除了以上的宏觀意義之外,從微觀層面來看,百度此次開源,也將帶來更強的商業(yè)化效率。例如,一方面堅持開源基礎(chǔ)模型(文心4.5)吸引用戶,另一方面,通過千帆平臺企業(yè)版(MaaS服務(wù)),以及重點行業(yè)的私有化部署、定制化需求等實現(xiàn)高端盈利。
結(jié)語
百戰(zhàn)歸來,仍是少年
作為一個長期跟蹤百度AI戰(zhàn)略的行業(yè)研究者,我當然難以忘卻百度在前幾年對閉源模式的偏愛,以及其背后的原因,如認為閉源模式更有效率等等。
所以,我也一度認為,百度雖然必然會在某個時刻、某個版本上轉(zhuǎn)向開源,但“偶像包袱”和“面子問題”,都會引發(fā)爭議和困惑。
![]()
但是沒想到,說轉(zhuǎn)就轉(zhuǎn)了,可謂快速決策,靈活轉(zhuǎn)身。
我為百度的干脆感到高興,從更深層次來說,這不僅說明了百度求真務(wù)實、洞察時代潮流變化的戰(zhàn)略洞察力,也說明百度及其領(lǐng)導者身上仍然具有創(chuàng)業(yè)企業(yè)的靈活性和活力,對于一家創(chuàng)立了25年的公司來說,能保留這種初心和活力,本身就是一種競爭力。
或許,此前百度的追求中,除了發(fā)展AI技術(shù)創(chuàng)新以外,也有對自己是行業(yè)領(lǐng)頭羊的內(nèi)心驕傲。但現(xiàn)在看來,百度的追求變得更加務(wù)實和接地氣——在認定“應(yīng)用”是目前的頭等大事后,百度可以說方方面面的努力都是服務(wù)于“應(yīng)用”。但這種“服務(wù)”的本質(zhì),是苦心經(jīng)營自己的底層核心競爭力、提升自家基礎(chǔ)大模型的核心能力和成本優(yōu)勢后,對行業(yè)能夠更好、更便宜的去應(yīng)用AI資源的一種最好的支持。
而這種努力的具象,就是眼前的這次開源;我認為這次開源是百度的一道關(guān)口,過了這道關(guān),百度會放下很多歷史包袱,會以更加靈活和充滿活力的姿態(tài),參與AI賽道的長跑,去爭取無盡游戲的終局勝利。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.