網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

為什么開放模型會拉開與封閉模型的差距 | 筆記

2026-04-17 23:16:26　來源: 未盡研究

上海舉報

分享至

Nathan Lambert是美國艾倫實驗室的研究員，他訓(xùn)練并跟蹤開放權(quán)重模型，去年的報告和榜單，宣告了中國的開放模型已經(jīng)全面超過了美國，引起了中美兩國各自的轟動。

最近，他對開放模型與封閉模型之間的競爭，產(chǎn)生了新的想法，其中一些判斷，與我們?nèi)ツ甑讓衲觊_源模型的展望不謀而合。

中國開放模型總體上保持領(lǐng)先的同時，美國的開放模型也在形成新的陣型，如Nemotron，Gemma等，可能會收復(fù)一些失地。

2026/12/21 閱讀全文 >

此外，由于封閉模型在智能體性能和經(jīng)濟性上的持續(xù)優(yōu)化能力，以及開放模型缺乏商業(yè)支持，美國封閉模型將會明顯拉開領(lǐng)先優(yōu)勢。

下面是Nathan Lambert的文章：

我們正身處這樣一個階段：我們將會知道，開放模型能否跟上封閉實驗室的步伐。顯而易見的答案是否定的。

這種回答其實是在說，它們不可能在所有領(lǐng)域都跟上。這種說法排除了一個流行的預(yù)測，即開放模型會徹底追平，所有模型都會趨于飽和，開放與封閉模型只會變得越來越相似。而在親歷這一過程時，我們顯然還很難看清，能力上的長期穩(wěn)定均衡究竟會在何時穩(wěn)定下來。

這是一個極其復(fù)雜的動態(tài)過程，我們關(guān)注的核心點，是模型之間的能力差距。與此同時，這一差距又與多種不斷演化的動態(tài)交織在一起，包括開放模型的資金供給、由誰來構(gòu)建開源模型、蒸餾這類支持快速跟進的技術(shù)如何遷移到新的應(yīng)用領(lǐng)域、可能妨礙開源 AI 生態(tài)系統(tǒng)的監(jiān)管，當(dāng)然還有，究竟是誰在實際使用開放模型。

能力差距只是紛繁復(fù)雜力量中的一個信號，這些力量正把供給與需求推向不同的形態(tài)。在許多情況下，需求端，也就是顯然有大量個人、組織和主權(quán)實體期待或需要開放模型，與供給端大體上是分離的。供給完全由經(jīng)濟因素決定。“哪些商業(yè)策略能夠支持發(fā)布開放模型”這個問題，至今仍懸而未決。

面對這種復(fù)雜性，我想把自己的核心看法提煉成一份清晰的清單。這些判斷來自我今年春季圍繞開源模型寫作或錄制的 10 多篇內(nèi)容。

1.令人驚訝的是，即使考慮到訓(xùn)練和研究上的算力差異，頂級封閉模型也沒有表現(xiàn)出相對于開源模型不斷擴大的能力優(yōu)勢，尤其是在 2025 年下半年以及直到今天。

2.開源模型實驗室在既有基準(zhǔn)測試上保持同步方面，技術(shù)實力非常強。這種情況會持續(xù)下去，反映出一種平衡：既有充足的人才，也有足夠的算力。

3.中國的開源權(quán)重實驗室，相比美國同類封閉實驗室，略微更聚焦于基準(zhǔn)分?jǐn)?shù)。蒸餾幫助中國的大語言模型公司做到這一點，但它并不是萬能藥。蒸餾動態(tài)的變化，例如監(jiān)管，不會成為決定能力平衡的關(guān)鍵因素。對基準(zhǔn)分?jǐn)?shù)關(guān)注度的提升，自然是其激勵的結(jié)果，因為維持“正在追趕前沿”的敘事，對AI的融資和采用都至關(guān)重要。

4.到目前為止，封閉模型往往比得分相近的開源模型更穩(wěn)健、也更具通用性。封閉模型擁有一些難以衡量的特質(zhì)，并沒有被當(dāng)前或過去的基準(zhǔn)測試很好地捕捉到。這將成為封閉模型主導(dǎo)某些市場的關(guān)鍵。在這些市場中，單個用戶會不斷提出新的需求，也就是把模型作為直接助手來支持知識工作者。

5.通過基準(zhǔn)測試來觀察，開源與封閉模型的競賽，在市場結(jié)構(gòu)收縮之前，很大程度上將是一場關(guān)于經(jīng)濟續(xù)航能力和快速跟進的游戲。我預(yù)計，中國的開源權(quán)重實驗室會最先面臨融資困難，最早可能就在今年晚些時候。 3 到 9 個月之后，融資困難將體現(xiàn)為能力軌跡出現(xiàn)分化。

6.以強化學(xué)習(xí)為主導(dǎo)的訓(xùn)練時代，分發(fā)到真實世界使用場景，在持續(xù)能力提升中成為一個關(guān)鍵因素。這些任務(wù)就是用戶直接使用 Claude Code 或 Codex 這類工具，通過智能體來解決工作中的問題。這是封閉實驗室首次在一個明確的技術(shù)領(lǐng)域里，有可能在能力上壓倒開放權(quán)重模型，并且可能直接利用基于用戶反饋的在線強化學(xué)習(xí)。

7.開放模型將越來越多地被用于重復(fù)性自動化任務(wù)，這會體現(xiàn)在整個生態(tài)系統(tǒng)中 API 市場份額的相對占比上，尤其是在重復(fù)性任務(wù)方面。其形式包括大量新的 AI 原生應(yīng)用、企業(yè)后臺自動化等等。這方面的成功，將推動對特定領(lǐng)域、高效率開放模型的更多投資。

這是一幅復(fù)雜的圖景，其長期軌跡更多是一個經(jīng)濟問題，而不是一個能力問題。許多其他渠道可以講述一個更簡單的敘事，比如“中國AI必然會追上我們”，并因此獲得更多傳播，因為那是一個簡單的故事。現(xiàn)實卻很復(fù)雜。只有真正的 AI 收入，才能帶來更多投資，而最終，這又會與模型能否持續(xù)快速改進的能力相掛鉤。到目前為止，經(jīng)濟現(xiàn)實尚未對開放模型擴展造成普遍影響。

這種以經(jīng)濟為中心的視角，也關(guān)系到我對更廣泛開源模型生態(tài)系統(tǒng)的立場。

8.要求禁止某些類型開放模型的呼聲還會持續(xù)出現(xiàn)，但在實踐中根本無法實施。訓(xùn)練強大的 AI 模型，也就是接近但尚未達(dá)到前沿水平的模型，其成本與大規(guī)模部署相比其實相對較小。比如說，如果美國禁止超過某個算力閾值的開放模型，另一個主權(quán)實體最終也會訓(xùn)練出這類模型并公開發(fā)布，而這些模型將以更少監(jiān)管的方式進入美國市場。

9.對開源模型影響的“二階導(dǎo)數(shù)”已經(jīng)發(fā)生了變化，而美國將從2027 年初開始，在開源模型的采用指標(biāo)上緩慢收復(fù)失地。中國速度的放緩，再到趨勢反轉(zhuǎn)，需要很長時間。例子包括 Google 的 Gemma 4，它取得了驚人的成功，以及 Nvidia 的 Nemotron 和Arcee AI。

10.隨著越來越強大的封閉模型被構(gòu)建、預(yù)覽和發(fā)布，還會出現(xiàn)更多安全沖擊，認(rèn)為最強 AI 模型的開放權(quán)重版本絕不能被允許存在，類似于人們對 Claude Mythos 的反應(yīng)。這些都可能推動針對開源模型的繁重監(jiān)管。

11.與此同時，市場對開放模型的長期興趣也會增加，因為主權(quán)實體和現(xiàn)有權(quán)力結(jié)構(gòu)會逐漸意識到，即將到來的超級強大 AI 工具，不能只落在一家公司或少數(shù)幾家公司手中。這些實體會把開放模型視為一種不同的治理范式。

12.新的開放模型融資結(jié)構(gòu)將會出現(xiàn)，因為許多利益相關(guān)方會意識到，讓獲取智能的渠道依賴于單一、以盈利為目的的公司，并不可靠。

13.本地智能體、OpenClaw 以及其他個人智能體，代表著一個迄今為止在很大程度上被忽視的開放模型使用市場。它有點像暗物質(zhì)，普遍存在，并且對開放與封閉模型力量對比具有巨大的潛在影響。

有一個詞支配著這篇文章，而且我是有意反復(fù)使用它的，那就是：復(fù)雜。

正是這種復(fù)雜的現(xiàn)實，促使我更深入地思考，如何清晰描述開放模型的差距，以及為什么我會在腦中同時保持這樣一種判斷：盡管已經(jīng)有相當(dāng)明確的證據(jù)支持近期開放權(quán)重模型的能力，我仍然預(yù)計美國的封閉實驗室會明顯拉開領(lǐng)先優(yōu)勢。

原文：

https://www.interconnects.ai/p/my-bets-on-open-models-mid-2026

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.