Nathan Lambert是美國艾倫實驗室的研究員,他訓(xùn)練并跟蹤開放權(quán)重模型,去年的報告和榜單,宣告了中國的開放模型已經(jīng)全面超過了美國,引起了中美兩國各自的轟動。
最近,他對開放模型與封閉模型之間的競爭,產(chǎn)生了新的想法,其中一些判斷,與我們?nèi)ツ甑讓衲觊_源模型的展望不謀而合。
中國開放模型總體上保持領(lǐng)先的同時,美國的開放模型也在形成新的陣型,如Nemotron,Gemma等,可能會收復(fù)一些失地。
2026/12/21 閱讀全文 >
此外,由于封閉模型在智能體性能和經(jīng)濟性上的持續(xù)優(yōu)化能力,以及開放模型缺乏商業(yè)支持,美國封閉模型將會明顯拉開領(lǐng)先優(yōu)勢。
![]()
下面是Nathan Lambert的文章:
我們正身處這樣一個階段:我們將會知道,開放模型能否跟上封閉實驗室的步伐。顯而易見的答案是否定的。
這種回答其實是在說,它們不可能在所有領(lǐng)域都跟上。這種說法排除了一個流行的預(yù)測,即開放模型會徹底追平,所有模型都會趨于飽和,開放與封閉模型只會變得越來越相似。而在親歷這一過程時,我們顯然還很難看清,能力上的長期穩(wěn)定均衡究竟會在何時穩(wěn)定下來。
這是一個極其復(fù)雜的動態(tài)過程,我們關(guān)注的核心點,是模型之間的能力差距。與此同時,這一差距又與多種不斷演化的動態(tài)交織在一起,包括開放模型的資金供給、由誰來構(gòu)建開源模型、蒸餾這類支持快速跟進的技術(shù)如何遷移到新的應(yīng)用領(lǐng)域、可能妨礙開源 AI 生態(tài)系統(tǒng)的監(jiān)管,當(dāng)然還有,究竟是誰在實際使用開放模型。
能力差距只是紛繁復(fù)雜力量中的一個信號,這些力量正把供給與需求推向不同的形態(tài)。在許多情況下,需求端,也就是顯然有大量個人、組織和主權(quán)實體期待或需要開放模型,與供給端大體上是分離的。供給完全由經(jīng)濟因素決定。“哪些商業(yè)策略能夠支持發(fā)布開放模型”這個問題,至今仍懸而未決。
面對這種復(fù)雜性,我想把自己的核心看法提煉成一份清晰的清單。這些判斷來自我今年春季圍繞開源模型寫作或錄制的 10 多篇內(nèi)容。
1.令人驚訝的是,即使考慮到訓(xùn)練和研究上的算力差異,頂級封閉模型也沒有表現(xiàn)出相對于開源模型不斷擴大的能力優(yōu)勢,尤其是在 2025 年下半年以及直到今天。
2.開源模型實驗室在既有基準(zhǔn)測試上保持同步方面,技術(shù)實力非常強。這種情況會持續(xù)下去,反映出一種平衡:既有充足的人才,也有足夠的算力。
3.中國的開源權(quán)重實驗室,相比美國同類封閉實驗室,略微更聚焦于基準(zhǔn)分?jǐn)?shù)。蒸餾幫助中國的大語言模型公司做到這一點,但它并不是萬能藥。蒸餾動態(tài)的變化,例如監(jiān)管,不會成為決定能力平衡的關(guān)鍵因素。對基準(zhǔn)分?jǐn)?shù)關(guān)注度的提升,自然是其激勵的結(jié)果,因為維持“正在追趕前沿”的敘事,對AI的融資和采用都至關(guān)重要。
4.到目前為止,封閉模型往往比得分相近的開源模型更穩(wěn)健、也更具通用性。封閉模型擁有一些難以衡量的特質(zhì),并沒有被當(dāng)前或過去的基準(zhǔn)測試很好地捕捉到。這將成為封閉模型主導(dǎo)某些市場的關(guān)鍵。在這些市場中,單個用戶會不斷提出新的需求,也就是把模型作為直接助手來支持知識工作者。
5.通過基準(zhǔn)測試來觀察,開源與封閉模型的競賽,在市場結(jié)構(gòu)收縮之前,很大程度上將是一場關(guān)于經(jīng)濟續(xù)航能力和快速跟進的游戲。我預(yù)計,中國的開源權(quán)重實驗室會最先面臨融資困難,最早可能就在今年晚些時候。 3 到 9 個月之后,融資困難將體現(xiàn)為能力軌跡出現(xiàn)分化。
6.以強化學(xué)習(xí)為主導(dǎo)的訓(xùn)練時代,分發(fā)到真實世界使用場景,在持續(xù)能力提升中成為一個關(guān)鍵因素。這些任務(wù)就是用戶直接使用 Claude Code 或 Codex 這類工具,通過智能體來解決工作中的問題。這是封閉實驗室首次在一個明確的技術(shù)領(lǐng)域里,有可能在能力上壓倒開放權(quán)重模型,并且可能直接利用基于用戶反饋的在線強化學(xué)習(xí)。
7.開放模型將越來越多地被用于重復(fù)性自動化任務(wù),這會體現(xiàn)在整個生態(tài)系統(tǒng)中 API 市場份額的相對占比上,尤其是在重復(fù)性任務(wù)方面。其形式包括大量新的 AI 原生應(yīng)用、企業(yè)后臺自動化等等。這方面的成功,將推動對特定領(lǐng)域、高效率開放模型的更多投資。
這是一幅復(fù)雜的圖景,其長期軌跡更多是一個經(jīng)濟問題,而不是一個能力問題。許多其他渠道可以講述一個更簡單的敘事,比如“中國AI必然會追上我們”,并因此獲得更多傳播,因為那是一個簡單的故事。現(xiàn)實卻很復(fù)雜。只有真正的 AI 收入,才能帶來更多投資,而最終,這又會與模型能否持續(xù)快速改進的能力相掛鉤。到目前為止,經(jīng)濟現(xiàn)實尚未對開放模型擴展造成普遍影響。
這種以經(jīng)濟為中心的視角,也關(guān)系到我對更廣泛開源模型生態(tài)系統(tǒng)的立場。
8.要求禁止某些類型開放模型的呼聲還會持續(xù)出現(xiàn),但在實踐中根本無法實施。訓(xùn)練強大的 AI 模型,也就是接近但尚未達(dá)到前沿水平的模型,其成本與大規(guī)模部署相比其實相對較小。比如說,如果美國禁止超過某個算力閾值的開放模型,另一個主權(quán)實體最終也會訓(xùn)練出這類模型并公開發(fā)布,而這些模型將以更少監(jiān)管的方式進入美國市場。
9.對開源模型影響的“二階導(dǎo)數(shù)”已經(jīng)發(fā)生了變化,而美國將從2027 年初開始,在開源模型的采用指標(biāo)上緩慢收復(fù)失地。中國速度的放緩,再到趨勢反轉(zhuǎn),需要很長時間。例子包括 Google 的 Gemma 4,它取得了驚人的成功,以及 Nvidia 的 Nemotron 和Arcee AI。
10.隨著越來越強大的封閉模型被構(gòu)建、預(yù)覽和發(fā)布,還會出現(xiàn)更多安全沖擊,認(rèn)為最強 AI 模型的開放權(quán)重版本絕不能被允許存在,類似于人們對 Claude Mythos 的反應(yīng)。這些都可能推動針對開源模型的繁重監(jiān)管。
11.與此同時,市場對開放模型的長期興趣也會增加,因為主權(quán)實體和現(xiàn)有權(quán)力結(jié)構(gòu)會逐漸意識到,即將到來的超級強大 AI 工具,不能只落在一家公司或少數(shù)幾家公司手中。這些實體會把開放模型視為一種不同的治理范式。
12.新的開放模型融資結(jié)構(gòu)將會出現(xiàn),因為許多利益相關(guān)方會意識到,讓獲取智能的渠道依賴于單一、以盈利為目的的公司,并不可靠。
13.本地智能體、OpenClaw 以及其他個人智能體,代表著一個迄今為止在很大程度上被忽視的開放模型使用市場。它有點像暗物質(zhì),普遍存在,并且對開放與封閉模型力量對比具有巨大的潛在影響。
有一個詞支配著這篇文章,而且我是有意反復(fù)使用它的,那就是:復(fù)雜。
正是這種復(fù)雜的現(xiàn)實,促使我更深入地思考,如何清晰描述開放模型的差距,以及為什么我會在腦中同時保持這樣一種判斷:盡管已經(jīng)有相當(dāng)明確的證據(jù)支持近期開放權(quán)重模型的能力,我仍然預(yù)計美國的封閉實驗室會明顯拉開領(lǐng)先優(yōu)勢。
原文:
https://www.interconnects.ai/p/my-bets-on-open-models-mid-2026
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.