![]()
機(jī)器之心報(bào)道
編輯:楊文、澤南
有關(guān)大語(yǔ)言模型的理論基礎(chǔ),可能要出現(xiàn)一些改變了。
斯坦福發(fā)了篇論文,徹底顛覆了「LLM 只是模式匹配器」的傳統(tǒng)論調(diào)。
它提出的不是擴(kuò)展技巧或新架構(gòu),而是一個(gè)讓模型真正具備推理能力的「協(xié)調(diào)層」。
![]()
- 論文題目:The Missing Layer of AGI: From Pattern Alchemy to Coordination Physics
- 論文地址:https://arxiv.org/pdf/2512.05765
核心觀點(diǎn):AGI 的瓶頸在于協(xié)調(diào),而非規(guī)模
人工智能界正因圍繞大語(yǔ)言模型本質(zhì)的爭(zhēng)論而分裂。一方面,擴(kuò)展派認(rèn)為 LLMs 足以實(shí)現(xiàn) AGI;另一方面,有影響力的批評(píng)者認(rèn)為 LLM「僅僅是模式匹配器」,在結(jié)構(gòu)上不具備推理、規(guī)劃或組合泛化能力,因此是死胡同。
作者認(rèn)為這場(chǎng)爭(zhēng)論建立在一個(gè)錯(cuò)誤的二分法之上,并提出一個(gè)顛覆性極強(qiáng)的核心觀點(diǎn):LLM 的失敗不是因?yàn)槿狈ν评砟芰Γ且驗(yàn)槲覀內(nèi)鄙賹⑵淠J脚c目標(biāo)綁定的系統(tǒng)。
為了解釋這一點(diǎn),作者用了一個(gè)捕魚隱喻。
海洋代表模型龐大的模式庫(kù),漁夫不用魚餌就撒網(wǎng),收獲的只是最常見的魚類(訓(xùn)練數(shù)據(jù)中的通用模式)。批評(píng)者譴責(zé)這些未錨定的輸出,但他們觀察到的只是未加誘餌的捕撈所產(chǎn)生的原始統(tǒng)計(jì)基線,這不是系統(tǒng)損壞,而是系統(tǒng)在默認(rèn)模式下的自然表現(xiàn)。
然而,智能行為不僅僅是撒網(wǎng),它還涉及下餌和過(guò)濾。如果誘餌過(guò)于稀疏,它就無(wú)法吸引特定、稀有的魚,海洋的先驗(yàn)仍然主導(dǎo)。如果誘餌足夠密集,它傳達(dá)了強(qiáng)烈的意圖,轉(zhuǎn)移了后驗(yàn)分布,使目標(biāo)概念壓倒常見先驗(yàn);但誘餌并非沒(méi)有成本,使用過(guò)多的誘餌來(lái)確保捕獲是低效的。
在這種觀點(diǎn)中,「缺失的層」就是協(xié)調(diào)層,它優(yōu)化了這種權(quán)衡:計(jì)算轉(zhuǎn)移后驗(yàn)所需的精確密度,同時(shí)不產(chǎn)生過(guò)高成本。
鑒于此,作者提出第三條道路:基礎(chǔ)層加協(xié)調(diào)層。LLM 是必要的系統(tǒng)- 1 基礎(chǔ)層(模式存儲(chǔ)庫(kù)),瓶頸在于缺少系統(tǒng)- 2 協(xié)調(diào)層,該層將這些模式與外部約束綁定、驗(yàn)證輸出并維護(hù)狀態(tài)。
UCCT 理論:推理的相變現(xiàn)象
作者引入了 UCCT(統(tǒng)一認(rèn)知意識(shí)理論)來(lái)形式化這一機(jī)制。UCCT 最激進(jìn)的觀點(diǎn)是:LLM 從幻覺(jué)到推理的轉(zhuǎn)變不是一個(gè)漸進(jìn)的、線性的過(guò)程,而是一個(gè)相變 。
這就像水在達(dá)到冰點(diǎn)時(shí)會(huì)瞬間凝結(jié)一樣,當(dāng)施加給模型的錨定信號(hào)達(dá)到一個(gè)臨界閾值時(shí),模型的行為會(huì)發(fā)生突變:
- 低于閾值:模型基于訓(xùn)練數(shù)據(jù)的統(tǒng)計(jì)學(xué)最大似然先驗(yàn)進(jìn)行輸出,這表現(xiàn)為無(wú)根據(jù)的生成或幻覺(jué)。
- 高于閾值:目標(biāo)導(dǎo)向的約束主導(dǎo)了輸出的后驗(yàn)分布,推理行為被激活,模型表現(xiàn)出受控且可靠的行為。
這種相變的發(fā)生由一個(gè)物理學(xué)式的錨定分?jǐn)?shù)決定,該分?jǐn)?shù)綜合考慮了以下三個(gè)關(guān)鍵變量:
- 有效支持:指外部約束(如檢索到的證據(jù)、提供的示例、工具的輸出)對(duì)目標(biāo)任務(wù)提供的強(qiáng)度和密度。其作用是拉動(dòng)模型走向目標(biāo),有效的錨點(diǎn)越多,分?jǐn)?shù)越高。
- 表征失配:指模型當(dāng)前的潛在模式(基質(zhì))與目標(biāo)任務(wù)或外部約束之間的差異程度。其作用是懲罰模型偏離約束,失配度越大,分?jǐn)?shù)越低。
- 自適應(yīng)錨定預(yù)算:代表在實(shí)際操作中,為了達(dá)到目標(biāo)而愿意付出的上下文成本和計(jì)算資源。其作用是平衡效率與可靠性,避免為了微小的收益而無(wú)限制地投入錨點(diǎn)。
也就是說(shuō),幻覺(jué)不是模型損壞,而是它在未加誘餌(unbaited)的情況下,簡(jiǎn)單地輸出了其模式存儲(chǔ)庫(kù)的最大似然先驗(yàn);推理則是外部約束將后驗(yàn)分布從通用的統(tǒng)計(jì)模式轉(zhuǎn)向目標(biāo)的結(jié)果。
因此,只要提供足夠密度的「誘餌」和「漁網(wǎng)」,即協(xié)調(diào)層的錨定機(jī)制,LLM 這個(gè)強(qiáng)大的模式基礎(chǔ)層就能被組織起來(lái),執(zhí)行可靠的推理任務(wù)。
架構(gòu)實(shí)現(xiàn):多智能體協(xié)調(diào)堆棧
為了將 UCCT 理論轉(zhuǎn)化為實(shí)際的架構(gòu),作者構(gòu)建了 MACI(多智能體協(xié)作智能),這是一個(gè)協(xié)調(diào)堆棧,為 LLMs 提供了類似于人類「執(zhí)行功能」的能力。
MACI 架構(gòu)通過(guò)其三個(gè)核心組件,精準(zhǔn)地映射并解決了 UCCT 中決定推理相變的三要素:
- 行為調(diào)制的辯論用于最大化有效支持。它讓多個(gè)智能體扮演不同角色(質(zhì)疑者、證據(jù)提供者、規(guī)劃者)進(jìn)行辯論,主動(dòng)檢索、生成和驗(yàn)證證據(jù),確保審議是多角度且有證據(jù)支持的。
- 蘇格拉底式評(píng)判 CRIT 用于最小化表征失配。UCCT 中的表征失配 是導(dǎo)致幻覺(jué)的根本原因。 MACI 引入了 CRIT 作為專門的蘇格拉底式裁判。CRIT 的核心任務(wù)是在推理的每一步中,嚴(yán)格審查智能體的提議和論點(diǎn)。它專門查找和過(guò)濾那些與事實(shí)、先前狀態(tài)或任務(wù)約束相矛盾的不恰當(dāng)論點(diǎn)。通過(guò)在早期環(huán)節(jié)就剔除與目標(biāo)嚴(yán)重偏離的聯(lián)想式輸出,MACI 積極地最小化了表征失配,從而防止低質(zhì)量或幻覺(jué)性的內(nèi)容污染推理循環(huán)。
- 事務(wù)性內(nèi)存用于優(yōu)化錨定預(yù)算。事務(wù)性內(nèi)存不只是簡(jiǎn)單的歷史記錄,它以持久化和事務(wù)性方式存儲(chǔ)經(jīng)過(guò)驗(yàn)證的關(guān)鍵中間狀態(tài),避免重復(fù)計(jì)算和上下文膨脹,實(shí)現(xiàn)錨定預(yù)算的最優(yōu)使用。
深度協(xié)調(diào)模式將推理視為受控過(guò)程。智能體進(jìn)行辯論、交叉檢查、修改方案、提取證據(jù)、修復(fù)計(jì)劃,并跨步驟持續(xù)維護(hù)狀態(tài),所有這些都由錨定信號(hào)指導(dǎo)。這本質(zhì)上是在底層模式基質(zhì)之上疊加執(zhí)行功能 —— 一旦錨定分?jǐn)?shù)跨越閾值,模型的行為就會(huì)從聯(lián)想式猛然轉(zhuǎn)向受控式。
論文的核心結(jié)論改變了我們對(duì) AGI 路徑的認(rèn)知:AGI 不會(huì)來(lái)自于更大的模式之海,它將來(lái)自于組織這些模式以形成可靠推理的網(wǎng)、誘餌、過(guò)濾器和記憶機(jī)制。如果這項(xiàng)技術(shù)能夠擴(kuò)展,LLM 就不再是「自動(dòng)補(bǔ)全」,而會(huì)成為完整推理系統(tǒng)的認(rèn)知基質(zhì)。
大語(yǔ)言模型并非通往 AGI 的死胡同,而是實(shí)現(xiàn) AGI 的必要「認(rèn)知基質(zhì)」。AGI 的瓶頸不在于 LLMs 的底層模式規(guī)模,而在于缺失了一個(gè)將這些模式組織和綁定到目標(biāo)的「協(xié)調(diào)層」。
作者 Edward Y. Chang 是誰(shuí)?
![]()
本研究唯一作者 Edward Y. Chang(張智威)是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的兼職教授。此前,他曾任加州大學(xué)圣巴巴拉分校(UCSB)終身教授。2006-2012 年,他擔(dān)任谷歌研究院總監(jiān),率先開展了以數(shù)據(jù)為中心和并行機(jī)器學(xué)習(xí)的研究,并為 ImageNet 項(xiàng)目做出了貢獻(xiàn)。他還曾在香港科技大學(xué)和加州大學(xué)伯克利分校任職。張智威擁有斯坦福大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位和電氣工程博士學(xué)位。
他的研究興趣涵蓋意識(shí)建模、生成式人工智能和醫(yī)療保健,并因此榮獲多項(xiàng)獎(jiǎng)項(xiàng),例如谷歌創(chuàng)新獎(jiǎng)、 XPRIZE 獎(jiǎng)等。他還是 ACM 和 IEEE 會(huì)士。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.