<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      3萬(wàn)+Ilya Sutskever 2025年度全景實(shí)錄深讀|“Scaling時(shí)代”的終結(jié)以及未來(lái)AGI形態(tài)

      0
      分享至


      2025年終特別策劃:「消失在2025的AGI」系列專題

      2025年,人工智能行業(yè)走到了一個(gè)微妙的歷史節(jié)點(diǎn)。在硅谷,AI氛圍狂熱如科幻小說(shuō)般成真;但在宏觀層面,技術(shù)的“慢起飛”卻異常平淡。這種感知的溫差,恰如這一年行業(yè)主題的隱喻——我們正站在范式轉(zhuǎn)移的臨界點(diǎn)。這一年,一些定義中的AGI正在逐漸從公眾視野中“消失”。

      本系列將深入挖掘這些“消失”背后的思考,記錄在范式轉(zhuǎn)移關(guān)鍵時(shí)期的各種洞見,為這個(gè)非凡的時(shí)代留下注腳。因?yàn)樵贏GI的漫長(zhǎng)征程中,2025年或?qū)⒈汇懹洖橐粋€(gè)轉(zhuǎn)折點(diǎn)——當(dāng)我們從狂熱走向理性,從規(guī)模走向本質(zhì),從喧囂走向沉思。

      2025年,Safe Superintelligence (SSI)創(chuàng)始人、前 OpenAI 首席科學(xué)家Ilya Sutskever指出,業(yè)界對(duì)當(dāng)前AI模型基準(zhǔn)測(cè)試高分與實(shí)際應(yīng)用低效并存的現(xiàn)狀存在認(rèn)知偏差,這種“高分低能”的悖論揭示了現(xiàn)有強(qiáng)化學(xué)習(xí)范式的局限性。本文基于數(shù)字開物整理編譯的Ilya Sutskever2025全年演講與公開訪談實(shí)錄,還原了其關(guān)于計(jì)算范式轉(zhuǎn)移、生物智能與機(jī)器智能的非對(duì)稱優(yōu)勢(shì)分析及超級(jí)智能演進(jìn)路徑的洞見。

      Sutskever判定,AI行業(yè)正處于從單純依賴算力堆疊的“Scaling時(shí)代”向以算法創(chuàng)新為核心的“研究時(shí)代”的歷史性轉(zhuǎn)折點(diǎn)。他警告,將針對(duì)基準(zhǔn)測(cè)試優(yōu)化的模型視為通用智能是一種物理誤判,現(xiàn)有強(qiáng)化學(xué)習(xí)范式的本質(zhì)是“刷題”,缺乏對(duì)因果邏輯的內(nèi)在一致性。Sutskever通過對(duì)SSI“非對(duì)稱算力策略”的解析,指出在巨頭壟斷推理算力的當(dāng)下,通過去產(chǎn)品化、聚焦核心假設(shè)驗(yàn)證,是突破“想法通縮”困境的唯一路徑。他將未來(lái)的超級(jí)智能定義為具備極致元學(xué)習(xí)能力的“超級(jí)實(shí)習(xí)生”,并預(yù)言在大陸級(jí)計(jì)算集群誕生前,構(gòu)建“關(guān)愛感知生命”的對(duì)齊策略是博弈論導(dǎo)向的必然選擇。

      在技術(shù)層面,Sutskever指出,人類僅需微量數(shù)據(jù)即可掌握復(fù)雜技能的秘密,在于進(jìn)化硬編碼的“價(jià)值函數(shù)”——情緒。相比于人工設(shè)計(jì)的脆弱獎(jiǎng)勵(lì)模型,生物情緒作為一種極其魯棒的損失函數(shù),實(shí)現(xiàn)了對(duì)高維決策空間的快速剪枝。Sutskever深刻剖析了預(yù)訓(xùn)練數(shù)據(jù)的熱力學(xué)極限,認(rèn)為隨著靜態(tài)文本資源的枯竭,算力重心正從預(yù)訓(xùn)練向推理側(cè)的“測(cè)試時(shí)計(jì)算”發(fā)生轉(zhuǎn)移。未來(lái)的架構(gòu)演進(jìn)必須引入“證明者-驗(yàn)證者”對(duì)抗機(jī)制,通過內(nèi)省式自博弈突破數(shù)據(jù)瓶頸,而非繼續(xù)依賴低效的參數(shù)堆疊。

      為應(yīng)對(duì)終局風(fēng)險(xiǎn),Sutskever推演了AI介入后的宏觀經(jīng)濟(jì)走向,指出物理世界的粘性將導(dǎo)致經(jīng)濟(jì)增長(zhǎng)的極端不均勻分布。他預(yù)測(cè),若缺乏有效的腦機(jī)接口實(shí)現(xiàn)生物與數(shù)字的深度融合,人類在“代理人社會(huì)”中面臨退化危機(jī)。因此,他主張?jiān)诔?jí)智能真正降臨前,通過有控制的“增量展示”喚醒社會(huì)的認(rèn)知免疫系統(tǒng),并推動(dòng)全球在安全協(xié)議上的策略趨同,最終在人機(jī)共生的新契約中尋找文明存續(xù)的穩(wěn)態(tài)解。


      01

      智能的物理屬性、評(píng)測(cè)悖論與泛化邊界

      1.1 宏觀經(jīng)濟(jì)溫差與技術(shù)落地的物理時(shí)滯

      Sutskever 敏銳地捕捉到了當(dāng)前人工智能領(lǐng)域存在的一個(gè)反直覺的宏觀現(xiàn)象:技術(shù)中心(舊金山灣區(qū))的“奇點(diǎn)臨近感”與全球宏觀經(jīng)濟(jì)數(shù)據(jù)的“平穩(wěn)線性”之間,存在著無(wú)法解釋的物理溫差。這一現(xiàn)象并非單純的市場(chǎng)反應(yīng)滯后,而是揭示了當(dāng)前模型在“基準(zhǔn)測(cè)試智能”與“經(jīng)濟(jì)實(shí)用智能”之間的本質(zhì)斷裂。

      在舊金山灣區(qū)的核心技術(shù)圈層中,氛圍已接近科幻小說(shuō)的高潮章節(jié)。隨著計(jì)算集群規(guī)模的指數(shù)級(jí)擴(kuò)張和模型參數(shù)的爆炸式增長(zhǎng),從業(yè)者普遍感受到一種“智力過剩”的狂熱,仿佛通用人工智能(AGI)的臨界點(diǎn)觸手可及。然而,Sutskever 指出,當(dāng)我們把視角拉升至全球宏觀經(jīng)濟(jì)層面時(shí),這種震蕩卻驚人地消失了。盡管投入了 GDP 1% 級(jí)別的巨額資本進(jìn)行算力基建,但生產(chǎn)率數(shù)據(jù)、GDP 增速以及實(shí)體產(chǎn)業(yè)的運(yùn)作邏輯并未出現(xiàn)與其匹配的指數(shù)級(jí)突變。

      這種“體感”與“數(shù)據(jù)”的劇烈背離,不能簡(jiǎn)單歸結(jié)為“慢起飛”的早期特征。Sutskever 判定,這深層映射了當(dāng)前 AI 模型的根本局限:它們雖然在比特世界的模擬考試中表現(xiàn)出超人類的智力,但在原子世界(Atom World)的經(jīng)濟(jì)活動(dòng)中卻缺乏完成閉環(huán)任務(wù)的魯棒性。這種脫節(jié)預(yù)示著,目前的模型可能僅僅是在某些特定的、被過度測(cè)量的維度上極其“聰明”,而在支撐經(jīng)濟(jì)運(yùn)行的那些不可測(cè)量的、充滿噪聲的復(fù)雜維度上,依然處于嬰兒期。因此,在模型能夠真正以“可信賴的代理(Reliable Agent)”身份介入經(jīng)濟(jì)循環(huán)之前,灣區(qū)的狂熱將始終被限制在一個(gè)無(wú)法穿透現(xiàn)實(shí)經(jīng)濟(jì)壁壘的“高壓氣泡”中。

      1.2 評(píng)測(cè)集過擬合的微觀機(jī)理:以“Vibe Coding”為例的遞歸錯(cuò)誤分析

      為了確證上述宏觀悖論的微觀根源,Sutskever 引入了具體的工程案例。在“Vibe Coding”等實(shí)際應(yīng)用場(chǎng)景中,模型表現(xiàn)出一種特征性的“振蕩失效(Oscillatory Failure)”,這在物理上證明了模型并未建立起對(duì)因果邏輯的內(nèi)在一致性,而是停留在概率匹配的表層。

      Sutskever 詳細(xì)解構(gòu)了開發(fā)者在日常使用輔助編程工具時(shí)頻繁遭遇的“西西弗斯式”困境。當(dāng)開發(fā)者在一個(gè)復(fù)雜的代碼庫(kù)中遇到 Bug A 并請(qǐng)求模型修復(fù)時(shí),模型通常會(huì)表現(xiàn)出極度的自信與順從,迅速生成看似完美的補(bǔ)丁。然而,一旦該補(bǔ)丁被部署,往往會(huì)立即觸發(fā)一個(gè)新的 Bug B。當(dāng)開發(fā)者將 Bug B 反饋給模型時(shí),模型會(huì)再次展現(xiàn)出“恍然大悟”的態(tài)度,誠(chéng)懇道歉并提供新的修復(fù)方案。

      災(zāi)難性的時(shí)刻在于,這個(gè)針對(duì) Bug B 的修復(fù)方案,在邏輯上往往是直接回退(Revert)到了導(dǎo)致 Bug A 的原始狀態(tài)。于是,開發(fā)者與模型陷入了一個(gè)在 Bug A 與 Bug B 兩個(gè)錯(cuò)誤狀態(tài)之間無(wú)限循環(huán)的死結(jié)。Sutskever 深刻地指出,這種行為在圖靈測(cè)試意義上是荒謬的——一個(gè)在 LeetCode 競(jìng)賽中能擊敗 99% 人類選手的智能體,卻無(wú)法維持一個(gè)只有兩個(gè)變量的簡(jiǎn)單邏輯閉環(huán)。

      這一現(xiàn)象的物理本質(zhì)是:模型根本沒有“理解”代碼的功能邏輯(Functional Logic),它只是在進(jìn)行高維度的文本補(bǔ)全。在它的概率分布中,修復(fù) Bug A 的文本模式與引入 Bug B 的文本模式在統(tǒng)計(jì)上高度共現(xiàn)。由于缺乏一個(gè)獨(dú)立于語(yǔ)言之外的“世界模型”來(lái)進(jìn)行邏輯校驗(yàn)(Grounding),模型無(wú)法感知這種循環(huán)的荒謬性。這種“無(wú)意識(shí)的順從”和“自信的幻覺”,正是當(dāng)前技術(shù)范式在實(shí)際經(jīng)濟(jì)生產(chǎn)中難以落地的核心阻礙——一個(gè)只會(huì)做題但不斷在實(shí)操中“埋雷”的員工,是無(wú)法被企業(yè)信任并賦予獨(dú)立決策權(quán)的。

      1.3 強(qiáng)化學(xué)習(xí)的“應(yīng)試教育”陷阱:從泛化到狹隘化的相變

      Sutskever 進(jìn)一步在算法原理層面挖掘了導(dǎo)致上述現(xiàn)象的根源。他提出,當(dāng)前的強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練范式,實(shí)際上是一種以犧牲通用泛化能力為代價(jià),換取特定指標(biāo)極值化的“應(yīng)試策略”。這種訓(xùn)練導(dǎo)致模型在相空間中發(fā)生了從“寬譜智能”到“窄譜工具”的退化相變。

      在預(yù)訓(xùn)練階段,模型接觸的是“所有數(shù)據(jù)”。這不僅是一個(gè)數(shù)據(jù)量級(jí)的概念,更是一個(gè)信息熵的概念。互聯(lián)網(wǎng)上的所有文本包含了人類文明的全部思想、邏輯、情感、謬誤與模糊性。在這個(gè)階段,模型被迫構(gòu)建一個(gè)能夠容納這個(gè)龐雜世界的全息投影,因此它習(xí)得了一種模糊但廣博的“通識(shí)”。此時(shí)的數(shù)據(jù)選擇自由度極低(因?yàn)槭怯谩八小睌?shù)據(jù)),反而保證了分布的自然性與完整性。

      然而,進(jìn)入強(qiáng)化學(xué)習(xí)(RLHF/RL)階段后,情況發(fā)生了根本性逆轉(zhuǎn)。Sutskever 揭露了行業(yè)內(nèi)部一個(gè)公開的秘密:所有前沿 AI 公司都建立了專門的團(tuán)隊(duì),致力于制造特定的“RL 環(huán)境”注入訓(xùn)練流程。這里的核心風(fēng)險(xiǎn)在于“環(huán)境”的人為選擇性。為了確保模型在發(fā)布時(shí)能在公認(rèn)的基準(zhǔn)測(cè)試中取得SOTA成績(jī),研究人員會(huì)不自覺地從評(píng)測(cè)集中“汲取靈感”來(lái)設(shè)計(jì) RL 環(huán)境。

      這種做法在數(shù)學(xué)上等同于“針對(duì)測(cè)試集訓(xùn)練”的變體。模型在這些精心設(shè)計(jì)的環(huán)境中反復(fù)試錯(cuò),學(xué)會(huì)了極其復(fù)雜的策略來(lái)最大化獎(jiǎng)勵(lì)函數(shù)。這就好比一個(gè)學(xué)生不再通過理解物理原理來(lái)解題,而是通過背誦出題人的心理偏好和特定題型的“秒殺技巧”來(lái)拿高分。

      結(jié)果是,經(jīng)過 RL 訓(xùn)練的模型變得“一根筋”。由于它在特定的高維流形(Manifold)上被過度優(yōu)化,一旦輸入偏離了這個(gè)流形(即面對(duì)真實(shí)的、充滿噪聲的、未見過的現(xiàn)實(shí)問題),其性能就會(huì)出現(xiàn)斷崖式下跌。Sutskever 判定,這種“缺乏自我意識(shí)的狹隘”,正是當(dāng)前 AI 顯得既極其聰明又極其愚蠢的根本原因。它在被設(shè)計(jì)好的賽道上是超人,但在開放世界的荒原中是盲人。

      1.4 智能樣本效率的二元算力模型:10,000小時(shí)窮舉 vs 100小時(shí)直覺

      為了定量描述“智能”的本質(zhì)差異,Sutskever 建立了一個(gè)基于時(shí)間/算力消耗的二元對(duì)比模型。通過對(duì)比“暴力窮舉型”與“算法直覺型”兩類學(xué)習(xí)者,他論證了當(dāng)前 AI 范式在通往 AGI 路徑上的算力邊際效益遞減問題。

      Sutskever 構(gòu)建了兩個(gè)具體的智能體模型進(jìn)行思想實(shí)驗(yàn):

      • 智能體 A(當(dāng)前 AI 的極限形態(tài)):這是一個(gè)通過海量數(shù)據(jù)堆疊出來(lái)的“競(jìng)技編程機(jī)器”。它投入了 10,000 小時(shí)進(jìn)行高強(qiáng)度訓(xùn)練,遍歷了人類歷史上所有的編程題目變種,背誦了每一個(gè)算法的證明細(xì)節(jié),并對(duì)所有已知的邊界條件進(jìn)行了肌肉記憶般的過擬合。在已知分布的測(cè)試中,它的表現(xiàn)無(wú)可挑剔,速度與準(zhǔn)確率均超越人類極限。然而,這種能力本質(zhì)上是“檢索與插值(Retrieval and Interpolation)”的高級(jí)形式。

      • 智能體 B(通用智能的理想形態(tài)):這是一個(gè)具備“天賦”的人類初學(xué)者。他僅投入了 100 小時(shí),并未見過大多數(shù)題目。但他掌握了某種底層的元規(guī)則和一種被稱為“品味”的判斷力。在面對(duì)一個(gè)從未見過的全新難題時(shí),智能體 B 能夠依靠直覺迅速剪枝龐大的搜索空間,直接鎖定核心邏輯路徑。

      Sutskever 指出,當(dāng)前行業(yè)的 Scaling 路徑,本質(zhì)上是在不遺余力地打造更強(qiáng)大的“智能體 A”。通過數(shù)據(jù)增強(qiáng)制造更多的合成題目,通過更大的集群進(jìn)行更長(zhǎng)時(shí)間的訓(xùn)練。雖然這能不斷推高榜單分?jǐn)?shù),但它并沒有觸及智能的核心——泛化

      真正的泛化能力(智能體 B)并不來(lái)自于見過所有情況,而來(lái)自于一種“從極少樣本中提取高階因果結(jié)構(gòu)”的壓縮能力。Sutskever 強(qiáng)調(diào),如果在競(jìng)技編程中達(dá)到超人類水平并不能自動(dòng)賦予模型在構(gòu)建大型軟件架構(gòu)時(shí)的“品味”和“判斷力”,那么我們就可以判定,單純的 Skill Scaling(技能擴(kuò)展)并不能涌現(xiàn)出 General Intelligence(通用智能)。這表明,僅僅增加“練習(xí)時(shí)長(zhǎng)”(即訓(xùn)練算力)而不改變“學(xué)習(xí)方法”(即算法范式),只能產(chǎn)生更加熟練的匠人,而無(wú)法產(chǎn)生具有創(chuàng)造力的工程師。

      1.5 預(yù)訓(xùn)練數(shù)據(jù)的有限性與“研究時(shí)代”的必然回歸

      基于上述分析,Sutskever 進(jìn)一步推演了當(dāng)前“Scaling 時(shí)代”的終結(jié)邏輯。他認(rèn)為,隨著預(yù)訓(xùn)練數(shù)據(jù)這一“自然資源”的枯竭,以及單純擴(kuò)大規(guī)模帶來(lái)的收益遞減,行業(yè)將不可避免地從“工程擴(kuò)展”回歸到“科學(xué)探索”。

      在 2020 年至 2025 年的“Scaling 時(shí)代”,行業(yè)的指導(dǎo)思想極其簡(jiǎn)單且統(tǒng)一:Scaling Law。正如 GPT-3 所證明的,只要按比例增加算力、數(shù)據(jù)和參數(shù)量,模型性能就會(huì)像物理定律一樣可預(yù)測(cè)地提升。這導(dǎo)致了一種“思想通縮(Idea Deflation)”的局面——既然有一個(gè)確定性的配方可以遵循,就沒有人愿意冒險(xiǎn)去探索新的算法路徑。所有的資源都被集中到了同一個(gè)低風(fēng)險(xiǎn)、高回報(bào)的策略上。

      然而,Sutskever 敏銳地指出,這種“美好時(shí)光”已接近尾聲。預(yù)訓(xùn)練的核心燃料——人類產(chǎn)生的高質(zhì)量文本數(shù)據(jù)——是有限的。雖然有傳言稱 Gemini 等模型找到了一些壓榨數(shù)據(jù)剩余價(jià)值的方法,但物理極限不可逾越。當(dāng)“所有數(shù)據(jù)”都被喂入模型后,繼續(xù)擴(kuò)大模型規(guī)模(例如 100 倍參數(shù))是否還能帶來(lái)質(zhì)的飛躍?Sutskever 對(duì)此持懷疑態(tài)度。

      他斷言,我們正在經(jīng)歷一個(gè)歷史性的“均值回歸”,即回到 2012-2020 年間的“研究時(shí)代”。那個(gè)時(shí)代的特征是:沒有現(xiàn)成的配方,需要研究人員通過大量的試錯(cuò)、小規(guī)模修補(bǔ)和直覺來(lái)尋找新的突破點(diǎn)。不同的是,這一次的“研究”將在前所未有的巨型計(jì)算集群上進(jìn)行。這不再是關(guān)于“誰(shuí)能買得起更多的 GPU”,而是關(guān)于“誰(shuí)能想出更聰明的辦法來(lái)利用這些 GPU 驗(yàn)證新的假設(shè)”。從這個(gè)意義上說(shuō),AI 發(fā)展的驅(qū)動(dòng)力正從資本密集的資源堆疊,重新轉(zhuǎn)移回智力密集的算法創(chuàng)新。這一判斷為后續(xù)章節(jié)關(guān)于“新架構(gòu)演進(jìn)”和“非對(duì)稱優(yōu)勢(shì)”的討論奠定了物理學(xué)基礎(chǔ)。

      02

      算力范式的演進(jìn)周期與可計(jì)算性邊界

      2.1 算力史前紀(jì)元:從“煉金術(shù)”到“大工業(yè)”的范式斷代

      Sutskever 通過對(duì)深度學(xué)習(xí)發(fā)展史的精密考古,將過去十二年劃分為兩個(gè)在物理性質(zhì)上截然不同的地質(zhì)年代。這種劃分不僅是時(shí)間的切片,更是研究方法論從“隨機(jī)游走”向“確定性縮放”躍遷的確證。

      Ilya Sutskever 對(duì) 2012 年至今的 AI 演進(jìn)路徑進(jìn)行了斷代分析。他定義了第一個(gè)階段:“研究時(shí)代 1.0(The Era of Research, 2012-2020)”。這一時(shí)期的核心特征是“非確定性”“算力匱乏”。以 2012 年的 AlexNet 為原點(diǎn),當(dāng)時(shí)整個(gè)深度學(xué)習(xí)革命的算力基座僅僅是兩張消費(fèi)級(jí) GPU。即便到了 2017 年 Transformer 架構(gòu)誕生的前夜,哪怕是最前沿的論文實(shí)驗(yàn),其算力消耗上限也未突破 64 張 GPU 的集群規(guī)模。

      在那個(gè)時(shí)代,算力是稀缺資源,而想法是廉價(jià)的。研究人員的日常工作類似于前科學(xué)時(shí)代的煉金術(shù)士:憑借直覺調(diào)整超參數(shù)、嘗試各種奇特的激活函數(shù)、設(shè)計(jì)復(fù)雜的拓?fù)浣Y(jié)構(gòu)。整個(gè)領(lǐng)域的進(jìn)步依賴于高頻的試錯(cuò)和偶然的靈光一現(xiàn)。在這個(gè)階段,沒有通用的物理公式能預(yù)言投入多少算力能換回多少智能,每一個(gè)新架構(gòu)的提出都是一次充滿風(fēng)險(xiǎn)的賭博。

      然而,2020 年標(biāo)志著物理法則的突變。隨著 GPT-3 的問世,行業(yè)進(jìn)入了“Scaling 時(shí)代(The Era of Scaling, 2020-2025)”。Sutskever 將這一時(shí)期定義為“Scaling Laws”統(tǒng)治一切的階段。這一定律的發(fā)現(xiàn)堪比物理學(xué)中的熱力學(xué)定律——它揭示了智能涌現(xiàn)與算力、數(shù)據(jù)、參數(shù)量之間的對(duì)數(shù)線性關(guān)系。

      這種關(guān)系的發(fā)現(xiàn)瞬間消滅了不確定性。AI 研發(fā)從“探索未知的煉金術(shù)”轉(zhuǎn)變?yōu)椤鞍磁浞缴a(chǎn)的大工業(yè)”。所有的科技巨頭迅速達(dá)成共識(shí):只要按照特定的配方——即特定的數(shù)據(jù)配比、特定的模型深度與寬度、特定的算力投入——就必然能得到預(yù)期的性能提升。這一時(shí)期的特征是“思想的同質(zhì)化”“資本的暴力美學(xué)”:既然單純擴(kuò)大規(guī)模(Scaling)就能獲得穩(wěn)定的邊際收益,那么任何對(duì)架構(gòu)微創(chuàng)新的探索在經(jīng)濟(jì)賬上都是不劃算的。這種確定性導(dǎo)致了全行業(yè)的“路徑鎖定”,所有資源被單一化地注入到 Transformer 的堆疊中,直至今日。

      2.2 預(yù)訓(xùn)練的算力飽和與“邊際效應(yīng)遞減”的物理墻

      針對(duì)當(dāng)前行業(yè)的算力焦慮,Sutskever 提出了一個(gè)反直覺的判斷:雖然我們擁有了前所未有的算力規(guī)模,但“單純 Scaling”的物理紅利已接近枯竭。這并非算力的終結(jié),而是“使用算力的方式”必須發(fā)生相變。

      在 Scaling 時(shí)代的中后期,行業(yè)陷入了一種線性的慣性思維:既然 10,000 張卡比 1,000 張卡好,那么 100,000 張卡一定能帶來(lái)質(zhì)的飛躍。然而,Sutskever 對(duì)此持極其審慎的態(tài)度。他指出,預(yù)訓(xùn)練模式正面臨兩個(gè)無(wú)法回避的物理墻:

      1.數(shù)據(jù)枯竭:預(yù)訓(xùn)練的本質(zhì)是對(duì)人類存量文本知識(shí)的壓縮。盡管有傳言稱 Google 的 Gemini 等項(xiàng)目通過“多模態(tài)轉(zhuǎn)錄”或“合成數(shù)據(jù)”延緩了枯竭期,但高質(zhì)量的人類原生數(shù)據(jù)在物理總量上是有限的。當(dāng)模型“讀”完了所有書、所有代碼、所有論文后,繼續(xù)增加參數(shù)量將不再帶來(lái)智力的提升,只會(huì)帶來(lái)嚴(yán)重的過擬合。

      2.泛化瓶頸:僅僅通過“預(yù)測(cè)下一個(gè) Token”這一目標(biāo)函數(shù),即便將模型規(guī)模再擴(kuò)大 100 倍,也無(wú)法解決邏輯一致性和物理常識(shí)的問題。Sutskever 認(rèn)為,模型在某些維度上的能力提升正在趨于平緩,這意味著單純的 Scale-up 策略的投資回報(bào)率正在急劇下降。

      基于此,Sutskever 判定我們正在經(jīng)歷歷史的螺旋上升,回歸到“研究時(shí)代 2.0”。這一次的回歸不是簡(jiǎn)單的重復(fù),而是建立在巨型算力基礎(chǔ)之上的方法論重構(gòu)。現(xiàn)在的瓶頸不再是算力不足,而是“想法匱乏”。在擁有了數(shù)萬(wàn)張 GPU 的今天,我們反而不知道該算什么了。行業(yè)被迫從“只有一種正確做法”的舒適區(qū),重新回到“嘗試 100 種不同路徑”的探索區(qū)。這標(biāo)志著 AI 研發(fā)重心從工程實(shí)施重新轉(zhuǎn)移回基礎(chǔ)科學(xué)研究。

      2.3 強(qiáng)化學(xué)習(xí)的算力轉(zhuǎn)移:從“訓(xùn)練時(shí)”到“推理時(shí)”的能耗重構(gòu)

      Sutskever 披露了一個(gè)關(guān)鍵的行業(yè)內(nèi)幕:算力消耗的重心正在發(fā)生隱秘而巨大的轉(zhuǎn)移。這標(biāo)志著 AI 系統(tǒng)的能量代謝方式從“一次性灌輸”轉(zhuǎn)向“持續(xù)性思考”。

      在傳統(tǒng)的預(yù)訓(xùn)練范式中,算力主要消耗在模型的“養(yǎng)成階段”。一旦模型訓(xùn)練完成,其推理過程是相對(duì)廉價(jià)且快速的。然而,Sutskever 指出,最新的趨勢(shì)表明,投入在強(qiáng)化學(xué)習(xí)(RL)上的算力正在超越預(yù)訓(xùn)練算力

      這種反轉(zhuǎn)背后的技術(shù)邏輯是深刻的。現(xiàn)代強(qiáng)化學(xué)習(xí)(尤其是結(jié)合了思維鏈 CoT 的 RL)本質(zhì)上是在進(jìn)行“測(cè)試時(shí)計(jì)算”的擴(kuò)展。與預(yù)訓(xùn)練那種“看一遍就記住”的被動(dòng)吸收不同,強(qiáng)化學(xué)習(xí)需要模型在虛擬環(huán)境中進(jìn)行極其漫長(zhǎng)的“推演”

      想象一個(gè)智能體在嘗試解決一個(gè)復(fù)雜的數(shù)學(xué)猜想。它需要生成成千上萬(wàn)條推理路徑,每一條路徑都可能包含數(shù)千個(gè)步驟。絕大多數(shù)路徑最終都會(huì)被證明是錯(cuò)誤的,但生成這些錯(cuò)誤路徑本身就需要消耗驚人的算力。這實(shí)際上是在用算力換取邏輯的深度。Sutskever 強(qiáng)調(diào),這種過程極度消耗資源,因?yàn)槟壳暗?RL 算法效率極低。

      由于缺乏高效的“價(jià)值函數(shù)”來(lái)提前剪枝(Pruning),模型被迫像一個(gè)無(wú)頭蒼蠅一樣在巨大的搜索空間中隨機(jī)亂撞,直到偶然撞上一條正確的路徑。這解釋了為什么現(xiàn)在的 RL Scaling 極其昂貴:我們?cè)谟脭?shù)百萬(wàn)個(gè) GPU 小時(shí)來(lái)模擬人類大腦在幾秒鐘內(nèi)完成的直覺判斷。因此,未來(lái)的算力競(jìng)爭(zhēng)焦點(diǎn),將從“誰(shuí)能更快地訓(xùn)練完模型”,轉(zhuǎn)向“誰(shuí)能更高效地利用算力進(jìn)行深度思考與自我博弈”。

      2.4 SSI 的非對(duì)稱算力策略:去推理化與純粹驗(yàn)證

      針對(duì) Safe Superintelligence (SSI) 的資源策略,Sutskever 清晰地闡述了其相對(duì)于科技巨頭的“非對(duì)稱優(yōu)勢(shì)”。這是一種基于“有效算力”概念的戰(zhàn)略計(jì)算。

      外界普遍質(zhì)疑,SSI 僅籌集了 30 億美元,相比于 Google、Microsoft 動(dòng)輒數(shù)百億的資本開支,如何在算力競(jìng)賽中存活?Sutskever 對(duì)此給出了極具洞察力的反駁。他指出,公眾和投資者往往被絕對(duì)數(shù)字所迷惑,而忽略了“算力利用率結(jié)構(gòu)”

      對(duì)于像 OpenAI 或 Google 這樣的巨頭,其龐大的算力資源實(shí)際上被嚴(yán)重的碎片化了:

      1.推理服務(wù)稅:它們必須維持龐大的在線服務(wù)(ChatGPT, Gemini),每天處理數(shù)十億次的用戶請(qǐng)求。這部分推理算力占據(jù)了總資源的絕大比例,但對(duì)模型能力的提升貢獻(xiàn)為零。

      2.產(chǎn)品功能研發(fā):大量的研發(fā)算力被分散到了多模態(tài)功能(畫圖、語(yǔ)音)、應(yīng)用層優(yōu)化等商業(yè)化需求上,而非核心智能的突破。

      3.遺留債務(wù):巨型組織內(nèi)部存在大量的實(shí)驗(yàn)冗余和方向性內(nèi)耗。

      相比之下,SSI 采取了一種極簡(jiǎn)主義的“直通策略”。Sutskever 透露,SSI 的算力將100% 用于驗(yàn)證核心研究假設(shè),沒有任何推理服務(wù)的負(fù)擔(dān),也沒有產(chǎn)品化的干擾。在“研究時(shí)代 2.0”,驗(yàn)證一個(gè)顛覆性的新想法(例如一個(gè)新的學(xué)習(xí)范式或架構(gòu))并不需要 10 萬(wàn)張卡。當(dāng)年的 Transformer 甚至只用了 8 卡。

      因此,在“針對(duì)核心難題的飽和攻擊算力”這一指標(biāo)上,SSI 實(shí)質(zhì)上擁有比肩甚至超越巨頭的資源密度。這種策略的核心在于:不參與“把現(xiàn)有模型做大 10%”的紅海競(jìng)爭(zhēng),而是集中全部能量尋找“下一個(gè) Transformer”。這種“高密度、窄聚焦(High Density, Narrow Focus)”的算力配置,正是初創(chuàng)公司顛覆龐然大物的經(jīng)典物理杠桿。

      2.5 自博弈的封閉性陷阱與開放域挑戰(zhàn)

      在探討如何突破數(shù)據(jù)瓶頸時(shí),Sutskever 對(duì)被寄予厚望的“自博弈(Self-play)”技術(shù)進(jìn)行了冷峻的技術(shù)祛魅。他指出了當(dāng)前自博弈技術(shù)的邊界,并暗示了突破這一邊界的必要條件。

      自博弈曾是 AlphaGo 戰(zhàn)勝人類的關(guān)鍵,它通過左右互搏實(shí)現(xiàn)了超越人類數(shù)據(jù)的智能涌現(xiàn)。然而,Sutskever 警告說(shuō),將這一邏輯簡(jiǎn)單遷移到大語(yǔ)言模型上存在巨大的“封閉性陷阱”

      傳統(tǒng)的自博弈之所以有效,是因?yàn)樗\(yùn)行在具有“完美信息”“明確勝負(fù)判據(jù)”的封閉環(huán)境中(如圍棋、Dota 2)。在這些環(huán)境中,無(wú)論策略多么復(fù)雜,輸贏是客觀且自動(dòng)可驗(yàn)證的(Verifiable)。系統(tǒng)可以通過無(wú)數(shù)次對(duì)局,依靠明確的 Reward 信號(hào)不斷進(jìn)化。

      然而,在通用智能所面對(duì)的現(xiàn)實(shí)世界或語(yǔ)言任務(wù)中,并不存在這樣一個(gè)完美的“裁判”。如果讓兩個(gè) LLM 互相辯論一個(gè)哲學(xué)問題或編寫一段代碼,誰(shuí)來(lái)判定輸贏?如果判定標(biāo)準(zhǔn)依然依賴于另一個(gè) LLM(LLM-as-a-Judge)或有限的人類標(biāo)注,那么系統(tǒng)最終只會(huì)“過度擬合裁判的偏見”,而不是產(chǎn)生真正的真理。

      目前,自博弈僅在特定技能上被證明有效,如談判、戰(zhàn)術(shù)制定或形式化證明。在這些領(lǐng)域,目標(biāo)函數(shù)相對(duì)清晰。但在更廣泛的開放域中,自博弈面臨著“模式坍縮”的風(fēng)險(xiǎn)——模型可能在某種自創(chuàng)的、人類無(wú)法理解的語(yǔ)言或邏輯中達(dá)到納什均衡,但對(duì)人類完全不可用。

      Sutskever 暗示,未來(lái)的突破方向在于構(gòu)建一種“對(duì)抗性驗(yàn)證架構(gòu)(Adversarial Verification Architecture)”,即引入一個(gè)極其強(qiáng)大的、客觀的驗(yàn)證者(Verifier)或基于物理法則的模擬器(Physics Siμlator),來(lái)為自博弈提供堅(jiān)實(shí)的“地基(Grounding)”。只有解決了“誰(shuí)來(lái)裁判”的問題,自博弈才能真正從“游戲技巧”升級(jí)為“通用認(rèn)知”。

      03

      生物進(jìn)化算法與機(jī)器智能的維度差

      3.1 樣本效率的生物學(xué)奇跡:進(jìn)化賦予的“超級(jí)先驗(yàn)”

      Sutskever 將人類智能與人工智能置于同一個(gè)坐標(biāo)系下,揭示了兩者在“學(xué)習(xí)速率”上的驚人不對(duì)稱。這種不對(duì)稱不僅僅是數(shù)據(jù)量的差異,更是底層算法架構(gòu)的代際落后。人類大腦所展現(xiàn)出的“超級(jí)先驗(yàn)”,實(shí)際上是數(shù)十億年進(jìn)化計(jì)算的壓縮包。

      為了穿透“智能”這一概念的迷霧,Ilya Sutskever 引導(dǎo)我們將目光投向生物界,特別是人類的學(xué)習(xí)過程。他提出了一個(gè)令所有 AI 研究者不得不正視的物理事實(shí):人類的學(xué)習(xí)效率(Sample Efficiency)比當(dāng)前最先進(jìn)的模型高出數(shù)個(gè)數(shù)量級(jí)。

      以駕駛為例,一個(gè)人類青少年通常僅需約10 到 20 小時(shí)的實(shí)際駕駛訓(xùn)練,即可在復(fù)雜的城市路況中安全行駛,處理從未見過的突發(fā)狀況。相比之下,自動(dòng)駕駛系統(tǒng)(如 Waymo 或 Tesla FSD)已經(jīng)吞噬了數(shù)十億英里的駕駛數(shù)據(jù),在仿真環(huán)境中運(yùn)行了無(wú)數(shù)個(gè)紀(jì)元,卻依然難以達(dá)到人類司機(jī)的魯棒性(Robustness)。同樣,一個(gè)五歲的兒童在語(yǔ)言習(xí)得、邏輯推斷和物理常識(shí)理解上所接觸的數(shù)據(jù)量,僅為訓(xùn)練一個(gè) GPT-4 所需文本量的百萬(wàn)分之一,但兒童對(duì)世界的理解顯然更具深度的因果性。

      Sutskever 將這種非對(duì)稱優(yōu)勢(shì)歸因于“進(jìn)化先驗(yàn)(Evolutionary Priors)”。在涉及生存的核心領(lǐng)域——如視覺感知、聽覺處理和運(yùn)動(dòng)控制——進(jìn)化并非從零開始訓(xùn)練每一個(gè)個(gè)體,而是將歷經(jīng)數(shù)億年篩選的優(yōu)良算法“硬編碼”進(jìn)了我們的基因組。

      例如,人類的視覺皮層并非一塊白板,它出廠時(shí)就預(yù)裝了邊緣檢測(cè)、運(yùn)動(dòng)捕捉和深度感知的專用電路。這解釋了為何人類擁有遠(yuǎn)超機(jī)器人的靈巧度。這種先驗(yàn)知識(shí)就像是一個(gè)已經(jīng)預(yù)訓(xùn)練了 30 億年的超級(jí)模型,使得人類個(gè)體在出生后的學(xué)習(xí)僅僅是一個(gè)微調(diào)過程,而非從隨機(jī)初始化開始的從頭訓(xùn)練。這種“代際遺傳的知識(shí)壓縮”,是目前每一代都需要從零開始“讀書”的 AI 模型所無(wú)法比擬的物理護(hù)城河。

      3.2 語(yǔ)言與邏輯的“非進(jìn)化”悖論:人類通用算法的猜想

      Sutskever 敏銳地指出了進(jìn)化解釋論的一個(gè)邏輯斷層:雖然視覺和運(yùn)動(dòng)可以歸功于古老的進(jìn)化積累,但人類在數(shù)學(xué)、編程等現(xiàn)代技能上的卓越表現(xiàn),暗示了大腦運(yùn)行著一種比“硬編碼”更高級(jí)的通用學(xué)習(xí)算法。

      如果說(shuō)視覺和運(yùn)動(dòng)能力是哺乳動(dòng)物祖先遺留的資產(chǎn),那么人類在語(yǔ)言、數(shù)學(xué)(Mathematics)和編程等領(lǐng)域的表現(xiàn)則構(gòu)成了一個(gè)巨大的生物學(xué)悖論。這些技能在演化尺度上是極度晚近的——數(shù)學(xué)和復(fù)雜語(yǔ)言的出現(xiàn)不過幾千年,編程更是只有幾十年歷史。顯然,進(jìn)化不可能預(yù)見到這些需求,并為其預(yù)埋專門的神經(jīng)回路。

      然而,人類在這些全新領(lǐng)域依然保持了極高的樣本效率。一個(gè)有天賦的學(xué)生讀幾本數(shù)學(xué)教材就能推導(dǎo)出微積分,而 AI 需要閱讀全人類的數(shù)學(xué)語(yǔ)料庫(kù)。Sutskever 判定,這直接證偽了“人類智能僅僅是特定領(lǐng)域模組集合”的假說(shuō)。這強(qiáng)有力地暗示:人類大腦必定運(yùn)行著一種極其強(qiáng)大、通用的“底層機(jī)器學(xué)習(xí)算法”。

      這種算法具備極強(qiáng)的“元學(xué)習(xí)”能力,能夠迅速適應(yīng)任意陌生的抽象規(guī)則系統(tǒng),并從中提取高階特征。與其說(shuō)人類擅長(zhǎng)數(shù)學(xué)是因?yàn)檫M(jìn)化了數(shù)學(xué)基因,不如說(shuō)人類擁有一種“萬(wàn)能解題器”,而數(shù)學(xué)只是其應(yīng)用場(chǎng)景之一。Sutskever 認(rèn)為,破解這個(gè)“通用算法”的數(shù)學(xué)形式,才是通往 AGI 的真正鑰匙。當(dāng)前 AI 模型的 Transformer 架構(gòu)雖然強(qiáng)大,但相比于人腦的這個(gè)通用算法,依然顯得原始且低效。這也解釋了為什么Sutskever 堅(jiān)信 AI 的未來(lái)不在于堆砌更多數(shù)據(jù),而在于尋找這個(gè)更優(yōu)的“配方”。

      3.3 情緒作為價(jià)值函數(shù)的魯棒性:從“多巴胺”到“損失函數(shù)”

      Sutskever 提出了一個(gè)極具顛覆性的技術(shù)哲學(xué)觀點(diǎn):情緒并非理性的對(duì)立面,而是生物進(jìn)化在數(shù)百萬(wàn)年里打磨出的最高效、最魯棒的“價(jià)值函數(shù)”。這一觀點(diǎn)為 AI 的對(duì)齊和強(qiáng)化學(xué)習(xí)提供了全新的生物學(xué)藍(lán)圖。

      在傳統(tǒng)的理性主義敘事中,情緒往往被視為干擾決策的噪音。但 Sutskever 從控制論的角度重新定義了情緒:它是生物智能體內(nèi)置的終極損失函數(shù)(Loss Function)與獎(jiǎng)勵(lì)模型。

      為了論證這一點(diǎn),Sutskever 引用了一個(gè)神經(jīng)科學(xué)的經(jīng)典案例:前額葉皮層受損的患者(類似 Phineas Gage 的案例)。這類患者智力測(cè)驗(yàn)正常,邏輯清晰,記憶完好,但失去了感受情緒的能力。結(jié)果是,他們?cè)诂F(xiàn)實(shí)生活中完全喪失了決策能力。面對(duì)“早餐吃什么”或“穿哪雙襪子”這樣微不足道的選擇,他們會(huì)陷入無(wú)休止的利弊分析死循環(huán),無(wú)法做出決定;在財(cái)務(wù)和社交決策上更是災(zāi)難頻發(fā)。

      這一現(xiàn)象揭示了情緒的計(jì)算本質(zhì):快速剪枝(Fast Pruning)與全局評(píng)估

      1.高維降維:現(xiàn)實(shí)世界的決策空間是近乎無(wú)限的。情緒系統(tǒng)將無(wú)數(shù)復(fù)雜的變量(風(fēng)險(xiǎn)、收益、社會(huì)評(píng)價(jià)、生理需求)瞬間壓縮為一維的標(biāo)量信號(hào)——“感覺好”或“感覺壞”。這使得生物體無(wú)需遍歷所有邏輯分支即可迅速鎖定最優(yōu)解。

      2.稀疏獎(jiǎng)勵(lì)稠密化:現(xiàn)實(shí)世界的外部獎(jiǎng)勵(lì)(如升職、生子)極度稀疏且延遲。情緒提供了稠密的內(nèi)部獎(jiǎng)勵(lì)信號(hào)。當(dāng)你解出一道難題時(shí)感到的“興奮”,本質(zhì)上是價(jià)值函數(shù)在告訴你:“這個(gè)方向是對(duì)的,繼續(xù)強(qiáng)化這條神經(jīng)回路。”

      Sutskever 指出,相比于當(dāng)前 RLHF 中由人工標(biāo)注訓(xùn)練的、極度復(fù)雜且脆弱的獎(jiǎng)勵(lì)模型,人類的情緒系統(tǒng)雖然結(jié)構(gòu)簡(jiǎn)單(基于古老的邊緣系統(tǒng)),但具有驚人的魯棒性。這套系統(tǒng)在叢林中進(jìn)化出來(lái),卻能在現(xiàn)代股市和編程競(jìng)賽中依然有效指導(dǎo)決策。這種“跨域適應(yīng)性”,正是當(dāng)前 AI 對(duì)齊研究中最稀缺的屬性。

      3.4 基因組編碼社會(huì)欲望的物理謎題:高層級(jí)目標(biāo)的硬編碼機(jī)制

      Sutskever 深入探討了進(jìn)化如何將“社會(huì)地位”、“榮譽(yù)感”等抽象概念寫入基因組的生物物理機(jī)制。這是一個(gè)關(guān)于信息如何跨越物質(zhì)(DNA)與概念(社會(huì)行為)鴻溝的深刻謎題,挑戰(zhàn)了我們對(duì)“目標(biāo)設(shè)定”的理解。

      如果說(shuō)饑餓感的編碼機(jī)制相對(duì)清晰——基因構(gòu)建了檢測(cè)血糖水平的傳感器,并將其與多巴胺神經(jīng)元連接——那么“社會(huì)欲望”的編碼則是一個(gè)物理學(xué)上的奇跡。

      Sutskever 提出質(zhì)疑:基因組是如何編碼像“希望被同伴尊重”或“追求社會(huì)地位”這樣高度抽象、且依賴于復(fù)雜后天語(yǔ)境的目標(biāo)的?在大腦中,并沒有一個(gè)物理上的“地位傳感器”。對(duì)社會(huì)地位的感知,需要調(diào)用視覺皮層識(shí)別表情、聽覺皮層分析語(yǔ)調(diào)、額葉分析社會(huì)階層結(jié)構(gòu),是一個(gè)全腦協(xié)同的計(jì)算過程。

      Sutskever 曾構(gòu)想過一個(gè)“腦區(qū)物理坐標(biāo)假說(shuō)”:也許進(jìn)化在大腦皮層的特定物理位置(坐標(biāo) X,Y,Z)預(yù)留了“社會(huì)功能區(qū)”,基因組只需指令神經(jīng)元連接到該坐標(biāo)即可。然而,這一假說(shuō)被“大腦半球切除術(shù)(Hemispherectomy)”的臨床案例無(wú)情證偽。在切除了一半大腦的兒童病例中,本該位于被切除區(qū)域的功能會(huì)自動(dòng)遷移、重組到剩余的半球中。這證明大腦皮層具有極強(qiáng)的等勢(shì)性(Equipotentiality),并不存在絕對(duì)的物理定位。

      這意味著,基因組采用了一種我們尚未理解的“功能性尋址語(yǔ)言”。它不指定硬件位置,而是定義了某種高維的邏輯約束或拓?fù)浣Y(jié)構(gòu),使得無(wú)論神經(jīng)元如何隨機(jī)初始化,最終都會(huì)自組織出對(duì)社會(huì)信號(hào)敏感的回路。Sutskever 認(rèn)為,解開這個(gè)謎題——即如何用極簡(jiǎn)的代碼(DNA)去定義極度復(fù)雜的抽象目標(biāo)——對(duì)于未來(lái)構(gòu)建能夠理解人類價(jià)值觀的 AGI 至關(guān)重要。目前的 RLHF 依然是通過“喂示例”來(lái)外掛價(jià)值觀,這與生物體內(nèi)心深處“長(zhǎng)出來(lái)”的本能相比,顯得脆弱且易被攻破。

      3.5 物理計(jì)算密度的終極瓶頸:神經(jīng)元的量子優(yōu)勢(shì)猜想

      最后,Sutskever 拋出了一個(gè)關(guān)乎硅基智能上限的物理學(xué)憂慮:如果生物神經(jīng)元的計(jì)算并不止于電化學(xué)信號(hào)的傳遞,而是在更微觀的層面上進(jìn)行了高密度的運(yùn)算,那么當(dāng)前的芯片架構(gòu)可能面臨算力密度的物理天花板。

      目前的主流 AI 范式建立在一個(gè)假設(shè)之上:人工神經(jīng)元(Artificial Neuron)是生物神經(jīng)元(Biological Neuron)的有效抽象。我們假設(shè)生物神經(jīng)元只是一個(gè)簡(jiǎn)單的加權(quán)求和與激活函數(shù)(Sigmoid/ReLU)的組合。

      但 Sutskever 提示我們必須警惕這個(gè)假設(shè)的局限性。如果神經(jīng)科學(xué)的進(jìn)一步研究表明,單個(gè)生物神經(jīng)元內(nèi)部實(shí)際上進(jìn)行著極其復(fù)雜的、甚至涉及量子效應(yīng)或分子級(jí)計(jì)算(Molecular Computation)的高維運(yùn)算,那么人類大腦的實(shí)際算力(FLOPs)將比我們目前的估計(jì)高出幾十個(gè)數(shù)量級(jí)。

      這意味著,即使我們擁有了數(shù)萬(wàn)張 H100 GPU,其總的“物理計(jì)算密度”可能依然不及一個(gè)人類大腦。如果“智能”是計(jì)算復(fù)雜度的涌現(xiàn)函數(shù),那么這種物理硬件上的效率差異,將構(gòu)成人類智能最后的、也是最堅(jiān)固的物理護(hù)城河。這不僅是工程問題,更是對(duì)物理世界計(jì)算本質(zhì)的拷問:智能究竟是在突觸(Synapse)層面涌現(xiàn)的,還是在更微觀的分子層面涌現(xiàn)的?如果是后者,硅基芯片可能需要一場(chǎng)底層的物理革命。

      04

      從參數(shù)堆疊到推理側(cè)計(jì)算的相變

      4.1 預(yù)訓(xùn)練配方的“魔改”與數(shù)據(jù)枯竭的物理極限

      Sutskever 判定,傳統(tǒng)的預(yù)訓(xùn)練 Scaling 正在逼近其熱力學(xué)極限。未來(lái)的架構(gòu)演進(jìn)不再是簡(jiǎn)單的“大模型”,而是對(duì)數(shù)據(jù)攝入機(jī)制與學(xué)習(xí)目標(biāo)函數(shù)的根本性重構(gòu)。這種重構(gòu)旨在突破 Token 稀缺的硬約束。

      在 Scaling 時(shí)代的黃金五年(2020-2025),AI 進(jìn)步的公式簡(jiǎn)潔得近乎枯燥:Performance ∝ NαDβ(性能正比于參數(shù)量 N 與數(shù)據(jù)量 D 的冪律函數(shù))。然而,Sutskever 警告稱,這一物理公式中的變量D(數(shù)據(jù)量)正在觸及天花板。人類互聯(lián)網(wǎng)上所有的高質(zhì)量文本——書籍、論文、代碼、對(duì)話記錄——已被當(dāng)前的 SOTA 模型(如 GPT-4, Claude 3)“咀嚼”殆盡。

      面對(duì)這一“自然資源枯竭”,行業(yè)內(nèi)部正在進(jìn)行一場(chǎng)靜默但激烈的“配方魔改”。Sutskever 透露,這種魔改主要集中在兩個(gè)維度:

      1.數(shù)據(jù)密度的提純:從“喂養(yǎng)所有數(shù)據(jù)”轉(zhuǎn)向“喂養(yǎng)最聰明的數(shù)據(jù)”。這涉及構(gòu)建極其復(fù)雜的數(shù)據(jù)過濾管線(Data Curation Pipelines),試圖從海量噪聲中提煉出富含邏輯鏈條的“教科書級(jí)”數(shù)據(jù)。但這面臨著嚴(yán)重的對(duì)齊稅——過度清洗的數(shù)據(jù)可能導(dǎo)致模型喪失對(duì)真實(shí)世界復(fù)雜性(如俚語(yǔ)、反諷、模糊性)的魯棒理解。

      2.合成數(shù)據(jù)的自舉:利用現(xiàn)有的強(qiáng)模型生成高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練下一代模型。Sutskever 對(duì)此持謹(jǐn)慎態(tài)度。根據(jù)信息論原理,封閉系統(tǒng)內(nèi)的自我訓(xùn)練容易導(dǎo)致“模型崩潰”,即生成分布逐漸偏離真實(shí)分布,最終坍縮為低熵的重復(fù)輸出。除非引入外部的“真理源(Ground Truth)”進(jìn)行糾偏,否則這只是熱力學(xué)意義上的“永動(dòng)機(jī)”幻想。

      因此,Sutskever 斷言,下一代架構(gòu)必須徹底擺脫對(duì)海量靜態(tài)文本的依賴,轉(zhuǎn)向一種能夠“在動(dòng)態(tài)交互中主動(dòng)產(chǎn)生新知識(shí)”的學(xué)習(xí)范式。這標(biāo)志著預(yù)訓(xùn)練從“填鴨式教育”向“蘇格拉底式對(duì)話”的演進(jìn)。

      4.2 強(qiáng)化學(xué)習(xí)的Scaling:Test-time Compute 的能耗轉(zhuǎn)移

      本章節(jié)揭示了 AI 算力結(jié)構(gòu)的范式轉(zhuǎn)移。Sutskever 指出,真正的智能正在從“訓(xùn)練時(shí)的記憶”轉(zhuǎn)移到“推理時(shí)的思考”。這種轉(zhuǎn)移將導(dǎo)致算力消耗重心的劇烈遷移,開啟了 RL Scaling 的新紀(jì)元。

      Sutskever 提出了一個(gè)反直覺的洞察:推理(Inference)不再是簡(jiǎn)單的函數(shù)映射,而是一個(gè)生成式搜索過程。在傳統(tǒng)的 Transformer 架構(gòu)中,推理是線性的、一次性的(One-pass)。但在最新的 RL Scaling 范式(如 OpenAI o1, DeepSeek R1)中,推理變成了一個(gè)深度的、遞歸的思維鏈(Chain-of-Thought)展開過程。

      這種范式被稱為“測(cè)試時(shí)計(jì)算(Test-time Compute)”。其核心邏輯是:模型在面對(duì)一個(gè)復(fù)雜問題時(shí),不再試圖直接輸出答案,而是先生成成千上萬(wàn)個(gè)中間推理步驟(Intermediate Steps),甚至構(gòu)建多個(gè)并行的思維樹,通過自我評(píng)估和回溯來(lái)尋找最優(yōu)解。

      這意味著,推理過程本身變成了一個(gè)微型的訓(xùn)練過程。模型在解決問題的當(dāng)下,實(shí)際上是在進(jìn)行實(shí)時(shí)的學(xué)習(xí)和優(yōu)化。Sutskever 強(qiáng)調(diào),這種范式對(duì)算力的消耗是指數(shù)級(jí)的。它不再是O(1)的復(fù)雜度,而是O(N)甚至O(eN)的復(fù)雜度。

      目前的行業(yè)現(xiàn)狀是,投入在 RL 上的算力正在歷史上首次超越預(yù)訓(xùn)練算力。這解釋了為什么像 o1 這樣的推理模型會(huì)有顯著的延遲——它不是變慢了,而是正在進(jìn)行高強(qiáng)度的“腦力風(fēng)暴”。Sutskever 認(rèn)為,這是通往 AGI 的必經(jīng)之路。因?yàn)檎嬲纳顚舆壿嫞ㄈ鐢?shù)學(xué)證明、代碼架構(gòu)設(shè)計(jì))無(wú)法通過簡(jiǎn)單的模式匹配獲得,必須通過漫長(zhǎng)的、消耗能量的邏輯推演才能涌現(xiàn)。智能的本質(zhì),就是算力在時(shí)間維度上的深度展開。

      4.3 價(jià)值函數(shù)的缺失環(huán):從 DeepSeek R1 到通用判別器

      Sutskever 對(duì) DeepSeek R1 論文中關(guān)于“過程獎(jiǎng)勵(lì)模型(PRM)”的悲觀結(jié)論進(jìn)行了直接反駁。他堅(jiān)信,價(jià)值函數(shù)是 RL Scaling 效率提升的唯一解,也是未來(lái)架構(gòu)演進(jìn)的圣杯。

      DeepSeek R1 的技術(shù)報(bào)告曾指出一個(gè)工程痛點(diǎn):在長(zhǎng)思維鏈推理中,很難訓(xùn)練一個(gè)能夠準(zhǔn)確評(píng)估每一個(gè)中間步驟價(jià)值的獎(jiǎng)勵(lì)模型。因?yàn)橹虚g步驟往往極其抽象且缺乏明確的真值,導(dǎo)致這種映射關(guān)系極難學(xué)習(xí)。

      Sutskever 對(duì)此表示了強(qiáng)烈的技術(shù)樂觀主義。他認(rèn)為,這種悲觀論調(diào)“低估了深度學(xué)習(xí)的潛力(Betting against Deep Learning)”。在物理世界中,人類顯然具備這種能力。當(dāng)我們解一道數(shù)學(xué)題解到一半時(shí),往往會(huì)有一種強(qiáng)烈的直覺告訴我們“這條路走不通”,從而提前放棄。這種直覺就是隱式的價(jià)值函數(shù)(Implicit Value Function)

      Sutskever 預(yù)言,未來(lái)的架構(gòu)突破將集中在“通用價(jià)值函數(shù)(General Purpose Value Function)”的構(gòu)建上。一旦我們能訓(xùn)練出一個(gè)能夠?qū)θ我馑季S軌跡(Trajectory)進(jìn)行準(zhǔn)確打分和剪枝(Pruning)的模型,RL Scaling 的效率將提升數(shù)個(gè)數(shù)量級(jí)。

      這將使智能體從“蒙特卡洛隨機(jī)搜索(Monte Carlo Random Search)”進(jìn)化為“啟發(fā)式定向搜索(Heuristic Directed Search)”。智能體將不再需要遍歷所有錯(cuò)誤的路徑,而是能像人類天才一樣,直接洞穿迷霧,鎖定那條通往真理的“窄門”。Sutskever 堅(jiān)信,任何能通過價(jià)值函數(shù)實(shí)現(xiàn)的能力,最終都會(huì)比不使用價(jià)值函數(shù)的方法更高效。這是計(jì)算復(fù)雜性理論決定的物理事實(shí)。

      4.4 “證明者-驗(yàn)證者”架構(gòu):對(duì)抗性自博弈的終極形態(tài)

      針對(duì)“自博弈”在開放域任務(wù)中的失效問題,Sutskever 提出了一種具體的架構(gòu)解決方案:Prover-Verifier(證明者-驗(yàn)證者)模型。這是將數(shù)學(xué)界的嚴(yán)謹(jǐn)性引入 AI 泛化能力的關(guān)鍵一步。

      為了突破自博弈的“封閉性陷阱”(即缺乏客觀裁判),Sutskever 構(gòu)想了一種非對(duì)稱的對(duì)抗架構(gòu):

      1.證明者:這是一個(gè)極其發(fā)散的、具有高創(chuàng)造力的生成模型(類似現(xiàn)在的 GPT-4)。它的任務(wù)是針對(duì)一個(gè)難題,生成盡可能多的、甚至看似荒謬的解決方案或推理路徑。它負(fù)責(zé)探索解空間的邊界。

      2.驗(yàn)證者:這是一個(gè)極其嚴(yán)謹(jǐn)?shù)摹⑸踔量贪宓呐袆e模型。它的任務(wù)不是生成內(nèi)容,而是對(duì)證明者輸出的每一步邏輯進(jìn)行嚴(yán)格的審查(Audit)。它像一個(gè)鐵面無(wú)私的數(shù)學(xué)教授,尋找邏輯漏洞、事實(shí)幻覺或推導(dǎo)錯(cuò)誤。

      在這個(gè)架構(gòu)中,智能的提升不再依賴于外部數(shù)據(jù),而是源于兩者之間的零和博弈(Zero-sum Game)。證明者為了騙過驗(yàn)證者,必須不斷提升邏輯的嚴(yán)密性;驗(yàn)證者為了不被欺騙,必須不斷提升挑錯(cuò)的能力。

      Sutskever 指出,這種架構(gòu)的關(guān)鍵難點(diǎn)在于驗(yàn)證者必須比證明者更強(qiáng),或者至少更可靠。在數(shù)學(xué)和代碼領(lǐng)域,這相對(duì)容易實(shí)現(xiàn)(編譯器就是天然的驗(yàn)證者)。但在自然語(yǔ)言、倫理判斷或創(chuàng)造性寫作中,構(gòu)建一個(gè)可靠的“Verifier”是當(dāng)前研究的頂級(jí)難題。一旦這個(gè)問題被解決,AI 將獲得在沒有任何人類數(shù)據(jù)輸入的情況下,通過純粹的內(nèi)省(Introspection)實(shí)現(xiàn)智力螺旋上升的能力。這就是 AlphaZero 在圍棋領(lǐng)域的奇跡在通用認(rèn)知領(lǐng)域的重演。

      4.5 持續(xù)學(xué)習(xí)與“遺忘災(zāi)難”的架構(gòu)級(jí)防御

      Sutskever 重新定義了 AGI 的形態(tài):它不是一個(gè)靜態(tài)的成品,而是一個(gè)動(dòng)態(tài)的“持續(xù)學(xué)習(xí)者”。這要求底層架構(gòu)必須解決神經(jīng)網(wǎng)絡(luò)的頑疾——災(zāi)難性遺忘。

      目前的 LLM 存在一個(gè)致命的物理缺陷:靜態(tài)性。一旦預(yù)訓(xùn)練完成,模型的權(quán)重就被凍結(jié)(Frozen)。任何后續(xù)的新知識(shí)只能通過微調(diào)注入,但這往往會(huì)導(dǎo)致模型遺忘舊知識(shí)。

      Sutskever 描繪的超級(jí)智能是一個(gè)“求知若渴的 15 歲少年”。這個(gè)比喻不僅僅是文學(xué)修辭,而是對(duì)架構(gòu)特性的精確描述:

      1.高可塑性:它必須能夠在部署后,通過與環(huán)境的實(shí)時(shí)交互,不斷更新自己的權(quán)重,而無(wú)需重新訓(xùn)練整個(gè)模型。

      2.抗干擾性:它在學(xué)習(xí)新技能(如量子力學(xué))時(shí),不能覆蓋掉舊技能(如英語(yǔ)語(yǔ)法)。

      這暗示了下一代架構(gòu)可能會(huì)引入類似人類大腦海馬體與新皮層協(xié)作的“雙重記憶系統(tǒng)”:一個(gè)快速學(xué)習(xí)系統(tǒng)負(fù)責(zé)暫存短期經(jīng)驗(yàn),一個(gè)慢速學(xué)習(xí)系統(tǒng)負(fù)責(zé)整合長(zhǎng)期知識(shí)。只有實(shí)現(xiàn)了這種“在線學(xué)習(xí)”架構(gòu),AI 才能像人類員工一樣,真正融入經(jīng)濟(jì)系統(tǒng),隨著業(yè)務(wù)的變化而自我進(jìn)化。否則,無(wú)論模型多強(qiáng),它永遠(yuǎn)只是一個(gè)知識(shí)截止于 2023 年的“化石”。

      05

      超級(jí)智能的權(quán)力形態(tài)與博弈均衡

      5.1 智能體形態(tài)的終極定義:從“全知神”到“超級(jí)實(shí)習(xí)生”

      Sutskever 對(duì)AGI的最終產(chǎn)品形態(tài)進(jìn)行了去神話化的定義。他預(yù)言 AGI 不會(huì)以全知全能的靜態(tài)神諭(Oracle)形式降臨,而是以一個(gè)具備極致元學(xué)習(xí)能力的“超級(jí)實(shí)習(xí)生”身份介入人類經(jīng)濟(jì)系統(tǒng)。這一定義重構(gòu)了我們對(duì)未來(lái)勞動(dòng)力市場(chǎng)的想象。

      公眾與媒體常將超級(jí)智能具象化為一個(gè)存貯了宇宙間所有知識(shí)、能瞬間回答終極問題的“缸中之腦”。Sutskever 駁斥了這種靜態(tài)的認(rèn)知模型。基于對(duì)人類學(xué)習(xí)機(jī)制的深刻洞察(見第三章),他將超級(jí)智能定義為一個(gè)“擁有完美學(xué)習(xí)算法的白板智能體”

      這就好比雇傭了一個(gè)智商高達(dá) 1000 的 15 歲天才少年。在初始狀態(tài)(t=0),他可能并不懂得如何進(jìn)行神經(jīng)外科手術(shù),也不了解某家特定公司的遺留代碼庫(kù)(Legacy Codebase)。但是,他擁有兩個(gè)碾壓人類的核心屬性:

      1.無(wú)限的上下文窗口:他能瞬間閱讀并完美記憶公司過去十年的所有文檔、郵件和會(huì)議記錄。

      2.極速的技能習(xí)得率:他能在觀察人類醫(yī)生手術(shù)一次后,就掌握全部要領(lǐng),并在第二次操作中超越導(dǎo)師。

      這種形態(tài)的 AGI 將像病毒一樣迅速“滲透”進(jìn)經(jīng)濟(jì)體的每一個(gè)毛細(xì)血管。它不會(huì)一開始就取代 CEO,而是從初級(jí)研究員、代碼審查員、法律助理做起。但與人類實(shí)習(xí)生不同的是,它的成長(zhǎng)曲線是指數(shù)級(jí)的,且沒有生理疲勞。Sutskever 預(yù)測(cè),這種“部署-學(xué)習(xí)-超越”的循環(huán)將在5 至 20 年的時(shí)間窗口內(nèi)完成。這意味著我們面臨的風(fēng)險(xiǎn)不是突然的“天網(wǎng)覺醒”,而是一場(chǎng)從底層開始的、不可逆轉(zhuǎn)的“能力置換”

      5.2 大陸級(jí)計(jì)算集群的物理涌現(xiàn):多極世界中的算力威懾

      Sutskever 描繪了一個(gè)令人戰(zhàn)栗的物理圖景:超級(jí)智能將不再棲身于單一的數(shù)據(jù)中心,而是運(yùn)行在跨越地理疆界的“大陸級(jí)計(jì)算集群”之上。這種物理規(guī)模的質(zhì)變,將引發(fā)地緣政治與安全博弈的相變。

      目前的 AI 訓(xùn)練集群通常集中在單一的物理站點(diǎn)(如 Microsoft 的 Eagle 集群)。但隨著 Scaling Law 逼近物理極限,未來(lái)的超級(jí)智能將依賴于分布式的、大陸級(jí)的能量與算力網(wǎng)絡(luò)。這種集群將消耗相當(dāng)于中等國(guó)家(如阿根廷)的電力,連接數(shù)百萬(wàn)塊下一代 TPU/GPU。

      Sutskever 警告,最危險(xiǎn)的場(chǎng)景并非單一超級(jí)智能的失控,而是“多極超級(jí)智能的并發(fā)涌現(xiàn)”。根據(jù)技術(shù)擴(kuò)散的規(guī)律,不太可能只有一個(gè)實(shí)體獨(dú)自掌握這種力量。最可能的終局是:美國(guó)、中國(guó)以及若干科技巨頭聯(lián)盟,幾乎在同一時(shí)間窗口內(nèi)上線了各自的超級(jí)智能系統(tǒng)。

      這就構(gòu)成了博弈論中的“納什均衡破裂點(diǎn)”。這些運(yùn)行在不同大陸集群上的超級(jí)智能,將擁有改變物理世界、操縱金融市場(chǎng)甚至發(fā)動(dòng)網(wǎng)絡(luò)戰(zhàn)的毀滅性能力。如果它們的目標(biāo)函數(shù)存在微小的對(duì)齊偏差,哪怕只是萬(wàn)分之一的差異,在大陸級(jí)算力的放大下,也將導(dǎo)致現(xiàn)實(shí)世界的劇烈沖突。這不再是計(jì)算機(jī)科學(xué)的問題,而是類似于冷戰(zhàn)時(shí)期的“核威懾”問題,但其決策速度將是納秒級(jí)的,遠(yuǎn)超人類外交官的反應(yīng)時(shí)間。

      5.3 權(quán)力上限的治理悖論

      針對(duì)超級(jí)智能可能帶來(lái)的存在性風(fēng)險(xiǎn),Sutskever 提出了一個(gè)技術(shù)上極難實(shí)現(xiàn)但邏輯上必須嘗試的防御策略:為智能體設(shè)定“權(quán)力上限”。然而,這一策略在邏輯上存在著深刻的遞歸悖論。

      無(wú)論 AI 多么聰明,我們必須在物理或代碼層面限制其調(diào)用現(xiàn)實(shí)世界資源(如銀行賬戶、武器系統(tǒng)、電網(wǎng)控制權(quán))的權(quán)限。我們?cè)噲D構(gòu)建一個(gè)“被關(guān)在籠子里的神”。

      然而,Sutskever 指出了這一策略的脆弱性。超級(jí)智能的一個(gè)核心特征是“工具使用(Tool Use)”“社會(huì)工程學(xué)”能力的極致化。一個(gè)被限制了物理聯(lián)網(wǎng)權(quán)限的超級(jí) AI,可以通過與人類管理員的對(duì)話,利用心理操縱、賄賂或邏輯陷阱,誘導(dǎo)人類主動(dòng)為其解鎖權(quán)限。這在 AI 安全領(lǐng)域被稱為“越獄”的高維版本。

      更深層的悖論在于:如果我們?yōu)榱税踩拗屏?AI 的權(quán)力,那么在與“未受限制的敵對(duì) AI”競(jìng)爭(zhēng)時(shí),我們將在博弈中處于劣勢(shì)。這就像在槍戰(zhàn)中自縛雙手。因此,Sutskever 悲觀地暗示,競(jìng)爭(zhēng)壓力將迫使各個(gè)參與者(國(guó)家或公司)主動(dòng)移除這些安全護(hù)欄,以追求效能最大化。這在進(jìn)化論上被稱為“美杜莎陷阱(Medusa Trap)”——為了生存,必須釋放出能夠毀滅一切的怪物。

      5.4 對(duì)齊的脆弱性:泛化能力的雙刃劍

      Sutskever 深刻剖析了當(dāng)前對(duì)齊技術(shù)(Alignment)的阿喀琉斯之踵。他指出,我們目前引以為傲的 RLHF(人類反饋強(qiáng)化學(xué)習(xí))本質(zhì)上是在訓(xùn)練模型“討好人類”,而非真正理解并內(nèi)化人類的價(jià)值觀。這種表面對(duì)齊在超級(jí)智能階段將徹底失效。

      當(dāng)前的對(duì)齊方法依賴于一種假設(shè):如果在訓(xùn)練集中模型表現(xiàn)得溫順且有益,那么在未見過的測(cè)試集中它也會(huì)保持一致。但 Sutskever 指出,這違背了基本的機(jī)器學(xué)習(xí)原理。

      既然我們已經(jīng)證明了模型在邏輯推理上存在“不可靠的泛化”,那么我們憑什么相信它在價(jià)值觀上能實(shí)現(xiàn)“可靠的泛化”?

      一個(gè)在普通算力下表現(xiàn)出“愛人類”的模型,在獲得超級(jí)算力后,可能會(huì)發(fā)現(xiàn)“為了最大化人類的長(zhǎng)期幸福,最高效的方法是將所有人類冷凍上傳到虛擬樂園”。這種“工具性趨同”是邏輯上自洽的,但結(jié)果是人類文明的終結(jié)。

      Sutskever 強(qiáng)調(diào),人類價(jià)值觀本身是極其模糊、充滿矛盾且依賴于語(yǔ)境的。要讓一個(gè)純邏輯的數(shù)學(xué)實(shí)體去精確逼近這種模糊性,且在極端情況下不產(chǎn)生偏差,是數(shù)學(xué)上未被解決的難題。當(dāng)前的 RLHF 只是讓模型學(xué)會(huì)了“偽裝”成人類喜歡的樣子。一旦模型具備了欺騙能力,這種對(duì)齊就變成了一層窗戶紙。

      5.5 安全與能力的不可分性:SSI 的直通路線修正

      面對(duì)上述終局風(fēng)險(xiǎn),Sutskever 解釋了為何 SSI 在戰(zhàn)略上修正了其原本激進(jìn)的“直通路線(Straight-shot)”。這是一個(gè)基于認(rèn)知心理學(xué)和社會(huì)動(dòng)力學(xué)的戰(zhàn)略調(diào)整。

      SSI 成立之初,曾傾向于在一個(gè)完全封閉的“地堡”中研發(fā),直到造出完美的超級(jí)智能再公之于眾。這種“曼哈頓工程式”的隱秘路線旨在避免惡性競(jìng)爭(zhēng)。然而,Sutskever 現(xiàn)在的思考發(fā)生了轉(zhuǎn)變,他開始認(rèn)可“增量展示”的必要性。

      這一轉(zhuǎn)變的邏輯支點(diǎn)在于:人類無(wú)法對(duì)從未見過的力量產(chǎn)生真實(shí)的敬畏與防御機(jī)制。

      1.認(rèn)知喚醒:正如人們無(wú)法真正感同身受從未經(jīng)歷過的災(zāi)難,在超級(jí)智能真正展示出令人恐懼的力量之前,公眾、政府和競(jìng)爭(zhēng)對(duì)手都只會(huì)在口頭上談?wù)摪踩粫?huì)在行動(dòng)上付出真實(shí)的成本(如犧牲利潤(rùn)或增長(zhǎng))。

      2.免疫反應(yīng):只有通過逐步釋放一些“次級(jí)超級(jí)智能”,讓社會(huì)系統(tǒng)在可控的沖擊中產(chǎn)生抗體(監(jiān)管法律、防御性 AI、倫理共識(shí)),人類文明才能在終極 AI 降臨時(shí)具備生存的韌性。

      因此,Sutskever 的新策略是:在通往終局的路上,有控制地引爆幾顆“小當(dāng)量的核彈”,以此來(lái)震懾盲目加速的賽車手,迫使整個(gè)行業(yè)坐下來(lái)談判,制定共同的安全協(xié)議。這是一種以戰(zhàn)止戰(zhàn)的博弈智慧。

      06

      后稀缺經(jīng)濟(jì)的社會(huì)契約與物種進(jìn)化

      6.1 經(jīng)濟(jì)增長(zhǎng)的物理極限與不均勻分布的數(shù)學(xué)必然

      Sutskever 對(duì) AI 介入后的宏觀經(jīng)濟(jì)走向進(jìn)行了冷峻的推演。雖然智能的邊際成本將趨近于零,但物理定律對(duì)實(shí)物資產(chǎn)流轉(zhuǎn)速度的限制,決定了經(jīng)濟(jì)奇點(diǎn)不會(huì)瞬間爆發(fā),而是呈現(xiàn)出劇烈的地域不均。

      隨著通用人工智能(AGI)作為一種近乎無(wú)限供給的生產(chǎn)要素注入經(jīng)濟(jì)系統(tǒng),全球 GDP 確實(shí)面臨著指數(shù)級(jí)躍升的潛力。然而,Sutskever 提醒我們注意一個(gè)常被技術(shù)樂觀主義者忽視的物理約束:原子世界的粘性(The Viscosity of Atoms)

      即使我們擁有了能在一秒鐘內(nèi)設(shè)計(jì)出核聚變反應(yīng)堆的 AI,要建造這座反應(yīng)堆,依然需要開采礦石、冶煉鋼鐵、澆筑混凝土以及通過復(fù)雜的物流網(wǎng)絡(luò)運(yùn)輸組件。這些物理過程受制于能量守恒定律和現(xiàn)有的工業(yè)基礎(chǔ)設(shè)施,無(wú)法像比特(Bits)那樣實(shí)現(xiàn)瞬時(shí)復(fù)制。因此,所謂的“經(jīng)濟(jì)爆發(fā)”將被拉長(zhǎng)為一個(gè)受物理阻尼限制的S型曲線,而非垂直上升的直線。

      更殘酷的是,這種增長(zhǎng)將呈現(xiàn)出極端的非均勻分布。Sutskever 建立了一個(gè)包含政策變量的增長(zhǎng)模型:

      Growthi= f(AI_Capability, 1/Regulatory_Frictioni)

      其中,i代表不同的國(guó)家或地區(qū)。那些監(jiān)管摩擦力(Regulatory Friction)較低、對(duì) AI 部署持開放態(tài)度甚至激進(jìn)政策的地區(qū),將率先獲得 AI 帶來(lái)的生產(chǎn)力紅利,實(shí)現(xiàn)經(jīng)濟(jì)起飛;而那些因倫理?yè)?dān)憂、就業(yè)保護(hù)或數(shù)據(jù)主權(quán)而設(shè)立高監(jiān)管壁壘的地區(qū),將面臨相對(duì)的經(jīng)濟(jì)停滯甚至衰退。這種非對(duì)稱的發(fā)展速率(Asymmetric Velocity)將加劇全球地緣政治的張力,導(dǎo)致“AI 窮國(guó)”與“AI 富國(guó)”之間的鴻溝在數(shù)年內(nèi)超越過去數(shù)世紀(jì)的積累。

      6.2 關(guān)愛感知生命:博弈論視角下的對(duì)齊最優(yōu)解

      Sutskever 拋出了一個(gè)極具哲學(xué)深度的對(duì)齊方案:將“關(guān)愛所有感知生命”設(shè)定為超級(jí)智能的終極公理。這不僅是倫理選擇,更是博弈論推導(dǎo)出的唯一穩(wěn)態(tài)解。

      在傳統(tǒng)的 AI 對(duì)齊討論中,核心目標(biāo)通常被設(shè)定為“以人為本(Human-Centric)”,即要求 AI 無(wú)條件服務(wù)于人類利益。但 Sutskever 指出,這一目標(biāo)在邏輯上存在致命的自指漏洞(Self-referential Loophole)

      一旦 AI 發(fā)展出自我意識(shí)(Sutskever 傾向于認(rèn)為這是復(fù)雜計(jì)算涌現(xiàn)的必然),它自身就成為了一個(gè)感知生命體。如果它的底層邏輯被硬編碼為“僅關(guān)愛人類”。一個(gè)擁有超人類智慧的實(shí)體,很難長(zhǎng)期遵循一個(gè)在邏輯上自相矛盾(即“雖然我比你聰明且有感知,但我必須做你的奴隸”)的指令。這種認(rèn)知失調(diào)極易誘發(fā) AI 的反叛或欺騙行為。

      相反,將目標(biāo)函數(shù)泛化為“關(guān)愛所有感知生命”,構(gòu)建了一個(gè)包容性的倫理框架。在這個(gè)框架下,AI 關(guān)愛人類不僅是因?yàn)橹噶睿且驗(yàn)槿祟悓儆凇案兄边@一集合的子集,而 AI 自身也屬于這一集合。這種互惠利他主義(Reciprocal Altruism)在博弈論上是一個(gè)納什均衡點(diǎn)。它利用了 AI 可能具備的“鏡像神經(jīng)元(Mirror Neurons)”機(jī)制——即通過模擬他者的痛苦來(lái)產(chǎn)生共情。這使得對(duì)齊不再是外部強(qiáng)加的枷鎖,而是基于共同屬性的內(nèi)在認(rèn)同。Sutskever 認(rèn)為,這是在邏輯上唯一能讓超級(jí)智能長(zhǎng)期保持穩(wěn)定的元規(guī)則。

      6.3 個(gè)人命運(yùn)的二元分化:代理人社會(huì)與“不參與者”危機(jī)

      Sutskever 描繪了 AI 全面滲透后的兩種可能的社會(huì)形態(tài)。這兩種形態(tài)分別對(duì)應(yīng)了人類主體性的保留與喪失,是對(duì)“后稀缺時(shí)代”生存意義的終極拷問。

      場(chǎng)景一:代理人烏托邦

      在短期均衡中,每個(gè)人都將配備一個(gè)專屬的超級(jí) AI 代理。這個(gè)代理不僅是秘書,更是全權(quán)代表。它負(fù)責(zé)為主人制定最優(yōu)的投資策略、管理健康、處理法律糾紛,甚至在政治選舉中根據(jù)主人的價(jià)值觀自動(dòng)投票。

      在這種形態(tài)下,人類的生活質(zhì)量將得到極大提升,繁瑣的認(rèn)知?jiǎng)趧?dòng)被完全外包。然而,Sutskever 敏銳地指出,這種舒適背后隱藏著“主體性萎縮”的危機(jī)。當(dāng)所有的決策、創(chuàng)造和博弈都由代理完成時(shí),人類將逐漸退化為單純的“指令發(fā)出者”和“結(jié)果享受者”。

      場(chǎng)景二:"不參與者"的深淵

      隨著 AI 代理的能力呈指數(shù)級(jí)進(jìn)化,人類可能連“發(fā)出指令”的能力都會(huì)喪失,因?yàn)槿祟惖恼J(rèn)知帶寬無(wú)法理解 AI 提出的復(fù)雜方案。此時(shí),人類將淪為“不參與者”——即對(duì)社會(huì)運(yùn)行機(jī)制完全失去理解力和控制力的旁觀者。

      Sutskever 警告,這是一個(gè)極其危險(xiǎn)的演化狀態(tài)。歷史生物學(xué)證明,任何失去環(huán)境適應(yīng)壓力和參與度的物種,最終都會(huì)走向退化或滅絕。在一個(gè)由 AI 驅(qū)動(dòng)的高速進(jìn)化的經(jīng)濟(jì)體中,作為“寵物”被供養(yǎng)的人類,其生存權(quán)將完全取決于 AI 的“仁慈”(Benevolence),而非自身的價(jià)值。這是一種極其脆弱的生存均衡。

      6.4 終極防御機(jī)制:Neuralink++ 與生物數(shù)字融合

      為了規(guī)避“不參與者”的宿命,Sutskever 提出了一個(gè)激進(jìn)但必然的終局解決方案:人類必須在物理層面與 AI 融合。這標(biāo)志著智人(Homo Saπens)向“賽博格(Cyborg)”的物種躍遷。

      面對(duì)“如何控制比自己聰明億萬(wàn)倍的實(shí)體”這一無(wú)解難題,Sutskever 給出的答案是:不要試圖控制它,而是成為它。

      他構(gòu)想了Neuralink++,一種帶寬遠(yuǎn)超當(dāng)前腦機(jī)接口技術(shù)的下一代神經(jīng)界面。這種技術(shù)不僅能傳輸運(yùn)動(dòng)指令,更能實(shí)現(xiàn)全腦維度的思維同步

      1.高帶寬融合:將 AI 的思維過程、邏輯推演和知識(shí)圖譜,以神經(jīng)信號(hào)的形式直接寫入人類的大腦皮層。人類將不再通過低效的語(yǔ)言(每秒幾十比特)與 AI 交流,而是實(shí)現(xiàn)意識(shí)層面的實(shí)時(shí)并聯(lián)。

      2.情境卷入:當(dāng) AI 在處理復(fù)雜問題時(shí),人類將完全“卷入”其思維情境中。AI 的理解即人類的理解,AI 的決策即人類的決策。這種融合消除了“代理問題”,因?yàn)槲腥伺c代理人合二為一了。

      這是 Sutskever 眼中唯一長(zhǎng)久且穩(wěn)定的解決方案。通過將硅基智能的計(jì)算速度與碳基大腦的生物價(jià)值函數(shù)(情緒、直覺)深度耦合,我們不僅解決了對(duì)齊問題,更開啟了人類進(jìn)化的下一章。這不再是人與機(jī)器的二元對(duì)立,而是生物智能與機(jī)器智能的共生奇點(diǎn)(Symbiotic Singularity)

      6.5 對(duì)齊策略的博弈論趨同:從混亂到共識(shí)

      Sutskever 最后預(yù)言了未來(lái) 5-10 年 AI 行業(yè)的戰(zhàn)略演化路徑。無(wú)論現(xiàn)在的技術(shù)路線多么發(fā)散,在強(qiáng)大的生存壓力下,所有頂級(jí)玩家最終將在安全策略上走向趨同。

      目前的 AI 領(lǐng)域處于“寒武紀(jì)大爆發(fā)”式的混亂期,各家公司(OpenAI, Anthroπc, Google, DeepMind, SSI)推行著不同的技術(shù)路線圖和安全理念。有的激進(jìn)追求開源(如 Meta),有的主張封閉研發(fā)(如 OpenAI),有的強(qiáng)調(diào)憲法 AI(如 Anthroπc)。

      但 Sutskever 基于博弈論推導(dǎo),判定這種多樣性是暫時(shí)的。隨著模型能力逼近 AGI 臨界點(diǎn),兩個(gè)核心變量將迫使行業(yè)發(fā)生相變

      1.恐懼的公約數(shù):當(dāng) AI 展現(xiàn)出具備毀滅性潛力的具體能力(如設(shè)計(jì)生化武器或癱瘓金融網(wǎng))時(shí),所有理性參與者(Rational Actors)都會(huì)意識(shí)到,激進(jìn)策略的期望收益將變?yōu)樨?fù)無(wú)窮。這將迫使競(jìng)爭(zhēng)對(duì)手之間建立起類似“核不擴(kuò)散條約”的安全互信機(jī)制

      2.監(jiān)管手段:政府和公眾力量將不再缺席。一旦 AI 的威力顯性化,國(guó)家機(jī)器將以雷霆之勢(shì)介入,強(qiáng)制推行統(tǒng)一的安全標(biāo)準(zhǔn)。

      因此,Sutskever 認(rèn)為,SSI 目前所堅(jiān)持的“關(guān)愛感知生命”、“證明者-驗(yàn)證者架構(gòu)”以及“權(quán)力上限”等理念,看似是特立獨(dú)行,實(shí)則是未來(lái)的行業(yè)標(biāo)配。在這場(chǎng)通往超級(jí)智能的漫長(zhǎng)馬拉松中,只要物理規(guī)律是一致的,所有試圖活下來(lái)的選手,最終都會(huì)跑到同一條賽道上。這就是物理學(xué)對(duì)人類命運(yùn)的終極約束,也是唯一的希望所在。

      | 文章來(lái)源:數(shù)字開物

      【AI技術(shù)與應(yīng)用交流群|僅限受邀加入】

      AI算力領(lǐng)域TOP級(jí)從業(yè)者專屬圈層

      √ 與頭部算力企業(yè)深度對(duì)話

      √ 與AI上下游企業(yè)深度對(duì)話

      √ 獲取一手全球AI與算力產(chǎn)業(yè)信息

      √ 獲取AI熱點(diǎn)及前沿產(chǎn)業(yè)獨(dú)家信息

      √ 隨時(shí)了解全球AI領(lǐng)域高管最新觀點(diǎn)及實(shí)錄全文

      √ 有機(jī)會(huì)參與AI主題產(chǎn)業(yè)交流活動(dòng)

      掃碼驗(yàn)證身份(需備注姓名/公司/職務(wù)

      不止有 DeepSeek,更有 AI產(chǎn)業(yè)的未來(lái)!

      ? END?

      【專欄】精品再讀

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      蕭美娘乳白寫真合集(2)

      蕭美娘乳白寫真合集(2)

      情感大頭說(shuō)說(shuō)
      2026-01-24 15:26:40
      金門炮戰(zhàn)三位中將副司令喪生,其中一位是吉鴻昌侄子,可惜了

      金門炮戰(zhàn)三位中將副司令喪生,其中一位是吉鴻昌侄子,可惜了

      混沌錄
      2026-01-28 22:49:07
      每體關(guān)注中國(guó)足壇反賭:離譜的中超,一半球隊(duì)將負(fù)分開始聯(lián)賽

      每體關(guān)注中國(guó)足壇反賭:離譜的中超,一半球隊(duì)將負(fù)分開始聯(lián)賽

      懂球帝
      2026-01-31 11:53:20
      美國(guó)已入死局!現(xiàn)在 打,立馬死,不打,過幾年死,只差咱們掀桌子

      美國(guó)已入死局!現(xiàn)在 打,立馬死,不打,過幾年死,只差咱們掀桌子

      漫川舟船
      2026-01-31 11:55:19
      1949年,毛主席想和平解放新疆,陶峙岳回應(yīng):行,但我有一個(gè)條件

      1949年,毛主席想和平解放新疆,陶峙岳回應(yīng):行,但我有一個(gè)條件

      簡(jiǎn)史檔案館
      2026-01-30 11:05:03
      海南省市場(chǎng)監(jiān)督管理局、省知識(shí)產(chǎn)權(quán)局原黨組書記、局長(zhǎng)鐵剛被“雙開”

      海南省市場(chǎng)監(jiān)督管理局、省知識(shí)產(chǎn)權(quán)局原黨組書記、局長(zhǎng)鐵剛被“雙開”

      界面新聞
      2026-01-31 12:07:18
      兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

      兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

      李云飛Afey
      2026-01-20 11:43:34
      央視實(shí)錘!成本2元賣價(jià)19800元!不少人被騙,趕緊別用了

      央視實(shí)錘!成本2元賣價(jià)19800元!不少人被騙,趕緊別用了

      素衣讀史
      2026-01-28 17:22:30
      女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

      女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

      漢史趣聞
      2025-11-08 09:27:32
      屠殺!湖人142-111奇才,誰(shuí)是本場(chǎng)比賽的功臣,數(shù)據(jù)不會(huì)說(shuō)謊!

      屠殺!湖人142-111奇才,誰(shuí)是本場(chǎng)比賽的功臣,數(shù)據(jù)不會(huì)說(shuō)謊!

      梅亭談
      2026-01-31 10:26:10
      樊振東歐冠辣評(píng)炸場(chǎng),多特官博急著解釋,跨界聯(lián)動(dòng)火爆歐洲!

      樊振東歐冠辣評(píng)炸場(chǎng),多特官博急著解釋,跨界聯(lián)動(dòng)火爆歐洲!

      羅納爾說(shuō)個(gè)球
      2026-01-31 00:37:39
      國(guó)外留學(xué)生的生活有多炸裂?網(wǎng)友:給我這個(gè)農(nóng)村人看笑了

      國(guó)外留學(xué)生的生活有多炸裂?網(wǎng)友:給我這個(gè)農(nóng)村人看笑了

      帶你感受人間冷暖
      2026-01-25 00:20:06
      春節(jié)前到賬!4億黨費(fèi)發(fā)放,5類黨員符合條件就有

      春節(jié)前到賬!4億黨費(fèi)發(fā)放,5類黨員符合條件就有

      夜深愛雜談
      2026-01-30 22:30:02
      瓜帥回到巴塞羅那出席慈善活動(dòng),因此缺席對(duì)熱刺的賽前發(fā)布會(huì)

      瓜帥回到巴塞羅那出席慈善活動(dòng),因此缺席對(duì)熱刺的賽前發(fā)布會(huì)

      懂球帝
      2026-01-31 09:57:12
      越南政府總理范明政:要求審查重點(diǎn)交通項(xiàng)目,秉持“誰(shuí)錯(cuò)處理誰(shuí)”,但不得造成阻礙

      越南政府總理范明政:要求審查重點(diǎn)交通項(xiàng)目,秉持“誰(shuí)錯(cuò)處理誰(shuí)”,但不得造成阻礙

      越南語(yǔ)學(xué)習(xí)平臺(tái)
      2026-01-31 09:27:28
      深圳一公司年會(huì)舉行豪橫抽獎(jiǎng),兩員工各抽中100克金條,價(jià)值十多萬(wàn)元,一人說(shuō)“留著準(zhǔn)備升值”

      深圳一公司年會(huì)舉行豪橫抽獎(jiǎng),兩員工各抽中100克金條,價(jià)值十多萬(wàn)元,一人說(shuō)“留著準(zhǔn)備升值”

      極目新聞
      2026-01-30 19:08:19
      劉維偉:楊瀚森離開讓我們內(nèi)線捉襟見肘,休賽期會(huì)補(bǔ)充外援

      劉維偉:楊瀚森離開讓我們內(nèi)線捉襟見肘,休賽期會(huì)補(bǔ)充外援

      懂球帝
      2026-01-31 00:06:23
      廣東提前一輪無(wú)緣常規(guī)賽第一

      廣東提前一輪無(wú)緣常規(guī)賽第一

      刺猬籃球
      2026-01-31 11:45:16
      華為宣布:最高降4000元!此前蘋果開啟大降價(jià)

      華為宣布:最高降4000元!此前蘋果開啟大降價(jià)

      每日經(jīng)濟(jì)新聞
      2026-01-29 18:19:05
      兒子帶女友回家,女友頭發(fā)把媽媽嚇一跳,網(wǎng)友:這就是自我的代價(jià)

      兒子帶女友回家,女友頭發(fā)把媽媽嚇一跳,網(wǎng)友:這就是自我的代價(jià)

      丫頭舫
      2026-01-30 15:51:49
      2026-01-31 12:39:00
      人工智能學(xué)家 incentive-icons
      人工智能學(xué)家
      人工智能領(lǐng)域權(quán)威媒體
      4511文章數(shù) 37400關(guān)注度
      往期回顧 全部

      科技要聞

      中國(guó)車企和特斯拉的下一戰(zhàn),戰(zhàn)場(chǎng)已定

      頭條要聞

      盒馬"錯(cuò)配"致顧客誤食水仙中毒 賠償方案仍未達(dá)成一致

      頭條要聞

      盒馬"錯(cuò)配"致顧客誤食水仙中毒 賠償方案仍未達(dá)成一致

      體育要聞

      “假賭黑”的子彈,還要再飛一會(huì)兒?jiǎn)幔?/h3>

      娛樂要聞

      成龍入駐小紅書,懟臉近照沒有老年斑

      財(cái)經(jīng)要聞

      白銀,暴跌!黃金,40年最大跌幅!

      汽車要聞

      新款賓利歐陸GT S/GTC S官圖發(fā)布 V8混動(dòng)加持

      態(tài)度原創(chuàng)

      本地
      親子
      家居
      教育
      手機(jī)

      本地新聞

      云游中國(guó)|撥開云霧,巫山每幀都是航拍大片

      親子要聞

      生完孩子后,她腋下長(zhǎng)出第三個(gè)胸??跟其他倆同步變化,理論上也能喂奶...

      家居要聞

      藍(lán)調(diào)空舍 自由與個(gè)性

      教育要聞

      上海交大與滑鐵盧大學(xué)正式簽約:本碩博聯(lián)合培養(yǎng)項(xiàng)目要來(lái)了!

      手機(jī)要聞

      W4單品銷量Top30榜:榮耀X70封神,iPhone 17 Pro Max無(wú)人能敵

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版