<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      CMU與NYU聯合團隊提出“上褶度”,揭秘計算受限下的智能真相

      0
      分享至

      當我們說一個 AI 模型“學到了東西”,究竟是什么意思?這個問題聽起來有點哲學,但它正在成為機器學習研究中一個越來越緊迫的技術命題。

      2026 年 1 月初,來自美國卡內基梅隆大學和紐約大學的聯合團隊發布了一篇題為《從熵到上褶度:為計算受限智能重新思考信息》(From Entropy to Epiplexity: Rethinking Information for Computationally Bounded Intelligence)的論文,團隊耗時兩年進行研究,提出了一個名為“epiplexity”(上褶度,或可譯為“認知復雜度”,epi 表“上層”,plexity 與 complex/perplexity 同源,指向“復雜性”)的新概念,試圖從根本上回答這個問題,論文發布后迅速在設計媒體上引發了討論。


      圖丨相關論文(來源:arXiv)

      日前,相關論文發表于預印本平臺 arXiv,卡內基梅隆大學博士后 Marc Finzi、博士生 Yiding jiang 與紐約大學博士生裘釋凱(Shikai Qiu)共同擔任第一作者。


      (來源:GitHub)

      這篇論文的核心論點是:我們長期以來用于衡量信息的經典工具香農熵(Shannon entropy)和柯爾莫哥洛夫復雜度(Kolmogorov complexity)在面對現代機器學習時表現得捉襟見肘。這些框架隱含地假設觀察者擁有無限的計算能力,但現實中的學習系統,無論是人腦還是 GPU 集群,都在有限的計算預算下運作。當我們忽視這一點時,理論與實踐之間就會出現令人困惑的裂痕。


      圖丨隨機信息與結構性信息示意圖(來源:arXiv)

      研究團隊列舉了三個“信息論悖論”,用以說明現有理論框架的局限性。

      第一個悖論涉及信息守恒:根據數據處理不等式(Data Processing Inequality),確定性變換不能增加信息量。然而 AlphaZero 僅從圍棋規則這一極其簡短的程序出發就學會了超越人類的策略,最終模型參數規模卻相當大。這些“額外的信息”從何而來?

      第二個悖論關乎順序:香農信息論告訴我們,先觀察 X 再觀察 Y 與先 Y 后 X 得到的總信息量相同,即 H(Y|X)+H(X)=H(X|Y)+H(Y)。但大量實驗表明,大語言模型在正向閱讀英文時的壓縮效果明顯優于逆向閱讀,數據的呈現順序確實影響學習效果。

      第三個悖論則觸及似然建模的本質:最大化似然被認為等同于匹配數據分布,因此模型不可能學到比數據生成過程更復雜的東西。但研究者們發現,在康威生命游戲這樣的系統中,計算受限的模型為了做出預測,必須學習識別“滑翔機”“振蕩器”等涌現結構,而這些概念在原始的局部演化規則中根本不存在。

      為了調和這些矛盾,研究者們引入了“時間受限熵”(time-bounded entropy)和“上褶度”(epiplexity)兩個概念。其核心定義建立在最小描述長度原則(Minimum Description Length,MDL)之上。

      給定一個隨機變量 X 和計算時間上界 T,他們首先找到在該時間約束下能最優壓縮數據的概率模型:

      這里 P_T 表示所有能在時間 T 內完成采樣和概率計算的程序集合,|P|是程序 P 的比特長度,E[log 1/P(X)]則是用該模型編碼數據所需的期望比特數。找到這個最優模型后,上褶度和時間受限熵分別定義為:

      (上褶度,即在給定計算預算下,為了把數據壓縮到最好,模型必須“內化”的結構性規律總量)

      (時間受限熵,即用最優模型編碼數據的期望長度)

      用更直白的話說:時間受限熵是“噪聲”,上褶度是“信號”,但這里的噪聲和信號是相對于特定計算能力而言的。一個密碼學安全的偽隨機數生成器(Cryptographically Secure Pseudo-Random Number Generator,CSPRNG)對于只有多項式時間計算預算的模型來說就是純噪聲,盡管它在數學上是完全確定的。


      圖丨如何估計上褶度(來源:arXiv)

      論文中證明,對于任何 CSPRNG 輸出,其時間受限熵接近最大值 n 比特,而上褶度則接近常數,這與我們的直覺完全吻合。

      “信息取決于觀察者”這個想法在密碼學中其實早有根基。單向函數(正向計算容易、逆向計算難),正是現代密碼體系的基石。但將這一思想系統性地引入機器學習的理論框架,并給出可操作的度量方法,是這篇論文的貢獻所在。

      研究者們提出了兩種估算上褶度的實用方法。第一種叫預序編碼(prequential coding),其核心思想可以用訓練損失曲線來理解:

      這個公式的含義是:用模型在第 i 步的損失減去最終收斂后的損失,然后對所有訓練步驟求和。如果你畫出訓練損失曲線,這就是曲線與最終水平線之間的面積。損失下降得越多、持續得越久,面積就越大,意味著模型“吸收”了越多的結構性信息。

      第二種方法叫請求編碼(requential coding),通過教師-學生蒸餾過程中的 KL 散度累積來給出更嚴格的上界,計算成本更高但理論上更可靠。

      論文中的實驗涵蓋了從元胞自動機到國際象棋再到自然語言的多種數據類型。團隊首先用初等元胞自動機(Elementary Cellular Automaton,ECA)做了一組對比實驗,ECA 的規則一共有 256 種,研究者挑了三種代表性的來測試。

      規則 15 產生簡單周期圖案,模型很快學會預測,上褶度很低;規則 30 產生混沌輸出,模型永遠無法做出有效預測,時間受限熵極高但上褶度幾乎為零;規則 54 則處于“復雜性邊緣”,產生部分可預測的涌現結構,上褶度隨計算預算增加而穩步上升。這也和此前耶魯大學團隊提出的“混沌邊緣智能”(Intelligence at the Edge of Chaos)的研究方向形成了呼應,最有價值的學習信號,或許恰恰藏在有序與混沌的交界地帶。


      圖丨用元胞自動機創建的信息(來源:arXiv)

      在國際象棋數據上,研究者們比較了兩種格式:先給出棋步序列再給出最終局面,與先給出局面再給出棋步。前者類似于“正向”計算,從走法推導局面是簡單的規則應用;后者則類似于“逆向”推理,從局面反推走法需要更復雜的理解。

      實驗表明,后者雖然訓練損失更高,但上褶度也更高,而且在下游任務(如國際象棋謎題求解和局面評估)上表現更好。這說明更難學習的數據呈現方式可能反而能迫使模型習得更豐富的局面表征,這些表征更容易遷移到需要理解局面的 OOD(Out-of-Distribution Generalization,分布外泛化)任務上。

      論文中可能最有現實啟發的一點,是它在同一算力條件下對比了不同數據模態的“可學結構”。在相同的計算預算下,OpenWebText 文本數據的上褶度顯著高于 Lichess 國際象棋數據,而后者又高于 CIFAR-5M 圖像數據。圖像數據的總信息量(按原始字節計)最大,但超過 99% 都是“時間受限熵”,即像素級的不可預測噪聲。


      圖丨上褶度揭示了不同數據模態中的結構信息差異(來源:arXiv)

      這或許解釋了一個長期困擾研究者的現象:為什么在文本上預訓練能帶來廣泛的能力遷移,而在圖像上預訓練卻不然?因為文本包含更多可學習的結構性信息,這些信息被編碼進模型權重后可以在新任務中復用。

      論文還探討了“歸納”(induction)和“涌現”(emergence)兩類現象如何產生超出數據生成過程的上褶度。

      關于歸納,研究者們援引了 Ilya Sutskever 的一個經典思想實驗:當你讀一本偵探小說,在某個時刻文本揭示了兇手的身份。如果模型能預測出這個名字,它就必須從前文的線索中推斷出答案。但小說作者并不需要做這種推理,她可能先決定誰是兇手,然后編織一個自圓其說的故事。因此,預測模型被迫學習的推理能力,可能根本不存在于數據的生成過程中。


      圖丨通過上褶度研究歸納(來源:arXiv)

      關于涌現,康威生命游戲提供了一個很好的說明。游戲規則可以用幾十個字節描述,一個計算能力無限的觀察者只需逐步執行規則就能完美預測。

      但計算受限的觀察者無力進行這種暴力模擬,必須學習識別和追蹤涌現結構,比如滑翔機的運動軌跡、不同“物種”的碰撞規則等,才能做出有效預測。這種被迫習得的高層抽象,正是上褶度試圖捕捉的東西。

      論文中的一個實驗顯示,當計算預算足夠大以至于模型可以“循環展開”(類似于思維鏈推理)來模擬游戲規則時,上褶度反而會驟降,因為此時簡單的暴力解法變得可行,復雜的涌現知識不再必要。

      不過要注意的是,上褶度是一個理論上定義清晰、但實踐中只能近似估計的量。論文承認,由于只能在有限的超參數空間中搜索,估計值可能與真實值存在系統性偏差。此外,高上褶度并不保證在特定下游任務上表現更好,它度量的是結構性信息的總量,而非與特定任務的相關性。一個模型可能學到了大量結構,但這些結構未必對你關心的任務有用。

      但總體而言,這篇論文代表了機器學習理論的一個轉向:從關注模型選擇轉向關注數據選擇。經典學習理論將訓練分布視為給定,優化目標放在模型架構和正則化上。但在預訓練時代,模型架構趨于同質化,數據質量和組成反而成為決定性因素。上褶度提供了一個不依賴于特定下游任務的數據價值度量,這對于合成數據生成、數據配比優化、課程學習等方向都有潛在的指導意義。

      香農信息論誕生于通信時代,其核心關切是信息的表征和傳輸,計算過程被抽象掉了。但學習,無論是生物的還是人工的,本質上是計算過程。什么能被學到,取決于可用的計算資源。上褶度的提出,是朝著將計算約束納入信息論框架的一次認真嘗試。它未必是最終答案,但它提出了正確的問題。

      參考資料:

      1.https://arxiv.org/pdf/2601.03220

      2.https://x.com/m_finzi/status/2008934727156453661

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      每月雷打不動3000+,定投紅利基金十年,我終結“死工資”的命運

      每月雷打不動3000+,定投紅利基金十年,我終結“死工資”的命運

      真實人物采訪
      2026-01-20 21:40:02
      女生遛狗被打后續:完整視頻曝光,打人者正臉被扒,鄰居透露更多

      女生遛狗被打后續:完整視頻曝光,打人者正臉被扒,鄰居透露更多

      徐徐道史
      2026-01-21 16:10:33
      中國駐日武官王慶簡:大校軍銜,每天定時開窗向日本傳遞絕密情報

      中國駐日武官王慶簡:大校軍銜,每天定時開窗向日本傳遞絕密情報

      萬年歷史老號
      2026-01-20 05:40:03
      國資委公布7戶中央企業14名領導人員職務任免

      國資委公布7戶中央企業14名領導人員職務任免

      界面新聞
      2026-01-21 19:45:28
      “陳真”梁小龍死因公布!這種病最近高發,被稱為心臟疾病“最后的戰場”,5年內病死率高達42.3%

      “陳真”梁小龍死因公布!這種病最近高發,被稱為心臟疾病“最后的戰場”,5年內病死率高達42.3%

      都市快報橙柿互動
      2026-01-21 18:06:09
      美國財長:中國無法繼續獲得委內瑞拉石油

      美國財長:中國無法繼續獲得委內瑞拉石油

      俄羅斯衛星通訊社
      2026-01-21 15:07:54
      老泄殘精,人窮壽盡!醫生提醒:50歲之后,男性要守好這4道關

      老泄殘精,人窮壽盡!醫生提醒:50歲之后,男性要守好這4道關

      醫學原創故事會
      2026-01-20 23:06:20
      撕破臉!被特朗普威脅后,馬克龍硬剛美國,轉身給中國發邀請函

      撕破臉!被特朗普威脅后,馬克龍硬剛美國,轉身給中國發邀請函

      淡淡稻花香s
      2026-01-22 03:52:51
      西班牙兩列高鐵撞了...道是新的,車是新的,莫名出問題!專家:蹊蹺...

      西班牙兩列高鐵撞了...道是新的,車是新的,莫名出問題!專家:蹊蹺...

      英國那些事兒
      2026-01-20 23:34:46
      “不敢想在國外玩得有多野”,看完牢A后,網友難以直視留學母女

      “不敢想在國外玩得有多野”,看完牢A后,網友難以直視留學母女

      樂悠悠娛樂
      2026-01-21 10:33:27
      下崗前我在庫房發現4米長的蛇皮,我提醒廠長:蛇蛻皮后兇性最大

      下崗前我在庫房發現4米長的蛇皮,我提醒廠長:蛇蛻皮后兇性最大

      罪案洞察者
      2026-01-20 14:06:19
      美股漲幅迅速擴大 三大指數均漲超1%

      美股漲幅迅速擴大 三大指數均漲超1%

      財聯社
      2026-01-22 03:34:15
      失業的人越來越多了

      失業的人越來越多了

      曹多魚的財經世界
      2025-12-24 14:56:20
      張藝興是細狗!演唱會脫光上衣縮成一團,白得發亮的他明顯不夠自信

      張藝興是細狗!演唱會脫光上衣縮成一團,白得發亮的他明顯不夠自信

      八卦王者
      2026-01-21 15:58:16
      故事:02年南京軍區警衛排長遭毆打,司令員親率精銳拔除黑惡毒瘤

      故事:02年南京軍區警衛排長遭毆打,司令員親率精銳拔除黑惡毒瘤

      甜心泡泡
      2025-04-07 15:24:48
      西蒙尼:主動權不在我們手上;全隊都要提高把握機會的能力

      西蒙尼:主動權不在我們手上;全隊都要提高把握機會的能力

      懂球帝
      2026-01-22 06:14:05
      10頭身女神!超模身材,確實無敵了

      10頭身女神!超模身材,確實無敵了

      碧波萬覽
      2026-01-22 00:24:39
      經紀人含淚回應梁小龍去世原因:還原真相,守護逝者尊嚴

      經紀人含淚回應梁小龍去世原因:還原真相,守護逝者尊嚴

      風月得自難尋
      2026-01-22 05:49:17
      截胡!阿森納必須贏下 8700 萬巨星爭奪戰,奧恩斯坦實錘有戲!

      截胡!阿森納必須贏下 8700 萬巨星爭奪戰,奧恩斯坦實錘有戲!

      瀾歸序
      2026-01-22 05:22:36
      韓瑩老公曝孫穎莎與邱貽可正在研究王曼昱:這不是什么秘密!

      韓瑩老公曝孫穎莎與邱貽可正在研究王曼昱:這不是什么秘密!

      十點街球體育
      2026-01-22 01:05:03
      2026-01-22 06:31:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16159文章數 514517關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      家居
      健康
      本地
      數碼
      時尚

      家居要聞

      褪去浮華 觸達松弛與欣喜

      打工人年終總結!健康通關=贏麻了

      本地新聞

      云游遼寧|漫步千年小城晨昏,“康”復好心情

      數碼要聞

      追覓科技成為央視春晚智能科技生態戰略合作伙伴

      締造仙女夢的人,去了天堂繼續縫制星光?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人精品aaaa视频一区| 久久夜色国产噜噜亚洲av| 好紧好湿好黄的视频| 精品制服丝袜亚洲专区| 久久精人人妻一区二区三区| 亚洲少妇人妻无码视频| 精品国产av色欲果冻传媒| 91视频在线看| 国产精品播放| 人妻在线日韩免费视频| 海安县| 被灌满精子的波多野结衣| 内射网址| 亚洲成人精品无码| 国产av一区二区三区| 亚洲人成电影网站图片| 老司机性色福利精品视频| 白嫩人妻精品一二三四区| 国产欧美精品一区二区三区-老狼| 亚洲精品天天影视综合网| 国产乱国产乱老熟300部视频 | 色午夜| 尼木县| 欧美性群另类交| 天天成人综合网| 青青草无码免费一二三区| 亚洲精品国产av一区二区| 另类 专区 欧美 制服| 仙女白丝jk小脚夹得我好爽| 高潮添下面视频免费看| 久久永久免费人妻精品| 日韩丰满少妇无码内射| 亚韩精品中文字幕无码视频| 无码人妻视频一区二区三区| 毛片自拍| а天堂中文最新一区二区三区| 91精品国产情侣高潮露脸| 精品毛片日| 伊人69| 亚洲精品成人久久久| 无码一级视频在线|