<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<abbr id="pc5re"></abbr>

<ruby id="pc5re"><rp id="pc5re"></rp></ruby>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

無預訓練模型拿下ARC-AGI榜三！Mamba作者用壓縮挑戰Scaling Law

2025-12-16 14:56:58　來源: 量子位

北京舉報

0

分享至

henry 發自凹非寺
量子位 | 公眾號 QbitAI

壓縮即智能，又有新進展！

在最新研究CompressARC中，Mamba作者Albert Gu團隊給出了一個不同于大規模預訓練的智能配方——

最小描述長度（MDL）

研究顯示，僅通過在推理階段最小化目標謎題的描述長度，一個76K參數，完全沒有經過預訓練的模型，就能在ARC-AGI-1基準上解決20%的問題。

值得一提的是，CompressARC不僅沒使用ARC-AGI的訓練集，還是目前唯一一個只在單個樣本上運行的深度學習方法。

憑借這一突破，CompressARC獲得了ARC Prize 2025的第三名，并且據論文一作Isaac Liao透露，這項研究僅使用了一張GPU就得以完成。

這是怎么做到的？

新的智能recipe：最小描述長度

如上所說，CompressARC一沒利用訓練集、二不進行預訓練，且網絡中僅有76K參數，但它仍能泛化并解決20%的評估謎題和34.75%的訓練謎題。

這種不靠預訓練獲取智能的關鍵在于，CompressARC的最終目標不是像普通神經網絡那樣學習一個泛化的規則，而是把一個特定的ARC-AGI謎題用一個最短的計算機程序表達出來。

換句話說，CompressARC并不是像監督學習一樣，學習一個x到y的映射，而是尋找一種能用最少比特信息來表述給定謎題的方法。

這一思想源自最小描述長度（MDL）理論（以及與其相關的Solomonoff歸納法和Kolmogorov復雜度理論）——一個現象（謎題）的最短描述（程序）往往能揭示其最深層的規律。

在ARC-AGI的情境中，CompressARC旨在將一個特定的ARC-AGI謎題（包括其輸入和期望的輸出）用一個最短的計算機程序來表達出來。

這個最短的程序意味著它找到了最簡潔、最本質的規則，而這些規則恰好就是謎題的解。

與此同時，研究還遵循奧卡姆剃刀原理，即最短的程序被假設具有最強大的泛化能力

因此，CompressARC僅使用謎題本身（兩個示例輸入/輸出對和測試輸入），而不加載任何額外的附加數據或訓練集。

接下來，我們具體來看。

CompressARC挑戰的ARC-AGI-1是一個檢驗系統能否在少量示例中找到規則的測試。

簡單來說，這有點像行測考試里的找規律題，每道題目會給出幾對輸入-輸出作為示例，模型需要找到謎題中的規則，從而生成正確的、對應的網格。

CompressARC 的“壓縮”過程，就是找到圖里最本質的信息/規則

目前，在該測試中取得最好成績的仍是基于互聯網數據預訓練的大語言模型。

比如o3能達到88%的成績，但o1則只有25%左右。

而在不進行預訓練、僅使用ARC-AGI 數據訓練的神經網絡中，最高成績為40.3%，CompressARC這次只在測試謎題本身上進行訓練。

總的來說，CompressARC解決問題的過程，是一個最小化目標謎題的程序性描述長度（Minimum Description Length, MDL）的過程，這可看作是用神經網絡來“寫”最短的程序。

MDL 框架與搜索空間的轉換

首先，由于計算機程序的組合搜索空間過于龐大，無法窮盡所有可能的程序來找到絕對最短的那一個（計算上不可行）。

因此，論文設計了一個固定的“程序模板”（Template Program / Algorithm 1）。

這個模板包含一套固定的運算流程：從隨機噪聲z采樣，經過一個神經網絡，再次采樣生成謎題顏色。

這些模板中留下了幾個“空位”，用于填入硬編碼的數值（即“種子”）以及神經網絡的權重。

只要填入了這些種子和權重，這個模板程序就能運行，并“打印”出整個 ARC-AGI 數據集。

由此，尋找最短程序的問題，就轉化成了尋找最短的種子和權重的問題。

接下來，研究借鑒了變分自編碼器（VAE）的原理，將程序長度的最小化轉化為一個可微分的優化問題：

種子長度 1 (KL 散度)：衡量了從標準正態分布中采樣隨機輸入z所需的編碼信息成本。通過最小化z分布與標準正態分布的KL散度，實現了對z所攜帶信息量的懲罰，迫使網絡以最短的比特數來編碼z。
種子長度 2 (交叉熵/重構損失)：衡量了神經網絡輸出的謎題與真實已知謎題的匹配程度（即負對數似然）。匹配得越好，說明該謎題被成功重構，所需的“額外校正信息”（即用于校正輸出結果的種子）就越少。

不過，原始的算法2需要進行復雜的相對熵編碼（REC），涉及指數級的計算，速度太慢。

因此，CompressARC通過算法3跳過了這些復雜步驟，直接用VAE中的損失函數（KL 散度和交叉熵）來近似種子的預期長度。

這把原本不可行的“尋找最短程序”的組合搜索問題，轉化成了一個可行的、可以用梯度下降（深度學習的標準優化方法）來求解的優化問題。

在架構方面，網絡的全部目標是：在沒有外部訓練數據的情況下，通過內置的強大歸納偏置（Inductive Biases），使得網絡本身就具有極高的概率能“生成”一個合理的 ARC-AGI 謎題，從而使所需的種子信息量降到最低。

這包含四個方面的處理：

等變性與對稱性處理：

架構內置了對ARC-AGI 謎題常見變換的等變性（Equivariance），包括旋轉、翻轉、顏色置換和示例順序置換。

這保證了網絡能夠默認賦予所有等價變換后的謎題相同的概率，避免了使用冗長代碼來描述這些對稱性，進一步縮短了程序長度。

數據結構：多張量（Multitensor）：

網絡內部并非使用一個單一的大張量，而是使用一個“張量桶”或多張量（Multitensor），其中包含形狀不同的張量，每個張量代表不同粒度的信息。

這種表示方式專門用于存儲高層次的關系信息，從而提供了更有效的歸納偏置，使網絡能夠更容易地進行抽象推理。

核心骨干：類 Transformer 結構：

架構在結構上類似于Transformer，采用一個殘差骨干（Residual Backbone），由線性投影（讀取/寫入）和專門設計的操作組成，并重復運行4次。

整個模型僅有76K參數。這是因為大部分參數僅用于通道維度的線性讀/寫投影，而核心操作本身是無參數的。

歸納偏置：無參數的自定義操作：

網絡的核心功能不是傳統的注意力機制，而是一系列針對謎題規則高度定制的、無參數的操作，這些操作直接體現了對ARC-AGI謎題規則的先驗知識：

信息匯總與傳播：沿著一個軸求和并將結果廣播回去，實現不同粒度信息的交互。
幾何操作：沿著幾何維度進行單像素平移（實現對象的移動/復制）。
拓撲/形狀操作：沿著幾何維度取累積最大值（Cumulative Max），有助于捕捉圖案的延伸、填充或邊界等拓撲屬性。

通過這種“高度工程化”的架構，CompressARC確保了其對謎題的描述性程序能夠被最大程度地壓縮，從而在無預訓練、數據極度受限的條件下，成功實現了對ARC-AGI謎題的泛化求解。

實驗驗證

為了評估CompressARC的性能，研究為CompressARC提供了2000個推理時訓練步驟來處理每個謎題，每個謎題大約花費20分鐘。

在這個推理時計算預算內，CompressARC 正確解決了20%的評估集謎題和34.75%的訓練集謎題。（如開頭所示）

總的來說，研究挑戰了智能必須源于大規模預訓練和數據的假設，其表明巧妙地運用MDL和壓縮原理可以帶來令人驚訝的能力。

CompressARC作為一個概念證明，旨在展示現代深度學習框架可以與MDL結合，從而創建一條通往通用人工智能（AGI）的可能的、互補的替代路徑。

One more thing

這篇論文的作者Isaac Liao目前是CMU機器學習系的在讀博士生，師從Albert Gu教授。

他本科與碩士階段均就讀于麻省理工學院（MIT），且本科期間便拿下了計算機科學與物理學雙學位。

他的研究興趣包括最小描述長度（Minimum Description Length, MDL）、變分推斷、超網絡（Hypernetworks）、元學習、優化方法以及稀疏性。

值得一提的是，這項研究中用到的核心基準測試ARC-AGI-1（Abstraction and Reasoning Corpus）由Google AI 研究員、深度學習庫Keras的創始人Fran?ois Chollet于2019年提出。

這一基準是為了應對當時深度學習方法在狹窄、專業任務上表現出色，但在展示類人泛化能力方面不足的現狀，旨在評估 AI 處理新穎、未曾明確訓練過的問題的能力，是衡量通用人工智能（AGI）能力的核心標尺。

它專門用于基準測試技能習得能力（智能的根本核心），而非在單一預定義任務上的性能。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

架構解耦是統一多模態模型所必須的嗎？全新AIA損失：No

機器之心Pro 2025-12-02 14:25:38
0 跟貼 0
中國版Sora2來了！阿里千問接入萬相2.6

經濟觀察報 2025-12-17 12:42:14
2 跟貼 2

QQ音樂你變了，竟能免費在AI PC上原創一首《大東北》

量子位 2025-12-16 20:05:26
0 跟貼 0

浙大聯手字節：開源大規模指令跟隨視頻編輯數據集OpenVE-3M

機器之心Pro 2025-12-17 14:39:20
0 跟貼 0
Nature重磅發文：深度學習x符號學習，是AGI唯一路徑！

新智元 2025-12-16 22:52:52
1 跟貼 1

公園回應永歷帝趴泥中雕塑引爭議

現代快報 2025-12-15 17:39:59
3723 跟貼 3723

泰軍在柬軍陣地繳獲中國制造的反坦克導彈外交部回應

環球網 2025-12-17 15:26:34
213 跟貼 213
頂尖技術+標準產品+創新模式+可靠服務，打造大模型落地中國范式

量子位 2025-12-16 10:18:46
0 跟貼 0

1100多個模型殊途同歸，指向一個通用子空間，柏拉圖又贏一回？

機器之心Pro 2025-12-15 10:26:02
2 跟貼 2
香港反對黨民主黨正式通過決議，決定解散并進入清算程序

玫瑰與花海 2025-12-15 11:28:17
0 跟貼 0
對話陳志杰：AI編程搶不了程序員的飯碗，我們是給廚子做飯的人

DeepTech深科技 2025-11-24 19:34:58
0 跟貼 0
Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0
Codeforces難題不夠刷？謝賽寧等造了AI出題機，能生成原創編程題

機器之心Pro 2025-10-20 14:17:05
0 跟貼 0
RL是「點金石」還是「挖掘機」？CMU 用可控實驗給出答案

機器之心Pro 2025-12-15 10:14:24
0 跟貼 0
ApdativeNN：建模類人自適應感知機制，突破機器視覺不可能三角

機器之心Pro 2025-11-28 17:15:19
0 跟貼 0
摩爾線程贏圖形頂會3DGS挑戰賽大獎，自研LiteGS全面開源

機器之心Pro 2025-12-17 14:16:00
0 跟貼 0
12306回應上線京滬夜班高鐵，網友稱之為“牛馬夜班專列”

上觀新聞 2025-12-16 19:47:06
589 跟貼 589
中日在安理會上三度交鋒日本代表手抖哆嗦閉眼發言

看看新聞Knews 2025-12-17 17:49:17
64 跟貼 64
Physical Intelligence發現人機遷移能力與預訓練多樣性正相關

DeepTech深科技 2025-12-17 13:18:32
0 跟貼 0
OpenAI大佬爆料：打字太慢拖后腿，人類竟成了AGI短板？

新智元 2025-12-17 18:05:21
0 跟貼 0
經驗記憶黑科技：LightSearcher讓AI工具調用減39.6%推理快48.6%

機器之心Pro 2025-12-17 14:49:43
0 跟貼 0
小米突發新模型，主打“極致性價比”，羅福莉：“這只是我們AGI圖線路上的第二步”

華爾街見聞官方 2025-12-17 10:52:23
1 跟貼 1
美銀：中國2026年GDP增長4.7% 一線城市房價率先回暖

財聯社 2025-12-16 20:10:05
768 跟貼 768
羅福莉首秀前，小米突然發布！代碼全球最強，總體媲美DeepSeek-V3.2【附實測】

智東西 2025-12-17 09:18:10
60 跟貼 60
沐曦股份漲超700% 總市值超越摩爾線程

財聯社 2025-12-17 10:26:04
784 跟貼 784
突發！OpenAI大神姚順雨，任騰訊首席AI科學家

新智元 2025-12-17 18:05:53
0 跟貼 0
獨家｜南京博物院館藏明代仇英《江南春》為何現身拍賣市場？

澎湃新聞 2025-12-17 08:16:28
818 跟貼 818
朱珠女兒長相遭議論，美貌基因傳承成謎題

娛樂大丸子湯 2025-12-14 09:58:18
1 跟貼 1
全球首款，成功試飛！

極目新聞 2025-12-16 21:27:34
98 跟貼 98
何晴與那些驚艷時光的內地女演員：無模板美的時代傳奇

莉莉和奶奶 2025-12-16 01:17:35
1 跟貼 1
國家發改委：推動清理汽車、住房等消費不合理限制性措施

新京報 2025-12-16 21:17:06
105 跟貼 105
做一輛坦克模型

制造科技 2025-12-16 11:17:18
0 跟貼 0
深度長文：人類和石頭都由原子構成，為何人類有思想而石頭沒有？

宇宙時空 2025-12-15 13:37:29
25 跟貼 25
高中數學求抽象函數解析式基礎題

天天數理學習分享 2025-12-16 11:03:39
3 跟貼 3
OpenAI反擊谷歌：ChatGPT圖像功能大升級敲打Photoshop“飯碗”

財聯社 2025-12-17 17:23:13
0 跟貼 0
魔獸：12月17日測試服藍貼！奧法和懲戒騎進行調整！

魔獸世界研究所 2025-12-17 16:17:12
0 跟貼 0
泰國宣布禁止向柬埔寨運輸石油及戰略物資

每日經濟新聞 2025-12-17 13:17:22
39 跟貼 39
最完美的中鋒模板，盤點范巴斯滕的八大超級進球！

足球印象CC 2025-12-17 16:00:44
31 跟貼 31
VGGT4D：無需訓練，挖掘3D基礎模型潛力，實現4D動態場景重建

機器之心Pro 2025-12-17 17:46:42
0 跟貼 0
12月16日山東泰安，司機加油445元后一腳油門逃單，加油員奮力拖住車門反而被拽跑，已報警，但由于

中安在線 2025-12-17 10:27:16
55 跟貼 55

中國“爛片王”又出新片，票房不到6萬，全是一星差評

中國“爛片王”又出新片，票房不到6萬，全是一星差評

影視高原說

2025-12-17 10:27:22

福建艦進入臺灣海峽！臺軍方下令：若遭遇突襲，無需命令即可作戰

福建艦進入臺灣海峽！臺軍方下令：若遭遇突襲，無需命令即可作戰

南宮一二

2025-12-17 16:34:57

為什么突然就涌出烏央烏央的“泰粉”？

為什么突然就涌出烏央烏央的“泰粉”？

細雨中的呼喊

2025-12-16 22:53:53

爆料廣東隊兩大混子球員被淘汰，杜鋒大動作，宣布重要決定

爆料廣東隊兩大混子球員被淘汰，杜鋒大動作，宣布重要決定

宗介說體育

2025-12-17 16:30:08

中央國家機關和地方2026年新聞發言人名錄公布

中央國家機關和地方2026年新聞發言人名錄公布

極目新聞

2025-12-16 21:50:43

格斗游戲那些下三濫的招式，動作設計師和男人有多大的仇

格斗游戲那些下三濫的招式，動作設計師和男人有多大的仇

街機時代

2025-12-16 18:00:03

活久見！真要開倒車了：手機、電腦的內存，明年會變小了

活久見！真要開倒車了：手機、電腦的內存，明年會變小了

互聯網.亂侃秀

2025-12-16 11:56:53

中央最近亮劍了，十五五規劃直接把“遮羞布”扯了下來。

中央最近亮劍了，十五五規劃直接把“遮羞布”扯了下來。

南權先生

2025-12-16 16:24:33

新加坡網友：新加坡是主權獨立的國家，最討厭叫我們“小中國”

新加坡網友：新加坡是主權獨立的國家，最討厭叫我們“小中國”

扶蘇聊歷史

2025-12-17 17:13:40

阿里嚴查午休

純潔的微笑

2025-12-17 12:27:20

演員李現潛水近距離遇鯊魚，直呼：哇，好刺激呀！

演員李現潛水近距離遇鯊魚，直呼：哇，好刺激呀！

現代快報

2025-12-17 18:28:13

明起迎來一波回溫，“急轉彎”在周末！下周浙江開啟陰冷模式

明起迎來一波回溫，“急轉彎”在周末！下周浙江開啟陰冷模式

浙江發布

2025-12-17 17:15:20

海南封關動了誰的奶酪？答案顯而易見：新加坡為代表的傳統中轉港

海南封關動了誰的奶酪？答案顯而易見：新加坡為代表的傳統中轉港

知法而形

2025-12-17 09:45:58

知名女星被曝收入1.39億元

深圳晚報

2025-12-17 10:23:19

中東誰也打不過的以色列，在東亞算什么水平？韓國：誰也打不過

中東誰也打不過的以色列，在東亞算什么水平？韓國：誰也打不過

比利

2025-11-29 18:49:51

反轉！曝許亞軍10年來出錢出力幫何晴，和小兒子去美國是拍戲！

反轉！曝許亞軍10年來出錢出力幫何晴，和小兒子去美國是拍戲！

古希臘掌管月桂的神

2025-12-17 10:05:58

河南美女“大晨”去世，年僅28歲，日常開奧迪，一口能喝三兩白酒

河南美女“大晨”去世，年僅28歲，日常開奧迪，一口能喝三兩白酒

寶哥精彩賽事

2025-12-16 08:40:55

這可能是2026年A股最大的利好！

這可能是2026年A股最大的利好！

小白讀財經

2025-12-17 16:40:51

灰絲：男人心中的神

疾跑的小蝸牛

2025-12-17 16:02:51

凈虧4000萬！西媒：利物浦愿以1.1億歐元將維爾茨賣給皇馬

凈虧4000萬！西媒：利物浦愿以1.1億歐元將維爾茨賣給皇馬

球事百科吖

2025-12-17 05:43:03

追蹤人工智能動態

11868文章數 176338關注度

往期回顧全部

科技要聞

特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

頭條要聞

高位截癱患者因腦機接口"再就業"：錢不多供兒讀大學

頭條要聞

高位截癱患者因腦機接口"再就業"：錢不多供兒讀大學

體育要聞

短短一年，從爭冠到0勝墊底...

娛樂要聞

狗仔曝熱播劇姐弟戀真談了？？？

財經要聞

重磅信號！收入分配制度或迎重大突破

汽車要聞

一車多動力+雙姿態長城歐拉5上市限時9.18萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

藝術

手機

數碼

公開課

本地新聞

云游安徽｜踏過戰壕與石板，讀一部活的淮北史

藝術要聞

毛主席書寫林則徐詩詞，字跡超凡，引發關注。

手機要聞

銷售遇冷，傳蘋果iPhone Air 2將升級雙攝并下調售價

數碼要聞

三星DRAM價格或暴漲超100% 你的下部手機電腦更貴了

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：久久久久高潮毛片免费全部播放| 黑人巨大精品| 亚洲综合无码AV| 末成年娇小性色xxxxx| 自拍性旺盛老熟女| 美女胸18下看禁止免费视频| 成人Av毛片| 天天干,天天插,天天射,天天| 亚洲自偷自拍熟女另类| 日韩av无码精品人妻系列| 亚洲中文字幕在线观看| 色达县| 国产成人精品日本亚洲| 日韩丰满少妇无吗视频激情内射| 国产美女久久久亚洲综合| 国产婬妇无码无遮挡A片在线观看| 成人网中文字幕| 67194熟妇人妻欧美日韩| 伊人久久大香线蕉网av| 色婷久久| 亚洲成人精品无码系列| 又大又长粗又爽又黄少妇视频| 日本国产精品第一页久久| 欧美狠狠撸| 老司机亚洲精品影院无码| 亚洲综合av色婷婷| 国产精品青草久久久久福利99| 人人干干| 人妻中文字幕网| 中文字幕av无码不卡免费| 日韩精品国产另类专区| 镇安县| 久久成人久久鬼色| 亚洲情综合五月天| 中文AV电影网| 亚洲国产精品美女久久久久| 中文www新版资源在线| 国产粗大| 巴彦县| 国内精品卡一卡二卡三| 新巴尔虎右旗|

<p id="7rm1e"></p>

<sub id="7rm1e"></sub>

^{<blockquote id="7rm1e"></blockquote>}

<legend id="7rm1e"><track id="7rm1e"></track></legend>

<style id="7rm1e"></style>