<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      三星 TRM 論文:少即是多,用遞歸替代深度,挑戰 Transformer 范式

      0
      分享至


      大數據文摘整理

      三星SAIL蒙特利爾實驗室的研究人員近日發布論文《Less is More: Recursive Reasoning with Tiny Networks》,提出一種名為Tiny Recursive Model(TRM)的新型遞歸推理架構。


      這項研究顯示,在推理任務上,小網絡也能戰勝大型語言模型

      TRM僅使用700萬參數、兩層神經網絡,就在多項高難度任務中超過了 DeepSeek R1、Gemini 2.5 Pro、O3-mini 等模型。

      在架構上,TRM也放棄了自注意力層(僅限 TRM-MLP 變體;TRM-Att 仍含自注意力。)。論文表明,對于小規模固定輸入任務,MLP反而能減少過擬合。另外,當上下文長度較短時,注意力機制反而是一種浪費。TRM 在某些任務(例如 Sudoku、Maze-Hard 等)中, 使用純 MLP 結構優于 Transformer-based 模型。


      圖注: Tiny Recursive Model(TRM)通過不斷在“答案 y和“潛在思考變量 z 之間遞歸更新,實現小參數模型的多輪自我修正推理。

      傳統大模型依賴鏈式思維(Chain-of-Thought)生成推理步驟,但這種方法成本高、容易累積錯誤。

      TRM 則通過遞歸地更新“答案”和“潛在思考變量”,讓模型在多輪自我修正中逼近正確結果。

      論文總結:“TRM以極小的規模實現了前所未有的泛化能力。”在ARC-AGI推理基準上,TRM獲得45%(ARC-AGI-1)8%(ARC-AGI-2)的準確率,高于多數大型模型。在Sudoku-Extreme任務上,它的準確率更是達到87.4%,刷新紀錄。

      研究團隊稱,這種結構的核心邏輯是“遞歸即深度”:深度遞歸可替代增加層數,模型不需更多層數,只需反復思考。

      推理機制重構:少即是多

      TRM的設計源自對上一代Hierarchical Reasoning Model(HRM)的反思。


      HRM模型在兩種不同頻率下遞歸更新潛變量與的過程,通過先無梯度、后帶梯度的雙階段循環,實現高低頻遞歸推理的結合。

      HRM 使用兩個網絡在不同“頻率層次”上遞歸運算,模仿人腦的多層推理結構。
      然而,其訓練過程復雜,依賴固定點理論(Fixed-Point Theorem)和生物學假設。

      TRM徹底放棄這些理論假設。

      研究者發現,單一網絡加深度監督(Deep Supervision)即可實現相同甚至更好的推理效果。

      模型通過多次前向遞歸更新內部潛變量z與當前答案y,讓推理鏈條在每一步收斂得更準。

      與HRM相比,TRM的參數量減少參數縮減約74%,單步前向次數減半,同時提升準確率。

      論文數據顯示:在Maze-Hard數據集上,TRM測試準確率為85.3%,高出HRM 10個百分點。

      TRM還取消了傳統的“繼續計算”機制(Adaptive Computational Time, ACT)中第二次前向傳播。

      研究者改用一個簡單的二元判斷來決定是否停止推理。

      結果顯示,模型訓練速度顯著提升,準確率幾乎不變。

      在架構上,TRM也放棄了自注意力層。對于小規模固定輸入任務(如數獨),使用多層感知機(MLP)反而能減少過擬合。

      論文指出,“當上下文長度較短時,注意力機制反而是一種浪費。”這一發現挑戰了AI界“模型越大越強”的經驗法則。減少層數、加深遞歸,是讓模型學會‘思考’的關鍵。


      結果與啟示:推理的新尺度

      實驗結果表明,TRM不僅在性能上反超HRM,更在泛化能力與效率比上建立了新標準。


      在Sudoku-Extreme上,它以5M參數實現87.4%準確率;


      在Maze-Hard任務上,以7M參數實現85.3%;


      在ARC-AGI系列測試中,表現超過Gemini 2.5 Pro與DeepSeek R1等大模型。

      研究團隊將這一成果概括為:“以遞歸取代規模,以思考取代堆疊。

      論文分析認為,大模型在生成式推理中往往容易被一次性錯誤放大,而TRM通過循環式的自我修正,將推理劃分為多個小步,顯著降低誤差傳播。

      這種結構在小樣本條件下尤為有效。

      作者還發現,兩層網絡的泛化能力優于更深模型。當層數增加到四層或以上時,性能反而下降,原因在于過擬合。

      團隊引入指數移動平均(EMA)以穩定訓練,使模型在小數據集上保持一致收斂。

      研究指出,這種方法提供了一條新的“輕量AI推理路線”:當算力與數據受限時,小模型通過遞歸學習仍可實現復雜思維行為。

      這為未來的邊緣AI與低資源應用提供了方向。智能的深度,不一定來自規模,而可能來自重復思考。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      老金怒斥瑤家:孩子撫養權絕不放手,金家后繼有人,孫子永遠姓金

      老金怒斥瑤家:孩子撫養權絕不放手,金家后繼有人,孫子永遠姓金

      愛下廚的阿釃
      2026-04-26 14:13:45
      Z世代抗議一年:推翻了政府,然后呢?

      Z世代抗議一年:推翻了政府,然后呢?

      晚風也遺憾
      2026-04-23 14:51:44
      所有長久的關系,本質是互相報恩

      所有長久的關系,本質是互相報恩

      洞見
      2026-04-25 10:26:12
      “早知這么危險就不當總統了”,特朗普撤離時摔倒,其回應為何總被暗殺!槍手系教師兼游戲開發者,作案目標是誰?嫌疑人供認:美官員

      “早知這么危險就不當總統了”,特朗普撤離時摔倒,其回應為何總被暗殺!槍手系教師兼游戲開發者,作案目標是誰?嫌疑人供認:美官員

      魯中晨報
      2026-04-26 15:16:07
      中國第四艘航母官宣!人民海軍用兩字通告全球,首艘核航母要來了

      中國第四艘航母官宣!人民海軍用兩字通告全球,首艘核航母要來了

      說歷史的老牢
      2026-04-25 11:39:39
      賈國龍天邊燜面才兩個月,評分已暴跌3.8分!網友直言:注意避坑

      賈國龍天邊燜面才兩個月,評分已暴跌3.8分!網友直言:注意避坑

      冷紫葉
      2026-04-25 14:33:10
      原來陳思誠父親是他,名下多家公司實力雄厚,祖孫三代共用一張臉

      原來陳思誠父親是他,名下多家公司實力雄厚,祖孫三代共用一張臉

      洲洲影視娛評
      2026-04-25 17:10:00
      黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

      黃一鳴回應:沒結婚一天找8個男的也沒關系 承認跟40歲大叔交往過

      法老不說教
      2026-04-25 14:34:56
      住了33年的房屋要被強拆還地,臺灣婦人叫囂:我是大日本帝國臣民

      住了33年的房屋要被強拆還地,臺灣婦人叫囂:我是大日本帝國臣民

      金牛傳聲
      2026-04-19 12:27:48
      1946年四平之戰林彪大敗,一路退至松花江,戰后為何說陳毅救了他

      1946年四平之戰林彪大敗,一路退至松花江,戰后為何說陳毅救了他

      談古論今歷史有道
      2026-04-26 15:10:03
      長白山驚現“藏寶洞”,專家估值達萬億,日本得知后要求中國歸還

      長白山驚現“藏寶洞”,專家估值達萬億,日本得知后要求中國歸還

      抽象派大師
      2026-04-20 01:30:41
      8歲考出760高分,智商230碾壓愛因斯坦,天才陶哲軒如今現狀如何

      8歲考出760高分,智商230碾壓愛因斯坦,天才陶哲軒如今現狀如何

      大魚簡科
      2026-04-22 17:11:04
      動力電池下半場,瑞浦蘭鈞如何押注場景、平臺、全球化

      動力電池下半場,瑞浦蘭鈞如何押注場景、平臺、全球化

      芯流智庫
      2026-04-26 11:10:21
      難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

      難怪民進黨氣得跳腳也不敢抓鄭麗文,她背后的保護傘,讓綠營絕望

      觀星賞月
      2026-04-25 17:56:35
      過去30年,我國三次韜光養晦裝孫子,與美國較量,差一點收復臺灣

      過去30年,我國三次韜光養晦裝孫子,與美國較量,差一點收復臺灣

      富強巨靠譜
      2025-03-13 09:21:41
      孫楊:張豆豆每天都在埋怨,一個勁數落自己

      孫楊:張豆豆每天都在埋怨,一個勁數落自己

      現代快報
      2026-04-24 22:38:03
      越南一渣男用私密視頻要挾前女友:強迫她與9個陌生男人發生關系,自己收錢

      越南一渣男用私密視頻要挾前女友:強迫她與9個陌生男人發生關系,自己收錢

      緬甸中文網
      2026-04-26 13:19:20
      男女之間,感情是幌子,性是需求,錢是底線

      男女之間,感情是幌子,性是需求,錢是底線

      加油丁小文
      2026-04-26 14:00:07
      48歲羽協主席被查,何濟霆如愿,劉李平安

      48歲羽協主席被查,何濟霆如愿,劉李平安

      最美的巧合
      2026-04-25 17:18:56
      黑八要來了?60勝徒有虛名,當家球星場均31+8燃盡,身邊卻無幫手

      黑八要來了?60勝徒有虛名,當家球星場均31+8燃盡,身邊卻無幫手

      你的籃球頻道
      2026-04-26 07:41:05
      2026-04-26 15:47:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6853文章數 94542關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      伊朗拒見美代表轉赴阿曼 特朗普怒撤行程

      頭條要聞

      伊朗拒見美代表轉赴阿曼 特朗普怒撤行程

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      《八千里路云和月》大結局意難平

      財經要聞

      DeepSeek V4背后,梁文鋒的轉身

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      藝術
      健康
      教育
      時尚
      手機

      藝術要聞

      鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

      干細胞如何讓燒燙傷皮膚"再生"?

      教育要聞

      麻省理工公開課19:吉爾伯特教授線性代數課-

      IU的臉,真的有自己的時間線

      手機要聞

      W16周:華為無敵手,蘋果持續第二,OPPO變第三

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 天美传媒一区二区| 亚洲成av人片高潮喷水| 久久久久无码精品国产| 敦化市| 高清国产精品人妻一区二区| 免费jizz| 欧美日韩视频无码一区二区三| 国产a网站| 精品伊人久久久大香线蕉欧美| 国产真实乱人偷精品人妻| 91网在线| 国产第一页屁屁影院| 丁香激情网| 亚洲日韩成人精品| 久久精品午夜视频| 最新国产麻豆AⅤ精品无码| 中国无码人妻丰满熟妇啪啪软件| 尤物193在线人妻精品免费| 成人视频在线观看| 91精品导航| 成人在线亚洲| 51精品国自产在线| 在线无码国产精品亚洲а∨| 天天做天天爱夜夜爽女人爽| 一本加勒比hezyo无码人妻| 在线 | 一区二区三区| 小13箩利洗澡无码免费视频| 影音先锋在线资源无码| 蜜臀99| 日本久久久久久久做爰片日本| A片黄色| 一本色道加勒比久久综合| 少妇精品视频| 偷拍亚洲一区二区三区| 少妇被粗大的猛烈进出69影院一| 久久亚洲国产精品久久| 亚洲高清中文字幕在线看不卡| 日本高清视频网站www| 国产又大又硬又粗| 天天碰天天狠天天透澡| 大伊香蕉精品一区视频在线|