<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      三星 TRM 論文:少即是多,用遞歸替代深度,挑戰 Transformer 范式

      0
      分享至


      大數據文摘整理

      三星SAIL蒙特利爾實驗室的研究人員近日發布論文《Less is More: Recursive Reasoning with Tiny Networks》,提出一種名為Tiny Recursive Model(TRM)的新型遞歸推理架構。


      這項研究顯示,在推理任務上,小網絡也能戰勝大型語言模型

      TRM僅使用700萬參數、兩層神經網絡,就在多項高難度任務中超過了 DeepSeek R1、Gemini 2.5 Pro、O3-mini 等模型。

      在架構上,TRM也放棄了自注意力層(僅限 TRM-MLP 變體;TRM-Att 仍含自注意力。)。論文表明,對于小規模固定輸入任務,MLP反而能減少過擬合。另外,當上下文長度較短時,注意力機制反而是一種浪費。TRM 在某些任務(例如 Sudoku、Maze-Hard 等)中, 使用純 MLP 結構優于 Transformer-based 模型。


      圖注: Tiny Recursive Model(TRM)通過不斷在“答案 y和“潛在思考變量 z 之間遞歸更新,實現小參數模型的多輪自我修正推理。

      傳統大模型依賴鏈式思維(Chain-of-Thought)生成推理步驟,但這種方法成本高、容易累積錯誤。

      TRM 則通過遞歸地更新“答案”和“潛在思考變量”,讓模型在多輪自我修正中逼近正確結果。

      論文總結:“TRM以極小的規模實現了前所未有的泛化能力。”在ARC-AGI推理基準上,TRM獲得45%(ARC-AGI-1)8%(ARC-AGI-2)的準確率,高于多數大型模型。在Sudoku-Extreme任務上,它的準確率更是達到87.4%,刷新紀錄。

      研究團隊稱,這種結構的核心邏輯是“遞歸即深度”:深度遞歸可替代增加層數,模型不需更多層數,只需反復思考。

      推理機制重構:少即是多

      TRM的設計源自對上一代Hierarchical Reasoning Model(HRM)的反思。


      HRM模型在兩種不同頻率下遞歸更新潛變量與的過程,通過先無梯度、后帶梯度的雙階段循環,實現高低頻遞歸推理的結合。

      HRM 使用兩個網絡在不同“頻率層次”上遞歸運算,模仿人腦的多層推理結構。
      然而,其訓練過程復雜,依賴固定點理論(Fixed-Point Theorem)和生物學假設。

      TRM徹底放棄這些理論假設。

      研究者發現,單一網絡加深度監督(Deep Supervision)即可實現相同甚至更好的推理效果。

      模型通過多次前向遞歸更新內部潛變量z與當前答案y,讓推理鏈條在每一步收斂得更準。

      與HRM相比,TRM的參數量減少參數縮減約74%,單步前向次數減半,同時提升準確率。

      論文數據顯示:在Maze-Hard數據集上,TRM測試準確率為85.3%,高出HRM 10個百分點。

      TRM還取消了傳統的“繼續計算”機制(Adaptive Computational Time, ACT)中第二次前向傳播。

      研究者改用一個簡單的二元判斷來決定是否停止推理。

      結果顯示,模型訓練速度顯著提升,準確率幾乎不變。

      在架構上,TRM也放棄了自注意力層。對于小規模固定輸入任務(如數獨),使用多層感知機(MLP)反而能減少過擬合。

      論文指出,“當上下文長度較短時,注意力機制反而是一種浪費。”這一發現挑戰了AI界“模型越大越強”的經驗法則。減少層數、加深遞歸,是讓模型學會‘思考’的關鍵。


      結果與啟示:推理的新尺度

      實驗結果表明,TRM不僅在性能上反超HRM,更在泛化能力與效率比上建立了新標準。


      在Sudoku-Extreme上,它以5M參數實現87.4%準確率;


      在Maze-Hard任務上,以7M參數實現85.3%;


      在ARC-AGI系列測試中,表現超過Gemini 2.5 Pro與DeepSeek R1等大模型。

      研究團隊將這一成果概括為:“以遞歸取代規模,以思考取代堆疊。

      論文分析認為,大模型在生成式推理中往往容易被一次性錯誤放大,而TRM通過循環式的自我修正,將推理劃分為多個小步,顯著降低誤差傳播。

      這種結構在小樣本條件下尤為有效。

      作者還發現,兩層網絡的泛化能力優于更深模型。當層數增加到四層或以上時,性能反而下降,原因在于過擬合。

      團隊引入指數移動平均(EMA)以穩定訓練,使模型在小數據集上保持一致收斂。

      研究指出,這種方法提供了一條新的“輕量AI推理路線”:當算力與數據受限時,小模型通過遞歸學習仍可實現復雜思維行為。

      這為未來的邊緣AI與低資源應用提供了方向。智能的深度,不一定來自規模,而可能來自重復思考。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      房產證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

      房產證上的人去世了,繼承別再花大幾千的公證費,80塊錢就能搞定

      室內設計師有料兒
      2025-12-07 16:05:28
      關鍵時刻,中國伙伴倒戈,連投357票反華,中方已做最壞打算

      關鍵時刻,中國伙伴倒戈,連投357票反華,中方已做最壞打算

      軍機Talk
      2025-12-13 10:14:13
      這絕對是劉德華最舍不得刪掉的一張照片。

      這絕對是劉德華最舍不得刪掉的一張照片。

      小椰的奶奶
      2025-12-14 01:23:18
      炸裂!40+14+11!北京隊三巨頭正式合體

      炸裂!40+14+11!北京隊三巨頭正式合體

      籃球實戰寶典
      2025-12-13 22:05:56
      中興通訊跌慘!摩爾線程爆雷,特變電工、賽微電子卻狂飆

      中興通訊跌慘!摩爾線程爆雷,特變電工、賽微電子卻狂飆

      風風順
      2025-12-14 02:00:03
      誤食半夏的荒野選手“熊二”喉嚨至今不舒服,稱體重下降約50斤,以后將做網絡直播,想找一個溫柔的女朋友

      誤食半夏的荒野選手“熊二”喉嚨至今不舒服,稱體重下降約50斤,以后將做網絡直播,想找一個溫柔的女朋友

      極目新聞
      2025-12-13 13:23:51
      轟24+16+14!威少再創神跡,你再這么超神下去,快船就要后悔了

      轟24+16+14!威少再創神跡,你再這么超神下去,快船就要后悔了

      巴叔GO聊體育
      2025-12-13 16:47:59
      馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

      馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

      豐譚筆錄
      2025-12-12 11:16:23
      貴州女老師趙慶梅被判死刑,全班22名男生受害,僅2人幸免

      貴州女老師趙慶梅被判死刑,全班22名男生受害,僅2人幸免

      瑾瑜聊情感
      2025-08-27 13:12:29
      表決落敗后,韓國瑜拒絕與賴見面!鄭麗文說到做到,拋出重磅!

      表決落敗后,韓國瑜拒絕與賴見面!鄭麗文說到做到,拋出重磅!

      李博世財經
      2025-12-13 14:05:03
      高市政權下的日本,西方媒體終于察覺到不對勁了……

      高市政權下的日本,西方媒體終于察覺到不對勁了……

      環球時報國際
      2025-12-12 23:56:09
      浙經貿的三分鐘戰士大二弟弟火了

      浙經貿的三分鐘戰士大二弟弟火了

      杭城村叔
      2025-09-11 12:54:47
      騙走 80 后眼淚的神片:《媽媽再愛我一次》,中年再看全是PUA

      騙走 80 后眼淚的神片:《媽媽再愛我一次》,中年再看全是PUA

      白羽居士
      2025-12-09 18:38:18
      一支99元!水銀體溫計禁產前夕:線上價格飆升,線下庫存告急

      一支99元!水銀體溫計禁產前夕:線上價格飆升,線下庫存告急

      上游新聞
      2025-12-13 17:24:11
      交警提醒:年檢又出新變化了?6~15年以內的車主需要注意了!

      交警提醒:年檢又出新變化了?6~15年以內的車主需要注意了!

      老特有話說
      2025-12-12 17:44:14
      一場3-2讓榜首易主,歐洲豪強登頂,恩里克創造隊史神紀錄

      一場3-2讓榜首易主,歐洲豪強登頂,恩里克創造隊史神紀錄

      足球狗說
      2025-12-14 06:27:06
      內線巔峰對決!奧尼爾如何防守約基奇和文班?大鯊魚本人詳解策略

      內線巔峰對決!奧尼爾如何防守約基奇和文班?大鯊魚本人詳解策略

      羅說NBA
      2025-12-14 06:45:48
      NBA杯半決賽:文班復出終結雷霆連勝,網友質疑馬刺前景

      NBA杯半決賽:文班復出終結雷霆連勝,網友質疑馬刺前景

      阿嚼影視評論
      2025-12-14 07:05:33
      魯山女教師新婚當天墜樓原因曝光:和父母對抗七年后她累了

      魯山女教師新婚當天墜樓原因曝光:和父母對抗七年后她累了

      映射生活的身影
      2025-12-13 23:29:04
      韓媒再曝猛料!被警方帶走的鳥叔再迎3大噩耗,公司經紀人全遭殃

      韓媒再曝猛料!被警方帶走的鳥叔再迎3大噩耗,公司經紀人全遭殃

      夢史
      2025-12-13 09:43:45
      2025-12-14 08:28:49
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6806文章數 94518關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動實現口碑逆轉

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      親子
      數碼
      健康
      時尚
      房產

      親子要聞

      七小七:用清潔配方重新定義兒童食品健康標準,獲雙品類銷量第一

      數碼要聞

      1399元 鐵威馬發布M.2硬盤盒:支持雷電5 6GB文件1秒傳

      甲狀腺結節到這個程度,該穿刺了!

      法式方頭靴的30種穿法,時髦不重樣!

      房產要聞

      中糧好房子體系盛大亮相三亞,禮獻海南自貿港封關

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲精品成人区在线观看| 国产成人女人在线观看| 99r免费视频| 无套内射蜜桃小视频| 成人精品无码成人亚洲| 国产日韩精品欧美一区灰| av无码av无码专区| 超碰w| 婷婷综合五月| 无码专区男人本色| 久久国产劲爆∧v内射| 国产乱子经典视频在线观看| 四虎影视久久久免费| 日韩无码2020| 色噜噜一区二区三区| 亚洲中文国产字幕| 国产综合久久久久鬼色| 国产深夜福利| 亚洲男人在线天堂| 大桥久未无码吹潮在线观看| 涪陵区| 亚欧女AV| 国产欧美另类久久久精品丝瓜| 亚洲人妻人| 99热精这里只有精品| 亚洲综合色丁香婷婷六月图片| 亚洲男人天堂av| 久久精品蜜芽亚洲国产av| 亚洲精平久| 国产jjizz女人多水喷水| 曰韩一级| 性无码专区无码| av午夜久久蜜桃传媒软件| 最新成免费人久久精品| 微山县| 亚洲av二区伊人久久| 好硬好湿好爽好深视频| 国产精品视频| 无码专区男人本色| 最新午夜男女福利片视频| 亚洲成人A∨|