<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Meta AI 推理新論文:模型記住套路,推理 token 砍半

      0
      分享至


      大數據文摘出品

      Meta 又一次在 AI 推理上“開了掛”。

      一份新論文顯示,Meta 的研究團隊找到一種讓大模型“用更少思維,想得更清楚”的辦法。

      這篇論文名為《Metacognitive Reuse: Turning Recurring LLM Reasoning Into Concise Behaviors》,發表于2025 年 9 月 17 日,來自Meta 團隊與普林斯頓大學、蒙特利爾大學聯合研究。


      作者包括Aniket Didolkar、Nicolas Ballas、Anirudh Goyal 與 Sanjeev Arora。

      論文地址: https://arxiv.org/abs/2509.13237

      論文提出一個新機制,讓大語言模型(LLM)能在每次推理后,總結自己重復用到的步驟,并把它們存為簡短指令,稱為“行為(Behavior)”。

      下一次遇到類似問題,模型不再重復推,而是直接調用這些“行為”。

      效果驚人。

      在數學推理任務上,Meta 團隊實測:模型在準確率不下降的前提下,推理所需的 token 數量最多減少 46%。

      也就是說,同樣一道題,模型少想一半,卻答得一樣準。

      研究團隊稱,這讓模型“學會記得自己怎么思考”,相當于給 LLM 裝上了“思維緩存”。

      思維有手冊:AI的“行為記憶術”


      “行為復用”(Metacognitive Reuse)框架

      Meta 把這個機制叫做“行為手冊(Behavior Handbook)”。

      當模型解決問題時,它會記錄下自己的整個推理過程。

      然后再回頭反思,分析哪些步驟是常見套路,比如“容斥原理”“有理化分母”“代入后先化簡”。

      模型會為這些套路起名、寫說明,變成一條條“行為指令”。

      這些指令被收進一本不斷擴充的手冊里。

      論文把這種機制稱為“元認知路徑(Metacognitive Pathway)”,意思是模型在“思考自己的思考”。

      舉個例子:當模型遇到一道擲骰子概率題,它可能調用behavior_total_outcomes(計算所有可能結果)和behavior_inclusion_exclusion(用容斥原理避免重復計數)。

      調用完就不再多說廢話,答案照出。

      所以,每個行為是一段壓縮的思維過程。它把原本要幾十步才能重建的推導,濃縮成一句話。

      論文展示了多個實驗結果。在MATH數據集上,行為調節推理(Behavior-conditioned Inference)讓模型的推理token平均減少近一半;在AIME–24/25高難數學題上,模型在低預算(2048–8192 tokens)下仍保持穩定精度。

      自我復盤,像人一樣“省思考”

      長期以來,大模型被詬病“啰嗦”:每解一道題,都要展開冗長的 chain-of-thought,把所有中間步驟重新鋪一遍。

      這不僅浪費 token,也拉低了模型吞吐量。Meta 讓模型自己反思,自己提煉,自己精簡。


      行為提取提示設計

      論文設計了三種模式:

      第一種,是“行為調節推理”(Behavior-conditioned Inference)。模型從手冊里調出相關行為提示,帶著它們去解題。
      結果:少寫46%的token,準確率不降反升。

      第二種,是“行為引導自我改進”(Behavior-guided Self-improvement)。模型用自己總結的行為來指導下次推理。
      結果:正確率比普通“自我批改”提升10%。

      第三種,是“行為調節監督微調”(Behavior-conditioned SFT)。Meta 研究者用帶有行為提示的推理數據去訓練學生模型。
      結果:學生模型學會推理,比傳統微調版本更聰明、更高效。

      實驗中,Meta 使用了R1-Llama-70B作為“元認知策略師”,并測試了Qwen3-32B、Llama-3.1-8B 等多個學生模型

      幾乎所有模型都出現了相同現象:推理token直線下滑,性能保持平穩。

      研究者把這一現象形容為:“模型從慢推導變成快反應。”它不再每次都重寫思維,而是像人一樣,學會了用經驗來省思考。

      注:頭圖AI生成

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?


      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      霸王餐女后續:賬號被扒連夜清空作品,知情人曝更多,早有目的

      霸王餐女后續:賬號被扒連夜清空作品,知情人曝更多,早有目的

      阿纂看事
      2025-12-13 09:24:46
      沒有得到任何報酬,朝鮮海外工兵部隊回國

      沒有得到任何報酬,朝鮮海外工兵部隊回國

      IN朝鮮
      2025-12-13 14:13:31
      太像了!87歲范曾和親兒子全家福公開,孩子與爸爸媽媽共一張臉…

      太像了!87歲范曾和親兒子全家福公開,孩子與爸爸媽媽共一張臉…

      火山詩話
      2025-12-14 05:49:12
      見證歷史,中國籃球出現最奇葩比賽,CBA徹底成了大笑話

      見證歷史,中國籃球出現最奇葩比賽,CBA徹底成了大笑話

      宗介說體育
      2025-12-13 15:46:24
      其實吧,大明跟你一點關系都沒有,尤其如果你不姓朱的話

      其實吧,大明跟你一點關系都沒有,尤其如果你不姓朱的話

      熊太行
      2025-12-12 00:08:15
      大刀斬鬼!東部戰區這次警告日本,用了一個極為罕見的稱呼

      大刀斬鬼!東部戰區這次警告日本,用了一個極為罕見的稱呼

      南宮一二
      2025-12-13 14:31:41
      松島輝空又給張本美和甩臉子了:采訪途中,“少爺”突然離席!

      松島輝空又給張本美和甩臉子了:采訪途中,“少爺”突然離席!

      十點街球體育
      2025-12-14 00:05:04
      上百萬支體溫計兩周搶空;西北唯一生產水銀體溫計老廠,投產55年后迎生存大考

      上百萬支體溫計兩周搶空;西北唯一生產水銀體溫計老廠,投產55年后迎生存大考

      大風新聞
      2025-12-13 20:44:05
      你辦綱絲節,我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      你辦綱絲節,我收徒弟!著名相聲演員楊議喜收愛徒 女人身份曝光

      社會日日鮮
      2025-12-13 06:36:53
      貪財又好色,德不配位!這3位老藝術家,“晚節不?!币稽c都不冤

      貪財又好色,德不配位!這3位老藝術家,“晚節不?!币稽c都不冤

      娛說瑜悅
      2025-12-13 19:07:32
      激活密鑰:TGFML-2MN8T-Y4QWQ-K7JD9-DYH26

      激活密鑰:TGFML-2MN8T-Y4QWQ-K7JD9-DYH26

      部落沖突打法錦集
      2025-12-12 21:31:07
      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      文史明鑒
      2025-12-12 21:08:17
      顛覆認知!決定你壽命的第一要素,根本不是運動,也不是飲食!

      顛覆認知!決定你壽命的第一要素,根本不是運動,也不是飲食!

      徐德文科學頻道
      2025-12-12 22:58:58
      上海地中海大叔與29歲女主播愛情,親密合照流出,共同買房引罵戰

      上海地中海大叔與29歲女主播愛情,親密合照流出,共同買房引罵戰

      老貓觀點
      2025-12-10 08:15:55
      張柏芝不再沉默!坦白三胎兒子生父身份,難怪謝霆鋒拒和王菲領證

      張柏芝不再沉默!坦白三胎兒子生父身份,難怪謝霆鋒拒和王菲領證

      查爾菲的筆記
      2025-12-13 18:47:41
      歐爾班:歐盟若動用俄被凍結資產將引發嚴重問題

      歐爾班:歐盟若動用俄被凍結資產將引發嚴重問題

      環球網資訊
      2025-12-14 07:00:04
      看明白了,2026年春節要“涼涼”?不是沒錢,而是累得不想再折騰

      看明白了,2026年春節要“涼涼”?不是沒錢,而是累得不想再折騰

      冷紫葉
      2025-12-13 15:01:11
      赴俄朝鮮工兵120天后回國,金正恩發表講話:自己每天都看戰報,現在終于放心了

      赴俄朝鮮工兵120天后回國,金正恩發表講話:自己每天都看戰報,現在終于放心了

      紅星新聞
      2025-12-13 19:10:10
      2-0!亞馬爾低迷,拉菲尼亞閃耀諾坎普,巴薩7連勝,甩開皇馬7分

      2-0!亞馬爾低迷,拉菲尼亞閃耀諾坎普,巴薩7連勝,甩開皇馬7分

      我的護球最獨特
      2025-12-14 03:28:06
      江蘇女孩喝多了讓人鉆了空子,男友提分手,她跪地求原諒

      江蘇女孩喝多了讓人鉆了空子,男友提分手,她跪地求原諒

      街聲巷聞
      2025-12-08 20:18:52
      2025-12-14 08:35:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6806文章數 94518關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      頭條要聞

      女子225個快遞"僅退款"被披露后又有商家發聲:也是她

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動實現口碑逆轉

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      教育
      旅游
      手機
      時尚
      房產

      教育要聞

      湖南物化地590分怕滑檔?3所穩錄高校推薦!

      旅游要聞

      江西上饒通報:望仙谷景區明火已被撲滅 無人員傷亡

      手機要聞

      三星三折疊對比華為Mate XTs丨Galaxy Z TriFold新形態有何亮點

      法式方頭靴的30種穿法,時髦不重樣!

      房產要聞

      中糧好房子體系盛大亮相三亞,禮獻海南自貿港封關

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久96热在精品国产高清| 亚洲精品久久国产高清| 深夜福利视频在线播放| 午夜爽爽爽男女污污污网站| 内射在线播放| 台南市| 国产亚洲日韩av在线播放不卡| 亚洲中文字幕在线第六区| 中文字幕第一页国产| 亚洲人成人网站| 国产成人a亚洲精| 无套内内射视频网站| 亚洲中文日韩一区二区三区| 亚洲区视频| 内射91| 国产特级毛片aaaaaa毛片| av天堂永久资源网| 国产高清在线精品一区| 中文字幕日韩有码| 国产人妻无套一区二区普通话对白 | 左贡县| 成人毛片一区二区| 无码人妻精品中文字幕 | 超碰人人插| 缙云县| 国产99久一区二区三区a片| 欧美色色网| 亚洲天堂中文字幕| 女同综合网| 天堂…中文在线最新版在线| 国内不卡的一区二区三区| 午夜剧场黄色| 人妻白浆-ThePorn| 国产在线精品一区二区在线看| 青草99在线免费观看| 欧美福利极品| 色综合久久88色综合天天| 又大又长粗又爽又黄少妇视频| 99国产精品永久免费视频| 91人人操| 中文字幕无码精品亚洲35|