<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      擴散LLM推理新范式:打破生成長度限制,實現動態(tài)自適應調節(jié)

      0
      分享至



      隨著 Gemini-Diffusion,Seed-Diffusion 等擴散大語言模型(DLLM)的發(fā)布,這一領域成為了工業(yè)界和學術界的熱門方向。但是,當前 DLLM 存在著在推理時必須采用預設固定長度的限制,對于不同任務都需要專門調整才能達到最優(yōu)效果。

      為了解決這一本質的問題,香港中文大學 MMLab,上海 AI 實驗室等提出 DAEDAL,賦予 DLLM 可以根據問題的具體情況自主調整回答長度的能力,彌補了 DLLM 與自回歸 LLM 的關鍵差距,為更靈活、高效、強大的擴散大語言模型打下了基石。



      • 論文標題:Beyond Fixed: Variable-Length Denoising for Diffusion Large Language Models
      • 論文地址:https://arxiv.org/abs/2508.00819
      • 代碼地址:https://github.com/Li-Jinsong/DAEDAL

      DAEDAL 作為一種 Training Free 的去噪策略,從一個統(tǒng)一且很短的初始長度開始,讓模型根據自己的需求在生成中調節(jié)長度,動態(tài)擴展,達到了和現有去噪策略在每個評測基準上精心調整生成長度得到的最佳性能相當的表現,有時甚至更勝一籌。



      圖 1 (a) DAEDAL 使用統(tǒng)一且很短的初始長度,在多個基準上取得了與精心調優(yōu)的固定長度基線相當甚至更優(yōu)的性能。(b) DAEDAL 能夠根據每個問題,在生成過程中自適應地動態(tài)調整長度,相比之下,現有方法則對所有問題都只能采用單一的固定長度。

      DAEDAL 介紹

      擴散大語言模型(DLLM)潛力巨大,但其現有推理流程存在一個關鍵的問題:需要預定義的,固定的生成長度。與能夠邊思考邊決定 “說” 多少的人類和自回歸模型不同,現有的 DLLM 需要預先設定確切的輸出長度。這導致了一個兩難的困境:設置太短,模型在復雜問題上難以發(fā)揮全部實力,可能導致做錯;設置太長,則會浪費大量的計算資源,同時,實驗中還發(fā)現過長的生成長度可能導致性能下降。

      作者在探索中發(fā)現,這一問題的解決方案就蘊藏在模型自身之中。DLLM 在生成時會不斷地全局規(guī)劃其整體輸出,而它的預測置信度正是其內部狀態(tài)的強大信號。作者發(fā)現了兩種關鍵信號:

      • DLLM 在序列末端生成序列結束符 (EOS) 的意愿直接反映了其對全局預算的規(guī)劃。當預設長度充足時,模型會自信地在末尾規(guī)劃出結束區(qū)域,從而高置信度地預測 EOS。反之,當長度不足時,模型會試圖利用所有可用空間來完成核心內容,因而抑制了在末尾生成 EOS 的置信度。
      • 在去噪過程中,對某個特定詞元的極低預測置信度,則可作為一種局部信號,這不僅代表了模型對該詞元的不確定性,更深層次地,它表明當前的局部上下文過于受限,不足以支撐一個復雜的邏輯步驟或細節(jié)的展開,或是需要插入空間對過去生成的內容進行補充和修正。



      圖 2 該熱力圖展示了在對一個長度為 128 的全掩碼輸入進行首次預測后,于序列末端測得的平均 EOS 詞元置信度之差。該差值的計算方式為:用 “長度充足” 問題(在少于 128 長度的 setting 下被正確回答)的平均置信度減去 “長度不足” 問題(僅在長度更長的 setting 才能被正確回答)的平均置信度。圖中大面積的綠色(差值 > 0)表明,對于長度充足的問題,結尾 EOS 序列置信度更高,驗證了文中的核心發(fā)現。

      基于發(fā)現,作者提出了 DAEDAL,一種無需訓練的兩階段推理策略,利用這些內部信號,賦予 DLLM 根據每個問題的具體情況,動態(tài)自主調整回答長度的能力。



      圖 3 DAEDAL 與現有基線方法流程對比

      1. 初始長度調整 (Initial Length Adjustment): 在去噪流程開始前,DAEDAL 從一個統(tǒng)一的很短初始長度出發(fā)。它會通過檢測序列末端的 EOS 序列平均置信度來衡量:“對于這個任務,當前分配的長度是否充足?”。如果置信度很低,即模型規(guī)劃充分利用全部長度,就表明模型認為長度預算不足。此時,DAEDAL 會通過增加 [MASK] 詞元來擴展序列長度,并重復此過程,直到模型確信長度預算充足。這為任務設定了一個合理的全局規(guī)劃長度。

      2. 迭代式掩碼插入 (Iterative Mask Insertion): 在逐步去噪的過程中,DAEDAL 會持續(xù)監(jiān)控模型的置信度。如果它發(fā)現模型對某個 [MASK] 位置極不確定,便會將其標記為 “擴展點”。DAEDAL 通過將這個單個 [MASK] 替換為由多個 [MASK],動態(tài)且精準地在模型最需要的地方為序列注入 “思考空間”,以便其在回復中進行補充修補,或是有足夠空間去進行更復雜的思考。

      通過結合這兩個階段,不需要進行任何訓練,DAEDAL 使得 DLLM 能夠根據每個問題的具體情況自主調整其回答的長度,展現了強大的效果。

      實驗結果





      圖 4 DAEDAL 在 4 個基準測試上與基線方法性能對比以及生成長度可視化

      DAEDAL 使用統(tǒng)一的短初始長度即可取得強大性能。 實驗結果清晰地展示了 DAEDAL 的優(yōu)越性能。盡管 DAEDAL 默認從一個較短的初始長度開始,但其兩階段的長度調整與擴展機制,不僅使其性能顯著優(yōu)于使用相同短初始長度的基線方法,更能達到與基線方法在所有固定長度中精心調優(yōu)后的峰值性能相當、甚至在某些情況下超越后者的水平。

      這一發(fā)現凸顯了 DAEDAL 的有效性,并揭示了固定長度范式的內在不便之處,因為基線方法的最佳長度因不同基準而異,這更強調了動態(tài)長度適應的必要性。為了直觀展示這種動態(tài)適應性,圖 3 對比了 DAEDAL 所用總生成長度(N_token)的分布與基線方法所用的單一最佳長度。

      DAEDAL 能自適應地找到最佳生成長度。 進一步的分析表明,DAEDAL 能智能地預估并生成恰當長度的回答。在多數情況下,DAEDAL 產生的有效詞元數(E_token)與基線方法在最佳性能配置下的有效詞元數相當。這表明 DAEDAL 能自適應地找到模型內在的、針對特定任務所需詞元長度的 “舒適點”。基線方法的行為也印證了這一點:當設置的長度過長時,即使有效詞元數可能繼續(xù)增加,性能反而可能會下降。DAEDAL 的自適應特性有效避免了這種因過度擴展導致的性能下降。

      DAEDAL 能夠提升計算資源利用率。在取得優(yōu)越準確率的同時,DAEDAL 生成的總詞元數(N_token)通常低于基線方法在最佳性能 setting 下的總詞元數。相近的有效詞元數和更低的總詞元數帶來了更高的有效詞元利用率(E_ratio)。這大大地提升了計算資源的利用率。

      總結

      DAEDAL 通過其初始長度調整(Initial Length Adjustment)和迭代式掩碼插入(Iterative Mask Insertion)機制,不僅在多個基準上取得了與精心調優(yōu)的固定長度基線相當甚至更優(yōu)的性能,還能為每個任務自適應地分配合適的長度。這使得模型在性能和計算效率上都取得了實質性的提升。DAEDA 彌補了擴散大語言模型與自回歸大語言模型在核心能力上的一個關鍵差距,為更靈活、高效、強大的擴散大語言模型打下了基石。

      作者介紹

      本文第一作者是香港中文大學 MMLab 的博士生李勁松,導師林達華教授,主要研究方向是多模態(tài)大模型和大語言模型。曾在 NeurIPS,ECCV,ACL 等頂級會議發(fā)表多篇論文,Google 學術引用超 1400 次。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      在寸土寸金的香港,貴為視后也難買豪宅,你看胡杏兒和鐘嘉欣聚餐

      在寸土寸金的香港,貴為視后也難買豪宅,你看胡杏兒和鐘嘉欣聚餐

      可樂談情感
      2025-11-25 12:07:13
      南京雙胞胎反目后續(xù):爸爸支持弟弟,讓弟弟不要低頭一家三口慶祝

      南京雙胞胎反目后續(xù):爸爸支持弟弟,讓弟弟不要低頭一家三口慶祝

      漢史趣聞
      2025-12-06 11:05:31
      張稀哲在國安拿到足協(xié)杯冠軍后,做出重要決定,讓球迷直言意外

      張稀哲在國安拿到足協(xié)杯冠軍后,做出重要決定,讓球迷直言意外

      懂個球
      2025-12-07 23:42:19
      戴口罩!已抵達杭州

      戴口罩!已抵達杭州

      都市快報橙柿互動
      2025-12-08 11:42:32
      杭州師大刪除的資金明顯被曝光,花4萬差旅費只為送幾千塊文具

      杭州師大刪除的資金明顯被曝光,花4萬差旅費只為送幾千塊文具

      映射生活的身影
      2025-12-08 10:28:03
      演員朱珠疑似塌房?照片流出,驚呆網友!

      演員朱珠疑似塌房?照片流出,驚呆網友!

      人間頌
      2025-12-08 13:20:46
      周星馳《鹿鼎記》重映首日票房僅18萬!網友真相了!星爺分不到錢

      周星馳《鹿鼎記》重映首日票房僅18萬!網友真相了!星爺分不到錢

      小娛樂悠悠
      2025-12-08 14:42:53
      殷秀梅:遺憾沒生孩子,一心培養(yǎng)弟弟,替弟弟養(yǎng)女兒值嗎?

      殷秀梅:遺憾沒生孩子,一心培養(yǎng)弟弟,替弟弟養(yǎng)女兒值嗎?

      鋭娛之樂
      2025-12-07 20:39:12
      羅永浩的十字路口:播客、年輕人和 AI 浪潮

      羅永浩的十字路口:播客、年輕人和 AI 浪潮

      極客公園
      2025-12-08 16:31:59
      張亮兒子不服管,曝天天在國外搞大女同學肚子,女方父母正鬧著!

      張亮兒子不服管,曝天天在國外搞大女同學肚子,女方父母正鬧著!

      阿廢冷眼觀察所
      2025-11-29 01:58:17
      阿信回應代替朱孝天加入F4演唱會:這不是最完整、大家希望的陣容

      阿信回應代替朱孝天加入F4演唱會:這不是最完整、大家希望的陣容

      韓小娛
      2025-12-08 11:22:54
      平心而論,以凱恩目前這樣的狀態(tài),7500萬歐的身價是不是太低了?

      平心而論,以凱恩目前這樣的狀態(tài),7500萬歐的身價是不是太低了?

      田先生籃球
      2025-12-07 20:29:03
      愛沙尼亞:中國,我最后警告你,我們的耐心快要耗盡了!

      愛沙尼亞:中國,我最后警告你,我們的耐心快要耗盡了!

      探源歷史
      2025-12-08 02:08:04
      6家銀行倒下!存款還能拿回來嘛?儲戶記住3件事,錢存得安心!

      6家銀行倒下!存款還能拿回來嘛?儲戶記住3件事,錢存得安心!

      搬磚營Z
      2025-12-08 08:58:38
      楊千嬅兒子好帥,13歲身高超170、一年長10cm,大鼻子和爸爸一樣

      楊千嬅兒子好帥,13歲身高超170、一年長10cm,大鼻子和爸爸一樣

      農村娛樂光哥
      2025-12-07 11:56:53
      清華學生被白嫖300元家教費后續(xù):對方不是高三學生 多名老師被騙

      清華學生被白嫖300元家教費后續(xù):對方不是高三學生 多名老師被騙

      阿芒娛樂說
      2025-12-08 15:27:18
      孫繼海遭質疑?旅日小將:中國足球13歲后才被日本超越,因3死結

      孫繼海遭質疑?旅日小將:中國足球13歲后才被日本超越,因3死結

      念洲
      2025-12-08 11:57:26
      一個弓箭手帶多少支箭,為何說箭如雨下會讓古代軍隊破產?

      一個弓箭手帶多少支箭,為何說箭如雨下會讓古代軍隊破產?

      老歿體育解說
      2025-12-07 20:32:00
      高市早苗再遭重擊!20年來首次,中方刪無核化表述,朝鮮徹底松綁

      高市早苗再遭重擊!20年來首次,中方刪無核化表述,朝鮮徹底松綁

      今日美食分享
      2025-12-08 14:50:21
      農村馬上要挨家挨戶,將嚴查這3件事,件件都和老百姓有關系

      農村馬上要挨家挨戶,將嚴查這3件事,件件都和老百姓有關系

      三農雷哥
      2025-12-06 16:08:14
      2025-12-08 17:11:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11868文章數 142510關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      頭條要聞

      40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態(tài)度原創(chuàng)

      數碼
      房產
      旅游
      教育
      時尚

      數碼要聞

      惠普、戴爾等回應漲價:由于配件漲價 電腦肯定也漲價

      房產要聞

      碧桂園,開始甩賣海口家底!

      旅游要聞

      山東榮成:雪后初霽現“海浩”景觀

      教育要聞

      父母永遠不要與孩子分享的8件事,關系再好也別說

      除了大衣,今年最火的外套一定就是它了!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码av波多野结衣| 看亚洲一级黄色片啪啪啪| 中国内地毛片免费高清| 一亚洲一区二区中文字幕| 国精产品乱码一区一区三区四区| 91免费视频观看| 一本色道久久亚洲综合精品蜜桃| 男人的天堂av社区在线| 国产va| 69精品人人人人| 91乱子伦国产乱子伦www.sz-sd.cn| 国产av人人夜夜澡人人爽麻豆| 在线播放国产一区二区三区| 一面膜上边一面膜下边视频| 人妻丝袜| 欧洲AV在线| 国产精品视频一区二区噜噜| 99re在线观看| 玖玖精品| 亚洲成人在线网站| 最新国产在线拍揄自揄视频| 欧美va免费高清在线观看| 成人亚洲精品一区二区三区嫩花 | 波多野结衣的av一区二区三区 | 91乱子伦国产乱子伦海的味道| 焦作市| 丁香五月网久久综合| 日韩无码专区| 97成人精品一区二区三区狼人| 一本色道加勒比久久综合| 最近2019中文字幕大全第二页| 亚洲成人无码AV| 亚洲第1色电影。| 另类小说久久| 成熟老妇女视频| 中文字幕亚洲综合第一页| 少妇被粗大猛烈进出免费视频| 久久国产成人精品av| 樱花草视频www日本韩国| 97人妻精品一区二区三区免费| 久久涩综合|