<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      解鎖任意步數文生圖,港大&Adobe全新Self-E框架學會自我評估

      0
      分享至



      盡管擴散模型(Diffusion Model)與流匹配(Flow Matching)已經把文本到圖像生成(Text-to-Image, T2I)推向了更高的視覺質量與可控性,但他們通常在推理時需要數十步網絡迭代,限制了其對于一些需要低延遲,Real-Time 的應用。

      為了把推理步數降下來,現有路線通常依賴知識蒸餾(Distillation):先訓練一個多步教師模型,再把能力遷移到少步學生模型。但這條路的代價同樣明顯 —— 既依賴預訓練教師,又引入了額外的訓練開銷,并在「從零訓練(from scratch)」與「極少步高質量」之間留下了長期空白。

      近日,香港大學(The University of Hong Kong)與 Adobe Research 聯合發布 Self-E(Self-Evaluating Model):一種無需預訓練教師蒸餾、從零開始訓練的任意步數文生圖框架。其目標非常直接:讓同一個模型在極少步數也能生成語義清晰、結構穩定的圖像,同時在 50 步等常規設置下保持頂級質量,并且隨著步數增加呈現單調提升。



      • 論文標題:Self-Evaluation Unlocks Any-Step Text-to-Image Generation
      • 項目主頁:https://xinyu-andy.github.io/SelfE-project/
      • 論文 PDF:https://www.arxiv.org/pdf/2512.22374



      引言:從「軌跡匹配」到「落點評估」

      擴散 / 流匹配范式本質上是在學習一張「局部向量場」:給定噪聲狀態,預測下一步該往哪里走。這個監督信號在「小步、密集積分」時非常有效,但一旦嘗試「大步跳躍」,誤差會被軌跡曲率放大,生成往往滑向平均解、語義漂移或結構坍塌。


      Self-E 的切入點是一個根本上的范式改變:我們能否不再執著于「每一步走得對不對」,而是把訓練重心轉向「落點好不好」?也就是把目標從「軌跡匹配(trajectory matching)」轉變為「落點評估(destination/landing evaluation)」。

      換句話說,傳統 Diffusion Model 訓練強調「在起點對齊局部方向」;Self-E 強調「在落點評估結果并給出糾偏方向」。監督位置的改變,帶來了訓練信號性質的改變:從靜態監督變成動態反饋。

      作者在項目主頁用動圖展示了這兩者的區別:





      這也是為什么模型在測試階段有少步推理能力:擴散模型在測試時只能逐步跟隨當前點預測的最好局部路徑,最終走到全局最優;而 Self-E 在訓練階段就逐步學會了走向全局最優的落點。

      這也不同于目前多數少步生成模型所采用的學習軌跡的積分,如 Consistency Model, Mean Flow;Self-E不局限于沿著預定義的軌跡走,而是直接關心每步結果好不好,對不對。

      Self-E 的核心:兩條互補訓練信號(Two Complementary Signals)

      Self-E 用同一個網絡在兩種「模式」下工作:一方面像 Flow Matching 一樣從真實數據學習分布的局部結構;另一方面用「模型自身正在學到的局部估計」去評估自生成樣本,形成自反饋閉環。

      1)從數據學習:Learning from Data

      • 學什么:分布的局部結構(local score /velocity 的期望形式),即「在鄰域內密度如何變化」。
      • 怎么學:采樣真實圖像與文本條件,加噪得到噪聲輸入,用條件流匹配式目標訓練模型去預測干凈樣本(或等價參數化),提供穩定的局部監督。

      2)自我評估學習:Learning by Self-Evaluation

      • 學什么:分布層面的正確性(distribution-level correctness)——生成樣本是否與真實分布一致、是否與描述的文本對齊。
      • 關鍵機制:模型先做一次「長距離跳躍」(從起始時間步跳到落點時間步),然后在落點處用自己當前學到的局部估計產生一個「方向信號」,告訴生成樣本應如何移動才能進入更高質量、更符合文本的概率分布區域。
      • 最大差異:評估信號不來自外部教師(pretrained diffusion teacher),而是來自模型自身的在訓估計(dynamic self-teacher)。



      訓練細節:把「自我評估」做成可反傳的學習信號

      Self-E 在理論上把評估寫成分布級目標(例如以反向 KL 為代表的分布匹配視角),但真正落地的難點在于:真實分布與生成分布的 score 都不可得。

      Self-E 的關鍵觀察是:模型在「從數據學習」階段會逐步學到某種條件期望形式,而該量與 score 通過 Tweedie’s formula 存在聯系,因此可以用「正在訓練的模型」去近似提供評估方向。

      在實現上,作者發現理論目標中包含「classifier score term」等項,并實證發現僅使用 classifier score 項就足夠有效,甚至更利于收斂,從而避免早期還要額外訓練一個用于 fake score 的模型分支。



      為了把這種「評估方向」變成可訓練的損失,Self-E 采用 stop-gradient 的雙前向構造 pseudo-target,通過最小化 MSE 誘導出與所需方向一致的梯度;并在最終目標中將數據驅動損失與自評估損失進行混合加權。



      最終,我們可以用一個統一的形式來訓練:



      其中,等式右邊第一項正是 Learning-from-data 的目標,而第二項對應 Self-Evaluation。

      推理:任意步數(Any-Step Inference),并隨步數單調變好

      在推理階段,Self-E 與擴散 / 流匹配一樣進行迭代去噪,但不同之處在于:由于訓練中已經顯式學習「長距離落點」的質量與糾偏方向,它可以在非常少的步數下保持可用的語義與結構,同時在增加步數時繼續提升細節與真實感。

      性能:GenEval 全步數段 SOTA,少步優勢尤其顯著

      在 GenEval 基準上,Self-E 對比其他方法取得全面領先,并且隨著步數增加呈現單調提升。更關鍵的是少步區間的「斷層式」優勢:在 2-step 設置下,Self-E 相比當時最佳對比方法的提升約為+0.12(0.7531 相比 0.6338),而多種傳統擴散 / 流匹配模型在 2-step 下幾乎無法生成可用結果。





      另一角度解讀:把「預訓練」與「反饋學習」拉到同一條線上

      從更宏觀的視角看,Self-E 把訓練過程組織成一個類似強化學習中的「環境 — 智能體(environment–agent)閉環」:

      • Data Phase:模型從真實數據學習分布的局部結構,得到越來越可靠的局部估計(可視作學習環境,并給出評估)。
      • Self-Evaluation Phase:模型提出長距離跳躍方案(可視作智能體執行動作),在落點處用內部估計產生反饋方向并更新參數(可視作獲得環境的反饋)。
      • Closed Loop:評估器隨訓練變強,反饋信號質量隨之提升,反過來又進一步強化少步生成能力。

      作者在項目主頁指出:這種內部評估器在角色上接近「可查詢的學習型獎勵模型」,為后續把強化學習(RL)更系統地引入視覺生成訓練提供了新的接口與想象空間。

      結語

      Self-E 的價值不只是在「少步生成」這一條指標上跑得更快,而在于它把文生圖訓練范式從「沿著既定軌跡走」推進到「學會評估落點并自我糾偏」:在不依賴預訓練教師蒸餾的前提下,讓單一模型同時覆蓋極低時延與高質量長軌跡兩種需求,并在不同推理預算下保持可擴展的性能曲線。

      對內容創作與生成式系統落地而言,「one model, any compute」的工程意義非常直接:同一個 checkpoint 可以按場景動態選擇步數 —— 交互式場景用 1~4 步追求即時反饋,高質量離線渲染用 50 步追求細節上限;而訓練側則繞開了教師蒸餾鏈路,把「從零訓練 + 少步推理」真正拉回到可討論、可復現、可擴展的主流路徑上。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      盤后央行重磅利好!降息來了,A股午盤走強,ETF出現天量拋盤

      盤后央行重磅利好!降息來了,A股午盤走強,ETF出現天量拋盤

      看財經show
      2026-01-15 16:57:15
      47歲賀嬌龍去世后續!好友曝其婚姻現狀,三任老公都離了,沒孩子

      47歲賀嬌龍去世后續!好友曝其婚姻現狀,三任老公都離了,沒孩子

      180視角
      2026-01-15 13:33:23
      聶衛平去世僅1天,惡心的一幕發生,私生活被扒,郎平也受牽連

      聶衛平去世僅1天,惡心的一幕發生,私生活被扒,郎平也受牽連

      查爾菲的筆記
      2026-01-15 19:26:43
      1060萬元買入錦繡公館,如今980萬元掛牌,房東一年虧近百萬

      1060萬元買入錦繡公館,如今980萬元掛牌,房東一年虧近百萬

      極目新聞
      2026-01-15 20:55:37
      16億只是保底,馬斯克想給朱曉彤的是100億

      16億只是保底,馬斯克想給朱曉彤的是100億

      字母榜
      2026-01-15 14:44:13
      痛心!74歲“棋圣”聶衛平去世,原因是直腸癌,三婚娶小23歲嬌妻

      痛心!74歲“棋圣”聶衛平去世,原因是直腸癌,三婚娶小23歲嬌妻

      180視角
      2026-01-15 09:32:04
      拔蘿卜出泥!學歷還沒查清,閆學晶再迎噩耗,多位大V錘她恐坐牢

      拔蘿卜出泥!學歷還沒查清,閆學晶再迎噩耗,多位大V錘她恐坐牢

      流史歲月
      2026-01-15 10:16:09
      新加坡不許武統,話音剛落,央視公布“南天門計劃”,信號不尋常

      新加坡不許武統,話音剛落,央視公布“南天門計劃”,信號不尋常

      文史旺旺旺
      2026-01-14 19:51:09
      女孩追母身亡后續:真相另有隱情,父親著急要保險金,奶奶更離譜

      女孩追母身亡后續:真相另有隱情,父親著急要保險金,奶奶更離譜

      有范又有料
      2026-01-15 18:00:52
      開盤閃崩跌停后直線上演地天板,今天割肉的股民哭暈在廁所

      開盤閃崩跌停后直線上演地天板,今天割肉的股民哭暈在廁所

      財經智多星
      2026-01-15 16:20:37
      劉強東拿下德邦,行業大為震驚

      劉強東拿下德邦,行業大為震驚

      新行情
      2026-01-15 14:46:09
      顛覆認知!哈佛 12 萬人研究實錘:每天 1-2 個雞蛋不升膽固醇,反而護血管

      顛覆認知!哈佛 12 萬人研究實錘:每天 1-2 個雞蛋不升膽固醇,反而護血管

      CHTV百姓健康
      2026-01-14 18:00:03
      閆學晶一家三口現身機場!疑似遇到麻煩,老公不停打電話面露難色

      閆學晶一家三口現身機場!疑似遇到麻煩,老公不停打電話面露難色

      阿纂看事
      2026-01-15 15:56:31
      好友見證賀嬌龍從苦孩子成長為“推介官”,多人已趕赴昭蘇送她最后一程,有攝影師缺席她最后一次拍攝遺憾自責

      好友見證賀嬌龍從苦孩子成長為“推介官”,多人已趕赴昭蘇送她最后一程,有攝影師缺席她最后一次拍攝遺憾自責

      極目新聞
      2026-01-15 17:46:12
      孫悟空這就叫不識貨!當年東海龍王手里那件7200斤的神器,他沒看上,結果差點要了他的命!

      孫悟空這就叫不識貨!當年東海龍王手里那件7200斤的神器,他沒看上,結果差點要了他的命!

      歷史回憶室
      2026-01-15 12:58:16
      馬斯克警告中國在AI計算和電力上大幅領先美國:中國電力產能2026年達到美國的3倍

      馬斯克警告中國在AI計算和電力上大幅領先美國:中國電力產能2026年達到美國的3倍

      知識圈
      2026-01-15 16:49:27
      又一個烏克蘭!全面推動去俄化,不準再叫將軍,只能叫突厥軍銜?

      又一個烏克蘭!全面推動去俄化,不準再叫將軍,只能叫突厥軍銜?

      科普100克克
      2026-01-15 14:18:27
      寶能姚振華實名舉報,相關部門回應:舉報不實,拍賣正常推進

      寶能姚振華實名舉報,相關部門回應:舉報不實,拍賣正常推進

      南方都市報
      2026-01-15 11:04:11
      安徽一殯儀館處理逝者遺物時,竟在被子里發現41萬存款單……

      安徽一殯儀館處理逝者遺物時,竟在被子里發現41萬存款單……

      環球網資訊
      2026-01-15 15:33:07
      被要求判死刑,尹錫悅漲紅了臉,抓起麥克風陳述89分鐘,拍桌怒罵特檢組

      被要求判死刑,尹錫悅漲紅了臉,抓起麥克風陳述89分鐘,拍桌怒罵特檢組

      紅星新聞
      2026-01-14 12:58:18
      2026-01-15 21:23:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12126文章數 142536關注度
      往期回顧 全部

      科技要聞

      阿里最狠的一次“自我革命”

      頭條要聞

      中央紀委全會公報發布 首現著重查處"關鍵少數"等表述

      頭條要聞

      中央紀委全會公報發布 首現著重查處"關鍵少數"等表述

      體育要聞

      聶衛平:黑白棋盤上的凡人棋圣

      娛樂要聞

      傳奇棋圣聶衛平離世,網友集體悼念

      財經要聞

      央行再次結構性降息0.25個百分點

      汽車要聞

      吉利帝豪/繽越推冠軍一口價 起售價4.88萬

      態度原創

      房產
      數碼
      手機
      公開課
      軍事航空

      房產要聞

      突發!商業用房購房貸款最低首付比例下調至30%

      數碼要聞

      還得多等:兩家英特爾顯卡合作伙伴稱尚未收到銳炫B770測試板

      手機要聞

      華為nova 16系列再次被確認:Deco大變樣,或6月份左右發布!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美國已正式開始出售委內瑞拉石油

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 青久草视频| 国产婷婷色一区二区三区| 一边添奶一边添p好爽视频| 亚洲色婷婷婷婷五月基地| 亚洲天堂无码| www97| 色伊人亚洲综合网站| 男女啪啪高潮激烈免费版| 性爱综合网| 亚洲AV日韩AV无码中出| av免费网站在线免费观看| 东京热大乱w姦| 国产精品免费看久久久| 精品国产乱码久久久久久口爆网站| 九九精品视频免费| 亚洲av成人一区二区三区| 国产乱子伦精品免费女| 亚洲黄色无码| 一本色道久久综合无码人妻| 少妇爽到呻吟的视频| 福利一区二区三区av| 国产精品999| 国产精品一区二区久久岳| 免费国产又色又爽又黄的网站| 美女裸体自慰在线观看| 五月天婷婷综合久久| 99精品视频在线观看| 亚洲成人性爱网| 中文字幕无码成人片| 97人妻天天摸天天爽天天| 中文字幕av免费专区| 国产成人一区二区三区| 四虎国产精品永久在线| 欧美成人看片一区二区三区尤物| 日韩一欧美内射在线观看| 少妇粗大进出白浆嘿嘿视频| 91久久精品美女高潮不断| 四虎精品免费永久免费视频| 18禁高潮出水呻吟娇喘蜜芽| 99在线观看视频| 成熟丰满熟妇av无码区|