<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      解鎖任意步數(shù)文生圖,港大&Adobe全新Self-E框架學(xué)會(huì)自我評估

      0
      分享至



      盡管擴(kuò)散模型(Diffusion Model)與流匹配(Flow Matching)已經(jīng)把文本到圖像生成(Text-to-Image, T2I)推向了更高的視覺質(zhì)量與可控性,但他們通常在推理時(shí)需要數(shù)十步網(wǎng)絡(luò)迭代,限制了其對于一些需要低延遲,Real-Time 的應(yīng)用。

      為了把推理步數(shù)降下來,現(xiàn)有路線通常依賴知識蒸餾(Distillation):先訓(xùn)練一個(gè)多步教師模型,再把能力遷移到少步學(xué)生模型。但這條路的代價(jià)同樣明顯 —— 既依賴預(yù)訓(xùn)練教師,又引入了額外的訓(xùn)練開銷,并在「從零訓(xùn)練(from scratch)」與「極少步高質(zhì)量」之間留下了長期空白。

      近日,香港大學(xué)(The University of Hong Kong)與 Adobe Research 聯(lián)合發(fā)布 Self-E(Self-Evaluating Model):一種無需預(yù)訓(xùn)練教師蒸餾、從零開始訓(xùn)練的任意步數(shù)文生圖框架。其目標(biāo)非常直接:讓同一個(gè)模型在極少步數(shù)也能生成語義清晰、結(jié)構(gòu)穩(wěn)定的圖像,同時(shí)在 50 步等常規(guī)設(shè)置下保持頂級質(zhì)量,并且隨著步數(shù)增加呈現(xiàn)單調(diào)提升。



      • 論文標(biāo)題:Self-Evaluation Unlocks Any-Step Text-to-Image Generation
      • 項(xiàng)目主頁:https://xinyu-andy.github.io/SelfE-project/
      • 論文 PDF:https://www.arxiv.org/pdf/2512.22374



      引言:從「軌跡匹配」到「落點(diǎn)評估」

      擴(kuò)散 / 流匹配范式本質(zhì)上是在學(xué)習(xí)一張「局部向量場」:給定噪聲狀態(tài),預(yù)測下一步該往哪里走。這個(gè)監(jiān)督信號在「小步、密集積分」時(shí)非常有效,但一旦嘗試「大步跳躍」,誤差會(huì)被軌跡曲率放大,生成往往滑向平均解、語義漂移或結(jié)構(gòu)坍塌。


      Self-E 的切入點(diǎn)是一個(gè)根本上的范式改變:我們能否不再執(zhí)著于「每一步走得對不對」,而是把訓(xùn)練重心轉(zhuǎn)向「落點(diǎn)好不好」?也就是把目標(biāo)從「軌跡匹配(trajectory matching)」轉(zhuǎn)變?yōu)椤嘎潼c(diǎn)評估(destination/landing evaluation)」。

      換句話說,傳統(tǒng) Diffusion Model 訓(xùn)練強(qiáng)調(diào)「在起點(diǎn)對齊局部方向」;Self-E 強(qiáng)調(diào)「在落點(diǎn)評估結(jié)果并給出糾偏方向」。監(jiān)督位置的改變,帶來了訓(xùn)練信號性質(zhì)的改變:從靜態(tài)監(jiān)督變成動(dòng)態(tài)反饋。

      作者在項(xiàng)目主頁用動(dòng)圖展示了這兩者的區(qū)別:





      這也是為什么模型在測試階段有少步推理能力:擴(kuò)散模型在測試時(shí)只能逐步跟隨當(dāng)前點(diǎn)預(yù)測的最好局部路徑,最終走到全局最優(yōu);而 Self-E 在訓(xùn)練階段就逐步學(xué)會(huì)了走向全局最優(yōu)的落點(diǎn)。

      這也不同于目前多數(shù)少步生成模型所采用的學(xué)習(xí)軌跡的積分,如 Consistency Model, Mean Flow;Self-E不局限于沿著預(yù)定義的軌跡走,而是直接關(guān)心每步結(jié)果好不好,對不對。

      Self-E 的核心:兩條互補(bǔ)訓(xùn)練信號(Two Complementary Signals)

      Self-E 用同一個(gè)網(wǎng)絡(luò)在兩種「模式」下工作:一方面像 Flow Matching 一樣從真實(shí)數(shù)據(jù)學(xué)習(xí)分布的局部結(jié)構(gòu);另一方面用「模型自身正在學(xué)到的局部估計(jì)」去評估自生成樣本,形成自反饋閉環(huán)。

      1)從數(shù)據(jù)學(xué)習(xí):Learning from Data

      • 學(xué)什么:分布的局部結(jié)構(gòu)(local score /velocity 的期望形式),即「在鄰域內(nèi)密度如何變化」。
      • 怎么學(xué):采樣真實(shí)圖像與文本條件,加噪得到噪聲輸入,用條件流匹配式目標(biāo)訓(xùn)練模型去預(yù)測干凈樣本(或等價(jià)參數(shù)化),提供穩(wěn)定的局部監(jiān)督。

      2)自我評估學(xué)習(xí):Learning by Self-Evaluation

      • 學(xué)什么:分布層面的正確性(distribution-level correctness)——生成樣本是否與真實(shí)分布一致、是否與描述的文本對齊。
      • 關(guān)鍵機(jī)制:模型先做一次「長距離跳躍」(從起始時(shí)間步跳到落點(diǎn)時(shí)間步),然后在落點(diǎn)處用自己當(dāng)前學(xué)到的局部估計(jì)產(chǎn)生一個(gè)「方向信號」,告訴生成樣本應(yīng)如何移動(dòng)才能進(jìn)入更高質(zhì)量、更符合文本的概率分布區(qū)域。
      • 最大差異:評估信號不來自外部教師(pretrained diffusion teacher),而是來自模型自身的在訓(xùn)估計(jì)(dynamic self-teacher)。



      訓(xùn)練細(xì)節(jié):把「自我評估」做成可反傳的學(xué)習(xí)信號

      Self-E 在理論上把評估寫成分布級目標(biāo)(例如以反向 KL 為代表的分布匹配視角),但真正落地的難點(diǎn)在于:真實(shí)分布與生成分布的 score 都不可得。

      Self-E 的關(guān)鍵觀察是:模型在「從數(shù)據(jù)學(xué)習(xí)」階段會(huì)逐步學(xué)到某種條件期望形式,而該量與 score 通過 Tweedie’s formula 存在聯(lián)系,因此可以用「正在訓(xùn)練的模型」去近似提供評估方向。

      在實(shí)現(xiàn)上,作者發(fā)現(xiàn)理論目標(biāo)中包含「classifier score term」等項(xiàng),并實(shí)證發(fā)現(xiàn)僅使用 classifier score 項(xiàng)就足夠有效,甚至更利于收斂,從而避免早期還要額外訓(xùn)練一個(gè)用于 fake score 的模型分支。



      為了把這種「評估方向」變成可訓(xùn)練的損失,Self-E 采用 stop-gradient 的雙前向構(gòu)造 pseudo-target,通過最小化 MSE 誘導(dǎo)出與所需方向一致的梯度;并在最終目標(biāo)中將數(shù)據(jù)驅(qū)動(dòng)損失與自評估損失進(jìn)行混合加權(quán)。



      最終,我們可以用一個(gè)統(tǒng)一的形式來訓(xùn)練:



      其中,等式右邊第一項(xiàng)正是 Learning-from-data 的目標(biāo),而第二項(xiàng)對應(yīng) Self-Evaluation。

      推理:任意步數(shù)(Any-Step Inference),并隨步數(shù)單調(diào)變好

      在推理階段,Self-E 與擴(kuò)散 / 流匹配一樣進(jìn)行迭代去噪,但不同之處在于:由于訓(xùn)練中已經(jīng)顯式學(xué)習(xí)「長距離落點(diǎn)」的質(zhì)量與糾偏方向,它可以在非常少的步數(shù)下保持可用的語義與結(jié)構(gòu),同時(shí)在增加步數(shù)時(shí)繼續(xù)提升細(xì)節(jié)與真實(shí)感。

      性能:GenEval 全步數(shù)段 SOTA,少步優(yōu)勢尤其顯著

      在 GenEval 基準(zhǔn)上,Self-E 對比其他方法取得全面領(lǐng)先,并且隨著步數(shù)增加呈現(xiàn)單調(diào)提升。更關(guān)鍵的是少步區(qū)間的「斷層式」優(yōu)勢:在 2-step 設(shè)置下,Self-E 相比當(dāng)時(shí)最佳對比方法的提升約為+0.12(0.7531 相比 0.6338),而多種傳統(tǒng)擴(kuò)散 / 流匹配模型在 2-step 下幾乎無法生成可用結(jié)果。





      另一角度解讀:把「預(yù)訓(xùn)練」與「反饋學(xué)習(xí)」拉到同一條線上

      從更宏觀的視角看,Self-E 把訓(xùn)練過程組織成一個(gè)類似強(qiáng)化學(xué)習(xí)中的「環(huán)境 — 智能體(environment–agent)閉環(huán)」:

      • Data Phase:模型從真實(shí)數(shù)據(jù)學(xué)習(xí)分布的局部結(jié)構(gòu),得到越來越可靠的局部估計(jì)(可視作學(xué)習(xí)環(huán)境,并給出評估)。
      • Self-Evaluation Phase:模型提出長距離跳躍方案(可視作智能體執(zhí)行動(dòng)作),在落點(diǎn)處用內(nèi)部估計(jì)產(chǎn)生反饋方向并更新參數(shù)(可視作獲得環(huán)境的反饋)。
      • Closed Loop:評估器隨訓(xùn)練變強(qiáng),反饋信號質(zhì)量隨之提升,反過來又進(jìn)一步強(qiáng)化少步生成能力。

      作者在項(xiàng)目主頁指出:這種內(nèi)部評估器在角色上接近「可查詢的學(xué)習(xí)型獎(jiǎng)勵(lì)模型」,為后續(xù)把強(qiáng)化學(xué)習(xí)(RL)更系統(tǒng)地引入視覺生成訓(xùn)練提供了新的接口與想象空間。

      結(jié)語

      Self-E 的價(jià)值不只是在「少步生成」這一條指標(biāo)上跑得更快,而在于它把文生圖訓(xùn)練范式從「沿著既定軌跡走」推進(jìn)到「學(xué)會(huì)評估落點(diǎn)并自我糾偏」:在不依賴預(yù)訓(xùn)練教師蒸餾的前提下,讓單一模型同時(shí)覆蓋極低時(shí)延與高質(zhì)量長軌跡兩種需求,并在不同推理預(yù)算下保持可擴(kuò)展的性能曲線。

      對內(nèi)容創(chuàng)作與生成式系統(tǒng)落地而言,「one model, any compute」的工程意義非常直接:同一個(gè) checkpoint 可以按場景動(dòng)態(tài)選擇步數(shù) —— 交互式場景用 1~4 步追求即時(shí)反饋,高質(zhì)量離線渲染用 50 步追求細(xì)節(jié)上限;而訓(xùn)練側(cè)則繞開了教師蒸餾鏈路,把「從零訓(xùn)練 + 少步推理」真正拉回到可討論、可復(fù)現(xiàn)、可擴(kuò)展的主流路徑上。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      古巴能源供應(yīng)被切斷,垃圾堆積如山

      古巴能源供應(yīng)被切斷,垃圾堆積如山

      昊軒看世界
      2026-01-14 10:15:12
      就在剛剛,1月23日上午,國乒陸續(xù)傳來向鵬、溫瑞博、石洵瑤消息

      就在剛剛,1月23日上午,國乒陸續(xù)傳來向鵬、溫瑞博、石洵瑤消息

      小彭美識
      2026-01-23 05:30:46
      演員劉琳:我一直想要孩子,35歲開始,第一次胎停,第二次又胎停

      演員劉琳:我一直想要孩子,35歲開始,第一次胎停,第二次又胎停

      南權(quán)先生
      2026-01-22 15:47:36
      中國駐日武官王慶簡:大校軍銜,每天定時(shí)開窗向日本傳遞絕密情報(bào)

      中國駐日武官王慶簡:大校軍銜,每天定時(shí)開窗向日本傳遞絕密情報(bào)

      萬年歷史老號
      2026-01-20 05:40:03
      31省份去年人均可支配收入公布

      31省份去年人均可支配收入公布

      第一財(cái)經(jīng)資訊
      2026-01-22 12:36:10
      澳門最強(qiáng)高中生!官方:澳門黑熊球員李翔將加入北體大征戰(zhàn)CUBA

      澳門最強(qiáng)高中生!官方:澳門黑熊球員李翔將加入北體大征戰(zhàn)CUBA

      懂球帝
      2026-01-22 15:05:06
      中國是否加入“和平委員會(huì)”?外交部回應(yīng)

      中國是否加入“和平委員會(huì)”?外交部回應(yīng)

      財(cái)聯(lián)社
      2026-01-22 15:30:07
      劇王回歸,尺度升級,兩集飆到豆瓣9.4

      劇王回歸,尺度升級,兩集飆到豆瓣9.4

      獨(dú)立魚
      2026-01-22 21:54:09
      為應(yīng)對“超短學(xué)期”,上海、江蘇等多地中小學(xué)“提前教學(xué)”下學(xué)期內(nèi)容,家長:接受并支持“提前學(xué)”

      為應(yīng)對“超短學(xué)期”,上海、江蘇等多地中小學(xué)“提前教學(xué)”下學(xué)期內(nèi)容,家長:接受并支持“提前學(xué)”

      魯中晨報(bào)
      2026-01-21 17:27:05
      《驚蟄無聲》預(yù)告質(zhì)感太差!楊冪沒精神劉詩詩像盲人,被嘲像網(wǎng)大

      《驚蟄無聲》預(yù)告質(zhì)感太差!楊冪沒精神劉詩詩像盲人,被嘲像網(wǎng)大

      萌神木木
      2026-01-22 12:58:36
      別再買錯(cuò)了!網(wǎng)購時(shí)“旗艦店”和“官方店”差2字,背后差別不小

      別再買錯(cuò)了!網(wǎng)購時(shí)“旗艦店”和“官方店”差2字,背后差別不小

      復(fù)轉(zhuǎn)這些年
      2026-01-20 08:10:05
      什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

      什么是性成癮?患者自述:比煙癮、酒癮厲害多了,比戒毒還難

      泠泠說史
      2025-10-30 15:20:45
      安東尼奧有魄力!3位主帥不敢用的人,被他重用,決賽或成殺手锏

      安東尼奧有魄力!3位主帥不敢用的人,被他重用,決賽或成殺手锏

      何老師呀
      2026-01-22 11:16:25
      年薪400萬銀行高管被曝“失聯(lián)”,官方暫未回應(yīng),反腐猜測四起

      年薪400萬銀行高管被曝“失聯(lián)”,官方暫未回應(yīng),反腐猜測四起

      老貓觀點(diǎn)
      2026-01-20 08:04:27
      華為登頂,吃了誰的蛋糕?

      華為登頂,吃了誰的蛋糕?

      智東西
      2026-01-22 22:49:33
      好慘,天津某國企設(shè)計(jì)院連一千月薪都不能準(zhǔn)時(shí)發(fā)了!

      好慘,天津某國企設(shè)計(jì)院連一千月薪都不能準(zhǔn)時(shí)發(fā)了!

      黯泉
      2026-01-22 23:27:25
      4376臺!尊界S800銷量失控了

      4376臺!尊界S800銷量失控了

      品牌頭版
      2026-01-20 18:53:55
      美國急壞了:中國為什么遮住神舟20的舷窗?有什么不想讓人看到?

      美國急壞了:中國為什么遮住神舟20的舷窗?有什么不想讓人看到?

      鐵錘簡科
      2026-01-21 14:06:40
      勇士隊(duì)傳聞:安德魯·威金斯或?qū)⒃诮灰捉刂谷涨爸胤涤率浚?>
    </a>
        <h3>
      <a href=好火子
      2026-01-23 03:52:00
      西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

      西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

      醫(yī)學(xué)原創(chuàng)故事會(huì)
      2026-01-21 21:50:30
      2026-01-23 06:51:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12171文章數(shù) 142547關(guān)注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸?guī)兹f億

      頭條要聞

      特朗普起訴美國最大銀行 索賠至少50億美元

      頭條要聞

      特朗普起訴美國最大銀行 索賠至少50億美元

      體育要聞

      跑個(gè)步而已,他們在燃什么?

      娛樂要聞

      車銀優(yōu)賺800億 涉嫌逃稅200億!

      財(cái)經(jīng)要聞

      西貝拿到“救命錢”,然后呢

      汽車要聞

      配備多塊娛樂屏 極氪8X內(nèi)飾曝光

      態(tài)度原創(chuàng)

      家居
      本地
      親子
      時(shí)尚
      公開課

      家居要聞

      法式風(fēng)情 南洋中古居

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點(diǎn)贊

      親子要聞

      真相很可怕!終于揭秘:為什么你記不住3歲前的事?

      這些才是最日常的冬季穿搭!不露腿、不扮嫩,簡約舒適又保暖

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品卡一卡二| 亚州Av无码| 国产毛片基地| 国产成人高清亚洲一区久久| 本道久久综合无码中文字幕| 国产成人精品2021欧美日韩| 无套内内射视频网站| 欧美成人一区二区三区| 郴州市| 免费无码毛片一区二三区| 国产精品久久久影院色| jizz国产免费观看| 天天看片视频免费观看| 暖暖免费观看电视在线高清| 999国产精品999久久久久久| 人与禽交av在线播放| 色综合久久88色综合天天提莫| 天堂√最新版中文在线地址| 亚洲色图另类| 熟妇图区| 精品亚洲国产成人| 奇米777四色成人影视| 男人的天堂无码动漫av| 亚洲欧洲日产国无高清码图片| 亚洲综合精品一区二区三区| 成人视频AAA| 尤物网址| 日韩AV导航| 亚洲国产区| 免费人成在线观看网站| 亚洲人成电影网站图片| 日本视频一两二两三区| 免费啪视频在线观看视频| 亚洲中文字幕无码爆乳av| 精品久久久无码中文字幕一丶| 精产国品一二三产品蜜桃| 呼玛县| √天堂资源地址在线官网| 无玛视频| 中文字幕成熟丰满人妻| 欧美人妖另类|