<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      上交大 x vivo 團隊:一個簡單改動,讓 diffusion 全面提升丨CVPR 2026

      0
      分享至

      很多人第一次覺得圖像生成模型已經足夠強,往往是在它能快速畫出一張看上去不錯的圖的時候。但真正開始頻繁使用之后,又會慢慢發現另一面。

      比如做一張活動主視覺,前幾次生成里主體、色調、氛圍都對了,可一放大細節就會發現手部、材質、邊緣關系經不起看。再比如給一篇文章配封面,模型明明理解了主題,卻總在最后呈現時把重點元素放錯位置,或者讓畫面風格和語義之間出現輕微但難以忽視的偏差。

      這正是當前生成式 AI 進入大規模應用之后,行業越來越在意的一類問題。今天的 diffusion 模型已經不缺生成能力,缺的是更穩定、更可控、也更符合真實使用過程的生成機制。

      過去幾年,行業主要依靠更大的模型、更多的數據和更強的算力推動效果上升,但當模型能力不斷逼近高位之后,很多問題開始不再表現為能不能生成,而是能不能穩定地生成對。換句話說,競爭的重點正在從模型會不會畫,轉向模型能不能在每一步都朝著正確方向畫。

      這個變化非常關鍵,因為它意味著生成模型的發展正在從規模驅動走向機制驅動。

      在這個背景下,來自上海交通大學與 vivo BlueImage Lab 的研究團隊提出了《C2FG Control Classifier Free Guidance via Score Discrepancy Analysis》。研究切中的恰恰是行業正在遇到的那個深層矛盾。

      過去廣泛使用的 guidance 方式,本質上默認生成過程中的條件引導強度可以保持固定,但真實的 diffusion 過程并不是靜止的,模型在不同階段對條件信息的依賴程度并不一樣。研究人員抓住的,正是這種長期存在卻常被經驗調參掩蓋的問題。

      從這個意義上看,C2FG 代表的不只是一次技術修補,而是一種研究視角的變化。它提醒行業,下一階段真正重要的問題,可能不再只是把模型做得更大,而是更精確地理解生成過程內部到底發生了什么,并據此重新設計控制方式。


      論文地址:https://arxiv.org/pdf/2603.08155

      C2FG 更改進了生成分布本身

      在實驗結果方面,研究團隊圍繞 ImageNet 這一核心任務首先驗證了方法的整體效果。對比可以發現,在常規的 DiT 模型上,引入 C2FG 之后最直接的變化是生成結果明顯更接近真實分布,這一點體現在 FID 從 2.29 下降到 2.07,同時 IS 從 276.8 提升到 291.5,而 Precision 基本保持在 0.83,Recall 從 0.57 上升到 0.59。

      這組變化共同說明,研究人員的方法并沒有通過犧牲質量來換取多樣性,而是在保持原有精度的情況下,同時讓生成圖像更清晰、類別更明確,并且覆蓋到更廣的真實分布區域。相比之下,如果只看單一指標,很難看出這種“同時提升多個維度”的效果,而這里的數據組合恰好體現了這一點。


      更關鍵的是,這種改進在強模型上依然成立。以 SiT-XL/2 為例,本身已經處在較高性能水平,固定 guidance 時 FID 為 1.80,而 C2FG 可以把它進一步壓到 1.51,同時 IS 從 284.0 提升到 315.0。雖然 Precision 從 0.81 略微變為 0.80,但 Recall 從 0.61 提升到 0.62,這說明整體生成能力仍然是增強的,而不是簡單的權衡變化。

      換句話說,在模型已經很強的情況下,仍然能夠在“更真實”和“更豐富”之間取得更好的平衡,這一點本身就說明問題不在模型能力,而在 guidance 機制。

      當實驗推進到更接近性能上限的設置時,這種趨勢依然存在。即使原方法已經達到 FID 1.42 這樣的水平,引入 C2FG 后仍然可以進一步降低到 1.41,這種微小但穩定的改進說明,隨著模型不斷逼近極限,誤差來源越來越集中在機制層面,而不是網絡本身。

      類似的現象也出現在更復雜的高分辨率任務中,在 512 × 512 設置下,原方法的 FID 為 6.81,而 C2FG 可以降低到 6.54,同時 IS 從 229.5 提升到 280.9,這表明在更困難的生成條件下,方法依然能夠改善圖像結構和整體清晰度,而不是只在簡單場景中有效。

      研究團隊還將驗證擴展到不同類型的任務中。在文本生成圖像任務中,雖然整體提升幅度不如 ImageNet 明顯,但趨勢保持一致,例如 U-ViT 的 FID 從 5.37 下降到 5.28,Stable Diffusion 的 CLIP 分數從 31.8 提升到 31.9,這說明這種方法不僅適用于類別條件,還對文本條件同樣有效,只是在更復雜語義約束下改進幅度會相對溫和。


      進一步在像素空間任務中,原模型已經可以達到 FID 1.58,在強 baseline 的幫助下下降到 1.04,而加入 C2FG 后仍然可以繼續降低到 1.03,這種在接近極限區域仍然存在的改進,直接說明誤差并不是來自模型表達能力,而是來自 guidance 的使用方式。雷峰網

      從更貼近實際應用的角度來看,研究人員還分析了推理步數減少時的表現。在 50 步和 20 步這兩種設置中,FID 都出現了穩定下降,并且在 20 步這種更極端的低計算預算下,提升反而更加明顯。這意味著,當每一步的決策變得更加關鍵時,動態 guidance 的優勢會被放大。

      最后,通過一個簡單的二維 toy 實驗,研究團隊展示了更直觀的現象,傳統方法會產生明顯偏離目標分布的異常樣本,而 C2FG 基本不會出現這類 outliers,生成分布也更貼近真實分布,這進一步說明改進不僅體現在視覺效果上,更體現在整體概率分布的正確性上。


      基于逐層驗證的實驗設計框架

      在實驗經過的安排上,研究團隊之所以設計這么多層次的實驗,并不只是為了說明 C2FG 比原來的方法更好,而是希望進一步回答一個更核心的問題,也就是這種方法為什么會更好。

      圍繞這個目標,研究人員搭建了一個逐層推進的驗證體系。第一層是機制驗證,重點去測條件分支和無條件分支之間的差異,結果發現這種差異并不是固定不變的,而是會隨著時間不斷變化。

      第二層是分布驗證,也就是通過 toy 實驗去觀察生成結果是否更接近真實分布,從而判斷改進究竟發生在視覺層面,還是已經深入到分布層面。

      第三層是性能驗證,研究團隊把方法放到 ImageNet 這種核心任務中,直接檢查各種指標能否得到提升。第四層是泛化驗證,在這一層里,研究人員主動更換模型、更換任務,也更換采樣方式,目的就是確認這種改進并不依賴某一種特定結構或某一種實驗條件。

      第五層則是極限驗證,專門去測試強模型和少步數這兩類更苛刻的情境,因為如果方法在這些設置下仍然有效,就更能說明它反映的是一種穩定規律,而不是偶然現象。

      這樣一層一層推進之后,整個實驗就形成了一條完整的證據鏈,最后支持的結論也就不再只是“效果更好”,而是“這種改進背后確實存在可以重復驗證的機制”。


      在這一系列實驗中,最關鍵的觀察集中在 diffusion 過程不同階段的變化上。研究人員發現,在早期階段,條件信息和無條件信息之間幾乎是接近的,二者差異很小,這意味著如果在這個時候仍然使用固定而且較強的 guidance,就容易出現引導過強的問題。

      相反,到了后期階段,這種差異會迅速增大,也就是說模型越來越需要條件信息去把生成過程拉回到目標分布附近,如果 guidance 依舊保持固定,就會顯得不夠,無法提供足夠的約束。

      正是在這個意義上,研究團隊提出的 C2FG 才顯得重要,因為它的作用不是簡單地把 guidance 變大或者變小,而是自動匹配這種隨時間變化的差異,讓前期不過強、后期不不足,從而使整個生成過程更符合真實的 diffusion 動態。


      對 diffusion 本質的修正

      從實驗意義來看,這項研究的重要性,不只是把幾個指標繼續提高了一點,而是說明研究團隊發現了 diffusion 生成模型里一個更本質的問題。

      過去很多方法默認 guidance 在整個生成過程中都可以保持固定,但實驗結果表明,問題并不只是參數怎么調,而是這種固定做法本身就不符合生成過程的實際變化。

      因為研究人員在不同任務、不同模型和不同設置下都觀察到了穩定提升,所以可以說明,C2FG 修正的不是某一種局部技巧,而是條件信息參與生成時普遍存在的偏差。這也意味著,研究真正推進的,不只是一個新方法,而是一種對生成機制更準確的理解。

      這種意義在強模型上的表現尤其有說服力。像從 1.80 降到 1.51 這樣的提升,如果放在普通模型上已經很明顯,而出現在本來就接近極限的強模型上,就更能說明剩余誤差主要不是模型能力不夠,而是 guidance 的作用方式還不夠合理。

      換句話說,研究團隊證明了,未來提升生成模型的效果,并不一定只能依賴更大的模型、更多的數據或更長的訓練時間,也可以來自對生成過程中引導機制的重新設計。

      少步數實驗的意義則更貼近日常應用。研究人員發現,步數越少,C2FG 的優勢越明顯,這說明在計算資源有限的時候,固定 guidance 帶來的誤差會被放大,而動態 guidance 更能減少這種問題。

      對普通人來說,這種改進最終可能體現在更直接的使用體驗上,比如生成速度更快,等待時間更短,對設備性能的要求更低,同時生成結果也更穩定,不容易出現模糊、跑偏或者細節崩壞。

      toy 實驗進一步說明,C2FG 改善的也不只是圖像表面的清晰度,而是讓生成結果在整體分布上更接近真實目標,這意味著普通用戶在使用生成工具時,更容易一次得到自然、合理、符合需求的結果,而不必反復修改和重試。雷峰網

      再往深一點看,這項研究的價值還在于,它讓生成模型的發展方向變得更清楚了。研究團隊最核心的貢獻,不只是把 guidance 從常數改成時間函數,而是用系統實驗說明,生成過程中的條件引導本來就應該隨著時間變化。

      這個結論不僅能幫助后續研究找到更合理的設計思路,也有機會讓現有生成系統以比較低的成本得到升級。最后落實到普通人身上,就是未來的圖像生成工具有可能變得更快、更穩,也更容易普及。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蔣介石孫子召開發布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

      蔣介石孫子召開發布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

      老謝談史
      2026-03-18 18:33:35
      明明也走了,初創主播只剩yoyo,一夜爆火出圈的東方甄選只剩回憶

      東方不敗然多多
      2026-04-25 14:39:14

      男人的生理需求能有多難忍?網友:我對我老公只有動物本能

      男人的生理需求能有多難忍?網友:我對我老公只有動物本能

      帶你感受人間冷暖
      2026-02-07 03:58:56
      百萬粉博主喊話經紀人霍汶希:張敬軒演唱會開得成,我跟你姓

      百萬粉博主喊話經紀人霍汶希:張敬軒演唱會開得成,我跟你姓

      一盅情懷
      2026-04-23 19:01:44
      孫宏斌現狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

      孫宏斌現狀:公司負債大幅減少,63歲愁白了頭,兒子成了他的驕傲

      洲洲影視娛評
      2026-04-20 15:16:52
      四川一媽媽帶兒子買高鐵票,結果相隔14個車廂,“距離遠還不相通”,12306回應:余票不足時才會被分開,可在上車后協商換座

      四川一媽媽帶兒子買高鐵票,結果相隔14個車廂,“距離遠還不相通”,12306回應:余票不足時才會被分開,可在上車后協商換座

      臺州交通廣播
      2026-04-24 23:52:56
      曝克洛普同意接掌皇馬!提出九大轉會要求,這三人必須買

      曝克洛普同意接掌皇馬!提出九大轉會要求,這三人必須買

      瀾歸序
      2026-04-25 05:46:16
      有色將重回上升通道。藏格將成為首支百元有色股。

      有色將重回上升通道。藏格將成為首支百元有色股。

      風風順
      2026-04-25 13:10:40
      有意思了,老鷹隊的庫明加將戰勝尼克斯的功勞歸于勇士隊的格林

      有意思了,老鷹隊的庫明加將戰勝尼克斯的功勞歸于勇士隊的格林

      好火子
      2026-04-25 04:32:17
      緊急通告!25日7時起,成綿高速應急搶險,臨時交通管制

      緊急通告!25日7時起,成綿高速應急搶險,臨時交通管制

      封面新聞
      2026-04-25 08:36:05
      特朗普通告全球,現在的美國要帶領全世界完成“去中國化”

      特朗普通告全球,現在的美國要帶領全世界完成“去中國化”

      果媽聊娛樂
      2026-04-25 09:22:11
      發現一個奇怪的現象:凡是情緒穩定、睡眠好、不焦慮的人,都有一個共性,那就是再大的事也不擱在心里,再惡劣的環境也能想辦法適應

      發現一個奇怪的現象:凡是情緒穩定、睡眠好、不焦慮的人,都有一個共性,那就是再大的事也不擱在心里,再惡劣的環境也能想辦法適應

      LULU生活家
      2026-04-24 19:12:24
      Shams:布朗退出公?;@球運營主管競選 公牛已開始首輪面試

      Shams:布朗退出公牛籃球運營主管競選 公牛已開始首輪面試

      北青網-北京青年報
      2026-04-25 09:53:02
      葡媒:阿莫林計劃下賽季繼續休整,他想利用這段時期精進能力

      葡媒:阿莫林計劃下賽季繼續休整,他想利用這段時期精進能力

      懂球帝
      2026-04-25 22:13:16
      蘋果8號員工干了49年:裁員名單繞著他走,因為賠不起

      蘋果8號員工干了49年:裁員名單繞著他走,因為賠不起

      世界圈
      2026-04-04 13:13:03
      重返國乒僅1周,國際乒聯對馬龍的稱呼變了,再次印證劉國梁的話

      重返國乒僅1周,國際乒聯對馬龍的稱呼變了,再次印證劉國梁的話

      什么都嘮嘮
      2026-04-24 22:03:04
      4月起,個人所得稅不能再零申報了!這3類人不得申報工資薪金

      4月起,個人所得稅不能再零申報了!這3類人不得申報工資薪金

      祥順財稅俱樂部
      2026-04-25 09:09:12
      以為我在“洗白”安祿山,你錯了,這才是歷史上真實的安祿山

      以為我在“洗白”安祿山,你錯了,這才是歷史上真實的安祿山

      抽象派大師
      2026-04-25 18:46:59
      新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

      新款大眾ID. Buzz官圖發布!網友:價格25萬起,肯定排隊

      汽車網評
      2026-04-23 23:00:31
      湖人最大功臣出爐,老詹兩點該夸!斯瑪特直言不諱,雷迪克也認錯

      湖人最大功臣出爐,老詹兩點該夸!斯瑪特直言不諱,雷迪克也認錯

      魚崖大話籃球
      2026-04-25 12:15:36
      2026-04-26 00:52:49
      雷峰網 incentive-icons
      雷峰網
      關注智能與未來!
      69155文章數 656118關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4發布!黃仁勛預言的"災難"降臨

      頭條要聞

      媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

      頭條要聞

      媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財經要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態度原創

      藝術
      旅游
      本地
      手機
      游戲

      藝術要聞

      最適合作為抖音總部的大樓,它在福建莆田!

      旅游要聞

      美猴王VS水蜜桃,連云港、無錫文旅“雙向奔赴”

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      手機要聞

      iPhone Ultra機模上手:11mm厚、無長焦,蘋果第一折就這?

      金發美少女魔王和我是鄰居!新游首曝美女角色太吸睛

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人妻人人狠人人爽天天综合网| а天堂中文最新一区二区三区| 男人天堂网址| 午夜亚洲av永久无码精品| 免费无码av片在线观看网站| 一区二区三区激情免费视频| 亚洲 欧美 综合 另类 中字| 激情图区| 无遮挡粉嫩小泬久久久久久久| 97久草| 亚洲一道一本快点视频| 国产精品亚洲аv无码播放| 久久伊人五月丁香狠狠色| 偷国产乱人伦偷精品视频| 日本一区二区国产高清在线播放| 欧美性色黄大片| 日本在线观看| 2020久久香蕉国产线看观看| 亚洲最大成人| 九九国产在线视频| 免费看国产精品3a黄的视频| 亚洲欧美日韩国产一区二区精品| 欧美肥老太交视频免费| 熟妇人妻午夜寂寞影院| 中文字幕av免费专区| 国产免费人成视频网| 久久九九精品99国产精品| 涟源市| 国产无遮挡又黄又爽高潮| 伊人高清在线视频| 久久天天躁夜夜躁狠狠| 香蕉视频在线国产| 国产真实乱子伦精品视手机观看| 亚洲青青草视频在线播放| 国产手机在线精品| 人妻偷拍一区二区三区| 欧美日韩国产一区二区三区欧| 精品国产一二三产品价格| 成人中文在线| 亚洲无人区码一码二码三码的含义| 诏安县|