<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      浙大提出ContextGen,實現(xiàn)布局錨定多實例生成新SOTA

      0
      分享至



      隨著擴散模型(Diffusion Models)的迭代演進,圖像生成已經(jīng)日臻成熟。然而,在多實例圖像生成(Multi-Instance Image Generation, MIG)這一有著大量用戶場景的關鍵領域,現(xiàn)有的方法仍面臨核心瓶頸:如何同時實現(xiàn)對多個對象的空間布局控制(Layout Control)以及身份特征的良好保持(Identity Preservation)。

      主流方法往往無法做到兩全其美:依賴文本和布局引導(Layout-to-Image)的模型往往難以實現(xiàn)高度的實例定制化,且實例遺漏、屬性泄露的問題時有發(fā)生;而主流的主體驅(qū)動(Subject-driven)方法在主體數(shù)量增加時,面臨著嚴重的身份混淆和細節(jié)丟失的問題。



      ContextGen 與主流 SOTA 的對比示例,以及 ContextGen 的使用例

      為解決這一制約高度定制化圖像生成的難題,浙江大學 ReLER 團隊發(fā)布 ContextGen,一個新型的基于Diffusion Transformer (DiT)的框架,旨在通過上下文學習,可靠地完成圖像引導的多實例生成任務!



      • 論文地址:https://arxiv.org/abs/2510.11000
      • 項目地址:https://nenhang.github.io/ContextGen
      • 開源代碼:https://github.com/nenhang/ContextGen
      • 開源模型:https://huggingface.co/ruihangxu/ContextGen

      ContextGen 提出了全新的上下文生成范式,通過整合布局圖像和多張參考圖像,將布局控制與身份保持的挑戰(zhàn)轉(zhuǎn)化為統(tǒng)一的上下文建模問題。

      雙核驅(qū)動:實現(xiàn)布局與身份的雙重保真

      ContextGen 的雙重核心機制,共同作用于統(tǒng)一的上下文 Token 序列上:



      ContextGen 框架結(jié)構概覽

      上下文布局錨定(Contextual Layout Anchoring, CLA)

      CLA 機制聚焦于全局上下文的引導,接受用戶設計(或者模型自動拼合)的布局圖像作為輸入,以提供精確的全局布局控制和初步的身份信息。它通過在 DiT 模塊的前置層和后置層部署自注意力機制,確保文本、待生成圖像和布局圖像三者進行充分注意力交互,對整體圖像結(jié)構進行有效控制。

      身份一致性注意力(Identity Consistency Attention, ICA)

      ICA 機制聚焦細粒度的身份注入,利用原始高保真度的參考圖像,將身份信息注入到其對應的目標位置,從而保障多個實例的身份一致性。它被部署到 DiT 模塊的中間層,通過一個隔離式的注意力掩碼,將參考圖像的 Token 與對應待去噪?yún)^(qū)域的 Token 建立連接,旨在緩解重疊或者壓縮導致的細節(jié)丟失問題,并在圖像序列增長時保證身份信息的穩(wěn)定注入。

      這種的層次化的雙重注意力策略,有效地讓框架兼具了宏觀的布局控制和精細的實例級身份保持。此外,ContextGen 還采用了增強的位置索引策略,系統(tǒng)性地區(qū)分和組織統(tǒng)一 Token 序列中多圖像之間的關系。

      數(shù)據(jù)基石:大規(guī)模詳細標注的多實例數(shù)據(jù)集

      針對當前領域高質(zhì)量訓練數(shù)據(jù)稀缺的現(xiàn)狀,團隊同時推出了IMIG-100K 數(shù)據(jù)集。這是首個為圖像引導的多實例生成任務設計的大規(guī)模、具備不同難度層級、提供詳細布局和身份標注的合成數(shù)據(jù)集,其構建流程代碼也已經(jīng)開源,支持用戶根據(jù)自身需求生成定制化數(shù)據(jù)集。



      IMIG-100K 數(shù)據(jù)集概覽



      IMIG-100K 的布局、身份標注

      性能優(yōu)化:DPO 強化學習解放創(chuàng)造力

      團隊在訓練過程中發(fā)現(xiàn),僅僅使用監(jiān)督微調(diào)容易使得模型過度參考布局圖像,導致生成的圖像缺乏多樣性和靈活性。為此,在監(jiān)督微調(diào)之外,ContextGen 還引入了基于偏好優(yōu)化(DPO)的強化學習階段。該階段將布局圖像作為非偏好輸入,鼓勵模型不僵硬復制布局內(nèi)容,生成更具創(chuàng)意和多樣性的圖像。



      DPO 微調(diào)過程示例

      實驗驗證:對標閉源模型,樹立性能標桿

      在廣泛的定量和定性評估中,ContextGen 展現(xiàn)出卓越的 SOTA 性能。

      身份保持:比肩閉源巨頭

      在LAMICBench++基準測試中,ContextGen 不僅超越了所有開源模型(平均得分提升+1.3%),更在身份一致性上比肩了一些閉源的商業(yè)巨頭,在多實例的復雜場景中,ContextGen 在人物身份保持 (IDS) 和物體特征保持 (IPS) 上甚至可以和 GPT-4o 和 Nano Banana 一較高下。



      LAMICBench++ 基準的定量對比



      LAMICBench++ 基準的定性對比1



      LAMICBench++ 基準的定性對比2

      布局與屬性控制:準確率大幅提升

      在COCO-MIG上,ContextGen 在實例級成功率 (I-SR) 上提升+3.3%,空間準確性 (mIoU) 提升+5.9%。 在LayoutSAM-Eval中,ContextGen 在顏色、材質(zhì)等屬性的正確率上也超過了現(xiàn)有的模型。



      COCO-MIG 和 LayoutSAM-Eval 基準的定量比較



      COCO-MIG 基準的定性比較



      LayoutSam-Eval 基準的定性比較

      這些結(jié)果充分證明了 ContextGen 在多實例圖像生成任務中的強大能力,成功實現(xiàn)了對布局和身份的雙重精確控制。

      前端支持:便捷的用戶交互

      為了方便用戶體驗,在項目中團隊增加了一個簡單易用的前端界面,支持用戶上傳參考圖像、以文本的形式添加新素材、通過拖拽方便地設計布局,生成多實例圖像。



      ContextGen 前端交互界面

      展望與未來

      ContextGen 通過帶有雙重注意力的上下文機制,為高度可控的多實例生成提供了一個強大且可行的 DiT 框架。ReLER 團隊進一步提出,如何更智能地理解用戶的文本意圖與多模態(tài)參考,仍然是一個值得深入探索的課題。未來,團隊計劃進一步優(yōu)化模型架構,提升生成效率,并探索更多樣化的用戶交互方式,以滿足更廣泛的應用需求。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      美國經(jīng)濟2025年第三季度增長4.3%

      美國經(jīng)濟2025年第三季度增長4.3%

      新華社
      2025-12-23 22:05:03
      30多名員工聯(lián)名舉報!這次,82歲徐湖平恐不是"退休養(yǎng)病"這么簡單

      30多名員工聯(lián)名舉報!這次,82歲徐湖平恐不是"退休養(yǎng)病"這么簡單

      奇思妙想草葉君
      2025-12-22 20:02:05
      陳震“解封門”大反轉(zhuǎn),一切都結(jié)束了

      陳震“解封門”大反轉(zhuǎn),一切都結(jié)束了

      品牌頭版
      2025-12-23 18:11:35
      來廣營13號線事故真相公布:1死1傷,11人被問責!

      來廣營13號線事故真相公布:1死1傷,11人被問責!

      來廣營鄰友圈
      2025-12-23 15:07:42
      上海交大JACS:仿生“分子肌肉”破解固態(tài)電解質(zhì)瓶頸,打造高安全、長壽命鋰金屬電池

      上海交大JACS:仿生“分子肌肉”破解固態(tài)電解質(zhì)瓶頸,打造高安全、長壽命鋰金屬電池

      高分子科學前沿
      2025-12-22 07:54:16
      泰柬沖突又有新狀況,中國89式反坦克火箭彈竟被木棍攔下?

      泰柬沖突又有新狀況,中國89式反坦克火箭彈竟被木棍攔下?

      新時代精神
      2025-12-22 22:24:24
      馬卡:C羅在紅海購入兩棟豪華別墅,享受私密寧靜的家庭時光

      馬卡:C羅在紅海購入兩棟豪華別墅,享受私密寧靜的家庭時光

      懂球帝
      2025-12-23 21:16:16
      她圖啥?清純女生拉著黑人男友在街上逛街,臉上的笑容很自豪

      她圖啥?清純女生拉著黑人男友在街上逛街,臉上的笑容很自豪

      詩意世界
      2025-12-15 15:00:03
      上海著名985高校“擴容”!新校區(qū)規(guī)劃公布→

      上海著名985高校“擴容”!新校區(qū)規(guī)劃公布→

      上觀新聞
      2025-12-23 21:42:07
      劉衛(wèi)東被查前,干了兩件最不要臉的事。

      劉衛(wèi)東被查前,干了兩件最不要臉的事。

      南權先生
      2025-12-18 16:50:39
      死刑!發(fā)小害死妻兒案宣判!家屬拒注射死刑,文明不該給兇手體面

      死刑!發(fā)小害死妻兒案宣判!家屬拒注射死刑,文明不該給兇手體面

      涼湫瑾言
      2025-12-23 16:02:09
      新F4演唱會上,周渝民就快讓人認不出來了,這濃濃的“人夫感”啊

      新F4演唱會上,周渝民就快讓人認不出來了,這濃濃的“人夫感”啊

      安寧007
      2025-12-22 23:55:02
      詹姆斯:SGA很會利用身體接觸制造犯規(guī),他有點像火箭時期的哈登

      詹姆斯:SGA很會利用身體接觸制造犯規(guī),他有點像火箭時期的哈登

      移動擋拆
      2025-12-24 03:57:39
      2026年1月1日物業(yè)新政落地!居委會實權管物業(yè),公共收益能分錢?

      2026年1月1日物業(yè)新政落地!居委會實權管物業(yè),公共收益能分錢?

      石辰搞笑日常
      2025-12-24 00:12:24
      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

      深度報
      2025-12-14 22:36:54
      越共十四大臨近,當局通過領導人推薦名單,高層權力將如何重組?

      越共十四大臨近,當局通過領導人推薦名單,高層權力將如何重組?

      40度觀察
      2025-12-23 18:48:20
      30歲女教師出軌已婚男5年:顏值照出眾,原配發(fā)聲,聊天記錄曝光

      30歲女教師出軌已婚男5年:顏值照出眾,原配發(fā)聲,聊天記錄曝光

      詩意世界
      2025-12-23 14:54:48
      第一批免簽去俄羅斯的中產(chǎn)傻眼了

      第一批免簽去俄羅斯的中產(chǎn)傻眼了

      風向觀察
      2025-12-16 18:26:08
      貴州一小區(qū)自來水變藍8個月,拆卸的管道內(nèi)發(fā)現(xiàn)油漆狀物質(zhì),20多人檢出身體異常,官方回應

      貴州一小區(qū)自來水變藍8個月,拆卸的管道內(nèi)發(fā)現(xiàn)油漆狀物質(zhì),20多人檢出身體異常,官方回應

      封面新聞
      2025-12-22 22:57:07
      孫允珠 性感尤物

      孫允珠 性感尤物

      可樂談情感
      2025-12-23 14:58:58
      2025-12-24 06:15:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11980文章數(shù) 142518關注度
      往期回顧 全部

      科技要聞

      慘烈90分鐘!快手驚魂:遭遇最強黑產(chǎn)攻擊

      頭條要聞

      與多名女子在泳池大尺度照片披露 克林頓最新回應

      頭條要聞

      與多名女子在泳池大尺度照片披露 克林頓最新回應

      體育要聞

      楊瀚森連續(xù)5場DNP!開拓者遭活塞雙殺

      娛樂要聞

      朱孝天回應阿信感謝,自曝沒再收到邀約

      財經(jīng)要聞

      祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

      汽車要聞

      四款新車集中發(fā)布 星途正式走進3.0時代

      態(tài)度原創(chuàng)

      游戲
      健康
      教育
      旅游
      軍事航空

      任天堂獨占!Bloober恐怖新作即將揭曉:生化粉肯定愛

      這些新療法,讓化療不再那么痛苦

      教育要聞

      班級太浮躁,該怎么辦?

      旅游要聞

      冰雪游熱度高 南北游客“雙向奔赴”帶動機票銷售

      軍事要聞

      俄烏沖突關鍵人物在莫斯科被炸死 烏方尚未公開認領

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美黑人又粗又大久久久| 久久国产AV| 91丨露脸丨熟女精品| 亚洲av电影天堂| 国产成人无码精品亚洲| 亚洲中文字幕av无码区| 亚洲日韩国产二区无码| 国产日产亚洲系列av| 亚洲一区二区AV| 国产wwww| 成人乱人伦精品小说| 久久精品人妻中文系列| 女人腿张开让男人桶爽| 粉嫩av懂色av蜜臀av熟妇| 欧美?级毛片一进一出夜本色| 欧美日韩不卡视频合集| 丰满妇女毛茸茸刮毛| 无码内射中文字幕岛国片| 伊人无码视频| av中文资源在线| 人妻丰满熟av无码区hd| 欧美牲交a欧美牲交aⅴ一| 日韩无码中出| 亚洲综合无码| 一本大道东京热无码| 国产精品美女一区二三区| 激情图区| 亚洲精品不卡无码福利在线观看| 久久天天躁狠狠躁夜夜不卡| 久久精品国产久精国产| 色欲av永久无码精品无码蜜桃| 蜜桃av一卡二卡三卡| 亚洲学生妹高清av| 欧美老少配性行为| 久草综合视频| 免费国产女王调教在线视频| 色噜噜狠狠色综合日日| 尹人香蕉久久99天天拍| 昭苏县| 国产xxxx做受视频| 熟女[21p]|