<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      中科院、港中文等提出HiFi-Inpaint:重塑Inpainting生成范式!

      0
      分享至

      HiFi-Inpaint 的整體框架,包含了數據集構建流程、高頻特征提取、SEA 模塊以及 DAL 損失。采用固定的高頻權重(Fixed)往往會導致特征沖突,在重繪區域產生明顯的視覺偽影;而 SEA 模塊巧妙地引入了可學習的權重因子(Learnable),使高頻細節的注入更加平滑、自適應,最終生成的 “人 + 商品” 圖像在光影與結構上更加和諧真實。傳統的 Canny 邊緣檢測會無差別地提取所有輪廓,引入大量無用的背景雜亂信息(如紅框所示);而 HiFi-Inpaint 采用的特定頻域濾波方法(Ours)能夠精準高亮商品上的關鍵文字、Logo 與精細紋理(如藍框所示),從而為 DAL 損失提供最純凈、最精確的像素級監督信號 。左側直方圖展示了極為廣泛的 Mask 面積占比分布,這意味著模型在訓練后能自適應從 “小掛件” 到 “大物件” 的各種生成比例;右側詞云圖則凸顯了極其豐富的商品類別,為模型學習真實世界中千變萬化的產品材質、形狀和物理結構打下了極其堅實的數據基石。與 ACE++、Insert Anything 和 FLUX-Kontext 相比,HiFi-Inpaint 能夠完美還原瓶身上的微小文字、Logo 和瓶蓋紋理,拒絕 “AI 幻覺”。HiFi-Inpaint 在多項自動評估指標上取得最佳性能(上:合成測試數據,下:真實測試數據)。圖注:無論是戶外無人物理環境、大姿態全身視角、復雜商品遮擋,還是大幅度的風格遷移(如漫畫風),HiFi-Inpaint 都能游刃有余。



      在 AIGC 領域,基于參考圖像的圖像修復(Reference-based Inpainting)一直是一項備受關注的核心任務,它旨在利用參考圖像引導修復過程,生成視覺一致的內容。這一技術在廣告營銷和電商領域有著巨大的應用潛力,例如讓 AI 自動生成 “真人手持或穿戴商品” 的展示圖。然而,真實世界的商業應用對高保真度有著極其苛刻的要求。現有的模型在處理這類高標準任務時常常 “翻車”,尤其是在精細細節的保留上顯得力不從心:品牌 Logo 扭曲、包裝文字亂碼、產品紋理丟失等問題,成為了阻礙技術落地的最大痛點。

      為了攻克這一難題,來自中國科學院大學、香港中文大學等機構的研究團隊聯合提出了HiFi-Inpaint模型。該工作深入探索了參考圖像修復的本質,通過創新性地引入高頻特征引導機制,實現了令人驚嘆的高保真細節還原。目前,該項工作已被計算機視覺頂級會議CVPR 2026接收。



      • 論文標題:HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images
      • 論文鏈接: https://arxiv.org/abs/2603.02210
      • 項目主頁: https://correr-zhou.github.io/HiFi-Inpaint

      行業痛點:為什么商品細節這么難搞?

      雖然當前的擴散模型(Diffusion Models)在圖像生成上取得了革命性進展,甚至能通過圖像定制或文本驅動編輯來生成內容,但在處理高度定制化的 “人 + 商品” 圖像時,依然力不從心 。

      現有的“基于參考圖像的圖像修復(Reference-based Inpainting)”方法提供了一個解決思路,但在實際應用中仍面臨三大阻礙 :

      1.細節易丟失: 擴散模型的去噪過程傾向于將內容 “平均化” 或產生幻覺,導致紋理、形狀和品牌元素(如文字)的嚴重不一致。

      2.監督信號粗糙: 傳統的隱空間(Latent Space)MSE 損失無法提供精確到像素級別的指導,難以約束高頻細節。

      3.缺乏高質量數據: 大規模、多樣化且精準對齊的 “人 + 商品” 開源訓練數據極度匱乏。

      核心洞察與解決方案:HiFi-Inpaint

      為了解決上述問題,研究團隊提出了HiFi-Inpaint。它的核心 Insight 在于:既然隱空間容易丟失高頻信息,那就顯式地將 “高頻特征” 提取出來,直接注入到網絡結構和損失函數中!



      HiFi-Inpaint 能夠將商品參考圖無縫融合到帶 Mask 的人物圖像中,同時保持極高保真度的細節還原。

      HiFi-Inpaint 基于 FLUX.1-Dev 架構進行了深度改造 ,其三大核心創新點如下:



      1. 結構創新:共享增強注意力(Shared Enhancement Attention, SEA)

      為了在重繪區域精準保留商品特征,研究團隊設計了共享增強注意力模塊。它利用共享的雙流視覺 DiT 塊來細化 Mask 區域內的視覺 Token。具體而言,模型在另一個分支中將商品圖像的 Token 替換為對應的高頻圖 Token,通過學習一個權重因子,將高頻特征注入回主干網絡:



      這種設計既增強了模型捕獲復雜商品特征的能力,又因為參數共享機制,保持了模型的緊湊性(每個模塊僅引入了一個額外參數)。



      2. 訓練策略:細節感知損失(Detail-Aware Loss, DAL)

      僅僅在模型結構上發力還不夠。為了彌補隱空間監督的不足,研究團隊引入了細節感知損失函數。這是一種利用高頻像素級監督的損失函數:



      它專門針對 Mask 區域內的高頻成分(如文字邊緣、圖案紋理)進行約束,有效指導了那些難以僅通過潛在級別監督恢復的細粒度細節的重建。



      3. 數據破局:構建 HP-Image-40K 數據集

      為了打破數據瓶頸,團隊提出了一套自動化的 “自合成與過濾” 流水線,構建了包含 4 萬多張 高質量樣本的數據集HP-Image-40K。 流程包括:使用 FLUX.1-Dev 生成雙聯圖(左側商品,右側人 + 商品)-> 邊緣檢測分割 ->YOLOv8 與 CLIP 進行語義一致性過濾 -> InternVL 進行文本重合度(Textual Filtering)過濾。這保證了訓練數據中商品文字和形態的高度一致性。



      驚艷的效果對比

      有了高頻特征引導和高質量數據的加持,HiFi-Inpaint 在定量和定性評估上都展現出了統治力。



      在自動評估指標中,HiFi-Inpaint 在文本對齊(CLIP-T)、視覺一致性(CLIP-I 達到 0.950,DINO 達到 0.919)和結構相似度(SSIM-HF 達到 0.429)上均取得了 SOTA(State-of-the-Art) 的表現 。





      此外,即使在更為復雜、未見過的真實世界數據集(包含復雜光照、遮擋、室內外場景)上,HiFi-Inpaint 依然表現出了強大的泛化能力和魯棒性,能夠自然地將目標商品融入場景并保留關鍵視覺屬性 。



      總結與思考 (Takeaways)

      HiFi-Inpaint 的出現,為電商海報生成、商品虛擬試用等商業落地場景掃清了一大障礙。它的成功給我們帶來了兩個核心啟發:

      1.高頻信號不可忽視: 在生成模型全面走向高保真度要求的今天,單純依賴網絡 “自己領悟” 隱空間特征在某些任務中是不夠的。顯式地引入傳統圖像處理中的先驗(如通過傅里葉變換提取高頻圖),能為模型提供極其精準的 “錨點”。

      2.Data-Centric AI 依然奏效: 利用大模型進行自動化數據合成與多重嚴格過濾,并進行自蒸餾學習,是突破領域數據匱乏的高效途徑。

      目前該工作已被頂級計算機視覺會議 CVPR 2026 接收。期待未來能在更多商業和視頻生成場景中看到它的身影。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊朗公布停戰條件:47年了,必須做個了斷!伊朗新一輪導彈襲擊:突破以色列多個防御系統;以財長:將吞并黎巴嫩南部

      伊朗公布停戰條件:47年了,必須做個了斷!伊朗新一輪導彈襲擊:突破以色列多個防御系統;以財長:將吞并黎巴嫩南部

      每日經濟新聞
      2026-03-24 18:56:44
      臺獨大金主身中29槍暴斃

      臺獨大金主身中29槍暴斃

      雪中風車
      2026-03-24 20:19:46
      東契奇成湖人隊史近20年最快單季2000分先生,比肩05-06科比

      東契奇成湖人隊史近20年最快單季2000分先生,比肩05-06科比

      林子說事
      2026-03-25 08:37:17
      烏克蘭摧毀波羅的海最大的俄方港口!圣彼得堡機場被迫關閉

      烏克蘭摧毀波羅的海最大的俄方港口!圣彼得堡機場被迫關閉

      項鵬飛
      2026-03-23 20:18:18
      岳云鵬現身上海,氣場跟以前完全不一樣了,助理當街抽煙也不避諱

      岳云鵬現身上海,氣場跟以前完全不一樣了,助理當街抽煙也不避諱

      仙味少女心
      2026-03-24 16:47:29
      前兩把賭輸,日本押上第三次

      前兩把賭輸,日本押上第三次

      極目新聞
      2026-03-25 08:08:59
      我退休金2580元,退休后發現大多企退女人拿2000多退休金挺知足的

      我退休金2580元,退休后發現大多企退女人拿2000多退休金挺知足的

      牛鍋巴小釩
      2026-03-25 16:03:01
      “90后”清華博士出任副市長,干部越來越“年輕化”

      “90后”清華博士出任副市長,干部越來越“年輕化”

      新民周刊
      2026-03-24 18:33:24
      美空軍雜志:美軍戰損2架F-35、9架F-15、6架F-16、7架加油機!

      美空軍雜志:美軍戰損2架F-35、9架F-15、6架F-16、7架加油機!

      勝研集
      2026-03-25 00:02:51
      300架運-20,不是上限是底線!2030年中國軍工,將交出硬核答案

      300架運-20,不是上限是底線!2030年中國軍工,將交出硬核答案

      混沌錄
      2026-03-25 19:50:07
      寶馬終于“出手”了!X5馬年版專為國人打造,3.0T六缸僅68萬

      寶馬終于“出手”了!X5馬年版專為國人打造,3.0T六缸僅68萬

      車界八卦
      2026-03-24 17:07:12
      伊駐巴大使:友好國家在與各方溝通 但伊朗未與美國展開談判

      伊駐巴大使:友好國家在與各方溝通 但伊朗未與美國展開談判

      財聯社
      2026-03-25 15:35:10
      18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

      18歲的姚晨在肯德基工作時的一張照片,那時就難掩渾身的好氣質

      娛你同歡
      2026-03-17 16:08:28
      風向真變了!各國專家媒體紛紛表示,中國已無需再向世界證明什么

      風向真變了!各國專家媒體紛紛表示,中國已無需再向世界證明什么

      樂趣紀史
      2026-03-25 20:06:17
      狼來了!四川雪寶頂保護區首次清晰記錄到狼:填補物種分布空白 “滾滾”們有了新鄰居

      狼來了!四川雪寶頂保護區首次清晰記錄到狼:填補物種分布空白 “滾滾”們有了新鄰居

      紅星新聞
      2026-03-25 16:38:16
      美國政府有關部門決定禁止進口所有外國制造路由器 外交部回應

      美國政府有關部門決定禁止進口所有外國制造路由器 外交部回應

      新京報
      2026-03-25 20:27:41
      中國選美冠軍白欣禾,胸前的美人痣真好看,仙氣飄飄像劉奕菲

      中國選美冠軍白欣禾,胸前的美人痣真好看,仙氣飄飄像劉奕菲

      可樂談情感
      2026-03-24 18:06:38
      張雪峰去世后,死因曝光,他錯過2次活命機會,給年輕人敲響警鐘

      張雪峰去世后,死因曝光,他錯過2次活命機會,給年輕人敲響警鐘

      李昕言溫度空間
      2026-03-25 20:03:51
      日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

      日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

      瑛派兒老黃
      2026-03-23 16:53:21
      徐必久任生態環境部副部長,劉海波任國家機關事務管理局副局長

      徐必久任生態環境部副部長,劉海波任國家機關事務管理局副局長

      新京報
      2026-03-25 16:10:22
      2026-03-25 20:51:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12598文章數 142593關注度
      往期回顧 全部

      科技要聞

      紅極一時卻草草收場,Sora宣布正式關停

      頭條要聞

      伊朗放話愿意與"主和派"萬斯談 特朗普表態

      頭條要聞

      伊朗放話愿意與"主和派"萬斯談 特朗普表態

      體育要聞

      35歲替補門將,憑什么入選英格蘭隊?

      娛樂要聞

      張雪峰經搶救無效不幸去世 年僅41歲

      財經要聞

      管濤:中東局勢如何影響人民幣匯率走勢?

      汽車要聞

      智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

      態度原創

      家居
      本地
      房產
      手機
      軍事航空

      家居要聞

      輕奢堇天府 小資情調

      本地新聞

      來永泰同安 赴一場春天的約會

      房產要聞

      41億!259畝!建學校…三亞這個大城更,最新方案曝光!

      手機要聞

      一加15T線下上手體驗:不吐不快,說說真實感受!

      軍事要聞

      伊朗重申非交戰國家船只可安全通過霍爾木茲海峽

      無障礙瀏覽 進入關懷版