<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      打破SAM交互限制,基于循環一致性的圖像與視頻上下文分割方法

      0
      分享至



      上下文分割(In-Context Segmentation)旨在通過參考示例指導模型實現對特定目標的自動化分割。盡管 SAM 憑借卓越的零樣本泛化能力為此提供了強大的基礎,但將其應用于此仍受限于提示(如點或框)構建,這樣的需求不僅制約了批量推理的自動化效率,更使得模型在處理復雜的連續視頻時,難以維持時空一致性。

      北京郵電大學聯合南洋理工大學等機構發表的 IEEE TPAMI 期刊論文《DC-SAM: In-Context Segment Anything in Images and Videos via Dual Consistency》,不僅為圖像和視頻的上下文分割建立了統一的高效框架DC-SAM,還構建了首個視頻上下文分割基準IC-VOS

      研究團隊巧妙地提出基于提示微調的 “循環一致性” 機制,通過正負雙分支與循環一致性注意力的協同,配合 Mask-Tube 策略,實現了 SAM 與 SAM2 在圖像及視頻上下文分割任務上的統一與高效適配。

      實驗結果顯示,DC-SAM 在多個基準測試中均取得了 SOTA 性能:在 COCO-20i 上達到 55.5 mIoU,在 Pascal-5i 上達到 73.0 mIoU;在新建的 IC-VOS 視頻基準上,J&F 得分高達 71.52,顯著優于現有方法。該篇論文已被IEEE TPAMI錄用。



      • 論文標題:DC-SAM: In-Context Segment Anything in Images and Videos via Dual Consistency
      • 論文鏈接:https://arxiv.org/pdf/2504.12080
      • 代碼鏈接:https://github.com/zaplm/DC-SAM

      研究背景

      近年來,以 SAM 和 SAM2 為代表的視覺基礎模型憑借海量訓練數據,展現了卓越的交互式分割能力,已成為醫學影像、開放詞匯分割等下游任務的強大基石。然而,盡管 SAM 在 “分割一切” 上表現出色,卻缺乏 “上下文分割”(In-Context Segmentation)的能力 —— 即無法僅憑一張參考示例(Support Image)及其掩碼,自動在查詢圖像(Query Image)中分割出同類目標。

      為了彌補這一短板,早期的少樣本學習方法多依賴度量學習,但泛化能力有限。雖然 SegGPT 等通用模型通過大規模圖文對訓練實現了上下文分割,但其計算資源消耗巨大。相比之下,提示微調(Prompt Tuning)提供了一條高效路徑。然而,現有的 SAM 適配方法(如 VRP-SAM)主要依賴骨干網絡提取的通用特征,忽略了 SAM 自身提示編碼器(Prompt Encoder)的特征特性,且往往未能充分利用背景(負樣本)信息來約束分割邊界,導致生成的提示精度不足。

      此外,視頻領域的上下文分割研究尚處于空白階段。現有的視頻分割基準(如 DAVIS、MOSE)主要側重于給定首幀掩碼的半監督跟蹤任務,缺乏評估 “基于參考示例進行視頻分割” 能力的專用基準。

      針對上述挑戰,研究團隊推出了首個視頻上下文分割基準 IC-VOS,并同步提出了DC-SAM 框架。該框架旨在通過提示微調技術,將 SAM 與 SAM2 的能力無縫遷移至這一新任務,實現了統一高效的圖像與視頻上下文分割。



      DC-SAM與現有方法的對比圖。 a) 方法對比圖,b) 預測可視化對比圖,c)得分對比圖。

      IC-VOS:首個面向上下文視頻分割的大規模基準數據集

      在研究過程中,研究團隊發現該領域缺乏一個專門用于評估 “上下文視頻對象分割” 的統一基準。現有的 VOS 數據集大多側重于第一幀掩碼的追蹤,而傳統的 Few-shot 圖像數據集則完全丟失了時間維度。

      為了填補這一空白,研究團隊推出了IC-VOS (In-Context Video Object Segmentation) 數據集。這是首個旨在全面衡量模型在視頻上下文中學習能力的數據集。IC-VOS 涵蓋了極其豐富的場景,包括極小目標分割、快速運動變形以及復雜背景融合等。



      IC-VOS 分割基準:a) 數據來源,b) 詞云圖,c) 類別分布,d) 示例樣本。

      DC-SAM 框架

      DC-SAM 框架由三個核心部分組成:基于 SAM 的特征融合正負雙分支循環一致性提示生成,以及面向視頻的 Mask-tube 訓練策略。該框架旨在充分利用 SAM 的特征空間,通過顯式的正負樣本約束和循環校驗,生成高精度的視覺提示。



      DC-SAM方法概覽圖。

      基于 SAM 的特征融合

      現有的上下文分割方法通常僅依賴于預訓練骨干網絡(如 ResNet 或 DINOv2)提取特征,這導致生成的 Prompt 與 SAM 內部的特征空間存在 “語義鴻溝”。









      基于 SAM 的多源特征融合方法圖

      正負雙分支循環一致性提示生成

      正負雙分支循環一致性提示生成是 DC-SAM 的核心模塊。為了解決單一前景提示帶來的邊界模糊問題,研究團隊設計了正負雙分支(Dual-Branch)結構:



      在每個分支內部,為了防止 “語義漂移”(即錯誤匹配非目標區域),研究團隊引入了循環一致性交叉注意力(Cyclic Consistent Cross-Attention)。其核心思想是:只有當支持圖像中的像素 j 與查詢圖像中的匹配像素 j* 滿足語義類別一致時,才保留該注意力權重;否則,通過偏置項 B 將其屏蔽:



      基于該偏置項,可以計算經過循環校驗的注意力輸出,確保生成的 Prompt 僅聚合高度可信的特征:



      最終,正負分支生成的 Prompt 分別疊加 SAM 預訓練的 Pos/Neg Embeddings,共同指導 Mask Decoder 生成精準掩碼。



      正負雙分支循環一致性提示生成方法圖

      面向視頻的 Mask-tube 訓練策略及模型優化

      得益于 SAM 與 SAM2 在 Prompt Encoder 上的架構一致性, DC-SAM 可以無縫遷移至視頻領域。為了賦予模型處理時空動態的能力,研究團隊設計了輕量級的Mask-tube(掩碼管道)訓練策略,通過數據增強將靜態圖像堆疊為偽視頻序列,從而模擬連續幀之間的時序變化。

      在優化階段,無論是圖像還是視頻流的預測,均由二元交叉熵損失(BCE Loss)和相似度度量損失(Dice Loss) 共同約束。最終的總損失函數定義為兩者的加權和,以平衡局部像素分類與整體區域重疊度的優化目標(超參數 λ 經驗性地設置為 1):



      性能評估與實驗分析

      核心結果方面,DC-SAM 在圖像上下文分割基準 COCO-20i 和 Pascal-5i 上取得顯著性能優勢。與基礎視覺模型對比,即使面對使用了海量圖文對訓練的通用模型 SegGPT(56.1 mIoU),基于 DINOv2 的 DC-SAM 依然在 COCO-20i 上取得了 62.0 mIoU 的成績,實現了近 6% 的性能反超,證明了所提出提示微調方法的泛化能力。與 基于 SAM 的方法對比,在同等骨干網絡(ResNet50)下,DC-SAM 全面超越現有的 SAM 適配方法,即使對比最強的基準模型 VRP-SAM,也在COCO-20i 超越了 1.6%,證明 SAM 特征融合方法以及 Prompt 生成的有效性。



      在團隊首創的視頻基準 IC-VOS 上,DC-SAM 取得了 71.52 的 J&F 得分,以 6.4% 的顯著優勢超越了 VRP-SAM,并大幅領先 PerSAM。這不僅充分驗證了 Mask-tube 策略的有效性,更證明了循環一致性約束能有效抑制視頻傳播過程中的語義漂移,實現穩健的目標鎖定。



      為了直觀評估模型性能,研究團隊對 Pascal-5i 和 IC-VOS 上的分割結果進行了可視化分析。在圖像任務中,DC-SAM 展現了對復雜結構和細粒度特征的強大捕捉能力。無論是 “瓶子” 的完整輪廓,還是 “鳥類” 的細微紋理,模型均能生成高精度的掩碼;特別是在處理 “自行車” 和 “飛機” 等復雜物體時,DC-SAM 有效抑制了背景區域的誤檢(False Positives),邊緣分割清晰銳利。



      圖像上下文分割效果對比圖,黃色的叉表示明顯錯誤。

      在更具挑戰的視頻任務中,DC-SAM 的優勢進一步凸顯。以 “摩托車” 視頻序列為例,基線模型 PFENet 出現了明顯的語義漂移現象,不僅漏檢了車輪,還錯誤地將騎手包含在分割目標內。相比之下,DC-SAM 能夠精準區分干擾對象(如騎手)與目標主體,在連續幀中實現了穩健的語義鎖定與追蹤。



      視頻上下文分割效果對比圖。

      我們相信,DC-SAM 的提出為視覺大模型的落地應用,尤其是在需要高效、自動處理海量視頻數據的工業與科研領域,提供了極具競爭力的解決方案。

      作者簡介

      齊夢實,北京郵電大學計算機學院,教授、博導。博士畢業于北京航空航天大學,美國羅切斯特大學聯合培養博士。曾工作于瑞士洛桑聯邦理工學院CVLAB擔任博士后研究員,百度研究院訪問研究員等。入選2021年第七屆中國科協青年人才托舉工程(中國人工智能學會)、2024年小米青年學者、2025年ACM北京分會新星獎。主要研究方向為人工智能、計算機視覺和多媒體智能計算等。作為主要負責人承擔國家自然科學基金(面上/青年)、北京市自然科學基金-小米創新聯合基金、騰訊犀牛鳥課題、小米、阿里、微軟合作項目等,并作為核心研發人員參與了國家自然科學基金重大/重點項目、科技部重點專項和港澳臺科技專項等,發表國際高水平期刊會議論文50余篇,包括頂級學術會議CVPR/ICCV/ECCV/NeurIPS/ACM MM/AAAI和權威學術期刊TPAMI/TIP/TMM/TCSVT/TIFS等,擔任頂級會議AAAI、IJCAI的領域主席和TMM的特邀編輯。

      畢蕭揚,北京郵電大學計算機學院,碩士研究生。主要研究方向為人工智能、計算機視覺和自動駕駛等。作為核心研究人員參與北京市自然科學基金-小米創新聯合基金、騰訊犀牛鳥課題等重點科研項目。發表的國際高水平論文成果收錄于權威學術期刊TPAMI和頂級學術會議UbiComp。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      俄軍攻勢開始疲軟,歐盟擬用7000億將烏克蘭打造為一流軍事強國

      俄軍攻勢開始疲軟,歐盟擬用7000億將烏克蘭打造為一流軍事強國

      史政先鋒
      2026-01-24 20:40:41
      多地將器官捐獻納入“見義勇為”評定,專家稱概念擴展需審慎

      多地將器官捐獻納入“見義勇為”評定,專家稱概念擴展需審慎

      澎湃新聞
      2026-01-24 22:55:05
      全網尋鞋!男子坐臥鋪時鞋被穿錯,一只斯凱奇變Prada:新鞋第一次穿就丟了,希望能找回

      全網尋鞋!男子坐臥鋪時鞋被穿錯,一只斯凱奇變Prada:新鞋第一次穿就丟了,希望能找回

      魯中晨報
      2026-01-24 17:23:25
      毒雞湯害人啊!上海一37歲單身女被問到“你不結婚是否幸福”飆淚

      毒雞湯害人啊!上海一37歲單身女被問到“你不結婚是否幸福”飆淚

      火山詩話
      2026-01-24 17:57:14
      身邊毀三觀的八卦,太炸裂了!不準備兩斤瓜子出不來!

      身邊毀三觀的八卦,太炸裂了!不準備兩斤瓜子出不來!

      另子維愛讀史
      2026-01-24 20:54:02
      云南毒紅薯升級!調查組介入,網友扒出黑幕,難怪商戶敢主動投毒

      云南毒紅薯升級!調查組介入,網友扒出黑幕,難怪商戶敢主動投毒

      云舟史策
      2026-01-24 16:14:54
      王鈺棟低級失誤!媒體人集體怒批:基本功太差,再不出去就晚了

      王鈺棟低級失誤!媒體人集體怒批:基本功太差,再不出去就晚了

      奧拜爾
      2026-01-24 23:43:02
      0比4不敵日本隊,U23國足球員道歉!主教練鳴不平!球迷鼓勵:已經很棒了

      0比4不敵日本隊,U23國足球員道歉!主教練鳴不平!球迷鼓勵:已經很棒了

      上觀新聞
      2026-01-25 09:07:10
      雪豹咬傷后續!女游客很漂亮,已經毀容,知情人曝內幕,被咬不冤

      雪豹咬傷后續!女游客很漂亮,已經毀容,知情人曝內幕,被咬不冤

      奇思妙想生活家
      2026-01-25 02:45:18
      湖南天氣:最低0℃!局地中到大雨,雨夾雪又要來了

      湖南天氣:最低0℃!局地中到大雨,雨夾雪又要來了

      三湘都市報
      2026-01-25 00:08:10
      被0-4拖累 李昊33次撲救仍無緣金手套獎 安東尼奧:不公+難以置信

      被0-4拖累 李昊33次撲救仍無緣金手套獎 安東尼奧:不公+難以置信

      我愛英超
      2026-01-25 03:30:41
      U23亞洲杯中日平均身高對比:國足181.96cm,比對手高1.39cm

      U23亞洲杯中日平均身高對比:國足181.96cm,比對手高1.39cm

      懂球帝
      2026-01-24 11:00:08
      斷層領先!日本用U21踢U23:4-0橫掃中國隊衛冕+無解16-1 3次捧杯

      斷層領先!日本用U21踢U23:4-0橫掃中國隊衛冕+無解16-1 3次捧杯

      風過鄉
      2026-01-25 01:14:43
      呆呆妹爆火后首次直播,人氣爆棚關閉了打賞,澄清自己35歲且未婚

      呆呆妹爆火后首次直播,人氣爆棚關閉了打賞,澄清自己35歲且未婚

      離離言幾許
      2026-01-24 21:13:06
      生姜立大功?美國研究發現:生姜能在36小時清除60%老化細胞?

      生姜立大功?美國研究發現:生姜能在36小時清除60%老化細胞?

      蜉蝣說
      2026-01-24 16:45:07
      解放軍報社論:堅決打贏軍隊反腐敗斗爭攻堅戰持久戰總體戰

      解放軍報社論:堅決打贏軍隊反腐敗斗爭攻堅戰持久戰總體戰

      新華社
      2026-01-24 23:03:04
      出大事了!中國收到“戰書”,這次不是美國,中方已經做好準備

      出大事了!中國收到“戰書”,這次不是美國,中方已經做好準備

      愛吃醋的貓咪
      2026-01-23 20:27:00
      官方:日本門將荒木琉偉獲得本屆U23亞洲杯最佳門將

      官方:日本門將荒木琉偉獲得本屆U23亞洲杯最佳門將

      懂球帝
      2026-01-25 01:41:11
      工廠停擺、門店撤退:理想汽車的“嚴冬”,比預想中來得更冷

      工廠停擺、門店撤退:理想汽車的“嚴冬”,比預想中來得更冷

      科技Nice
      2026-01-23 11:27:59
      網傳上海74所幼兒園和小學停辦,新生兒銳減,學校關停潮仍在繼續

      網傳上海74所幼兒園和小學停辦,新生兒銳減,學校關停潮仍在繼續

      爆角追蹤
      2026-01-24 12:20:35
      2026-01-25 10:04:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12179文章數 142549關注度
      往期回顧 全部

      科技要聞

      馬斯克SpaceX背后的她:現實版鋼鐵俠小辣椒

      頭條要聞

      媒體:特朗普發布與一只企鵝上格陵蘭島圖片 舉世嘩然

      頭條要聞

      媒體:特朗普發布與一只企鵝上格陵蘭島圖片 舉世嘩然

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      隋廣義等80人被公訴 千億騙局進入末路

      汽車要聞

      別克至境E7內飾圖曝光 新車將于一季度正式發布

      態度原創

      旅游
      時尚
      親子
      手機
      軍事航空

      旅游要聞

      云南昌寧金山云海美成流動仙境

      冬天最佳“顯瘦”公式:上短+下長

      親子要聞

      為什么媽媽說的話不好聽,外人卻總能說進你心里

      手機要聞

      蘋果史上最慘新機?消息稱iPhone Air激活量不足20萬,價格大跳水

      軍事要聞

      俄美烏三方首輪會談細節披露

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 狠狠躁夜夜躁无码中文字幕| 狠狠躁夜夜躁人人爽天天天天97 | 喀喇沁旗| 日本55丰满熟妇厨房伦| 66精品人妻| av熟女一区二区久久| 无码国产成人午夜电影在线观看| 成年网站拍拍拍Av| 欧洲人妻丰满av无码久久不卡| 婷婷丁香社区| 无码人妻一区二区三区三| 色翁荡媳又硬又粗又长视频| 国产午夜福利一区二区三区| 最新成免费人久久精品| 欧美成人在线视频| 亚洲美女又黄又爽在线观看| 天堂亚洲国产中文在线| 婷婷久久久亚洲欧洲日产国码av| 舟山市| 日本AⅤ精品一区二区三区日| 久久久亚洲欧洲日产国码农村| 亚洲人成网站在线播放2019| 中国护士18xxxxhd| 国产精品天干天干| 亚洲综合激情另类小说区| 2021国产精品一卡2卡三卡4卡| 富川| 欧美牲交40_50a欧美牲交aⅴ| 白浆网站| 亚洲综合无码一区二区| 性饥渴艳妇性色生活片在线播放 | 精品深夜av无码一区二区| 永安市| 国产亚洲精品久久久久秋霞| 91视频免费网站| 久久国产av影片| 久久精品亚洲| 麻豆A?V视频| 亚洲一区二区av| 无卡无码| 洋洋AV|