<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      FS-DETR如何實現高效的少樣本目標檢測并超越現有技術

      0
      分享至

      在計算機視覺領域,目標檢測技術已取得長足進步,但傳統閉集檢測方式仍存在明顯短板。想象一下,如果你能讓機器像人類一樣,只需看到幾個例子就能識別從未見過的物體,而不必經歷漫長的再訓練過程,這會帶來怎樣的變革?FS-DETR正是為解決這一挑戰而生。它通過巧妙的視覺提示和偽類嵌入機制,使模型能夠在單次前向傳遞中同時檢測多個新類別,且支持每類任意數量的樣本。最令人驚嘆的是,它不僅超越了所有無需再訓練的方法,甚至在極少樣本情況下擊敗了大多數需要再訓練的方法。這種能夠"即插即用"的檢測能力,將如何重塑我們對機器視覺學習能力的認知?


      認知的邊界

      傳統目標檢測技術在過去幾年取得了巨大突破,這主要得益于深度學習的廣泛應用。但這些系統普遍采用閉集設定——在固定類別上訓練和測試,這種方式存在著難以忽視的局限性。

      想象你有一臺機器人助手,它能識別家中的常見物品如椅子、桌子和電視。某天,你帶回一個電子筆記本,但機器人無法識別它,因為它從未在訓練數據中見過這類物品。在現實世界中,不可能預先標注所有可能遇到的物體,因此大多數當前系統只訓練識別一小部分物體類別。

      人類視覺系統則截然不同。我們可以僅通過看一眼新物體,就能在不同場景中識別它,無需"重新訓練"我們的視覺能力。這種能力很可能源于我們已學習的表示知識,這正是少樣本目標檢測(FSOD)試圖模擬的核心能力。

      少樣本目標檢測指的是借助幾個樣本(通常為1-10個)來檢測訓練時未見過的新類別物體的任務。從2019年開始,這一領域的研究顯著增加,各種方法競相登場。這些方法主要分為兩大類:基于再訓練的方法和無需再訓練的方法。

      基于再訓練的方法假設在測試前可以利用新類別的少量樣本微調模型。這類方法又可分為基于元學習和基于微調的方法。元學習方法如FSRW、MetaDet和Meta R-CNN嘗試通過元學習將知識從基類遷移到新類別。而基于微調的方法如TFA、FSCE和DeFRCN則采用預訓練再微調的標準流程,它們在性能上明顯優于元學習方法。

      無需再訓練的方法則更為靈活,能夠在不需額外訓練的情況下直接部署。這類方法主要基于度量學習,如QA-FewDet和AirDet等。它們通常使用交叉注意力機制在骨干網絡和查詢特征間進行細化,或通過原型學習和跨尺度支持引導的方式生成檢測建議。

      盡管現有FSOD系統取得了可觀進展,但要成為真正實用和靈活的系統,它們仍需滿足三個關鍵要求:(a)使用即插即用,無需測試時再訓練;(b)能在同一前向傳遞中同時處理任意數量的新物體類別和每類任意數量的樣本;(c)達到與閉集系統相當的分類準確率。目前的FSOD系統距離滿足這三點要求仍有不小差距,特別是在MSCOCO這樣的困難數據集上。

      變革的設計

      FS-DETR是一種基于DETR框架的創新少樣本檢測器,完全無需重新訓練就能同時處理多個新類別。這種設計思路的獨特之處在于,它將少樣本檢測問題重新構建為一個通過視覺提示控制的集合預測問題。


      DETR原本通過一組可學習的查詢來重新定義目標檢測任務,這些查詢通過交叉注意力機制與圖像特征交互,從而產生檢測預測。FS-DETR在此基礎上進行了關鍵擴展,使其能夠處理開放集少樣本檢測問題。

      FS-DETR的核心創新在于兩點:首先,它將新類別的視覺模板作為額外的視覺提示輸入到系統中;其次,這些提示被"打上"偽類嵌入的標記,這些偽類標記最終會在解碼器輸出中被預測出來,同時還會預測邊界框位置。

      具體來說,FS-DETR的架構由三個主要部分組成:(1)CNN骨干網絡,用于從目標圖像和模板中提取視覺特征;(2)變換器編碼器,對圖像令牌執行自注意力,并在模板和圖像令牌之間執行交叉注意力;(3)變換器解碼器,處理對象查詢和模板以預測偽類和邊界框。

      模板編碼是FS-DETR的第一個關鍵步驟。對于可用的m個類別(每類k個示例),模板圖像首先通過CNN骨干網絡生成模板特征。然后,這些特征被動態地關聯到偽類嵌入中,這些嵌入是隨機初始化并在訓練過程中學習的。值得注意的是,這些偽類嵌入與實際類別無關,是完全類別無關的。

      這些帶有偽類嵌入的模板接著作為視覺提示被添加到傳遞給解碼器的對象查詢序列中。這樣,模板就能通過注意力機制將偽類相關信息注入到對象查詢中。這可以被視為一種新型的訓練感知軟提示。

      在編碼器階段,目標圖像首先通過相同的CNN骨干網絡生成特征,并通過位置編碼增強。然后,這些特征通過多頭自注意力、層歸一化和MLP層進行處理,以獲取全局上下文信息。FS-DETR還引入了多頭交叉注意力層,用于在解碼前過濾和突出感興趣的圖像令牌。

      解碼器接受連接的模板和可學習對象查詢作為輸入,通過自注意力和交叉注意力層進行轉換,最終用于偽類預測和邊界框回歸。值得一提的是,FS-DETR對應于模板和對象查詢的解碼器特征使用不同的MLP進行處理,這是因為它們攜帶的信息在語義上有所不同。

      FS-DETR的訓練過程也頗具特色。對于目標圖像中存在的每個基類,系統會從訓練集中不同的圖像隨機采樣并裁剪該類別的對象作為模板。在應用圖像增強后,裁剪的對象/模板通過CNN骨干網絡傳遞。對于每個目標圖像和模板i,訓練目標是(c^s_i, b_i),其中c^s_i是目標偽類標簽,b_i是歸一化的邊界框坐標。

      為了計算損失,只使用最后一個解碼層輸出的N個轉換對象查詢進行偽類分類和邊界框回歸。系統通過二分匹配找到最優排列,最終損失由交叉熵分類損失、L1邊界框回歸損失和IoU損失組成。

      由于變換器架構相比CNN缺乏歸納偏置,更容易過擬合,因此FS-DETR采用無監督預訓練策略。系統使用ImageNet-100和部分MSCOCO圖像進行預訓練,其中類別和邊界框是通過對象提議系統即時生成的,無需使用任何標簽。這種預訓練方式顯著提升了系統的泛化能力。

      與其他方法如TSF和AirDet不同,FS-DETR不學習任何類型的基類原型,而是完全動態的(數據與數據之間的交互,而非數據與原型的交互)。此外,與使用二元交叉熵損失的度量學習方法不同,FS-DETR訓練預測偽類,使用交叉熵以類別無關的方式,這是一個更強大的訓練目標。


      技術的本質

      FS-DETR的核心優勢在于它的視覺提示機制和偽類嵌入設計,這兩項創新使得模型能夠在沒有再訓練的情況下識別新類別物體。傳統目標檢測器需要大量特定類別的數據才能學習識別新物體,而FS-DETR只需要幾個示例就能完成同樣的任務。

      視覺提示機制是FS-DETR的第一個關鍵創新。在這個系統中,新類別的視覺模板直接作為提示輸入到模型中。具體來說,這些模板有兩種用途:一是在編碼器中通過交叉注意力過濾骨干網絡的圖像特征;二是作為視覺提示添加到解碼器的可學習對象查詢前面。這種設計允許系統在推理時直接使用新類別的視覺外觀信息,無需額外的訓練過程。

      偽類嵌入是系統的另一個關鍵組成部分。每個視覺模板都被賦予一個特定的偽類嵌入,這些嵌入在訓練過程中學習得到。值得注意的是,這些偽類嵌入是類別無關的,它們不與實際類別名稱相關聯。在訓練過程中,每次迭代都會隨機將模板關聯到偽類嵌入,這確保了系統學習到的是通用的檢測能力,而非特定類別的識別能力。當一個新類別的多個示例輸入系統時,它們會共享同一個偽類嵌入,這樣系統就能將它們識別為同一類別。

      在技術實現上,偽類嵌入的添加方式非常直接:對于每個類別i的k個模板提示,系統會分配一個偽類嵌入c^s_i,并將其添加到模板特征上。這些帶有偽類標記的模板隨后被預置到傳遞給解碼器的對象查詢序列前,形成一個擴展的查詢序列。

      FS-DETR處理多類別和多樣本的能力尤為突出。與需要為每個新類別單獨運行一次前向傳遞的其他方法不同,FS-DETR能在單次前向傳遞中同時處理多個新類別,每個類別可以有任意數量的示例。這大大提高了系統的效率,特別是在需要識別多個新類別的場景中。

      在推理階段,用戶只需提供新類別的幾個視覺模板,系統就能直接用于檢測這些新類別,無需任何微調或再訓練。這種"即插即用"的能力使FS-DETR特別適合實時部署和資源受限的設備。


      與競爭方法相比,FS-DETR的設計更加簡潔和優雅。例如,TSF方法使用額外的變換器插件模塊來建模輸入特征與基類信息之間的交互,而AirDet則嘗試學習一組原型和跨尺度支持引導的建議網絡。相比之下,FS-DETR不需要任何額外的模塊或仔細設計的結構,它直接將提示附加到解碼器的對象查詢上,通過標準的注意力機制實現所有功能。

      FS-DETR的訓練目標也與其他方法不同。許多基于度量學習的方法使用二元交叉熵損失進行訓練,而FS-DETR使用多類別交叉熵來預測偽類,這是一個更強大的訓練目標。因為系統不需要學習類別名稱與視覺表示之間的映射,而是直接學習檢測物體的能力,所以它能更好地泛化到未見過的類別。

      值得一提的是,FS-DETR的無監督預訓練策略在提高系統性能方面起到了關鍵作用。通過在ImageNet-100和部分MSCOCO圖像上進行預訓練,系統能夠學習到更加通用的表示,這對于少樣本學習尤為重要。預訓練過程中,系統使用對象提議系統生成類別和邊界框,完全不依賴任何人工標注。

      實驗的力量

      為了全面評估FS-DETR的性能,研究團隊在PASCAL VOC和MSCOCO這兩個廣泛使用的數據集上進行了大量實驗。實驗設置遵循前人工作的慣例,將數據集分為基類和新類別,用基類進行訓練,用新類別進行測試。

      在PASCAL VOC數據集上,FS-DETR的表現尤為突出。對于每個k-shot實驗(k=1,2,3,5,10),FS-DETR都顯著優于所有無需再訓練的方法,在某些情況下,性能提升高達17.8個AP50點。例如,在Novel Set 1的1-shot實驗中,FS-DETR達到了45.0的AP50,而之前最好的無需再訓練方法QA-FewDet僅為41.0。這一差距在k值增加時仍然存在,展示了FS-DETR在各種樣本數量下的穩定性能。


      更令人印象深刻的是,FS-DETR甚至超越了許多需要再訓練的方法,特別是在極少樣本(k=1,2)的情況下。例如,在Novel Set 2的1-shot實驗中,FS-DETR達到了37.3的AP50,而需要再訓練的方法如DeFRCN僅為29.5。這表明FS-DETR能夠在沒有額外訓練的情況下,實現與專門為新類別微調的模型相當甚至更好的性能。

      在更具挑戰性的MSCOCO數據集上,FS-DETR同樣表現出色。它在大多數k-shot設置下都超越了所有無需再訓練的方法,例如,在1-shot實驗中,FS-DETR達到了7.0的AP和13.6的AP50,明顯優于之前最好的方法AirDet(5.97的AP和10.52的AP50)。與再訓練方法相比,FS-DETR在k=1,2的情況下也能匹配或超越大多數方法,這在MSCOCO這樣困難的數據集上是一個顯著成就。

      研究團隊還進行了大量消融實驗,以評估不同組件對FS-DETR性能的貢獻。這些實驗涵蓋了模板編碼設計、預訓練策略、輔助損失以及個別組件的影響等方面。

      模板編碼設計的實驗表明,使用注意力池化而非全局平均池化可以提升性能,而增加分辨率從128像素到192像素并沒有帶來額外收益。這表明對于當前數據集,細粒度細節并非識別新類別的關鍵,較高級別的概念已經足夠。此外,雖然空間增強通常有助于目標識別,但在模板邊界框上添加噪聲反而降低了準確率。

      預訓練策略的實驗結果特別引人注目。未經預訓練的模型在Novel Set 1的1-shot實驗中只能達到19.0的AP50,而經過預訓練的模型達到了45.0,性能提升超過兩倍。這凸顯了無監督預訓練在少樣本學習中的重要性,它能幫助模型建立更好的泛化能力,防止對基類的過擬合。


      研究團隊還探索了在對象查詢上應用額外輔助損失(如L2特征損失和對比損失)的效果,但沒有觀察到進一步的性能提升。這表明偽類分類損失已經足夠引導網絡學習有效的表示。

      最后,個別組件的消融實驗表明,FS-DETR編碼器中的多頭交叉注意力層和解碼器中的類型特定MLP都對性能有顯著貢獻。移除這些組件會導致性能下降,特別是移除編碼器中的交叉注意力層會使得Novel Set 1的1-shot性能從45.0降至38.1。這表明早期在圖像處理中注入模板相關信息對于突出關鍵區域至關重要。

      除了定量結果,研究團隊還提供了大量定性可視化結果,展示了FS-DETR在各種場景下的檢測能力。這些可視化結果直觀地展示了系統如何利用少量示例準確定位和分類新類別的物體,即使這些物體在形狀、大小、姿態和遮擋等方面有很大變化。

      總體而言,實驗結果表明FS-DETR不僅滿足了實用FSOD系統的所有要求——無需再訓練、能處理多個新類別、性能接近閉集系統——而且在很多情況下超越了當前最先進的方法,特別是在極少樣本學習方面。這一成就標志著少樣本目標檢測領域的重要進展,為構建更加靈活和實用的計算機視覺系統鋪平了道路。

      參考資料

      1. Bulat, A., Guerrero, R., Martinez, B., &; Tzimiropoulos, G. (2023). FS-DETR: Few-Shot DEtection TRansformer with prompting and without re-training. ICCV 2023.

      2. Carion, N., Massa, F., Synnaeve, G., Usunier, N., Kirillov, A., &; Zagoruyko, S. (2020). End-to-End Object Detection with Transformers. ECCV 2020.

      3. Xu, Q., Tian, Z., Wang, Y., &; Huang, T. (2022). Meta-DETR: Few-Shot Object Detection via Unified Image-Level Meta-Learning. IEEE TPAMI.

      4. Hu, L., Zhang, S., Wang, S., Kang, B., &; Li, H. (2022). AirDet: Few-Shot Detection without Fine-tuning. CVPR 2022.

      5. Wang, X., Huang, T., Barnes, C., Zhong, Y., &; Lu, H. (2022). Query Adaptive Few-Shot Object Detection with Heterogeneous Graph Convolutional Networks. ICCV 2021.

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      鄰居長期在樓道堆放鞋子等雜物,屢勸不聽,湖南一男子將爺爺遺照掛樓道“反擊” ;當事人:實在被逼得沒辦法

      鄰居長期在樓道堆放鞋子等雜物,屢勸不聽,湖南一男子將爺爺遺照掛樓道“反擊” ;當事人:實在被逼得沒辦法

      大風新聞
      2025-12-26 18:12:08
      南博事件新證據曝光!徐湖平夫妻被帶走,40億金獸疑似被偷梁換柱

      南博事件新證據曝光!徐湖平夫妻被帶走,40億金獸疑似被偷梁換柱

      鶴羽說個事
      2025-12-27 09:57:19
      但斌:茅臺的主力消費人群正在慢慢消失

      但斌:茅臺的主力消費人群正在慢慢消失

      新浪財經
      2025-12-26 16:52:47
      為什么人類吃食草動物的肉,基本上不吃食肉動物的肉?

      為什么人類吃食草動物的肉,基本上不吃食肉動物的肉?

      宇宙時空
      2025-12-26 11:49:12
      家中有事?缺席對陣新疆,周琦獨自離隊,原因曝光,首鋼回應

      家中有事?缺席對陣新疆,周琦獨自離隊,原因曝光,首鋼回應

      樂聊球
      2025-12-26 11:15:13
      毛主席微服察訪北平后勃然大怒,嚴令羅瑞卿徹查此事,最終七人被執行槍決,究竟發生了何等嚴重事端?

      毛主席微服察訪北平后勃然大怒,嚴令羅瑞卿徹查此事,最終七人被執行槍決,究竟發生了何等嚴重事端?

      桃煙讀史
      2025-12-20 17:37:11
      江蘇首富嚴昊:身價千億,迎娶著名女歌星,克林頓親自來出席婚禮

      江蘇首富嚴昊:身價千億,迎娶著名女歌星,克林頓親自來出席婚禮

      阿柒的訊
      2025-12-26 15:16:44
      曾苦戀王志文四年,后與沙桐結婚1年后閃離,最終收獲幸福

      曾苦戀王志文四年,后與沙桐結婚1年后閃離,最終收獲幸福

      小欣欣聊體育
      2025-12-26 22:47:42
      美國「斬殺線」沖爆熱搜!失業180天,年薪45萬美元程序員流落街頭

      美國「斬殺線」沖爆熱搜!失業180天,年薪45萬美元程序員流落街頭

      新智元
      2025-12-27 09:23:35
      演員金莎曬視頻宣布被男友孫丞瀟求婚,兩人相差19歲,于2023年9月公開戀情

      演員金莎曬視頻宣布被男友孫丞瀟求婚,兩人相差19歲,于2023年9月公開戀情

      臺州交通廣播
      2025-12-24 22:45:46
      婚禮結束僅4天,霍震霆兩個兒子“翻車”,郭晶晶態度早說明一切

      婚禮結束僅4天,霍震霆兩個兒子“翻車”,郭晶晶態度早說明一切

      娛樂看阿敞
      2025-11-22 13:26:47
      湖人內訌實錘!拉拉維亞直指內部脫節,雷迪克暗諷某人,難怪連敗

      湖人內訌實錘!拉拉維亞直指內部脫節,雷迪克暗諷某人,難怪連敗

      細話籃球
      2025-12-26 13:21:49
      陳獨秀逝世幾十年,鄧小平收到后人來信,立刻下令:保護陳獨秀墓

      陳獨秀逝世幾十年,鄧小平收到后人來信,立刻下令:保護陳獨秀墓

      歷史龍元閣
      2025-12-26 11:15:07
      942 天零出場!利物浦傳奇遭解約,30 歲斷崖式下滑

      942 天零出場!利物浦傳奇遭解約,30 歲斷崖式下滑

      瀾歸序
      2025-12-27 01:07:57
      南京博物館事件后,全國博物館紛紛關閉:施工關閉、臨時關閉

      南京博物館事件后,全國博物館紛紛關閉:施工關閉、臨時關閉

      爆角追蹤
      2025-12-26 11:02:32
      南博事件新證據曝光!徐湖平夫妻被帶走,40億金獸疑被偷梁換柱

      南博事件新證據曝光!徐湖平夫妻被帶走,40億金獸疑被偷梁換柱

      花小貓的美食日常
      2025-12-27 09:41:54
      老公和閨蜜好上了,陜西女子一夜白頭,閨蜜為男方打胎,身材性感

      老公和閨蜜好上了,陜西女子一夜白頭,閨蜜為男方打胎,身材性感

      水晶的視界
      2025-12-27 06:56:58
      中央5臺今日直播乒乓球賽嗎?今晚19∶00男團半決賽直播在哪看

      中央5臺今日直播乒乓球賽嗎?今晚19∶00男團半決賽直播在哪看

      皮皮觀天下
      2025-12-27 10:30:06
      宣布交易!楊瀚森,狂喜!

      宣布交易!楊瀚森,狂喜!

      李帕在北漂
      2025-12-26 14:32:35
      晚年不能自理時,怎樣才能安然度過余生?睿智的老人是這樣解決的

      晚年不能自理時,怎樣才能安然度過余生?睿智的老人是這樣解決的

      人間百態大全
      2025-12-27 06:35:03
      2025-12-27 12:27:00
      臆說歷史 incentive-icons
      臆說歷史
      作有深度的歷史解讀
      162文章數 232關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      賈國龍首次回應西貝風波 稱自己連續40天靠安眠藥入睡

      頭條要聞

      賈國龍首次回應西貝風波 稱自己連續40天靠安眠藥入睡

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      劉宇寧:我的價值不需要靠番位來證明

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態度原創

      房產
      旅游
      游戲
      公開課
      軍事航空

      房產要聞

      炸裂,三亞360億超級清單發布,又一批重大配套要來了!

      旅游要聞

      山西省啟動達人共創計劃助力文旅發展

      魔獸世界:60級黑龍巢穴強到離譜的極品,你當年最愛哪一款?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      英法德三國領導人通話 重申對烏支持

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩欧美卡一卡二卡新区| 碰碰免费视频| 91白浆| 久久久久成人片免费观看蜜芽| 中文字幕乱码视频32| 把插八插露脸对白内射| 精品久久人人妻人人做精品| 亚洲色涩| 亚洲成人a| 中文字幕va一区二区三区| 亚洲电影av| 97人妻视频| 合阳县| 色又黄又爽18禁免费视频| 亚洲亚洲人成综合网络| аⅴ天堂国产最新版在线中文| 亚洲欧美天堂| 久久精品人人做人人综合试看| 免费国偷自产拍精品视频| 亚洲精品成人A在线观看| 成人福利网站导航秘?涩涩屋 | 91九色在线观看| 日日躁夜夜躁狠狠久久av| 开心五月综合亚洲| 欧美AA视频| 洪江市| 3d动漫精品一区二区三区| 91视频在线看| 久久av高潮av| 亚洲一区自拍| 亚洲一区av在线观看| 欧美拍拍视频免费大全| 亚洲无码?制服丝袜| 亚洲av网站| 中文字幕精品亚洲无线码二区| 九九综合va免费看| 国产精品电影久久| 国产精品无码成人午夜电影| 亚洲午夜成aⅴ人片| 国产欧美日韩精品丝袜高跟鞋| 会理县|