<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      多模態(tài)檢索新突破,用軟標(biāo)簽打破傳統(tǒng)剛性映射約束,全面超越CLIP

      0
      分享至

      UniME-V2團(tuán)隊(duì) 投稿
      量子位 | 公眾號(hào) QbitAI

      統(tǒng)一多模態(tài)嵌入模型是眾多任務(wù)的技術(shù)基石。

      當(dāng)前主流方法通常采用批內(nèi)負(fù)例挖掘策略,通過(guò)計(jì)算查詢(xún)-候選對(duì)的相似度進(jìn)行訓(xùn)練。

      但這類(lèi)方法存在明顯局限:難以捕捉候選樣本間細(xì)微的語(yǔ)義差異,負(fù)例樣本多樣性不足,且模型在區(qū)分錯(cuò)誤負(fù)例與困難負(fù)例時(shí)的判別能力有限。

      針對(duì)這些問(wèn)題,團(tuán)隊(duì)提出全新解決方案——基于多模態(tài)大模型語(yǔ)義理解能力的統(tǒng)一多模態(tài)嵌入模型UniME-V2。

      該方法首先通過(guò)全局檢索構(gòu)建潛在困難負(fù)例集,隨后創(chuàng)新性地引入“MLLM-as-a-Judge”機(jī)制:利用MLLM對(duì)查詢(xún)-候選對(duì)進(jìn)行語(yǔ)義對(duì)齊評(píng)估,生成軟語(yǔ)義匹配分?jǐn)?shù)。

      這一設(shè)計(jì)帶來(lái)三重突破:

      • 以匹配分?jǐn)?shù)為依據(jù)實(shí)現(xiàn)精準(zhǔn)困難負(fù)例挖掘,有效規(guī)避錯(cuò)誤負(fù)例干擾
      • 確保篩選出的困難負(fù)例兼具多樣性與高質(zhì)量特性
      • 通過(guò)軟標(biāo)簽機(jī)制打破傳統(tǒng)一對(duì)一的剛性映射約束



      通過(guò)將模型相似度矩陣與軟語(yǔ)義匹配分?jǐn)?shù)矩陣對(duì)齊,使模型真正學(xué)會(huì)辨析候選樣本間的語(yǔ)義差異,顯著提升判別能力。

      為進(jìn)一步提升性能,團(tuán)隊(duì)基于挖掘的困難負(fù)例訓(xùn)練出重排序模型UniME-V2-Reranker,采用配對(duì)與列表聯(lián)合優(yōu)化策略。



      圖1 UniME-V2與以往方法的本質(zhì)不同,在于巧妙利用了多模態(tài)大模型(MLLM)的深層語(yǔ)義理解能力。它不僅能用此能力精準(zhǔn)挖掘“困難負(fù)例”,更能生成一個(gè)軟語(yǔ)義匹配分?jǐn)?shù),如同一位資深導(dǎo)師,指導(dǎo)模型學(xué)會(huì)辨別候選樣本間微妙的語(yǔ)義差異。

      方法
      MLLM-as-a-Judge 困難負(fù)樣本挖掘

      過(guò)去的研究主要依賴(lài)于批內(nèi)硬負(fù)樣本挖掘,其中計(jì)算查詢(xún)-候選嵌入相似性以采樣負(fù)樣本。

      然而,這種方法通常受到負(fù)樣本多樣性有限和嵌入判別能力不足的困擾,難以有效區(qū)分錯(cuò)誤和困難的負(fù)樣本。

      為了克服這些挑戰(zhàn),如圖2所示,首先利用全局檢索構(gòu)建一個(gè)潛在的困難負(fù)樣本集。

      之后,利用MLLM的強(qiáng)大理解能力來(lái)評(píng)估每個(gè)查詢(xún)-候選對(duì)的語(yǔ)義對(duì)齊性,并生成軟語(yǔ)義匹配分?jǐn)?shù)。

      這個(gè)分?jǐn)?shù)指導(dǎo)了硬負(fù)樣本挖掘,使得能夠識(shí)別出多樣化和高質(zhì)量的困難負(fù)樣本,同時(shí)減少錯(cuò)誤負(fù)樣本的影響。



      圖2:基于MLLM-as-a-Judge的困難負(fù)樣本挖掘流程。我們首先利用現(xiàn)有的多模態(tài)嵌入模型進(jìn)行全局檢索,構(gòu)建一個(gè)潛在的困難負(fù)樣本集。然后,利用MLLM強(qiáng)大的理解能力根據(jù)語(yǔ)義對(duì)齊性對(duì)查詢(xún)-候選對(duì)進(jìn)行評(píng)分,從而精確識(shí)別困難負(fù)樣本。

      潛在困難負(fù)樣本集合為了從全局樣本中提取更高質(zhì)量的困難負(fù)樣本,首先使用VLM2Vec為查詢(xún)和候選生成嵌入。

      接著,為每個(gè)查詢(xún)檢索出50個(gè)最相關(guān)的候選。

      為了應(yīng)對(duì)錯(cuò)誤負(fù)樣本并增加多樣性,我們基于查詢(xún)-候選相似度分?jǐn)?shù)設(shè)定一個(gè)相似度閾值,并選擇前50名的候選作為潛在的困難負(fù)樣本集:

      其中 是由VLM2Vec模型計(jì)算得出的查詢(xún) 與候選 的相似度分?jǐn)?shù)。

      語(yǔ)義匹配分?jǐn)?shù)在構(gòu)建潛在的困難負(fù)樣本集后,我們使用MLLM作為評(píng)判,為中的每個(gè)查詢(xún)-候選對(duì)計(jì)算語(yǔ)義匹配分?jǐn)?shù),具體指令如下:



      隨后,根據(jù)()和()標(biāo)記的logits計(jì)算語(yǔ)義匹配分?jǐn)?shù),其中。這里,表示查詢(xún)的數(shù)量。利用MLLMs的高級(jí)理解能力,語(yǔ)義匹配分?jǐn)?shù)有效地捕捉了查詢(xún)和候選之間的語(yǔ)義對(duì)齊程度。

      困難負(fù)樣本采樣為了提高困難負(fù)樣本的質(zhì)量,利用語(yǔ)義匹配分?jǐn)?shù)對(duì)候選進(jìn)行精煉。

      候選樣本的分?jǐn)?shù)超過(guò)閾值(其中表示正樣本,是控制閾值間隔的超參數(shù))則會(huì)當(dāng)作錯(cuò)誤負(fù)樣本并排除。為保持多樣性,采用五步間隔的循環(huán)采樣策略。

      如果精煉后的集合包含的候選少于十個(gè),將重復(fù)選擇以確保至少有十個(gè)。

      在極少數(shù)情況下(<1%),如果沒(méi)有候選符合條件,將從最初的五十個(gè)候選中隨機(jī)選擇10個(gè),并給每個(gè)分配1.0的語(yǔ)義匹配分?jǐn)?shù)。

      最后,對(duì)于每個(gè)查詢(xún),我們獲得困難負(fù)樣本集及其相應(yīng)的語(yǔ)義匹配分?jǐn)?shù)。



      圖3:基于MLLM判斷的訓(xùn)練框架結(jié)構(gòu)。UniME-V2使用軟語(yǔ)義匹配分?jǐn)?shù)作為監(jiān)督信號(hào),以增強(qiáng)候選者間的語(yǔ)義區(qū)分學(xué)習(xí)。UniME-V2-Reranker采用pairwise和listwise聯(lián)合訓(xùn)練以提升重排序性能。

      基于MLLM判斷的訓(xùn)練框架

      UniME-V2為此提出了一個(gè)基于MLLM判斷的分布對(duì)齊框架,如圖3所示,利用軟語(yǔ)義匹配分?jǐn)?shù)作為監(jiān)督信號(hào)來(lái)提高表征性能。

      具體來(lái)說(shuō),給定一個(gè)查詢(xún)及其候選集,將它們輸入到MLLM中,并提取最后一個(gè)標(biāo)記作為查詢(xún)和候選集的嵌入,其中是目標(biāo)候選的嵌入,是每個(gè)查詢(xún)的困難負(fù)樣本數(shù)。然后計(jì)算查詢(xún)嵌入與候選嵌入之間的關(guān)系得分矩陣如下:

      基于語(yǔ)義匹配分?jǐn)?shù),計(jì)算由MLLM判斷得出的語(yǔ)義匹配分?jǐn)?shù)矩陣如下:

      為了增強(qiáng)學(xué)習(xí)的穩(wěn)健性并確保矩陣對(duì)稱(chēng)性,采用了JS-Divergence,這是KL-Divergence的一種對(duì)稱(chēng)替代。最終的損失函數(shù)定義為:

      除此之外,受前人工作啟發(fā),UniME-V2聯(lián)合pairwise和listwise訓(xùn)練了一個(gè)重排序模型UniME-V2-Reranker(如圖3所示)來(lái)提高基于初始嵌入的檢索精度。

      在成對(duì)訓(xùn)練中,為每個(gè)查詢(xún)構(gòu)造兩對(duì),一對(duì)與正候選結(jié)合,另一對(duì)與最困難的負(fù)候選結(jié)合。然后指導(dǎo)UniME-V2-Reranker對(duì)正候選輸出,對(duì)負(fù)候選輸出。成對(duì)損失使用交叉熵?fù)p失函數(shù)計(jì)算如下:

      其中表示UniME-V2-Reranker的自回歸輸出過(guò)程。對(duì)于列表訓(xùn)練,基于語(yǔ)義匹配分?jǐn)?shù),從困難負(fù)候選中選擇前個(gè)候選,隨機(jī)插入目標(biāo)候選并獲取其索引。

      然后提示UniME-V2-Reranker輸出真實(shí)位置,公式為:

      最終的損失函數(shù)定義為。



      表1:MMEB基準(zhǔn)測(cè)試結(jié)果。IND表示在分布內(nèi),OOD表示在分布外。分?jǐn)?shù)為補(bǔ)充材料中的平均精度結(jié)果。

      實(shí)驗(yàn)
      多模態(tài)檢索

      表1展示了在相同訓(xùn)練數(shù)據(jù)和配置下UniME-V2與現(xiàn)有基線模型在MMEB基準(zhǔn)上的性能對(duì)比。

      UniME-V2在各種基礎(chǔ)模型上均有顯著的性能提升。

      具體來(lái)說(shuō),UniME-V2在Qwen2-VL-2B和7B模型上分別比VLM2Vec高出3.5%和2.2%。

      當(dāng)基于LLaVA-OneVision作為基礎(chǔ)時(shí),UniME-V2比包括QQMM、LLaVE和UniME在內(nèi)的之前的最先進(jìn)模型提高了0.5%-0.9%。此外,UniME-V2在分布外數(shù)據(jù)集上的得分為66.7,凸顯其魯棒性和卓越的遷移能力。



      表2:在短描述(Flickr30K, MS-COCO)、長(zhǎng)描述(ShareGPT4V, Urban1K)和組合(SugarCrepe)數(shù)據(jù)集上的零樣本文本-圖像檢索結(jié)果。

      跨模態(tài)檢索

      如表2所示,在零樣本跨模態(tài)檢索任務(wù)上評(píng)估UniME-V2。對(duì)于短描述數(shù)據(jù)集,包括Flickr30K和MS-COCO,UniME-V2在圖像到文本檢索中比UniME表現(xiàn)出了2.2%-9.7%的性能提升。

      在文本到圖像檢索中,其性能與UniME相當(dāng),這主要?dú)w因于兩個(gè)因素:

      (1)MMEB訓(xùn)練集中文本到圖像數(shù)據(jù)的比例有限;

      (2)短描述中的語(yǔ)義信息不足。

      對(duì)于長(zhǎng)描述跨模態(tài)檢索任務(wù),UniME-V2在ShareGPT4V和Urban1K上取得了顯著改進(jìn),這得益于其增強(qiáng)的區(qū)分能力和詳細(xì)描述提供的豐富語(yǔ)義內(nèi)容。

      值得注意的是,與EVA-CLIP-8B相比,UniME-V2展示了更為穩(wěn)健的檢索性能,這主要因?yàn)槠渫ㄓ枚嗄B(tài)嵌入能顯著減少模態(tài)間的差距(如圖4所示)。



      圖4:EVA-CLIP-8B與UniME-V2(LLaVA-OneVision-7B)之間的表示分布對(duì)比。

      組合跨模態(tài)檢索

      基于SugarCrepe評(píng)估UniME-V2模型區(qū)分困難負(fù)樣本的能力。

      如表2所示,UniME-V2在所有評(píng)估指標(biāo)上均表現(xiàn)出卓越性能。

      與UniME相比在使用Qwen2-VL-2B時(shí)性能提升了5.3%,6.0%,4.5%。當(dāng)模型從2B擴(kuò)展到7B后也實(shí)現(xiàn)了9.0%,9.2%,9.2%的性能提升。

      此外,與EVA-CLIP-8B相比,UniME-V2還顯示出2.7%,3.4%,和3.8%的改進(jìn),凸顯其在區(qū)分困難負(fù)樣本上的強(qiáng)大能力。



      表3:使用UniME-V2 (Qwen2-VL-7B) 和 UniME-V2 (Qwen2-VL-2B) 比較LamRA與UniME-V2-Reranker的重排序性能。

      重排序?qū)Ρ?/h5>

      在表3中基于top5檢索結(jié)果對(duì)比了LamRA與UniME-V2-Reranker的性能。為確保公平,使用與LamRA相同的訓(xùn)練參數(shù)和基礎(chǔ)模型(Qwen2.5-VL-7B)。

      當(dāng)使用LamRA和UniME-V2-Reranker對(duì)UniME-V2 (Qwen2-VL-2B) 檢索結(jié)果進(jìn)行重排后在四個(gè)下游任務(wù)上均提升了性能。

      UniME-V2-Reranker在只使用一半數(shù)據(jù)的情況下始終獲得更優(yōu)結(jié)果。類(lèi)似地,使用UniME-V2 (Qwen2-VL-7B) 進(jìn)行檢索時(shí),UniME-V2-Reranker的表現(xiàn)也超過(guò)了LamRA,在四個(gè)任務(wù)中分別獲得了0.5%,0.4%,0.3%,和7.4%的性能提升。

      值得注意的是,UniME-V2-Reranker在組合理解檢索任務(wù)中展示了對(duì)LamRA的顯著優(yōu)勢(shì),這歸功于其利用MLLM的理解能力提取多樣化和高質(zhì)量的困難樣本,有效增強(qiáng)了模型的區(qū)分能力。

      論文:

      https://arxiv.org/abs/2510.13515

      GitHub:

      https://github.com/GaryGuTC/UniME-v2

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

      你永遠(yuǎn)想不到醫(yī)院的八卦能有多炸裂?一件提神醒腦,兩件直接撂倒

      另子維愛(ài)讀史
      2026-01-22 18:21:09
      特斯拉FSD中國(guó)獲批倒計(jì)時(shí)?特斯拉中國(guó)回應(yīng)

      特斯拉FSD中國(guó)獲批倒計(jì)時(shí)?特斯拉中國(guó)回應(yīng)

      時(shí)間財(cái)經(jīng)
      2026-01-23 21:30:17
      皮爾斯:勇士高層該跟庫(kù)里和追夢(mèng)談?wù)劊瑔?wèn)問(wèn)他們想留隊(duì)還是離隊(duì)爭(zhēng)冠

      皮爾斯:勇士高層該跟庫(kù)里和追夢(mèng)談?wù)劊瑔?wèn)問(wèn)他們想留隊(duì)還是離隊(duì)爭(zhēng)冠

      懂球帝
      2026-01-24 15:37:08
      陳婷也沒(méi)想到,她的“七旬老漢”再破天花板,讓整個(gè)導(dǎo)演圈沉默了

      陳婷也沒(méi)想到,她的“七旬老漢”再破天花板,讓整個(gè)導(dǎo)演圈沉默了

      妙知
      2026-01-23 10:12:48
      張又俠、劉振立涉嫌嚴(yán)重違紀(jì)違法被立案審查調(diào)查

      張又俠、劉振立涉嫌嚴(yán)重違紀(jì)違法被立案審查調(diào)查

      東部戰(zhàn)區(qū)
      2026-01-24 15:32:22
      崛起!19歲溫瑞博比林詩(shī)棟強(qiáng)在哪里?三大技術(shù)讓小馬龍又狠又穩(wěn)!

      崛起!19歲溫瑞博比林詩(shī)棟強(qiáng)在哪里?三大技術(shù)讓小馬龍又狠又穩(wěn)!

      騎馬寺的少年
      2026-01-24 13:00:48
      山東挺起工業(yè)硬脊梁

      山東挺起工業(yè)硬脊梁

      人民網(wǎng)
      2026-01-24 06:19:14
      中年返貧三件套,一個(gè)都別碰

      中年返貧三件套,一個(gè)都別碰

      詩(shī)詞中國(guó)
      2025-12-31 21:12:41
      半場(chǎng)0板+全場(chǎng)1板!申京再被火蜜瘋狂炮轟:軟弱無(wú)能 空有2.11米

      半場(chǎng)0板+全場(chǎng)1板!申京再被火蜜瘋狂炮轟:軟弱無(wú)能 空有2.11米

      顏小白的籃球夢(mèng)
      2026-01-24 10:59:14
      睡完首富睡首相:從廠妹到頂級(jí)名媛,靠男人撈到268億,她憑什么

      睡完首富睡首相:從廠妹到頂級(jí)名媛,靠男人撈到268億,她憑什么

      深度報(bào)
      2026-01-21 22:54:05
      很多地方,已經(jīng)開(kāi)始不折騰了

      很多地方,已經(jīng)開(kāi)始不折騰了

      詩(shī)詞中國(guó)
      2026-01-23 19:01:10
      武漢、宜昌入選!全國(guó)擬開(kāi)展有獎(jiǎng)發(fā)票試點(diǎn)城市名單公示

      武漢、宜昌入選!全國(guó)擬開(kāi)展有獎(jiǎng)發(fā)票試點(diǎn)城市名單公示

      極目新聞
      2026-01-24 13:48:17
      國(guó)補(bǔ)后3999元起!史上最便宜iPhone悄悄上架 連發(fā)布會(huì)都直接省了

      國(guó)補(bǔ)后3999元起!史上最便宜iPhone悄悄上架 連發(fā)布會(huì)都直接省了

      小柱解說(shuō)游戲
      2026-01-24 02:11:35
      耗資3000萬(wàn),正面對(duì)決吳京,我感慨:41歲謝苗終于邁出了這一步

      耗資3000萬(wàn),正面對(duì)決吳京,我感慨:41歲謝苗終于邁出了這一步

      靠譜電影君
      2026-01-22 21:05:13
      特朗普在回國(guó)專(zhuān)機(jī)上,宣告了伊朗的結(jié)局,最快48小時(shí)內(nèi)見(jiàn)證歷史?

      特朗普在回國(guó)專(zhuān)機(jī)上,宣告了伊朗的結(jié)局,最快48小時(shí)內(nèi)見(jiàn)證歷史?

      滄海旅行家
      2026-01-24 17:07:50
      深夜利空,23個(gè)社保重倉(cāng)股業(yè)績(jī)暴雷,龍頭利潤(rùn)下滑778%,12股虧損

      深夜利空,23個(gè)社保重倉(cāng)股業(yè)績(jī)暴雷,龍頭利潤(rùn)下滑778%,12股虧損

      風(fēng)風(fēng)順
      2026-01-24 00:00:08
      1996年, 施瓦辛格在家中無(wú)事,和35歲200斤女傭發(fā)生不當(dāng)關(guān)系

      1996年, 施瓦辛格在家中無(wú)事,和35歲200斤女傭發(fā)生不當(dāng)關(guān)系

      南權(quán)先生
      2026-01-20 15:49:53
      曾蔭權(quán):曾千億救市打爆索羅斯,卸任后卻因幾張機(jī)票,換來(lái)20個(gè)月牢飯?

      曾蔭權(quán):曾千億救市打爆索羅斯,卸任后卻因幾張機(jī)票,換來(lái)20個(gè)月牢飯?

      寄史言志
      2026-01-22 19:02:17
      皮爾斯:詹姆斯為湖人帶來(lái)了一座總冠軍和100億美元,湖人太劃算了

      皮爾斯:詹姆斯為湖人帶來(lái)了一座總冠軍和100億美元,湖人太劃算了

      懂球帝
      2026-01-24 15:37:08
      無(wú)論戰(zhàn)爭(zhēng)勝敗,澤連斯基的結(jié)局都不會(huì)改變,他就是下一個(gè)吳庭艷!

      無(wú)論戰(zhàn)爭(zhēng)勝敗,澤連斯基的結(jié)局都不會(huì)改變,他就是下一個(gè)吳庭艷!

      近史博覽
      2026-01-19 00:02:15
      2026-01-24 17:43:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12056文章數(shù) 176363關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢(qián)

      頭條要聞

      男子就醫(yī)從尿道取出圓筒狀、筆芯狀異物 存留長(zhǎng)達(dá)20年

      頭條要聞

      男子就醫(yī)從尿道取出圓筒狀、筆芯狀異物 存留長(zhǎng)達(dá)20年

      體育要聞

      當(dāng)家球星打替補(bǔ),他們?cè)诠室鈹[爛?

      娛樂(lè)要聞

      李微漪更新:狼王格林去世,3字淚目

      財(cái)經(jīng)要聞

      “百年老字號(hào)”張小泉遭60億債務(wù)壓頂

      汽車(chē)要聞

      有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

      態(tài)度原創(chuàng)

      游戲
      本地
      時(shí)尚
      家居
      公開(kāi)課

      《RE維羅妮卡》情報(bào)大匯總!你想看的都在這了

      本地新聞

      云游中國(guó)|格爾木的四季朋友圈,張張值得你點(diǎn)贊

      不一定能掀桌男主,但一定是個(gè)好演員!

      家居要聞

      在家度假 160平南洋混搭宅

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 黑巨人与欧美精品一区| 欧洲亚洲国产成人综合色婷婷| 中文字幕亚洲中文字幕无码码 | 无码?人妻?在线| 色网站免费在线观看| 色色欧美| 91久久国产综合精品 | 亚洲熟妇无码成人A片| 乱人妻人伦中文字幕| 福利视频一区二区在线| 日本一卡二卡不卡视频查询| 成人品视频观看在线| av免费网站| 综合一区亚洲| 一区二区淫网| 亚洲男人的天堂久久精品| 人人妻人人澡人人爽欧美一区双| 亚洲AV综合色区无码另类小说| 日韩乱码人妻无码中文字幕| 宁都县| 无码国产精品一区二区免费式芒果| 91肉丝| 天天爱天天躁XXXXAAAA| 成人欧美日韩一区二区三区| 欧美怡红院视频一区二区三区 | 亚洲欧美精品午睡沙发| 特级无码毛片免费视频尤物| 性高湖久久久久久久久| 瓮安县| 欧美老熟妇喷水| 国产日韩欧美小视频苍井空毛片| 亚洲?欧美?自拍?另类?日韩?人妻| 亚洲精品自拍| 欧美人与动zozo在线播放| 久久精品av国产一区二区| 日韩视频在线免费观看| 蜜桃无码一区二区三区| 暖暖免费观看电视在线高清| 熟女俱乐部五十路六十路| 啦啦啦视频在线观看免费播放高清 | 亚洲成人自拍|