<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      國產多模態Agent拿下醫學分割SOTA!不用改模型、不加token

      0
      分享至

      這個生物醫學視覺推理框架,被CVPR 2026接收了!



      人類專家在標注醫學圖像時,從不是“看一眼就畫出來”。

      他們會先掃視全圖、鎖定可疑區域,隨后在分割工具上反復點擊正負樣本,根據每一步生成的mask形態重新判斷,不斷調整策略——

      這是一個多輪交互、邊看邊想、邊想邊做的迭代推理過程。

      然而,現有的醫學多模態大模型普遍采用“單次前向推理”范式:

      輸入圖像,輸出mask,一步到位。

      這種方式面對生物醫學圖像中細微的病灶邊界、復雜的解剖結構、模糊的視覺語義時往往力不從心。

      更深層的問題在于,為了賦予MLLM分割能力,現有方法普遍引入隱式分割token(如

      )并與外部pixel decoder聯合微調——

      這一設計破壞了大模型原有的文本輸出空間,導致語言推理能力退化,泛化能力大打折扣。

      上述范式存在四個核心瓶頸:

      • 單次推理無法自我糾錯:一旦第一步定位出現偏差,錯誤持續累積,最終影響分割質量。
      • 隱式token破壞推理能力
      • 等token侵占文本空間,導致災難性遺忘,細粒度視覺推理被嚴重壓制。
      • 缺乏自主決策機制:模型只能被動執行單次指令,無法像人類專家一樣主動觀察、反思、調整。
      • 訓練數據瓶頸:現有數據集只有最終mask,缺乏逐步交互的推理軌跡,難以直接監督多步行為。

      鑒于上述問題,浙江大學蔡鈺祥教授、上海人工智能實驗室研究員江彥開等人聯合提出了IBISAgent——

      一個將分割重新定義為多步視覺決策過程的Agentic MLLM框架。

      具體方法

      概括而言,IBISAgent的主要創新點如下:

      • 將分割任務建模為多步馬爾可夫決策過程(MDP) ,以交錯的文本推理與點擊動作替代隱式token,保留MLLM完整的語言推理能力,同時實現自主多輪迭代精化。
      • 提出兩階段訓練框架。首先通過冷啟動SFT在自動生成的推理軌跡上建立像素級推理先驗;隨后引入Agentic強化學習,以細粒度獎勵信號驅動模型自主探索更優決策策略,超越對軌跡的簡單模仿。
      • 構建包含456K條高質量推理軌跡的冷啟動數據集,覆蓋正常標注與自我反思糾錯兩類軌跡,為多步視覺推理提供系統化的訓練基礎。

      具體方法為,IBISAgent將整個分割過程建模為一條多步推理軌跡,每一步由三個核心元素構成閉環:

      • 推理(Textual Thinking) :模型對當前分割圖像的狀態進行推理分析,如“當前mask偏左,需要在右側腫瘤邊緣補充正向點擊”。
      • 行動(Action) :模型輸出結構化的空間點擊指令,包含三個要素:分割目標類別(Target)、點擊屬性(正/負,Attribute)、歸一化圖像坐標(Coordinate_2d)。模型可在一步中同時輸出多個點擊。
      • 觀測(Observation) :點擊被傳入交互式分割工具MedSAM2,生成更新后的mask,并疊加到原圖上作為下一步的視覺輸入反饋給模型。

      這一設計的關鍵在于:

      模型每一步都能“看到”自己上一步分割的結果,形成視覺感知與語言推理的閉環。

      整個過程不引入任何新的模型組件或隱式token,分割能力完全從MLLM內在的視覺推理中涌現,并天然支持從頭分割與mask精化兩類任務。



      與此同時,IBISAgemt采用兩階段訓練方案:

      第一階段:冷啟動SFT

      現有生物醫學分割數據集只有最終mask,沒有逐步點擊軌跡。

      研究團隊利用BiomedParseData(340萬圖像-mask對, 9種成像模態)開發了自動軌跡生成算法:

      通過規則化的點擊模擬策略自動推導點擊序列,再用Gemini- 2.5-Pro為每步生成對應的自然語言推理。

      為增強魯棒性,額外合成兩類自我反思軌跡:

      (1)錯誤自糾正——檢測到錯誤動作后回溯并重新推理;

      (2)指令不一致糾正——遇到與初始mask不符的指令時主動丟棄并重新分割。最終構建出包含456K樣本的高質量冷啟動數據集。

      第二階段:Agentic強化學習

      SFT之后模型仍在模仿已有軌跡,研究團隊進一步引入RL,設計細粒度獎勵框架在每個交互步驟提供密集反饋:



      其中區域點擊獎勵與漸進式分割改進獎勵是核心創新——

      前者引導模型將每次點擊落在語義有效的區域,后者強制每步行動必須帶來實質性的分割改善,從而徹底杜絕冗余操作與來回震蕩。

      RL訓練使用GRPO算法,在888KVQA樣本上進行優化。



      實驗結果

      實驗結果顯示,IBISAgemt在域內測試集、域外泛化集(MeCOVQA-G+,涵蓋5種成像模態)和自建私有數據集(1K CT/MRI/病理, 7類癌癥)三個benchmark上, 均大幅領先所有對比方法。

      相比醫學專用MLLM基線,平均IoU提升35.13%, DSC提升37.58%, F1提升29.79%

      值得注意的是, Citrus-V和UniBiomed均在比本方法更大規模的數據集上訓練, IBISAgent仍能一致超越,說明性能提升來自方法設計本身,而非數據優勢。



      與工具增強Agent的對比實驗

      相比同樣調用MedSAM2的工具增強型Agent(GPT-4o 、LLaVA-Med 、HuatuoGPT-Vision等), IBISAgent在域外集和私有數據集上仍保持顯著領先,充分說明多輪交互式推理帶來的增益遠超簡單的工具調用。



      兩階段訓練消融實驗

      消融實驗證明,冷啟動SFT、自我反思軌跡和RL三個方案缺一不可,逐級疊加均帶來明顯收益。

      RL階段提供最大的性能躍升,說明強化學習的探索-利用機制對激發真正自主的像素級推理至關重要。



      細粒度獎勵設計消融實驗

      對于RL階段的獎勵設計,研究團隊同樣進行了逐項驗證。

      以僅使用格式獎勵與答案獎勵為基線,在域外集MeCOVQA-G+上的IoU僅為73.77;

      逐步引入區域點擊獎勵后, IoU提升至76.60, mask定位準確性顯著改善;

      加入漸進式分割改進獎勵后進一步躍升至80.61,同時平均交互步數從11.29步壓縮至8.12步,模型學會了更高效的分割路徑;

      最終疊加軌跡長度獎勵后,交互效率繼續提升,步數降至4.26步,同時分割質量維持在最高水平。

      這一結果表明,細粒度的逐步反饋信號是驅動模型在質量與效率之間取得最優平衡的關鍵,單純依賴最終結果獎勵無法達到同等效果。



      小結一下

      這項研究將生物醫學圖像分割從“單次推理輸出”推進到“自主多輪交互決策”。

      針對現有方法依賴隱式token導致的推理能力退化問題, IBISAgent以交錯的文本推理與點擊動作完全替代

      token,保留了MLLM完整的語言能力,并通過多步MDP建模實現真正的自主迭代精化。

      進一步地,冷啟動SFT結合自動軌跡生成建立穩健的推理先驗,Agentic強化學習與細粒度獎勵驅動模型超越模仿、探索最優決策策略,最終實現了細粒度的視覺推理。

      廣泛的實驗驗證了IBISAgent在多模態、多疾病場景下的一致性優勢,為未來面向真實臨床的智能醫學圖像分析系統奠定了重要基礎。

      論文鏈接:
      https://arxiv.org/abs/2601.03054
      代碼鏈接:
      https://github.com/Yankai96/IBISAgent

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      皓皓情感說
      2026-04-22 08:20:32
      東莞市一棟獨棟別墅333萬起被拍賣,25個人加價229次后816萬成交

      東莞市一棟獨棟別墅333萬起被拍賣,25個人加價229次后816萬成交

      天天話事
      2026-04-24 08:08:37
      蔣介石曾孫蔣友松突然宣布:兩蔣靈柩必須遷回浙江奉化

      蔣介石曾孫蔣友松突然宣布:兩蔣靈柩必須遷回浙江奉化

      深度報
      2026-04-20 22:37:17
      中莫聲明落地,莫桑比克全方位鼎力挺華,破格拿下中方獨一份優待

      中莫聲明落地,莫桑比克全方位鼎力挺華,破格拿下中方獨一份優待

      書紀文譚
      2026-04-23 23:09:11
      廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

      廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

      動物奇奇怪怪
      2026-04-15 18:16:01
      16頁PPT舉報德育副校長私生活:瘋批,主角照片曝光,知情人發聲

      16頁PPT舉報德育副校長私生活:瘋批,主角照片曝光,知情人發聲

      溫柔看世界
      2026-04-22 12:03:24
      網傳上海公司發氦氣斷供聲明 霍爾木茲海峽封鎖限制全球氦氣供應鏈

      網傳上海公司發氦氣斷供聲明 霍爾木茲海峽封鎖限制全球氦氣供應鏈

      六子吃涼粉
      2026-04-23 11:19:07
      “易中天”一季度業績狂飆,市值1.88萬億超過貴州茅臺

      “易中天”一季度業績狂飆,市值1.88萬億超過貴州茅臺

      21世紀經濟報道
      2026-04-23 23:57:12
      鳳凰傳奇現狀,一個年入千萬,一個負債累累,真相不簡單

      鳳凰傳奇現狀,一個年入千萬,一個負債累累,真相不簡單

      可愛的巴比龍
      2026-04-23 14:18:40
      屬鼠人當心:4月24日,就算你閉門不出,這件“怪事”也會找上門

      屬鼠人當心:4月24日,就算你閉門不出,這件“怪事”也會找上門

      一口娛樂
      2026-04-24 05:04:04
      現在這形勢,大家做好長期打算吧!

      現在這形勢,大家做好長期打算吧!

      英國報姐
      2026-04-23 21:11:57
      申花剛擊敗海牛隊!斯盧茨基賽后就發聲做出重要決定,事關特謝拉

      申花剛擊敗海牛隊!斯盧茨基賽后就發聲做出重要決定,事關特謝拉

      張麗說足球
      2026-04-23 11:12:18
      美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

      美預測:臺海一旦開打,9國將展開混戰,中俄朝將對陣6國聯軍

      琴音繚繞回
      2026-04-23 10:11:11
      前國腳楊晨:在老家北京生活,演員妻子風韻猶存,兒子沒走足球路

      前國腳楊晨:在老家北京生活,演員妻子風韻猶存,兒子沒走足球路

      素衣讀史
      2026-04-22 20:16:55
      中國工資重回3000時代,月薪3000元成常態

      中國工資重回3000時代,月薪3000元成常態

      念得小柔
      2026-04-22 16:42:12
      小寶與王某雷,誰探訪花的數量更多?

      小寶與王某雷,誰探訪花的數量更多?

      挪威森林
      2026-01-31 12:15:26
      都是窮,河南的窮,四川的窮,有什么差別

      都是窮,河南的窮,四川的窮,有什么差別

      高廣銀
      2026-04-10 06:09:37
      華為余承東并非狂妄!智界V9電磁壓鑄雙專利算法護航,難以模仿!

      華為余承東并非狂妄!智界V9電磁壓鑄雙專利算法護航,難以模仿!

      牛鍋巴小釩
      2026-04-23 13:10:35
      臺灣第一千金蔣孝章有多美?端莊優雅絕佳的福相,卻下嫁三婚男!

      臺灣第一千金蔣孝章有多美?端莊優雅絕佳的福相,卻下嫁三婚男!

      海佑講史
      2026-04-23 06:00:11
      窮可以讓一個女人卑微到什么程度?看網友的評論引起萬千共鳴

      窮可以讓一個女人卑微到什么程度?看網友的評論引起萬千共鳴

      夜深愛雜談
      2026-03-01 21:28:54
      2026-04-24 09:47:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12524文章數 176457關注度
      往期回顧 全部

      科技要聞

      凌晨突發!GPT-5.5正式上線:跑分更猛

      頭條要聞

      用了16年的學位證"失效"男子舉報自己 高校最新通報

      頭條要聞

      用了16年的學位證"失效"男子舉報自己 高校最新通報

      體育要聞

      給文班剃頭的馬刺DJ,成為NBA最佳第六人

      娛樂要聞

      王大陸因涉黑討債被判 女友也一同獲刑

      財經要聞

      19家企業要"鋁代銅",格力偏不

      汽車要聞

      預售30.29萬起 嵐圖泰山X8配896線激光雷達

      態度原創

      數碼
      教育
      手機
      旅游
      公開課

      數碼要聞

      重磅回歸!當貝超級盒子正式開啟預約 4月27日全網開售

      教育要聞

      相似無刻度直尺作圖,一個視頻學會!

      手機要聞

      2026年最后一款不加價的旗艦!OPPO Find X9s Pro首銷:5299元起

      旅游要聞

      一城煙火映齊魯 三脈共燃向未來

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一区二区三区日本大片| www.熟女| 亚洲自拍天堂| 一本久久88中| 鸡泽县| 韩日午夜在线资源一区二区| 国产在线不卡精品网站| 97se亚洲综合自在线| 偷拍亚洲一区二区三区| 强伦人妻精品三级| av人摸人人人澡人人超碰下载 | 国产又爽又黄又刺激的视频| 97人妻人人揉人人躁人人| 中国熟妇牲交视频| 国产天美传媒性色av| 国产欧美精品aaaaaa片 | 国产11一12周岁女毛片| 曰批永久免费40分钟免费观看软件| 中文AV电影网| 精品尤物TV福利院在线网站| 亚洲国产精品乱码一区二区| 久久午夜伦鲁鲁片免费 | 国产精品???A片在线观看| 嘉黎县| 内射老阿姨1区2区3区4区| 日韩精品国产二区三区| 在线视频这里只有精品| 黄网在线观看免费网站| 狠狠五月激情六月丁香| 亚洲色大成网站WWW永久麻豆| 久久久精品2019中文字幕之3| 人妖福利导航| 河东区| 一区二区中文字幕久久| 亚洲AV无码一区东京热久久| 精品乱码一区内射人妻无码 | 精品一区二区久久久久久久网站| 91久久性奴调教国产免费| 成人小说一区二区三区| 屏东县| 国产精品香蕉在线|