<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      36.4萬超聲圖文對!中國團隊構建首個大規模超聲專屬數據集

      0
      分享至

      Ultrasound-CLIP團隊 投稿
      量子位 | 公眾號 QbitAI

      超聲領域也有大模型了!

      超聲影像憑借實時、無輻射的優勢,成為臨床各場景的一線診斷手段。

      但異質的解剖結構、多樣的診斷屬性,讓通用視覺語言預訓練模型難以直接適配,且現有醫療跨模態數據中超聲樣本占比不足5%,成為領域研究的核心瓶頸。

      △超聲圖像統計數據跨越主要基準點的分布情況。



      上圖紅色區域和內部百分比顯示了超聲圖像所占的比例,而藍色區域則展示了其余模態的占比情況。頂部標簽表示絕對數量(以千為單位)。論文中所提出的US-365K是首個大規模、100%專用于超聲影像的數據集。

      針對這一問題,浙大城市學院聯合浙江大學、香港城市大學、香港浸會大學、浙江大學醫學院附屬第一醫院、浙江大學醫學院附屬婦產科醫院等團隊,構建了首個大規模通用超聲圖像-文本數據集US-365K,并提出專為超聲場景設計的語義感知對比學習框架Ultrasound-CLIP,讓模型真正理解超聲的臨床診斷語義,相關成果被CVPR 2026接收,數據集及代碼已開源。



      核心痛點:超聲跨模態學習的三重障礙

      現有視覺語言模型在超聲領域的應用,始終面臨三個關鍵問題:

      1. 數據缺口顯著:主流醫療跨模態數據集以CT、MRI等為主,超聲樣本占比極低,缺乏大規模、標準化的專屬訓練數據;

      2. 語義模糊難對齊:超聲診斷報告的表述多樣,相同病變存在不同描述方式,傳統對比學習難以精準界定正負樣本,易產生語義偏差;

      3. 缺乏臨床結構先驗:超聲診斷依賴病灶與診斷屬性的復雜關聯,通用模型無法建模這類專業的臨床推理邏輯,僅能實現簡單的關鍵詞匹配。

      △UDT和Ultrasound-CLIP概述。



      上圖中(a) UDT作為語義基礎,通過標準化解剖層次結構(UHAT)和定義9個關鍵診斷屬性(UDAF)來形式化超聲知識。(b) Ultrasound-CLIP利用UDT的方式有兩種:(1)基于UDAF的異構圖編碼器通過交叉注意力將屬性關系融合到文本嵌入中,以建模結構化推理。(2)構建基于UDAF的語義先驗,以實現雙目標優化,從而解決歧義。該框架將視覺特征與這些圖增強的、語義感知的文本表示對齊。

      為從根本上解決上述問題,研究團隊立足超聲臨床診斷的專業邏輯,從標準化數據構建和定制化模型設計兩大維度出發,打造全鏈路適配超聲場景的跨模態學習體系,實現雙重核心技術突破。

      第一步:構建UDT知識框架,打造標準化US-365K數據集

      團隊率先建立超聲診斷分類體系(UDT),為超聲數據的標準化標注和模型學習確立統一的專業依據,該體系包含兩大核心模塊,實現超聲診斷知識的結構化、形式化:

      超聲層級解剖分類(UHAT):按臨床診斷原則,系統梳理9大人體系統、52個器官的層級解剖結構,明確各器官的層級歸屬與上下文關聯,徹底解決不同數據源中解剖分類混亂的問題,實現超聲解剖標注的標準化;

      超聲診斷屬性框架(UDAF):凝練臨床醫生解讀超聲影像時核心關注的9大診斷維度,包括身體系統、器官、診斷結果、形狀、邊緣、回聲性、內部特征、后方聲學現象、血流信號,為每個維度定制臨床有效描述詞匯表,形成標準化的超聲診斷描述體系。

      △基于UHAT的US-365K解剖層次結構可視化。



      基于UDT標準化框架,團隊從5個國際權威醫療數據庫收集體量超聲數據,經多步驟精細化處理:先過濾非超聲內容,將超聲視頻按0.5秒間隔分解為靜態幀,平衡數據多樣性與冗余性;再基于UDAF框架,通過大模型+結構化提示的混合流水線,提取標準化診斷標簽;最后經醫療專家逐例審核、篩選,剔除模糊、不一致樣本,最終構建出US-365K數據集。

      該數據集包含36.4萬對超聲圖像-文本樣本、11676個臨床真實病例,覆蓋全解剖區域,是業內首個100%專屬超聲的大規模圖文數據集,數據有效率超90%,填補了超聲跨模態大規模標準化數據的行業空白,為超聲AI研究奠定高質量數據基礎。

      第二步:提出Ultrasound-CLIP框架,實現超聲語義的精準建模與對齊

      針對超聲場景的語義模糊和結構缺失難題,團隊設計出Ultrasound-CLIP語義感知對比學習框架,在經典雙編碼器(圖像+文本)基礎上,創新融入UDAF引導的異質圖編碼器基于UDAF的語義軟標簽兩大核心模塊,并采用雙目標優化策略,讓模型具備超聲領域的結構化臨床推理能力,突破通用模型的局限:

      (1)UDAF引導的異質圖編碼器,建模臨床屬性結構化關聯

      團隊將每個超聲樣本的文本標注,轉化為樣本專屬的異質圖:基于UDAF框架定義診斷節點和屬性節點兩類核心節點,根據樣本的標準化診斷標簽確定激活節點集,并在診斷節點與屬性節點間構建全二分連接,形成病灶-屬性的關聯圖結構。

      通過輕量級異質圖神經網絡(GNN)對異質圖進行編碼,得到包含節點關聯信息的節點嵌入,再經注意力池化生成圖匯總向量,最后通過多頭交叉注意力將圖嵌入與原始文本嵌入融合,并通過門控殘差連接實現穩定融合,得到圖增強的文本嵌入。這一過程讓文本嵌入融入超聲診斷標簽與屬性的結構化臨床關聯,突破單純關鍵詞匹配的局限,讓模型能捕捉超聲診斷的專業語義邏輯。

      (2)基于UDAF的語義軟標簽,實現細粒度語義相似度度量

      摒棄傳統二進制硬標簽,團隊基于UDAF的9大診斷維度,構建連續語義相似度軟標簽:為每個診斷維度預定義標準化標簽相似度矩陣,計算樣本對在各維度的語義親和力,再加權聚合得到樣本對的整體語義先驗相似度,形成B×B的軟先驗矩陣(B為批次大小),實現細粒度的語義重疊識別,解決超聲診斷報告表述多樣帶來的語義模糊問題。

      (3)雙目標優化策略,實現跨模態精準對齊與語義正則化

      框架采用對比損失+語義損失的雙目標優化策略,讓模型同時實現圖像-文本跨模態精準對齊和語義特征的正則化:

      對比損失(L(CLIP)):采用經典對稱對比損失,最大化正樣本對(圖像-對應文本)的相似度,最小化負樣本對的相似度,實現圖像與文本的基礎跨模態對齊;

      語義損失(L(semantic)):融合均方誤差(MSE)和KL散度,讓模型預測的相似度矩陣與UDAF基語義軟先驗矩陣匹配,既實現相似度的數值匹配,又保證分布一致性,讓語義相似的樣本在特征空間中有效聚類。

      通過雙目標聯合優化,模型既能實現超聲圖像與文本的精準跨模態對齊,又能精準捕捉超聲診斷的細粒度語義特征,真正理解超聲的臨床語言。

      實驗驗證:全任務性能領先,泛化能力適配多臨床場景

      團隊以US-365K為基礎,在多任務分類、圖像-文本檢索任務中開展實驗,并在4個公開的超聲下游數據集上驗證模型泛化能力,結果顯示Ultrasound-CLIP全面優于現有醫療CLIP基線模型:

      多任務分類:平均準確率達59.61%,其中病灶邊緣、診斷結果等核心臨床屬性的識別準確率分別達84.44%、64.05%,能精準捕捉超聲診斷的關鍵信息。



      圖像-文本檢索:圖像到文本檢索(I2T)@10達37.45%,文本到圖像檢索(T2I)@50達80.22%,實現超聲圖文的高效雙向匹配。



      下游泛化:在乳腺、胃腸超聲等4個數據集的零樣本、線性探測、全微調任務中均取得最優性能,可適配不同超聲臨床診斷場景。

      資源開源:助力超聲AI領域共同研究

      為推動超聲跨模態學習領域的發展,團隊已將研究相關的代碼和US-365K數據集公開,為后續研究者提供可直接復用的基礎資源。

      論文標題:
      Ultrasound-CLIP: Semantic-Aware Contrastive Pre-training for Ultrasound Image-Text Understanding
      作者:
      Jiayun Jin, Haolong Chai, Xueying Huang, Xiaoqing Guo, Zengwei Zheng, Zhan Zhou, Junmei Wang, Xinyu Wang, Jie Liu*, Binbin Zhou*
      單位:
      浙大城市學院、香港浸會大學、浙江大學、浙江大學醫學院附屬第一醫院、浙江大學醫學院附屬婦產科醫院、香港城市大學
      發表:
      CVPR 2026
      arxiv論文地址:
      http://arxiv.org/abs/2604.01749
      項目地址:
      https://github.com/ZJUDataIntelligence/Ultrasound-CLIP
      數據集地址:
      https://huggingface.co/datasets/JJY-0823/US-365K
      作者簡介:
      本文第一作者為金佳云,浙大城市學院碩士生,研究方向為多模態大模型。本文在周斌彬副教授和劉潔博士的指導下完成。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      約基奇創神跡!包攬籃板和助攻榜第一,打破塵封半個多世紀紀錄

      約基奇創神跡!包攬籃板和助攻榜第一,打破塵封半個多世紀紀錄

      仰臥撐FTUer
      2026-04-14 13:35:03
      李小冉抱住唐藝昕驚呆全場,直言要“補償你老公”引發話題!

      李小冉抱住唐藝昕驚呆全場,直言要“補償你老公”引發話題!

      草莓解說體育
      2026-04-14 11:33:03
      跳樓身亡、家里現金“堆成山”,偷養私生子,大衣哥的謠言太離譜

      跳樓身亡、家里現金“堆成山”,偷養私生子,大衣哥的謠言太離譜

      米果說識
      2026-04-12 10:20:30
      歐冠4強將誕生2席!巴薩+利物浦都面臨0-2絕境,有1隊有望3-0逆轉

      歐冠4強將誕生2席!巴薩+利物浦都面臨0-2絕境,有1隊有望3-0逆轉

      球場沒跑道
      2026-04-14 10:15:36
      被馬特塔摟住的女記者發聲:那是次很好的采訪,動作被放大了

      被馬特塔摟住的女記者發聲:那是次很好的采訪,動作被放大了

      懂球帝
      2026-04-14 01:47:18
      反轉!巴西部長強行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人

      反轉!巴西部長強行封殺比亞迪,盧拉深夜震怒:立刻卷鋪蓋走人

      諦聽骨語本尊
      2026-04-14 18:25:22
      太復雜了!天津一地鐵站驚現13個出口!ABCDEFGHJKLMN···網友:適合密室逃脫

      太復雜了!天津一地鐵站驚現13個出口!ABCDEFGHJKLMN···網友:適合密室逃脫

      天津人
      2026-04-14 16:24:33
      孫衛東卸任外交部副部長

      孫衛東卸任外交部副部長

      澎湃新聞
      2026-04-14 09:54:26
      48歲舒淇新片殺瘋了!腹部比水平尺還平,這狀態誰敢相信快50了?

      48歲舒淇新片殺瘋了!腹部比水平尺還平,這狀態誰敢相信快50了?

      喜歡歷史的阿繁
      2026-04-13 19:28:12
      96年,軍委給清貧度日的李敏副軍級待遇,李:父母是父母,我是我

      96年,軍委給清貧度日的李敏副軍級待遇,李:父母是父母,我是我

      舊史新譚
      2026-04-14 01:45:21
      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      哄動一時啊
      2026-02-17 22:21:25
      首位下課主帥,蒙哥馬利已經走到下課邊緣,下輪再輸大概率走人

      首位下課主帥,蒙哥馬利已經走到下課邊緣,下輪再輸大概率走人

      體壇風之子
      2026-04-14 04:30:03
      維爾茨和?;倏藦姀妼υ?貢獻?物浦歐冠翻盤面臨巨大挑戰

      維爾茨和?;倏藦姀妼υ?貢獻?物浦歐冠翻盤面臨巨大挑戰

      樂道足球
      2026-04-14 20:50:58
      全球首家AI妓院,革了成人行業的命

      全球首家AI妓院,革了成人行業的命

      廣告案例精選
      2026-04-02 14:49:22
      奧沙利文終于說了句公道話:丁俊暉不是不行,是命太硬

      奧沙利文終于說了句公道話:丁俊暉不是不行,是命太硬

      阿豐聊娛
      2026-04-14 08:54:25
      羅湖地鐵深夜混戰:六人因一言不合全軍覆沒,打贏坐牢打輸住院

      羅湖地鐵深夜混戰:六人因一言不合全軍覆沒,打贏坐牢打輸住院

      墜入二次元的海洋
      2026-04-14 02:06:03
      今日最慘股,股價從18跌到了2.6,連創新低后今又閃崩跌停!

      今日最慘股,股價從18跌到了2.6,連創新低后今又閃崩跌停!

      丁丁鯉史紀
      2026-04-14 18:01:29
      英偉達回應“正尋求收購一家大型公司”傳聞:消息不實,英偉達沒有在磋商收購任何個人電腦制造商

      英偉達回應“正尋求收購一家大型公司”傳聞:消息不實,英偉達沒有在磋商收購任何個人電腦制造商

      瀟湘晨報
      2026-04-14 08:50:11
      “你真美,是不是嫌我老?”:手機被沒收后,女子用手表錄16分鐘

      “你真美,是不是嫌我老?”:手機被沒收后,女子用手表錄16分鐘

      江山揮筆
      2026-04-14 10:48:18
      三十多位作家、編輯在五臺山遭遇離奇車禍,竟是因為口無遮攔?

      三十多位作家、編輯在五臺山遭遇離奇車禍,竟是因為口無遮攔?

      心靈短笛
      2025-04-11 14:08:32
      2026-04-14 21:23:01
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12469文章數 176448關注度
      往期回顧 全部

      科技要聞

      離職同事"煉化"成AI?這屆公司不需要活人了

      頭條要聞

      女子喪偶后和上海婆婆反目 婆婆出錢買的房打官司輸了

      頭條要聞

      女子喪偶后和上海婆婆反目 婆婆出錢買的房打官司輸了

      體育要聞

      帶出中超最大黑馬!他讓球迷們“排隊道歉”

      娛樂要聞

      宋祖兒劉宇寧戀情大反轉 正主火速辟謠

      財經要聞

      許家印認罪,他和恒大還有多少欠債?

      汽車要聞

      售12.99萬起/續航2000km 風云T9L上市

      態度原創

      手機
      藝術
      數碼
      時尚
      公開課

      手機要聞

      蘋果iOS 26.4現Bug:捷克語鍵盤缺失字符致用戶無法解鎖手機

      藝術要聞

      這位美女畫家的夏天竟如此夢幻

      數碼要聞

      OPPO Pad 5 Pro旗艦配置官曝,懸浮鍵盤確認配備全域壓感觸控板

      全網走紅的「爆改老媽」,審美霸凌了多少中年女性?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版