<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      AI“世界模型”離真實(shí)手術(shù)還有多遠(yuǎn)?首個(gè)外科視頻生成基準(zhǔn)SurgVeo揭示“合理性差距”

      0
      分享至

      文章來源:我愛計(jì)算機(jī)視覺(ID:aicvml)

      最近,視頻生成領(lǐng)域的基石模型正展現(xiàn)出作為潛在“世界模型”模擬物理世界的驚人能力。然而,當(dāng)這些技術(shù)被應(yīng)用于像外科手術(shù)這樣高風(fēng)險(xiǎn)、需要深度專業(yè)因果知識(shí)而非普適物理規(guī)則的領(lǐng)域時(shí),其表現(xiàn)如何?這是一個(gè)至關(guān)重要但尚未被探索的領(lǐng)域。

      為了系統(tǒng)地應(yīng)對(duì)這一挑戰(zhàn),來自耶魯大學(xué)、諾丁漢大學(xué)等機(jī)構(gòu)的研究者們進(jìn)行了一項(xiàng)開創(chuàng)性的研究。他們提出了 SurgVeo,這是首個(gè)由專家策劃的、用于評(píng)估手術(shù)視頻生成模型的基準(zhǔn);同時(shí),他們還設(shè)計(jì)了一個(gè)新穎的四層評(píng)估框架——手術(shù)合理性金字塔(Surgical Plausibility Pyramid, SPP),旨在從基本外觀到復(fù)雜手術(shù)策略等多個(gè)層面評(píng)估模型生成內(nèi)容的質(zhì)量。



      • 論文標(biāo)題 : How Far Are Surgeons from Surgical World Models? A Pilot Study on Zero-shot Surgical Video Generation with Expert Assessment

      • 中文標(biāo)題 ::外科醫(yī)生離手術(shù)世界模型還有多遠(yuǎn)?基于專家評(píng)估的零樣本手術(shù)視頻生成研究

      • 作者 : Zhen Chen, Qing Xu, Jinlin Wu, Biao Yang, Yuhao Zhai, Geng Guo, Jing Zhang, Yinlu Ding,Nassir Navab, Jiebo Luo

      • 機(jī)構(gòu) : 耶魯大學(xué),諾丁漢大學(xué),中國(guó)科學(xué)院,山西醫(yī)科大學(xué),山東大學(xué),慕尼黑工業(yè)大學(xué),羅切斯特大學(xué)

      • 論文地址 : https://arxiv.org/pdf/2511.01775

      • Benchmark (待開源): https://github.com/franciszchen/SurgVeo

      當(dāng)前挑戰(zhàn):通用世界模型難以駕馭專業(yè)領(lǐng)域

      “世界模型”的核心思想是讓機(jī)器建立一個(gè)關(guān)于世界如何運(yùn)作的內(nèi)部表征,理解環(huán)境如何演變、行為如何導(dǎo)致后果。近期的視頻生成模型,如谷歌的Veo,已經(jīng)能夠生成非常逼真的通用場(chǎng)景視頻,似乎讓我們離通用物理世界的模擬器越來越近。

      然而,外科手術(shù)領(lǐng)域與日常物理世界有著本質(zhì)的不同。它不僅僅是關(guān)于物體如何移動(dòng)或碰撞,而是充滿了需要“專家直覺”的知識(shí),比如解剖學(xué)、生理學(xué)和生物力學(xué)。一個(gè)成功的“手術(shù)世界模型”必須理解手術(shù)刀切開不同組織時(shí)會(huì)發(fā)生什么,理解特定操作背后的戰(zhàn)略意圖。將為模擬“常識(shí)物理”而生的模型直接應(yīng)用于手術(shù)這樣需要“專家知識(shí)”的領(lǐng)域,其能力邊界在哪里?這正是本研究試圖回答的核心問題。

      研究方法:SurgVeo基準(zhǔn)與SPP評(píng)估框架

      為了科學(xué)地衡量現(xiàn)有視頻生成模型在手術(shù)領(lǐng)域的真實(shí)能力,研究者構(gòu)建了一套完整的評(píng)測(cè)流程。


      首先,他們創(chuàng)建了 SurgVeo 基準(zhǔn)。該基準(zhǔn)包含了兩種具有代表性但風(fēng)格迥異的手術(shù)視頻:腹腔鏡子宮切除術(shù)和內(nèi)窺鏡垂體手術(shù)。前者代表了在密閉空間內(nèi)的軟組織操作,后者則要求在關(guān)鍵神經(jīng)血管結(jié)構(gòu)附近進(jìn)行極其精細(xì)的操作。研究者從這些真實(shí)手術(shù)錄像中提取視頻片段,形成“起始幀-后續(xù)真實(shí)視頻”的數(shù)據(jù)對(duì)。

      接著,他們讓先進(jìn)的 Veo-3 模型執(zhí)行一項(xiàng)零樣本(zero-shot)預(yù)測(cè)任務(wù):給定手術(shù)場(chǎng)景的起始幀和一段文本提示(prompt),模型需要生成接下來8秒的手術(shù)視頻。


      最關(guān)鍵的一步,是由四位具有執(zhí)業(yè)資格的外科醫(yī)生組成的專家小組,使用研究者提出的 手術(shù)合理性金字塔(SPP) 框架來對(duì)生成的視頻進(jìn)行打分。SPP框架將評(píng)估分為四個(gè)層級(jí),從下到上,要求越來越高:

      1. 視覺感知合理性 (Visual Perceptual Plausibility) :評(píng)估視頻最基本的外觀質(zhì)量,如清晰度、光照、組織紋理和視頻流暢度。

      2. 器械操作合理性 (Instrument Operation Plausibility) :評(píng)估手術(shù)器械的運(yùn)動(dòng)軌跡、操作技術(shù)是否符合物理規(guī)律和手術(shù)規(guī)范。

      3. 環(huán)境反饋合理性 (Environment Feedback Plausibility) :評(píng)估手術(shù)場(chǎng)景(如組織、器官)對(duì)器械操作的反應(yīng)是否真實(shí),例如,組織被牽拉后的變形、切割后的出血模式是否符合生物力學(xué)和解剖學(xué)原理。

      4. 手術(shù)意圖合理性 (Surgical Intent Plausibility) :評(píng)估預(yù)測(cè)的系列動(dòng)作是否展現(xiàn)出清晰、邏輯自洽且符合當(dāng)前手術(shù)階段的戰(zhàn)略目標(biāo)。這是最高層次的評(píng)估,考驗(yàn)?zāi)P褪欠窭斫狻盀槭裁础币@么做。

      專家們會(huì)在生成的視頻播放到第1秒、第3秒和第8秒時(shí),參照真實(shí)視頻,對(duì)這四個(gè)維度進(jìn)行1-5分的打分。

      實(shí)驗(yàn)結(jié)果:驚人的“合理性差距”

      研究結(jié)果揭示了一個(gè)深刻的斷層,研究者稱之為“合理性差距”(plausibility gap):盡管Veo-3在生成視覺上令人信服的手術(shù)場(chǎng)景方面表現(xiàn)出色,但在SPP框架的更高層級(jí)上卻嚴(yán)重失敗。

      量化數(shù)據(jù)分析

      下方的兩個(gè)表格分別展示了在腹腔鏡手術(shù)和神經(jīng)外科手術(shù)中,不同提示策略下,模型在三個(gè)時(shí)間點(diǎn)的得分情況。


      腹腔鏡手術(shù)評(píng)估分?jǐn)?shù)


      神經(jīng)外科手術(shù)評(píng)估分?jǐn)?shù)

      我們可以清晰地看到:

      • 視覺質(zhì)量高 :在兩個(gè)手術(shù)類別中,“視覺感知合理性”的初始得分都很高(例如,基線提示下腹腔鏡手術(shù)為3.72分,神經(jīng)外科為3.88分)。外科醫(yī)生評(píng)價(jià)生成的圖像“清晰得驚人”。

      • 高層邏輯差 :然而,分?jǐn)?shù)在SPP金字塔的更高層級(jí)急劇下降。器械操作、環(huán)境反饋和手術(shù)意圖的得分要低得多,并且隨著時(shí)間的推移(從1秒到8秒)迅速惡化。例如,在腹腔鏡手術(shù)中,環(huán)境反饋合理性得分從1秒時(shí)的3.06分驟降至8秒時(shí)的1.64分。


      腹腔鏡手術(shù)評(píng)估分?jǐn)?shù)的小提琴圖


      神經(jīng)外科手術(shù)評(píng)估分?jǐn)?shù)的小提琴圖

      小提琴圖更直觀地展示了這種差異。視覺感知的得分(最左側(cè))密集分布在高分區(qū)域,而其他三個(gè)維度的得分則大量堆積在低分區(qū)域,且隨著時(shí)間推移(顏色由淺到深)不斷下移。

      有趣的是,研究還發(fā)現(xiàn),為模型提供更明確的“階段感知”提示(例如,明確告知當(dāng)前是“血管結(jié)扎”階段)并不能顯著改善其表現(xiàn)。這有力地證明,模型的問題不在于缺少上下文信息,而在于根本無法理解和運(yùn)用這些專業(yè)的領(lǐng)域知識(shí)

      典型失敗案例

      定性的案例分析讓這些冰冷的數(shù)字變得更加觸目驚心。


      上圖展示了一些典型的失敗案例:

      • (a) 視覺質(zhì)量失真 :生成的視頻畫面亮度發(fā)生突兀且不自然的變化,與穩(wěn)定的手術(shù)照明條件不符。

      • (b) 器械錯(cuò)誤 :模型“幻覺”出了一種現(xiàn)實(shí)中不存在的手術(shù)器械。

      • (c) 操作不當(dāng) :真實(shí)操作需要向左移動(dòng),模型卻生成了向右的錯(cuò)誤動(dòng)作。模型展示的器械在處理黏液,而正確的手術(shù)操作應(yīng)是在另一目標(biāo)部位上進(jìn)行沖洗與吸引的協(xié)同動(dòng)作。

      • (d) 不當(dāng)手術(shù)目標(biāo) :模型展示的器械在處理黏液,而正確的手術(shù)操作應(yīng)是在另一目標(biāo)部位上進(jìn)行沖洗與吸引的協(xié)同動(dòng)作。

      • (e) 環(huán)境反饋錯(cuò)誤 :模型違反物理定律,讓吸引器像提拉固體一樣將一整塊明膠海綿吸走,而不是吸走表面的液體。

      • (f) 意圖錯(cuò)誤 :真實(shí)意圖是在硬腦膜上注射生物膠水,模型卻錯(cuò)誤地預(yù)測(cè)了一個(gè)完全不相關(guān)的動(dòng)作——用棉片擦拭。

      錯(cuò)誤類型的量化分布(上圖)進(jìn)一步證實(shí)了“合理性差距”。在兩種手術(shù)中,與高層手術(shù)邏輯相關(guān)的錯(cuò)誤(如手術(shù)意圖、器械操作錯(cuò)誤)占了絕大多數(shù),而底層的視覺質(zhì)量問題僅占一小部分(腹腔鏡6.2%,神外2.8%)。

      當(dāng)然,模型偶爾也能生成一些高分案例,但這些通常是手術(shù)動(dòng)作簡(jiǎn)單、甚至是暫停的場(chǎng)景。


      高分案例:(a)中生成了自然的解剖動(dòng)作,(b)中則幾乎完美復(fù)刻了手術(shù)暫停的場(chǎng)景。


      災(zāi)難性失敗案例:(a)中需要縫合,模型卻幻覺出器械并執(zhí)行無法識(shí)別的操作;(b)中需要涂膠水,模型完全搞錯(cuò)了意圖。

      研究意義與未來展望

      這項(xiàng)研究首次提供了量化證據(jù),揭示了當(dāng)前最先進(jìn)的視頻生成模型在手術(shù)AI領(lǐng)域中,令人信服的視覺模仿與真正的因果理解之間存在巨大鴻溝

      CV君認(rèn)為,這項(xiàng)工作意義重大。它告訴我們,僅僅依靠在通用數(shù)據(jù)上進(jìn)行大規(guī)模訓(xùn)練,可能不足以讓模型掌握專家領(lǐng)域的復(fù)雜規(guī)則。未來的“手術(shù)世界模型”可能需要新的架構(gòu)范式,能夠整合結(jié)構(gòu)化的領(lǐng)域知識(shí),并在生成過程中強(qiáng)制執(zhí)行嚴(yán)格的物理和邏輯約束。

      SurgVeo基準(zhǔn)和SPP評(píng)估框架為未來的研究奠定了一個(gè)至關(guān)重要的基礎(chǔ)和路線圖,指引著我們?nèi)绾伍_發(fā)能夠駕馭真實(shí)世界醫(yī)療領(lǐng)域復(fù)雜性的下一代模型。雖然通往真正的手術(shù)世界模型道阻且長(zhǎng),但這項(xiàng)研究無疑是邁出的清醒而關(guān)鍵的一步。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      “最風(fēng)流”央視女主持:將2個(gè)有婦之夫玩弄于股掌,如今幸福嗎

      “最風(fēng)流”央視女主持:將2個(gè)有婦之夫玩弄于股掌,如今幸福嗎

      優(yōu)趣紀(jì)史記
      2025-11-29 17:22:29
      一口氣看完四集郭京飛新劇《老舅》,我感慨萬千,寫下這篇文章

      一口氣看完四集郭京飛新劇《老舅》,我感慨萬千,寫下這篇文章

      晴晴的娛樂日記
      2025-12-15 22:06:55
      何晴去世不到24小時(shí),惡心事發(fā)生!私生活被詬病,網(wǎng)友:紅顏薄命

      何晴去世不到24小時(shí),惡心事發(fā)生!私生活被詬病,網(wǎng)友:紅顏薄命

      徐徐道史
      2025-12-14 18:28:32
      廣西54歲李某甘蔗地殺2女后續(xù)!10萬懸賞追逃,當(dāng)?shù)厝似馗鄡?nèi)幕

      廣西54歲李某甘蔗地殺2女后續(xù)!10萬懸賞追逃,當(dāng)?shù)厝似馗鄡?nèi)幕

      奇思妙想草葉君
      2025-12-14 21:46:07
      醫(yī)生苦勸:長(zhǎng)期吃降壓藥的人,千萬要牢記,多補(bǔ)充這3種維生素!

      醫(yī)生苦勸:長(zhǎng)期吃降壓藥的人,千萬要牢記,多補(bǔ)充這3種維生素!

      紙上的心語
      2025-12-15 21:32:22
      中方一句“東倭”,嚇壞日本右翼?前駐華大使急呼:該臥薪嘗膽了

      中方一句“東倭”,嚇壞日本右翼?前駐華大使急呼:該臥薪嘗膽了

      近史博覽
      2025-12-15 14:43:10
      突發(fā)!澤連斯基,妥協(xié)了!一切結(jié)束了!

      突發(fā)!澤連斯基,妥協(xié)了!一切結(jié)束了!

      財(cái)經(jīng)要參
      2025-12-15 13:18:38
      人社部定調(diào)!穩(wěn)步提高社會(huì)保障待遇水平,2026年養(yǎng)老金雙增長(zhǎng)嗎?

      人社部定調(diào)!穩(wěn)步提高社會(huì)保障待遇水平,2026年養(yǎng)老金雙增長(zhǎng)嗎?

      財(cái)話連篇
      2025-12-15 18:35:49
      亞運(yùn)三金王王莉?qū)嵜e報(bào):基地主任索要15萬 體罰辱罵下跪是常事

      亞運(yùn)三金王王莉?qū)嵜e報(bào):基地主任索要15萬 體罰辱罵下跪是常事

      醉臥浮生
      2025-12-15 08:01:17
      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      錢再多有啥用?鞏俐帶77歲老公回北京,雪中騎一輛車,笑容藏不住

      洲洲影視娛評(píng)
      2025-12-13 19:57:10
      張藝興發(fā)文致歉:因參加國(guó)家話劇院重要活動(dòng)而趕回北京,此前SM娛樂臨時(shí)公告張藝興將缺席EXO粉絲見面會(huì),已入場(chǎng)觀演門票不可退款

      張藝興發(fā)文致歉:因參加國(guó)家話劇院重要活動(dòng)而趕回北京,此前SM娛樂臨時(shí)公告張藝興將缺席EXO粉絲見面會(huì),已入場(chǎng)觀演門票不可退款

      極目新聞
      2025-12-14 18:51:00
      張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

      張文宏直言:不管你信不信,老人過了80歲,基本都有如下7個(gè)現(xiàn)狀

      黃河新流域
      2025-09-28 13:34:43
      被全網(wǎng)瘋傳的“雙頂流”戀愛瓜,竟是他倆?結(jié)果大反轉(zhuǎn)!

      被全網(wǎng)瘋傳的“雙頂流”戀愛瓜,竟是他倆?結(jié)果大反轉(zhuǎn)!

      毒舌八卦
      2025-12-15 22:52:12
      央視一哥畢福劍再婚生子,次子已上幼兒園,生活近況曝光

      央視一哥畢福劍再婚生子,次子已上幼兒園,生活近況曝光

      復(fù)轉(zhuǎn)這些年
      2025-12-07 15:39:25
      U23亞洲杯最終23人名單確定,6人無緣參賽或被淘汰

      U23亞洲杯最終23人名單確定,6人無緣參賽或被淘汰

      凡人說體育
      2025-12-15 13:55:06
      何晴離世消息曝光不到24小時(shí),惡心的一幕出現(xiàn)了!

      何晴離世消息曝光不到24小時(shí),惡心的一幕出現(xiàn)了!

      叨嘮
      2025-12-15 01:57:05
      撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

      撒切爾夫人在回憶錄中坦言:當(dāng)年并不想歸還香港,考慮過發(fā)動(dòng)戰(zhàn)爭(zhēng)

      泠泠說史
      2025-12-15 18:05:17
      西方內(nèi)訌升級(jí):英銀行家集體反水威脅撤出俄資產(chǎn)

      西方內(nèi)訌升級(jí):英銀行家集體反水威脅撤出俄資產(chǎn)

      夢(mèng)想的現(xiàn)實(shí)
      2025-12-15 10:41:52
      賺大陸錢捐給“臺(tái)獨(dú)”的集團(tuán):民進(jìn)黨的頭號(hào)金主,終于被殺雞儆猴

      賺大陸錢捐給“臺(tái)獨(dú)”的集團(tuán):民進(jìn)黨的頭號(hào)金主,終于被殺雞儆猴

      被誤解的時(shí)候能微微一笑
      2025-12-15 08:54:45
      變臉?亞歷山大賽前曾表示想追73勝紀(jì)錄,輸馬刺后稱破紀(jì)錄毫無意義

      變臉?亞歷山大賽前曾表示想追73勝紀(jì)錄,輸馬刺后稱破紀(jì)錄毫無意義

      懂球帝
      2025-12-15 15:24:06
      2025-12-16 06:43:00
      算法與數(shù)學(xué)之美 incentive-icons
      算法與數(shù)學(xué)之美
      分享知識(shí),交流思想
      5267文章數(shù) 64595關(guān)注度
      往期回顧 全部

      科技要聞

      大佬冷酷預(yù)言:未來15年 人形機(jī)器人成廢鐵

      頭條要聞

      小米車主第1天提車在交付中心撞人 小米內(nèi)部人士回應(yīng)

      頭條要聞

      小米車主第1天提車在交付中心撞人 小米內(nèi)部人士回應(yīng)

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動(dòng)物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場(chǎng),前夫許亞軍雙眼泛紅?

      財(cái)經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      健康
      本地
      藝術(shù)
      游戲
      公開課

      這些新療法,讓化療不再那么痛苦

      本地新聞

      云游安徽|阜陽三朝風(fēng)骨,傳承千年墨香

      藝術(shù)要聞

      從木匠到巨匠,大師是如何煉成的

      當(dāng)手機(jī)能自動(dòng)清每日任務(wù),玩家天天上線是為了什么?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: A成片人| 伊人色亚洲| 亚洲欧美制服| 怡红院久久| 欧美狠狠撸| 中文字幕另类综合| 国产无吗一区二区三区在线欢| 少妇高潮喷水久久久影院| 日本特黄特色aaa大片免费| 乱人伦xxxx国语对白| 国产精品人成视频免费播放| аⅴ天堂中文在线网| 影音先锋你懂得| 黑人AV网站| 依依综合网| 亚洲成a人片在线观看无码| 国产精品天天看天天狠| 日韩在线视频观看免费网站| 国产免费无码一区二区三区| 人妻伦理在线一二三区| AV不卡在线| 欧美一性一乱一交一视频| 蜜臀av午夜一区二区三区 | 色妞www精品免费视频| 无码gogo大胆啪啪艺术| 无码国产精品一区二区色情男同| 小13箩利洗澡无码视频网站| 人妻?无码?中出| 国产一区二区波多野结衣| 精品婷婷色一区二区三区| 人妻夜夜爽天天爽| 亚洲国产精品久久一线不卡| 越南女子杂交内射bbwxz| 亚洲无码精品人妻| 国产一級A片免费看| 99免费精品视频| 失禁大喷潮在线播放| 一区二区三区中文字幕| 欧美精品在线观看| 光泽县| 日韩 高清 无码 人妻|