撰文丨王聰
編輯丨王多魚
排版丨水成文
近年來,促進(jìn)生物學(xué)、化學(xué)、物理學(xué)、材料科學(xué)、計(jì)算機(jī)科學(xué)和工程學(xué)等不同科學(xué)領(lǐng)域合作的跨學(xué)科研究,推動(dòng)了眾多科學(xué)領(lǐng)域的突破,并開辟了新的增長(zhǎng)途徑。例如,在數(shù)字醫(yī)學(xué)領(lǐng)域,臨床實(shí)踐、計(jì)算機(jī)科學(xué)及其他學(xué)科的知識(shí)和技術(shù)的融合,極大地推動(dòng)了醫(yī)療保健服務(wù)的提升、患者參與度的提高、臨床結(jié)果的改善以及醫(yī)療保健系統(tǒng)的優(yōu)化。
然而,盡管諸如人工智能(AI)之類的技術(shù)在生物醫(yī)學(xué)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力,但其廣泛應(yīng)用卻因技術(shù)障礙而受到極大限制。醫(yī)生能夠提供寶貴的臨床見解和第一手經(jīng)驗(yàn),但由于缺乏必要的多學(xué)科專業(yè)知識(shí)或技能,以及難以獲得工程技術(shù)人員的支持,他們?cè)谏婕?AI 技術(shù)的問題導(dǎo)向型研究中的參與可能會(huì)受到極大阻礙。對(duì)于那些身處偏遠(yuǎn)醫(yī)院或大學(xué)的小型研究團(tuán)隊(duì)或臨床團(tuán)隊(duì),以及那些難以獲取研究資源、跨學(xué)科合作和技術(shù)支持的年輕醫(yī)生來說,這一挑戰(zhàn)尤為明顯。
2025 年 11 月 26 日,中山大學(xué)中山眼科中心林浩添教授團(tuán)隊(duì)在 Cell 子刊Cell Reports Medicine上發(fā)表了題為:The effectiveness of large language models in medical AI research for physicians: A randomized controlled trial 的研究論文。
這項(xiàng)隨機(jī)對(duì)照試驗(yàn)評(píng)估了大語言模型(LLM)在醫(yī)學(xué)人工智能研究中對(duì)醫(yī)生的有效性,結(jié)果顯示,大語言模型能夠幫助醫(yī)生克服技術(shù)障礙,協(xié)助醫(yī)生開展醫(yī)療人工智能研究,但也存在著幻覺和依賴性風(fēng)險(xiǎn)。
![]()
醫(yī)生能夠提供寶貴的臨床見解,但他們?cè)?strong>醫(yī)學(xué)人工智能研究中的參與度,受到技術(shù)專長(zhǎng)有限的限制。
在這項(xiàng)最新研究中,研究團(tuán)隊(duì)開展了一項(xiàng)優(yōu)效性、開放標(biāo)簽的隨機(jī)對(duì)照試驗(yàn),招募了64名初級(jí)眼科醫(yī)生,在最小化工程輔助的情況下進(jìn)行為期兩周的“自動(dòng)化白內(nèi)障識(shí)別”項(xiàng)目。其中干預(yù)組(32人)使用大語言模型(LLM)ChatGPT-3.5,對(duì)照組(32人)則不使用。
結(jié)果顯示,干預(yù)組的項(xiàng)目總完成率高于對(duì)照組(87.5% vs. 25.0%),無輔助完成率同樣更高(68.7% vs. 3.1%)。干預(yù)組展現(xiàn)出更優(yōu)的項(xiàng)目規(guī)劃能力和更短的完成時(shí)間。經(jīng)過兩周洗脫期后,41.2% 的成功干預(yù)組參與者在沒有大語言模型(LLM)支持的情況下完成了新項(xiàng)目。
調(diào)查顯示,42.6% 的參與者擔(dān)心會(huì)不加理解地復(fù)述 AI 給出的信息,40.4% 的參與者擔(dān)憂 AI 會(huì)助長(zhǎng)惰性思維,這表明 AI 對(duì)于醫(yī)生而言可能存在潛在依賴性風(fēng)險(xiǎn)。
因此,大語言模型雖能幫助醫(yī)生克服技術(shù)障礙,但其長(zhǎng)期風(fēng)險(xiǎn)仍需進(jìn)一步研究。
該研究的核心發(fā)現(xiàn):
大語言模型(LLM)協(xié)助醫(yī)生開展醫(yī)療 AI 項(xiàng)目,完成率從 25% 提升至 87%;
在洗脫期后,41% 的成功干預(yù)醫(yī)生能夠獨(dú)立完成新項(xiàng)目;
大語言模型使醫(yī)療 AI 研究民主化,但存在幻覺和依賴風(fēng)險(xiǎn);
提出了與大語言模型有效互動(dòng)的初步提示指南。
![]()
總的來說,這項(xiàng)研究證明,大語言模型(LLM)能夠有效地幫助醫(yī)生克服與醫(yī)療 AI 項(xiàng)目的設(shè)計(jì)、執(zhí)行和報(bào)告相關(guān)的專業(yè)知識(shí)和技術(shù)障礙。然而,該研究也觀察到使用大語言模型存在某些風(fēng)險(xiǎn),例如 AI 的幻覺以及可能產(chǎn)生的依賴傾向。因此,還需要進(jìn)一步的研究來評(píng)估長(zhǎng)期使用大語言模型所形成的依賴風(fēng)險(xiǎn)。
論文鏈接:
https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00542-7
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.