近日,中國平安旗下平安科技攜手平安好醫(yī)生、北大醫(yī)療聯(lián)合研發(fā)的平安“醫(yī)療大模型3.5”,在全球醫(yī)療AI權(quán)威評(píng)測(cè)集HealthBench Hard(OpenAI發(fā)布)中斬獲全球最高分(57.27分),超越百川(44.4分)、Meta(42.8分)、OpenAI(42分)等多家頭部科技企業(yè)位列排名榜首,刷新該基準(zhǔn)的評(píng)分紀(jì)錄。此前,中國平安金融大模型在行業(yè)權(quán)威大模型評(píng)測(cè)體系CNFinBench大語言模型公開榜單上同樣位列綜合第一。相關(guān)評(píng)測(cè)方表示,目前中國平安在“金融”、“醫(yī)療”兩大專業(yè)領(lǐng)域的大模型技術(shù)能力均達(dá)到世界一流水平。
據(jù)了解,平安醫(yī)療大模型參與評(píng)測(cè)的HealthBench基準(zhǔn)由OpenAI發(fā)布,由60個(gè)國家、26個(gè)醫(yī)學(xué)專業(yè)的262名醫(yī)生共同構(gòu)建,包含5000組高仿真多輪醫(yī)療對(duì)話,并設(shè)置48,562項(xiàng)由醫(yī)生制定的評(píng)分標(biāo)準(zhǔn)系。其中,HealthBench Hard被視為高難度子集,是OpenAI從5000組對(duì)話中篩選出1000組更具挑戰(zhàn)性的案例,用于測(cè)試模型在復(fù)雜、不確定、高風(fēng)險(xiǎn)臨床場(chǎng)景中的推理能力上限,也是OpenAI評(píng)估先進(jìn)模型及醫(yī)療健康產(chǎn)品的重要參考。
復(fù)刻真實(shí)醫(yī)生臨床推理邏輯,AI醫(yī)療大模型從“咨詢”走向“診療”
平安科技介紹,區(qū)別于通用大模型側(cè)重標(biāo)準(zhǔn)化問答的訓(xùn)練邏輯,平安結(jié)合北大醫(yī)療集團(tuán)、平安好醫(yī)生等醫(yī)療自營(yíng)旗艦業(yè)務(wù)的真實(shí)場(chǎng)景,依托長(zhǎng)期積累的“篩、管、治、康”全病程服務(wù)閉環(huán)數(shù)據(jù),持續(xù)推動(dòng)醫(yī)療AI從傳統(tǒng)的信息獲取、健康咨詢,進(jìn)一步走向復(fù)雜病種輔助決策、多學(xué)科協(xié)同診療等更接近臨床核心的應(yīng)用場(chǎng)景,打造主動(dòng)服務(wù)式AI大模型。
結(jié)合真實(shí)場(chǎng)景數(shù)據(jù),AI大模型復(fù)刻真實(shí)醫(yī)生臨床推理邏輯。針對(duì)臨床普遍存在患者癥狀描述模糊、病情動(dòng)態(tài)變化、關(guān)鍵信息缺失等難題,平安科技研發(fā)團(tuán)隊(duì)設(shè)計(jì)了由患者數(shù)字分身、自適應(yīng)評(píng)估智能體、臨床知識(shí)圖譜組成的動(dòng)態(tài)診斷模擬環(huán)境,將醫(yī)生在不確定條件下的判斷過程建模為multi-turn RL推理任務(wù),為算法優(yōu)化突破提供支撐。
錘煉頂尖算法能力,提高AI大模型可用性、準(zhǔn)確度。針對(duì)醫(yī)療推理高復(fù)雜、低容錯(cuò)的特點(diǎn),研發(fā)團(tuán)隊(duì)采用三階段遞進(jìn)訓(xùn)練:靜態(tài)框架內(nèi)化構(gòu)建具臨床邏輯的知識(shí)體系、動(dòng)態(tài)思維鏈探索實(shí)現(xiàn)復(fù)雜場(chǎng)景下的長(zhǎng)鏈與跨學(xué)科推理,最終實(shí)現(xiàn)高階推理能力躍遷。同時(shí)自研全鏈路幻覺控制引擎,融合上下文及語境學(xué)習(xí)、不確定量化等算法,實(shí)現(xiàn)從提示詞、訓(xùn)練到推理階段的全流程風(fēng)險(xiǎn)控制,不斷降低幻覺率。
AI賦能“四到”醫(yī)療體系(到線、到院、到家、到企)。推出平安靈眸、健康管家、AI-MDT、AI康復(fù)等AI醫(yī)療產(chǎn)品,平安逐步構(gòu)建了覆蓋"篩查-管理-治療-康復(fù)"的完整醫(yī)療鏈路,通過規(guī)模化、數(shù)據(jù)飛輪、真實(shí)世界對(duì)齊三項(xiàng)核心要素,實(shí)現(xiàn)醫(yī)療AI智能躍遷。在早篩環(huán)節(jié),“平安靈眸”已構(gòu)建90余種疾病篩查模型。目前,該產(chǎn)品已下沉至全國1500家基層醫(yī)療機(jī)構(gòu),累計(jì)完成150萬次早篩,每年幫助30萬客戶實(shí)現(xiàn)風(fēng)險(xiǎn)早發(fā)現(xiàn),。在管理環(huán)節(jié),“健康管家”通過多智能體協(xié)同,打造了“社群運(yùn)營(yíng)”式健康管理體系,已構(gòu)建起服務(wù)200萬患者的國內(nèi)最大慢病管理社區(qū)。通過AI主動(dòng)干預(yù),慢病患者的依從性提升了5倍,實(shí)現(xiàn)了從一次性咨詢到長(zhǎng)期健康效果管理的質(zhì)變。
落地MDT多場(chǎng)景,AI診療方案采納率已達(dá)85%
行業(yè)臨床數(shù)據(jù)表明,接受規(guī)范MDT(Multidisciplinary Team,多學(xué)科診療團(tuán)隊(duì))會(huì)診的腫瘤患者,五年生存率可提升15%。但受限于頂級(jí)專家稀缺、醫(yī)院流程限制、地域資源不均等問題,國內(nèi)高質(zhì)量MDT服務(wù)覆蓋率長(zhǎng)期偏低。響應(yīng)市場(chǎng)和客戶需求,中國平安依托醫(yī)療大模型,推出北大醫(yī)療AI-MDT Pro智能會(huì)診系統(tǒng),面向醫(yī)生團(tuán)隊(duì)提供復(fù)雜病史自動(dòng)整理、多學(xué)科診療方案生成、康復(fù)及隨訪方案輔助等能力,把稀缺的多學(xué)科診療能力通過AI產(chǎn)品化下沉,解決用戶的就醫(yī)難題。
平安科技介紹,北大醫(yī)療AI-MDT Pro智能會(huì)診系統(tǒng)已落地北大醫(yī)療、平安好醫(yī)生等機(jī)構(gòu)真實(shí)場(chǎng)景,可充分考慮患者信息,給出化療、靶向治療、放療、內(nèi)分泌治療的全流程建議,并明確用藥劑量、周期、順序。內(nèi)部數(shù)據(jù)顯示,平安的AI診療方案采納率達(dá)到85%;在乳腺癌等重癥領(lǐng)域,AI診療方案和主任專家一致性達(dá)到92.5%以上。平安首席技術(shù)官王曉航表示,平安的目標(biāo)是將頂級(jí)的多學(xué)科診療能力,從中心城市大醫(yī)院的稀缺資源,轉(zhuǎn)化為觸手可及的規(guī)模化普惠供給。
值得一提的是,2026年3月,中國平安金融大模型PingAnGPT-Qwen3-32B 在CNFinBench大語言模型公開榜單上綜合排名第一,超越DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等開源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等領(lǐng)先的閉源商業(yè)模型,在金融事實(shí)推理與計(jì)算、金融專業(yè)知識(shí)問答、金融合規(guī)與風(fēng)險(xiǎn)控制等多項(xiàng)關(guān)鍵指標(biāo)表現(xiàn)卓越。2026年4月,中國平安升級(jí)AI“快捷服務(wù)”,為2.52億客戶打造“一句話能辦事”的專屬金融AI 助手,能交易、能融資、能理賠、能救急,滿足“一個(gè)入口、一站式解決”客戶需求。該AI助手將300余項(xiàng)數(shù)字化服務(wù)全面封裝,構(gòu)建了主動(dòng)服務(wù)能力,能夠理解客戶的個(gè)性化需求,讓服務(wù)從“被動(dòng)響應(yīng)”走向“主動(dòng)打理”。
打造領(lǐng)先科技能力,專業(yè)服務(wù)守護(hù)心中的平安。中國平安表示,公司將堅(jiān)持深化“綜合金融+醫(yī)療養(yǎng)老”雙輪并行以及科技驅(qū)動(dòng)戰(zhàn)略,秉承“AI in ALL”原則,深度扎根金融、醫(yī)療、養(yǎng)老等核心主業(yè),持續(xù)推進(jìn)模型優(yōu)化迭代,進(jìn)一步打造領(lǐng)先AI能力,深化場(chǎng)景化應(yīng)用落地,重構(gòu)業(yè)務(wù)效率、變革服務(wù)體驗(yàn),不斷滿足人民群眾對(duì)美好生活的向往。
來源:大眾報(bào)業(yè)·半島網(wǎng)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.