![]()
醫眾案例
該Agent案例由醫眾投遞并參與金猿組委會×數據猿×上海大數據聯盟共同推出的《2025中國大數據產業年度Data Agent創新應用》榜單/獎項評選。
在“健康中國 2030”規劃綱要與國家數字經濟發展戰略指引下,以大型語言模型為代表的人工智能技術正深度融入醫療健康領域,顯著提升疾病診斷、治療方案制定及醫學研究的效率與質量。然而,AI性能的充分發揮依賴于對多模態、跨機構醫療數據的深度學習與優化,而我國《數據安全法》《個人信息保護法》及國際HIPAA法規所確立的“數據不出院、不出境”原則,在保障患者隱私與數據安全的同時,也帶來了數據共享與隱私保護之間的根本矛盾。
當前,盡管業界已提出“可信數據空間”“聯邦學習”等技術路徑,但在應對異構醫療數據時,仍難以支撐新一代醫療大模型對數據深度融合與精細化調優的需求。此外,傳統開發模式高度依賴人工編碼與系統搭建,開發人員不得不耗費大量精力構建基礎架構,導致研發效率低下,且受制于個體技術能力。
在此模式下,技術迭代難以匹配醫院快速變化的需求,開發進程常受限于技術瓶頸。醫院業務場景復雜多樣,個性化需求頻繁涌現,傳統模式難以敏捷響應,往往僅能提供標準化解決方案,無法精準適配臨床、管理、科研等多維場景,導致所構建系統與實際業務需求之間存在顯著差距。
為應對以上困境,本項目創新融合自主研發的“數據科學模型”與“數據編織”的創新管理理念,構建面向真實臨床場景的醫療大模型優化機制。該機制在確保數據物理位置不變、全程加密的基礎上,通過密碼學協議構建安全可計算的虛擬數據網絡,實現“數據不動算法動,數據可用不可見”,同時開放給開發者和數據高階使用者以AI原生的方式調用DataAI的能力,靈活生成適用于各類個性化場景的Data Agent,為醫療大模型的合規應用與數據價值釋放開辟創新路徑。
時間周期:
開始時間:2025年9月
中間重要時間節點:2025年11月
完結時間:2026年12月(預計)
Data Agent 應用需求
1.客戶“Data Agent”需求
希望通過“數據+AI”賦能臨床與科研,需要一個系統性破解當前醫療數據困境的智能解決方案——具備自主性、合規性與協同性的“Data Agent”生態系統:
?安全數據價值釋放:能在《數據安全法》、《個人信息保護法》及HIPAA等嚴苛法規框架下,不移動原始數據而實現跨機構、多模態醫療數據價值融合與計算。實現“數據可用不可見,數據不動算法動”,從根本上解決數據利用與隱私保護的矛盾。
?系統集成與治理協調:面對院內數據質量差、孤島林立、系統異構及成本高昂的現狀,具備強大的連接與治理能力,能夠跨越多樣化、老舊化的系統(如HIS, EMR, PACS, LIS),實現數據的自動標準化、對齊與質量提升。
?臨床場景賦能:能理解復雜臨床語境、并能執行端到端任務。克服當前醫療大模型的“知識幻覺”與場景適應性不足的缺陷,通過自主感知、決策與多任務協同,直接輔助或完成如輔助診斷、治療方案推薦、科研數據提取等復雜臨床決策任務。
?自主可控的智能模型:支持基于模型生成個性化、場景化的數據智能體Data Agent,構建自主可控的智能數據模型體系,使用戶能夠根據實際業務需求靈活生成并部署執行各類數據任務的智能體,實現數據能力的閉環建設與持續進化。
2.需求拆解
我公司從根源性問題出發,進行深入剖析:客戶的需求并非單一技術點,而是一個貫穿數據、模型、應用與治理全鏈路的生態:在保障數據安全隱私前提下,實現跨機構醫療數據的有效利用與融合,以提升醫療大模型性能。基于此,將需求拆解為三個關鍵層面:
?基礎層面:安全可信的數據協作網絡
目標:打破數據孤島,實現跨域數據融合。需解決異構數據源對接、全周期隱私保護、以及融合過程中的性能與可信驗證問題。
?核心層面:臨床導向的模型優化與任務執行
目標:提升AI的準確性與可靠性。需攻克數據質量不佳導致的模型訓練難題、以及大模型的“知識幻覺”和復雜場景適應性問題。將多源業務數據高效訓練為專用模型,并支持模型的持續動態更新,安全、可靠地服務于各類實時業務數據需求場景。
?保障層面:可量化評估的治理與合規體系
目標:構建數據治理與合規閉環體系:通過元數據血緣圖譜實現全鏈路分鐘級快速追溯;利用全鏈路安全審計日志自動生成不可篡改的合規證據鏈;基于血緣與審計數據建立量化評估體系,實現治理成效與合規狀態的動態可視化管理。
3.解決方案
針對上述需求,我公司提供完整的數據智能服務解決方案:
?數據編織:將“數據編織”與全同態加密深度耦合,應用于高敏感度醫療數據領域。構建動態緊密耦合的數據協作新范式,支持不同來源數據特征在密文域內進行豐富代數與邏輯運算,生成統一“加密數據體”。引入零知識證明機制,實現去中心化可信驗證,保證數據融合過程安全合規。
?數據科學模型(DataScience):構建臨床導向的多智能體自適應優化算法,將醫療模型解構為多個面向特定臨床子任務的功能模塊Data AI。設計知識與數據雙輪驅動算法,融合臨床知識圖譜與加密編織數據;引入多任務協同優化機制,通過智能體間協同與博弈實現多臨床子目標動態權衡優化,可智能理解數據需求,自動編排并執行數據任務。
?開放平臺:構建靈活的能力開放平臺,提供標準化的API接口和開發工具包,支持醫療機構的二次開發和集成。平臺提供完整的開發者文檔、測試環境和運維支持,確保各類應用場景的快速落地和持續優化。
面臨挑戰
1.數據層面挑戰
?數據質量參差不齊:醫療數據源自HIS、EMR、PACS、LIS等多個異構系統,缺乏統一標準與清洗流程,加之手工錄入錯誤與接口傳輸問題,導致數據一致性差、錯誤率高,整體質量難以保障。
?數據孤島現象嚴重:各業務系統由不同廠商建設,數據庫獨立、格式不一,缺乏有效的共享機制與互通標準,致使數據整合與無縫流轉困難。
?系統改造成本高昂:平臺建設需投入大量資金,而醫院內部老舊系統占比較高,接口開發復雜,導致初始集成與長期運維成本居高不下,制約了數字化升級進程。
2.模型應用挑戰
?臨床場景復雜多變:醫療大模型需要處理復雜多變的臨床場景和數據模式,要求模型具備強大架構與算法以適應多樣數據模式。
?模型幻覺與適應性不足:醫療大模型易產生“知識幻覺”,生成看似合理實則錯誤的內容,誤導臨床判斷。此外,模型對復雜現實場景的適應性仍顯不足,難以靈活應對臨床不確定性與個體差異。
3.法規合規挑戰
?國內外《數據安全法》《個人信息保護法》及HIPAA等法規均嚴格限定醫療數據“不出院、不出境”,旨在保護患者隱私。然而,醫療AI的發展恰恰依賴于跨機構、多模態數據的深度學習和流通,這與法規要求形成根本矛盾。如何在合法合規的前提下,安全地整合與利用分散數據,是當前面臨的核心合規瓶頸。
?安全與性能難以兼顧:醫療數據高度敏感,加密技術雖提升安全性,但也增加處理復雜度與計算開銷;匿名化與脫敏在保護隱私的同時,常會損失數據信息量,影響分析準確性。
戰略目標
1.數據整合:全域數據集成與治理
通過數據編織技術,在不移動原始數據的前提下,邏輯聯結各院區異構數據源,實現全域元數據的統一采集與整合,并進行語義智能化分析與理解,自動構建數據血緣關系與醫學知識圖譜,形成標準化、可檢索的統一數據資產目錄,為后續分析提供高質量數據基礎。
2.數據加密與脫敏:確保“數據可用不可見
集成隱私增強計算技術,對需聯合計算的數據進行加密,支持在密文狀態下直接完成數學運算,確保計算結果與明文一致。通過統一服務接口實現跨數據源安全訪問,并支持行列級數據訪問控制,結合AI動態定義與執行數據安全策略。
3.數據分析:驅動智能決策與科研
基于前述環節形成的高質量、高安全性數據環境,訓練具備醫學專業知識、能深度理解臨床語境的大語言模型。支持各院區在本地進行模型訓練,僅聚合加密的模型參數,確保原始數據永不出域。
4.數據智能體開發:動態自然語義交互與Data Agent開發
通過自然語言人機交互,調用數據科學模型生成Data Agent,可實現在高維向量層智能解析復雜數據需求,并自動編排、執行端到端的數據任務,最終將數據價值直接轉化為臨床洞察與行動。
實施與部署過程
1.Data Agent的職能角色
數據科學模型是一個客觀的動態參數模型,它向下封裝并協調了復雜的數據技術棧,向上以最自然的方式響應業務需求,將靜態的數據資產轉化為動態的、可流動的智能生產力。通過數據科學模型,本項目成功地將“數據可用不可見”的技術原則,兌現為“洞察可見、行動可控”的業務現實,最終賦能醫院在保障安全與合規的前提下,實現臨床、科研與管理能力的全面智能化升級。
為確保項目成功交付與持續運營,我們設立了跨職能的協同團隊,涵蓋交付、產研與售后三大板塊:
?交付團隊:是項目交付階段的總負責人,是客戶與公司內部之間的核心橋梁,確保項目在預定時間、預算內,達到預期的業務目標。
?產研團隊:是核心技術的構建者,負責將客戶需求轉化為穩定、可擴展的產品與解決方案。
?售后團隊:是項目上線后的價值保障與拓展中心,確保系統穩定、高效運行,并通過持續運營挖掘數據的長期價值。
?項目管理團隊:負責整合規劃、進度控制、風險管理和資源協調,確保各團隊目標一致、節奏協同、交付順暢。
2.系統架構
采用分布式數據管理架構,分為三層:
?數據源層:全域異構數據的統一管理
全面覆蓋結構化、非結構化、半結構化數據,無縫對接關系型數據庫、數據湖、數據倉庫、數據中臺等各類異構數據源,實現數據源的統一管理,為上層提供豐富的“數據原料”
?數據連接層(虛擬化層):安全的虛擬數據網絡
是整個架構的中樞神經系統,不通過物理移動原始數據,而通過數據虛擬化技術構建了一個邏輯統一的數據訪問層。
?訪問與消費層:靈活開放的DataAI服務
提供標準化的T-SQL、OpenAPI等接口,讓用戶能夠以AI原生的方式,實時、靈活調用數據、生成AI應用(如Data Agent、小程序),進行AI原生應用開發等,直接驅動業務決策與創新。
![]()
3.核心技術
?元數據管理:快速數據源連接,不通過物理方式抽取,快速實現數據整合,并進行主動元數據探查,對醫療數據的相關元信息進行全面、精準的采集、存儲、更新與維護。通過AI自動識別元數據并分析血緣關系,形成標準化、可檢索的數據資產目錄,為數據發現、數據分類、數據檢索等功能提供基礎支撐,為深度分析與價值挖掘奠定基礎。
?隱私增強計算:在加密狀態下完成數據計算與分析,確保數據“可用不可見”,實現隱私保護下的聯合建模與價值挖掘。為跨機構醫療數據協作提供安全底座,推動隱私合規前提下的精準醫療與科研創新。
?長文本特征提取:運用自然語言處理與機器學習技術,對電子病歷、檢查報告、科研論文等非結構化長文本進行解析與語義理解,提取關鍵醫療信息(如癥狀、診斷、用藥等),并轉化為結構化數據。該過程釋放文本中潛在的臨床與科研價值,支持數據挖掘、知識圖譜構建與決策分析。支持無監督學習的智能模型優化,以向量化方式表達文本,并保留語序和上下文信息,經過無監督深度學習后,申城高質量、高緯度的向量數據。
?Data Agent以及AI小程序開發:支持以自然語言交互方式理解用戶復雜需求,自動生成任務流程并動態執行,并動態調整與優化任務執行策略,通過深度理解自然語言中的語義信息,結合醫療領域知識圖譜與規則引擎,將語義意圖轉化為可執行指令,并實時監控任務執行過程,根據反饋信息動態調整任務參數與執行路徑,確保任務高效、準確完成。此技術顯著提升系統的適應性與靈活性,更好滿足醫療領域復雜多變的應用需求。
?模型微調和參數擴展:提供高效的模型微調工具與參數擴展服務,支持用戶根據自身業務場景的私有數據,對基礎模型進行定向優化與知識注入。通過引入業務特征參數,可實現模型能力的快速適配與性能提升,確保其輸出與醫院的實際診療規范、數據標準持續保持一致,實現模型效果的持續進化與專用化定制。
?AI原生應用開發:賦能開發者使用公開的應用程序編程接口(API)和工具構建應用程序和服務,滿足OpenAPI 3.0的協議標準,具備完善的開放文檔,賦能開發者自行開發AI+數據的新型應用,并有效減少開發工作量。
4.核心產品矩陣
?數據編織:是一種智能化的分布式數據管理架構,通過AI、機器學習與語義知識圖譜動態整合異構數據源,實現跨平臺的虛擬化數據訪問與自動化治理。
數據源管理:可快速連接各類多源異構數據源
元數據管理:通過元數據采集、語義理解、元數據血緣關系分析,完成元數據注釋,構建數據資產目錄
數據虛擬化:統一虛擬化數據訪問層,實現跨庫數據統一查詢和NoETL同步
數據任務管理:自動化編排ETL/流處理等任務,動態優化查詢性能與處理流程
數據權限:支持行級數據訪問控制,可結合AI定義數據訪問規則
安全審計:慢查詢日志分析,可支持AI風險行為分析
?數據科學模型:是一種基于動態數據的生成式語言模型,生成的內容取自于經過特征工程治理后的高質量數據。具有很強的科學性:參數來自于自身業務數據,與業務持續保持一致;符號計算:使用圖結構化架構表示復雜知識,求解復雜問題;通過高維向量將模糊的、非標化自然語義描述匹配到標化數據。
![]()
長文本特征提取:依托數據科學模型,自動解析非結構化長文本(如病歷、報告),將其轉化為高質量結構化數據并存儲,賦能深度分析。
模型微調工具和參數擴展:提供工具與服務,支持將特定業務場景參數快速融入模型并即時生效,實現模型的個性化定制與性能擴展。
?開放平臺:面向開發者和數據高階使用者,靈活調用醫眾數據和智能的能力整合平臺,OpenAPI和IDE工具賦予了用戶調用DataAI能力的靈活性,用戶以AI原生的方式使用數據、開發數據應用、研究分析數據,生產效率倍增。
![]()
5.創新思維
?技術創新:
數據安全合規層:傳統隱私計算與聯邦學習在醫療數據應用中協作靜態松散。我們將“數據編織”架構與全同態加密(FHE)技術深度融合,支持不同醫療機構異構數據在密文域通過標準化協議融合,生成統一“加密數據體”。
動態融合性:突破聯邦學習局限,支持密文域內數據特征豐富運算,讓模型學習跨樣本、模態、機構的深層關聯,為大模型提供更精準全面的數據基礎。
去中心化可信驗證:引入零知識證明(ZKP)機制,生成操作證明供參與方驗證,保證數據融合完整可追溯,規避傳統中心化架構風險。
數據精度層:當前醫療大模型存在“知識幻覺”與適應性不足問題。本項目設計基于多智能體強化學習(MARL)的臨床情景感知自適應優化機制,將醫療模型解構為功能模塊并抽象為智能體,協同完成臨床決策。
知識與數據雙驅動:融合臨床知識圖譜(CKG)與加密編織數據,確保模型決策遵循臨床指南與證據鏈,提升準確性、魯棒性與安全性。
多任務協同優化:引入協同與博弈機制,使模型在多臨床子目標間動態權衡,自主學習全局最優帕累托前沿,契合臨床決策過程。
智能應用層:針對醫院個性化業務需求,用戶戶通過自然語言描述數據需求,數據科學模型,即可智能理解數據需求、自動編排,生成可執行的數據智能體。
數據查詢分析的結果來源于科學模型的高質量數據,結果準確,權限可控。
自動生成數據小程序:無需編寫代碼或部署環境,即開即用,實現“所說即所得”的數據任務構建方式,大幅降低技術門檻。
即時響應與自適應執行:生成的智能體具備自主理解、任務分解與執行能力,能夠靈活應對各類個性化的臨床數據場景需求。
?技術優勢:
更快:24小時連接核心系統數據源,億級別數據計算秒級響應。數據整合計算效率平均提升10倍以上
全面:全量數據邏輯連接,實現一個虛擬庫的準實時數據請求。數據請求節點減少90%,覆蓋范圍擴大3-5倍。
智能:AI模型理解數據、治理數據、分析數據,直接響應數據需求。數據工作時長減少80%,響應效率增強50倍。
開放:免費提供開放平臺和IDE 工具,賦予用戶數據使用、AI原生開發的最高權限。數據開發外包成本降低至“0”。
安全:AI風險分析,動態參數模型,自主模型微調和權限規則。“0”模型幻覺,“0”參數污染,“0”數據泄露。
6.團隊配合
以“價值交付”為核心,建立了一套敏捷的協同工作機制。交付團隊作為客戶需求的“傳感器”和項目驅動的“火車頭”,牽引產研團隊進行精準的產品迭代與方案開發;項目管理團隊擔任協同決策中樞,確保資源調配與節奏把控;售后團隊則作為“價值延伸器”,將一線反饋和運營洞察回流至產研與交付團隊,形成從交付到反饋,再到優化的價值閉環,確保解決方案的持續生命力與客戶成功。
合作服務效果
本項目旨在構建一個安全合規、智能驅動的醫療數據價值轉化平臺。我們的核心目標是:通過數據編織技術,在不移動原始數據的前提下,安全集成跨院區異構數據,形成統一、高質量的數據資產視圖;在此基礎上,深度融合隱私增強計算技術,確保全流程“數據可用不可見”,為醫療大模型訓練與數據分析提供高可信度的數據環境;最終,賦能各院區基于本地數據開發專業數據科學模型,通過自然語言交互將數據價值直接轉化為精準的臨床決策、高效的科研發現與智能化的管理行動,全面推動人工智能在醫療領域的深度應用與創新。
1.從“孤島”到“網絡”,實現安全的數據虛擬整合
建立“邏輯統一、物理分散”的數據版圖,跨院區快速將客戶分散在各個系統的數據進行了虛擬化統一接入與編目,構建了覆蓋區域核心業務數據的虛擬數據網絡。過去需耗時數周的手工數據協調與整合工作,如今通過數據編織平臺,數據就緒時間縮短至分鐘級,效率大幅提升。
2.從“數據合規負擔”到“業務創新引擎”
采用本體智能的數據科學模型(Data Sceience)構建理念,將用戶的業務數據持續訓練為動態更新的專有模型,顯著提升數據質量,有效抑制模型幻覺。結合配套的模型微調工具,用戶可自主擴展參數、定義規則并控制權限,形成安全可控、專屬定制的智能數據科學模型,可穩定應用于臨床決策支持、科研分析等實時業務場景,真正將數據轉化為業務創新的核心引擎。
3.從“復雜調用”到“自然交互”,實現靈活的智能服務消費
醫療機構獲得“開箱即用”的數據自服務能力,通過平臺提供的標準化 T-SQL和OpenAPI 接口,獲取跨源數據的開發調試周期縮短,接口開發效率提升。通過“數據科學模型”,用戶無需編寫復雜查詢語句,使用自然語言即可完成數據交互,生成AI DataAgent,在短時間內即可自動完成數據協調、查詢與分析,并生成結構化報告。復雜數據洞察任務的交付速度提升了10倍以上。
4.合規與成本成效:在安全前提下顯著降本增效
得益于虛擬化集成方式,大幅減少了物理數據遷移與復制需求,新業務接入的數據集成成本降低,長期數據存儲與管理成本也得到有效控制。同時,全流程嚴格遵循“數據不出院”原則,在實現數據價值最大化的同時,確保了100%的合規安全,為后續數據要素的深度開發利用提供了可靠范式。
關于企業
·長遠佳
北京長遠佳信息科技有限公司(簡稱長遠佳)成立于2015年,是國家高新技術企業,也是國內數智化醫療數據服務領域可信服務商。“醫眾”是北京長遠佳信息科技有限公司持有的醫療數據服務品牌。為用戶全類型數據提供可持續的數據整合、治理、共享、智能的“DataAI”服務。
·清華長庚
北京清華長庚醫院是由清華大學與北京市共建共管的大型綜合性公立醫院,堅持“醫療服務以患者為中心,醫院運營以醫師為核心,醫院發展以員工為重心”,創立并踐行精準醫療、精誠服務、精益管理的“三精醫療”理念,構建起覆蓋全生命周期、融合數智化的現代健康醫療服務體系;堅持公益性本位,實行黨委領導下的院長負責制,建立健全現代醫院治理體系,醫療團隊與職業化行政團隊分工協同治理,致力于塑造醫教研三位一體的國際化學府型醫院。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.