原文發(fā)表于《科技導報》2025 年第24 期 《 數(shù)據(jù)要素時代的隱私計算平臺互聯(lián)路徑與挑戰(zhàn) 》
隱私計算是實現(xiàn)“數(shù)據(jù)可用不可見”的核心技術,隱私計算平臺繁榮發(fā)展,逐漸形成了以隱私計算平臺為核心的“平臺孤島”現(xiàn)象。如何解決“平臺孤島”問題,進一步促進數(shù)據(jù)要素融合和價值成為重要的研究方向。本文梳理了國內外典型的隱私計算平臺功能、國內隱私計算平臺的互聯(lián)生態(tài)現(xiàn)狀,結合行業(yè)實踐案例,剖析了節(jié)點和算法互聯(lián)的不同模式。總結了隱私計算跨平臺互聯(lián)的難點以及多種挑戰(zhàn)。最后提出具體對策建議。
隨著數(shù)據(jù)要素被確認為國家最新的生產(chǎn)要素,如何加速數(shù)據(jù)的要素化、市場化配置進程成為國家重點關注的問題。保障數(shù)據(jù)安全與隱私保護是數(shù)據(jù)流通與應用的底線要求,因此,隱私計算成為在保護隱私的基礎上進行多方數(shù)據(jù)協(xié)同的關鍵技術之一。
隱私計算按照當前行業(yè)的主流思想可以分為3類技術,安全多方計算(MPC)、聯(lián)邦學習(FL)和可信執(zhí)行環(huán)境(TEE)。隨著隱私計算技術的蓬勃發(fā)展,通過數(shù)據(jù)加密、參數(shù)共享代替數(shù)據(jù)共享等模式,實現(xiàn)了“數(shù)據(jù)孤島”的有效連接,數(shù)據(jù)持有方的數(shù)據(jù)在不出其管理域的前提下,完成了多方協(xié)作計算。在部署多個框架、重新適配業(yè)界主流框架和推動不同平臺框架的互聯(lián)開放這3個選項中,推動不同平臺框架的互聯(lián)開放將成為解決“平臺孤島”問題的最優(yōu)方案,如何實現(xiàn)不同隱私計算框架的互聯(lián)成為了業(yè)界關注和亟待解決的難題。
1
隱私計算平臺互聯(lián)現(xiàn)狀
1.1 隱私計算平臺發(fā)展現(xiàn)狀
根據(jù)公開信息,整理了國內外主流的隱私計算平臺和典型隱私計算工具,隱私計算平臺從上文提到的主流技術視角主要分為3類,具體如表1所示。
一是以工具包、引用庫形式提供隱私計算的必要功能。行業(yè)上相對成熟的主要包括數(shù)據(jù)匿名化、差分隱私、同態(tài)加密庫等。其技術核心都在于構建安全多方計算和聯(lián)邦學習的基礎能力和協(xié)議,并且采用與計算引擎松耦合的模式,實現(xiàn)跨平臺的應用。
二是只提供多方安全計算、聯(lián)邦學習或可信執(zhí)行環(huán)境單一功能的平臺。
三是提供多類功能的綜合性平臺。國內外多個平臺提供的包含聯(lián)邦學習、安全多方計算和可信執(zhí)行環(huán)境中的多種能力。中國隱私計算的平臺,以互聯(lián)網(wǎng)公司、通信行業(yè)、金融行業(yè)和軟件服務商為主要研發(fā)方,其多側重于研發(fā)綜合性隱私計算平臺。
表1 國內外隱私計算平臺工具
![]()
隱私計算平臺與區(qū)塊鏈技術的結合逐漸成為主流,在遵循安全協(xié)議的基礎上,通過區(qū)塊鏈進行身份認證、對計算參與方的行為數(shù)據(jù)進行上鏈和以智能合約實現(xiàn)協(xié)議自動化等方式,進一步保障計算參與者的身份可信和行為可追溯。
1.2 隱私計算平臺互聯(lián)的生態(tài)現(xiàn)狀
隱私計算平臺互聯(lián)場景針對不同的數(shù)據(jù)持有方,采用不同的隱私計算平臺進行聯(lián)合建模或聯(lián)合計算時,因計算框架或采用的計算工具不同進一步導致“平臺孤島”。中國的研究機構、互聯(lián)網(wǎng)行業(yè)、金融行業(yè)都開始探索隱私計算框架的互聯(lián)互通,從代碼開源角度可分為開源互聯(lián)和閉源互聯(lián)。從互聯(lián)的推動主體視角,主要包括以下3類。
一是以金融行業(yè)為中心的、代碼閉源隱私計算平臺互聯(lián)互通。北京金融產(chǎn)業(yè)科技聯(lián)盟是在中國人民銀行指導下,由中國金融電子化集團發(fā)起的綜合性金融科技聯(lián)合創(chuàng)新工作平臺,該聯(lián)盟牽頭開展了金融領域隱私計算數(shù)據(jù)流通平臺的互聯(lián)互通模式探索,成為金融行業(yè)的主流互聯(lián)互通標準。
二是以互聯(lián)網(wǎng)企業(yè)為中心的、開源研發(fā)生態(tài)。微眾銀行開源的FATE 2.0開放開源異構系統(tǒng)互聯(lián)互通開發(fā)指南,意圖推動異構系統(tǒng)的互聯(lián)互通。螞蟻集團開源的隱語框架,在隱私計算聯(lián)盟的組織下,制定系列隱私計算跨平臺互聯(lián)互通開放協(xié)議。
三是點狀的以自研平臺為中心推進的、閉源的互聯(lián)互通實踐。中國電信和中國銀聯(lián)金融科技研究院的隱私計算平臺構建“插拔式”算法組件的互聯(lián)互通,中國移動基于其“1+X”隱私計算平臺與洞見科技、富數(shù)科技、同盾科技和華控清交等多個軟件服務商公司實現(xiàn)互聯(lián)互通。
2
隱私計算平臺互聯(lián)的技術路徑
不同隱私計算平臺開發(fā)方就互聯(lián)路徑尚未達成共識。主要有2種思路,一是從平臺架構和開放層次深度,在2022年可信隱私計算峰會上,有企業(yè)提出隱私計算互聯(lián)從系統(tǒng)架構視角,可以按照應用層、算法層和原語層進行分層互通。北京金融產(chǎn)業(yè)科技聯(lián)盟提出按照管理面和數(shù)據(jù)面解耦進行互聯(lián)互通。葉劍等提出按照“底層通信—中間層交互—頂層應用”的思路設計隱私計算平臺的互聯(lián)互通。
2.1 研究范疇
中華人民共和國工業(yè)和信息化部批準發(fā)布的行業(yè)標準《隱私計算跨平臺互聯(lián)互通第1部分:總體框架》(編號 YD/T 4961.1—2024)定義隱私計算平臺互聯(lián)互通為“具有不同系統(tǒng)架構或功能實現(xiàn)方案的隱私計算技術平臺(包括同一平臺的不同版本)之間通過統(tǒng)一規(guī)范的接口、協(xié)議等實現(xiàn)跨平臺數(shù)據(jù)、算法、算力的交互與協(xié)同,以支持部署不同技術平臺產(chǎn)品用戶共同完成同一隱私計算任務”。
在推動隱私計算跨平臺互聯(lián)的過程中,不同框架的節(jié)點不能直接調度其他平臺的所有計算資源,包括其數(shù)據(jù)集和最小粒度的計算單元。算法互聯(lián)也是同理,隱私計算平臺只能調用自有平臺的基礎算法組件和算子,不能跨平臺調度,但如果是外部第三方插件式的算法組件,多方都可調度算法相同算法組件實現(xiàn)互通。
需要指出的是,數(shù)據(jù)資源互聯(lián)不在我們討論范圍內。不同隱私計算平臺開放數(shù)據(jù)集以供互相訪問的場景也不在我們的探討范圍內。隱私計算平臺互聯(lián)討論內容如圖1所示。
![]()
圖1 隱私計算平臺互聯(lián)研究內容
2.2 節(jié)點互聯(lián)
節(jié)點是指承載具體計算任務的節(jié)點,可以是物理機、云虛擬機或容器。節(jié)點互聯(lián)互通貫穿聯(lián)合計算任務全周期,在框架部署階段,各個隱私計算框架以信息配置的方式,明確單個平臺內部節(jié)點的資源、IP(互聯(lián)網(wǎng)協(xié)議)地址和端口等信息,默認在配置完成后內部各個節(jié)點可以互信。節(jié)點互聯(lián)需要依據(jù)待同步的信息類型制定不同的通信協(xié)議。
2.2.1 聯(lián)盟方節(jié)點自治
每個聯(lián)盟方提供一個節(jié)點或一個集群參與聯(lián)合計算,每個計算節(jié)點資源調度由聯(lián)盟方節(jié)點的調度功能模塊完成。集群管理等相關功能可能部署在代理節(jié)點上,也可能部署在單獨某計算節(jié)點上,以完成多節(jié)點的管理、監(jiān)控。在此種場景下,跨平臺的節(jié)點互聯(lián)互通是只需要面向不同框架開放代理節(jié)點即可。
互聯(lián)方式也有2種,一種是以單平臺為中心,根據(jù)其開放的節(jié)點通信接口,構建協(xié)議轉換模塊,實現(xiàn)節(jié)點互聯(lián),另一種是構建獨立于各平臺的獨立開放協(xié)議,所有平臺根據(jù)協(xié)議進行面向外部協(xié)議的適配模塊,實現(xiàn)互聯(lián)互通。方式一更適合單企業(yè)主導的互聯(lián)互通模式,可擴展性較差;方式二更適合多企業(yè)、研發(fā)方參與的聯(lián)盟式生態(tài),可擴展性強,但需要所有參與方都進行適配。
值得注意的是,在每個隱私計算平臺內部,其節(jié)點的信任機制由平臺內部的信任機制控制,構建多方互信的節(jié)點認證方法,是節(jié)點互聯(lián)互通后續(xù)研究的重要方向。
2.2.2 統(tǒng)一引擎管理
部分隱私計算平臺采用統(tǒng)一管理不同聯(lián)盟方計算節(jié)點的模式進行內部節(jié)點互聯(lián)與調度,多采用成熟的分布式框架。平臺不以聯(lián)盟方為區(qū)隔,采用分布式管理引擎統(tǒng)一管理所有計算節(jié)點,并在物理節(jié)點上虛擬形成邏輯計算設備,由邏輯計算設備調度物理計算節(jié)點,實現(xiàn)任務的協(xié)同計算。
目前來看,早期系統(tǒng)常依賴顯式的代理節(jié)點實現(xiàn)跨方通信,而當前云原生平臺普遍通過服務網(wǎng)格將通信、認證與策略控制下沉至基礎設施層,顯著簡化了節(jié)點互聯(lián)的復雜性。當前,節(jié)點互聯(lián)的核心關注點已轉向身份認證、網(wǎng)絡隔離與跨域通信協(xié)議的標準化,而非早期多樣化的拓撲結構設計。
2.3 算法互聯(lián)
算法互聯(lián)是業(yè)界關心和積極探索的重點。行業(yè)上,一般用“黑盒”“白盒”針對算法組件互聯(lián)進行分類,“黑盒”“白盒”的互聯(lián)互通模式與參與企業(yè)是否開源其平臺、主導塑造的生態(tài)模式息息相關。
算法互聯(lián)的是當用戶發(fā)起如隱私求交、聯(lián)合統(tǒng)計或聯(lián)合建模推理等任務時,不同隱私計算平臺調用內部算法組件協(xié)同完成任務的算法執(zhí)行過程互聯(lián)。計算任務調度的互聯(lián)是指多方發(fā)起計算任務后,不同的隱私計算平臺完成不同的task,同步task的執(zhí)行狀態(tài)和結果數(shù)據(jù),每個task調用獨立的算法組件完成,同步內容與DAG中作業(yè)編排數(shù)據(jù)對象中的元數(shù)據(jù)結構相符。計算步驟的互聯(lián)互通是不僅包含了task狀態(tài)和數(shù)據(jù)的同步,也包含了task執(zhí)行過程中的數(shù)據(jù)同步。
算法互聯(lián)從平臺改造視角,可以分為3種。
一是單向適配的模式,此種方法一般不涉及算法內部流程的同步,重點在于算法任務調度的互聯(lián)互通,對應業(yè)界“黑盒”模式。
二是雙向適配模式,雙方都有適配模塊一般是基于點對點的平臺互聯(lián),在隱私計算平臺發(fā)展前期,此種模式較為常見,且都是基于已成型平臺進行互通,算法內部邏輯互不開放,采用算法調度層面互通。因此,也常見于“黑盒”模式。以獨立適配器完成格式轉換和數(shù)據(jù)傳輸?shù)裙δ埽牵ㄖ苹潭雀撸坏┰黾有缕脚_,需要大量工程化改造。這正是從雙向互聯(lián)到基于公開協(xié)議的多向開放互聯(lián)的過渡形態(tài)。
三是多向開放互聯(lián)模式,任意參與方依據(jù)公開制定的協(xié)議規(guī)范,完成內部算法流程步驟的改造和算法調度的改造,即可實現(xiàn)算法互聯(lián)。但是,由于面臨算法開放后的知識產(chǎn)權問題,部分平臺采用算法組件改造的模式,保障底層算法的不可見。將算法拆解成標準組件,如數(shù)據(jù)預處理、梯度計算、安全聚合等,也可將算法整體封裝成獨立組件,規(guī)范組件調用間的數(shù)據(jù)通信格式,保留算法底層計算方法的基礎上實現(xiàn)算法互聯(lián)。
2.4 算法互聯(lián)協(xié)議
跨隱私計算平臺互聯(lián)互通的基礎在于協(xié)議,不同的適配模式下,協(xié)議分為雙方協(xié)定基礎上的定制化協(xié)議和多方共識的標準化協(xié)議。從互聯(lián)互通的深度上來說,算法調度互聯(lián)的通信協(xié)議,主要是算法任務的調度信息的互聯(lián),算法互聯(lián)則包括算法流程過程中交互的數(shù)據(jù)結構、算法內部協(xié)議的配置信息,表2展示了由隱私計算聯(lián)盟2023年發(fā)布的《隱私計算 跨平臺互聯(lián)互通開放協(xié)議第1部分:ECDH?PSI》中ECDH?PSI算法的參數(shù)協(xié)商數(shù)據(jù)結構。
表2 已有規(guī)范中ECDH?PSI算法參數(shù)協(xié)商數(shù)據(jù)結構示例
![]()
消息隊列是實現(xiàn)互聯(lián)互通的調度組件。通過消息中間件,通過消息的產(chǎn)生和消費,實現(xiàn)互通信息的更新,可以以任務要素標識符(ID)作為消息主題,構建基于協(xié)議的消息格式,實現(xiàn)消息互通。
3
隱私計算平臺互聯(lián)的難點與趨勢
3.1 互聯(lián)難點
總體來看,隱私計算平臺互聯(lián),仍然面臨著底層技術不兼容、跨平臺數(shù)據(jù)資源互操作難和復雜數(shù)據(jù)交互流程提升數(shù)據(jù)泄露風險,以及多方通信性能難以滿足用戶需求等難題。
從算法視角看,深層次的算法互聯(lián),技術的兼容性仍然是跨隱私計算互聯(lián)平臺面臨的難題。另外,各種安全和加密算法是隱私計算核心技術,不同平臺采用的不同底層安全加密算法也提升了算法互聯(lián)層面的難度。
從數(shù)據(jù)視角看,不同隱私計算平臺采用不同數(shù)據(jù)格式和不同數(shù)據(jù)預處理方法,不同特征工程的數(shù)據(jù)處理方法也提升了跨平臺互聯(lián)的適配和操作復雜性。
從安全視角看,跨平臺的隱私計算任務調度增加了數(shù)據(jù)流轉的環(huán)節(jié),不同技術框架和不同的數(shù)據(jù)節(jié)點都可能引入新的安全漏洞,增加數(shù)據(jù)泄露的風險。而且,跨平臺的隱私計算互聯(lián),進一步增加了監(jiān)管部門的監(jiān)管難度。
從性能視角看,跨平臺的隱私計算平臺互聯(lián)往往面臨著跨地域的通信,基礎網(wǎng)絡能否保障跨平臺的通信時延要求存在不確定性。另外,由于不同平臺采用的算法和架構不一致,平臺間的任務計算效率存在差異,跨平臺的互聯(lián),尤其是面臨大規(guī)模數(shù)據(jù)的計算任務,會帶來額外的計算和通信消耗,可能會引入新的效率性能瓶頸。
從生態(tài)視角看,隱私計算平臺互聯(lián)的驅動并非僅僅是技術驅動,也來自實際場景需求的市場驅動,但是市場由大型互聯(lián)網(wǎng)企業(yè)、科技創(chuàng)新型企業(yè)、研究機構和以產(chǎn)品盈利為目標的技術服務型公司構成,各方利益難以平衡導致隱私計算平臺的互聯(lián)互通難度大大提升。
3.2 發(fā)展趨勢
雖然隱私計算平臺互聯(lián)互通面臨各種挑戰(zhàn),但是跨平臺互聯(lián)仍然是未來發(fā)展的重要趨勢,各個隱私計算平臺主導方也在持續(xù)推動跨隱私計算平臺互聯(lián)互通,目前已經(jīng)逐漸形成了小范圍的開放互聯(lián)實踐。
標準和規(guī)范方面,金融行業(yè)、電信行業(yè)都在探索行業(yè)內部的隱私計算平臺互聯(lián)標準。未來如何在符合不同行業(yè)監(jiān)管要求和業(yè)務需求的基礎上統(tǒng)一各行業(yè)標準、形成可兼容的標準體系成為了隱私計算平臺各研發(fā)方的重點研究方向。
技術方面,規(guī)模化的、基于開放協(xié)議的平臺互聯(lián)互通將逐漸成為更多技術方的選擇。多技術融合可能成為隱私計算跨平臺互聯(lián)互通完成計算任務的輔助手段,性能提升和安全保障也將成為因計算技術互聯(lián)互通的重要研究方向。如何保障各方知識產(chǎn)權、利益分配合理基礎上,實現(xiàn)各算法的進一步互聯(lián)互通也成為后續(xù)重點研究問題。
總體來說,隱私計算平臺作為數(shù)據(jù)流通基礎設施的重要組成,對互通方案的可落地性要求會隨著應用場景的增加而更加嚴格,各個參與主體由于商業(yè)考量導致生態(tài)小范圍內閉源和技術差異導致的互通難度大都將隨著市場需求的增加和技術進步逐漸實現(xiàn)突破。
4
結論
我們梳理了相關文獻和公開資料,從功能視角切入當前隱私計算平臺,結合隱私計算平臺互聯(lián)互通實踐,總結了當前主要的互聯(lián)方案。目前已形成以金融行業(yè)和互聯(lián)網(wǎng)企業(yè)為中心的小規(guī)模探索型互聯(lián)互通生態(tài)。同時結合當前生態(tài),根據(jù)隱私計算平臺的算法互聯(lián),從落地難度視角出發(fā),明確隱私計算平臺互聯(lián)互通的適配難度、方式,從適配的工程化、復雜性角度闡述各種模式與當前行業(yè)“黑盒”“白盒”式互聯(lián)的關系。
隱私計算的互聯(lián)互通仍然處在小范圍的試點實踐過程中,單場景的應用較多,規(guī)范化的落地實踐仍然面臨著技術、監(jiān)管和生態(tài)上的挑戰(zhàn)。但是,隨著鼓勵數(shù)據(jù)開放、數(shù)據(jù)要素流通的政策文件頻發(fā),中國不斷增加的數(shù)據(jù)流通需求將有效驅動技術的進步,而生態(tài)開放將會成為制約隱私計算互聯(lián)互通的核心要素之一。因此,構建兼容并存、大規(guī)模公開互聯(lián)、小規(guī)模封閉互聯(lián)的模式可能成為未來隱私計算互聯(lián)互通的重要模式。
本文作者:劉穎慧、魏進武、張溶芳、蔡一欣、李堃
作者簡介:劉穎慧,北京交通大學電子信息工程學院,中國聯(lián)合網(wǎng)絡通信有限公司研究院,高級工程師,研究方向為數(shù)據(jù)流通;魏進武(通信作者),中國聯(lián)合網(wǎng)絡通信有限公司研究院,教授級高級工程師,研究方向為衛(wèi)星互聯(lián)網(wǎng)與大數(shù)據(jù)。
文章來 源 : 劉穎慧, 魏進武, 張溶芳, 等. 數(shù)據(jù)要素時代的隱私計算平臺互聯(lián)路徑與挑戰(zhàn)[J]. 科技導報, 2025, 43(24): 17?26 .
本文有刪改,
內容為【科技導報】公眾號原創(chuàng),歡迎轉載
白名單回復后臺「轉載」
《科技導報》創(chuàng)刊于1980年,中國科協(xié)學術會刊,主要刊登科學前沿和技術熱點領域突破性的研究成果、權威性的科學評論、引領性的高端綜述,發(fā)表促進經(jīng)濟社會發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學文化、促進科技創(chuàng)新和科技成果轉化的決策咨詢建議。常設欄目有院士卷首語、科技新聞、科技評論、本刊專稿、特色專題、研究論文、政策建議、科技人文等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.