![]()
AI時代“數模一體”,對數據可信流通有了更迫切的需求。密態計算行業迎來重要的戰略機遇期。
文|徐鑫
編|任曉漁
“螞蟻密算創新全鏈路密態的隱私保護計算技術,以技術突破信任壁壘,實現數據規模化低成本可信流通,服務超千萬級用戶。”日前,螞蟻密算獲得“世界互聯網大會杰出貢獻獎”,頒獎詞著重強調了“數據規模化低成本可信流通”的價值
大模型進入產業落地前夜的當下,螞蟻密算獲得權威認可,在外界看來是一個信號。某種程度,它反映了這家年輕的公司圍繞著數據流通和人工智能產業落地卡點的探索關注,在AI時代已成為行業普遍性議題——
一方面,數據驅動的模型對高質量數據產生了前所未有的需求,數據要素的跨主體、跨行業、跨區域的低成本、高性能、高安全流通變得更為迫切。另外,大模型帶來的智能變革似乎近在眼前,但它距離千百倍的行業變革仍然有距離。
螞蟻密算的解法,由此也產生了更大的行業借鑒意義。無論是提出密態計算還是發布致力解決大模型在專業應用中的可靠性困境的高階程序(High-Order Program, HOP),在“數模一體”的新時代,正為解決高質量數據缺乏背景下的數據治理產能不足、推進高價值高敏感數據跨主體融合利用、加速人工智能的產業應用,貢獻了一份自己的力量。
![]()
螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜在溝通會現場直言,“AI時代,螞蟻密算所選擇的方向正得到產業界認同,整個行業發展正迎來一個重要的戰略窗口期和規模化應用機會。”
01
密態計算正進入規模化應用元年
“數據是AI時代的新石油”,這句誕生在AI 1.0時代的斷言,在大模型時代含金量還在進一步上升。
今年6月,Meta以約143億美元對數據標注領域頭部公司Scale AI 49%股份的天價收購案,某種程度上反映出,AI時代數據在模型智能及大模型的競爭中呈現出巨頭卡位的重要性。
這背后是當下AI數據領域的現實挑戰:目前,可用于通用模型訓練的互聯網公開數據在基模訓練里幾乎已消耗殆盡,這一方面使得大模型訓練早已從數據參數規模擴展,轉向數據語料的質量上。同時,不在公開渠道流轉的高敏數據以及包含了垂類場景知識的專業數據,正對大模型智能提升以及行業應用產生越來越大的影響。
這一行業現狀也讓產業界對更加暢通的數據要素安全流通機制有切實需求。以Scale AI收購案為例,在Meta發出收購信息后,一大批與Meta的模型存在競爭關系的廠商紛紛開始切斷與Scale AI的合作,背后就是對數據安全相關的擔憂。
但現實是,擁有稀缺的高質量數據的企業和各類主體,出于安全等各種顧慮,很難放心讓數據跨域去流通、流轉。IDC在今年4月的一份報告中就指出,當前數據市場供需不旺,主要原因對數據流通的不信任。
韋韜觀察,AI時代“數模一體”,數據的可信安全流通還多了一重新的迫切性。
大模型作為數據驅動的知識匯聚技術,只有大量的數據和專業知識,才能構建大模型。同時,模型即數據,數據上所承載的專業價值、商業的秘密都會展現在模型里面。
韋韜認為,大模型一旦流通應用,數據上所要做的保障,在模型層也需要做相關的保障。模型本身也需要誕生在能保障數據、智能體高效流動、應用和融合的密態計算基礎設施之上。
這些都意味著,密態計算的市場空間正進一步打開。
實際上,過去兩年來,密態計算領域經歷了快速的發展演進。
![]()
一年半以前,螞蟻集團成立了螞蟻密算,將螞蟻過去十年在下一代隱私保護計算領域積累的技術能力對外輸出。當時密態計算領域正如韋韜所言,“去年但凡談密算,大家都覺得是螞蟻一家在做。”
但隨著密態計算技術升級,成本大幅降低至明文分布式計算的1.5倍以內,這項新興技術開始在醫療、金融等領域規模化落地,比如幫助超1300萬農戶獲得貸款,讓75%新能源車主平均下降8%保費。據相關合作單位估算,在密算上投入100萬,整個行業收益100倍以上,一年電費能耗不到5000元。
韋韜提到,這些落地進展讓行業確信,密算真的能讓產業界敢于注入高敏高價值數據,并且基于密算保障的數據流通后,業務能真正獲得顯著效果。
與產業落地進程同步,密態計算的相關國家標準也在同步推進中,同時更多的行業玩家進入這一市場。
就在烏鎮舉行的世界互聯網大會的前一天,韋韜還參與了國家數標委WG6(國家數據標準化委員會數據基礎設施標準工作組)成立的SG2密態計算研究組,他看到已經有超過20家單位加入工作組,密態計算正加速進入行業共建階段。
疊加上AI時代對數據安全流通產生的強烈需求,韋韜認為,“今年是密態計算的市場化規模應用啟動元年”。當下行業處于高敏高價值行業先行投入階段,隨著行業基建完善,未來整個互聯網上無法公開傳輸的數據都可以基于密算承載,這將是一個巨大的市場。
02
“數模一體”,加速AI時代數據價值釋放
數據流通安全問題經由密態計算技術得到保障后,專業數據要真正在產業應用流通里真正“用得好”并不是那么“理所當然”。
韋韜觀察到,螞蟻密算在與國家部委的合作里發現,那些從來沒有參與跨主體、跨域流通和供給的數據的質量,與真實產業場景應用的要求之間存在不小的差距。
“大量數據缺乏治理、缺乏標準化,以及此前匯聚傳輸過程中可能累積了很多錯誤,這使得它很難快速被用起來,去產生應用價值”,韋韜說。
實際上,這一現象過去幾年里在明文數據的治理領域也是一個通行問題。為解決高質量數據缺乏現狀,國家在頂層設計層面也已經出臺了大量的政策,牽引和推動高質量數據集的建設工作。
但不可否認,傳統的基于人工來處理數據治理工作,依然有不小的產能局限。中國信通院在《數據標注產業發展研究報告(2025)》中指出,人才培養機構輸出的標注工程師年均缺口超30%。高端專業領域的標注和治理人才稀缺,已是共識。
涉及到高敏高價值的數據場景,產能缺口就更大。比如金融機構的聯合風控場景,數據不能出域,為構建更好的模型,多方針對業務指標數據的清洗、治理、對齊等需要數周,并且能去做相關工作的專家資源很難找。
![]()
針對這一挑戰,螞蟻密算認為,基于密算體系支撐的高階程序和高階智能體可來解決這些高敏高價值數據的治理效能問題。
今年7月螞蟻密算針對大模型產業落地時可靠性不足,需要人工核驗等大規模應用瓶頸提出了高階程序技術框架,它用編程語言強化大模型執行結果的審核和核驗,擺脫對人工核驗的依賴,確保大模型落地的可靠性。韋韜認為,這將加速行業效能提升,“如果所有大模型處理完的業務都需要人再核驗,效能提升非常有限”。
這一解決思路,也體現了韋韜提出“數模一體”新范式的另一重意義——海量專業數據與行業知識是構建大模型與專業智能體的基石,智能體也成為挖掘與融合數據價值的核心引擎。
“整個數據的流動和數據上產生的模型,以及模型對數據的應用是以一體化的方式進行”,韋韜說。
IDC在今年4月發布報告里也指出,可針對數據質量參差不齊的情況,結合大模型等人工智能實現數據治理自動化,推動數據標識、語義發現、元數據識別等智能處理,自動匹配利用數據API進行調用,實現數據的無縫對接和互操作性。
螞蟻密算已經在自身的業務實踐里,感受到了數據治理場景里高階智能體加速治理效能的必要性。韋韜介紹,他們基于高階智能體體系把200多項關于數據的國標和行標,全部做自動化處理。以前標準在那里,用的人不多,因為里面有非常多的口徑不統一問題。這里面涉及到非常多繁瑣的工作,比如圍繞著性別就有非常多的指代口徑。
在醫療場景里的一些數據也基于高階程序產生了治理效能升級。醫院有大量的數據需要做合規診斷,比如醫生寫的診療報告,相關的項目是不是寫全,實際診療的內容和報告中是不是對應匹配。
靠傳統規則去查很難,傳統大模型做這件事情,可靠性又跟不上。由于涉及高敏信息,院方受限于數據敏感及行業保密要求,也很難將相關數據交由第三方進行專業分析處理。而基于密態計算的高階智能體則能很好能解決這個問題。
在數模一體的范式下,匯聚了行業知識的高階智能體,正加速AI時代數據的匯集和治理能效,釋放數據價值,推進AI產業落地進程。
03
螞蟻密算,探索AI時代的數據可信流通新基建
“最能體現密態計算的價值點不體現在防御外部攻擊者,而是保障平臺運維者不能出于自身利益而將數據偷走。”韋韜用來一個比喻直觀地解釋它的價值,他認為整個密態計算體系本質上是將云計算的Paas層及以上全部重構。
以前外掛式安全路徑其實無法解決這一問題,因為針對外部供給的安全部署、策略配置方案、甚至賬號本身都在管理員手里。而整個PaaS體系進行密態計算重構,就是要基于可信體系把虛擬機、操作系統、容器等全部做密態化、安全化增強。
在這個基礎上,有數據流轉的密態膠囊和數據血緣追蹤以及密態網關,當所有的數據從密態切成明文傳輸時都有檢查核驗,追溯明確數據加工的產品數據源出處,并需要各個相關數據源方通過數據密鑰來授權是否可以輸出。
這是一個龐大的工程,需要體系化的投入,才能支撐住海量數據的高效能跨域融合流轉以及出域的有效管控。
![]()
而螞蟻密算當下能基于“數模一體”范式來推進AI時代的數據低成本規模化可信流通,也得益于螞蟻集團從2016年開始的長期投入。
目前,螞蟻密算正從密態計算基礎設施、數據供給和流通供給、行業應用落地等多環節發力,形成了“芯片、系統、平臺”的全體系基建,全棧布局來加速數據可信流通
在與大模型應用落地最直接相關的應用層,今年7月在世界人工智能大會上螞蟻密算提出了高階程序大模型可信應用技術框架,它融合了自然語言與編程語言,來解決大模型在專業場景的可靠性困境,使大模型的應用邏輯從“黑盒”走向顯性化、可控化。目前,該技術已在數據治理、金融風控、醫保智能審核等多個專業領域落地。
“現在在做2.0的迭代和積累,很快會在行業里面發布”,韋韜預告了高階程序框架的最新進展。
而高階程序框架要能落地應用,還需要各行各業的行業專家們將領域內的專家知識和Know-How注入高階程序,這些數據行業屬性很強,承載了極強的商業價值,必然需要海量數據供給和流通。螞蟻密算此前發布過業內首個密態可信數據空間,依托芯片遠程認證、“密態膠囊”等技術,讓行業數據應用從“主體信任”走向“技術信任”,能確保數據源方敢于注入海量高價值高敏感數據。
更底層的芯片和操作系統層面,螞蟻也有長期布局。芯片層,今年9月在外灘大會上螞蟻密算發布了AI密態升級卡,在不更換現有xPU硬件、不修改AI應用代碼與驅動的前提下,能將現有的、大規模的明文智能算力,改造成密態智能算力。
“性能損失跟國內各家GPU的適配,最好的損失不到2%,最差的損失不到6%,能有效支撐大模型的推理和微調,未來我們還會跟更多廠商合作。”韋韜說。
操作系統層,星綻開源操作系統采用新興的Rust編程語言,首創框內核OS架構,安全性方面大幅領先于Linux等主流OS。
韋韜指出,螞蟻密算在這一領域構建全面的能力,最初起源于螞蟻自身的業務發展存在強烈的需求。“螞蟻一個重要的特點在于,推出的所有技術,在螞蟻體系里面經過非常長時間的打磨。隱私保護計算,2016年開始各個技術路線全面鋪開,包括操作系統也是在內部做了將近5年。有了很強的能力后才能夠對行業提供服務。”
而大模型時代,隨著AI時代的數據流通面臨多方位的安全威脅,數據可信安全流通成為全社會共同的痛點,這一領域也迎來了前所未有的發展前景。
對于螞蟻密算而言,這是一個找對了方向最終自然收獲回報的過程。“首先是找到了一個正確的方向,這個方向可能初期投入很大,可能非常艱難,但是它突破以后能給行業帶來價值,真正的收益也是巨大的。”韋韜說。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.